본문 바로가기

전체 글

(289)

[오픈소스 AI] 알리바바 최신 언어 모델 Qwen3-Next 공개 – 학습비용 90% 절감, 추론 속도 10배↑ 안녕하세요,AI 오픈소스 모델을 선도하는 알리바바에서 또 한 번 의미 있는 발표를 했습니다. 이번에 공개된 Qwen3-Next는 기존 Qwen3 시리즈를 한 단계 발전시킨 차세대 언어 모델로, 학습 비용을 약 10% 수준으로 절감하면서도 추론 속도를 10배 이상 향상시킨 것이 가장 큰 특징입니다. 대규모 파라미터를 유지하면서도 효율성을 극대화한 덕분에 초장문 문맥 처리, 복합 추론, 코드 생성 등 다양한 작업에서 더 빠르고 안정적인 성능을 제공합니다.이번 포스팅에서는 Qwen3-Next 모델의 주요 특징과 Instruct·Thinking 버전의 차이에 대해 살펴보겠습니다. Qwen3-Next 모델이란2025년 9월 11일, 알리바바에는 Qwen 모델 계열에서 새로운 최신 모델, Qwen3-Next를 공개..

ChatGPT만 쓰던 당신에게, UPDF AI로 PDF를 더 똑똑하게 다루는 법 안녕하세요,오피스 근무자들에게 PDF 파일은 가장 흔하게 접하는 문서 형식 중 하나입니다. 보고서, 계약서, 안내문 등 업무에서 주고받는 파일 대부분이 PDF일 정도입니다. 이번에 소개할 서비스는 UPDF AI입니다. UPDF는 PDF 읽기와 편집 기능을 제공하는 프로그램이며, 여기에 AI 기능이 결합되어 PDF 파일을 요약·번역·질의응답 등 다양한 방식으로 활용할 수 있습니다.이번 포스팅에서는 UPDF AI의 주요 기능과 활용 방법, ChatGPT와 비교하여 알려드리겠습니다.UPDF AI UPDF AI는 단순한 PDF 뷰어나 편집기를 넘어선 문서 중심 AI 어시스턴트입니다. UPDF 소프트웨어에는 GPT-5와 DeepSeek R1 모델 기반의 언어 모델이 통합되어 있어, PDF 읽기·편집은 물론 요약,..

[오픈소스 AI] 맥북에서 실행 가능한 초경량 LLM – Qwen3-4B-MLX-4bit 모델을 소개합니다. 안녕하세요,최근 중국 알리바바에서 경량화된 대형 언어 모델 Qwen3-4B-MLX-4bit 모델을 공개했습니다. 이 모델은 약 40억(4B) 파라미터로 구성되어 있으며, 전체 용량이 약 2GB 수준으로 비교적 가벼운 편에 속합니다. 작은 크기에도 불구하고 긴 컨텍스트 처리, 추론(Thinking) 모드, 다국어 지원 등 다양한 기능을 제공하며, 온디바이스 환경에서도 원활하게 활용할 수 있습니다.이번 포스팅에서는 Qwen3-4B-MLX-4bit 모델의 특징과 장점, 그리고 어떤 환경에서 활용할 수 있는지 자세히 살펴보겠습니다.Qwen3-4B-MLX-4bitQwen3-4B-MLX-4bit는 Alibaba가 개발한 Qwen3 계열의 최신 AI 언어 모델로, 약 40억(4B) 파라미터를 갖춘 중형급 대형 언어 ..

[ComfyUI] 오디오·이미지 기반 AI 영상 생성 모델, Wan2.2-S2V 가이드 안녕하세요,이전에 알리바바에서 공개한 Wan 2.2 모델을 소개한 적이 있습니다. 이 모델은 텍스트 입력만으로 영상을 생성할 수 있는 모델로, 가벼운 모델 크기에도 불구하고 뛰어난 생성 품질과 우수한 성능으로 많은 관심을 받았습니다. 이번에는 이 모델이 한 단계 발전하여, 이미지와 오디오 입력을 함께 활용해 더욱 원하는 영상 결과를 만들 수 있는 기능을 갖추게 되었습니다.이번 포스팅에서는 새로운 Wan 2.2-S2V 모델에 대해 자세히 알아보겠습니다. 참고 : [Marcus' Story] - [ComfyUI + Wan 2.2] AI 영상 생성 오픈소스, Wan 2.2 사용법 | ComfyUI로 로컬에서 실행하기 Wan2.2-S2V 모델이란Wan2.2-S2V는 정적 이미지와 오디오를 함께 활용하여 영상 콘..

OpenAI의 에이전트 코딩 모델, GPT‑5-Codex를 소개합니다. 안녕하세요,최근 개발 현장에서는 단순한 코드 자동완성을 넘어, 프로젝트 전체 맥락을 이해하고 능동적으로 개선할 수 있는 AI 개발 파트너에 대한 요구가 높아지고 있습니다. OpenAI는 그동안 Codex 모델을 통해 코드 생성 기능을 제공해 왔으며, 이번에 이를 대규모로 업그레이드하여 코드 작성은 물론 리뷰·테스트·배포까지 지원하는 새로운 형태의 개발 에이전트를 선보였습니다.이번 글에서는 OpenAI가 공개한 차세대 코딩 모델 GPT-5-Codex의 주요 특징과 활용 가능성에 대해 살펴보겠습니다.GPT-5-Codex란 GPT-5-Codex는 OpenAI가 GPT-5 시리즈에서 엔지니어링과 실제 소프트웨어 개발에 최적화해 선보인 차세대 코딩 AI 모델입니다. 코드 생성부터 대규모 리팩터링, 기능 추가, 디..

AI 이미지 생성·편집 모델, Seedream 4.0을 소개합니다 안녕하세요,최근 중국 기업 바이트댄스(ByteDance)가 공개한 차세대 이미지 생성 모델 Seedream 4.0이 큰 화제를 모으고 있습니다. 공개 직후에는 text-to-image(텍스트 → 이미지) 생성 모델 중에서 기존 강자였던 나노바나나 모델을 뛰어넘어 최고 성능을 기록하며 주목받았습니다.이번 포스팅에서는 Seedream 4.0이 어떤 모델인지, 어떤 특징과 강점을 가지고 있는지, 실제 생성 가능한 이미지 사양과 벤치마크 성능, 그리고 API 사용 비용까지 하나씩 살펴보겠습니다. Seedream 4.0 모델이란 Seedream 4.0은 틱톡(TikTok)으로 잘 알려진 중국 기업 바이트댄스(ByteDance)가 공개한 최신 이미지 생성·편집 AI 모델입니다. 하나의 통합 아키텍처에서 텍스트 기반..

ChatGPT 개발자 모드 사용법｜MCP 연결로 GPT를 에이전트로 만들기 안녕하세요,인공지능은 이제 단순히 질문에 답하는 수준을 넘어 직접 행동하는 에이전트로 빠르게 진화하고 있습니다. 이에 발맞춰 OpenAI는 최근 ChatGPT 웹 플랫폼에서 MCP(Model Context Protocol)를 직접 연결할 수 있는 기능을 공개했습니다. 이제 적절한 MCP를 추가하기만 하면, ChatGPT에게 내가 원하는 작업을 실제로 실행하도록 맡길 수 있게 되었습니다.이번 글에서는 MCP가 무엇인지, 그리고 ChatGPT에 MCP를 추가하는 방법에 대해 알아보겠습니다.ChatGPT와 MCP2025년 9월 11일, OpenAI는 ChatGPT 웹 플랫폼에서 MCP(Model Context Protocol)를 직접 추가할 수 있는 기능을 공식 공개했습니다. 이 변화로 ChatGPT는 단순히..

AI가 대신 검색해준다! 구글 AI 모드 사용법 & 활용 가이드 안녕하세요,검색 시스템으로 전 세계에서 가장 잘 알려진 구글이 최근 자사의 핵심 서비스인 검색에 인공지능을 본격적으로 접목한 새로운 기능을 선보였습니다. 구글은 이 기능을 ‘AI 모드(AI Overview)’라고 부르며, 단순한 키워드 검색을 넘어 사용자의 질문 의도를 파악하고 관련 정보를 요약·정리하여 보다 직관적이고 빠르게 보여주는 것이 특징입니다.이번 글에서는 이 AI 모드가 무엇인지, 기존 검색과 어떤 점에서 다른지, 그리고 실제로 어떤 장점을 제공하는지 자세히 살펴보겠습니다.구글 AI 모드란2025년 9월 9일, 구글은 한국에서 AI 모드(AI Overview)를 공식 공개하였습니다. 이 기능은 기존의 검색 결과 페이지와 달리, 사용자가 입력한 질문을 AI가 분석하고 웹의 다양한 정보를 종합해 ..

이전 1 2 3 4 5 6 ··· 37 다음

728x90

티스토리툴바