본문 바로가기

전체 글

(286)

GPT-5급 성능의 오픈소스 추론 모델, 메이투안 LongCat-Flash 소개 안녕하세요,최근 중국의 대표적인 테크 기업 메이투안(Meituan)이 차세대 프론티어급 모델인 GPT-5에 견줄 만한 새로운 AI 추론 모델을 공개하였습니다. 이 모델은 LongCat-Flash 시리즈로, 단순한 언어 생성 능력을 넘어 수학, 논리, 프로그래밍, 정형 증명 등 복잡한 추론 과제까지 처리할 수 있는 강력한 성능을 지니고 있습니다. 더욱 주목할 점은 이 모델이 오픈소스로 공개되어 연구자와 개발자뿐 아니라 누구나 직접 사용해볼 수 있다는 것입니다.이번 글에서는 LongCat-Flash 모델의 개요와 주요 특징, 그리고 벤치마크 성능과 활용 가능성에 대해 살펴보겠습니다.LongCat-Flash 모델이란최근 중국 음식 배달 서비스 분야 1위 기업인 메이투안(Meituan)이 자체 개발한 대규모 언..

[오픈소스 AI] 멀티모달 AI 끝판왕? Qwen3-Omni-30B-A3B 기능·성능 총정리 안녕하세요,최근 중국 알리바바가 또 한 번 주목할 만한 인공지능 모델을 공개했습니다. 이번에 발표된 Qwen3-Omni 모델은 단순히 텍스트만 이해하는 기존 언어 모델을 넘어, 오디오·이미지·비디오까지 입력받아 종합적으로 이해하고 답변할 수 있는 멀티모달 AI 모델입니다. 특히 명령 수행, 단계별 추론, 오디오 이해와 캡셔닝 등 다양한 기능을 하나의 모델에서 처리할 수 있어 연구·개발뿐 아니라 실무 서비스에도 활용 가치가 높습니다.이번 포스팅에서는 Qwen3-Omni 모델의 주요 특징과 세부 버전(Instruct, Thinking, Captioner), 그리고 경쟁 모델과의 벤치마크 비교까지 차근차근 살펴보겠습니다.Qwen3-Omni-30B-A3B2025년 9월 22일, Alibaba Tongyi Qia..

구글이 발표한 AP2: 에이전트 기반 상거래(Agent Commerce)를 위한 오픈 프로토콜 안녕하세요,최근 다양한 AI 에이전트가 공개되면서 단순한 대화나 추천을 넘어 실제로 사용자를 대신해 행동하는 사례가 늘어나고 있습니다. 이제는 결제 시스템까지 지원하는 에이전트가 등장하며, 온라인 쇼핑·구독·송금 등 상거래 영역에서도 자동화가 본격화되고 있습니다.이번 글에서는 구글이 공개한 Agent Payments Protocol(AP2)을 중심으로, 에이전트 기반 결제가 어떤 방식으로 구현되고 어떤 변화에 대해 알아보겠습니다. Agent Payments Protocol (AP2) 란2025년 9월 17일, 구글은 Agent Payments Protocol(AP2)을 공개했습니다. AP2는 AI 에이전트가 사용자를 대신해 안전하고 신뢰성 있게 결제를 수행할 수 있도록 설계된 개방형 결제 프로토콜로, A..

xAI 최신 모델 Grok 4 Fast 소개 – 빠르고 효율적인 차세대 추론 AI 안녕하세요,xAI가 최근 공개한 Grok Code Fast 1 모델로 개발자 커뮤니티의 큰 주목을 받은 데 이어, 불과 한 달도 채 지나지 않아 차세대 모델 Grok 4 Fast를 새롭게 공개했습니다. 이번 모델은 기존 Grok 4의 강점을 그대로 계승하면서도 토큰 효율성, 응답 속도, 비용 절감 측면에서 한층 더 발전한 모습을 보여주고 있습니다. 특히 reasoning과 non-reasoning 모드를 통합해 더 빠르고 일관된 결과를 제공하는 것이 핵심입니다.이번 포스팅에서는 Grok 4 Fast의 주요 특징과 기존 모델과의 차별점, 벤치마크 성능 등에 대해 알아보겠습니다. Grok 4 Fast 란2025년 9월 19일, xAI는 최신 비용 효율 중심의 추론 모델, Grok 4 Fast를 공개했습니다...

구글의 최신 AI 디자인 툴, Stitch 완전 정리 (특징·사용법·모드별 차이) 안녕하세요,최근 구글은 Stitch라는 실험적 UI 설계 도구를 공개했습니다. 이 도구는 단순한 텍스트 설명이나 이미지 입력만으로도 웹·앱의 사용자 인터페이스(UI)를 설계하고, 이를 프런트엔드 코드로 자동 변환할 수 있도록 돕는 혁신적인 서비스입니다. 기존에는 디자이너가 화면을 설계하고, 개발자가 이를 코드로 구현하는 과정에서 많은 시간과 반복 작업이 필요했습니다. Stitch는 이러한 과정을 획기적으로 단축해, 아이디어 단계에서 실제 프로토타입까지 빠르게 연결하는 새로운 워크플로우를 제공합니다.이번 글에서는 Stitch의 주요 특징과 실제 사용 방법을 단계별로 살펴보며, 어떤 상황에서 활용할 수 있는지 소개하겠습니다.Stitch 란2025년 5월 20일, 구글은 Stitch라는 실험적 AI 기반 UI..

[오픈소스 AI] 알리바바 최신 언어 모델 Qwen3-Next 공개 – 학습비용 90% 절감, 추론 속도 10배↑ 안녕하세요,AI 오픈소스 모델을 선도하는 알리바바에서 또 한 번 의미 있는 발표를 했습니다. 이번에 공개된 Qwen3-Next는 기존 Qwen3 시리즈를 한 단계 발전시킨 차세대 언어 모델로, 학습 비용을 약 10% 수준으로 절감하면서도 추론 속도를 10배 이상 향상시킨 것이 가장 큰 특징입니다. 대규모 파라미터를 유지하면서도 효율성을 극대화한 덕분에 초장문 문맥 처리, 복합 추론, 코드 생성 등 다양한 작업에서 더 빠르고 안정적인 성능을 제공합니다.이번 포스팅에서는 Qwen3-Next 모델의 주요 특징과 Instruct·Thinking 버전의 차이에 대해 살펴보겠습니다. Qwen3-Next 모델이란2025년 9월 11일, 알리바바에는 Qwen 모델 계열에서 새로운 최신 모델, Qwen3-Next를 공개..

ChatGPT만 쓰던 당신에게, UPDF AI로 PDF를 더 똑똑하게 다루는 법 안녕하세요,오피스 근무자들에게 PDF 파일은 가장 흔하게 접하는 문서 형식 중 하나입니다. 보고서, 계약서, 안내문 등 업무에서 주고받는 파일 대부분이 PDF일 정도입니다. 이번에 소개할 서비스는 UPDF AI입니다. UPDF는 PDF 읽기와 편집 기능을 제공하는 프로그램이며, 여기에 AI 기능이 결합되어 PDF 파일을 요약·번역·질의응답 등 다양한 방식으로 활용할 수 있습니다.이번 포스팅에서는 UPDF AI의 주요 기능과 활용 방법, ChatGPT와 비교하여 알려드리겠습니다.UPDF AI UPDF AI는 단순한 PDF 뷰어나 편집기를 넘어선 문서 중심 AI 어시스턴트입니다. UPDF 소프트웨어에는 GPT-5와 DeepSeek R1 모델 기반의 언어 모델이 통합되어 있어, PDF 읽기·편집은 물론 요약,..

[오픈소스 AI] 맥북에서 실행 가능한 초경량 LLM – Qwen3-4B-MLX-4bit 모델을 소개합니다. 안녕하세요,최근 중국 알리바바에서 경량화된 대형 언어 모델 Qwen3-4B-MLX-4bit 모델을 공개했습니다. 이 모델은 약 40억(4B) 파라미터로 구성되어 있으며, 전체 용량이 약 2GB 수준으로 비교적 가벼운 편에 속합니다. 작은 크기에도 불구하고 긴 컨텍스트 처리, 추론(Thinking) 모드, 다국어 지원 등 다양한 기능을 제공하며, 온디바이스 환경에서도 원활하게 활용할 수 있습니다.이번 포스팅에서는 Qwen3-4B-MLX-4bit 모델의 특징과 장점, 그리고 어떤 환경에서 활용할 수 있는지 자세히 살펴보겠습니다.Qwen3-4B-MLX-4bitQwen3-4B-MLX-4bit는 Alibaba가 개발한 Qwen3 계열의 최신 AI 언어 모델로, 약 40억(4B) 파라미터를 갖춘 중형급 대형 언어 ..

이전 1 2 3 4 5 ··· 36 다음

728x90

티스토리툴바