본문 바로가기

전체 글

(284)

2025년 10월 AI 모델 성능 비교: GPT-5, Claude, Gemini, DeepSeek 최신 순위 정리 안녕하세요,최근 대형 언어모델(LLM)의 경쟁은 단순한 언어 처리 능력을 넘어, 현실 문제를 해결하는 종합적 수행력으로 확장되고 있습니다. 텍스트 이해와 생성 성능이 상향 평준화되면서, 이제는 도구 활용·멀티스텝 추론·상황 적응력과 같은 실질적 역량이 모델 간 차별화를 만드는 핵심 지표로 부상하고 있습니다.이번 글에서는 LMArena 등 사용자 투표 기반 평가, Artificial Analysis의 종합 벤치마크, 그리고 GAIA 에이전트 평가 점수 이 세 가지 지표를 함께 보며, 2025년 10월 시점에서 주목할 만한 AI 모델들의 실제 퍼포먼스와 활용 역량을 비교해 보겠습니다.이번 글에서는 이러한 흐름을 바탕으로, 세 가지 핵심 지표를 중심으로 LLM의 전반적 성능과 에이전트로서의 실제 문제 해결 역..

2025년 7월 생활화학제품 위반제품 정보 안녕하세요,우리 생활 속에서 흔히 사용하는 각종 청결용품과 향기 제품들은 일상을 더욱 편리하고 쾌적하게 만들어 주지만, 그만큼 안전 관리가 제대로 이루어지지 않을 경우 건강과 환경에 직접적인 피해를 줄 수 있습니다. 2025년 7월에 실시된 생활화학제품 안전 점검에서는 다양한 품목에서 법규 위반 사례가 다수 확인되며, 평소 무심코 사용하는 제품들이 여전히 안전성 관리의 사각지대에 놓여 있음을 보여주고 있습니다.이번 글에서는 2025년 7월에 적발된 생활화학제품 위반 사례를 중심으로 주요 문제점과 특징을 살펴보고, 소비자가 제품을 선택하고 사용할 때 반드시 유의해야 할 점들을 함께 짚어보고자 합니다.2025년 7월 생활화학제품 위반제품 정보제품종류업체명제품명조치일자결함(위반)내용조치내용 방향제개인의 취향개..

GPT-5 Pro와 Sora 2 공개! 2025 OpenAI DevDay 주요 내용 정리 안녕하세요,최근 OpenAI가 전 세계 개발자들을 위해 개최한 연례 행사 DevDay 2025가 성황리에 진행되었습니다. 이번 행사에서는 신기술 발표를 비롯해 제품 데모, 토크 세션, 그리고 다양한 네트워킹 프로그램이 함께 열리며 많은 관심을 모았습니다. 특히 ChatGPT 안에서 직접 앱을 실행하고, AI가 스스로 영상을 생성하며, 실시간으로 사람과 대화하는 등 인공지능의 새로운 가능성을 보여주는 발표들이 이어졌습니다.이번 포스팅에서는 OpenAI DevDay 2025에서 공개된 주요 내용과 변화의 핵심 포인트를 함께 살펴보겠습니다.OpenAI Devday2025년 10월 6일, OpenAI는 전 세계 개발자와 연구자를 대상으로 진행되는 OpenAI의 대표 기술 컨퍼런스, DevDay를 개최했습니다. ..

구글 Data Commons MCP, 신뢰성 높은 AI를 위한 새로운 공공 데이터 프로토콜 안녕하세요.최근 인공지능 분야에서 가장 중요한 과제로 떠오른 것은 ‘신뢰할 수 있는 데이터 기반의 응답 생성’입니다. 대형 언어모델은 방대한 텍스트를 학습해 놀라운 성능을 보여주고 있지만, 여전히 사실과 다른 정보를 만들어내는 ‘환각(hallucination)’ 문제가 종종 발생하고 있습니다. 이러한 한계를 해결하기 위해 구글은 새로운 접근 방식을 제시하였습니다. 바로 Data Commons MCP — AI가 현실 세계의 공공 데이터와 직접 연결되어, 근거 있는 분석과 신뢰성 높은 응답을 제공할 수 있도록 설계된 표준 프로토콜입니다.이번 포스팅에서는 구글이 공개한 Data Commons MCP 서버를 중심으로, 그 구조와 동작 원리, 그리고 간단한 사용 예시를 함께 살펴보겠습니다.구글의 Data Comm..

AI 검색 플랫폼 퍼플렉시티, Comet 브라우저와 Search API 공개 안녕하세요,AI와 검색 기술을 결합한 혁신적인 서비스로 주목받아온 퍼플렉시티(Perplexity)가 최근 두 가지 중요한 소식을 발표했습니다. 바로 AI 기반 웹브라우저 ‘Comet’의 전 세계 무료 공개와, 개발자들이 직접 퍼플렉시티의 검색 기술을 활용할 수 있도록 설계된 ‘Search API’의 공개입니다. 이번 발표는 퍼플렉시티가 단순한 AI 질의응답 서비스를 넘어, 사용자와 개발자 모두를 위한 AI 검색 생태계 구축으로 나아가고 있습니다.이번 포스팅에서는 두 서비스의 주요 내용과 특징, 그리고 이를 통해 엿볼 수 있는 퍼플렉시티의 새로운 방향에 대해 자세히 살펴보겠습니다.1. 퍼플렉시티, AI 웹브라우저 ‘Comet’을 전 세계 이용자에게 무료 공개 "Comet"은 퍼플렉시티(Perplexity)..

[ComfyUI] Lodestones에서 공개한 고성능 이미지 생성 모델, Chroma1을 소개합니다. | 오픈소스 AI 안녕하세요,인공지능(AI) 기술의 발전으로 텍스트를 이미지로 변환하는 '텍스트-투-이미지' 모델의 시대가 본격적으로 열렸습니다. 수많은 모델이 경쟁하는 가운데, 최근 Lodestones가 공개한 'Chroma1' 시리즈가 주목받고 있습니다. Chroma1은 변형된 FLUX.1-schnell 아키텍처를 기반으로, 정교하고 사실적인 이미지를 안정적으로 생성하는 대규모 생성 모델입니다. 특히 연구, 창작, 상업적 활용 등 목적에 따라 다양한 버전을 제공하여 폭넓은 확장성으로 높은 평가를 받습니다.이번 글에서는 Chroma1 시리즈의 핵심 특징과 구체적인 활용 방안까지 자세히 살펴보겠습니다. Chroma1 모델이란 Chroma1은 AI 모델 개발사 Lodestones에서 공개한 차세대 텍스트-투-이미지(Text..

GPT-5급 성능의 오픈소스 추론 모델, 메이투안 LongCat-Flash 소개 안녕하세요,최근 중국의 대표적인 테크 기업 메이투안(Meituan)이 차세대 프론티어급 모델인 GPT-5에 견줄 만한 새로운 AI 추론 모델을 공개하였습니다. 이 모델은 LongCat-Flash 시리즈로, 단순한 언어 생성 능력을 넘어 수학, 논리, 프로그래밍, 정형 증명 등 복잡한 추론 과제까지 처리할 수 있는 강력한 성능을 지니고 있습니다. 더욱 주목할 점은 이 모델이 오픈소스로 공개되어 연구자와 개발자뿐 아니라 누구나 직접 사용해볼 수 있다는 것입니다.이번 글에서는 LongCat-Flash 모델의 개요와 주요 특징, 그리고 벤치마크 성능과 활용 가능성에 대해 살펴보겠습니다.LongCat-Flash 모델이란최근 중국 음식 배달 서비스 분야 1위 기업인 메이투안(Meituan)이 자체 개발한 대규모 언..

[오픈소스 AI] 멀티모달 AI 끝판왕? Qwen3-Omni-30B-A3B 기능·성능 총정리 안녕하세요,최근 중국 알리바바가 또 한 번 주목할 만한 인공지능 모델을 공개했습니다. 이번에 발표된 Qwen3-Omni 모델은 단순히 텍스트만 이해하는 기존 언어 모델을 넘어, 오디오·이미지·비디오까지 입력받아 종합적으로 이해하고 답변할 수 있는 멀티모달 AI 모델입니다. 특히 명령 수행, 단계별 추론, 오디오 이해와 캡셔닝 등 다양한 기능을 하나의 모델에서 처리할 수 있어 연구·개발뿐 아니라 실무 서비스에도 활용 가치가 높습니다.이번 포스팅에서는 Qwen3-Omni 모델의 주요 특징과 세부 버전(Instruct, Thinking, Captioner), 그리고 경쟁 모델과의 벤치마크 비교까지 차근차근 살펴보겠습니다.Qwen3-Omni-30B-A3B2025년 9월 22일, Alibaba Tongyi Qia..

이전 1 2 3 4 ··· 36 다음

728x90

티스토리툴바