전체 글 (151) 썸네일형 리스트형 [오픈 소스 AI] [음성 생성 AI] 영상을 보고 알맞은 소리를 생성해주는 AI, MMAudio를 소개합니다. 안녕하세요,이번에 소개해 드릴 AI는 영상을 분석하여 그에 맞는 소리나 음성을 생성해 주는 모델입니다. 이 모델은 AI가 영상을 보고 적절한 효과음, 음성, 혹은 음악을 자동으로 만들어 줍니다. 이제 영상뿐만 아니라, 그에 어울리는 소리까지 AI가 생성할 수 있게 되었습니다. 그럼, 이 AI 모델에 대해 자세히 알아보겠습니다.MMAudio 란 MMAudio는 비디오와 텍스트 입력을 기반으로 동기화된 오디오를 생성하는 모델입니다. 이 모델의 핵심 혁신은 다양한 오디오-비주얼 및 오디오-텍스트 데이터 세트를 활용한 멀티모달 조인트 트레이닝을 가능하게 한다는 점입니다. 또한, 동기화 모듈을 통해 생성된 오디오가 비디오 프레임과 정밀하게 정렬되어, 자연스럽게 일치하는 영상과 오디오를 만들어냅니다.MMAudio .. [ComfyUI] Stability Matrix에 ComfyUI-Manager 설치하기 안녕하세요,지난번 포스팅에서는 Stability Matrix를 설치하고 이를 활용해 ComfyUI를 설치하는 과정과 Stability Matrix의 기능을 중점적으로 다뤄봤습니다. 이번에는 Stability Matrix를 통해 설치한 ComfyUI에 ComfyUI를 더욱 편리하게 관리할 수 있는 패키지, ComfyUI-Manager를 추가하는 방법을 알아보겠습니다. Stability Matrix와 ComfyUIStability Matrix와 ComfyUI는 모두 Stable Diffusion 기반의 AI 이미지 생성을 돕는 소프트웨어입니다. 얼핏 보면 비슷해 보이지만, 각 도구의 역할은 다릅니다. Stability Matrix는 Stable Diffusion 관련 도구들을 손쉽게 설치하고 실행할 수 있도.. 마이크로소프트가 무료로 제공하는 AI, Copilot을 소개합니다. 안녕하세요,올해에도 많은 글로벌 대기업들이 AI 모델 개발과 제공을 두고 치열한 경쟁을 이어가고 있습니다. 이러한 상황에서 오늘 소개해 드릴 AI 모델은 마이크로소프트에서 개발한 'Copilot'입니다. Copilot은 이전부터 제공되어 왔지만, 최근 마이크로소프트가 Copilot의 다양한 기능을 무제한 무료로 제공한다고 발표하면서 더욱 주목받고 있습니다. 그럼 지금부터 Copilot이 제공하는 주요 기능과 사용 방법에 대해 자세히 알아보겠습니다.Copilot이란Microsoft Copilot은 마이크로소프트에서 제공하는 강력한 생성형 AI 모델로, 다양한 업무 및 개인적인 활동을 지원하는 서비스입니다. 사용자들은 Copilot을 통해 질문에 대한 답변을 얻거나 콘텐츠 초안 작성, 이미지 생성, 일상적인.. 국내 기업 카카오의 오픈 소스 AI 모델, Kanana를 소개합니다. 안녕하세요,최근 인공지능 기술이 급격히 발전하면서 다양한 LLM(Large Language Model)이 등장하고 있습니다. 그중에서도 국내 IT 기업인 카카오는 자사가 개발한 AI 모델을 오픈 소스로 공개하였습니다. 한국 기업에서 개발한 만큼, 특히 한국어 처리 성능이 다른 모델에 비해 높을 것으로 기대됩니다. 이번 블로그에서는 Kanana 모델이 무엇인지, 어떤 특징을 가지고 있는지, 그리고 실제로 어떻게 활용할 수 있는지 자세히 살펴보겠습니다. Kanana 모델이 국내 AI 생태계에 어떤 영향을 미칠지 함께 알아보겠습니다. KananaKanana는 카카오가 개발한 이중 언어 AI 모델 시리즈로, 한국어에서 뛰어난 성능을 보이며 영어에서도 경쟁력 있는 결과를 제공합니다. 특히, 유사한 규모의 최신 모.. ChatGPT-4.5, Claude 3.7, Grok-3, Gemini-2.0 성능 비교: 가장 똑똑한 AI는? 안녕하세요,2025년이 시작된 지도 벌써 두 달이 지났습니다. 그동안 다양한 대화형 인공지능 모델(LLM, Large Language Model)이 출시되었으며, 각 모델은 놀라운 성능을 보여주었습니다. 그렇다면 이 중에서 가장 사용하기 편리하고 성능이 뛰어난 AI 모델은 무엇일까요? 이번 글에서는 최신 AI 모델들을 비교하고, 그 성능을 살펴보겠습니다.현재 다양한 AI 모델이 존재하는 만큼, 비교 기준에 따라 그 순위가 달라질 수 있습니다. 이번 글에서는 최신 AI 모델들의 성능을 비교해 보고자 합니다. 특히, 공정한 평가를 위해 Chatbot Arena에서 제공하는 데이터를 기반으로 분석할 예정입니다.Chatbot Arena는 UC Berkeley SkyLab 연구원들이 개발한 크라우드소싱 기반 AI.. 2024년 12월 생활화학제품 위반제품 정보 안녕하세요,집 안 곳곳에서 사용되는 방향제, 향초, 염색제 같은 생활화학제품들은 은은한 향기로 분위기를 바꿔주고, 기분을 좋게 만들어 주지만 사용 전 반드시 안전성을 확인하는 것이 중요합니다. 환경부(생활환경안전정보시스템 초록누리)에서 발표한 2024년 12월 생활화학제품 위반 제품 정보에 따르면, 많은 제품이 안전 기준을 준수하지 않은 채 판매되고 있는 것으로 확인됐습니다. 일부 제품에서는 유해 물질이 검출되었으며, 필수적인 제품 정보가 누락된 사례도 많았습니다. 이번 내용에서 어떤 제품들이 적발되었고, 주요 위반 사항은 무엇인지 자세히 살펴보겠습니다.2024년 12월 생활화학제품 위반제품 정보제품종류업체명제품명조치일자결함(위반)내용조치내용방향제남한강잡화점빅베어브릭 석고방향제(일랑일랑 향)2024-12.. OpneAI의 최신 AI 모델, GPT-4.5를 소개합니다. 안녕하세요,최근 앤트로픽이 최신 AI 모델을 발표한 데 이어, OpenAI에서도 GPT-4.5 버전을 새롭게 공개했습니다. 이번 모델은 이전 버전인 GPT-4o보다 더욱 정확하고 정교해졌으며, 오류 발생률도 한층 줄어들었다고 합니다. 어떤 부분이 어떻게 발전되고 변화했는지 알아보겠습니다.GPT-4.52025년 2월 27일 OpenAI가 GPT-4.5를 출시했습니다. 이는 현재까지 채팅을 위한 가장 크고 강력한 모델로, GPT-4o와 비교하 사전 학습을 확장하여 더욱 일반적인 용도로 설계되었습니다. 기존의 STEM 중심 추론 모델과는 다른 접근 방식을 취하여 보다 다양한 분야에서 활용될 수 있도록 최적화되었다고 합니다. GPT-4.5는 검색을 통한 최신 정보 액세스, 파일 및 이미지 업로드 지원, 캔버스를.. 엔트로픽에서 발표한 최신 LLM AI, Claude 3.7 Sonnet를 소개합니다. 안녕하세요,오늘은 엔트로픽에서 발표한 최신 LLM에 대해 소개해드리겠습니다. 이 AI 모델은 처음 등장했을 때부터 뛰어난 성능으로 큰 주목을 받았으며, 특히 코딩 생성과 디버깅 능력에서 다른 AI 모델보다 우수하다는 평가를 받아왔습니다. 이번에 새롭게 Claude 3.7 Sonnet로 업데이트되었습니다. 이번 업데이트에서는 어떤 기능이 추가되었는지 함께 살펴보겠습니다.Claude 3.7 Sonnet앤트로픽에서 출시한 Claude 3.7 Sonnet는 지금까지 가장 지능적인 AI 모델로 평가되며, 최초의 하이브리드 추론 모델입니다. 이 모델은 표준 모드와 확장 사고 모드를 제공하여 사용자가 필요에 따라 AI의 사고 과정을 조절할 수 있도록 설계되었습니다. Claude 3.7 Sonnet는 빠른 응답과 깊은.. 이전 1 2 3 4 5 6 7 ··· 19 다음