본문 바로가기

반응형

AI 소식/오픈소스 AI 모델

(32)
[오픈 소스 AI] 로블록스가 만든 "텍스트 to 3D 모델", Cube 3D를 소개합니다. 안녕하세요,최근 로블록스는 텍스트 프롬프트만으로 다양한 3D 객체를 생성할 수 있는 생성형 AI 모델을 공개하였습니다. 별도의 3D 모델링 지식 없이도, 단순한 문장 입력만으로 실시간 3D 모델을 만들어낼 수 있다는 점에서 모두에게 매우 유용한 도구가 될 것으로 기대됩니다. 이번 포스팅에서는 이 AI 모델인 Cube 3D에 대해 소개하고, 직접 설치하고 사용하는 방법까지 단계별로 알아보겠습니다.Cube 3D2025년 3월 17일, 로블록스(Roblox)는 생성형 AI 기술을 활용한 3D 모델 생성 도구인 'Cube 3D'를 오픈소스로 공개했습니다. 이 모델은 텍스트 프롬프트만으로도 직접 3D 모델과 환경을 생성할 수 있으며, 기존의 2D 이미지 기반 방식과 달리 네이티브 3D 데이터를 학습해 보다 기능적..
[오픈 소스 AI] 음성 스타일까지 복제하는 AI, Sesame을 소개합니다. 안녕하세요,최근 AI 기술의 발전으로, 단순한 명령 수행을 넘어 사람처럼 자연스럽게 대화할 수 있는 음성 AI 모델들이 등장하고 있습니다. 이러한 모델은 목소리의 억양, 감정, 말투까지 표현할 수 있는 고도화된 음성 생성 기술을 기반으로, 실제 사람과 대화하는 듯한 경험을 제공합니다.이번에 소개할 Sesame AI는 그런 대표적인 사례 중 하나로, 현재 데모 버전을 통해 직접 체험할 수 있으며, 일부 기능은 오픈소스로도 공개되어 있어 누구나 활용해볼 수 있습니다. 이 글에서는 Sesame 모델의 주요 특징과 직접 설치하여 사용하는 방법에 대해 알아보겠습니다.Sesame이란Sesame은 자연스럽고 생동감 있는 대화를 주고받을 수 있는 음성 기반 AI 모델입니다. 이 AI는 인간의 음성에서 감정과 맥락을 인..
[오픈 소스 AI] 짧은 음성 하나면 목소리를 복제하는 AI, Spark-TTS를 소개합니다. 안녕하세요,최근 AI 기술은 언어, 이미지, 영상은 물론 소리 분야에서도 눈부신 발전을 이루고 있습니다. 특히 주목할 만한 점은, 단 몇 초간의 음성 샘플만으로 특정 인물의 목소리를 정교하게 복제할 수 있는 AI 모델들이 등장하고 있다는 사실입니다. 이번에 소개해드릴 AI 모델 역시, 불과 15초 정도의 짧은 오디오 클립만 제공하면 해당 목소리를 그대로 재현해내는 놀라운 기술을 보여줍니다. 바로, 오늘 알아볼 Spark-TTS입니다. 그럼 Spark-TTS가 어떤 모델인지 자세히 살펴보겠습니다. Spark-TTS Spark-TTS는 대규모 언어 모델을 기반으로 한 고급 텍스트-투-스피치(Text-to-Speech) 시스템으로, 자연스럽고 정확한 음성 합성을 제공합니다. 이 모델은 연구와 실제 서비스 환..
구글의 온디바이스 모델 Gemma3를 소개합니다. 안녕하세요,최근 AI 기술의 발전으로 누구나 쉽게 챗봇, 글쓰기 도우미, 이미지 생성 AI를 활용하는 시대가 열렸습니다. 하지만 여전히 많은 사람들이 한 번쯤은 고민해 봅니다.“내 컴퓨터에서 직접, 나만을 위한 AI를 실행할 수 없을까?” 이 질문에 대한 해답으로 SLM(Small Language Model) 이 주목받고 있습니다. 가벼우면서도 강력한 성능을 가진 모델들이 등장하면서, 개인 PC나 로컬 환경에서도 AI를 직접 돌릴 수 있는 가능성이 열리고 있습니다. 이번 글에서는 그 중 하나인 Google Gemma 3 모델을 로컬과 Ollama 환경에서 실행해보고, 실제 성능과 활용법을 살펴봅니다.Gemma 3 란 Gemma 3는 구글에서 개발한 최신 온디바이스 AI 모델로, 경량화된 구조와 고성능을 ..
[오픈 소스 AI] Deepseek와 동급의 무료 고성능 추론 모델, QwQ를 소개합니다. 안녕하세요,AI 기술이 빠르게 발전하면서, 누구나 쉽게 활용할 수 있는 고성능 AI 모델에 대한 관심이 높아지고 있습니다. 특히, 강력한 성능을 유지하면서도 가볍고 효율적으로 실행할 수 있는 모델은 많은 사용자들에게 매력적인 선택지가 되고 있습니다.이번 글에서 소개해드릴 AI 모델은 바로 QwQ-32B입니다. QwQ-32B는 강화 학습을 적용한 고성능 AI 모델로, DeepSeek-R1과 같은 대형 모델과 유사한 성능을 발휘하면서도, 적은 리소스로 실행할 수 있도록 최적화된 모델입니다. 그러면 바로 QwQ-32B의 주요 특징, 성능, 설치 및 실행 방법을 자세히 알아보겠습니다.QwQ란QwQ는 Qwen 시리즈의 추론 모델로, 기존의 명령어 학습 모델보다 뛰어난 사고 및 추론 능력을 갖추고 있습니다. 특히 ..
국내 기업 카카오의 오픈 소스 AI 모델, Kanana를 소개합니다. 안녕하세요,최근 인공지능 기술이 급격히 발전하면서 다양한 LLM(Large Language Model)이 등장하고 있습니다. 그중에서도 국내 IT 기업인 카카오는 자사가 개발한 AI 모델을 오픈 소스로 공개하였습니다. 한국 기업에서 개발한 만큼, 특히 한국어 처리 성능이 다른 모델에 비해 높을 것으로 기대됩니다. 이번 블로그에서는 Kanana 모델이 무엇인지, 어떤 특징을 가지고 있는지, 그리고 실제로 어떻게 활용할 수 있는지 자세히 살펴보겠습니다. Kanana 모델이 국내 AI 생태계에 어떤 영향을 미칠지 함께 알아보겠습니다. KananaKanana는 카카오가 개발한 이중 언어 AI 모델 시리즈로, 한국어에서 뛰어난 성능을 보이며 영어에서도 경쟁력 있는 결과를 제공합니다. 특히, 유사한 규모의 최신 모..
[오픈 소스 AI] [로컬 환경] 저용량 고성능의 SLM, Mistral Small 3를 소개합니다. 안녕하세요,최근 AI 모델들은 점점 더 고성능화되고 있지만, 높은 연산 요구사항과 비용이 부담되는 경우가 많습니다. 특히, 로컬 환경에서 AI를 실행하려는 사용자들에게는 강력한 성능과 효율적인 리소스 활용이 중요한 요소가 됩니다.이러한 요구에 부응하여 Mistral에서 새롭게 출시한 SLM(Small Language Model), Mistral Small 3 모델이 큰 주목을 받고 있습니다. 이번 글에서는 이 모델의 특징을 살펴보고, 직접 로컬에 설치하여 실행하는 과정을 소개하겠습니다.Mistral Small 3 모델Mistral Small 3 AI 모델은 Mistral AI에서 2025년 1월 30일에 발표한 240억 개의 매개변수를 가진 고성능·저지연 AI 언어 모델입니다. 이 모델은 오픈 소스로 공..
[오픈 소스 AI] Suno와 같이 노래를 생성 해주는 AI 모델, "YuE"를 소개합니다. 안녕하세요,현재 음악 생성과 관련하여 알려진 AI 플랫폼은 Suno나 Udio 등이 있습니다. 이러한 상황에서 최근 음악 생성 AI 모델이 오픈 소스로 공개되었습니다. 이 모델은 "YuE"로 음악 생성은 물론, 보컬을 포함한 노래 또한 생성할 수 있습니다. 그러면 이 YuE 모델에 대해 알아보겠습니다.YuE란YuE는 주어진 가사를 기반으로 전체 곡을 생성하는 'lyrics2song' 작업을 수행하는 오픈소스 음악 생성 모델입니다. 이 모델은 홍콩과학기술대학교(HKUST)와 M-A-P(Multimodal Art Projection)이 공동으로 개발한 프로젝트입니다. YuE라는 이름은 음악과 행복을 뜻하는 중국어 단어 '乐'에서 유래했습니다. YuE 프로젝트 페이지 : https://map-yue.githu..

728x90
반응형