본문 바로가기

반응형

전체 글

(252)
[오픈 소스 AI] LG가 만든 고성능 추론 모델, EXAONE-Deep을 소개합니다. 안녕하세요,최근 국내 기업 LG에서 새롭게 개발한 추론 모델 EXAONE-Deep이 공개되었습니다. 이전 버전인 EXAONE 모델은 이미 작년에 선보인 바 있지만, 성능 면에서는 다소 아쉬운 부분이 있었습니다. 그러나 이번에 발표된 EXAONE-Deep은 DeepSeek-R1과 비교해도 손색없는 성능을 보여주고 있습니다.이번 글에서는 EXAONE-Deep 모델에 대해 자세히 살펴보고, 실제로 어떻게 활용할 수 있는지도 함께 알아보겠습니다.EXAONE-Deep EXAONE-Deep은 LG AI연구원이 개발한 고성능 추론 특화 인공지능 모델로, 수학적 논리 이해, 과학적 개념 추론, 프로그래밍 문제 해결 등에서 뛰어난 성능을 보여줍니다. 이 모델은 320억 개의 매개변수를 가진 EXAONE-Deep-32B,..
Grok-3 등장 몇 주 후, AI 시장의 흐름은? 주요 모델 한눈에 비교 안녕하세요,어느새 긴 겨울이 지나고, 봄기운이 완연하게 퍼졌습니다. 거리에는 벌써 반팔 차림의 사람들이 하나둘 눈에 띄고, 따뜻한 바람 속에서 여름의 기운마저 서서히 느껴지는 요즘입니다.올해 초, 다양한 AI들이 연이어 등장하며 뜨거운 관심을 모았습니다. 그 중에서도 특히 주목받았던 Grok-3가 출시된 지 어느덧 몇 주가 지났습니다. 이제 시간이 조금 흐른 지금, 과연 Grok-3가 여전히 ‘최고의 AI’라는 평가를 받고 있는지 궁금해집니다. 오늘은 그 평가에 어떤 변화가 있었는지, 그리고 다른 AI들과 비교해 현재 어떤 위치에 있는지 함께 살펴보겠습니다.현재 다양한 AI 모델이 출시되고 있는 만큼, 어떤 기준으로 비교하느냐에 따라 그 순위는 달라질 수 있습니다. 이번 포스팅에서는 최신 AI 모델들을 ..
[오픈 소스 AI] [음성 생성 AI] 짧은 음성 하나면 목소리를 복제하는 AI, Spark-TTS를 소개합니다. 안녕하세요,최근 AI 기술은 언어, 이미지, 영상은 물론 소리 분야에서도 눈부신 발전을 이루고 있습니다. 특히 주목할 만한 점은, 단 몇 초간의 음성 샘플만으로 특정 인물의 목소리를 정교하게 복제할 수 있는 AI 모델들이 등장하고 있다는 사실입니다. 이번에 소개해드릴 AI 모델 역시, 불과 15초 정도의 짧은 오디오 클립만 제공하면 해당 목소리를 그대로 재현해내는 놀라운 기술을 보여줍니다. 바로, 오늘 알아볼 Spark-TTS입니다. 그럼 Spark-TTS가 어떤 모델인지 자세히 살펴보겠습니다. Spark-TTS Spark-TTS는 대규모 언어 모델을 기반으로 한 고급 텍스트-투-스피치(Text-to-Speech) 시스템으로, 자연스럽고 정확한 음성 합성을 제공합니다. 이 모델은 연구와 실제 서비스 환..
한 번의 프롬프트로 업무 끝! 완전 자동화 AI, Manus AI 등장 안녕하세요,최근 AI 분야에서 또 한 번 눈길을 사로잡는 소식이 전해졌습니다. 중국에서 개발된 Manus AI가 등장하며, 많은 사람들이 상상하던 완전 자동화 AI 에이전트의 모습을 현실로 보여주고 있기 때문입니다. 단순한 대화형 AI를 넘어, 사용자의 지시 없이 스스로 계획하고 실행하는 Manus AI는 출시 전임에도 불구하고 전 세계적으로 큰 주목을 받고 있습니다. 아직 정식 서비스가 오픈되지는 않았지만, 이 AI가 왜 주목받고 있는지, 어떤 점에서 기존 AI와 다른지 궁금해하시는 분들을 위해 Manus AI의 주요 특징과 기능을 정리해보았습니다.Manus AI 란Manus AI는 중국 스타트업에서 개발한 자율형 인공지능 에이전트로, 2025년 3월 공식 출시되었습니다. 'Manus'라는 이름은 라틴..
구글의 온디바이스 모델 Gemma3를 소개합니다. 안녕하세요,최근 AI 기술의 발전으로 누구나 쉽게 챗봇, 글쓰기 도우미, 이미지 생성 AI를 활용하는 시대가 열렸습니다. 하지만 여전히 많은 사람들이 한 번쯤은 고민해 봅니다.“내 컴퓨터에서 직접, 나만을 위한 AI를 실행할 수 없을까?” 이 질문에 대한 해답으로 SLM(Small Language Model) 이 주목받고 있습니다. 가벼우면서도 강력한 성능을 가진 모델들이 등장하면서, 개인 PC나 로컬 환경에서도 AI를 직접 돌릴 수 있는 가능성이 열리고 있습니다. 이번 글에서는 그 중 하나인 Google Gemma 3 모델을 로컬과 Ollama 환경에서 실행해보고, 실제 성능과 활용법을 살펴봅니다.Gemma 3 란 Gemma 3는 구글에서 개발한 최신 온디바이스 AI 모델로, 경량화된 구조와 고성능을 ..
언어 모델과 이미지 생성의 결합, Gemini 2.0 Flash Exp를 소개합니다. 안녕하세요,최근 성능좋고 빠른 대형 언어 모델이나 이미지 생성 모델들이 등장하고 있습니다. 하지만 이번에는 이러한 대형 언어 모델 최근 성능이 뛰어나고 빠른 대형 언어 모델과 이미지 생성 모델들이 잇따라 등장하고 있습니다. 그런데 이번에는 이 두 가지 기능을 하나로 통합한 새로운 AI 모델이 출시되었습니다. 바로 구글이 개발한 "Gemini 2.0 Flash Experimental"입니다. 기존의 이미지 생성 모델은 주로 대형 언어 모델과 별도로 연결되어 있는 방식이었지만, 이번에 구글이 선보인 모델은 대형 언어 모델 안에 이미지 생성 기능까지 통합한 것이 특징입니다. 그러면 이 모델에 대해 알아보겠습니다. Gemini 2.0 Flash (Image Generation) Experimental 란 Gem..
[ComfyUI] 알리바바가 공개한 무료 영상 생성 AI, "Wan 2.1" – ComfyUI 연동 가능한 오픈 소스! 안녕하세요,최근 AI 기술의 발전으로 텍스트나 이미지 생성은 물론, 영상 생성 AI까지 눈부신 성장을 이루고 있습니다. 얼마전 텐센트에서 공개했던 HunyuanVideo-I2V 모델을 공개했었는데, 이번에는 알리바바에서 강력한 영상 생성 오픈소스 AI, Wan 2.1을 공개했습니다. 특히 ComfyUI와 같은 노드 기반 AI 툴과도 연동이 가능해, 복잡한 설정 없이도 쉽게 고품질 영상을 만들어볼 수 있다는 점에서 큰 주목을 받고 있는데요. 이번 글에서는 Wan 2.1의 특징, 설치 방법, 그리고 직접 활용하는 방법에 대해 알아보겠습니다.Wan 2.1Wan 2.1은 알리바바 산하 연구팀에서 개발한 최첨단 AI 비디오 생성 모델로, 다양한 영상 생성 및 편집 작업을 손쉽게 수행할 수 있는 강력한 기능을 제공..
[오픈 소스 AI] Deepseek와 동급의 무료 고성능 추론 모델, QwQ를 소개합니다. 안녕하세요,AI 기술이 빠르게 발전하면서, 누구나 쉽게 활용할 수 있는 고성능 AI 모델에 대한 관심이 높아지고 있습니다. 특히, 강력한 성능을 유지하면서도 가볍고 효율적으로 실행할 수 있는 모델은 많은 사용자들에게 매력적인 선택지가 되고 있습니다.이번 글에서 소개해드릴 AI 모델은 바로 QwQ-32B입니다. QwQ-32B는 강화 학습을 적용한 고성능 AI 모델로, DeepSeek-R1과 같은 대형 모델과 유사한 성능을 발휘하면서도, 적은 리소스로 실행할 수 있도록 최적화된 모델입니다. 그러면 바로 QwQ-32B의 주요 특징, 성능, 설치 및 실행 방법을 자세히 알아보겠습니다.QwQ란QwQ는 Qwen 시리즈의 추론 모델로, 기존의 명령어 학습 모델보다 뛰어난 사고 및 추론 능력을 갖추고 있습니다. 특히 ..

728x90
반응형