본문 바로가기

반응형

분류 전체보기

(127)
[오픈 소스 AI] [로컬 환경] 메타에서 공개한 LLM, Llama 3.3를 소개합니다. 안녕하세요,최근 메타에서 또 하나의 새로운 LLM 모델을 출시했습니다. 이전에 공개된 Llama 3.1 405B 모델은 오픈소스임에도 불구하고 GPT-4o와 유사한 성능을 발휘한다는 평가를 받았으며, Llama 3.2 모델은 온디바이스 모델로도 활용할 수 있을 만큼 경량화되면서도 뛰어난 성능을 제공해 많은 주목을 받았습니다. 2024년이 끝나기 전에 메타는 Llama 3.3 모델을 추가로 선보였습니다. 이번 모델은 과연 어떤 특징을 가지고 있을지 함께 알아보겠습니다.Llama 3.3메타는 2024년 12월 6일 Llama 3.3 70B 모델을 공개했습니다. 이 모델은 같은 해 4월에 발표된 Llama 3의 하위 버전으로, 700억 개의 매개변수를 보유한 중형 언어 모델입니다. Llama 3.3 모델은 G..
AI가 실시간으로 게임을 만든다, 구글 딥마인드에서 공개한 Genie2를 소개합니다. 안녕하세요,이제 AI가 게임 속 환경을 스스로 만들어내고, 사용자에게 실시간으로 만들어지는 공간을 제공해준다면 어떨까요? 최근 Google DeepMind에서 이러한 혁신적인 AI를 발표했습니다. 바로 Genie 2입니다. 이 모델은 복잡한 게임 환경을 스스로 학습하고 이해하며, 사용자가 직접 그 환경 속에 들어가 상호작용하는 듯한 경험을 제공합니다. 그럼 Genie 2에 대해 자세히 알아보겠습니다.1. Genie 2란? Genie 2는 Google DeepMind가 최근 발표한 대규모 기초 월드 모델로, 인공지능 분야에서 큰 주목을 받고 있는 혁신적인 AI 시스템입니다. 이 모델은 게임 환경에서 일반화된 학습과 추론 능력을 보여주며, 복잡한 상황에서도 지능적으로 행동할 수 있도록 설계되었습니다. Gen..
[영상 생성 AI] [로컬 환경] ComfyUI 이용하여 영상 생성하기 6탄 : LTX-Video AI 안녕하세요,오늘은 누구나 손쉽게 고품질의 비디오를 제작할 수 있게 도와주는 'LTX-Video AI'를 소개하려고 합니다. 텍스트나 이미지에서 멋진 비디오를 만들어낼 수 있다면 어떨까요? 게다가 그 과정이 간단하고 누구나 쉽게 접근할 수 있다면 정말 매력적이겠죠. 이번 포스팅에서는 LTX-Video AI를 직접 다운로드하고 설치하는 방법부터 실제로 영상을 만들어보는 과정까지 자세히 안내해 드리겠습니다.LTX-Video AILTXV-Video는 Lightricks에서 개발한 최첨단 생성형 AI 비디오 모델로, 텍스트/이미지/비디오 입력을 통해 고품질 영상을 생성합니다. GPU와 TPU 시스템에 최적화되어 있어 빠른 속도로 영상을 생성하면서도 높은 시각적 품질을 유지합니다. 이 모델은 프레임 간 학습을 통해..
구글이 출시한 음악 생성 AI 도구, MusicFX를 소개합니다. 안녕하세요,복잡한 음악 제작 과정 없이 원하는 장르, 악기, 감정을 텍스트로 입력하면 음악을 생성해주는 AI가 있다면 어떨까요? 지난달 구글에서 새롭게 출시된 MusicFX라는 음악 생성 AI를 소개해드리려고 합니다. MusicFX는 구글이 선보인 AI 기반 음악 생성 도구로, 누구나 손쉽게 자신만의 음악을 창작할 수 있는 AI 플랫폼입니다. 이번 포스팅에서는 MusicFX의 주요 특징과 사용 방법을 자세히 알아보겠습니다.MusicFX란MusicFX는 구글이 개발한 AI 기반 음악 생성 도구로, 누구나 쉽고 창의적으로 음악을 제작할 수 있도록 설계된 혁신적인 서비스입니다. 이 도구는 사용자가 텍스트 프롬프트를 입력하면 새로운 음악을 생성하며, 원하는 장르, 악기, 분위기 등을 자유롭게 지정할 수 있습니다..
2024년 9월 생활화학제품 위반제품 정보 안녕하세요,우리의 일상에서 자주 사용하는 생활화학제품들, 과연 얼마나 안전할까요? 섬유유연제, 세탁세제, 방향제 등은 이미 우리의 생활에 깊이 스며들어 있습니다. 그러나 이러한 제품들 중 일부는 안전 기준을 위반하여 우리의 건강에 위험을 미칠 수 있습니다. 2024년 9월, 환경부에서 운영하는 초록누리에서 생활화학제품 위반제품 정보를 가져왔습니다. 이러한 제품들은 최대한 사용을 피하는 것이 좋으며, 이는 우리 가족의 건강을 지키는 중요한 첫걸음이라 생각합니다. 그럼 2024년 9월 생활화학제품 위반 제품 정보를 함께 살펴보겠습니다. 1.  2024년 9월 생활화학제품 위반제품 정보제품분류업체명제품명조치일결함(위반)내용조치내용방향제오마이캔들 왁스타블렛2024-09-12안전·표시기준 위반[안전기준 적합확인 ..
Google 딥마인드에서 공개한 4D AI, CAT4D를 소개합니다. 안녕하세요,최근 AI 기술은 2D 이미지와 영상을 넘어 "4D 장면"까지 생성할 수 있는 수준에 도달했습니다. 구글 딥마인드에서 공동으로 개발된 CAT4D라는 이 AI 모델은 시간과 공간의 변화를 동시에 표현함으로써 기존 영상 기술을 한 단계 더 발전시키고 있습니다. 특히, 복잡한 카메라 세팅 없이도 다양한 시점에서 장면을 생성할 수 있어 매우 직관적이고 혁신적인 방법으로 새로운 시각적 경험을 제공합니다. 이번 포스팅에서는 CAT4D의 원리와 주요 기능, 그리고 그 독창적이고 혁신적인 접근 방식을 소개해 드리겠습니다.CAT4D란CAT4D는 'Create Anything in 4D with Multi-View Video Diffusion Models'의 약자로, 단일 모노큘러 비디오를 다중 시점 비디오로 ..
[이미지 생성 AI] [로컬 환경] ComfyUI 이용하여 이미지 생성하기 9탄 : OmniGen AI, 2img to img 생성 안녕하세요,지난 포스팅에서 우리는 OmniGen을 활용하여 텍스트를 기반으로 이미지를 생성하고, 특정 이미지를 수정하는 방법에 대해 살펴보았습니다. 이번 글에서는 첫 번째 포스팅에 이어, OmniGen의 심화 기능에 대해 다뤄보려 합니다. 여러 이미지를 활용해 특정 포즈의 이미지를 생성하거나, 다른 이미지의 스타일을 적용하는 등 OmniGen의 확장된 기능을 알아보겠습니다.OmniGenOmniGen은 VAE(Variational Autoencoder)와 Transformer 모델을 결합한 통합 이미지 생성 모델입니다. 이전 포스팅에서는 OmniGen을 활용하여 텍스트를 기반으로 이미지를 생성하거나 특정 이미지를 수정하는 방법을 다뤘습니다. 이 모델은 단순히 텍스트 기반 생성뿐만 아니라, 여러 이미지를 참..
[이미지 생성 AI] [로컬 환경] ComfyUI 이용하여 이미지 생성하기 8탄 : OmniGen AI, txt2img, img2img 안녕하세요,AI를 사용해 이미지를 생성하는 것은 이제 흔한 일이 되었습니다. 생성된 이미지를 AI로 편집할 수도 있지만, 이를 위해서는 여러 단계를 거쳐야 했기 때문에 다소 어렵게 느껴지기도 했습니다. 그런데 하나의 AI만으로 이미지 생성과 편집을 모두 할 수 있다면 어떨까요? 이번 포스팅에서 소개드릴 내용은 바로 OmniGen AI 입니다. OmniGen은 텍스트 입력만으로 이미지 생성뿐만 아니라 편집까지 손쉽게 수행할 수 있는 생성형 AI 입니다. 그럼 이제 OmniGen에 대해 자세히 알아보겠습니다. OmniGen이란OmniGen은 VAE(Variational Autoencoder)와 변환기(Transformer) 모델로 구성된 간소화된 통합 이미지 생성 모델입니다. 기존의 이미지 생성 모델들이 C..

728x90
반응형