본문 바로가기

AI 소식/오픈소스 AI 모델

(32)

[영상 생성 AI] [로컬 환경] 오픈 소스 ToonCrafter를 소개합니다. 안녕하세요 디지털 시대에 우리는 점점 더 많은 시간을 온라인에서 보내며, 영상 콘텐츠의 중요성은 날로 커지고 있습니다. 특히, 만화와 애니메이션 팬들에게는 자신만의 독창적인 영상을 만드는 것이 큰 꿈일 것입니다. 이러한 꿈을 실현시켜 줄 수 있는 도구가 있습니다. 바로 ToonCrafter입니다. ToonCrafter는 두 장의 이미지를 입력하면 그 두 장의 이미지를 처음과 끝으로 하는 자연스러운 전환 영상을 생성해주는 오픈 소스 AI 모델입니다. 이 도구는 만화 이미지를 생성하고 중간 이미지를 인터폴레이션하는 연구 프로젝트로, 사용자가 손쉽게 고품질의 애니메이션을 만들 수 있도록 도와줍니다. 이 포스팅에서는 로컬환경에서 ToonCrafter를 설치하는 방법과 실행 방법에 대해 자세히 알아보겠습니다. ..

[영상 생성 AI 모델] 소리에 맞게 입 모양을 만들어주는 AI, Hallo를 소개합니다. 안녕하세요오늘은 사진을 생생한 영상으로 변환해주는 AI 모델, Hallo를 소개해드리고자 합니다. Hallo는 단순한 사진을 오디오 음성에 맞춰 실제로 말하는 듯한 동영상으로 만들어주는 획기적인 AI 모델입니다. 이 모델은 지금까지 여러 AI들이 시도했던 입 모양 생성 기술을 뛰어넘어, 가장 현실적이고 자연스러운 결과를 제공합니다. Hallo를 사용하면 마치 사진 속 인물이 실제로 말하는 것처럼 생생한 영상을 만들어낼 수 있습니다. 특히, 이 기술은 영화 제작, 게임 개발, 가상 인플루언서, 언어 학습 도구 등 다양한 분야에서 큰 혁신을 불러올 것입니다. 이제 Hallo AI에 대해 자세히 살펴보겠습니다.1. Hallo란?Hallo 모델은 GitHub에서 오픈 소스로 공개된 혁신적인 AI 모델입니다. 이..

[이미지 생성 AI] Stable Diffusion 로컬 환경에서 사용하기 안녕하세요. 2024년은 AI 시대라고 해도 과언이 아닙니다. 작문부터 번역, 그림, 심지어 영상 제작까지 AI가 우리의 삶을 혁신적으로 변화시키고 있습니다. 이러한 AI 기술의 발전은 우리에게 새로운 가능성을 열어주며, 다양한 분야에서 창의적인 작업을 보다 쉽게 할 수 있도록 도와주고 있습니다. 오늘은 그중에서도 이미지 생성 AI인 Stable Diffusion에 대해 알아보겠습니다. Stable Diffusion이란Stable Diffusion은 AI 기반의 이미지 생성 모델로, 주어진 텍스트 프롬프트를 바탕으로 고품질의 이미지를 생성합니다. 2022년에 출시된 이 모델은 여러 단계의 노이즈 제거 과정을 통해 이미지를 생성하는 방식으로 작동합니다. Stable Diffusion은 OpenAI의 D..

오픈소스 EEVE 모델 로컬환경에서 실행하기 3탄 (RemoteRunnable / Streamlit) 안녕하세요.지난 포스팅에서 오픈소스를 활용하여 서버에서 작동하는 EEVE 모델을 만들었습니다. 이번에는 RemoteRunnable과 Streamlit을 사용하여 프론트엔드 코드를 구성하고, 로컬 서버에서 EEVE 모델이 작동하는 형태로 만들어보겠습니다. EEVE 모델을 활용하여 로컬 서버로 백엔드를 구성하는 작업에 대해 궁금하신 분들은 아래 링크를 통해 확인하실 수 있습니다.[Marcus' Stroy] - 오픈소스 EEVE 모델 로컬환경에서 실행하기 1탄[Marcus' Story] - 오픈소스 EEVE 모델 로컬환경에서 실행하기 2탄 (LangChain / LangServe / ngrok) 1. RemoteRunnable / Streamlit RemoteRunnable과 Streamlit은 각각 원격 ..

오픈소스 EEVE 모델 로컬환경에서 실행하기 2탄 (LangChain / LangServe / ngrok) 안녕하세요.지난 포스팅에서는 오픈소스 EEVE 모델을 로컬 환경에 설치하고 실행하는 과정을 다뤘습니다. 이번에는 설치된 EEVE 모델을 LangServe를 이용하여 외부 웹사이트에 배포하는 방법을 소개하고자 합니다. 지난 글을 놓치신 분들은 아래 링크를 통해 확인하실 수 있습니다.[Marcus' Stroy] - 오픈소스 EEVE 모델 로컬환경에서 실행하기 1탄1. LangChain / LangServe LangChain와 LangServe는 대형 언어 모델(LLM)을 활용한 애플리케이션을 개발할 수 있게 도와주는 도구로써, 이번에 이를 활용하여 오픈소스 EEVE 모델을 설정하여 서버를 구동하는 방법을 다루고자 합니다. LangChain은 LLM을 다양한 데이터 소스와 API에 연결할 수 있는 유연한 추상..

구글 AI모델, Gemma 사용하기 1탄 안녕하세요이번 글에서는 Gemma AI모델을 만드는 방법에 대해 알아보겠습니다. Gemma AI모델은 구글에서 오픈소스로 공개한 AI모델 중 하나입니다. Gemma에 대해 더 알고 싶으시다면 아래 포스팅 글을 참고하시기 바랍니다.Google의 AI모델, Gemma 준비물1. Kaggle ID (사이트 주소 : https://www.kaggle.com/) - 구글은 Gemma의 오픈 소스를 "Kaggle"이라는 사이트를 통해 공유했습니다. 따라서 해당 사이트를 이용하기 위해서는 Kaggle 아이디가 필요합니다.2. Google ID (사이트 주소 : https://www.google.com/) - Gemma 모델을 실행시킬 프로그램으로는 구글 코랩을 사용..

Google의 AI모델, Gemma 구글은 2024년 2월 21일, 무료 AI 모델 Gemma(젬마)에 대해 발표하였습니다. Gemma는 오픈 AI모델로, 이 모델을 통해 개인화 된 AI를 만들 수 있게 되었습니다. 구글의 최첨단 오픈 모델 '젬마(Gemma)'를 공개합니다. Gemma 모델은 현재 구글의 가장 유용하고 규모가 큰 AI모델 Gemini의 기술 및 인프라를 기반으로 구축된 최첨단 경량 오픈 모델입니다. 그래서 이번에 젬마 모델은 동급 규모의 다른 오픈 모델들과 비교했을때 최고의 성능을 보여줍니다. Gemma 모델은 인터넷 연결없이 개발자의 노트북이나 데스크톱 컴퓨터에서 바로 실행될 수 있고, 구글이 추구하는 사용기준에 적합하도록 AI모델의 답변을 제한하는 기능이 추가되었으며, 주요 벤치마크에서 더 큰 규모의 타 모델보다 뛰어..

구글의 AI, Gemini 1.5 안녕하세요. AI 시대를 살아가는 우리에게 구글이 만든 AI 모델, Gemini 1.5에 대해 간략히 소개해보려고 합니다. AI 모델 AI 모델이란 기계 학습(machine learning)이나 딥러닝(deep learning)과 같은 AI 기법을 사용하여 데이터로부터 학습하는 알고리즘의 집합입니다. 이 모델들은 데이터에서 패턴을 인식하고, 이를 기반으로 예측, 분류, 의사 결정 등 여러 종류의 작업을 수행할 수 있습니다. AI 모델은 다양한 유형이 있으며, 각각의 모델은 특정 작업이나 문제 해결에 적합한 구조와 알고리즘을 가지고 있습니다. 요즘 큰 화두가 되는 AI(인공지능)에 대한 이야기는 모두 이와 같은 모델 중 하나를 일컫습니다. 어떤 방법으로, 어떤 데이터를, 어떻게 학습시키느냐에 따라 다양한 ..

이전 1 2 3 4 다음

728x90

티스토리툴바