전체 글 (127) 썸네일형 리스트형 [이미지 생성 AI] [로컬 환경] ComfyUI 이용하여 이미지 수정하기 1탄 : Flux-Upscaler 안녕하세요, 2024년은 AI의 시대라고 해도 과언이 아닙니다. AI는 이제 이미지 생성뿐만 아니라 음성, 음악, 심지어 영상 제작까지 그 영역을 확장하고 있습니다. 그러나 AI 기술은 단순히 콘텐츠를 생성하는 데 그치지 않고, 사용자가 원하는 결과물을 더욱 정밀하고 고품질로 만드는 방향으로 지속적으로 발전하고 있습니다. 오늘 소개할 주제는 바로 '이미지 업스케일링'입니다. 이미지 업스케일링이란 저해상도 이미지를 고해상도로 변환하는 과정을 의미합니다. 해상도가 낮아 선명하지 않거나 크기 제한으로 인해 아쉬웠던 이미지를 고해상도로 개선하여 품질을 높이는 작업입니다. 특히 AI로 생성된 이미지의 디테일을 향상시키기 위해 업스케일링 기술이 중요한 역할을 하고 있습니다. 이번 포스팅에서는 이미지 생성 AI로 잘.. [오픈 소스 AI] [로컬 환경] 알리바바 클라우드에서 공개한 AI, Qwen 2.5를 소개합니다. 안녕하세요,AI 기술은 미국뿐만 아니라 세계 곳곳에서 혁신적인 발전을 이루고 있습니다. AI 기술은 의료, 금융, 교육 등 다양한 산업 분야에서 기존의 한계를 넘어 새로운 가능성을 제시하고 있습니다. 특히 최근 중국에서 발표된 동영상 생성 AI인 KLING AI는 매우 사실적이고 자연스러운 동영상 생성 능력으로 많은 사람들을 놀라게 했습니다. 이번에는 알리바바 클라우드에서 발표한 AI 모델인 Qwen 2.5 모델이 큰 주목을 받고 있습니다. Qwen 2.5는 자연어 처리, 코드 작성 등 다양한 작업에서 놀라운 성능을 보여주는 대형 언어 모델로, 이번 포스팅에서는 이 모델의 기능과 특징에 대해 자세히 알아보도록 하겠습니다. Qwen 2.5란Qwen 2.5는 알리바바 클라우드의 최신 대형 언어 모델로, 여러.. [오픈 소스 AI] [로컬 환경] 실시간 대화하는 AI 비서, "Moshi"를 소개합니다. 안녕하세요, 오픈AI가 최근 GPT-4o를 출시하며 실시간 대화 음성 기능을 선보여 큰 주목을 받았습니다. 이와 동시에 구글도 Gemini Live라는 기능을 통해 실시간 음성 채팅 서비스를 제공하고 있으며, AI와의 실시간 대화 기능이 점점 더 많은 관심을 받고 있습니다. 이제 단순한 텍스트 기반의 채팅을 넘어서, 음성으로 소통하는 AI 비서가 차세대 기술로 자리잡고 있습니다. 이러한 흐름 속에서 프랑스 기업 Kyutai(큐타이)는 GPT-4o와 비슷한 성능을 지닌 AI 음성 비서 Moshi(모시)를 개발하고, 이를 오픈 소스로 공개하여 더욱 큰 화제를 불러일으켰습니다. Moshi는 사용자와 자연스러운 음성 대화를 나눌 수 있는 인공지능 비서로, 다양한 용도에 쉽게 적용될 수 있도록 설계되었습니다. 이.. 2024년 7월 생활화학제품 위반제품 정보 안녕하세요,우리 일상 속에서 쉽게 접할 수 있는 생활화학제품들이 우리 몸에 해를 끼칠 수 있다는 사실을 아시나요? 우리가 매일 사용하는 청소용품, 세제, 화장품 등은 삶을 더 편리하고 쾌적하게 만들어 주지만, 때로는 우리의 건강에 큰 악영향을 미치기도 합니다. 2024년 7월에는 안전 규정을 어기고 판매된 생활화학제품들이 확인되었는데, 믿고 사용하던 제품들조차 위험성을 내포하고 있을 수 있다는 사실은 소비자로서 더욱 주의를 기울이게 만듭니다. 이제 그 문제 제품들이 무엇인지 알아보고, 우리의 일상을 더 안전하게 지키는 방법에 대해 알아보겠습니다. 1. 2024년 7월 생활화학제품 위반제품 정보 제품분류업체명제품명조치일결함(위반)내용조치내용광택 코팅제대진산업미네랄 우드 오일2024-07-02안전확인 갱신.. [오픈 소스 AI] [로컬 환경] 국내 기업 올거나이즈에서 개발한 한국어 특화 AI 모델을 소개합니다. 안녕하세요,오늘은 국내 기업 올거나이즈에서 선보인 강력한 한국어 AI 언어 모델인 'Llama 3 Alpha Ko 8B Instruct'를 소개해드리려고 합니다. 이 모델은 메타에서 오픈 소스로 공개한 Llama 3를 개량하여, 한국어의 특성에 맞춰 LLM이 더욱 잘 이해하고 대답하도록 만든 모델입니다. 이번 포스팅에서는 'Llama 3 Alpha Ko 8B Instruct'를 어떻게 사용할 수 있는지에 대해 알아보도록 하겠습니다. 그럼 지금부터 이 모델의 특징과 활용 방법을 자세히 살펴보겠습니다. 올거나이즈 LLM (한국어 특화 AI)올거나이즈는 한국어 실무에 특화된 대형 언어 모델(LLM)인 '알파-인스트럭트'를 출시했습니다. 이 모델은 메타의 LLaMA 3 기반으로 개발되었으며, 특히 한국어 문서 .. [이미지 & 영상 생성 AI] 이미지와 영상을 생성해주는 AI, KLING AI를 소개합니다. 안녕하세요,KLING AI는 텍스트나 이미지를 간단히 입력하면 이를 고퀄리티 영상으로 변환해주는 혁신적인 AI 도구입니다. 시각적 콘텐츠 제작의 복잡함을 없애고, 누구나 손쉽게 창의적인 영상을 만들 수 있도록 도와줍니다. 이 포스팅에서는 KLING AI의 핵심 기능과 실제 사용 경험을 소개합니다. KLING AI란Kling AI는 Kuaishou에서 개발한 강력한 AI 기반 비디오 생성 도구로, 텍스트나 이미지 입력만으로 고품질 영상을 제작할 수 있습니다. 특히 현실적인 물리적 움직임과 상호작용을 구현하는 데 뛰어나며, 최대 2분 길이의 1080p 해상도 비디오를 생성할 수 있습니다. Kling AI는 고유한 3D 시공간 주의 메커니즘과 Diffusion Transformer 기술을 결합해 복잡한 동작을.. [영상 생성 AI] [로컬 환경] ComfyUI 이용하여 영상 생성하기 3탄 : Stable Video Diffusion 활용하기 안녕하세요,AI를 활용하면 이제 이미지 생성뿐만 아니라 다양한 콘텐츠 생성이 가능해졌습니다. 노래, 작곡, 심지어 영상 생성까지도 AI 모델을 통해 생산할 수 있습니다. 이번 포스팅에서는 텍스트나 이미지를 입력받아 영상을 생성하는 AI 모델인 Stable Video Diffusion(SVD)를 소개하고자 합니다. 이 모델은 이미지 생성 AI 모델 Stable Diffusion을 오픈 소스로 공개하여 유명한 Stability AI에서 개발한 것입니다. 작년에 출시되었지만 여전히 뛰어난 퀄리티를 자랑해 소개드리게 되었습니다. 그럼 이제 SVD 모델에 대해 자세히 알아보겠습니다. Stable Video Diffusion (SVD) Stable Video Diffusion(SVD) 모델은 Stability AI.. [이미지 생성 AI] [로컬 환경] ComfyUI 이용하여 이미지 생성하기 5탄 : FLUX.1 AI 활용하기 (저사양 버전) 안녕하세요,지난 포스팅에서 FLUX.1 AI 모델의 설치 및 사용 방법을 소개드렸습니다. 다만, Flux 모델은 120억 개의 매개변수를 가지고 있어 고사양 PC가 필요하며, 이미지 생성 시 높은 퀄리티를 제공하지만 실행 속도와 자원 소모가 상당히 큽니다. 그러나, 최근에 낮은 사양의 PC에서도 실행 가능한 FLUX.1 AI FP8 버전 체크포인트가 배포되었습니다. 이번 포스팅에서는 낮은 사양에서도 FLUX.1 AI FP8 버전을 설치하고 사용하는 방법을 안내드리겠습니다. 이 내용은 "FLUX.1 AI 활용하기" 시리즈의 연장선에 있는 포스팅으로, ComfyUI 설치나 추가적인 필요한 노드에 관한 정보는 이전 포스팅을 참고해 주세요.FLUX.1 AI 활용하기 : [Marcus' Story] - [이미지 .. 이전 1 ··· 5 6 7 8 9 10 11 ··· 16 다음