본문 바로가기

AI 소식/오픈소스 AI 모델

구글의 AI, Gemini 1.5

안녕하세요.

AI 시대를 살아가는 우리에게 구글이 만든 AI 모델, Gemini 1.5대해 간략히 소개해보려고 합니다.

 

AI 모델

AI 모델이란 기계 학습(machine learning)이나 딥러닝(deep learning)과 같은 AI 기법을 사용하여 데이터로부터 학습하는 알고리즘의 집합입니다. 이 모델들은 데이터에서 패턴을 인식하고, 이를 기반으로 예측, 분류, 의사 결정 등 여러 종류의 작업을 수행할 수 있습니다. AI 모델은 다양한 유형이 있으며, 각각의 모델은 특정 작업이나 문제 해결에 적합한 구조와 알고리즘을 가지고 있습니다.

요즘 큰 화두가 되는 AI(인공지능)에 대한 이야기는 모두 이와 같은 모델 중 하나를 일컫습니다. 어떤 방법으로, 어떤 데이터를, 어떻게 학습시키느냐에 따라 다양한 성능과 기능을 갖추게 됩니다.

 

구글의 차세대 전략, Gemini 1.5 소개

이번에 구글에서는 Gemini 1.5라는 AI모델을 발표했습니다. (2024. 02. 16 Gemini 1.5 발표)

처음 챗GPT가 세상에 등장했을 때, 전세계적으로 큰 파장을 불러일으켰습니다. 구글은 이를 따라잡기 위해 처음으로 AI모델 Bard를 출시했고 여러 발전 단계를 거쳐 2024년 2월 Bard는 Gemini라는 이름으로 리브랜딩되었습니다. 이후 Gemini 1.0, Gemini 1.0 Ultra, 그리고 현재는 Gemini 1.5 버전으로 업그레이드 되었습니다.

 

Gemini 1.5의 특징

Gemini 1.5는 챗GPT와 같은 LLM( Large Language Model )모델로,  매우 큰 규모의 자연어 처리 모델을 의미합니다. 대량의 텍스트 데이터를 사용하여 학습되며, 텍스트 생성, 번역, 요약, 질문 응답 등 다양한 자연어 이해 및 생성 작업에 유용합니다.

이번에 발표한 Gemini 1.5의 가장 큰 특징은 한번에 입력 받을 수 있는 토큰의 수 입니다. Gemini 1.5에서는 최대 100만 토큰까지 처리할 수 있어서 방대한 양의 정보를 한 번에 처리할 수 있습니다.

'토큰'이란 단어나 구두점 등의 언어 요소를 의미하며, 입력 데이터와 모델이 생성하는 출력 데이터를 합친 전체 길이에 적용됩니다.

한 번에 처리 가능한 최대 토큰 수 비교
- ChatGPT 3.5      4,096개
- ChatGPT 4         128,000개
- Gemini 1.5         1,000,000개

 

100만개 토큰이 어느 정도의 분량인지 한 번에 가늠되지 않을 수 있습니다. 100만 토큰이 어느 정도의 양인지 쉽게 알 수 있게 하나의 지표를 가져왔습니다. 아래 표는 현재 Gemini 1.5에 대한 성능을 다른 AI모델과 비교하여 내타낸 지표입니다. 

(Gemini 1.5 - 동영상 1시간 / 음성파일 11시간 / 코드 3만 줄 / 70만개 단어까지 한번에 처리 가능.)

출처 - 구글코리아 블로그

 

 

많은 양의 처리 능력을 기반으로 긴 문맥의 데이터뿐만 아니라 동영상, 음성파일, 심지어 몇 만줄이나 되는 코드 정보까지도 처리할 수 있게 되었습니다.

 

Mixture of Experts (MoE)

Gemini 1.5는 이전 버전과 비교하여 더 적은 리소스로 거의 비슷한 효율을 낼 수 있다고 합니다. 이게 가능한 이유는 바로 Mixture of Experts(MoE) 기술 때문입니다. MoE는 여러 전문가가 모여 작업을 수행하는 모델 아키텍처를 말합니다. 각 분야의 전문가 모델을 만들고 이들에게 해당 분야의 작업 처리를 할당합니다. 이렇게 함으로써 특정 작업이나 데이터 영역에 더 능숙한 전문가가 전체 모델의 예측을 결정하도록 만들어줍니다. 이는 적은 리소스로도 더 큰 효율을 내도록 도와주는 방법입니다.

 

InContext Learning

Gemini 1.5에서 또 주시해야할 기능으로는 InContext Learning 기능입니다. InContext Learning 기능모델이 주어진 프롬프트 내 정보를 기반으로 새로운 정보를 학습하는 기능을 말합니다. 이는 추가적인 미세 조정 작업 없이도 모델이 새로운 상황이나 정보를 이해하고 활용할 수 있게 합니다. 예를 들어, 한글에 대해 전혀 학습되지 않은 상태라도 한글 문법책만 입력하면 한글을 사용할 수 있게 됩니다. Gemini 1.5에서 이러한 InContext Learning 기능이 잘 구현되어 있습니다.

 

 

AI 기술은 우리의 삶을 혁신하고 변화시키는 핵심 기술로, 무섭게 느껴질 정도로 빠르게 진화하는 AI 모델들이 나타나고 있습니다. 현재 구글에서 출시한 Gemini 1.5 또한 이러한 AI모델 중 하나라고 생각됩니다. AI는 이제 피할 수 없는 현실이 되었으며, AI는 우리의 직업을 대체할 것입니다. AI시대를 대비하기 위해서는 이러한 AI 기술을 활용하는 사람이 되어야 할것입니다.