GPT (Generative Pre-trained Transformer)

모델

GPT

Generative Pre-trained Transformer

OpenAI가 개발한 트랜스포머 기반 언어 모델 시리즈. 대규모 텍스트로 사전학습 후 다양한 언어 작업을 수행할 수 있음을 보여주며 현대 LLM 시대를 열었다.

개념 설명

GPT는 트랜스포머의 디코더만을 사용해 "다음 토큰 예측"이라는 단순한 목표로 대규모 텍스트를 학습한다. GPT-1(2018)에서 GPT-4(2023)로 이어지는 시리즈는 스케일을 늘릴수록 성능이 급격히 향상된다는 것을 입증했고, 이 발견이 현재 AI 붐의 출발점이 됐다. ChatGPT를 통해 대중에게 처음으로 LLM의 능력을 직접 경험하게 만든 모델이기도 하다.

사용 예시

OpenAI API를 통해 GPT-4를 호출하면 텍스트 생성, 코드 작성, 분석 등을 처리할 수 있다. Claude나 Gemini 같은 경쟁 모델들도 GPT와 같은 디코더-온리 트랜스포머 구조를 따르며, GPT가 정착시킨 "사전학습 후 정렬"이라는 패러다임을 공유한다.

#OpenAI#생성모델#디코더

← AI Wiki에서 더 보기