대규모 언어 모델 (Large Language Model)

모델

대규모 언어 모델

Large Language Model

수백억 개의 파라미터로 학습한 딥러닝 모델. 텍스트 이해, 생성, 추론, 코드 작성 등 광범위한 작업을 수행하는 현재 AI 기술의 핵심이다.

대규모 언어 모델이란

인터넷의 방대한 텍스트를 학습해서, 주어진 맥락에서 다음에 올 토큰을 예측하는 신경망이다. 이 단순한 원리에서 번역, 요약, 코드 작성, 수학 추론까지 놀라운 능력이 나온다. GPT(OpenAI), Claude(Anthropic), Gemini(Google), Llama(Meta)가 대표적이다.

사용 예시

API로 직접 호출할 때는 시스템 프롬프트로 역할을 정하고, 도구를 연결하고, 구조화된 출력으로 형식을 강제하는 식으로 활용한다. Claude Code, Cursor 같은 AI 코딩 도구의 핵심 엔진이 바로 LLM이다.

LLM 단독으로는 학습 시점 이후의 정보를 모르고, 외부 시스템에 접근할 수 없고, 가끔 그럴듯한 거짓말(환각)을 한다. 이 한계를 RAG(외부 지식 검색), Tool Use(외부 도구 연결), 가드레일(출력 검증)로 보완하는 게 현재 AI 애플리케이션 개발의 핵심 패턴이다.

#GPT#Claude#Transformer

← AI Wiki에서 더 보기