텍스트, 이미지, 음악, 코드 등 새로운 콘텐츠를 만들어내는 AI 기술의 총칭. 단순히 분류하거나 예측하는 AI를 넘어 "창작"하는 AI다.
기존 AI가 "이 사진이 고양이인가 강아지인가"를 판단하는 분류 문제를 풀었다면, 생성형 AI는 "고양이 사진을 만들어줘"에 답한다. GAN(적대적 생성 신경망)에서 시작해 Diffusion 모델, Transformer 기반 LLM까지 다양한 아키텍처가 생성 능력을 구현한다. 텍스트, 이미지, 오디오, 비디오, 코드, 3D 모델까지 생성 대상이 계속 확장되고 있다.
개발자가 생성형 AI를 활용할 때는 대부분 API 형태로 접근한다. OpenAI, Anthropic, Google의 API를 호출해서 텍스트를 생성하거나, Stability AI API로 이미지를 만든다. 자체 서비스에 생성 기능을 더할 때 어떤 모달리티(텍스트/이미지/음성)가 필요한지, 응답 속도와 비용 균형을 어떻게 잡을지가 주요 설계 결정이다. 파인튜닝으로 특정 스타일이나 도메인에 맞게 커스터마이징하는 것도 가능하다.