텍스트, 이미지, 코드 등을 의미를 담은 숫자 벡터로 변환하는 기술. "자동차"와 "automobile"이 벡터 공간에서 가까이 놓여, 의미 기반 검색과 비교가 가능해진다.
"자동차"와 "automobile"은 글자가 다르지만 의미는 같다. 임베딩은 이런 의미적 관계를 수백~수천 차원의 숫자 벡터로 표현한다. 비슷한 의미의 단어는 벡터 공간에서 가까이 놓이고, 코사인 유사도로 얼마나 비슷한지를 수치로 측정할 수 있다.
RAG 파이프라인에서 핵심 역할을 한다. 문서를 임베딩으로 변환해 벡터 DB에 저장하고, 사용자 질문도 임베딩으로 변환해서 가장 유사한 문서를 찾는다. 키워드 매칭이 아니라 의미 기반으로 검색하니까, "파이썬 리스트 정렬"과 "Python list sort"가 같은 결과를 반환한다.
OpenAI의 text-embedding-3, Google의 Gemini Embedding, Anthropic의 Voyage 등이 대표적인 임베딩 모델이다. API 한 줄로 텍스트를 벡터로 변환할 수 있다.