키워드 일치가 아닌 의미의 유사성을 기준으로 검색하는 기술. "강아지 먹이"와 "펫 사료"처럼 표현이 달라도 같은 의도를 찾아낸다.
전통적인 키워드 검색은 단어가 정확히 일치해야 결과가 나온다. 시맨틱 검색은 텍스트를 임베딩 벡터로 변환한 뒤, 의미적으로 가까운 벡터를 찾는다. "노트북 추천"을 검색하면 "laptop 구매 가이드"처럼 단어가 다른 문서도 찾아낼 수 있다. 이 능력이 RAG, 지식 베이스 검색, 유사 문서 추천의 핵심을 이룬다.
기존 Elasticsearch 기반 검색에 벡터 검색을 추가해서 하이브리드 검색을 구현하는 방식이 많이 쓰인다. 키워드가 정확히 있는 문서는 기존 검색으로, 개념적으로 관련 있는 문서는 벡터 검색으로 보완한다. OpenSearch, Elasticsearch, Pinecone 모두 벡터 검색을 지원한다. 임베딩 모델 선택이 검색 품질을 크게 좌우하는데, 도메인에 맞는 모델(예: 코드용, 의료용)을 사용하면 정확도가 올라간다.