Meta가 공개한 오픈 웨이트 LLM 시리즈. 오픈소스 LLM 생태계의 기반이 되었으며 파인튜닝, 양자화, 모델 병합 연구의 주요 대상이다.
2023년 Meta가 Llama를 공개하면서 오픈소스 LLM 시대가 본격적으로 열렸다. Llama 2(2023.07), Llama 3(2024.04), Llama 4(2025)로 이어지며 상업적 사용이 가능한 라이선스와 함께 커뮤니티 생태계가 폭발적으로 성장했다. 대부분의 오픈소스 파인튜닝 연구, 양자화 실험, 모델 병합이 Llama를 베이스로 이루어진다.
Ollama로 ollama run llama3 한 줄이면 로컬에서 바로 실행된다. vLLM으로 서빙하면 OpenAI 호환 API를 자체 인프라에서 운영할 수 있다. LoRA로 도메인 특화 파인튜닝을 하거나, GGUF로 양자화해서 모바일에 배포하는 것이 대표적 활용 방식이다.