MLOps — AI Wiki

인프라

MLOps

머신러닝 모델의 개발·배포·모니터링을 자동화하고 표준화하는 실천 방법론. ML과 DevOps를 결합해 모델의 생산 배포를 안정적으로 만든다.

개념 설명

연구실에서 좋은 성능을 보인 모델이 실제 서비스에서는 데이터 분포 변화, 인프라 문제, 재현성 부재로 실패하는 경우가 많다. MLOps는 이 간극을 메우는 방법론이다. 데이터 버전 관리, 실험 추적, 모델 레지스트리, CI/CD 파이프라인, 모니터링을 체계화한다. MLflow, DVC, Weights & Biases, Kubeflow, Airflow가 MLOps 도구의 대표 주자다.

LLM 시대에 들어서며 전통적 MLOps와 다른 LLMOps가 필요해졌다. 프롬프트 버전 관리, 평가(eval) 파이프라인, 파인튜닝 파이프라인 등 LLM 특화 과제들이 추가됐다.

사용 예시

MLflow로 실험 파라미터와 메트릭을 추적하고, DVC로 학습 데이터 버전을 관리하며, GitHub Actions로 모델 평가·배포 CI/CD를 구성한다. 새 모델 버전이 스테이징에서 일정 점수를 넘으면 자동으로 프로덕션에 배포되는 파이프라인이 MLOps의 전형이다.

#운영#파이프라인#DevOps

← AI Wiki에서 더 보기