명시적 규칙 없이 데이터에서 패턴을 학습해 예측하는 AI 기술. 딥러닝과 LLM의 토대이자, 여전히 많은 실용적 문제에서 직접 쓰이는 도구다.
전통적 프로그래밍이 규칙을 코드로 작성하는 것이라면, 머신러닝은 데이터에서 규칙을 자동으로 학습한다. 지도학습(레이블된 데이터로 학습), 비지도학습(레이블 없이 패턴 발견), 강화학습(보상 신호로 학습) 세 가지가 주요 패러다임이다. 의사결정 트리, 랜덤 포레스트, XGBoost, SVM 같은 알고리즘은 딥러닝 이전부터 쓰여왔고 지금도 표 형식 데이터에서 강점을 보인다.
고객 이탈 예측, 사기 탐지, 수요 예측처럼 정형 데이터로 된 예측 문제에는 XGBoost나 LightGBM이 LLM보다 빠르고 비용 효율적이다. scikit-learn으로 모델을 학습하고, MLflow로 실험을 추적하고, 클라우드(SageMaker, Vertex AI)로 배포하는 흐름이 일반적인 ML 파이프라인이다. LLM이 모든 걸 해결하는 건 아니어서, 레이블된 데이터가 충분하고 예측 문제가 명확하다면 클래식 ML이 여전히 최선인 경우가 많다.