모델
손실 함수
Loss Function

모델의 예측이 실제 정답과 얼마나 다른지를 수치로 표현하는 함수. 이 숫자를 최소화하는 방향으로 가중치를 조정하는 것이 학습의 핵심이다.

개념 설명

모델이 "고양이" 이미지를 "강아지"라고 잘못 예측했을 때, 이 실수가 얼마나 큰지를 숫자로 나타내야 수정 방향을 알 수 있다. 손실 함수가 이 역할을 한다. 손실이 클수록 예측이 틀렸다는 뜻이고, 학습은 이 손실을 줄이는 방향으로 가중치를 계속 조정하는 과정이다. 분류 문제에는 크로스 엔트로피, 회귀 문제에는 평균제곱오차(MSE)가 자주 쓰인다.

사용 예시

파인튜닝할 때 어떤 손실 함수를 쓰는지가 모델의 목표를 정의한다. LLM을 파인튜닝할 때는 다음 토큰 예측의 크로스 엔트로피 손실이 기본이다. RLHF에서 보상 모델 학습에는 선호도 비교 손실이 쓰인다. 학습 중 손실 곡선(loss curve)을 모니터링하면 과적합, 학습률 문제, 수렴 여부를 진단할 수 있어서 MLflow나 Weights & Biases로 기록하는 게 표준 관행이다.

#학습#오차측정#최적화
← AI Wiki에서 더 보기