실행 경험에서 스스로 스킬을 생성하고 개선하는 에이전트. 사람이 매번 새 능력을 가르치지 않아도 사용할수록 더 잘하게 된다.
일반 에이전트는 정해진 도구와 프롬프트 안에서만 작동한다. 자기학습 에이전트는 작업을 수행하면서 성공한 패턴을 스킬로 저장하고, 실패한 패턴을 분석해 다음에 더 나은 전략을 쓴다. Nous Research의 Hermes Agent가 이 개념을 구체화했다. 에이전트가 자신의 실행 로그를 리플렉션하고, 반복되는 작업 패턴을 재사용 가능한 스킬로 추출하는 구조다.
Claude Code에서 스킬을 직접 정의해 재사용하는 것이 수동 버전이라면, 자기학습 에이전트는 이 과정을 자동화한다. "이 작업을 5번 했으니 스킬로 만들어두자"를 에이전트가 스스로 판단한다. 장기 실행 에이전트나 반복 업무 자동화에서 시간이 지날수록 효율이 올라가는 구조를 만들 수 있다.