"생각 → 행동 → 관찰"을 반복하면서 도구를 사용해 문제를 단계별로 해결하는 에이전트 설계 패턴. 대부분의 AI 에이전트가 이 구조로 동작한다.
에이전트가 문제를 풀 때 머릿속으로 생각만 하는 것도 아니고, 생각 없이 행동만 하는 것도 아닌, 둘을 번갈아 하는 패턴이다. Thought(이 문제를 풀려면 먼저 ~를 확인해야겠다) → Action(검색 도구 호출) → Observation(검색 결과 확인) → Thought(이 결과를 보면 ~인 것 같다) → Action(다음 도구 호출)... 이 루프가 답에 도달할 때까지 반복된다.
Claude의 도구 사용이 이 패턴으로 동작한다. "이 프로젝트의 테스트 커버리지를 확인해줘"라고 시키면, 먼저 프로젝트 구조를 탐색하고(Action), 테스트 파일들을 확인하고(Observation), 커버리지 도구를 실행하고(Action), 결과를 분석해서(Observation) 보고한다.
추론 과정이 명시적으로 기록되기 때문에 에이전트가 왜 그런 행동을 했는지 추적하고 디버깅할 수 있다. 에이전트가 이상하게 동작하면 Thought 로그를 확인해서 어디서 판단이 잘못됐는지 찾을 수 있다.