AI 에이전트가 코드를 짜고, 사람은 설계·검증·품질을 책임지는 소프트웨어 개발 방법론. 바이브 코딩의 '일단 돌아가면 OK' 방식에서 벗어나, 테스트와 구조적 감독을 핵심에 둔다.
2025년 초 Andrej Karpathy가 '바이브 코딩'이라는 말을 만들었다. 자연어로 지시하면 AI가 코드를 뱉고, 에러가 나면 에러 메시지를 다시 붙여넣는 — 코드를 직접 읽지도 않는 방식이었다. 1년 뒤인 2026년 초, Karpathy 본인이 "바이브 코딩은 이제 지났다"고 선언하며 내놓은 개념이 에이전틱 엔지니어링이다.
핵심은 두 단어에 담겨 있다. 에이전틱 — 개발자가 코드를 직접 쓰는 비율이 1% 미만이고, 나머지는 AI 에이전트가 계획·구현·테스트를 자율적으로 수행한다. 엔지니어링 — 이 과정이 되는대로 돌아가는 게 아니라, 아키텍처 설계·품질 관리·시스템 운영이라는 공학적 규율 위에서 돌아간다.
바이브 코딩과의 결정적 차이는 테스트다. 탄탄한 테스트 스위트가 있으면 에이전트가 테스트를 통과할 때까지 스스로 반복 수정할 수 있고, 그래야 신뢰할 수 있는 결과가 나온다.
실제 워크플로우는 Plan → Execute → Verify(PEV) 루프로 돌아간다. 먼저 스펙 문서를 써서 에이전트에게 정확한 목표와 제약을 알려주고, 작업을 에이전트 단위 태스크로 쪼갠다. 에이전트가 코드를 생성하면 사람이 동료의 PR을 리뷰하듯 검토한다. 이 과정에서 CLAUDE.md로 프로젝트 규칙을 전달하고, 훅으로 린트·타입체크 같은 가드레일을 자동 실행하며, 스킬로 반복 워크플로우를 명령 한 줄로 호출하는 것이 전형적인 패턴이다.
멀티에이전트와 결합하면 위력이 커진다. 한 에이전트는 파일 탐색과 코드 작성을, 다른 에이전트는 테스트 작성과 실행을 동시에 맡기면 컨텍스트 한계를 우회하면서 병렬로 작업이 진행된다.
Simon Willison은 자신이 매일 쓰는 에이전틱 엔지니어링 패턴 세 가지를 정리했다. Red/Green TDD — 실패하는 테스트를 먼저 쓰고 에이전트에게 통과시키라고 넘기는 것, 템플릿 — 반복되는 작업 구조를 마크다운으로 정의해 에이전트에게 재사용시키는 것, 호딩(Hoarding) — 에이전트가 맥락을 잃지 않도록 관련 정보를 미리 컨텍스트에 쌓아두는 것이다.
구조적 감독 없이 에이전트에게 코드를 맡기면, 기술 부채가 가치보다 빨리 쌓인다. 에이전틱 엔지니어링은 기존의 소프트웨어 공학 역량 — GitOps, CI/CD, 테스트 자동화, 아키텍처 감독 — 을 증폭시키는 것이지 대체하는 게 아니다.