사용자가 많아질수록 데이터가 쌓이고, 데이터로 모델이 좋아지며, 좋은 모델이 더 많은 사용자를 끌어오는 선순환 구조. AI 서비스의 핵심 경쟁력이다.
플라이휠은 한 번 돌기 시작하면 자체 관성으로 계속 도는 무거운 바퀴를 뜻한다. AI 데이터 플라이휠은 이 선순환이다. 사용자가 서비스를 쓰면 그들의 입력, 선택, 피드백이 데이터가 된다. 이 데이터로 모델을 파인튜닝하면 서비스가 더 좋아진다. 더 좋은 서비스는 더 많은 사용자를 끌어오고, 사이클이 반복된다. ChatGPT가 수억 명의 대화 데이터로 지속적으로 개선되는 것이 대표적 사례다.
데이터 플라이휠이 강력한 이유는 진입 장벽이 된다는 것이다. 나중에 시장에 들어온 경쟁자는 초기 데이터 부족으로 같은 품질을 낼 수 없다.
AI 서비스 설계 시 사용자 피드백(좋아요/싫어요, 재생성 클릭, 수동 수정)을 로깅하는 구조를 처음부터 설계하면 나중에 이 데이터로 DPO나 SFT에 활용할 수 있다. 챗봇이 잘못 답한 케이스를 수집해 주기적으로 파인튜닝에 반영하는 파이프라인이 데이터 플라이휠의 실천이다.