다음 세션을 위한 AI 핸드오프(handoff) 문서 작성
AI 에이전트(agent) 세션이 컨텍스트(context) 한도에 도달했거나, 작업 중간에 기기를 바꿔야 합니다. 핸드오프 문서가 없으면 다음 세션이 이미 내린 결정을 다시 논의하고 실패한 시도를 또 반복합니다. 이 프롬프트는 처음 보는 사람도 그대로 이어받을 수 있는 구조화된 HANDOFF 문서를 만들어 줍니다.
AI 세션 기억 상실(amnesia)의 숨은 비용
Claude, Cursor, Copilot로 본격적인 제품 작업을 해본 사람이라면 이 벽을 만난 적이 있습니다. 세션이 종료되거나, 컨텍스트(context) 윈도우가 꽉 차거나, 노트북이 잠들고 나면 다음에 도구를 열었을 때 반나절치 추론이 사라져 있습니다. 에이전틱(agentic) 도구로 일하는 프로덕트 매니저(product manager)는 한 세대 전 개발자들이 문서화로 풀었던 컨텍스트 손실 문제를 다시 마주하고 있고, AI 에이전트(agent)의 "기억"은 위키 페이지보다 더 부서지기 쉽습니다. GitHub의 2022년 생산성 연구에 따르면 AI 어시스턴트를 쓰는 개발자는 작업 완수 속도가 최대 55% 빨라지지만, 이 이득은 세션이 시간·일·동료 사이로 파편화되면 빠르게 사라집니다.
왜 세션 기억 상실이 새로운 "잃어버린 작업"인가
장기 호라이즌 AI 워크플로우(workflow) — PRD 작성, 사용자 인터뷰 30건 합성, 흔들리는 멀티 스텝 마이그레이션(migration) 디버깅 — 는 수십 턴(turn)에 걸쳐 진행됩니다. SWE-bench 같은 최신 에이전트 벤치마크는 프론티어 모델조차 작업 길이와 턴 수가 늘어날수록 정확도가 떨어진다는 사실을 보여줍니다. 모델이 멍청해진다기보다는 관련 컨텍스트가 어텐션(attention) 범위 밖으로 떠밀려 나가기 때문입니다. PM에게도 같은 물리가 적용됩니다. 전략 세션 두 시간이 지나면 AI는 세 번째 턴에서 설정한 제약 조건을 더 이상 안정적으로 기억하지 못합니다. Microsoft Work Trend Index는 지식 노동자의 68%가 충분한 집중 시간을 확보하지 못한다고 보고하고, 이는 AI 세션이 인지 부하 속에서 중단·대기·재개된다는 것을 사실상 보장합니다. 즉흥적 핸드오프(handoff)가 실패하기 딱 좋은 조건입니다.
비용은 반복되는 질문, 번복되는 결정, 그리고 세 턴 전에 이미 기각한 접근을 AI가 다시 실행하는 형태로 드러납니다. Anthropic의 Claude Code 엔지니어링 가이드도 멀티 세션 작업에서 가장 큰 레버리지(leverage) 실천법으로 구조화된 핸드오프와 영속 메모리 파일을 지목합니다. 세션이 누적되는 것과 매번 부트스트랩(bootstrap)을 다시 해야 하는 것의 차이입니다.
프롬프트가 어떻게 작동하는가
이 프롬프트는 세션 재개 실패 모드에 매핑된 8개 섹션을 강제합니다. 섹션 1-2는 새 에이전트에게 작업이 어디까지 와 있는지 빠른 차가운 읽기를 제공합니다. 섹션 3은 무엇을 시도했는지 — 무엇이 왜 실패했는지 포함 — 표면화해서 다음 세션이 막다른 길을 다시 밟지 않게 합니다. 섹션 4는 결정을 잠그고, 정말로 번복 가능한 것만 표시해서 다음 에이전트가 결착된 질문을 재논의하지 못하게 합니다. 섹션 5-7은 미해결 질문·핵심 파일·경고를 담고, 섹션 8은 다음 세션을 세 줄로 다시 정렬시키고 첫 구체적 액션을 가리키는, 그대로 붙여넣을 수 있는 프롬프트로 마무리합니다.
이 구조는 의도적으로 인시던트(incident) 포스트모템(postmortem)과 엔지니어링 RFC를 닮았습니다. 두 형식 모두 독자가 0에서 시작할 때 사전 구조화된 정보가 자유 형식 노트보다 낫다는 것을 이미 증명했기 때문입니다. 에이전틱 워크플로우를 돌리는 PM은 사실상 몇 시간마다 마이크로 포스트모템을 쓰고 있는 셈입니다.
사용 시점
- 내일 이어서 할 긴 Claude Code 또는 Cursor 세션을 마무리할 때
- 작업 중간에 기기·브랜치(branch)를 바꿔야 하고 새 환경이 깨끗하게 이어받아야 할 때
- 절반쯤 진행한 조사를 동료나 다른 전문 에이전트(예: 리서치 → 스펙 작성)에게 넘길 때
- 다음 에이전트가 새 모델 버전이 될 멀티 데이 디스커버리(discovery) 스프린트(sprint)를 일시 중단할 때
- 휴가, 온콜(on-call) 로테이션, 우선순위가 바뀔 가능성이 큰 상태 미팅 직전에 마무리할 때
자주 빠지는 함정
- 핸드오프를 상태 업데이트처럼 작성하기. 상태 업데이트는 이미 맥락을 가진 청중을 위한 요약입니다. 핸드오프는 맥락이 0인 사람을 위해 — 파일을 명시하고, 에러 메시지를 그대로 붙이고, 정확한 티켓을 링크하세요.
- "확정된 결정" 섹션을 "당연하잖아"라며 건너뛰기. 다음 에이전트에게는 당연하지 않습니다. 이 섹션의 존재 이유 자체가 재논의를 막기 위함입니다. 실제로 내린 3-7개의 판단과 그 사유를 명시하세요.
- 섹션 8(제안 첫 프롬프트) 잊기. 이게 없으면 다음 세션은 핸드오프를 다시 읽는 것부터 시작합니다. 핸드오프의 목표는 재시작 시간을 한 번의 붙여넣기로 줄이는 것입니다.
Sources
- Anthropic: Claude Code best practices — 영속 메모리와 구조화된 핸드오프 패턴에 대한 엔지니어링 가이드
- GitHub: Quantifying GitHub Copilot's impact on developer productivity — 55% 작업 속도 향상 연구, 세션 파편화 노트 포함
- Microsoft Work Trend Index — 지식 노동자 68% 집중 시간 부족 데이터
- SWE-bench (Princeton/Stanford) — 작업 길이에 따른 멀티 턴 코딩 에이전트 정확도 감쇠 벤치마크
Sources
- Claude Code Best Practices — Anthropic
- Research: Quantifying GitHub Copilot's Impact on Developer Productivity and Happiness — GitHub
- Work Trend Index — Microsoft
- SWE-bench: Can Language Models Resolve Real-World GitHub Issues? — Princeton / Stanford (arXiv)
Prompt details
Ready to try the prompt?
Open the live prompt detail page for the full workflow.