Claude Code를 쓰다 보면 어느 순간 AI가 갑자기 바보가 된다. 분명 잘 돌아가던 게 어느 순간 이상한 코드를 반복해서 짜거나, 이미 만든 기능을 다시 만들려고 한다. 토큰이 빠르게 소진되거나 사용량 제한에 자주 걸린다면, 대부분 컨텍스트 관리가 문제다
토큰이 뭔지 먼저 알아야 한다
토큰은 AI가 데이터를 처리하는 최소 단위다. Hello는 약 1개, 한국어 안녕하세요는 약 5개의 토큰을 차지한다. 우리가 Claude에게 프롬프트를 보내면 AI는 이 텍스트를 토큰 단위로 쪼개서 읽고 응답한다
Claude와 주고 받는 모든 것이 토큰으로 소비된다
- 입력 토큰: 내가 보내는 메시지 ,첨부 파일, 대화 히스토리, CLAUDE.md 메모리 파일
- 출력 토큰: Claude가 생성하는 응답, 코드, 분석 결과
그리고 이 모든 게 컨텍스트 윈도우 안에서 관리된다
컨텍스트 윈도우가 핵심이다
컨텍스트 윈도우는 Claude가 한 번에 처리할 수 있는 최대 토큰량이다. 현재(2026년 4월) Claude 모델의 컨텍스트 윈도우는 20만 토큰 – 책 한 권 분량이다
문제는 대화를 이어갈수록 이 공간이 계속 쌓인다는 것이다
[1번째 메시지] 입력 + 출력 = 누적 [2번째 메시지] 1번 전체 + 입력 + 출력 = 누적 [3번째 메시지] 1+2번 전체 + 입력 + 출력 = 누적 ...
결국 컨텍스트 윈도우가 가득 찬 상태에서 계속 작업하면 Claude는 방향을 잃고 이상한 결과를 낸다. 컨텍스트가 60~70%를 넘어가면 이미 성능 저하가 시작된다고 보면 된다
세 가지 명령어로 관리한다
- /context: 현재 컨텍스트 사용량을 시각화해서 보여준다. 70%가 넘었다면 정리할 타이밍이다

- /clear: 대화 내역을 전부 지우고 새 세션을 시작한다. 로그인 기능을 완성했다면, 결제 기능을 시작하기 전에
/clear를 먼저 한다. 로그인 관련 대화는 결제 구현에 필요하지 않다 - /compact: 대화를 요약해서 컨텍스트를 압축한다. 작업을 이어가야 하는데 컨텍스트가 거의 찼을 때 사용한다. 원하는 요약 방향이 있다면
/compact 지금까지 완성된 API 구조 중심으로 요약해줘처럼 뒤에 붙이면 된다 - /config:
auto-compact를 켜두면 컨텍스트가 거의 찰 때 자동으로 요약해준다. 단, 자동 요약은 Claude 마음대로 정리하기 때문에 중요한 작업이라면 직접/compact로 방향을 잡아주는 편이 낫다

실전 워크플로우
새 기능 시작
→ /clear
→ 작업 진행
→ 30분~1시간마다 /context 확인
→ 70% 초과?
├─ 작업 이어갈 경우 → /compact
└─ 새 기능 시작할 경우 → /clear
토큰을 아끼는 네 가지 습관
프롬프트 범위를 제한한다
“로그인 기능 만들어줘”보다 “로그인 폼 컴포넌트 만들어줘. 테스트 코드나 배포 설정은 제외해줘”가 훨씩 적은 토큰을 쓴다. Claude는 범위를 주지 않으면 필요하지 않은 것까지 전부 만들어버린다
작업에 맞는 모델을 고른다
| 모델 | 용도 | 비용 (입력/출력, 1M 토큰) |
| Haiku | 간단한 질문, 학습, 실습 | $1 / $5 |
| Sonnet | 일반 개발, 코딩 | $3 / $15 |
| Opus | 복잡한 아키텍처, 어려운 버그 |
새 기능은 항상 /clear로 시작한다
이전 작업의 대화가 쌓인 채로 새 기능을 요청하면, 무관한 히스토리가 입력 토큰으로 소모된다. 불필요한 맥락은 오히려 방해가 된다
확장 기능은 필요한 것만 설치한다
MCP 서버, 서브에이전트, 커스텀 커맨드 – 이것들도 모두 컨텍스트 윈도우를 차지한다. 쓰지 않는 MCP는 과감하게 끄거나 제한한다. CLAUDE.md도 길어질수록 매 요청마다 입력 토큰을 잡아먹는다. 간결하게 유지하는 게 중요하다
사용량 확인 방법
Claude Code에서 usage 명령어를 입력하면 현재 사용량을 바로 볼 수 있다. 세 가지 단위로 표시된다
- Current Session: 5시간 단위로 리셋. 어떤 모델을 써도 여기서 차감된다
- Current Week All: 일주일 단위 전체 모델 제한
- Sonnet Only: 일주일 단위 Sonnet 전용 제한
세션 한도가 가득 찼다면 몇 시에 리셋되는지도 함께 표시된다

아무리 AI 모델이 발전하고 컨텍스트 윈도우가 커져도, 결국 해야 할 일은 같다. 한정된 공간 안에서 꼭 필요한 맥락만 정확하게 전달하는 것. 그게 Claude Code를 제대로 쓰는 방법이다