Claude Code 모델 설정 - 헤매다가 힘들어서 만든 개발 블로그

Claude Code를 쓰면서 토큰이 빨리 소진된다면, 모델 설정을 한 번도 바꾸지 않았을 가능성이 높다.

기본 모델로만 작업하면 간단한 작업에 과한 리소스를 쓰게 된다. 작업 유형에 맞게 모델을 선택하는 것만으로도 토큰 소비를 크게 줄일 수 있다

모델 변경하기

/model을 입력하면 현재 사용 가능한 모델 목록이 나타난다. 방향키로 선택하고 엔터를 누르면 즉시 적용되고, 세션을 종료해도 설정이 유지된다

가장 강력한 모델이다. 복잡한 아키텍처 설계, 난이도 높은 버그 디버깅, 대규모 리팩토링에 적합하다. 단, Sonnet 대비 토큰을 4~5배 더 소모한다

성능과 비용의 균형이 잘 잡힌 모델이다. 일반적인 코딩, 파일 수정, 기능 구현 등 대부분의 작업에 이 모델을 기본으로 쓰면 된다

가장 빠르고 저렴한 모델이다. 간단한 질문, 파일 검색, Claude Code 기능을 익히는 학습 단계에 적합하다

Opus 모델을 선택하면 Effort Level을 추가로 설정할 수 있다. 모델 선택 화면에서 Opus를 선택한 상태로 좌우 방향키를 누르면 된다

Opus + High 레벨 조합은 토큰 소모가 가장 크다. Pro 플랜에서 이 조합으로 계속 작업하면 사용량 제한에 빠르게 도달한다

Claude Code는 상황에 따라 모델을 자동으로 전환하는 별칭을 제공한다. /model 명령어 대신 별칭을 직접 입력해서 설정한다

/model opus-plan

Plan 모드(계획 단계)에서는 Opus를 사용하고, 실제 실행 단계에서는 자동으로 Sonnet으로 전환된다. 계획은 똑똑하게, 구현은 효율적으로 처리하고 싶을 때 유용하다

Sonnet 모델에 컨텍스트 윈도우를 100만 토큰으로 확장한다. 대규모 코드베이스를 다루거나 긴 대화가 필요한 작업에 사용한다. 현재(2026년 4월) 베타 버전이다

모델 별칭은 계속 추가될 수 있다. 공식 문서 Model Configuration 섹션에서 최신 별칭을 확인하는 것을 권장한다.

모델 별칭을 이해하려면 컨텍스트 윈도우 개념이 필요하다

Claude Code는 매 요청마다 이전 대화 전체를 함께 전송한다. 대화가 쌓일수록 하나의 요청에 포함되는 토큰 수가 늘어나는 구조다. 이 누적되는 대화의 크기 한도를 컨텍스트 윈도우라고 부른다

현재 Opus, Sonnet, Haiku 모두 기본 컨텍스트 윈도우는 200만 토큰이다. 주의할 점은 컨텍스트 윈도우가 60~70%만 차도 응답 품질이 떨어지기 시작한다는 것이다. 작업이 길어질수록 /clear로 컨텍스트를 정리하는 것이 중요하다

Anthropic이 TechCrunch를 통해 공개한 플랜별 사용량 가이드다.

Pro 플랜이라면 Opus는 꼭 필요한 순간에만 써야 한다. Opus는 Sonnet 대비 4~5배 토큰을 소모하기 때문에 기본 모델로 사용하면 금방 한도에 도달한다. opus-plan 별칭을 쓰더라도 계획 단계를 짧게 유지하는 것이 중요하다

특정 프로젝트에서 모델을 항상 동일하게 유지하고 싶다면 ./claude/settings.json에 명시하면 된다

{
  "plansDirectory": ".claude/plans/",
  "model": "sonnet"
}

세션마다 /model을 바꿀 필요 없이 해당 프로젝트에서는 항상 지정한 모델이 적용된다

모델 선택은 단순히 “좋은 모델 vs 나쁜 모델”이 아니다. 작업 복잡도에 맞는 모델을 쓰는 것이 품질과 비용 모두를 잡는 방법이다

Opus를 항상 쓴다고 결과가 좋아지지 않는다. 사용량 제한에 걸려 작업이 멈추는 것이 더 큰 손실이다