Logo
본문으로 이동
중급8분 소요costsbillingbudget

Claude Code는 각 상호작용마다 토큰을 소비합니다. 평균 비용은 개발자 1인당 하루 약 $6이며, 90%의 사용자는 일일 비용이 $12 미만입니다. 팀 사용 시에는 Sonnet 4.6 기준 개발자 1인당 월 약 $100~200이지만, 실행 인스턴스 수와 자동화 사용 여부에 따라 편차가 큽니다.

비용 추적하기

/cost 명령 사용

/cost 명령은 현재 세션의 상세 토큰 사용 통계를 제공합니다.

Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

참고: /cost 명령은 API 토큰 사용량을 표시하며 API 사용자를 위한 것입니다. Claude Max 및 Pro 구독자는 구독에 사용량이 포함되어 있으므로 /cost 데이터는 청구 목적으로 관련이 없습니다. 구독자는 /stats로 사용 패턴을 확인할 수 있습니다.

팀 비용 관리

워크스페이스 지출 한도 설정

Claude API를 사용할 때 플랫폼 콘솔에서 Claude Code 워크스페이스의 총 지출 한도를 설정할 수 있습니다. 관리자는 Console에서 비용 및 사용량 보고를 확인할 수 있습니다.

참고: Claude Console 계정으로 Claude Code를 처음 인증하면 "Claude Code"라는 워크스페이스가 자동으로 생성됩니다. 이 워크스페이스는 조직의 모든 Claude Code 사용에 대한 중앙 집중식 비용 추적 및 관리를 제공합니다.

Bedrock, Vertex, Foundry 환경

이러한 클라우드 환경에서 Claude Code는 클라우드에서 메트릭을 전송하지 않습니다. 비용 메트릭을 얻으려면 LiteLLM과 같은 도구를 활용할 수 있습니다. LiteLLM은 키별 지출 추적을 돕는 오픈소스 도구입니다.

팀 규모별 속도 제한 권장 사항

팀 규모 사용자당 TPM 사용자당 RPM
1~5명 200k~300k 5~7
5~20명 100k~150k 2.5~3.5
20~50명 50k~75k 1.25~1.75
50~100명 25k~35k 0.62~0.87
100~500명 15k~20k 0.37~0.47
500명 이상 10k~15k 0.25~0.35

예: 200명의 사용자가 있다면 사용자당 20k TPM을 요청하거나 총 400만 TPM(200 × 20,000)을 요청할 수 있습니다.

속도 제한은 개인이 아닌 조직 수준에서 적용되므로, 다른 사용자가 활성화되지 않은 경우 개인 사용자가 일시적으로 자신의 할당량보다 더 많이 사용할 수 있습니다.

에이전트 팀 토큰 비용

에이전트 팀은 여러 Claude Code 인스턴스를 생성하며, 각각 자체 컨텍스트 창을 가집니다. 토큰 사용량은 활성 팀원 수와 실행 시간에 비례합니다.

에이전트 팀 비용을 관리하려면:

  • 팀원에게 Sonnet을 사용합니다. 협업 작업에서 성능과 비용의 균형이 좋습니다.
  • 팀 규모를 작게 유지합니다. 각 팀원이 자체 컨텍스트 창을 실행하므로 토큰 사용량은 팀 규모에 거의 비례합니다.
  • 스폰 프롬프트를 집중적으로 유지합니다.
  • 작업 완료 후 팀을 정리합니다. 유휴 상태에서도 토큰을 계속 소비합니다.

토큰 사용량 줄이기

토큰 비용은 컨텍스트 크기에 따라 증가합니다. Claude Code는 프롬프트 캐싱(반복 콘텐츠 비용 절감)과 자동 압축(컨텍스트 한도에 접근 시 대화 요약)을 통해 자동으로 비용을 최적화합니다.

컨텍스트 능동적 관리

/cost로 현재 토큰 사용량을 확인하거나 상태 표시줄에 지속적으로 표시하도록 구성하세요.

세션 간 정리: 무관한 작업으로 전환할 때 /clear를 사용하여 새로 시작합니다. 오래된 컨텍스트는 이후 메시지마다 토큰을 낭비합니다.

압축 지침 추가: /compact Focus on code samples and API usage처럼 요약 시 Claude에게 보존할 내용을 알려줍니다.

CLAUDE.md에서 압축 동작을 사용자 정의할 수도 있습니다.

# Compact instructions

When you are using compact, please focus on test output and code changes

올바른 모델 선택

Sonnet은 대부분의 코딩 작업을 잘 처리하며 Opus보다 비용이 적습니다. 복잡한 아키텍처 결정이나 다단계 추론에는 Opus를 사용하세요. /model로 세션 중 모델을 전환하거나 /config에서 기본값을 설정합니다.

MCP 서버 오버헤드 줄이기

각 MCP 서버는 유휴 상태에서도 컨텍스트에 도구 정의를 추가합니다.

  • 가능하면 CLI 도구 선호: gh, aws, gcloud, sentry-cli 같은 도구는 지속적인 도구 정의를 추가하지 않아 컨텍스트 효율이 더 높습니다.
  • 사용하지 않는 서버 비활성화: /mcp를 실행하여 구성된 서버를 확인하고 비활성화합니다.
  • 도구 검색 자동화: MCP 도구 설명이 컨텍스트 창의 10%를 초과하면 Claude Code가 자동으로 이를 연기하고 온디맨드로 도구를 로드합니다.

코드 인텔리전스 플러그인 설치

타입 언어용 코드 인텔리전스 플러그인은 텍스트 기반 검색 대신 정밀한 심볼 탐색을 제공합니다. 단일 "정의로 이동" 호출이 grep과 여러 후보 파일 읽기를 대체할 수 있습니다.

훅과 스킬로 처리 오프로드

커스텀 훅은 Claude가 데이터를 보기 전에 전처리할 수 있습니다. 예를 들어 Claude가 10,000줄 로그 파일을 직접 읽는 대신, 훅이 ERROR를 검색하여 일치하는 줄만 반환하면 컨텍스트를 크게 줄일 수 있습니다.

테스트 출력을 실패만 보이도록 필터링하는 PreToolUse 훅 예시:

{
  "hooks": {
    "PreToolUse": [
      {
        "matcher": "Bash",
        "hooks": [
          {
            "type": "command",
            "command": "~/.claude/hooks/filter-test-output.sh"
          }
        ]
      }
    ]
  }
}

CLAUDE.md에서 스킬로 지침 이동

CLAUDE.md 파일은 세션 시작 시 컨텍스트에 로드됩니다. PR 검토나 데이터베이스 마이그레이션 같은 특정 워크플로우에 대한 상세 지침이 포함되어 있다면, 무관한 작업 시에도 해당 토큰이 존재합니다. 스킬은 호출 시에만 온디맨드로 로드되므로 특수 지침을 스킬로 이동하면 기본 컨텍스트를 작게 유지할 수 있습니다. CLAUDE.md는 필수 내용만 포함하여 약 500줄 미만으로 유지하세요.

확장 사고 조정

확장 사고는 기본적으로 31,999 토큰 예산으로 활성화됩니다. 사고 토큰은 출력 토큰으로 청구되므로, 깊은 추론이 필요하지 않은 간단한 작업에는 /model에서 노력 수준을 낮추거나, /config에서 사고를 비활성화하거나, 예산을 줄여 비용을 절감할 수 있습니다 (예: MAX_THINKING_TOKENS=8000).

서브에이전트에 상세 작업 위임

테스트 실행, 문서 가져오기, 로그 파일 처리는 상당한 컨텍스트를 소비할 수 있습니다. 이를 서브에이전트에 위임하면 상세한 출력이 서브에이전트의 컨텍스트에 남고 요약만 주 대화로 돌아옵니다.

구체적인 프롬프트 작성

"이 코드베이스를 개선하세요"와 같은 모호한 요청은 광범위한 스캔을 유발합니다. "auth.ts의 로그인 함수에 입력 유효성 검사를 추가하세요"와 같은 구체적인 요청은 Claude가 최소한의 파일 읽기로 효율적으로 작업할 수 있게 합니다.

복잡한 작업에서 효율적으로 작업하기

  • 복잡한 작업에 계획 모드 사용: Shift+Tab을 눌러 구현 전에 계획 모드로 전환합니다. Claude가 코드베이스를 탐색하고 접근 방식을 제안하면, 잘못된 방향으로 인한 비용 낭비를 방지할 수 있습니다.
  • 조기 수정: Claude가 잘못된 방향으로 진행하면 Escape를 눌러 즉시 중지합니다. /rewind 또는 Escape 두 번으로 이전 체크포인트로 대화와 코드를 복원합니다.
  • 검증 대상 제공: 테스트 케이스, 스크린샷 붙여넣기, 또는 예상 출력을 프롬프트에 포함하세요. Claude가 자신의 작업을 검증할 수 있으면 수정 요청 전에 문제를 잡을 수 있습니다.
  • 점진적 테스트: 파일 하나를 작성하고 테스트한 후 계속합니다. 수정 비용이 적을 때 초기에 문제를 잡습니다.

백그라운드 토큰 사용량

Claude Code는 유휴 상태에서도 일부 백그라운드 기능에 토큰을 사용합니다.

  • 대화 요약: claude --resume 기능을 위한 이전 대화 요약 백그라운드 작업
  • 명령 처리: /cost 같은 일부 명령은 상태 확인 요청을 생성할 수 있습니다

이러한 백그라운드 프로세스는 활성 상호작용 없이도 소량의 토큰(일반적으로 세션당 $0.04 미만)을 소비합니다.

다음 단계

  • 분석 대시보드: 팀 전체의 사용량 및 비용 시각화를 확인합니다
  • 사용량 모니터링: OpenTelemetry로 실시간 비용 메트릭을 내보냅니다
  • 서버 관리 설정: 관리 설정을 통해 조직 전체에 비용 제한을 적용합니다
  • 에이전트 팀: 병렬 실행이 비용에 미치는 영향과 최적화 방법을 알아봅니다

관련 가이드

비용 관리 | Claude Code 가이드 | GodDaeHee | GodDaeHee