Claude Code 모델 선택법 — 작업 유형별 정답 (Opus 4.7 업데이트)
Claude Code에서 모델을 잘못 고르면 작업 시간이 2배, 비용은 5배까지 차이난다. Opus 4.7이 최근 출시되면서 선택지가 Sonnet, Opus 4.6, Opus 4.7 세 가지로 늘었다. 이 글은 “작업 유형별로 뭘 써야 하나”에 대한 필자의 판단 프레임을 정리한다. Opus 4.7 24시간 실사용 경험을 근거로 쓰지만, 뼈대는 모델이 바뀌어도 유효한 기준이다.
선택이 왜 어려운가
Sonnet은 빠른 응답에 특화된 모델, Opus는 복잡한 추론에 특화된 고성능 모델이다. Anthropic이 두 계열을 구분해서 출시한다. 문제는 “복잡한 작업”의 기준이 모호하다는 것.
모델마다 성격이 다르다. 같은 “코딩용 AI”라도 판단 스타일, 토큰 소비, 응답 길이가 제각각이다. Anthropic 공식 문서는 “Opus는 복잡 작업, Sonnet은 빠른 작업”이라 쓰지만, 실제 작업 단위로 내려가면 이보다 훨씬 세분화가 필요하다.
여기에 버전 업데이트가 더해진다. 4.7이 4.6 상위호환이라고 생각하면 틀린다. Reddit r/ClaudeAI에 “Opus 4.7 is terrible” 계열 글이 연달아 상위에 오른 이유가 이 오해에서 시작한다.
Opus 4.7 자체에 대한 출시 개요는 Claude Opus 4.7 출시 총정리에서 다뤘다. 이 글은 선택 프레임에 초점을 둔다.
핵심 프레임 — 작업 3축
모든 Claude Code 작업은 다음 3축으로 분류된다.
- 판단 횟수: 1회 판단으로 끝나는가, 여러 판단을 이어가야 하는가
- 컨텍스트 길이: 파일 몇 개를 동시에 봐야 하는가
- 결과 형태: 정해진 답을 내는가, 아키텍처를 설계하는가
이 3축이 높을수록 Opus(특히 4.7)가 유리하고, 낮을수록 Sonnet이 유리하다. 4.6은 중간 구간에서 쓸 만하다.
여기서 에이전트 루프라는 용어를 쓴다 — Claude가 사용자 개입 없이 여러 파일을 순차적으로 수정·검토하는 구조를 말한다. 이 루프가 길수록 Opus가 유리하다.
작업 유형별 정답표
| 작업 | 권장 모델 | 이유 |
|---|---|---|
| 변수명 하나 수정 | Sonnet | Opus는 불필요하게 장황 |
| 함수 1~2개 단순 리팩터링 | Opus 4.6 | 4.7 대비 답 간결 |
| 파일 5개+ 연쇄 리팩터링 | Opus 4.7 | 중간 끊김 없이 완주 |
| 새 기능 설계 + 구현 | Opus 4.7 | 아키텍처 판단 우수 |
| 버그 원인 추적 (긴 호출 체인) | Opus 4.7 | 컨텍스트 유지 |
| 문서 초안 작성 | Sonnet | 과도한 edge case 제안 방지 |
| 테스트 케이스 생성 | Sonnet | 단순 반복에 Opus 낭비 |
| 오타·스타일 수정 | Sonnet | Opus는 근거까지 붙여 장황 |
요컨대 Opus 4.7은 여러 판단이 엮일 때만 부른다.
Opus 4.7 24시간 실사용 — 구체 경험
필자가 24시간 동안 Claude Code에서 Opus 4.7을 돌리며 기록한 체감 변화다.
에이전트 루프 끊김이 줄었다
4.6은 파일 3~4개를 넘어가면 “다음으로 어떤 파일을 수정할까요?” 구간이 한 번씩 끼었다. 4.7은 10단계 이상 한 번에 간다. Blogger API publish.py를 리팩터링하면서 자리를 비워도 커밋 직전까지 도달해 있었다.
틀린 가정을 먼저 잡는다
변수 이름을 잘못 언급한 적이 있다. 4.6은 “네, 수정했습니다”고 답했는데 실제로는 존재하지 않는 변수였다. 4.7은 “해당 변수가 없습니다. 이런 가정으로 처리할까요”를 먼저 묻는다.
반면 단발 작업은 오히려 길어졌다
“이 함수 이름만 바꿔줘” 같은 3초 작업에 4.7은 근거를 붙이고 관련 문서 링크까지 넣는다. 타이핑 2초면 끝날 걸 답변 읽느라 오히려 오래 걸린다. 4.6은 이럴 때 한 줄로 끊었다. Reddit “terrible” 글이 이런 체감에서 나왔다.
비용 추정 — 솔직히
공식 API 단가는 Opus 입력 $15/MTok·출력 $75/MTok, Sonnet 입력 $3/MTok·출력 $15/MTok이다. Opus가 입출력 모두 Sonnet 대비 5배다. 여기에 4.7은 4.6 대비 출력 토큰이 평균 20~30% 늘었다(필자 24시간 세션 로그 기준).
필자의 한 달 Claude Code 사용 패턴(입력 70%·출력 30% 구성 가정)을 적용하면 동일 작업량 비용 비율은 대략:
- Sonnet: 1.0배 (기준)
- Opus 4.6: 약 3.5배
- Opus 4.7: 약 4.5~5.0배
이건 추정치다. 정확한 값은 Anthropic 대시보드에서 본인 사용량으로 직접 확인해야 한다. 캐시 히트율에 따라 2~3배 차이가 난다. 비용 아끼는 법은 Claude Code 토큰 아끼는 법에 따로 정리했다.
필자의 현재 설정
참고가 되라고 적는다. 필자는 Claude Code 기본 모델을 Sonnet으로 둔다. Opus 4.7은 “파일 5개 이상 건드리는 작업”에만 명시적으로 불러온다.
# 기본은 Sonnet (settings.json)
{
"model": "claude-sonnet-4-6"
}
# 복잡 작업만 Opus 4.7로 전환
claude --model claude-opus-4-7
“모든 작업에 Opus 4.7”로 설정하면 하루 비용이 체감상 3~4배 올라간다. 대신 에이전트 루프에만 선별적으로 Opus를 쓰면 월 비용이 1.5배 수준에서 멈춘다.
Reddit “terrible” 글을 어떻게 봐야 하나
r/ClaudeAI와 r/artificial에 “Opus 4.7 is terrible” 계열 글이 연달아 올라왔다. 공통 패턴:
- 작업 유형을 특정하지 않고 한 줄 평한 글이 대부분
- 단발 작업에서 “답변 길이 증가”를 “느려짐”으로 체감
- 자동 안내 문구·근거 링크 증가에 대한 불만
즉 작업 유형별 선택 프레임이 없는 사람의 리뷰다. 에이전트 루프를 실제로 돌리는 사람의 리뷰는 대체로 긍정이다.
자주 묻는 질문
Claude Code에서 어떤 모델을 써야 하나?
작업 유형에 따라 다르다. 파일 여러 개 연쇄 리팩터링·새 기능 설계·긴 디버깅은 Opus 4.7, 단발 함수 수정·문서 작성·테스트 생성은 Sonnet이 가성비 낫다. 4.6은 중간 구간에서 여전히 유효하다.
Opus 4.7은 Opus 4.6보다 무조건 좋나?
아니다. 긴 에이전트 루프에선 4.7이 명확히 낫지만, 단발 작업에선 4.6이 더 간결했다는 체감이 많다. Reddit “Opus 4.7 terrible” 글 대부분이 단발 작업 기준이다.
비용 차이는 얼마나 나나?
필자 한 달 사용량 추정 기준, 동일 작업량 환산 시 Sonnet 1.0배 / Opus 4.6 3.5배 / Opus 4.7 4.5~5.0배. 정확한 값은 Anthropic 대시보드에서 본인 사용량으로 확인해야 한다.
관련 시리즈
- Claude Opus 4.7 출시 총정리 — 뭐가 달라졌고 지금 써야 하나
- Claude Code 토큰 아끼는 법
- Claude Code + Blogger 자동화 — 마크다운에서 발행까지 1분
지금 해볼 것
Claude Code에서 오늘 할 작업 하나를 골라 위 표의 권장 모델로 돌려봐라. 그다음 반대 모델로 같은 작업을 한 번 더 돌려 비교해보라. 10분이면 당신 워크로드에 어느 축이 맞는지 판단이 선다. 기본 모델 설정은 그다음에 바꾸면 된다.
댓글
댓글 쓰기