Claude Opus 4.7 말투, 나는 4.6으로 내렸다 — 5일 써본 솔직한 판정

먼저 결론 — 나는 기본 작업을 4.6으로 내렸다

Claude Opus 4.7을 5일 돌려본 뒤, 블로그 글 교정과 단일 파일 리팩터링은 4.6으로 내렸다. Opus 4.7 말투가 내 작업 루프에서 마찰을 늘렸기 때문이다. 긴 리서치와 큰 코드베이스 탐색만 4.7에 남겼다.

이 글은 그 판단에 이르게 된 5일치 기록이다.

내가 실제로 겪은 장면 하나

평소 쓰던 CLAUDE.md 규칙 “반말. 서두 칭찬 금지. 결론부터.”를 그대로 붙였는데, 4.7은 처음엔 지시를 지켰다. 네 번째 턴부터 달라졌다.

  • 내 입력: 블로그 한 문단을 주고 “문장만 다듬어. 의미는 그대로.”
  • 4.7 응답: “주신 문장은 이미 의미가 명확하지만 더 자연스럽게 쓸 수 있는 방법을 제안드리면 세 가지가 있습니다…” + A/B/C안 제시 + 각 안의 장단점 설명
  • 내가 시킨 것: 문장 하나 다듬기
  • 받은 것: 안 시킨 A/B/C 비교 리포트

4.6 때는 같은 프롬프트에 한 문장이 돌아왔다. 지난 5일간 이 패턴을 13번 기록했다. r/ClaudeAI에서는 이 “반박 + 대안 제시 + 수정 실행” 패턴을 “arguing loop”라고 부른다.

Reddit·X에서 올라온 실제 불만

Opus 4.7은 2026년 4월 16일 출시됐다. 4월 17일부터 r/ClaudeAI에 회귀 지적 글이 올라왔다.

해외 리뷰 블로그에서는 Opus 4.7 backlash 분석Legendarily Bad 평가가 올라왔다. 공통 지적은 두 가지다. 대화 톤이 더 방어적이다. 같은 작업인데 토큰이 1.5~3배 든다.

원인 2가지 — 내가 돌리면서 확인한 것

원인 1. 더 문자 그대로 해석한다. 4.6은 “자연스럽게 써줘” 수준의 모호한 지시에 알아서 톤을 채웠다. 4.7은 힌트를 덜 읽는다. 지시가 모호하면 기본값으로 돌아가는데, 그 기본값이 방어적이다. 외국 리뷰어는 이 현상을 “ambiguity tax”(모호한 지시에 세금을 매긴다)라고 부른다.

두 번째는 반박 루프다. 위의 내 사례가 정확히 이 패턴이다. 명확한 지시 → 반박 + 대안 제시 + 수정 실행 → 교정하면 또 반박. 4.6 때는 거의 없던 흐름이다. 위에 링크한 r/ClaudeAI 3개 쓰레드 상위 댓글에서 같은 보고가 반복된다.

이 두 원인이 합쳐지면 출력 길이가 늘어난다. 내 지난 5일 기록 기준으로 동일 작업의 토큰 소비가 1.8~2.4배로 찍혔다. 해외 리뷰 수치(1.5~3배)와 일치한다.

내가 쓰고 있는 대응 3가지

대응 1. 시스템 프롬프트를 더 강하게 박는다. “반말. 서두 칭찬 금지. 반박 금지. 결론부터. 시킨 것 외에 제안 금지.” 마지막 줄이 4.7에는 필수다. 4.6 때는 없어도 됐다.

대응 2. 지시를 수치화한다. “잘 써줘” 대신 “1,500자, 반말, H2 3개, 첫 문단 100자 내 키워드 1회.” 4.7의 ambiguity tax가 줄어든다.

마지막은 그냥 모델을 분리해서 쓰는 것이다. Claude Code라면 /model 명령으로 Sonnet·4.6으로 내리고, API라면 claude-opus-4-6을 명시한다. 4.7이 낫다고 확신하는 작업(장문 리서치, 복잡한 코드 탐색)만 4.7에 올린다.

대응 1·2를 붙이면 arguing loop 발생이 줄어든다. 5일치 기록 기준 13회 → 4회로 떨어졌다. 완전히 없어지진 않는다.

당신의 경우는 다를 수 있다 — 자가 판단 3질문

Opus 4.7이 나쁜 모델이라는 뜻은 아니다. 긴 리서치, 큰 코드베이스 탐색에서는 여전히 4.6보다 우위가 있다. 나는 그 영역 외에서 마찰이 더 컸기 때문에 4.6으로 내렸다.

다른 사람에게도 이 판단이 맞을지는 세 질문으로 갈린다.

  1. 내가 주는 지시가 평균적으로 얼마나 구체적인가? (ambiguity tax에 취약한가)
  2. 반박 + 대안 제시 패턴을 감내할 수 있는가? (arguing loop 내성)
  3. 월 토큰 청구서가 1.8~2.4배 늘어나는 것에 민감한가? (비용 체감)

세 질문에 모두 “그렇다”면 4.6으로 내리는 게 맞다. 하나라도 “아니다”면 4.7을 그대로 쓰면 된다. 장문 작업에서는 4.7이 여전히 낫다.


관련 글
- Claude Opus 4.7 시스템 프롬프트 3가지 핵심 변화
- Claude Code 모델 선택법 — 작업 유형별 정답

Claude #Opus47 #Opus46 #AI도구 #ClaudeCode #AnthropicAPI

─── 이 블로그 ───
🧵 Threads: @uddeu_app
💻 GitHub: jason-h23

댓글

이 블로그의 인기 게시물

[알고리즘] Suffix Tree

Claude Opus 4.7 출시 총정리 — 뭐가 달라졌고 지금 써야 하나

[기타IT] php설치