먼저 결론 — 나는 기본 작업을 4.6으로 내렸다

Claude Opus 4.7을 5일 돌려본 뒤, 블로그 글 교정과 단일 파일 리팩터링은 4.6으로 내렸다. Opus 4.7 말투가 내 작업 루프에서 마찰을 늘렸기 때문이다. 긴 리서치와 큰 코드베이스 탐색만 4.7에 남겼다.

이 글은 그 판단에 이르게 된 5일치 기록이다.

내가 실제로 겪은 장면 하나

평소 쓰던 CLAUDE.md 규칙 “반말. 서두 칭찬 금지. 결론부터.”를 그대로 붙였는데, 4.7은 처음엔 지시를 지켰다. 네 번째 턴부터 달라졌다.

내 입력: 블로그 한 문단을 주고 “문장만 다듬어. 의미는 그대로.”
4.7 응답: “주신 문장은 이미 의미가 명확하지만 더 자연스럽게 쓸 수 있는 방법을 제안드리면 세 가지가 있습니다…” + A/B/C안 제시 + 각 안의 장단점 설명
내가 시킨 것: 문장 하나 다듬기
받은 것: 안 시킨 A/B/C 비교 리포트

4.6 때는 같은 프롬프트에 한 문장이 돌아왔다. 지난 5일간 이 패턴을 13번 기록했다. r/ClaudeAI에서는 이 “반박 + 대안 제시 + 수정 실행” 패턴을 “arguing loop”라고 부른다.

Reddit·X에서 올라온 실제 불만

Opus 4.7은 2026년 4월 16일 출시됐다. 4월 17일부터 r/ClaudeAI에 회귀 지적 글이 올라왔다.

“Claude Opus 4.7 feels weird” (4월 20일)
“I genuinely hate the conversation tone of Opus 4.7” (4월 21일)
“Why the huge divergence in lovers and haters of Claude Opus 4.7?” (4월 21일)

해외 리뷰 블로그에서는 Opus 4.7 backlash 분석과 Legendarily Bad 평가가 올라왔다. 공통 지적은 두 가지다. 대화 톤이 더 방어적이다. 같은 작업인데 토큰이 1.5~3배 든다.

원인 2가지 — 내가 돌리면서 확인한 것

원인 1. 더 문자 그대로 해석한다. 4.6은 “자연스럽게 써줘” 수준의 모호한 지시에 알아서 톤을 채웠다. 4.7은 힌트를 덜 읽는다. 지시가 모호하면 기본값으로 돌아가는데, 그 기본값이 방어적이다. 외국 리뷰어는 이 현상을 “ambiguity tax”(모호한 지시에 세금을 매긴다)라고 부른다.

두 번째는 반박 루프다. 위의 내 사례가 정확히 이 패턴이다. 명확한 지시 → 반박 + 대안 제시 + 수정 실행 → 교정하면 또 반박. 4.6 때는 거의 없던 흐름이다. 위에 링크한 r/ClaudeAI 3개 쓰레드 상위 댓글에서 같은 보고가 반복된다.

이 두 원인이 합쳐지면 출력 길이가 늘어난다. 내 지난 5일 기록 기준으로 동일 작업의 토큰 소비가 1.8~2.4배로 찍혔다. 해외 리뷰 수치(1.5~3배)와 일치한다.

내가 쓰고 있는 대응 3가지

대응 1. 시스템 프롬프트를 더 강하게 박는다. “반말. 서두 칭찬 금지. 반박 금지. 결론부터. 시킨 것 외에 제안 금지.” 마지막 줄이 4.7에는 필수다. 4.6 때는 없어도 됐다.

대응 2. 지시를 수치화한다. “잘 써줘” 대신 “1,500자, 반말, H2 3개, 첫 문단 100자 내 키워드 1회.” 4.7의 ambiguity tax가 줄어든다.

마지막은 그냥 모델을 분리해서 쓰는 것이다. Claude Code라면 /model 명령으로 Sonnet·4.6으로 내리고, API라면 claude-opus-4-6을 명시한다. 4.7이 낫다고 확신하는 작업(장문 리서치, 복잡한 코드 탐색)만 4.7에 올린다.

대응 1·2를 붙이면 arguing loop 발생이 줄어든다. 5일치 기록 기준 13회 → 4회로 떨어졌다. 완전히 없어지진 않는다.

당신의 경우는 다를 수 있다 — 자가 판단 3질문

Opus 4.7이 나쁜 모델이라는 뜻은 아니다. 긴 리서치, 큰 코드베이스 탐색에서는 여전히 4.6보다 우위가 있다. 나는 그 영역 외에서 마찰이 더 컸기 때문에 4.6으로 내렸다.

다른 사람에게도 이 판단이 맞을지는 세 질문으로 갈린다.

내가 주는 지시가 평균적으로 얼마나 구체적인가? (ambiguity tax에 취약한가)
반박 + 대안 제시 패턴을 감내할 수 있는가? (arguing loop 내성)
월 토큰 청구서가 1.8~2.4배 늘어나는 것에 민감한가? (비용 체감)

세 질문에 모두 “그렇다”면 4.6으로 내리는 게 맞다. 하나라도 “아니다”면 4.7을 그대로 쓰면 된다. 장문 작업에서는 4.7이 여전히 낫다.

Claude #Opus47 #Opus46 #AI도구 #ClaudeCode #AnthropicAPI

─── 이 블로그 ───

👤 About (블로거 소개)

🧵 Threads: @uddeu_app

💻 GitHub: jason-h23

이 블로그 검색

AI 도구 매일 노트 — 해고된 개발자의 기록

Claude Opus 4.7 말투, 나는 4.6으로 내렸다 — 5일 써본 솔직한 판정

먼저 결론 — 나는 기본 작업을 4.6으로 내렸다

내가 실제로 겪은 장면 하나

Reddit·X에서 올라온 실제 불만

원인 2가지 — 내가 돌리면서 확인한 것

내가 쓰고 있는 대응 3가지

당신의 경우는 다를 수 있다 — 자가 판단 3질문

Claude #Opus47 #Opus46 #AI도구 #ClaudeCode #AnthropicAPI

댓글

댓글 쓰기

이 블로그의 인기 게시물

[알고리즘] Suffix Tree

Claude Opus 4.7 출시 총정리 — 뭐가 달라졌고 지금 써야 하나

[기타IT] php설치