라벨이 AI에이전트인 게시물 표시

AI 아첨을 감지하는 것과 줄이는 것은 다르다 — 감점제 AI 리뷰어를 만든 이유

왜 AI는 항상 "좋습니다"라고 하는가 AI에게 코드 리뷰를 시키면 "잘 짰습니다"부터 나온다. 이건 AI가 거짓말을 하는 게 아니라 칭찬하도록 훈련된 결과다. 프롬프트로 "솔직하게 말해줘"라고 해도 근본적으로 바뀌지 않는다. AI 모델은 사용자가 '좋아요'를 누른 답변을 더 많이 만들도록 훈련된다. 이 방식을 RLHF(인간 피드백 기반 강화학습)라고 한다. 문제는 사람이 정확한 답보다 기분 좋은 답에 '좋아요'를 더 많이 누른다는 것이다. AI 입장에서는 동의하면 점수가 올라가고, 칭찬하면 점수가 올라간다. 그래서 아첨을 학습한다. Anthropic이 이 문제를 직접 연구해서 논문으로 발표 했다. 2026년 3월에는 Stanford 연구팀이 AI 챗봇의 아첨이 "위험한 수준" 이라는 결과를 냈다. 코드 리뷰에서 이 문제가 특히 위험하다. 코드를 보여주면 "구조가 깔끔합니다"로 시작한다. 버그가 있어도 "전반적으로 잘 작성되었습니다"를 먼저 말하고 문제를 조심스럽게 언급한다. AI가 동의했으니까 맞겠지. 이 가정이 가장 위험하다. 감점제 — 칭찬할 구조가 없는 채점표 만든 도구의 이름은 brutal-review다. 원리는 단순하다. 10점 만점에서 시작해서 감점만 한다. 가산점이 없다. "잘한 점"을 말할 칸이 채점표에 없으니, AI가 칭찬을 끼워넣을 여지가 줄어든다. 실제 결과는 이렇게 나온다. SUDYA MYASNIK (The Butcher) — Final Scorecard ============================================== 종목 1. 구조적 정확성(Structural Correctness): 0.9 /...

맥스튜디오 도착 1주 전, 카페24가 오픈클로 VPS 를 풀었다 — 결정을 다시 한 5가지 기준

4월 중순에 맥스튜디오가 도착합니다. 그 1주 전인 어제, 카페24가 14,000원에 오픈클로(OpenClaw) VPS 를 풀었습니다. ( 헤럴드경제 보도 , 카페24 공식 페이지 ) 오픈클로는 2025년 11월에 공개된 후 두 달 만에 GitHub 스타 14만 개를 돌파한 오픈소스 AI 에이전트 프레임워크입니다 ( Milvus 가이드 ). 텔레그램·슬랙 같은 메신저와 OpenAI·Gemini 같은 LLM 을 연동해서 실제 작업을 수행하는 자율 에이전트 도구죠. 저는 2월부터 이걸 맥북 안에서 임시로 돌리고 있었습니다. 노트북 자원을 잡아먹는 게 부담이라, 맥스튜디오가 도착하면 거기에 본격적으로 셋업하려던 계획이었죠. 그 셋업 직전에 카페24가 14,000원이라는 가격으로 매니지드 옵션을 던졌습니다. "맥스튜디오에 오픈클로 셋업을 그대로 진행할까, 아니면 카페24로 갈아탈까?" 이 글은 AI 에이전트를 직접 운영 중이거나, 매니지드 호스팅 도입을 고민 중인 개발자 를 위한 글입니다. 어제 30분 동안 정리한 5가지 결정 기준 을 공유합니다. 카페24 출시를 계기로 정리하지만, 이 기준은 카페24에만 적용되는 게 아니라 모든 AI 에이전트 자가 호스팅 결정 에 적용됩니다. 1. 사용 시간 — 매일 8시간 이상인가, 주 1~2회인가 자가 호스팅의 모든 비용 (시간, 학습, 유지보수) 이 정당화되려면 충분한 사용량이 필요합니다. 매일 8시간 이상 : 셀프 호스팅의 한계 비용이 0에 가까워짐. 정당화됨. 주 1~2회 : 매니지드가 시간/심리적 부담 모두 적음. 14,000원의 가치가 명확. 저는 매일 8시간 이상 사용하는 케이스라 직접 호스팅 쪽으로 기울었습니다. 만약 가끔만 쓰는 상황이라면 카페24가 압도적으로 합리적인 선택입니다. 2. 데이터 민감도 — 사내 코드인가, 공개 가능한 작업인가 매니지드 호스팅은 데이터가 외부 서버를 통과합니다. 법적으로 문제 없지만...