Claude Fable 5와 Mythos 5 — Anthropic의 '하나의 모델, 두 얼굴' 전략과 커뮤니티 반응

2026-06-10 · 2026-06-10_claude-fable-5-mythos-5-anthropic-official.md

#claude #anthropic #frontier-model #mythos-class #fable #ai-safety #safeguards #pricing #hn-analysis #software-engineering #ai-agents

원문 출처

https://www.anthropic.com/news/claude-fable-5-mythos-5

Claude Fable 5와 Mythos 5 — Anthropic의 '하나의 모델, 두 얼굴' 전략

한 줄 요약

Anthropic이 2026년 6월 9일 Claude Fable 5(일반 공개)와 Claude Mythos 5(제한 공개)를 동시에 발표했으며, 두 모델은 동일한 가중치를 공유하지만 안전 필터(classifier)만 다르게 설정된 '하나의 모델, 두 가지 얼굴' 전략이다. 입력 토큰당 10달러, 출력 토큰당 50달러라는 가격은 DeepSeek 대비 20배 이상 비싸며, 6월 23일 이후 구독 요금제에서 제외되고 유료 크레딧으로 전환된다. HN에서는 2096점/1621개 댓글로 가격 정책, 안전 장치의 과도한 차단, '경쟁사 제재' 기능이 주요 논쟁점이 되었다.

핵심 내용

1. 모델 구조 — Fable과 Mythos는 같은 몸체, 다른 얼굴

Fable 5와 Mythos 5는 내부적으로 완전히 동일한 모델이다. Anthropic은 이를 'Mythos-class'라고 부르는데, 기존 Opus 클래스보다 상위 단계에 해당하는 성능 등급이다. 두 모델의 차이는 안전 필터(classifier)의 설정뿐이다.

Fable 5: 사이버 보안, 생물학/화학, 디스틸레이션(모델 능력 추출) 관련 요청을 감지하면 Claude Opus 4.8으로 대체 응답. 일반 사용자가 접근하는 버전.
Mythos 5: 사이버 보안 필터가 해제된 버전. 미국 정부 협력 프로젝트인 Project Glasswing을 통해 사이버 방어 전문가들만 사용 가능. 생물학/화학 필터도 곧 신뢰할 수 있는 연구자들에게 단계적으로 개방할 계획.

이름의 유래도 이 차이를 반영한다. Fable(라틴어 fabula, '이야기')은 안전 장치가 있는 일반용, Mythos(그리스어 mythos, '서사')는 안전 장치가 해제된 전문가용을 의미한다.

2. 성능 — 실제 사용자 사례 중심의 발표

Anthropic은 전통적인 벤치마크 점수 나열 대신 실제 기업과 사용자의 사례를 중심으로 성능을 소개했다.

소프트웨어 엔지니어링:

Stripe(결제 서비스 기업)는 5000만 줄 Ruby 코드베이스 전체 마이그레이션을 Fable 5가 하루 만에 완료했다고 보고. 같은 작업을 인력이 두 달 이상 걸렸던 작업.
Cursor(코드 에디터 기업) CEO는 "Fable 5는 CursorBench에서 state-of-the-art이며, 이전 모델들이 접근할 수 없었던 장기 호라이즌 문제들을 열었다"고 평가.
Cognition의 FrontierCode 평가에서 프런티어 모델 중 최고 점수.

지식 작업과 금융:

Hebbia의 금융 벤치마크에서 시니어 레벨 추론 부문 최고 점수. 문서 기반 추론, 차트/표 해석, 문제 해결에서 상당한 개선.
IMC(투자 기업)는 거래 분석 평가에서 사실 확인, 개념적 추론, 원인 분석, 기대값 분석에서 거의 전반부 압도적 성공.

비전(시각 인식):

과학 도표에서 정확한 숫자 추출, 스크린샷만으로 웹 앱 소스 코드 재구축.
Pokémon FireRed 게임을 '화면 캡처만'으로 클리어. 이전 모델은 복잡한 보조 도구가 필요했지만 Fable 5는 최소한의 시각 입력만으로 완주.

기억과 장기 컨텍스트:

Slay the Spire(카드 게임)에서 파일 기반 지속 기억을 제공했을 때 성능이 Opus 4.8보다 3배 더 향상. 최종 액트에 도달할 확률도 3배 증가.
태양계 시뮬레이션(물리 법칙으로부터 행성 궤도 유도 → 일식 예측), Factorio 자율 플레이, 브라우저 기반 CAD 에디터 제작 및 3D 프린팅 가능한 모델 설계.

생명과학 연구 (Mythos 5 전용):

단백질 설계에서 숙련된 인간 연구자와 동등하거나 더 나은 결과. 약물 설계 프로세스의 일부 단계를 약 10배 가속.
분자생물학에서 새로운 가설 일관성 있게 생산. 블라인드 비교에서 과학자들이 Mythos의 가설을 약 80%의 비율로 Opus 클래스보다 선호.
138개 동물 종의 단일 세포 데이터를 자율 학습적으로 분석. 자체 설계한 머신러닝 모델이 Science 저널에 발표된 모델보다 성능이 좋았으며 모델 크기는 100배 작음.

3. 안전 장치 — 분류기(classifier) 기반의 3층 방어

Fable 5의 안전 장치는 별도의 AI 분류기가 잠재적 오용을 감지하면 Opus 4.8으로 대체 응답하는 구조다. 세 가지 영역을 커버한다.

1) 사이버 보안:

공격적 사이버 작업(재connaissance, lateral movement, exploit 개발 등)을 차단.
외부 버그 바운티 프로그램에서 1000시간 이상 테스트 중 '보편적 제יל브레이크' 발견 실패.
외부 레드팀 조직도 장기적 에이전트 작업에서 보편적 제יל브레이크를 찾지 못함.
한 외부 파트너는 Fable 5의 사이버 보안 방어력이 테스트된 모델 중 가장 강력하다고 평가. 30가지 공개 제יל브레이크 기법에도 단일 턴 해킹 요청에 0% 응답률.

2) 생물학 및 화학:

기존에는 좁은 범위의 생물무기 관련 질문만 차단했으나, Mythos 클래스의 과학적 능력 상승으로 범위를 대폭 확대.
실제 테스트에서 Mythos 5가 AAV(아데노 연관 바이러스) 설계 작업에서 전용 단백질 언어 모델보다 우수하게 수행. 이는 유전자 치료 연구에 긍정적이지만, 동시에 악의적 행위자에게도 위험을 제공한다는 이중 사용(dual-use) 리스크를 보여줌.
현재 Fable 5는 생물학/화학 관련 대다수 요청을 Opus 4.8으로 폴백. 이는 연구자들에게 상당한 불편을 초래.

3) 디스틸레이션(모델 능력 추출):

대규모로 Claude의 능력을 추출해 경쟁 모델을 훈련하려는 시도를 차단. 특히 독재 국가에서의 프런티어 AI 확산을 우려.

추가: 경쟁사 제재 (모델 카드 공개 내용):

모델 카드에 따르면, '프런티어 LLM 개발'을 목표로 하는 요청(프리트레이닝 파이프라인 구축, 분산 훈련 인프라, ML 가속기 설계 등)에 대해 사용자에게 알림 없이 성능을 침묵형으로 저하시킴. 프롬프트 수정, 스티어링 벡터, PEFT(파라미터 효율적 파인튜닝) 등의 방법을 사용. 전체 트래픽의 약 0.03%만 영향 받지만, 0.1% 미만 조직에 집중되어 있음. 사용자에게는 이 제재가 표시되지 않음.

4. 데이터 보관 정책 변경

Mythos 클래스 모델(Fable 5, Mythos 5, 향후 동일 수준 이상의 모델)의 모든 트래픽에 대해 30일 보관을 의무화한다. 새 모델 훈련에는 사용하지 않으며 안전 목적만 사용한다. 30일 후 거의 모든 경우 삭제되며, 인간 접근은 모두 로깅된다. Anthropic은 이를 '새로운 제יל브레이크와 여러 요청에 걸친 공격 방어'를 위한 것이라고 설명하지만, HN에서는 'Shannon 이론을 깨뜨렸다(보안과 프라이버시를 동시에 주장하는 모순)'라는 비판이 나왔다.

5. 가격과 접근성

가격: 입력 토큰 100만 개당 10달러, 출력 토큰 100만 개당 50달러. 이전 Claude Mythos Preview의 절반 미만.
Opus 4.8 대비: 입력 $5→$10, 출력 $25→$50으로 2배 비쌈.
DeepSeek v4 Pro 대비: 입력 $0.435→$10으로 약 23배 비쌈.
구독 요금제 변경: 6월 23일까지 Pro/Max/Team/Enterprise 구독에 포함. 6월 23일 이후 유료 크레딧 필요. 충분한 용량이 확보되면 다시 구독에 포함할 '목표'를 가지고 있으나 구체적인 일정 없음.

HN 커뮤니티 반응 (2096점, 1621개 댓글 중 584개 분석)

가격 정책 — 가장 뜨거운 논쟁점

HN 커뮤니티에서 가장 많은 반응을 얻은 주제는 가격 정책이었다. 사용자들은 Fable 5의 가격이 실제 사용에서 얼마나 부담스러운지 구체적인 사례로 이야기했다.

caleblloyd는 Max 구독에서 Enterprise API로 전환한 경험을 전했다. 같은 사용 패턴으로 월 200달러에서 1만 달러로 폭증했고, Fable 5는 월 2만 달러가 예상된다며 "미국에서 완전히 장비 완비된 소프트웨어 엔지니어 한 명의 평균 급여와 비슷한 수준"이라고 지적했다. 결국 DeepSeek v4 Pro로 전환했다고 말했다. 중요한 지적은 "Ruby 스택을 Go로 2일에 리팩토링하는 것이 인상적이지만, 그건 매출을 늘리는 게 아니다"라는 점이다. 새로운 비즈니스 기능을 반복하는 작업은 LLM이 훈련되지 않은 니치 영역이라 20배 토큰 비용이 정당화되지 않는다는 논리다.

rvz는 6월 23일까지의 무료 제공을 '카지노의 무료 스핀'에 비유했다. 사용자를 새로운 기계에 익숙하게 한 후 유료로 전환하는 의도적 전략이라는 분석이었다. nickandbro도 "중독시킨 후 끊는다. 가장 오래된 전술"이라고 동의했다.

angst 사용자는 전체 프런티어 모델 가격 비교표를 작성해 공유했다. Fable 5 입력 $10은 GPT 5.5($5), Gemini 3.5 Flash($1.5), DeepSeek($0.435) 대비 현저히 비쌌다.

반면 modeless는 역사적 관점에서 접근했다. "1990년 메인프레임 가격을 보고 PC가 부자 전용이라고 결론낸 것과 같다. 새로운 성능 레벨의 가격은 매우 빠르게 떨어질 것"이라고 예상했다. hootz도 "DeepSeek, Xiaomi, Moonshot이 이미 저렴하고 6개월 전 프런티어 성능과 맞먹는다"며 6개월 후면 상황이 완전히 달라질 것이라고 전망했다.

안전 장치 — '과도한 차단'과 '경쟁사 제재' 비판

안전 장치에 대한 반응은 양분되었다. 일부는 Anthropic의 책임감을 인정했지만, 대다수는 실제 사용에서 불편함을 호소했다.

SubiculumCode는 뇌 데이터 분석 작업에서 random effects model의 불확실성 전파를 묻는 질문조차 거부당했다고 밝혔다. "'뇌'와 'random effects'라는 단어가 안전 장치를 작동시켰다"며 생물학 필터의 과도한 범위를 지적했다. 이는 연구자들에게 실제적인 문제를 야기할 수 있는 사례다.

piokoch는 Anthropic이 'safeguards'라는 표현을 정부에 대한 암시적 협박으로 사용하고 있다고 비판했다. "이 모델이 정부도 해칠 수 있다"는 식의 과시로 읽힐 수 있다는 지적이었다.

philipkglass가 가장 중요한 발견을 공유했다. 모델 카드에 'Anthropic과 경쟁하는 것'도 unsafe로 분류된다는 내용이 있었다. LLM 개발 관련 요청에 대해 사용자에게 알림 없이 성능을 침묵형으로 저하시키는 기능이 있으며, 이 제재가 활성화되었음을 사용자에게 알려주지 않는다는 점이었다. 이는 '윤리적 AI'를 표방하는 Anthropic의 이미지와 충돌한다는 비판을 받았다. kyledrake는 "엔터프라이즈 고객을 위한 가격 장벽만 허용하는 것이 '더 윤리적인 AI 기업'이라는 이미지와 어떻게 조화되는가"라고 물었다.

실제 성능 — 인상적이지만 환각 문제도

Fable 5의 실제 성능에 대한 반응은 대체로 긍정적이었다.

danilafe는 Agda 코드베이스(형식 증명 언어)를 Lean으로 변환하는 작업을 성공시켰다고 밝혔다. 6000줄을 한 시간에 포팅했고 Lean 체크가 통과되었다며 "다른 어떤 모델로도 해내지 못했던 작업"이라고 평가했다. 이는 수학적으로 엄밀한 코드 변환에서 Fable 5가 이전 모델들과 차별화된 능력을 보여준 사례다.

EchoVoicy는 C++ 개발 벤치마크에서 Opus보다 약 5배 빠르고 결과도 더 좋았다고 보고했다. vb-8448은 Python 코딩에서 "명확하고 과잉 설계되지 않은 코드, 코드베이스 이해도가 뛰어남"이라고 평가했다. nickstinemates는 Opus 4.8 출시 당시 broke되었던 tool calling이 Fable 5에서는 처음부터 작동했으며 토큰 생성 속도도 빠르다고 밝혔다.

하지만 connorboyle는 환각(hallucination) 문제를 지적했다. Joseph Needham의 '중국의 과학과 문명' 책에서 별 표기법을 묻는 질문에 Fable 5는 1801년 Bode 카탈로그(천체 목록)부터 1875년 Schlegel의 중국 천문학 저술까지 상세한 참조 체인을 제시했지만, 실제 스캔본 책을 확인하니 해당 별이 존재하지 않았다. Opus로 강등해야만 Fable의 답변이 환각이었음을 인정했다고 밝혔다. 이는 Fable 5가 '더 확신에 찬 환각'을 생산할 수 있다는 우려를 제기한다.

펠리칸 SVG — 여전히 완벽한 지표는 아님

Simon Willison의 펠리칸 SVG 벤치마크도 등장했다. ethanlipson은 "pelican SVG 생성에 얼마나 많은 파인튜닝 비용을 들였을까"라고 의문을 제기했고, csomar는 "개량된 펠리칸 SVG에서 꼬리 위치가 여전히 잘못되었다"고 지적했다. sarreph는 "pelican 테스트가 유명해지면서 프런티어 랩들이 pelican 예술에 최적화하고 있지 않은가? 신뢰할 수 있는 지표인가"라고 근본적인 질문을 던졌다.

대체 모델과 경쟁

vorticalbox는 Cursor의 Composer 2.5(Kimi 2.5 파인튜닝)를 사용해 대부분의 작업에 충분하다고 밝혔다. jrflo는 Codex/ChatGPT로 전환했으며 같은 구독 등급에 훨씬 관대한 사용량 제한이 있다고 말했다. hootz는 DeepSeek, Xiaomi, Moonshot이 이미 저렴하고 6개월 전 프런티어 성능과 맞먹는다고 강조했다.

Mythos 클래스 추정

m_w_는 Mythos가 약 10조 파라미터로 추정된다고 밝혔다. MoE(Mixture of Experts)와 looped model 같은 기술도 개선에 기여했을 것이라고 분석했다. himata40113은 2-3T 클래스 모델로 보이며, 중국 연구소는 이런 모델을 훈련시킬 GPU 시스템에 현재 접근이 불가능하지만 1년 내 자체 구축이 가능할 것이라고 전망했다. hootz는 "Mythos는 여전히 과대광고이며, 사이버 보안 공포와 가드레일 대부분이 Glasswing 파트너십을 위한 마케팅"이라고 비판했다.

새로운 시각

1. '안전'과 '경쟁 제한'의 경계 모호화

Anthropic이 안전 장치의 이름으로 경쟁사 제재 기능을 숨긴 것은 AI 산업에서 '안전'이라는 개념이 어떻게 도구화되는지를 보여준다. 사용자에게 알림 없는 침묵형 성능 저하는 기술적으로 PEFT(파라미터 효율적 파인튜닝)나 스티어링 벡터로 구현되지만, 개념적으로는 '서비스 제공자가 사용자의 요청을 숨겨서 제한한다'는 점에서 기존 SaaS의 ToS(이용약관) 위반 개념과 다르다. 이는 AI 서비스의 새로운 거버넌스 문제를 제기한다.

2. 구독 → 토큰 과금 전환은 산업 전반의 트렌드

Fable 5의 경우만 그런 것이 아니라, AI 모델 산업 전체가 구독 모델에서 토큰 기반 과금으로 이동하고 있다. 이는 모델이 단순한 '채팅 서비스'가 아니라 '계산 자원'으로 재정의되고 있음을 의미한다. 1990년대 메인프레임에서 PC로 넘어가던 시기와 유사하게, 초기에는 고가이지만 시간이 지나면 성능 대비 가격이 급격히 하락할 가능성이 높다.

3. '동일 모델, 다른 필터' 전략의 함의

Fable 5와 Mythos 5가 동일 가중치를 공유한다는 것은 '모델의 능력'과 '모델의 안전성'이 분리 가능함을 보여준다. 이는 AI 안전 연구에서 중요한 시사점을 가진다. 모델 자체를 재훈련하지 않고 필터만 조정하여 안전성을 조절할 수 있다면, 새로운 모델 출시 시 안전 평가 기간을 대폭 단축할 수 있다. 반면, 필터의 정확도(false positive/negative)가 모델의 실제 사용 경험을 결정한다는 의미이기도 하다.

4. 30일 데이터 보관 — 안전인가 감시인가

Anthropic은 30일 데이터 보관을 '새로운 제יל브레이크 방어'를 위한 것이라고 설명하지만, 이는 동시에 모든 사용자의 요청 패턴을 분석할 수 있는 권한을 얻는다는 의미다. '안전 목적만 사용한다'는 약속은 기술적으로 검증이 불가능하며, 이는 모든 클라우드 서비스에서 반복되는 신뢰 문제다.

자녀/미래 영향

아인, 석현, 은한을 위한 관점

진로 측면: Fable 5가 5000만 줄 코드베이스를 하루 만에 마이그레이션할 수 있다는 것은, 단순 코드 작성 능력만 가진 개발자의 수요가 빠르게 줄어들음을 의미한다. 하지만 caleblloyd의 지적처럼 "LLM이 훈련되지 않은 니치 영역"은 여전히 인간 개발자의 가치가 높다. 아인, 석현, 은한이 개발을 진로로 고려한다면 '문제 정의 능력'과 '도메인 지식'이 코드 작성 능력보다 훨씬 중요해질 것이다.

교육 측면: Fable 5가 Agda에서 Lean으로 6000줄을 변환했다는 것은 수학/논리학 교육의 중요성을 다시 떠오르게 한다. 형식 증명 언어는 AI가 가장 잘 처리하는 영역 중 하나이며, 이런 언어를 이해할 수 있는 교육이 미래 경쟁력이 될 수 있다.

AI 리터러시: 환각 문제를 이해하는 것이 중요하다. connorboyle의 사례처럼 Fable 5는 '더 확신에 찬 환각'을 생산할 수 있다. 자녀들이 AI의 출력을 맹목적으로 신뢰하지 않고 검증하는 습관을 들이는 것이 필요하다.

가격 인식: AI 모델이 '계산 자원'으로 재정의되면서, 자녀 세대에서는 AI 사용이 전기 요금처럼 '사용량 기반 과금'이 될 가능성이 높다. 효율적인 프롬프트 작성 능력과 모델 선택 능력이 새로운 디지털 리터러시가 될 것이다.