Anthropic, 역대 가장 강력한 모델 Claude Fable 5와 사이버 방어용 Mythos 5 공개

2026-06-10 · 2026-06-10_claude-fable-5-mythos-5-공개.md

#ai-llm #anthropic #claude #cybersecurity #ai-safety #benchmark

원문 출처

https://discuss.pytorch.kr/t/anthropic-claude-fable-5-mythos-5/10630

Anthropic, Claude Fable 5와 Mythos 5 공개

한 줄 요약

Anthropic이 2026년 6월 9일 Claude Fable 5(일반 공개)와 Claude Mythos 5(제한적 공개)를 동시에 발표했는데, 두 모델은 동일한 가중치를 공유하면서 안전 장치 classifier만 다르게 설정된 '하나의 모델, 두 가지 얼굴' 전략이다.

---

핵심 내용

1. '하나의 모델, 두 가지 얼굴' — Fable 5와 Mythos 5의 차이

두 모델은 내부 가중치(weights)가 완전히 동일하다. 차이점은 안전 메커니즘뿐이다.

Claude Fable 5 — 일반 대중용. 사이버 보안, 생물학/화학, 모델 디스틸레이션(모델의 지식을 다른 모델로 빼내는 기술) 관련 질문을 감지하면 Claude Opus 4.8으로 대체한다. 즉, 위험한 주제는 이전 세대의 모델이 대신 처리한다.
Claude Mythos 5 — 사이버 방어 전문가, 핵심 인프라 운영자 등 'Project Glasswing' 파트너 약 150개 기관만 사용 가능. 안전 장치가 해제되어 사이버 보안/생물학 분야에서 전 능력 사용 가능.

두 모델 모두 $10/100만 입력 토큰, $50/100만 출력 토큰으로 동일 가격이다. 이전 Opus 4.8($5/$25)의 두 배다.

핵심 인사이트: Anthropic은 '위험한 질문을 모두 막는' 방식에서 '라우팅(경로 전환) 전략'으로 바뀌었다. 위험 주제를 완전히 차단하는 게 아니라, 덜 강력한 모델로 보내서 사용 경험은 유지하면서도 위험한 능력의 노출을 제한한다. Fable 5 세션의 95% 이상이 Opus 4.8으로 대체되지 않고 Fable 5 그대로 동작한다고 한다.

2. 벤치마크 — 거의 모든 분야에서 최첨단

Fable 5/Mythos 5는 주요 벤치마크에서 경쟁사 모델들을 압도했다.

소프트웨어 엔지니어링:

SWE-Bench Pro: 80.3% (Opus 4.8: 69.2%, GPT-5.5: 58.6%, Gemini 3.1 Pro: 54.2%)
FrontierCode Diamond: 29.3% (Opus 4.8: 13.4%, GPT-5.5: 5.7%) — 2배 이상 차이
Terminal-Bench 2.1: 88.0%

실제 사례 — Stripe: Fable 5가 5천만 줄짜리 Ruby 코드베이스 전체 마이그레이션을 하루 만에 완료했다. 인간 엔지니어 팀이 두 달 이상 걸렸을 작업이다. Stripe는 "Fable 5가 수개월의 엔지니어링 작업을 수일로 압축한다"고 평가했다.

지식 작업:

GDPval-AA: 1932 (Opus 4.8: 1890, GPT-5.5: 1769)
Hex Analytics: 90% 돌파 — 복잡한 분석 작업에서 첫 90% 기록
금융 회사 IMC/Optiver: 거래 분석 평가에서 일관된 최고 성능

비전(시각 인식):

GDP.pdf: 29.8% — 복잡한 과학 차트에서 정확한 데이터 추출
웹 앱 스크린샷만으로 소스 코드 재구성 가능
Pokémon FireRed: 화면 픽셀만으로 클리어 — 이전 모델들은 보조 도구 있어도 실패

생명과학:

약물 설계 프로세스의 일부 약 10배 가속
14개 단백질 표적 중 9개에서 유망 후보 발견 (면역 체크포인트, 신경퇴행성 질환 포함)
과학자들이 Mythos 5의 가설을 Opus 대비 약 80% 더 선호
한 가설(E. coli 단백질 메커니즘 관련)은 독립 연구소에서 검증됨

사이버 보안 (Mythos 5 전용):

ExploitBench: 78.0% (Opus 4.8: 40.0%) — 2배 이상
CyberGym: 83.8%
Mythos를 사용한 기관들이 이미 10,000개 이상의 치명적 보안 결함을 발견함

기타:

GPQA Diamond: 94.1%(포화), USAMO 2026: 99.8%
Humanity's Last Exam: 59.0% (GPT-5.5: 41.4%)
Legal Agent Bench: 13.3% (GPT-5.5: 2.1%, Gemini: 0.0%)

3. 안전 메커니즘 — classifier 시스템

Anthropic은 Fable 5에 전용 AI classifier(분류기)를 장착했다.

동작 방식:

질문이 들어오면 classifier가 사이버 보안, 생물학/화학, 모델 디스틸레이션 관련 여부를 판단
위험하다고 판단되면 Claude Opus 4.8으로 전환 — 사용자에게는 알림
내부/외부 레드 팀(해킹 시뮬레이션 팀)이 1,000시간 이상 테스트했으나 보편적 제일브레이크(모든 상황에 작동하는 우회 방법)는 발견되지 않음

반면 Mythos 5는:

승인된 기관에서만 사용 가능
사이버/생물학 안전 장치 해제
'Project Glasswing' 프로그램 참여 기관만 접근

4. 데이터 보관 정책 — 30일 의무 보관

Fable 5/Mythos 5 사용 시 모든 트래픽이 30일간 보관된다. 이전의 제로-보관(데이터 전혀 남기지 않음) 정책과 완전히 다른 접근이다.

보관 목적: 새로운 제일브레이크 및 공격 패턴 감지, 오탐(False Positive) 감소
모델 학습에는 사용 안 함 — 보안 모니터링 전용
데이터는 30일 후 거의 모두 삭제
기업고객 요구사항: 규제 대상 기업에게는 이 정책이 문제를 일으킬 수 있음

5. 접근 일정 — 6월 22일 클리프

지금 ~ 6월 22일: Pro/Max/Team/Enterprise 구독에 무료 포함
6월 23일 이후: 표준 구독에서 제외, 사용량 크레딧 필요
Anthropic은 "가능한 빨리 표준 구독에 복원할 계획"이라고 함
즉, 현재는 제한 기간 동안 무료로 써볼 수 있는 상황

---

커뮤니티 반응 (Hacker News)

게시물이 아직 출시 직전이라 댓글 수는 많지 않지만, 몇 가지 흥미로운 반응이 있었다.

이름에 대한 비판:

"Fable(동화), Mythos(신화) 같은 거창한 이름은 '이 소프트웨어가 초인적인 경험이다'라고 생각하게 만드는 마케팅" — Anthropic의 브랜딩 전략에 대한 회의적 시각
"이름은 'vast and alien'(광대하고 낯선) 느낌인데, 모델의 성격은 친근한 고등학교 선생님처럼 훈련된 모순" — Anthropic이 모델에 친근한 톤을 부여하면서도 이름은 위협적으로 만드는 이중성 지적

비용에 대한 우려:

"토큰이 눈 깜짝할 사이에 사라질 것" — $50/100만 출력 토큰이 매우 비싸다는 우려
"사용량 한도를 순식간에 다 쓸 것"

보안 관련:

bug bounty(버그 상금) 제출자들이 이 모델로 얼마나 강력한 공격을 할 수 있을지 우려하는 댓글

---

새로운 시각

1. '안전한 AI'의 새로운 정의: 차단을 대신한 라우팅

Anthropic의 접근 방식이 의미 있는 전환점이다. 기존에는 '위험한 질문을 막는다'는 접근이 주류였는데, 이제는 '위험한 질문을 덜 강력한 모델로 보낸다'는 방식으로 바뀌었다. 이는 다음과 같은 의미를 가진다:

사용자에게는 '거부'가 아닌 '답변'이 제공되므로 사용자 경험은 유지됨
동시에 가장 강력한 모델의 위험한 능력은 노출되지 않음
하지만 Opus 4.8도 충분히 강력한 모델이므로, 실제로 '위험을 줄였다'고 볼 수 있는지는 의문

2. 30일 데이터 보관 — 보안 vs 프라이버시의 새로운 균형

이 정책은 업계에 선례가 될 수 있다. 강력한 모델에 접근하려면 데이터 보관을 수용해야 한다는 원칙이 확립되면, 앞으로 AI 모델의 '안전성'과 '프라이버시'는 트레이드오프(상충 관계)가 될 것이다. 규제 산업(의료, 금융 등)에서는 이것이 심각한 문제가 될 수 있다.

3. IPO 시점의 전략적 출시

Anthropic, OpenAI, SpaceX가 모두 공개 시장 진출을 준비하는 시점에 Fable 5가 출시되었다. Anthropic의 사적 가치 평가는 약 1조 달러(약 1400조 원)에 근접한다. 이 시기에 가장 강력한 모델을 공개하는 것은 주가 기대감을 높이는 전략적 움직임으로 읽힌다.

4. 'AI가 너무 빠르게 발전한다'는 경고와 동시에 가장 강력한 모델 출시

Anthropic 공동 설립자 Jack Clark는 "AI 산업에는 액셀러레이터는 있는데 브레이크 페달이 없다"고 경고했다. 그런데 동시에 가장 강력한 모델을 공개한 것은 모순적으로 보인다. 이는 '안전한 AI 발전'이라는 Anthropic의 핵심 메시지와 실제 비즈니스 전략 사이의 괴리를 보여준다.

---

자녀/미래 영향

아인, 석현, 은한에게 어떤 의미가 있을까?

코딩 교육의 변화: Fable 5가 5천만 줄 코드베이스를 하루 만에 마이그레이션했다는 것은, 단순 코딩 기술보다는 '문제를 어떻게 정의하고 AI에게 전달하는가'가 더 중요한 시대가 왔다는 뜻이다. 석현, 은한이 코딩을 배우더라도 '코드를 쓰는 법'보다 'AI와 협업하는 법'을 먼저 배워야 할 것 같다.

생명과학의 민주화: 약물 설계가 10배 가속되고, AI가 과학자가 선호하는 가설을 만들어낸다는 것은 의약품 개발 비용이 크게 낮아질 수 있다는 의미다. 아인이 관심 있다면 생물정보학(생명과학과 컴퓨터의 융합) 분야가 매우 유망해질 것이다.

보안 리터러시: 10,000개 이상의 보안 결함이 AI에 의해 발견되었다는 것은, 앞으로도 AI 기반 보안 점검이 표준이 될 것임을 의미한다. 아이들이 크면 '보안'은 전문가만의 영역이 아니라 모든 개발자에게 필수적인 소양이 될 것이다.

데이터 프라이버시 인식: 30일 데이터 보관 정책은 아이들이 성장하는 시대에 AI 서비스 이용이 곧 데이터 수집을 의미할 수 있음을 보여준다. 어릴 때부터 '내 데이터는 어디로 가는가'에 대해 생각하는 습관을 길러주는 것이 중요해질 것 같다.

---