-
Tokenmaxxing은 죽었다, Tokenmaxxing 만세: 분석 노트
Tokenmaxxing은 죽었다, Tokenmaxxing 만세: 분석 노트 한 줄 요약 Tokenmaxxing 토큰 과다 소비 현상 은 처음에 경영진이 AI 도구를 전사에 강제로 퍼뜨리기 위한 '둔탁한 정책'이었지만, 이제는 모델이 오래 실행될수록 정확도가 올라가는 '누적 정확성 compounding correctness...
-
GLM 5.2, Semgrep IDOR 벤치마크에서 Claude 앞서
GLM 5.2, Semgrep IDOR 벤치마크에서 Claude 앞서 한 줄 요약 Semgrep의 IDOR 취약점 탐지 벤치마크에서 중국 Zhipu AI의 오픈웨이트 모델 GLM 5.2가 프롬프트만으로 Claude Code Opus 기반 를 넘어선 39% F1을 기록했으며, 이는 모델 자체 성능과 하네스 스캐폴딩 효과를...
-
GLM 5.2 beats Claude in our benchmarks
GLM 5.2 beats Claude in our benchmarks 한 줄 요약 GLM 5.2, 중국의 오픈웨이트 모델이 별도의 보조 도구 없이도 IDOR 취약한 직접 객체 참조 탐지에서 Claude Code 32% 를 39% F1으로 앞질렀으며, 취약점당 비용은 약 $0.17로 경제성까지 입증했다 — 하지만 harne...
-
Asian AI startups launch Mythos-like models
Asian AI startups launch Mythos like models 한 줄 요약 미국이 Anthropic의 Mythos/Fable 수출을 금지하자 일본 Sakana AI 퓨구 와 중국 360 툴롱펑 이 ‘Mythos급’을 표방한 모델을 내놓았지만, Hacker News 커뮤니티는 독립 벤치마크 부재와 ‘오케스트...
-
오픈 웨이트 LLM과 폐쇄형 LLM의 격차
오픈 웨이트 LLM과 폐쇄형 LLM의 격차 한 줄 요약 Doubleword의 Jamie Dborin은 Artificial Analysis의 18개 벤치마크 데이터를 분석해 오픈 웨이트 LLM과 폐쇄형 LLM의 성능 격차를 측정했으며, Intelligence Index 하나만 보면 2026년 12월 3일경 격차가 0이 될...
-
DSpark: Speculative decoding을 활용한 LLM 추론 가속화
DSpark: Confidence Scheduled Speculative Decoding with Semi Autoregressive Generation 논문 : DeepSeek AI & Peking University PDF : https://github.com/deepseek ai/DeepSpec/blob/main/D...
-
What happened after 2k people tried to hack my AI assistant
What happened after 2k people tried to hack my AI assistant 한 줄 요약 저자가 자기 AI 비서 Fiu 를 6,000통 이상의 이메일로 공격하게 한 실험에서 단 한 번도 비밀이 유출되지 않았지만, HN 댓글은 실험 설계의 한계 단발성 공격, 비현실적 환경, 비용 문제 를 지적...
-
오픈 LLM 전환의 비용: 리눅스 시대의 재현인가, 아니면 기술적 성숙의 신호인가
오픈 LLM 전환의 비용: 리눅스 시대의 재현인가, 아니면 기술적 성숙의 신호인가 한 줄 요약 2026년 중반, Claude와 GPT 같은 독점 모델의 성능 우위는 여전히 존재하지만, 오픈 가중치 모델의 격차가 '몇 달' 수준으로 좁혀지면서 '리눅스 전환'처럼 전문적인 희생 없이도 오픈 모델로의 이주가 실질적인 선택지가...
-
GLM-5.2 로컬 실행: 1.5TB 모델의 양자화, 메모리 대역폭 전쟁, 그리고 의료 데이터 주권
GLM 5.2 로컬 실행: 1.5TB 모델의 양자화, 메모리 대역폭 전쟁, 그리고 의료 데이터 주권 한 줄 요약 Z.ai의 GLM 5.2 744B 파라미터 는 Unsloth의 동적 양자화 기술로 인해 256GB RAM 수준의 하드웨어에서 실행 가능해졌으며, 이는 클라우드 API 의존성 탈피와 의료 데이터 프라이버시 확보를...
-
GLM 5.2 대 Opus: 비용과 품질의 트레이드오프, 그리고 오픈 가중치의 전략적 가치
GLM 5.2 대 Opus: 비용과 품질의 트레이드오프, 그리고 오픈 가중치의 전략적 가치 한 줄 요약 GLM 5.2는 오픈 가중치 모델로서 비용 효율성과 접근성에서 압도적 우위를 보이지만, 시각적 검증 능력 부재와 완성도 측면에서 폐쇄형 최상위 모델인 Claude Opus 4.8에 비해 한계가 명확하며, 이는 '비용 우...
-
오픈 모델 전환의 기회비용: 리눅스 시대의 재림인가, 단순한 대안인가
오픈 모델 전환의 기회비용: 리눅스 시대의 재림인가, 단순한 대안인가 한 줄 요약 상용 AI 모델 Claude, GPT 의 폐쇄성과 검열, 신원 확인 강화라는 '엔시티피케이션 Enshittification ' 리스크에 대응하여, 성능 격차가 좁혀진 오픈 가중치 Open weight 모델로 전환하는 것이 실무적·전략적으로...
-
Apertus: 주권 AI를 위한 완전 공개 파운데이션 모델의 가능성과 한계
Apertus: 주권 AI를 위한 완전 공개 파운데이션 모델의 가능성과 한계 한 줄 요약 스위스의 Apertus는 가중치뿐 아니라 학습 데이터와 레시피까지 모두 공개하는 '완전 공개' 모델을 통해, 미국 빅테크 중심의 AI 패권에서 벗어나 데이터 주권과 과학적 재현성을 확보하려는 시도이다. 원문 핵심 내용 '완전 공개'의...
-
LLM이 작성한 인시던트 보고서의 미래가 두렵다
LLM이 작성한 인시던트 보고서의 미래가 두렵다 이 글은 LLM 대규모 언어 모델 이 인시던트 보고서 사고 보고서 작성을 대체했을 때 발생할 수 있는 위험성과 학습 기회의 상실, 그리고 기술적 부채의 심화에 대해 경고하는 내용을 다루고 있습니다. 1. 원문 핵심 내용 인시던트 보고서 Incident Report 는 시스템...
-
Andrej Karpathy: Software in the era of AI
Andrej Karpathy: Software in the era of AI 이 노트는 Andrej Karpathy가 제시한 AI 시대의 소프트웨어 진화 단계와 LLM을 새로운 운영체제 OS 로 보는 관점을 분석한 내용입니다. Hacker News의 심도 있는 토론 내용을 포함하여, 단순한 도구를 넘어선 새로운 컴퓨팅 패...
-
AI가 이미 자기계발 논픽션 책을 죽였나?
AI가 이미 자기계발 논픽션 책을 죽였나? Tim Ferriss가 자신의 책 판매 데이터에서 자기계발 논픽션 장르의 급격한 하락을 발견하고, 이를 AI 확산과 연결 지어 분석한 글. GeekNews를 통해 소개됨. 1. 원문 핵심 내용 Tim Ferriss의 발견 Tim Ferriss 《The 4 Hour Workweek...
-
LLM Wiki: RAG의 한계를 넘어선 ''영속적 지식 베이스''의 등장
LLM Wiki: RAG의 한계를 넘어선 '영속적 지식 베이스'의 등장 한 줄 요약 단순 검색 RAG 의 비효율성을 개선하고, LLM이 문서를 분석해 영속적인 위키 구조와 지식 그래프로 자동 변환하는 오픈소스 데스크톱 앱 'LLM Wiki'의 작동 원리와 의료/교육 분야에서의 시사점을 분석한다. 원문 핵심 내용 RAG의...
-
OpenRouter Fusion API: 단일 모델의 한계를 넘어선 ''합의''의 시대
OpenRouter Fusion API: 단일 모델의 한계를 넘어선 '합의'의 시대 한 줄 요약 OpenRouter의 Fusion API는 단일 AI 모델의 한계를 극복하기 위해 여러 전문가 모델을 병렬로 분석하고 심판 모델이 결과를 종합하는 '멀티 모델 심의' 방식을 제공하며, 이는 정확도 향상과 비용·시간 증가 사이의...
-
제주 방언 ↔ 표준어 번역 모델 (88M 파라미터) — 저자원 방언 보존의 기초 인프라
제주 방언 ↔ 표준어 번역 모델 88M 파라미터 — 풀 분석 작성자: PCN R&S LLM 팀 PyTorchKR 커뮤니티 게재일: 2026 06 08 출처: discuss.pytorch.kr 모델: HuggingFace postcn/Jeju Standard Korean Translator 이 글이 나온 배경 제주어 Jej...
-
Lathe — LLM로 새로운 도메인 배우기, 건너뛰지 않기
Lathe — LLM로 새로운 도메인 배우기, 건너뛰지 않기 작성자: Deven Jarvis 게재일: 2026 06 08 출처: Hacker News Show HN 317점 / 36댓글 프로젝트: GitHub devenjarvis/lathe 이 글이 나온 배경 LLM이 코드를 대신 써주면서 사람들이 "배우는 과정"을 건너...