#LLM

Tokenmaxxing은 죽었다, Tokenmaxxing 만세: 분석 노트
2026-06-29 · #AI #LLM #tokenmaxxing #기업전략 #기술도입

Tokenmaxxing은 죽었다, Tokenmaxxing 만세: 분석 노트 한 줄 요약 Tokenmaxxing 토큰 과다 소비 현상 은 처음에 경영진이 AI 도구를 전사에 강제로 퍼뜨리기 위한 '둔탁한 정책'이었지만, 이제는 모델이 오래 실행될수록 정확도가 올라가는 '누적 정확성 compounding correctness...
GLM 5.2, Semgrep IDOR 벤치마크에서 Claude 앞서
2026-06-29 · #LLM #보안 #벤치마크 #GLM-5.2 #오픈웨이트

GLM 5.2, Semgrep IDOR 벤치마크에서 Claude 앞서 한 줄 요약 Semgrep의 IDOR 취약점 탐지 벤치마크에서 중국 Zhipu AI의 오픈웨이트 모델 GLM 5.2가 프롬프트만으로 Claude Code Opus 기반 를 넘어선 39% F1을 기록했으며, 이는 모델 자체 성능과 하네스 스캐폴딩 효과를...
GLM 5.2 beats Claude in our benchmarks
2026-06-29 · #AI #open-weight #GLM #Claude #security

GLM 5.2 beats Claude in our benchmarks 한 줄 요약 GLM 5.2, 중국의 오픈웨이트 모델이 별도의 보조 도구 없이도 IDOR 취약한 직접 객체 참조 탐지에서 Claude Code 32% 를 39% F1으로 앞질렀으며, 취약점당 비용은 약 $0.17로 경제성까지 입증했다 — 하지만 harne...
Asian AI startups launch Mythos-like models
2026-06-29 · #AI #geopolitics #regulation #education #children

Asian AI startups launch Mythos like models 한 줄 요약 미국이 Anthropic의 Mythos/Fable 수출을 금지하자 일본 Sakana AI 퓨구 와 중국 360 툴롱펑 이 ‘Mythos급’을 표방한 모델을 내놓았지만, Hacker News 커뮤니티는 독립 벤치마크 부재와 ‘오케스트...
오픈 웨이트 LLM과 폐쇄형 LLM의 격차
2026-06-28 · #LLM #Open-Weight-Models #Closed-Source-Models #Benchmark-Analysis #Artificial-Analysis

오픈 웨이트 LLM과 폐쇄형 LLM의 격차 한 줄 요약 Doubleword의 Jamie Dborin은 Artificial Analysis의 18개 벤치마크 데이터를 분석해 오픈 웨이트 LLM과 폐쇄형 LLM의 성능 격차를 측정했으며, Intelligence Index 하나만 보면 2026년 12월 3일경 격차가 0이 될...
DSpark: Speculative decoding을 활용한 LLM 추론 가속화
2026-06-28 · #AI #LLM #inference-optimization #speculative-decoding #deepseek

DSpark: Confidence Scheduled Speculative Decoding with Semi Autoregressive Generation 논문 : DeepSeek AI & Peking University PDF : https://github.com/deepseek ai/DeepSpec/blob/main/D...
What happened after 2k people tried to hack my AI assistant
2026-06-27 · #AI #security #prompt_injection #LLM #education

What happened after 2k people tried to hack my AI assistant 한 줄 요약 저자가 자기 AI 비서 Fiu 를 6,000통 이상의 이메일로 공격하게 한 실험에서 단 한 번도 비밀이 유출되지 않았지만, HN 댓글은 실험 설계의 한계 단발성 공격, 비현실적 환경, 비용 문제 를 지적...
오픈 LLM 전환의 비용: 리눅스 시대의 재현인가, 아니면 기술적 성숙의 신호인가
2026-06-23 · #AI #Open Source #LLM #Hacker News #Privacy

오픈 LLM 전환의 비용: 리눅스 시대의 재현인가, 아니면 기술적 성숙의 신호인가 한 줄 요약 2026년 중반, Claude와 GPT 같은 독점 모델의 성능 우위는 여전히 존재하지만, 오픈 가중치 모델의 격차가 '몇 달' 수준으로 좁혀지면서 '리눅스 전환'처럼 전문적인 희생 없이도 오픈 모델로의 이주가 실질적인 선택지가...
GLM-5.2 로컬 실행: 1.5TB 모델의 양자화, 메모리 대역폭 전쟁, 그리고 의료 데이터 주권
2026-06-23 · #LLM #Quantization #Local-Inference #Hardware-Requirements #Medical-AI-Ethics

GLM 5.2 로컬 실행: 1.5TB 모델의 양자화, 메모리 대역폭 전쟁, 그리고 의료 데이터 주권 한 줄 요약 Z.ai의 GLM 5.2 744B 파라미터 는 Unsloth의 동적 양자화 기술로 인해 256GB RAM 수준의 하드웨어에서 실행 가능해졌으며, 이는 클라우드 API 의존성 탈피와 의료 데이터 프라이버시 확보를...
GLM 5.2 대 Opus: 비용과 품질의 트레이드오프, 그리고 오픈 가중치의 전략적 가치
2026-06-23 · #AI #LLM #Open-Weights #Software-Engineering #Cost-Benefit-Analysis

GLM 5.2 대 Opus: 비용과 품질의 트레이드오프, 그리고 오픈 가중치의 전략적 가치 한 줄 요약 GLM 5.2는 오픈 가중치 모델로서 비용 효율성과 접근성에서 압도적 우위를 보이지만, 시각적 검증 능력 부재와 완성도 측면에서 폐쇄형 최상위 모델인 Claude Opus 4.8에 비해 한계가 명확하며, 이는 '비용 우...
오픈 모델 전환의 기회비용: 리눅스 시대의 재림인가, 단순한 대안인가
2026-06-22 · #AI #Open-Weights #LLM #Digital-Sovereignty #Productivity

오픈 모델 전환의 기회비용: 리눅스 시대의 재림인가, 단순한 대안인가 한 줄 요약 상용 AI 모델 Claude, GPT 의 폐쇄성과 검열, 신원 확인 강화라는 '엔시티피케이션 Enshittification ' 리스크에 대응하여, 성능 격차가 좁혀진 오픈 가중치 Open weight 모델로 전환하는 것이 실무적·전략적으로...
Apertus: 주권 AI를 위한 완전 공개 파운데이션 모델의 가능성과 한계
2026-06-22 · #rss-auto #geeknews #AI #OpenSource #SovereignAI

Apertus: 주권 AI를 위한 완전 공개 파운데이션 모델의 가능성과 한계 한 줄 요약 스위스의 Apertus는 가중치뿐 아니라 학습 데이터와 레시피까지 모두 공개하는 '완전 공개' 모델을 통해, 미국 빅테크 중심의 AI 패권에서 벗어나 데이터 주권과 과학적 재현성을 확보하려는 시도이다. 원문 핵심 내용 '완전 공개'의...
LLM이 작성한 인시던트 보고서의 미래가 두렵다
2026-06-21 · #LLM #SRE #Incident-Report #AI-Ops #Technical-Writing

LLM이 작성한 인시던트 보고서의 미래가 두렵다 이 글은 LLM 대규모 언어 모델 이 인시던트 보고서 사고 보고서 작성을 대체했을 때 발생할 수 있는 위험성과 학습 기회의 상실, 그리고 기술적 부채의 심화에 대해 경고하는 내용을 다루고 있습니다. 1. 원문 핵심 내용 인시던트 보고서 Incident Report 는 시스템...
Andrej Karpathy: Software in the era of AI
2026-06-21 · #AI #LLM #Software Engineering #Programming Paradigm #Agent

Andrej Karpathy: Software in the era of AI 이 노트는 Andrej Karpathy가 제시한 AI 시대의 소프트웨어 진화 단계와 LLM을 새로운 운영체제 OS 로 보는 관점을 분석한 내용입니다. Hacker News의 심도 있는 토론 내용을 포함하여, 단순한 도구를 넘어선 새로운 컴퓨팅 패...
AI가 이미 자기계발 논픽션 책을 죽였나?
2026-06-19 · #ai #자기계발 #출판 #LLM #콘텐츠-산업

AI가 이미 자기계발 논픽션 책을 죽였나? Tim Ferriss가 자신의 책 판매 데이터에서 자기계발 논픽션 장르의 급격한 하락을 발견하고, 이를 AI 확산과 연결 지어 분석한 글. GeekNews를 통해 소개됨. 1. 원문 핵심 내용 Tim Ferriss의 발견 Tim Ferriss 《The 4 Hour Workweek...
LLM Wiki: RAG의 한계를 넘어선 ''영속적 지식 베이스''의 등장
2026-06-18 · #LLM #지식관리 #RAG #개인생산성 #의료정보

LLM Wiki: RAG의 한계를 넘어선 '영속적 지식 베이스'의 등장 한 줄 요약 단순 검색 RAG 의 비효율성을 개선하고, LLM이 문서를 분석해 영속적인 위키 구조와 지식 그래프로 자동 변환하는 오픈소스 데스크톱 앱 'LLM Wiki'의 작동 원리와 의료/교육 분야에서의 시사점을 분석한다. 원문 핵심 내용 RAG의...
OpenRouter Fusion API: 단일 모델의 한계를 넘어선 ''합의''의 시대
2026-06-16 · #AI #LLM #Multi-Agent System #OpenRouter #Medical AI

OpenRouter Fusion API: 단일 모델의 한계를 넘어선 '합의'의 시대 한 줄 요약 OpenRouter의 Fusion API는 단일 AI 모델의 한계를 극복하기 위해 여러 전문가 모델을 병렬로 분석하고 심판 모델이 결과를 종합하는 '멀티 모델 심의' 방식을 제공하며, 이는 정확도 향상과 비용·시간 증가 사이의...
제주 방언 ↔ 표준어 번역 모델 (88M 파라미터) — 저자원 방언 보존의 기초 인프라
2026-06-08 · #jeju-dialect #NLP #low-resource-language #translation #AI

제주 방언 ↔ 표준어 번역 모델 88M 파라미터 — 풀 분석 작성자: PCN R&S LLM 팀 PyTorchKR 커뮤니티 게재일: 2026 06 08 출처: discuss.pytorch.kr 모델: HuggingFace postcn/Jeju Standard Korean Translator 이 글이 나온 배경 제주어 Jej...
Lathe — LLM로 새로운 도메인 배우기, 건너뛰지 않기
2026-06-08 · #LLM #learning #tutorial #education #hands-on

Lathe — LLM로 새로운 도메인 배우기, 건너뛰지 않기 작성자: Deven Jarvis 게재일: 2026 06 08 출처: Hacker News Show HN 317점 / 36댓글 프로젝트: GitHub devenjarvis/lathe 이 글이 나온 배경 LLM이 코드를 대신 써주면서 사람들이 "배우는 과정"을 건너...