-
Code as Agent Harness: 코드를 에이전트의 실행 기반으로 보는 102페이지 서베이
Code as Agent Harness: 코드를 에이전트의 실행 기반으로 보는 102페이지 서베이 한 줄 요약 코드는 더 이상 LLM이 생성하는 '결과물'이 아니라, 에이전트가 추론하고 행동하며 상태를 관리하는 '실행 환경 Harness ' 그 자체로 진화하고 있으며, 이는 단순한 프로그래밍 패러다임 변화를 넘어 디지털...
-
Claude Code ''Extended Thinking''의 환상: 요약본은 사고가 아니다
Claude Code 'Extended Thinking'의 환상: 요약본은 사고가 아니다 한 줄 요약 Claude Code의 'Extended Thinking' 기능은 모델의 실제 사고 과정을 보여주는 것이 아니라, 사고의 결과물을 요약한 텍스트일 뿐이며, 이는 디버깅의 불확실성과 오픈소스 모델 디스틸레이션 방지라는 비즈...
-
ponytail: AI 에이전트를 ''게으른 시니어 개발자''로 만드는 법
ponytail: AI 에이전트를 '게으른 시니어 개발자'로 만드는 법 한 줄 요약 AI 코딩 에이전트가 불필요하게 복잡한 코드를 짜는 '과잉 설계 Over engineering '를 방지하고, 표준 라이브러리와 네이티브 기능을 우선 활용하게 하여 코드량을 획기적으로 줄이는 최적화 프레임워크. 원문 핵심 내용 '게으른 시...
-
구글 Open Knowledge Format (OKF): AI 에이전트 시대의 지식 표준화
구글 Open Knowledge Format OKF : AI 에이전트 시대의 지식 표준화 한 줄 요약 구글이 제안한 'Open Knowledge Format OKF '은 복잡한 SDK나 플랫폼 없이, 단순한 마크다운 파일과 YAML 메타데이터만으로 조직의 파편화된 지식을 AI 에이전트가 바로 이해하고 공유할 수 있는 범용...
-
Open Code Review: 결정론적 엔진과 LLM 에이전트를 결합한 Alibaba의 코드 리뷰 도구
Open Code Review: 결정론적 엔진과 LLM 에이전트를 결합한 Alibaba의 코드 리뷰 도구 한 줄 요약 알리바바의 오픈소스 코드 리뷰 도구 'Open Code Review'는 LLM의 불확실성을 보완하기 위해 '무엇을 리뷰할지'는 결정론적 엔진이, '어떻게 피드백할지'는 LLM 에이전트가 담당하는 하이브리드...
-
Apodex-1.0: '검증하는 팀'이 만드는 구조적 신뢰, 그리고 의료 진단의 미래
Apodex 1.0: '검증하는 팀'이 만드는 구조적 신뢰, 그리고 의료 진단의 미래 한 줄 요약 단일 AI 모델의 추론 루프를 무작정 늘리는 대신, '탐색하는 전문가 팀'과 '독립적인 검증자 팀'을 구조적으로 분리 하여 외부 정보와 교차 검증하는 Apodex 1.0 아키텍처가 딥리서치 분야에서 새로운 최고 성능 SOTA...