구글 Open Knowledge Format (OKF): AI 에이전트 시대의 지식 표준화

2026-06-19 · 2026-06-19_google-open-knowledge-format-okf-analysis.md

#AI_Agent #Data_Engineering #Knowledge_Management #Open_Standards #Future_of_Work #Medical_Records

원문 출처

구글 Open Knowledge Format (OKF): AI 에이전트 시대의 지식 표준화

한 줄 요약

구글이 제안한 'Open Knowledge Format(OKF)'은 복잡한 SDK나 플랫폼 없이, 단순한 마크다운 파일과 YAML 메타데이터만으로 조직의 파편화된 지식을 AI 에이전트가 바로 이해하고 공유할 수 있는 범용 표준을 정의한다.

원문 핵심 내용

작동 원리: '파일'이 곧 '지식'

OKF의 핵심 철학은 "플랫폼이 아닌 포맷(Format, not platform)"에 있다. 기존에 각 벤더가 고안한 복잡한 지식 그래프나 전용 카탈로그 서비스를 대체하기 위해, OKF는 지식을 마크다운 파일 디렉터리로 표현한다.

  1. 구조: 하나의 개념(테이블, 지표, API, 런북 등)은 하나의 .md 파일이다.
  2. 식별: 파일 경로가 개념의 고유 ID가 된다.
  3. 메타데이터: 파일 상단에 YAML frontmatter가 붙어 구조화된 정보(type, title, description, tags 등)를 담는다.
  4. 연결성: 일반 마크다운 링크([링크 텍스트](경로))를 통해 파일 간 관계를 그래프처럼 연결한다.

비유: 기존 지식 관리 시스템이 '도서관'(특정 건물의 특정 선반에 책을 꽂아야 함)이었다면, OKF는 '우편 시스템'이다. 표준화된 봉투(YAML)와 내용물(Markdown)만 있으면, 어떤邮局(에이전트)에서도 읽고 보낼 수 있다.

구체적인 예시와 수치

OKF v0.1 사양은 단 1페이지에 담길 만큼 간결하다. 필수 필드는 type 하나뿐이며, 나머지는 생산자가 자유롭게 정의할 수 있다.

  • 예시 파일 구조:

```markdown --- type: BigQuery Table title: Orders description: 고객 주문 내역 테이블 resource: https://console.cloud.google.com/... tags: [sales, revenue] timestamp: 2026-05-28T14:30:00Z --- # Orders ## Schema

  • order_id: INT64
  • customer_id: INT64

... ## Joins

  • customers (on customer_id)

```

  • 참조 구현체:
  • Enrichment Agent: BigQuery 데이터셋을 순회하며 자동으로 OKF 문서를 초안 작성하고, 공식 문서를 크롤링해 보강하는 에이전트.
  • Static HTML Visualizer: 백엔드 없이 단일 HTML 파일로 OKF 번들을 인터랙티브 그래프로 시각화하는 뷰어.
  • 샘플 번들: GA4 이커머스, Stack Overflow, 비트코인 공개 데이터셋을 OKF 형식으로 변환한 예시.

트레이드오프와 설계 원칙

OKF는 세 가지 원칙으로 설계되었다.

  1. 최소한의 규정(Minimally opinionated): type 필드만 강제하고, 나머지 콘텐츠 모델은 생산자에게 위임한다. 이는 유연성을 극대화하지만, 일관성 유지는 사용자의 몫이다.
  2. 생산자/소비자 독립성: 사람이 작성한 번들을 AI가 읽고, AI가 생성한 번들을 사람이 볼 수 있다. 도구는 교체 가능하나 포맷은 계약처럼 고정된다.
  3. 벤더 중립성: 특정 클라우드나 SDK를 요구하지 않는다. 가치의 출처는 소유자가 아닌 사용자의 수에서 나온다.

트레이드오프: 복잡한 관계나 공간적 레이아웃(예: 엑셀의 색상 코딩, Miro의 다이어그램)을 완벽하게 표현하기 어렵다. 하지만 "최대 공약수"로서 마크다운이 선택된 이유는, 인간과 LLM이 모두 가장 잘 읽을 수 있는 형식이기 때문이다.

Hacker News 커뮤니티 반응

마크다운의 한계 vs. 실용성

커뮤니티는 OKF의 단순함을 칭찬하면서도, 마크다운이 모든 지식을 표현하기에 충분한지 의문을 제기했다.

  • 지지론: jarym은 마크다운이 인간과 LLM 간 상호작용의 최대 공약수(Lowest Common Denominator)라고 지적하며, 복잡함보다 접근성이 중요함을 강조했다.
  • 비판론: sadschnitzel은 마크다운이 토큰 비효율적이며, 복잡한 데이터 파이프라인이나 공간적 의미를 가진 지식(스프레드시트 등)을 표현하기엔 한계가 있다고 비판했다. 대신 DBML, Mermaid 같은 도메인 특화 언어를 마크다운 코드 블록으로 혼합하는 방안을 제안했다.
  • 대안 제시: xamde는 마크다운 외부의 파일이나 URL도 연결할 수 있는 초경량 지식 그래프 언어(ddot)를 소개하며, OKF와 유사한 '포맷만 있는' 접근법의 가치를 공유했다.

시맨틱 웹의 재탄생인가?

mrkiouak는 이를 10년마다 돌아오는 RDF/OWL 시맨틱 웹 시도의 또 다른 변종으로 보았다. 과거 시맨틱 웹이 실패한 이유(너무 복잡함, 채택 부진)를 고려할 때, OKF가 단순함으로 그 간극을 메우려 한다는 점이 주목받았다.

YAML의 취약성 지적

port11은 "15KB짜리 사양에 YAML 들여쓰기 오류만 없다면 좋겠다"며 아이러니하게 비판했다. 이는 마크다운 기반 시스템이 직면한 보편적인 운영상의 리스크를 지적한 것으로, 포맷의 단순함이 구현의 안정성을 보장하지는 않음을 시사한다.

그래프 데이터베이스와의 관계

bzmrgonz는 OKF를 인간이 3차원 지식 그래프를 볼 수 없어 만든 '발판(Scaffolding)'으로 해석했다. 인간이 마크다운으로 구조화하면, 에이전트가 이를 메모리 내 그래프나 Neo4j 같은 그래프 DB로 변환하여 처리할 것이라는 관점이다.

새로운 시각

'지식의 물리적화'와 버전 컨트롤의 승부

OKF의 진정한 혁신은 AI 기술 자체보다 소프트웨어 엔지니어링 관행의 확장에 있다. 코드는 이미 Git으로 버전 관리되고 리뷰된다. OKF는 지식(문서, 스키마, 비즈니스 로직)을 코드와 동일한 생명주기에 넣는다.

  • 시사점: 이는 "지식 관리"를 IT 부서의 특수 작업이 아닌, 개발 워크플로우의 자연스러운 일부로 만든다. git diff로 지식의 변경 내역을 추적하고, pull request로 지식의 정확성을 검증할 수 있게 된다. 이는 조직 내 '암묵적 지식'을 '명시적 자산'으로 전환하는 가장 저비용 고효율의 경로다.

AI 에이전트 시대의 'API'는 문서다

과거에는 시스템 간 연계를 위해 REST API나 gRPC 같은 기술적 인터페이스가 필요했다. AI 에이전트 시대에는 문서 자체가 API가 된다.

  • 연결: 에이전트가 다른 시스템과 대화하는 방식은 HTTP 요청이 아니라, 해당 시스템의 OKF 번들을 읽는 것이다. 따라서 시스템의 '사용성'은 코드 품질이 아니라, OKF 문서의 품질에 의해 결정된다. 이는 개발자에게 새로운 책임(문서화)을 지우지만, 동시에 AI와의 협업 효율성을 극대화한다.

'불완전한 정확성'의 수용

OKF는 완벽한 지식 그래프를 지향하지 않는다. type 필드만 강제하고 나머지는 자유로운 이유는, 완벽함보다 속도를 우선시하기 때문이다. AI 에이전트는 100% 정확한 지식보다, 80% 정확하지만 즉시 접근 가능한 지식을 선호한다. OKF는 이 '충분한 정확성'을 표준화함으로써, 지식 구축의 진입 장벽을 낮춘다.

자녀와 미래에 대한 시사점

① 변화하는 진로: '기록가'의 부활

미래의 고부가가치 직업은 단순한 코드 작성자가 아니라, 복잡한 시스템을 이해하고 구조화된 지식(OKF 등)으로 변환하는 사람일 것이다. AI가 코드를 생성한다면, 인간은 그 코드가 작동하는 '맥락(Context)'을 정의해야 한다. 자녀에게 가르쳐야 할 것은 코딩 기술보다, 복잡한 정보를 추상화하고 표준화된 형식으로 문서화하는 능력이다.

② 교육의 방향: 구조적 사고와 메타데이터 이해

아이들이 정보를 소비하는 방식이 변한다. 단순한 텍스트 읽기가 아닌, 메타데이터(type, tags, relationships)를 통해 지식의 신뢰도와 연결성을 판단하는 능력이 필요하다. 학교 교육에서 '보고서 작성'이 아닌, '데이터 스키마 정의'나 '지식 그래프 설계'와 같은 구조적 사고 훈련이 중요해질 것이다.

③ 의료 분야 함의: 환자 기록의 표준화

사용자의 의료(소화기·내시경·종양학) 맥락에서, OKF와 같은 표준은 환자 기록의 상호운용성에 영감을 줄 수 있다. 현재 각 병원/시스템마다 다른 형식의 기록이 파편화되어 있다면, 이를 표준화된 '마크다운+메타데이터' 형식으로 변환하면, AI 에이전트가 환자의 과거 병력, 검사 결과, 약물 이력을 통합적으로 분석하여 정밀 진단을 돕는 데 활용할 수 있다. 특히 종양학처럼 다학제 협진이 중요한 분야에서는, 표준화된 지식 포맷이 의사 간 정보 공유의 장벽을 낮출 것이다.