Google Agentic RAG — 부족한 정보를 끝까지 찾아내는 멀티 에이전트 검색

2026-06-09 · 2026-06-09_google-agentic-rag-sufficient-context-agent.md

#ai/rag #google-research #multi-agent #enterprise-ai #retrieval #gemini-enterprise #2026-06

원문 출처

Google Agentic RAG — 부족한 정보를 끝까지 찾아내는 멀티 에이전트 검색

한 줄 요약

Google Research가 Gemini Enterprise Agent Platform에 Agentic RAG를 공개했다. 기존 RAG가 한 번 검색으로 끝나는 반면, 이 시스템은 여러 에이전트가 협력해서 정보를 찾을 때까지 반복 검색하고, Sufficient Context Agent가 "정보가 충분한지"를 판단해서 불완전한 답변을 막는다. 사실 정확도가 최대 34% 향상되었다.

배경: 기존 RAG의 문제점

RAG가 무엇인가

RAG(Retrieval-Augmented Generation, 검색 증강 생성)는 LLM이 답변을 만들기 전에 외부 문서에서 관련 정보를 찾아오는 기술이다. 사용자가 질문하면 시스템이 데이터베이스에서 비슷한 문서를 검색해서 LLM에게 주고, LLM이 그 정보를 바탕으로 답변을 작성한다.

기존 "바닐라 RAG"의 한계

기존 RAG 시스템은 한 번의 검색으로 모든 것을 해결하려고 한다. 문제는 기업 환경에서 정보가 여러 데이터베이스에 분산되어 있다는 것이다.

예를 들어 "프로젝트 X에 쓰인 서버의 사양이 뭐야?"라고 물어보면:

  1. 첫 검색에서 "프로젝트 X는 서버 ID-1234를 사용함"이라는 문서를 찾는다
  2. 여기서 끝난다 — ID-1234의 사양을 두 번째 데이터베이스에서 찾아오지 않는다
  3. 결과: 불완전한 답변 또는 "정보를 찾을 수 없습니다"

Google Research의 Cyrus Rashtchian과 Da-Cheng Juan이 2026년 6월 5일 공개한 글에서 이렇게 설명한다: "기존 단일 단계 RAG 시스템은 현대 비즈니스 워크플로우의 다중 소스, 다중 홉(여러 단계를 거쳐야 하는) 쿼리를 위해 설계되지 않았다."

Agentic RAG의 핵심 구조

Google은 Agentic RAG를 단일 검색 엔진이 아니라 조직된 연구 부서로 conceptualize(개념화)한다. 각 에이전트가 전문 역할을 맡아서 협력한다.

5단계 워크플로우

1단계: 오케스트레이션(Orchestration)

  • Root Agent(루트 에이전트): 사용자의 요청을 분석하고 하위 에이전트들에게 작업을 분배한다
  • Planner Agent(플래너 에이전트): 정보를 얻기 위한 경로를 설계한다. 예를 들어 "먼저 재무 데이터베이스를 확인하고, 다음으로 프로젝트 로그를 확인한다"는 계획을 세운다
  • Query Rewriter(쿼리 리라이터): 모호한 사용자 요청을 구체적인 검색 쿼리로 번역한다. "프로젝트 X가 어떻게 진행되고 있어?"라는 질문을 "프로젝트 X 3분기 진행 상황 보고서"라는 구체적인 검색어로 변환한다

2단계: 검색(Search)

  • Search Fanout Agent: 다듬어진 쿼리들을 여러 검색 소스에 동시에 보낸다
  • RAG Agent: Google RAG Engine(파서 + 재순위 지정기 포함)을 사용해 스니펫(문서 조각)을 수집한다
  • 여기서 중요한 점은: 표준 RAG라면 이 단계에서 끝난다. 정보가 부족해도 더 이상 검색하지 않고 불완전한 답변을 반환한다

3단계: Sufficient Context Agent(충분한 컨텍스트 에이전트) — 핵심 혁신

이것이 Google 접근법의 핵심 차별점이다. 최종 답변을 생성하기 전에 품질 관리 검사원 역할을 하는 에이전트이다. 세 가지를 점검한다:

  1. 검색된 스니펫 검토: 가져온 텍스트 조각들에 필요한 정보가 실제로 들어있는가
  2. 중간 초안 검토: "임시 초안" 답변을 프롬프트와 스니펫과 비교해서 완성도와 근거가 충분한가
  3. 누락 분석: 정확히 무엇을 놓쳤는지 특정한다. 예: "약물과 식이요법은 찾았지만 알레르기 정보가 빠져 있다"

이 에이전트가 "정보가 부족하다"고 판단하면, 구체적인 피드백 로그를 생성한다: "약물과 저염식 지침은 찾았지만, 입원 중 알레르기 반응이나 부작용에 대한 정보는 누락되었습니다. '발진' 또는 '부작용'으로 다시 검색하세요."

4단계: 반복 검색(Iteration)

  • Sufficient Context Agent의 피드백을 받아 Query Rewriter가 새로운 타겟ted 검색을 생성한다
  • RAG Agent가 이전에 간과했던 파일들을 더 깊이 탐색한다
  • 이 과정이 정보가 충분히 모일 때까지 반복된다

5단계: 종합(Synthesis)

  • Sufficient Context Agent가 최종 검증을 통과하면 Synthesis Agent가 정확한 최종 요약을 작성한다

실제 사례: 의료 질문

의사가 다음과 같이 질문했다고 가정하자:

"존 두의 무릎 수술 후 퇴원 약물과 식이 제한은 무엇이며, 입원 중 알레르기 반응이 있었나요? 병원 내 주사 약물은 헤파린 정맥 주사와 테니텍테플라스만 제외하세요."

표준 RAG의 반응: 약물과 식이요법은 찾을 수 있지만, 알레르기 정보는 놓쳐서 불완전한 답변을 반환한다

Agentic RAG의 반응:

  1. 약물과 식이요찬 정보 발견
  2. Sufficient Context Agent가 "알레르기 정보가 부족하다"고 판단
  3. "부작용" 또는 "adverse events"로 재검색 지시
  4. 이전에 간과했던 임상 노트에서 알레르기 정보 발견
  5. 세 가지 요구(약물, 식이, 알레르기) 모두 충족 확인 후 최종 요약 생성

실험 결과

Google은 FramesQA 벤치마크(824개 쿼리, 2,676개 PDF 문서, 다중 홉 추론 필요)에서 시스템을 평가했다.

테스트 케이스: TV 파이널 방영 시간

질문: "2024년 6월 기준, 가장 많이 본 TV 시즌 파이널 두 가지 중 어느 것이 더 오래 방영되었고, 얼마나 차이가 있었나요?"

표준 RAG 실패: 명시적인 방영 시간 데이터를 찾지 못하고 "정보를 찾을 수 없습니다"라고 응답

Agentic RAG 성공:

  1. 해당 프로그램을 식별(MASH와 Cheers)
  2. 방영 시간 정보를 찾기 위해 추가 검색 수행
  3. 정확한 시간 차이 계산

성능 지표

  • 정확도 향상: 표준 RAG 대비 사실성 데이터셋에서 최대 34% 향상
  • Cross-Corpus 정확도: 4개 데이터 소스 중 올바른 것을 선택해야 하는 환경에서 90.1% 정확도 달성 (단일 코퍼스 정확도에 거의 근접)
  • 지연 시간: 단일 코퍼스 대비 평균 3% 이내의 추가 지연만 발생 — 반복 검색에도 불구하고 거의 실시간 수준

비교 테이블

기능 바닐라 RAG 표준 Agentic RAG Google Cross-Corpus Agentic RAG
검색 방식 단일 단계 매칭 다중 에이전트, 단일 패스 다중 에이전트, 반복적
Sufficient Context Agent 없음 없음 있음
반복 재검색 없음 없음 있음
Cross-Corpus 라우팅 없음 없음 있음 (4개 중 선택)
보고된 정확도 기준선 미보고 90.1%
지연 시간 영향 N/A N/A <3% 증가

새로운 시각

1. "지속성(Persistence)"이 핵심이다

이 시스템의 진짜 혁신은 더 많은 에이전트를 넣은 것이 아니라, 언제 검색을 멈출지 아는 능력이다. 대부분의 AI 시스템은 두 극단 중 하나에 빠진다: 정보가 없으면 추측해서 답변하거나, 너무 조기에 "모릅니다"라고 포기한다. Sufficient Context Agent는 세 번째 길을 제시한다 — "정보가 있을 수 있으니 더 찾아보자"는 접근법이다.

2. 기업 데이터의 "아일랜드" 문제를 해결하는 실제적 방안

기업 환경에서는 각 부서가 자체 데이터베이스를 운영하는 것이 일반적이다. HR은 인사 시스템, 재무는 ERP, 연구소는 자체 서버를 가진다. Agentic RAG는 이 데이터 아일랜드들을 물리적으로 통합하지 않고도 논리적으로 연결할 수 있다. 데이터 마이그레이션이나 통합 시스템 구축 없이도 작동한다는 점이 실무적으로 중요하다.

3. 의료 분야에서의 실제 영향

의료 기록은 전형적인 다중 소스 문제이다. 처방전, 영양 기록, 임상 노트, 검사 결과 등이 서로 다른 시스템에 저장되어 있다. 의사가 환자에 대한 종합적인 정보를 얻으려면 여러 시스템을 수동으로 확인해야 한다. Agentic RAG가 이 문제를 해결한다면, 진료 효율성과 환자 안전에 직접적인 영향을 미칠 수 있다.

자녀/미래 영향

아인(첫째 딸) — 의료/생명과학 진로 고려 시

의사가 된다면 Agentic RAG 같은 시스템이 진료 보조 도구로 일상화되어 있을 것이다. 환자의 전체적인 건강 정보를 한 번에 확인할 수 있게 되면, 진단 정확도가 향상되고 실수가 줄어들 것이다. 다만, 의료 AI의 신뢰성은 항상 검증해야 한다는 점을 알려줘야 한다.

석현, 은한(둘째, 셋째 아들) — 엔지니어링/데이터 분야

이 시스템이 보여준 "지속성" 개념은 AI 엔지니어링의 새로운 패러다임이다. 단순히 데이터를 처리하는 것이 아니라, 목표를 달성할 때까지 전략적으로 접근하는 AI를 설계하는 것이 중요해진다. 문제 해결 능력을 키우는 교육이 더욱 중요해질 것이다.

관련 노트