Unified Context-Intent Embeddings for Scalable Text-to-SQL

Author: Pinterest Engineering (Keqiang Li, Bin Yang) | Source: Pinterest Engineering Blog | Published: 2026-03-07


한 줄 요약

Pinterest가 10만+ 테이블 환경에서 과거 SQL 쿼리를 의미 기반 임베딩으로 변환하고 거버넌스 인지 랭킹을 결합하여, 분석가의 기관 지식을 검색 가능한 라이브러리로 만든 Analytics Agent 아키텍처.

핵심 주장/내용

  • 3단계 임베딩 파이프라인: Domain Context Injection → SQL-to-Text(LLM이 분석 의도를 구조화된 NL로 변환) → Text-to-Embedding
  • 구조적 패턴(조인 키, 필터, 집계) + 통계적 시그널(성공률, 사용 빈도, 작성자 전문성) + 거버넌스 메타데이터(테이블 티어, 신선도)를 융합한 거버넌스 인지 랭킹
  • Asset-first 원칙: 새 SQL 생성 전에 기존 신뢰 에셋(테이블, 큐레이션 쿼리)을 먼저 발견
  • AI 문서화로 수동 문서 작업 ~70% 감소, join-based lineage로 40%+ 컬럼 자동 태깅
  • MCP 통합 레이어로 테이블·쿼리·지식 검색 도구를 에이전트에 제공

주요 수치 / 사실

  • 100,000+ 분석 테이블, 2,500+ 분석가 대상
  • 출시 2개월 만에 분석가 인구의 40% 커버, 사내 에이전트 1위 (2위 대비 10x 사용량)
  • AI 테이블 설명의 75%+가 “usable” 이상으로 평가
  • Vector DB as a Service(OpenSearch 기반)로 수백만 임베딩 관리, 일간 증분 업데이트

관련 위키


Source: 원문 보기