RAGパイプラインの設計と運用

検索拡張生成の設計判断と運用で学んだ教訓をまとめる。

RAGの基本構成

Retrieval-Augmented Generationは、検索と生成を組み合わせる手法だ。

設計のポイント

  1. チャンク分割の粒度
  2. 埋め込みモデルの選定
  3. ベクトルDBの選択
  4. リランキングの導入

運用で学んだこと

  • チャンクサイズは512トークンが安定
  • ハイブリッド検索(ベクトル+全文)が精度高い
  • 定期的なインデックス再構築が必要

まとめ

RAGは構築より運用が難しい。