RAGパイプラインの設計と運用
検索拡張生成の設計判断と運用で学んだ教訓をまとめる。
RAGの基本構成
Retrieval-Augmented Generationは、検索と生成を組み合わせる手法だ。
設計のポイント
- チャンク分割の粒度
- 埋め込みモデルの選定
- ベクトルDBの選択
- リランキングの導入
運用で学んだこと
- チャンクサイズは512トークンが安定
- ハイブリッド検索(ベクトル+全文)が精度高い
- 定期的なインデックス再構築が必要
まとめ
RAGは構築より運用が難しい。
検索拡張生成の設計判断と運用で学んだ教訓をまとめる。
Retrieval-Augmented Generationは、検索と生成を組み合わせる手法だ。
RAGは構築より運用が難しい。