ひとことで言うと
リランカーは、最初の検索で集めた候補をそのまま使わず、質問との相性でもう一度順位づけし直す部品です。
どんな場面で使うか
- RAG で検索候補は取れるが、上位の並びが甘いとき
- 似た文書が多く、どれを先に LLM へ渡すかで答えがぶれるとき
- コンテキストウィンドウ に入れられる件数が限られるとき
- 検索精度を上げたいが、文書全体の作り直しはすぐできないとき
最初の検索では広めに候補を拾い、そのあとリランカーで「この質問に本当に近い順」へ並べ替える構成がよく使われます。 これにより、限られた入力枠へ、より関係の強い文書を優先して入れやすくなります。
ベクトル検索との違い
- ベクトル検索 は、意味の近さで候補を広く集める役
- リランカー は、その候補を質問文との相性で再評価して順番を詰める役
つまり、ベクトル検索だけで終わらせるより、候補集めと順位づけを分けたほうが安定する場面があります。
実務で気にするポイント
- リランカーを入れると精度は上がっても、速度やコストが増えることがある
- 文書分割が粗すぎると、並べ替え以前に良い候補が取れない
- 評価 では「検索されたか」だけでなく「上位に来たか」も見る
- 出典表示の運用まで含めて、上位文書が利用者に納得できるかを確認する
注意: リランカーは順位調整の部品です。元の検索で必要文書が候補に入っていなければ救えないため、検索設計とセットで見直す必要があります。