ひとことで言うと
Embedding は、文章の意味を検索しやすい数値表現に変えるための仕組みです。似た内容ほど近い位置に並べやすくなります。
どんな場面で使うか
- 社内文書検索の精度を上げたい時
- RAG 用に関連文書を探したい時
- 類似FAQを自動で見つけたい時
- タグ付け前のざっくり分類をしたい時
キーワード検索との違い
キーワード検索は、同じ単語が入っているかを見るのが中心です。Embedding は、表現が少し違っても意味の近さで拾いやすいのが強みです。
実務で気にするポイント
- 元文書の区切り方で検索精度が変わる
- 埋め込みモデルの選択で得意分野が変わる
- ベクトル検索だけで正答とは限らない
- 評価用の質問セットを先に用意する
注意: Embedding は意味を整理しやすくする部品であって、答えそのものではありません。検索が当たっても、最終回答の確認は別に必要です。