Embedding

Embedding は、文章や単語の意味の近さを数値ベクトルで表す仕組みです。

Embedding のアイキャッチ図解
まずは、こう考えるとつかみやすいです。

書類の内容を見て、意味の近いものほど近い棚番号に置けるようにする整理ラベルのようなものです。

ひとことで言うと

Embedding は、文章の意味を検索しやすい数値表現に変えるための仕組みです。似た内容ほど近い位置に並べやすくなります。

どんな場面で使うか

  • 社内文書検索の精度を上げたい時
  • RAG 用に関連文書を探したい時
  • 類似FAQを自動で見つけたい時
  • タグ付け前のざっくり分類をしたい時

キーワード検索との違い

キーワード検索は、同じ単語が入っているかを見るのが中心です。Embedding は、表現が少し違っても意味の近さで拾いやすいのが強みです。

実務で気にするポイント

  • 元文書の区切り方で検索精度が変わる
  • 埋め込みモデルの選択で得意分野が変わる
  • ベクトル検索だけで正答とは限らない
  • 評価用の質問セットを先に用意する

注意: Embedding は意味を整理しやすくする部品であって、答えそのものではありません。検索が当たっても、最終回答の確認は別に必要です。