テキスト、画像、音声などの非構造化データを数値ベクトルとして表現し、高次元空間で検索・比較するために設計されたデータベースである。
従来のリレーショナルデータベースやキーバリュー型データベースでは難しかった「意味的な類似性検索」を高速に実現できる点が特徴である。
とりわけ生成AI(ChatGPT)などの言語モデルにおいて、検索拡張生成(RAG)のデータの格納と検索に用いられ注目されている。
特徴
一般のデータベースは「名前」や「番号」で情報を探す、ベクトルデータベースは、高次元空間「意味が近いもの」で検索・比較することができる。
たとえば、アイスクリームを考えてみる。
- バニラ → 白い、あまい、ミルクっぽい
- チョコ → 茶色い、あまい、ちょっと苦い
- 抹茶 → 緑、少し苦い、さっぱり
それぞれのアイスを「色」「あまさ」「苦さ」「さっぱり感」などの数字の点数で表す。
すると、アイスはただの名前じゃなくて、「いろんな点数を持ったボール」みたいに表される。
この「いろんな点数のボールたち」が並んでいる世界が 高次元空間。
高次元空間で検索すると
もし「少し苦くて、さっぱりしたアイスが食べたい」と思ったら、ベクトルデータベースはその点数に近いボールを探してくれる。
そのため「抹茶」や「フルーツ系のアイス」が見つかるかもしれない。
デザイン上の利用方法と具体例
ベクトルデータベースはプロダクトやUXデザインにおいて以下のように利用できる。
-
意味検索によるUX改善
ユーザーが曖昧なキーワードを入力しても、ベクトルデータベースにより「意味的に近い情報」を提示できる。例として、ECサイトにおいて「涼しい靴」と検索した際に、「通気性の良いスニーカー」や「夏用サンダル」を推薦できる。 -
パーソナライズド体験
ユーザーの閲覧履歴や嗜好をベクトル化し、類似ユーザーや関連アイテムを高速に推薦することで、より精度の高いパーソナライズを実現できる。 -
マルチモーダル検索
テキストで「赤い丸い椅子」と入力した際に、画像データベースから該当するプロダクト写真を検索できる。これにより、ビジュアル中心のUIを持つアプリケーションに直感的な検索体験を組み込める。
提唱者
ベクトルデータベースという概念に明確な「単一の提唱者」は存在しない。これはAI研究の発展とともに徐々に体系化された技術である。ただし、初期の大規模実用化に貢献した企業や人物として以下が挙げられる。
- Pinecone(Edan Zajdenverg 氏が創業)
- Milvus(Zilliz 社、創業者 Charles Xie 氏)
- Weaviate(Bob van Luijt 氏が共同創業)
プロダクト・コンテンツデザインでの活用シーンと事例
この場面に使える
- ナレッジ検索: 社内WikiやFAQをベクトルデータベース化し、自然言語で問い合わせると最適な回答が得られる。
- ユーザーサポート: サポートチャットでFAQの類似事例を引き当て、回答を自動補完する。
- デザインアーカイブ: 過去のデザインファイルやモックアップを意味的に検索し、類似UIを素早く探す。
具体例
- Notion が「AIアシスタント」でベクトル検索を活用し、ノート間の関連情報を提示する。
- Shopify が商品の特徴ベクトルを活用して「関連商品推薦」を実現している。
- Figma のコミュニティ素材検索に意味検索を導入し、キーワードに依存しない探索体験を提供している。