ゼロショット学習(Zero-shot Learning)
ゼロショット学習とは、AIが学習時に見たことのないタスクやカテゴリを、追加の学習なしで遂行できる能力を指す。大規模言語モデルや画像認識モデルにおいて、事前に多様なデータで学習しておくことで、未知のタスクにも一般化して対応できる。
例:
- 「ペンギンを分類してください」と指示されたとき、学習時に「ペンギン画像」を見ていなくても、言語や概念の知識を使って正しく推定する。
- ChatGPTに「フランス語で詩を書いて」と依頼しても、特定の「フランス語詩データ」を学習していなくても実行できる。
ワンショット学習(One-shot Learning)
ワンショット学習とは、ごく少量の例(通常は1つ)を与えるだけで、新しいタスクやカテゴリを学習し、実行できる能力を指す。人間の学習に近く、限られた情報からパターンを推測できる点が特徴である。
例:
- AIに「新しい商品のロゴ画像」を1枚見せて「このロゴを含む広告を分類せよ」と指示すると、わずか1枚のサンプルから学習してタスクを実行できる。
- ユーザーがアプリに自分の手書きサインを1度だけ入力すると、それを基準に本人確認が可能になる。
提唱者
- ゼロショット学習とワンショット学習は、特定の1人の提唱者によるものではなく、機械学習・自然言語処理・画像認識の研究領域で段階的に発展してきた概念である。
- 特に「ワンショット学習」は、2015年にGoogle DeepMind(現Google DeepMind)の研究者 Oriol Vinyals らが発表した論文「Matching Networks for One Shot Learning」により広く知られるようになった。
- 「ゼロショット学習」は2010年代からNLPやCVの研究で使われ始め、OpenAIやGoogleなどの大規模モデル開発で注目を浴びた。
デザイン上の利用方法
未知のユーザー入力や新しいサービス領域に対して、柔軟に応答できるUI設計を実現できる。ユーザーが想定外の質問をしても対応できる。
-
ユーザー負担の軽減
ゼロショット・ワンショットを活用すれば、ユーザーが大量のデータを入力する必要がなくなる。これはUX設計において「学習コストの低さ」として価値がある。 -
カスタマイズ可能なUI
ユーザーが一度操作例を示すだけで、システムがパターンを学び次回以降の操作を自動化する仕組みを設計できる。 -
多言語・異文化対応
ゼロショット学習を使えば、未対応の言語や表現にもシステムが柔軟に反応でき、国際的なユーザー体験を向上させられる。
具体事例
たとえば、FAQチャットボットにおいて、登録されていない新しい質問が出たときでも、ゼロショット推論で回答を生成することができる。これにより顧客体験が向上する。以下に他の例も示す。
-
翻訳アプリ(ゼロショット)
新しい言語ペア(例:日本語⇄スワヒリ語)を直接学習していなくても、既知の言語知識をもとに翻訳を実現できる。 -
カスタマーサポートAI(ワンショット)
ユーザー企業ごとに異なるFAQを、わずか1件のサンプルを与えるだけで新しいカテゴリとして分類可能。 -
デザイン支援ツール(ワンショット)
ユーザーが1つのアイコンデザインをアップロードすると、そのテイストに基づいたバリエーションを自動生成する。
プロダクトやコンテンツデザインでの具体例
-
UIテストの自動化
ユーザーが1度クリックフローを実演すれば、そのパターンをワンショットで学び、他のテストケースを自動生成する。 -
パーソナライズされた学習アプリ
学習者が1問解答しただけで、その解答傾向をワンショット学習により推定し、適切な次の問題を提示する。 -
新規サービスのオンボーディング
ゼロショットを活用し、説明を最小限にしてもAIが文脈を推測し、ユーザーをスムーズに導く体験を作れる。
AI関連用語
- ディープラーニング → モデルを「最初から学習」する
- RAG→ モデルに「外部知識」をつなげる
- トランスファーラーニング → 既存の知識を「別の分野に転用」する
- プロンプトエンジニアリング → 「入力の工夫」で性能を引き出す
- インコンテキストラーニング → 「その場の例」で一時的に学ぶ
- ナレッジディスティレーション → 大きなモデルを「小さなモデルに縮小」する
- ゼロショット/ワンショット → 「少ない例で推論」する