アンラーニング

学習データにはプライバシー情報、不適切なコンテンツ、あるいは著作権で保護された素材が含まれてしまうリスクが常に存在する。欧州のGDPR（一般データ保護規則）などの法制化により、ユーザーが自身のデータの削除を要求した際、速やかに消去することを企業に求められる。

従来ではAIを作り直す方法が考えられていたが、時間とコストがかかり過ぎるため、効率的にAIに「忘れさせる」技術としてアンラーニングが開発された。

語源・提唱者・普及者

2015年にYinzhi(インジ) Cao(ツァオ)とJunfengジュンフェン Yangヤンによって発表された論文「Machine Unlearning」により提唱された。彼らは、増大するデータプライバシーへの懸念、特にEUで議論が進んでいた「忘れられる権利」を技術的に実現する必要性を背景に、学習済みモデルから特定の学習データを効率的に削除するためのフレームワークを提唱した。

: Yinzhi Cao
https://www.cs.jhu.edu/

: Junfeng Yang
https://www.cs.columbia.edu/

確実に消すか、消えるように学習させるか

やり方として、「正確なアンラーニング（Exact Unlearning）」と「近似的アンラーニング（Approximate Unlearning）」の2つがある。

正確なアンラーニングとは、データを小さなグループに分割してそれぞれ別のモデルで学習させ、削除したいモデルのみを再学習するといった手法（シャーディング）である。結果は確実だが、手間とコストがかかり、AIの設計自体に制約が生まれることもあった。

近似的アンラーニングとは、情報を削除せず、情報を打ち消すような情報を再学習させる方法である。削除対象データがモデルのパラメータに与えた影響を逆算し、その影響を打ち消すような学習をさせる。こちらは非常にスピーディーだが、どこまで完璧に忘れられたかを証明しにくいという側面を持つ。

どちらの方法をとるべきかは、プロダクトが守るべきルールの厳しさ、かけられるコスト、求められる対応スピードのバランスで決まる。

画像生成AIの著作権問題

とある大手IT企業の画像生成AIの中に、アーティストの作品が無断で大量に含まれていたことが発覚し、著作権で問題になった。

企業は問題となったアーティストの作品画像とその特徴を特定し、それらのデータがモデルのどの部分（ニューラルネットワークの重み）に影響を与えたかを解析した。そして、その影響を打ち消すような逆方向の学習をモデルに適用することで、特定の画風や作品のパターンを生成する能力を選択的に「忘れさせた」。

AIの「飽き」を防ぎ、新たな出会いを

AIに一度学んだことを「忘れさせる」技術は、単に個人情報を守ったり、問題を修正したりするためだけのものではない。顧客体験を積極的に良くするためにも使える。

動画配信サービスでは、ある時期、特定のジャンルのドラマにユーザーが夢中になると、AIはそれを過剰に学習し、おすすめがそのジャンル一色になってしまう。ユーザーは「もうこの手の話は十分なのに」と感じ、サービスに魅力を感じなくなってしまう。

そこで「最近の視聴履歴をおすすめから除外する」という機能を用意し、ユーザーが選択するだけで、おすすめはリセットされ、以前の多様な好みに基づいたものや、世間で話題の作品など、新鮮な提案が再び並ぶようになる。これにより、ユーザーに「AIを自分でコントロールできる」という感覚を与え、サービスへの満足度を高めて、長く使い続けてもらえるようになる。

アンラーニング Unlearning

語源・提唱者・普及者

確実に消すか、消えるように学習させるか

画像生成AIの著作権問題

AIの「飽き」を防ぎ、新たな出会いを

関連用語

高橋祐哉

「UX用語」のカテゴリー

ツール・フレームワーク・方法論・分類

テクノロジー・技術

デザイン・情報設計

マーケティング・ビジネス

リサーチ・分析・テスト

心理学・行動経済学・脳科学

思考・マインド・バイアス

組織・ファシリテーション

語源・提唱者・普及者

確実に消すか、消えるように学習させるか

画像生成AIの著作権問題

AIの「飽き」を防ぎ、新たな出会いを

関連用語

高橋 祐哉

ツール・フレームワーク・方法論・分類

テクノロジー・技術

デザイン・情報設計

マーケティング・ビジネス

リサーチ・分析・テスト

心理学・行動経済学・脳科学

思考・マインド・バイアス

組織・ファシリテーション

高橋祐哉