拡散モデル（Diffusionモデル）

Diffusionモデル（拡散モデル）は、データに少しずつ「ざらざらしたもの（ノイズ）」を足していく「拡散プロセス」と、そのざらざらを少しずつ消して元のきれいなデータに戻す「逆拡散プロセス」を学ぶことで、新しいデータを生成する機械学習モデルである。

このモデルは、インクが水に広がるような自然の「拡散」の現象にヒントを得ている。学習時には、元の画像に少しずつノイズを加えて完全なノイズにする過程を学習し、生成時にはその逆のプロセスを辿ることで、ランダムなノイズから高品質な画像を生成する。

拡張モデルの仕組み

従来のGAN（敵対的生成ネットワーク）と比較して、拡散モデルは学習が安定しており、いろいろな種類の高品質な画像を作りやすい特徴がある。また、途中の段階をコントロールできるので、部分的に画像を変える、条件をつけて画像を作ることもできる。

特徴

拡散モデルが大きく注目を集めたのは、2020年にJonathan Hoジョナサン・ホーらによって発表された論文「Denoising Diffusion Probabilistic Models（DDPM）」である。この研究で、拡散モデルは画像を作る新しい強い方法として知られるようになった。

拡張モデルはデザイン分野において以下のような利用方法がある。

プロダクトデモンストレーション
新製品のプロモーション動画作成に活用できる。例えば、スマートホームデバイスの利用シーンをテキスト指示だけで複数パターン生成し、ターゲット層ごとにカスタマイズした動画を短時間で制作できる。
UXプロトタイピング
モバイルアプリのインタラクションデザインに利用可能。新機能のUIアニメーションを複数パターン生成することで、最適な動きを事前に検証できる。
コンテンツマーケティング
SNS向け短尺動画コンテンツの制作に役立つ。商品写真からショート動画を自動生成し、日々の投稿コンテンツを効率的に作成できる。テキストプロンプトを変えるだけで、異なるムードやシーンの動画も簡単に作成可能だ。
教育コンテンツ
複雑な概念の説明動画の作成に利用できる。科学的な概念や抽象的なビジネスプロセスをアニメーション動画で可視化し、静止画では伝わりにくい変化や流れを動的に表現できる。