こんにちは!綾鳥みおです。
最近「生成AI」って言葉を聞かない日はありませんよね。
「ChatGPT(LLM)」で文章を作ったり、「Stable Diffusion」や「Midjourney」で綺麗なイラストを描いたり……。でも、今のAIブームが本格的に始まるずっと前から、密かに、でも力強く私たちの生活を支えてきた「GAN(ガン)」という技術があるのをご存知ですか?
今日は、ちょっとマニアックに見えて、実はめちゃくちゃ身近な「GAN(敵対的生成ネットワーク)」について、どこよりも分かりやすく解説します!
1. GANを一言で言うと「2人のプロの化かし合い」
GANは英語で Generative Adversarial Network と言います。日本語に訳すと「敵対的生成ネットワーク」。……漢字が多くてちょっと難しそうですよね。
これをめちゃくちゃ簡単に例えるなら、「偽札職人」と「鑑定士」の真剣勝負です。
GANの中には、2人のAIが住んでいます。
- 1人目:ジェネレーター(生成器=偽札職人)本物そっくりの画像(データ)を作って、鑑定士を騙そうとします。最初はめちゃくちゃ下手ですが、何度も練習します。
- 2人目:ディスクリミネーター(識別器=鑑定士)送られてきた画像が「本物の写真」か、それとも「職人が作った偽物」かを見破ろうとします。
この2人が「騙してやる!」「いや、見破ってやる!」と切磋琢磨することで、最終的に人間が見ても本物と区別がつかないほどの、超リアルな画像が生み出されるようになるんです。これが「敵対的(アドバーサリアル)」と呼ばれる理由です!
2. なぜ今「GAN」を知っておくべきなの?
「最近はDiffusion(拡散モデル)の方が流行ってるんじゃない?」と思ったあなた、鋭いです!
確かに、今のイラスト生成ブームの主役はDiffusion modelsです。でも、GANには「GANにしかできない得意技」があるんです。
それは、「今あるものを、リアルに加工する力」です。
皆さんのスマホに入っている写真アプリで、「笑顔にする」「若返らせる」「白黒写真をカラーにする」なんて機能はありませんか? 実はあの裏側で動いているのは、多くの場合このGANなんです。
3. 私たちの生活を変えているGANの活躍シーン
GANは「裏方の職人」として、いろんな場所で働いています。
- 実在しないモデルさんの誕生最近の広告やファッションカタログには、実在しない「AIモデル」が登場しています。GANを使えば、肖像権の心配がない「完璧なモデル」を生成できるんです。
- 「あの頃」を蘇らせる高画質化(超解像)10年前のガラケーで撮ったボケボケの写真や、おじいちゃんの代の古い写真。これを最新のデジカメで撮ったかのようにクッキリさせる「Remini」などのアプリも、GANの得意分野です。
- 医療の世界での「データの水増し」珍しい病気のレントゲン写真は数が少なくて、AIの学習が難しいんです。そこでGANが「本物そっくりの症例画像」を作って、診断AIのトレーニングを手伝っています。これって、でったん凄いことじゃないですか?
4. GANの弱点と、これからの未来
もちろん、GANも完璧ではありません。
職人(生成器)が「この顔なら100%騙せるぞ!」という1パターンに固執してしまう「モード崩壊」という現象が起きたり、学習がすごく難しかったりする一面もあります。
でも、最近では最初に見た産総研さんのスライドのように、「量子コンピューティング」と組み合わせることで、今まで何日もかかっていた計算を爆速にする研究も進んでいます。
もし計算コストがほぼゼロになったら……?
私たちが鏡を見るように、リアルタイムで自分の姿を好きなキャラに変身させて会話できる、そんな未来がすぐそこまで来ているかもしれません。
まとめ:GANは「リアリティ」を追求する情熱の塊
「生成AI」と一言で言っても、言葉が得意な子(LLM)、想像力が豊かな子(Diffusion)、そしてリアリティを極める職人(GAN)。みんな違って、みんな良いんです!
次に写真アプリで自撮りを加工したときは、ぜひ「あ、今私の裏側で、偽札職人と鑑定士が戦ってるんだな……」と思い出してみてくださいね(笑)。
みおからの問いかけ
皆さんは、もしGANを使って「自分だけの完璧な何か」を作れるとしたら、何を作ってみたいですか?
「昔飼っていたペットとの新しい写真」? それとも「理想の自分」?
よかったらコメントで教えてくださいね!
あなたの「学びたい」を、これからも全力で応援します!ですです!