AIによる現実の補完と改変という「偽造現実」。問われる真実

◆高画質化アプリ「Remini」がバズる

2月の半ばに「Remini」というアプリがバズった。低解質の画像を、AI を利用して高画質化してくれるアプリだ。粗い写真から鮮明な写真を生成してくれる。

このアプリを使って、ネットで有名な人物写真を高画質化する人が多くいた。顔の形が分かるものならば、かなりきれいな画像を作り出してくれる。あまりにも低解質の写真の場合は、本物とは違う顔が産み出される。

AI を利用した補完は、画像を拡大して滑らかにする処理とは違う。画像を拡大して滑らかにする処理では、拡大して粗くなった画素のあいだを埋めてきれいに繋ぐ。

推測だが「Remini」は、GAN (Generative Adversarial Networks 敵対的生成ネットワーク)を利用、あるいは応用しているのではないか。GAN は、データから特徴を学習することで、実在しないデータを生成したり、存在するデータの特徴に沿って変換できる技術だ(参照:ブルーバックス)。

こうした技術を利用した補完は、ある意味ではモンタージュ写真に近い。犯罪捜査で利用されるモンタージュ写真は、顔の特徴を思い出して、本物に近い写真を作る。AI は画像の特徴を学習しており、もっともらしい顔や人体、風景を作り出す。

そのため、あまりにも低解像度の写真の場合は、上手く再現できない。そして、学習したデータを元にした顔を提示する。欧米人の顔を学習していた場合は、ディテールの推測ができないと欧米人っぽい顔を返すことになる。

そのため、何も考えずに犯罪捜査に使えば冤罪を生む。物凄く小さな犯人の顔を AI で拡大してみたら、別人の顔が現れるといったことが起こりうる。あくまで細部の補完に留めるべきだ。

こうした AI を利用して、画像や動画を補完する技術は、近年多く見られる。今回は、そうした話について触れる。

◆「AVモザイク除去」ができるAIに業界が震撼

同じく2月半ばの記事だが、AV のモザイクが除去できる AI の話が話題になった。ビデオテープ時代に物心付いていた男性は、雑誌などでモザイク除去機の広告を見たり、噂を聞いたりしたことがあるだろう。そうした機能が、AI によって可能になったという話だ。

先ほどの高画質化アプリと同じように、隠されている部分を、学習したデータから推測する。そのため、本物の部位の画像が現れるわけではない。しかし、モザイク部分を除去したような効果がある。

アダルトと AI による画像加工の関係は、今に始まったことではない。アダルト映像の顔を、芸能人など別人のものにすげ替えるフェイクポルノというものがある。猥褻な動画に出演していない人物の動画が、多く作られて問題になっている。

仕組みはそれほど突飛なものではない。その昔、アイドルコラージュ、通称アイコラというものがあった。主に、アイドルの顔と、猥褻な画像の体を合成したものだ。印刷物を切り貼りしていた時代から存在している。また、画像編集ソフトを使い、本物と見分けが付かないレベルのものまで様々ある。

こうしたアイコラは1枚の画像を加工したものだ。フェイクポルノでは、こうした作業を動画でおこなう。動画は、1秒あたり数十枚の大量の画像で構成されている。それらを全て修正すれば、動画のアイコラができる。人手ならば大変な作業でも、AI なら文句を言わずにやってくれる。

◆捏造される現実世界

革新的な技術は、時にアダルトの分野で素早く応用される。しかし、AI による画像や動画の加工は、アダルト分野だけではない。この技術は広範にわたっており、顔をすげ替えるだけでなく、唇の同期や感情の再現、身振りの移植もおこなえる。2017年には、スピーチ音声からオバマ前大統領を CG 映像化して、口元部分を自動生成する映像がニュースになった。

政治や経済に影響がある人物が、嘘の話をする映像が拡散したとする。最終的に偽物だとばれるかもしれないが、その過程で大きな影響が出ることが予想できる。株価を大きく動かしたり、戦争の引き金になる可能性もある。

社会的に重要な人物ではなくても警戒は必要だ。家庭を不和に導く発言、恋人との破局をもたらす告白、そうした動画が作られ、標的に送られる可能性もある。

◆身近な言葉で語りかける

AIによる動画の加工は、悪用ばかりではない。善用、あるいはグレーゾーンのものもある。

2019年には、デービッド・ベッカムが、9ヶ国語を使って、マラリア撲滅を訴える動画が公開された(Malaria Must Die、実際の動画、メイキング)。世界的に影響力のある人を起用して、視聴者にとってより身近な言葉で語りかける。その効果は大きいだろう。

こうした用い方は、どこにも問題がないように見える。しかし政治の世界で利用すれば、グレーゾーンの使い方になる。今年の2月にインドの選挙で利用された例がある(参照:ITmedia NEWS)。インドは、多数の言語の人々が住むことで有名だ。そうした有権者へのメッセージを、まるで本人が、それぞれの言語の話者であるように加工して公開した。

仮に、メッセージに問題がなく、本人が同意した上での加工であったとしても、その加工により選挙の結果に影響を与える可能性がある。加工はどこまで許されるのか。そもそも日本の選挙でも、選挙ポスターの写真は、本人とは似ても似つかない大きく加工されたものだ。それらと、どれほど違いがあるのか。

AIは、現実の加工を容易にする。選挙の候補者の顔写真ひとつ取っても、その写真を見る人全員にパーソナライズした加工を施すこともできる。その人が好む芸能人の顔にわずかに似せる。見る人の人種的特徴を写真に混ぜる。そうしたことも可能になる。意思決定の手掛かりを、改変することができる。

◆加工はどこまで許されるか

写真の精細化、アダルト分野での応用、政治や経済に影響をおよぼす利用など、AI による加工について見てきた。

AI は、現実を他の形に加工するコストを劇的に下げた。そのコストはどんどん下がり、精度も上がっていくだろう。今はフェイク動画はそれほど蔓延していない。しかし、流れてくる動画のほとんどが加工されたものになればどうなるだろうか。

中国のIT大手のテンセントでは去年、自社のテンセント・ビデオで、動画の中にスポンサー企業の商品や看板を自然に合成する試みを始めた(参照:FINDERS)。AI会社Mirriadの技術で、動画を上書きして、元々撮影されていたように広告を潜り込ませる。映画内にスポンサーの商品を登場させるように、動画内に広告を登場させるのだ。

こうした技術が進めば、同じ動画でも、見る人によって内容が違うという状態になる。共通のフェイク動画に騙されるのではなく、個別のフェイク動画に誘導される未来が、そこまで来ている。