画像認識から動画生成へ…劇的に進化する視覚分野でのAI活用

架空の写真がAIにより作成可能に

人工知能(AI)が高いパフォーマンスを発揮する分野のひとつに「画像認識」がある。ここ数年話題が尽きないディープラーニングも、そもそもは画像認識の実証実験で成果を出していたことから注目を集め始めた。

こうしたなか、最近では画像認識だけではなく「画像生成」の分野でも、人工知能を応用する動きが始まっている。これは、人間の手によって撮影・作成・描写されなくとも、機械が過去のデータから新しいイメージを自動的に生み出す、もしくは補完するというものだ。

2016年4月には、17世紀に活躍したバロック絵画の大家・レンブラントの作風をAIによって再現しようというプロジェクト「The Next Rembrandt」の作品が公開された。プロジェクトの担い手は、マイクロソフトやレンブラント博物館、オランダのデルフト工科大学などだ。AIによって、まるで本物そっくりに生み出された一連の絵画に対し、世界中から驚きの声が挙がったのは記憶に新しい。

なお、AIの演算処理に使われるGPU開発で有名な半導体メーカー・NVIDIAも、2017年4月に画像生成に関する技術論文を発表している。これは、海外有名人の写真データから、目・鼻立ち、背景、色などの情報を取得し、学習した背景ぼかしを入れて構図を変更するというもの。まったく新しい、架空の“写真”を作成することが可能になったのだ。

このように、人工知能を使った「画像認識」や「画像生成」はすでに実証段階を終え、実用化の段階に進もうとしている。ポピュラーなもので言えば、Googleの画像検索や、各SNSにおけるタグ付け、もしくはイラスト作成ソフトなどが例に挙げられるだろう。

「フォトショップ」などで有名なAdobeの動きにも注目したい。同社は2017年10月に行われたクリエイター向けイベント「Adobe MAX」で、「AIを使った11の新技術」を発表している。そこでは、白黒画像をカラーに色付けする「PROJECTSCRIBBLER」、ユーザーの手書き画像から自社データベースを検索し類似した3D画像を見つける「PROJECTQUICK3D」などが公開された。いずれもディープラーニングが使用されており、画像認識や画像生成の原理を応用したものと言える。

防犯分野で活用される動画認識技術

今後、人工知能の応用が期待されているのは、「止まった画像=静止画」の領域だけではない。「動く画像=動画」の認識・生成分野においてもイノベーションが期待されている。

AIが動画を高度なレベルで認識できるようになると何が起こるか。まず考えられるのは、「防犯カメラ」などへの適用だろう。AIで対象物やその行動を正確に把握できれば、犯罪や事故の抑止力を高めることができる。また警備業界では、監視カメラや周辺システムの「誤検知」により、担当スタッフが無駄に現地まで赴かなければならないという状況があると言われている。しっかりとした検知が可能となれば、無駄な作業を削減することができる。特に日本の警備業界は、他の業界の例にもれず働き手不足が深刻だ。人的リソースの有効活用も期待されている。

実際に韓国や中国では、政府や警察当局が主導してAIを搭載した防犯カメラおよび犯罪抑止システムの開発が進められている。特に中国のAI犯罪者追跡システム「天網」は世界的にも有名で、カメラに映った対象物やその動きを、隅々まで正確に検知すると言われている。

一方で、ウェブサイトなどにUPされた違法動画を摘発するのにも、動画を認識するAIは応用されること間違いない。犯罪と関連した動画はもちろん、著作権保護に繋がるようなテクノロジーとしてブラッシュアップされれば、コンテンツ産業に与えるインパクトも計り知れないだろう。

動画を一から生み出すAI

AIが画像生成の分野で成果を出し始めているということは前述した通りだが、動画を生成する分野においても、徐々に応用例が報告され始めている。最近、特に話題になっているのが、現実には存在しない動画、つまり「フェイク動画」を生み出すAIだ。同時にその生成を担うAIテクノロジーとして、「敵対的生成ネットワーク(Generative Adversarial Network=GAN)」が脚光を浴びている。GANは、現在グーグル・リサーチに籍を置く科学者のIan Goodfellow氏が生み出したモデルで、「教師なし学習(unsupervised learning)」のひとつとして注目を浴びている。

2017年7月には、このGANを利用して、米ワシントン大学の研究者チームがオバマ前大統領の「偽スピーチ動画」を発表している。この3か月後、GANによって生み出されたフェイク動画がツイッター上で出回り、すでにその手法が出回っていることが確認された。AIを使った動画生成はもはや不可能ではなく、今後、一般的なシーンでも広がっていく可能性が明らかになったのだ。例えばIT市場調査企業・ガートナーは、2017年10月に米フロリダ州で開催されたシンポジウムで、「2020年までにAIを使った偽コンテンツが配布される」との予測し、警鐘を鳴らしている。

フェイク動画というネーミングには少々、ネガティブな響きがあるが、AIによる動画生成が実現すれば、ビジネス的なチャンスにもなりうる。ほんの一例で言えば、自分の分身、つまり「アバター」がより現実的に生み出されることになり、人々の活動の幅が広がっていく。例えば医者が遠隔医療を行う場合、遠く離れた患者の前に合成された医者の映像を映し出すことで、目の前で診断しているような感覚を患者に感じてもらうことができるかもしれない。また外見上コンプレックスを抱いた人が、人前に出たくない場合でも、合成された自身のアバターを用いて他者とコミュニケーションをとることも可能だ。

AIによる動画生成が普及するメリットは、現時点では想像しきれない。今後、それらAI技術を取り入れた新しいビジネスが数多く生まれてくることに期待したい。