グーグルの人工知能、今度は「モザイク画像の被写体を特定」する

グーグルの研究チームは、人間には何が写っているかほとんど認識できないような人の顔や部屋を写した低解像度の画像から、元の画像を推測・再現する人工知能システムを開発した。防犯などに応用できる可能性がある。
グーグルの人工知能、今度は「モザイク画像の被写体を特定」する
右は元画像。左は低解像度の画像。中央は、AIが低解像度の画像から何が写っているかを推測・再現した画像。IMAGE COURTESY OF GOOGLE BRAIN

グーグルが開発した2種類の人工知能(AI)は、ピクセルの粗い低画質の画像から、かなり鮮明な元の写真を再現することができる。

グーグルのAI開発チーム「Google Brain」のコンピューター科学者たちは、今回の研究成果で、写真の解像度を上げられるだけでなく、その処理中に「欠けている細部」を埋められることも示した。研究論文「Pixel Recursive Super Resolution」によると、グーグルの研究者たちは、有名人の顔写真や寝室の写真を使ってシステムをトレーニングしたという。

このシステムでは、「conditioning network」と「prior network」という2種類のニューラルネットワークを組み合わせて画像を解析し、8×8ピクセルという低画質画像から、32×32ピクセルの高解像度ヴァージョンを生成している。これによって、人間にはほとんど認識できない不鮮明な写真を、人や部屋をはっきり表す画像に変換できる。

このAIシステムでは、2段階のアプローチを採用している。まずconditioning networkは、低解像度画像を任意の高解像度画像と比較することで、そこに写っているのが顔なのか部屋なのかを判断する。大きな画像を8×8ピクセルサイズに縮小することで、両者を比較することが可能になると研究者たちは説明する。

次に「PixelCNN」(CNN:畳み込みニューラルネットワーク)を使用するprior networkが、8×8画像にピクセルを追加する。『Are Technica』UK版の記事によると、PixelCNNは既知の画像を利用して細部を追加するという。たとえば、唇はピンクであることが多いので、唇だと判断された領域にはピンクのピクセルを追加するという具合だ。

それぞれのニューラルネットワークの処理が終わると、グーグルの研究者たちがその結果を組み合わせて最終画像を生成する。「顔の典型的なヴァリエーションを前もって学習することで、AIは細部をリアルに描画することができる」と研究者たちは書いている。

今後さらに研究が進めば、低解像度の写真や動画に映っているものを再現できるようなシステムが開発されるだろう。防犯カメラの不鮮明な映像に映っているものを特定するために、こうした技術が役立つかもしれない。


RELATED ARTICLES

TEXT BY MATT BURGESS

TRANSLATION BY MIHO AMANO, HIROKO GOHARA/GALILEO