公開日 2022/05/25 18:43

Google、文章から高精度画像を生成するAI「Imagen」。ポルノなどへの悪用考え一般公開せず【Gadget Gate】

「革ジャンで自転車に乗ったパンダ」も画像化
Munenori Taniguchi
  • Twitter
  • FaceBook
  • LINE
Google Researchが、入力された文章から詳細な画像を生成する人工知能システム「Imagen」を開発、プレプリント論文サイト「arXiv」に発表した。

フルネームを「Imagen diffusion model」と称するこのAIシステムは、Google ResearchのBrain Teamが開発したもので、チームいわく「これまでにないフォトリアリズムな描写力と、レベルの深い言語理解能力」を備えるとのこと。

Imagenは、たとえば「自転車に乗っている犬」や「オリンピックの400mバタフライで泳ぐテディベア」といったテキストを受け取り、それを解釈して対応する画像を生成する。画像生成AIは与えられた情報を元に、純粋なノイズ画像を開始点として徐々に変更を加えて、最終的にそれ以上「自転車に乗っている犬」にすることができないと判断できるレベルまで洗練させる。この仕組みにより、これまでの画像生成AIにあった、最初の推測段階で画像化の方向性を間違えてしまうことを防止しているわけだ。もちろん言語解釈能力の向上も図られている。

Image : Imagen(Google)

イーロン・マスクが共同設立した、人工知能を研究する非営利団体OpenAIもまた、テキストを解釈して画像化するAIとして「DALL-E」を開発し、一時話題になった。GoogleはImagenについて、「DALL-E 2」やRyan Moulton氏が開発する「VQ-GAN+CLIP」などといった他のテキスト画像化AIより高い能力を持たせるべく研究を行った。

まず、各テキスト画像化AIシステムを比較可能にするため、Googleのチームは「DrawBench」と称するベンチマークを作成した。これは簡単に言えば、各AIに入力される大量のテキストのリストで、そのテキストから各AIが出力した画像を人間が比較評価している。Googleは、これを用いて「出力したサンプルの品質、画像とテキストへの整合性の両方を横並びで比較したところ、Imagenの出力した画像の評価が高かった」と述べている。

Googleによる独自のテストなので、主観的な面もあるかもしれないものの、これまで他の画像生成AIに比べ抜きん出た性能だと見なされてきた、DALL-E 2の知覚品質と同等であるとの評価はかなり印象的だ。

ただ、GoogleはImagenを一般の誰でも利用できるようにはしていない。これはOpenAIが、DALL-E 2の将来の製品化を見据え、不適切とされる画像データをあらかじめ取り除いたデータセットを用いてAIを鍛えているのに対し、Googleはあえてそれらを含むデータセットを用いたためだ。つまり、DALL-E 2は誰が見ても安全な画像しか生成しないが、Imagenは場合によっては「職場閲覧注意」のラベル付けをしなければならないような画像も描き出す可能性があるということだ。また、生み出された画像がリベンジポルノや、誤った情報の拡散に悪用されないとも限らない。

GoogleはImagenのウェブサイトで、「テキストから画像への変換モデルのデータ要件から、研究者は大規模でほとんどがキュレーションされていない、ウェブからスクレイピングされたデータセットに大きく依存してきた」と述べ、実際ポルノ画像や、人種差別的であったりなど、社会的に有害な、不適切なコンテンツを含むLAION-400Mデータセットも使用したとしている。そして、「大規模言語モデルは、社会的バイアスなどをそのまま受け継ぎ、有害なステレオタイプや表現を生み出す可能性があるため、安全対策を講じない限りは、Imagenを一般利用のために公開しないという判断をした」と述べている。

とはいえチームは、いつかは一般の人々も自由にテキストを入力し、Imagenを利用できるようにしたいと考えているようだ。「今後はオープンアクセスにおけるリスクに対してバランスをとり、責任ある外部化のための枠組みを模索する」としている。記事執筆時点では、Imagenはウェブサイトで限られた文言の組み合わせを選んで、どのような画像が生成されるかを確認できるようにしている。油絵風または写真風、動物の種類、着用している衣服、行動の種類、背景の場面などを選ぶことができるので、作った文章からどんな画像が生成されるのか、ご興味があるなら一度試してみると良いかもしれない。

Image : Imagen(Google)

Source:arXiv.org
via:Imagen, Engadget



※テック/ガジェット系メディア「Gadget Gate」を近日中にローンチ予定です。本稿は、そのプレバージョンの記事として掲載しています。

この記事をシェアする

  • Twitter
  • FaceBook
  • LINE

トピック

クローズアップCLOSEUP
アクセスランキング RANKING
1 オーディオ銘機賞「ベストバリュー大賞」受賞! DALIの技術と美学を凝縮した「KUPID」の実力に迫る
2 “スイング式”インシュレーターに薄型モデルが登場!セレニティ 静寂-Shijima-の「SWI-10」使いこなしレポート
3 トップクラスのながら聴きイヤホンにさらなる機能性がプラス!Shokz「OpenFit 2+」レビュー
4 <ポタフェス>SHANLING、水月雨監修のポータブルCDプレーヤー「Crossover」世界初公開/ONIX、超小型DAC「Tocata XM2」初展示
5 <ポタフェス>見た目も音もこだわった、HiBy Digitalの「初音ミク」コラボアイテム展示/FAudio「Major」に後継機か
6 大好きな車とバイクを眺める6畳空間に、4K/100型のホームシアターを実現
7 SHANLING、サブミニチュア真空管をデュアル搭載したポータブルDAC/アンプ「UA7」
8 Oriolus、落ち着いた音色と現代的な機能性を両立したBluetoothアンプ「1795MKII」
9 ピクセラ、テレビを見るとポイントが貯まるワイヤレスチューナー「ポイテレ」
10 <ポタフェス>オーディオテクニカ、フラグシップ機「ATH-ADX7000」「ATH-TWX9M2」を堪能
12/15 11:02 更新
音元出版の雑誌
オーディオアクセサリー199号
季刊・オーディオアクセサリー
最新号
Vol.199
世界のオーディオアクセサリーブランド大全2025
特別増刊
世界のオーディオアクセサリーブランド大全2025
最新号
プレミアムヘッドホンガイドマガジン vol.23 2025冬
別冊・プレミアムヘッドホンガイドマガジン
最新号
Vol.23
プレミアムヘッドホンガイド Vol.33 2025 SUMMER
プレミアムヘッドホンガイド
(フリーマガジン)
最新号
Vol.33(電子版)
VGP受賞製品お買い物ガイド 2025年冬版
VGP受賞製品お買い物ガイド
(フリーマガジン)
最新号
2025年夏版(電子版)
DGPイメージングアワード2024受賞製品お買い物ガイド(2024年冬版)
DGPイメージングアワード受賞製品お買い物ガイド
(フリーマガジン)
最新号
2025年冬版(電子版)
WEB
  • PHILE WEB
  • PHILE WEB AUDIO
  • PHILE WEB BUSINESS
  • プレミアムヘッドホンガイド
  • ホームシアターCHANNEL
  • デジカメCHANNEL
AWARD
  • VGP
  • DGPイメージングアワード
  • DGPモバイルアワード
  • AEX
  • AA AWARD
  • ANALOG GPX