ガジェット 公開日 2022/12/19 16:41

入力テキストを音楽にするAI「Riffusion」公開。文字を画像化し音に変換

音を絵で表すスペクトログラムを学習
Gadget Gate
Munenori Taniguchi
  • Twitter
  • FaceBook
  • LINE
音楽を生成するAIというのはすでに何種類か存在するが、Seth Forsgren氏とHayk Martiros氏が趣味のプロジェクトとして開発した「Riffusion」は、テキストの構文をもとに音の視覚的な表現であるスペクトログラムを作成し、それをオーディオとして再生するという、一風変わったAIモデルだ。

テキスト入力で画像を生成するAIとしては、拡散モデルを使った「DALL・E 2」が少し前に話題になった。そのDALL・E 2と同じ種類の「Stable Diffusion 1.5」が、この音楽生成AIのベースとなっている。

音を画像で表現するスペクトログラムは、X 軸で時間、Y 軸で音の周波数を表し、色で音の振幅を表現する。ForsgrenとMartirosは、サウンドを表現するスペクトログラムのサンプルを大量に作成し、その画像にblues guitar、jazz piano、afrobeatなどといった、関連する音楽を示すワードを紐付けた。

そして、これを使ってAIモデルをトレーニングすることで、ある音が「どのようなものか」「どのように再現したり組み合わせられるか」などといったことが次第にわかり、スペクトログラムと拡散モデルによって、音色を他の音色に変えるようなことも可能になったという。

Riffusionのウェブページでは、画面の左側に、入力されたテキストによって生成されたスペクトログラムが連続して表示され、それをもとにしたオーディオをリアルタイムで再生するようになっている。音楽スタイルを組み合わせてこれまでにない音楽ジャンルを生み出すことも可能だ。

ただ、自分で入力したテキストでは思ったような音楽が出力されないこともある。そのときは、テキスト入力窓の左にあるサイコロのアイコンをクリックすれば、プリセットされた構文が表示されるのでこれを実行してみると良いだろう。きっと、ああなるほどな、と思える音楽が再生できるはずだ。

Forsgren氏は「Haykと私は単に音楽が好きなもの同士というだけだったので、Stable DiffusionというAIがオーディオに変換できるほど、ちゃんとしたスペクトログラムを生成できるのかもわからなかった」とTechCrunchに述べ「ひとつのアイデアが次のアイデアへと次々につながっていった」結果、Riffusionができあがったとしている。

音楽生成AIモデルはRiffusionが初めてというわけではない。少し前にはロンドンのAIスタートアップHarmonaiが、やはりStable Diffusionをベースに拡散モデルを使った「Dance Diffusion」なる音楽生成AIを公開している。また仕組みは違うが、2020年にはOpenAIが、ニューラルネットワークで音楽を生成する「Jukebox」を発表していた。さらにノンストップで音楽を生成するSoundrawのようなサービスもすでに存在する。

RiffusionはこれらのAIに比べると、もっとホビーの領域にあるものであり、生成される音楽もまだまだリスニング用途に耐えるものではない。それでも潜在拡散モデルの応用例としては、注目を集めそうだ。

Source: Riffusion
via: Ars Technica

この記事をシェアする

  • Twitter
  • FaceBook
  • LINE

トピック

クローズアップCLOSEUP
アクセスランキング RANKING
1 レコードの音楽を読み取って光るターンテーブル。オーディオテクニカ「Hotaru」一般販売スタート
2 ダイソンとPORTERがコラボした特別デザインのヘッドホンとショルダーバッグ。全世界380セット限定販売
3 LUMINの進化は終わらない。初のディスクリートDAC搭載「X2」の思想を開発担当者に訊く!
4 Spotif、2025年に最も聴かれた邦楽は「ライラック」。国内外で最も聴かれた楽曲・アーティストの年間ランキング発表
5 DUNU、7ドライバー/トライブリッド構成を採用したイヤホン「DN 142」
6 カセットテープとともに過ごすカフェ「CASSE」。12/17渋谷でグランドオープン
7 Vento、3次元特殊メッシュを採用したハイブリッド拡散パネル「DAP180 / DAP120」
8 AVIOT、最大120時間再生と小型軽量を両立したオンイヤー型Bluetoothヘッドホン「WA-G1」
9 サンワサプライ、省スペース設置できる木製キャビネットのサウンドバー「400-SP120」
10 アイレックス、ALBEDO/AUDIAブランド製品の価格改定を発表。2026年1月1日より
12/5 10:47 更新
音元出版の雑誌
オーディオアクセサリー199号
季刊・オーディオアクセサリー
最新号
Vol.199
世界のオーディオアクセサリーブランド大全2025
特別増刊
世界のオーディオアクセサリーブランド大全2025
最新号
プレミアムヘッドホンガイドマガジン vol.23 2025冬
別冊・プレミアムヘッドホンガイドマガジン
最新号
Vol.23
プレミアムヘッドホンガイド Vol.33 2025 SUMMER
プレミアムヘッドホンガイド
(フリーマガジン)
最新号
Vol.33(電子版)
VGP受賞製品お買い物ガイド 2025年冬版
VGP受賞製品お買い物ガイド
(フリーマガジン)
最新号
2025年夏版(電子版)
DGPイメージングアワード2024受賞製品お買い物ガイド(2024年冬版)
DGPイメージングアワード受賞製品お買い物ガイド
(フリーマガジン)
最新号
2025年冬版(電子版)
WEB
  • PHILE WEB
  • PHILE WEB AUDIO
  • PHILE WEB BUSINESS
  • プレミアムヘッドホンガイド
  • ホームシアターCHANNEL
  • デジカメCHANNEL
AWARD
  • VGP
  • DGPイメージングアワード
  • DGPモバイルアワード
  • AEX
  • AA AWARD
  • ANALOG GPX