トップページへ戻る

ニュース

HOME > ニュース > Gadgetニュース

公開日 2024/04/04 14:47
オーディオクリップを生成に使う場合は著作権に注意

Stability AI、CD音質で3分間の曲を生成できる「Stable Audio 2.0」発表

Munenori Taniguchi
Stability AIは、同社のAI音楽生成プラットフォームをアップグレードした「Stable Audio 2.0」を発表した。このツールは無料で、同社のウェブサイトで一般公開されている。

このAIは、ユーザーが楽曲をイメージする文章を入力することで、最大3分のオーディオデータを生成できる。前バージョンは最大90秒だった。

3分というのは一般的なシングル曲に多い時間であり、イントロ、ヴァース(Aメロ)、プリコーラス(Bメロ)、コーラス(サビ)、ブリッジ(Cメロ)、そしてアウトロと、完全な構成の楽曲を作れる長さと言えそうだ。

楽曲の生成はテキストプロンプトで行うが、ユーザーが用意したオーディオクリップをアップロードすることも可能だ。システムはこのクリップを分析して似たような調子の楽曲を生成できる。

ただし、アップロードするクリップは著作権に関してクリアでなければならないので注意が必要。オーディオをアップロードするなら、たとえばドラムのパートを口ずさんだものをドラムの音に “清書” したり、十数秒ほどの短い著作権フリーなクリップをもとに時間を延長した楽曲を作るのに良いかもしれない。ちなみにStable Audio 2.0そのものは、ストックオーディオサービス「AudioSparx」のライブラリからライセンスを取得したデータセットのみを使用してトレーニングされている。

Stable Audio 2.0を使ってできあがる楽曲は、最初はクールに思えるかもしれないが、何度も生成していくと、少々気になるところも出てきそうだ。たとえば、このシステムはボーカルパートを追加することができるが、ボーカルに聞こえるだけで人が理解できる言語ではない。クジラの鳴き声のように聞こえる場合もあるようだ。

また、出力された楽曲では、その中で特定のパートが消えたり、別のものに変わってしまったりすることもあるとEngadgetは伝えている。それは、AI生成画像における人物の指や歯がやたらと多かったり、あるはずの部分がなかったりするようなものに例えられるかもしれない。

最大3分とはいっても、おそらくまだAIが生成する楽曲は、生身の作曲家が感情や心の中の情景を反映させて作り上げる作品にはほど遠そうだ。このAI音楽生成プラットフォームに適する使い道としては、ビデオクリップを多少賑やかにするための、当たり障りのないBGMなどになるのかもしれない。

Source: Stability AI, Stable Audio
via: Engadget

新着クローズアップ

クローズアップ

アクセスランキング RANKING
1 “レコードブーム”はもはや死語。人気が定着し、カートリッジがプレーヤーの売上を上回る事態も<販売店の声・売れ筋ランキング5月>
2 オーディオマニアの欲望を凝縮、秋葉原の専門ショップ「オーディオみじんこ」。オタクの“聖地”を炭山アキラ氏が探訪!
3 この高画質、まさに「レグザクオリティ」。“映える”小型4Kプロジェクター「RLC-V5R-S」徹底レビュー
4 <HIGH END>B&W「801 D5」、山之内正氏の速報インプレッション。「卓越したベースの音色に本質的進化を感じる」
5 パナソニック旗艦4Kテレビ「Z95C」視聴レビュー! 評論家が「傑作」と高評価する理由とは?
6 「ヨドバシカメラ マルチメディア池袋」6/30 9時半オープン。圧巻の品揃えと体験・体感を重視した売り場を一足先にお披露目
7 新旧切り替え期の液晶テレビ1位はソニー「K-55XR70」。後継にRGB Mini LED搭載機<ビジュアル&関連製品売れ筋ランキング5月>
8 オープンイヤーへの理解度が半端ない!Shokz「OpenDots 2」は音質も着け心地もパワーアップ
9 専門店で今“売れている”“注目されている”オーディオアクセサリー<売れ筋ランキング5月 番外編>
10 “ゴジラ”も唸る低域再生力。リビングユースにもGood、トライアングルのアクティブスピーカー「Borea BR03 Connect」
6/30 11:42 更新

WEB