Metaは音楽生成LM「MusicGen」を発表しました。このオープンソースなライブラリ「Audiocraft」を使用することで、テキストプロンプトを入力するだけで音楽を生成できます。さらに、mp3形式のメロディデータも追加可能です。MusicGenはGoogleの「Transformer」モデルをベースにしており、セマンティック表現を必要とせず、自己教師型の音楽生成モデルです。高品質な音楽トラックのデータセットやライセンス音楽を用いたトレーニングを行いました。Audiocraftのインストールには16GBのメモリを備えたGPU、Python 3.9、PyTorch 2.0.0が必要です。HuggingFace Spaceでのデモも公開されており、具体的な要件を指定することで独自の音楽が生成できます。モデルのパラメータのサイズによって音楽の品質が異なりますが、15億パラメータのモデルが最も高く評価されました(論文より)。
Bing AIの情報
「MusicGen」は、Metaによって発表された人工知能(AI)音楽生成システムです。テキストプロンプトやメロディーを使用して調整できます。これはGoogleの MusicLM に似ており、口笛を吹いたり、ハミングしたり、歌ったり、楽器で演奏したりする既存のメロディーを基にして生成することができます。MusicGenはオープンソース化されており、テキストによる説明入力(例えば、バックグラウンドで重いドラムとシンセ パッドを使用した80年代のドライブ用のポップソング)すると約12秒のオーディオが生成されます。さらに、MusicGenでは既存の曲からメロディーの候補となる音源を参照することが可能で、テキストによる入力と合わせて出力することができます。
音楽生成AIは他にもたくさんあります。例えば、SOUNDRAWは、AIが作る著作権フリーの音楽を提供するサービスです。ムード、ジャンル、長さを選ぶだけで、AIが美しい曲を生成します。また、Amper Music, AIVA, Soundful, Ecrett Musicなども人気のある音楽生成AIサービスです。Googleにも「MusicLM」という説明テキストから音楽を生成するAIツールがあります。これらのサービスは、音楽制作プロセスのあらゆる側面に影響を与えることができます。
https://www.itmedia.co.jp/news/articles/2306/12/news084.html
メタバースの構築を効率化する 3Dモデル生成AI超入門!: 文章、画像、音楽、動画に続く生成AI 初心者向け解説書 (超入門! シリーズ) 新品価格 |