AI作曲では楽曲が完成した状態で生成されます。このため、ボーカル、ギター、シンセサイザー、ドラム、ベースといったパート別の編集は基本的にAIベースのSTEM分離機能を使うことになります。
Sunoについては、従来はボーカルとそれ以外を分離することは可能でしたが、それ以上になるとLogic Proであれば最大6パートの分離が可能になりました(従来は4パート)し、ヤマハのiPhoneアプリExTrackを使えば6パートに分離できるので、これらを使うことはできました。
しかし、分離するには有償のソフトが必要です。そして、ノイズなしできれいに分離するというのもなかなか難しく、アーティファクトが残ったり、レベルが均一でなかったりといった問題が残ります。
前置きが長くなりましたが、Sunoの最新版では、STEM分離が新設の「Stem Extraction」で、理想に近い形で実装されました。





ボーカル、コーラス、ギター、シンセサイザー、ベース、ドラム、パーカッション、その他……など最大12パートの分離ができるのです。
Sunoで作ってあった曲をStem Extractionしてみたところ、バッキングボーカル、ベース、ブラス、ドラム、FX、ギター、キーボード、パーカッション、ストリングス、シンセ、ボーカル、木管という12種類のパート別MP3かWAVファイルが抽出できました。
分離はかなりきれいにできていて、特にリードボーカルとコーラスの分離までできるとか最高です。ちなみに、オーディオアップロードした音源でも取り込んでしまえば分離はできるので、もう高価な外部ソフトはいらんかなあ、という感じです。
実は、筆者はここ3日くらい、とある案件で既存楽曲のリードボーカルをAIに置き換えるという仕事をしているのですが、元曲のリードボーカルとコーラスパートが重なっていて、分離できないために、コーラスパートも一から作り直す(筆者が歌う)ということをやっているのです。今まさにその作業中なのですが、この機能がもっと早く来ていたら楽できたのに……となっているところです。
まあ、既存楽曲の場合、はねられることも多いとは思いますが。
そして、オーディオ取り込みが最長8分まで可能になっております。無敵か。曲の断片だけじゃなく、曲全体をアップロードして、その音楽スタイル、歌詞などを変えていくことが可能になります。

これらの機能を統合的に扱えるSong Editorはさらに高度化されていて、Verse、Chorusといったセクション単位での順序入れ替えや、任意の位置でスプリットして削除・移動させるなど、これはもう新規トラックを足すのでなければDAW不要といった様相です。

さらに嬉しいのは、テンポ変更機能。Custom BPMで任意のスピードに設定できるようになったのです。BPM表示にテンポ変更と、DAW並みの機能が入ったことになります。
次は、ボーカルやギター、キーボードなどのオーディオを取り込んで、さらにそれをAIで再生成していくなんてこともありそうです。

これらの機能を利用するにはProアカウント以上である必要があり、さらにクレジットのポイントを消費しますが、Udioなど他のAI作曲ソフトで作った曲も積極的に取り込んでいきたいですね。
ここまでくると、プロのミュージシャンたちも積極的に使わざるを得ない状況と言えるのではないでしょうか。
SunoとUdioを訴えているレコード会社は両社に対し、
ライセンス料の支払い:AIモデルの訓練や生成された音楽に対する使用料。
少額の株式取得:SunoおよびUdioへの少額の出資。
著作権管理技術の導入:YouTubeのContent IDのような指紋認識技術を用いて、AIが生成した音楽の出所を特定し、使用状況を追跡する仕組み。
製品開発への関与:AIが生成する音楽の内容や配信方法に対するレーベルの関与。
を求めて交渉を進めているとBoombergは報じています。一方で、訴訟対象となっていないオープンソースのYuEやACE-Stepの性能も侮れないところまで来ています。
音楽とAIを追っている筆者のところにもいくつかの相談が来ているくらいですから、音楽業界はAIへの取り組みにより積極的に動いて行かざるを得ないのは確かでしょう。