AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ(CloseBox)

テクノロジー AI
松尾公也

テクノエッジ編集部 シニアエディター / コミュニティストラテジスト @mazzo

特集

AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ(CloseBox)
  • AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ(CloseBox)
  • AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ(CloseBox)
  • AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ(CloseBox)
  • AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ(CloseBox)
  • AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ(CloseBox)
  • AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ(CloseBox)
  • AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ(CloseBox)
  • AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ(CloseBox)

歌詞を与えれば作曲・演奏・歌唱と残りの全てをやってくれるAI作曲完パケサービス「Suno」。音楽制作界隈では「MIDIで吐いてくれ」との声が多く上がっています。

いい感じの音楽が出るまでガチャを引けばいいのですが、Sunoを効率化のために使いたい、アイデア出しのために利用したいんだけど、出力された音楽をいちいち手弾きで入力するのもだるい、という話です。

今回はこの解決策をご紹介しようと思います。詳しい人ならご承知のことと思いますが、改めて。

以前のコラムで紹介したように、例えばLogic ProのFlexPitchのようなピッチエディターを使えば、単音のオーディオファイルからMIDIデータを取り出すことは可能です。

実際、筆者はUVR5という音源分離ツールを使って取り出したBassトラックをFlexPitchによってピアノロール表示し、それを改めてMIDIデータとして打ち込むというのをやっています。

▲オーディオデータをLogic ProのFlexPitchでMIDIノートに変換


しかし、ベース、ボーカル以外の音楽トラックは、単音ではありません(ベースとボーカルも複数の音から構成されるポリフォニーであることがままあります)。

そういえば、CelemonyのMelodyneはポリフォニックMIDIを取り出して、そのノートをぐりぐり変えられる機能があったなと思い出したところへ、「通常349ドルのアップグレード料金だけど、今なら100ドルですぜ」というメールが筆者のところに届きました。10年以上前に購入してそのまま使っていなかったのが、ここにきて生きてきたのです。もちろんアップグレードしました。

▲あまりにもこちらの状況を掴んでいるかのようなタイミングでセールスメールがきた

Melodyneは音楽を生業とする人、特にボーカルを扱う人であれば必須と言っても良いツール。その分高価であり、筆者がアップグレードした最上位のstudioエディション(現行はMelodyne 5 studio)であれば、通常価格が849ドル(現在は699ドル)。日本だと10万円近くします。当時はDAWのStudio Oneがデビューして間もない時期で、Melodyneのエントリーエディションが無料で付属しており、そこからのアップグレードができたので安価に上位エディションを手に入れられたのですが、今ではおいそれとは買えない価格。機能としては非常に優れているのはたしかですが。


試してみたところ、ピアノトラックをしっかり認識しました。コードも表示してくれます。

▲Melodyne 5 studioでポリフォニーMIDIを取り出したところ

これで終わりかと思ったのですが、耳寄りな話を聞きました。同様の機能を持った別のソフトがあるというのです。

ChatGPTに「オーディオデータからポリフォニックでMIDIを吐き出せるソフトはない?」と聞くと、筆頭に上がったのはMelodyneではなく「Ableton Live」でした。

Ableton LiveといえばDJ御用達ツールで、EDMやらない自分のような人間には全く不要と新機能が発表されてもスルーしていたので気づいていなかったのですが、なんと2013年からオーディオデータからポリフォニックMIDIを取り出す「Harmony to MIDI」という機能がついていたのです。そうなおいしい機能ががあるんならちゃんと俺に教えてくれよと心の中で叫びました。

この機能が使えるのは最上位のAbleton Live Suiteが必要で、価格は現在6万4000円。現行バージョンが11で、12へのアップグレードが間近ということで、バージョン11を買っておけば12に無償アップグレードという、DAW界隈でありがちなお得プライスです。


Ableton Live11 Suite 通常版 エイブルトン
¥64,600
(価格・在庫状況は記事公開時点のものです)

こちらも買いたいところですが、Logic Proの2倍以上の価格。ちょっと最近モノを買い過ぎてしまい、今は手が出せない状況である上に、Melodyneで同様のことができるので、そこまでする必要もなし。でも、試してはみたい。でも良かった。30日間使用できるものがダウンロードできます。これで試したところ、Sunoで出力したピアノトラックをちゃんとMIDIファイルに吐き出すことができました。

▲ドラッグ&ドロップしたオーディオファイルのピアノハーモニーをMIDIに変換できました

ただし、ポリフォニックのMIDI解釈は必ずしも完全なものではなく、特にSunoのように音質があまりよろしくない場合には倍音成分を誤解釈したりもするので、その後のエディットは必須。それでも最初から手打ちで入力するよりははるかに楽ちんで、そのトラックをソフト音源に切り替えれば、全体の音質は向上できます。MIDIデータなので、スムーズにアレンジも可能。オリジナル音源では唐突に終わっていたものを、エンディングまで持っていくことができます。

▲こちらはオリジナル音源(一部いじってますが)

▲こちらのピアノはHarmony to MIDIでMIDIファイルにし、それをLogic Proのソフト音源で再生しています

そんなわけで、Sunoで「MIDIが吐ければなあ」とお嘆きのミュージシャンの皆さんは、Melodyne 15 studioかAbleton Live suiteを買うと、幸せになるよ、というお話でした。

今日公開した生成AIウィークリーで紹介している「StemGen」は、最初から楽器パートに分かれていて、一つのパートのバリエーションを生成し、それに反応して別パートも作っていけるという、音楽制作のワークフローにぴったりの音楽生成AIです。


残念ながらまだコードやデモは公開されていませんが、早く使いたいですね。そして今後は「楽曲生成後」を考えたさらなるAIモデルの登場を期待したいところです。

記事を執筆後に見つけたソフトも同種のことができるので、追加しておきます。

それはドイツのSamplabという企業が提供している同名の「Samplab」というアプリ。AIを使って、オーディオデータからポリフォニーMIDIに変換できるのはAbleton LiveやMelodyneと同様。無料で10秒間のオーディオクリップを試せるので同じSunoのピアノトラックで実験してみました。

▲SamplabでもポリフォニックのMIDIデータをオーディオデータから取得できた

違うパートの楽器は色違いで表示され、ボーカル、ベース、ドラム、その他の4種類のSTEM(パート別ファイル)にエクスポートできます。オーディオ段階で分離しなくていいのは良いですね。処理はクラウドで行われているのでローカルマシンの処理能力には依存しません。

さらに良いポイントは価格。サブスクリプション制となっており、初期投資額が少なくて済みます。1オーディオにつき10秒でモノラル、ノートの変更不可の制限を我慢すれば無料でOK。制限撤廃すると月額7.99ドル。最初の2週間は無料です。使う期間にもよりますが、オーディオ→MIDI変換だけを考えれば、Ableton LiveやMelodyneよりも大幅にお得な価格設定なのは間違いないでしょう。

しかし、それを上回るハイコストパフォーマンスの方法があるのも見つけてしまいました。Spotifyが2022年に発表した「Basic Pitch」というオープンソースプロジェクトです。こちらはコードが公開されている上、ブラウザで処理できるデモページも用意されています。オーディオファイルに含まれている全てのノートをまとめてMIDI化します。事前にオーディオを分離していればパート毎に分けられますし、後で不要なものを削除したり必要なものを選択して別ファイルに移すというのもできます。

▲ボーカルとピアノの演奏が含まれたオーディオファイルを読み込んだところ、ちゃんとMIDIに変換できた

MIDI解釈についてはパラメータで細かいコントロールも可能。

つまり、Basic Pitchであれば無料で「MIDIで吐いてくれ」るわけです。ほとんどの人にはこれで十分ではないでしょうか。

もう一つ、無料でポリフォニックMIDIに変換できるソフトがありました。9月に個人開発者のDamRsnさんが公開したばかりのソフト「NeuralNote」です。これはスタンドアロン、AU、VSTといったプラグインの形で提供されており、これまで紹介したものと同様にオーディオファイルからポリフォニーMIDIデータを取り出せます。試したところ、これもできました。

無料版ですが、DAWに組み込んだり、ローカルのみで処理したい場合には有用だと思います。スケールや時間ベースのクォンタイズなどの調整ができるので、これも便利そう。

まとめますと、

  • Melodyne 5 Studio:9万5799円(スタンドアロン、プラグイン)

  • Ableton Live 11 suite:6万4000円(DAW内蔵機能)

  • Samplab:月額7.99ドル(約1140円)、(スタンドアロン、プラグイン、クラウド処理)

  • Basic Pitch:無料(ブラウザ)

  • NeuraNote:無料(スタンドアロン、プラグイン)

ということになります。あなたはどれを選びますか?

《松尾公也》

松尾公也

テクノエッジ編集部 シニアエディター / コミュニティストラテジスト @mazzo

特集

BECOME A MEMBER

テクノエッジ友の会に登録しませんか?

今週の記事をまとめてチェックできるニュースレターを配信中。会員限定の独自コンテンツのほか、イベント案内なども優先的にお届けします。