少し前からベータテスターによるインプレッションが投稿されていたAI音楽生成サービス「Tunee」の招待がきたので、さっそく試してみました。
Tuneeはたぶん、チューニーと読むはず。SunoやUdioのように、歌詞や音楽スタイルを入力してパラメータを設定することで作曲するのではなく、対話形式で音楽を作っていく方式で、その点においてはProducer(.ai、旧Riffusion)と似ています。

Tunee自身は次のようなものを特徴として挙げています。
知的な対話型クリエイション
アイデアを伝えるだけ。複雑なパラメータや専門用語は不要です。マルチメディア理解
動画・画像・音声断片をアップロードすれば、Tuneeが感情やスタイルを理解し、ぴったりの音楽を生成。リアルタイムWeb検索
最新の音楽トレンドを検索・分析し、常に時代に合ったサウンドを実現。プロフェッショナルな成果物
インテリジェントなマスタリング、歌詞制作、商用ライセンスまで対応した完全な制作パイプライン。
それが本物であるのか、どのレベルであるのかを、実際に試しながら検証していきたいと思います。
まず、筆者はベータテスターなので全機能を使うことができますが、会員プランは4つが提供される予定です。SunoやUdioなどと同様に有料プラン(月額18ドルから)からは商用利用が可能で、

マルチモーダルでWeb検索も統合
筆者が現在メインで使っているAI作曲サービスはSunoです。近々DAW機能が統合されることがアナウンスされており、非常に高機能かつ高品質の成果物が出せるのですが、そのためのプロンプトや歌詞を考えるのにはどうしてもChatGPT、Gemini、Claudeといった大規模言語モデル(LLM)の手を借りることが多いのが現状です。
確固たる歌詞のアイデアや音楽スタイルの目標が頭の中にないと、それをアウトプットするのは難しいのです。もちろん。鼻歌や簡単なフレーズを弾いたものをアップロードして、そこから音楽のアイデアを膨らませたり、アプリ版であれば、写真から曲の断片を作ることもできますが、いずれにしても自分に音楽を完成させるのに必要な知識とそれを表現する語彙がないと、サービスに伝えることができません。
Producer(.ai)では、参照する素材として、オーディオだけでなく、画像や動画もアップロード可能です。それに加えて、Web検索機能を持っているので、現在の音楽トレンドや過去の音楽資産、理論、知識をサービスから離れずに参照することもできます。
ではやってみましょう。
「ビートルズ後期やシド・バレットが在籍したピンク・フロイド初期のサイケデリックサウンドを再現するような、ひねくれたポップロックを作りたい」と最初に指示すると、
3つの選択肢を出してきました。
その中でビートルズ風というのを選ぶと、Personalized Planを出してきます。音楽プロンプト、歌詞、楽曲をそれぞれお作成していく3つのステップです。
ほどなく、後期ビートルズに強く影響を受けたバンドサウンドというしかない2曲が出来上がりました。もうこれでいいんじゃないでしょうか。

ここからMP3、WAVがダウンロード可能です(44.1kHz、16bit)。さらにSTEM生成とダウンロードもサポートしています。STEMは現状では、ボーカル、ドラム、ベース、その他の4種類と基本的なもののみです。
サウンドに関してはここで終わり……ではありません。マスタリング機能があり、3つのプリセットまたはアップロードした音源を参照して仕上げのマスタリングすルコとが可能です。例えばIn the NightというJ-POP曲を参照すると、高音域のブライトネスを上げ、サウンドステージを広げる仕上がりになります。


さらに、ミュージックビデオを作ることもできます。さすがにフル楽曲は無理ですが、15秒から60秒の範囲で、5つのビジュアルスタイルでMVを生成できます。Vaporwave Anime、Studio Ghibli Pastoral、Glitch Scene、Makoto Shinkai Cinematic、Dreamcore Surreaの中から選択するのですが、l840クレジットを消費してしまいます。

ジブリ風を選び(そのネーミイングはいいのか?)スタートすると、12シーンから構成されるストーリーボードを作り、撮影用のプロンプトを生成。それに基づいた絵コンテを作って、そこから動画を作っていきます。
Video Theme
Whimsical dreamlike journey through a magical countryside blending reality and fantasy.
Video Setting
Hand-drawn Ghibli-inspired European rural landscapes, filled with enchanted nature and surreal visuals.
Cinematography for Each Shot
Shot 1 (0.00-5.75): Slow pan across the cottage interior, soft focus, sunlight filters in with gentle camera push-in to magical creatures.
Shot 2 (5.75-9.90): Wide low-angle shot outside, subtle tilt as clock tower melts, zooming in on wildlife reacting in wonder.
Shot 3 (9.90-15.32): Tracking shot following protagonist through a misty forest, dreamy lens blur, gentle handheld-style sway.
Shot 4 (15.32-19.55): Rotating camera moves between floating mirrors, reflections shown with seamless transitions, animal close-ups.
Shot 5 (19.55-23.46): Dynamic upward tracking shot as butterflies ascend, sparkling effects, slightly slow motion for magic emphasis.
Shot 6 (23.46-27.36): Medium shot drifting along woodland path, rotating camera to suggest clocks running backwards, soft light flares.
Shot 7 (27.36-31.36): Wide shot of flying horses, camera gently rises with them into the clouds, dreamy vignette.
Shot 8 (31.36-36.78): Swirling aerial shot around spinning protagonist, psychedelic color transitions, kaleidoscopic distortion effects.
Shot 9 (36.78-42.21): Smooth dolly shot over patchwork countryside, floating camera emulating drifting sensation, lingering on oversized flowers/birds.
Shot 10 (42.21-49.47): Whip-pan transitions, abstract movements, exaggerated zooms, colors and shapes swirl rapidly.
Shot 11 (49.47-54.01): Steady pull-back as protagonist enters glowing portal, field shifts gently, soft golden hour lighting.
Shot 12 (54.01-60.00): Epic wide shot, slow zoom out revealing entire magical world at peace, lens flare and glowing edges highlight harmony.

この絵コンテでいいか、ストーリーボードに戻るかを選択。これでよければ動画生成に進みます。
と、ここまでは良かったのですが、「Sorry, ssytem response failed.」の警告が。3回目のトライ。

このあたりのやり取りは、ヴァイブコーディングでプログラムを作っているときのようです。対話は英語でも日本語でもできるので、本当に自然にやり取りができます。3度目の正直で、今度は出来上がりました。冒頭の1分間をミュージックビデオにしたものです。

でも最後のシーンの左端にジブリの有名クリーチャーに似た何かが紛れ込んでいました。途中で気づけば、これも修正可能です。
ジブリ風、新海誠風以外のものも選べるので、こうした事故も回避はできます。
それにしても単なるおまけだと考えていたミュージックビデオ生成が意外に本格的なものだったので、ストーリーボードを生成するためだけに使うのもアリではないかと思いました。
そしてこのTuneeですが、プロンプトに「ビートルズ」「ピンク・フロイド」といったキーワードを入れても拒否されずに進めることができました。あくまでもインスパイアなので、そこで制限することのほうがおかしいのですが、ありがたいことです。
そして出来上がった曲の完成度が高く、意図した音楽に合致したものが生成されたので、満足度は非常に高いです。ここからアレンジを模索したりパートごとの調整をしたりするのはSuno(とのその後のDAW統合)が便利なので使うと思いますが、今後の音楽制作ではこのTuneeを最大限活用していこうと思います。