Mac版AIブラウザ「ChatGPT Atlas」の突破力に感歎。「Sunoで今日の天気を織り込んだ曲を作って」と頼んだらあっさりできちゃいました(CloseBox)

テクノロジー AI
松尾公也

テクノエッジ編集部 シニアエディター / コミュニティストラテジスト @mazzo

特集

AIによるブラウザベースのエージェントがついに一線を超えました。ChatGPT Atlasの登場で。


SunoをAIエージェントでコントロールし、ユーザーが最初に出した指示の通りに曲を作り上げるという、これまでかなわなかった難題が達成されたのです。

AIによってWebブラウザをコントロールし、様々なサービスを横断的に使える技術には、browser-use、ChatGPT Operator、Fellou、Manusといった様々なアプローチがありましたが、これまで、この課題をクリアしたものはありませんでした。



毎回ログインでユーザーが介在しなければならなかったり、ロボット判定されて先に行けなかったりでした。Fellouでは曲はできたのですが、Sunoを指定していたのにFellou自身の音楽エージェント(おそらくAPIベース)を使っており、Sunoへのアクセスは困難と言い訳していました。WebブラウザそのものにAIエージェントを一体化させてしまうというChatGPTの試みは(それだけではないにしろ)見事に成功したように思います。非常に突破力が高いです。

今回やったのは、「今日の天気をもとにして、Sunoに曲を作らせる」というシンプルなタスクですが、現在の天気からプロンプトを作って、それをSunoに渡し、作曲のための指示出しをして最後まで動かすというところまでやらなければなりません。

ChatGPTをエージェントモードにして、命令すると、次のような独り言を発しながら作業を進めていきます。

ユーザーのリクエストは「Sunoで今日の天気を織り込んだ曲を作って」ということですね。Sunoをうまく活用して、このリクエストにぴったりな曲を作れるようにすごく考えています。どんな天気かを確認し、それに合わせたモチーフを考えるのが重要だなと思っています。

ユーザーのリクエストに基づいて、SunoというAI音楽生成サイトを活用して、今日の天気に基づいた歌を作成する必要があります。天気を反映させるため、東京・高野台の天気を調べるか、過去の情報を使い、そこに合った歌詞を生成します。

ユーザーのリクエストはSunoを使って、今日の天気を織り込んだ曲を作ることですね。そのため、まずは天気情報を検索して集めます。これを基にして、Sunoで作成する曲に必要な要素を盛り込みます。

検索結果から、今日は「東京の天気、2025年10月22日」の詳細を調べています。いくつかの信頼できるページが見つかったので、その中から一つ(例えばtimeanddate.com)を開いて、現在の天気(軽い雨、部分的に曇り、気温摂氏13度)を確認します。

天気情報を得るために、今回はtimeanddate.comのページ(ID: 9)を開いて、天気データを収集することにします。MetOfficeのページ(ID: 11)も一応開いて、他の情報と照らし合わせながら比較してみます。

timeanddate.comから得た天気情報(摂氏13度、軽い雨、曇り、予報18/11度、風速9 km/h、湿度77%)を曲に組み込む準備が整いました。次にSuno.aiにアクセスして、そのサイトで曲を生成します。ログインが必要なら、ユーザーにお願いすることにします。

Suno.aiを開いた後、ページを分析して曲を作成する手続きを進めます。システムのガイドラインに従って、DOMや視覚的な情報を使って作業を進める予定です。まずは新しいURLを使ってタブを開く必要があります。

新しいタブが読み込まれたので、内容を確認しないといけません。ただ、ログイン画面やフィードが表示されているかもしれません。まずはDOMを使ってページの内容を分析して、次に進めるかどうかを確かめます。

「高野台の今日の天気は摂氏13度、小雨、曇り。」この天気を反映させたバラードを作るプロンプトを入力します。「ゆったりとしたテンポで、雨音や湿った空気を感じるメロディ」になるようにお願いする予定です。この内容をテキストエリアに入力して実行します。

どうやら曲が生成されていないようです。もしかしたら「作成」ボタンでエラーが発生したか、サイトに変更があったのかもしれません。新しい「新モデル」バナーが表示されており、「v5で作成」ボタンもあります。しばらく待って、再度DOMを取得して確認します。

URLが変わって、今回は「作成ページ」に移動したようです。レイアウトが新しくなっていて、ページには「Song Description」や「Lyrics」などのフィールドがあります。天気をテーマにした歌を作成するために、簡単な説明文を入力し、必要に応じて歌詞を加えることで進めます。

「Song Description」に天気に関連した説明文を入力し、AIに歌詞を生成させることができます。ユーザーが既に書いた「雨のブランケット(高野台)」の歌詞を使用し、天気に基づく内容を反映させます。歌詞はそのまま使っても大丈夫です。

新しい「Song Description」欄に天気に関する説明を入力して、AIに歌詞を生成させます。「Lyrics」ボタンをクリックして、以前書いた歌詞(Aメロなど)を貼り付けても良いですが、音声のみでの生成も可能です。

「Create」ボタンをクリックしましたが、すぐに新しい歌が表示されないようです。生成には時間がかかるかもしれません。UIには既存の曲のリストがあり、生成が始まった兆候も見られるので、約30秒待ってから確認してみます。

新しく作成した曲がリストのトップに「Untitled」として表示されています。おそらく2種類のバージョンが生成されており、最初のクリップを開くためにクリックします。ユーザーがリンクを求めるかもしれないので、リンクを共有できるようにします。

「雨音の街」の詳細が表示されました。これが生成された曲です。2つのバージョンがありますが、最初のものを選んで開くと歌詞が表示され、音声も利用可能です。リンクを共有する準備ができましたが、ユーザーが公開またはダウンロードしたいか確認します。

「雨音の街」作成後、ユーザーにリンクを提供する準備ができました。共有ボタンをクリックしてリンクをコピーできますが、リンクを提供する前にユーザーに確認を求めるべきかもしれません。リンクを取得するだけなので、投稿は行いません。

「雨音の街」の作成が完了しました。公開はせず、歌がワークスペース内にあることをユーザーにお伝えします。ユーザーの確認を得てから、公開または共有します。さらに、スクリーンショットをキャプチャしてその内容を記録します。

「雨音の街」という歌が生成され、雨をテーマにしたバラードスタイルの歌詞が含まれています。歌のリンクを提供し、公開または共有の意向を確認します。説明とともに、天気に関する参考としてスクリーンショットを提供します。

作曲が終わるまでにかかったのは2分。ただし、3箇所の読み間違いがあったので、Song Editorで手作業で歌詞を修正したので完成までには10分ほど余計にかかっています。

ChatGPTが心配していたログインですが、あらかじめAtlasでSunoにログインしておいたので、ロボット判定されることなく問題なく行けました。

ちょっと手間取ったのは、SunoのAIモデルが変更され、非課金ユーザーが使えるAIモデルが従来のv4から、v4.5-allへと変更になったことへの対応くらいですが、それも難なくクリアして、2曲を作ってしまったのです。あっさりすぎて拍子抜けしました。

まだ文字入力などで不具合のあるAtlasですが、AIブラウザとしては最高レベルに到達していると感じました。

二度目からは、戸惑うことなく作曲タスクを完遂できました。エージェント実行中には星がきらめくようなアニメーションがオーバーレイされてきれいです。

また、エージェント機能だけでなく、開いているタブそれぞれでChatGPTにわからないことを相談できるというのはとても楽で便利。

プロンプトの改善提案をわざわざ別タブや別アプリのChatGPT、Geminiを開かずにやってもらえるのはとてもありがたいです。ChatGPTアプリを呼び出すためのキーボードショートカットも煩わしいし、何よりコンテキストを説明し直す必要もありません。これはコンピュータの使い方として革命的なのでは?

同様のことはGeminiを完全に組み込んだChromeでも可能になるでしょうが、今、この時点においてはMac使いのChatGPTユーザーだけが享受できます。

本当はこうしたことはApple Intelligenceがやって欲しいものではあるのですが、もうこれでいいのでは、という気になっています。

一つだけ残念なのは、デフォルトブラウザをオンにしろというアラートが画面の下に表示されて消せない邪悪なところなのですが、便利すぎてデフォルトをChromeからAtlasに乗り換えてしまいました。

さて、次は何をしましょうか。この曲のミュージックビデオを複数の画像・動画生成AIサービスを使って完成させるあたり。

最初の5秒まではできましたが、複数の動画クリップを生成するやり方だと、ファイルをいったんローカルかクラウドに保存して再編集する必要があるので、ユーザーのインタラクションが必要となりますね。

この辺までやろうとすると、A2A対応とかが必要になるのでしょうか。

また、「Soraで今の自分の気持ちを推定して動画を投稿して」というエージェントの実行中にはいくつか不具合がありました。

参照画像を間違って開いてFinderダイアログが閉じないままになっていたり、Atlas自身によりページがブロックされたりとかありましたが、動画自体は生成され、投稿までいけました。

ChatGPT Atlas、現在はMacのみのですけど、Windowsへの対応も楽しみです。


そして、この記事をAtlasに読ませて、Sunoに作曲させてみました。こんなので、聴きごたえのある曲ができてしまう恐ろしさよ……。

このミュージックビデオをダウンロードして思ったのですが、Chromeではダウンロード履歴が画面の右上を大きく占拠してしまって必要なボタンが押せなくなることが多いんですよね。

Atlasはダウンロード表示が右下に小さくまとまっていて使いやすいです。このこともあり、今のところデフォルトブラウザとしておこうと考えています。

《松尾公也》

松尾公也

テクノエッジ編集部 シニアエディター / コミュニティストラテジスト @mazzo

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。