AIエージェントがコマンドラインでブラウザを自動操作。「Browser Use CLI 2.0」リリース。Chrome DevTools接続などで操作が倍速に

テクノロジー AI
新野淳一

ITジャーナリスト/Publickeyブロガー。IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。

特集

人間やAIエージェントがコマンドラインから指示することでWebブラウザを操作できるオープンソースのPythonライブラリ「Browser Use CLI 2.0」がリリースされました。

Browser Use CLI 2.0では、Chromeブラウザに対してChrome DevTools Protocol(CDP)で接続して操作できるようになり、またセッションごとにWebブラウザを起動することなくデーモンによるセッションの保持が行われることで、前バージョンよりも操作速度が2倍になるなどの機能向上が実現されています。

Browser Use CLI 2.0は、AIエージェントによるWebブラウザの操作自動化を実現するオープンソースの「Browser Use」の一部として、コマンドラインから操作する機能を備えたソフトウェアです。

一般に、コードやコマンドを用いたWebブラウザの自動操作は、操作対象となるWebサイトのURL、表示された画面上のボタンやフィールドを操作するためのDOMの指定や名称などを、ひとつひとつ正確に指示しなければなりません。

しかしBrowser UseおよびBrowser Use CLIでは、人間やAIエージェントがおおまかな指示を与えるだけで、Browser Useに組み込んだAIがその意図を読み取り、適切なURLやボタンなどを操作してくれる、というものです。

操作対象のWebブラウザとして、ユーザーが利用しているChrome、ヘッドレスのChromium、有償で提供しているBrowser Use Cloud API経由でのクラウドベースのWebブラウザが利用可能で、既存のユーザープロファイルを利用してWebサイトへのログインが可能。

有償のBrowser Use Cloudには、ボットを判別するキャプチャの突破機能などが備わっています。

Browser Use CLI 2.0ではChrome DevTools Protocol(CDP)での接続、最初のコマンドでデーモンが起動し、Webブラウザとのセッションを保持することでセッションごとにWebブラウザを起動することなくコマンドを実行できるようになったことなどにより、コマンドに対して50ミリ秒以下で操作が行われる高速なレスポンスを実現していると説明されています。

利用可能なAIモデルはGoogle Gemini、OpenAI GPT、Anthropic Claude、Azure OpenAIなどの他に、Responses APIにも対応。ローカルで実行しているLLMも利用可能です。

コマンドラインからの指示でブラウザを自動操作

以下は公開されたデモ動画のキャプチャです。

Brouser Use CLI 2.0を起動し、「x.com」に接続せよと指示。

Webブラウザでは、Devtoolsが外部と接続してよいかどうかの許可を求めてきたため、Allow(許可)ボタンをクリック。

するとx.comが表示される。

Browser Use CLIから、「What are my most recent notifs」(最近の通知を教えて)と指示。

x.comの「Notifications」のページへ遷移。

Browser Use CLIがこれを読み取り、コマンドラインに最近の通知の一覧が返ってくる。


この記事は新野淳一氏が運営するメディア「Publickey」が2026年3月23日に掲載した『AIエージェントがコマンドラインでブラウザを自動操作できる「Browser Use CLI 2.0」リリース。Chrome DevToolsへの接続などで操作速度が2倍に』を、テクノエッジ編集部にて編集し、転載したものです。

《新野淳一》

新野淳一

ITジャーナリスト/Publickeyブロガー。IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。