Anthropicは、生成AIチャットボットClaudeを「完全な音声会話」で利用できる「音声モード」を、今後数週間のうちにiOSおよびAndroidアプリに提供することを明らかにしました。
Anthropicは今年3月、音声操作AIを開発するスタートアップ企業のElevenLabs、主要な投資家のひとつである米Amazonとともに、音声モードの開発に取り組んでいると述べていました。
音声モードの提供に伴い、更新されたClaudeのサポートページでは、音声モードでは「Claudeに話しかけ、音声で応答を聞くことができるため、手がふさがっている時でも集中して操作できる」ことが利点だと述べ、「Claudeに話しかけ、音声でその回答を聞く」「クロードが話している間、その要点を画面に表示する」「チャットの最中に、その会話でテキストと音声をシームレスに切り替える」「音声会話を通じてGoogleドキュメント、カレンダー、Gmail、ウェブ検索へのアクセスを提供(有料ユーザーのみ)」できると説明しています。
ただし、音声モードによるやり取りも、テキストチャットの場合と同様の使用量制限がある点には注意が必要です。無料ユーザーの場合は、だいたい1日あたり20~30件のやりとりでその上限に達すると考えられます。
生成AIチャットボットへの音声操作機能の追加は、OpenAIやGoogle、xAIといった主要な生成AI企業がすでに行っており、いずれも、自然な会話で操作することができ、コンピューター操作に不慣れな人でも直感的に扱えるようになりつつあります。
Anthropicは、ChatGPTで使える音声は限られたプリセットのなかか選ぶようにしており、だれかの音声の複製や特定の人物を真似た声を悪用するなりすましを防止する設計だと述べています。
なお、Claudeには音声モードの他に、先日有料ユーザー向けに追加されていたウェブ検索機能を、Claudeの無料ユーザーにも提供することを明らかにしています。