GoogleはAndroid版のGoogle翻訳アプリに、ユーザーが複数言語の発音を練習するための機能を追加しました。
この機能は発表時点では米国とインドで提供され、英語、スペイン語、ヒンディー語に対応します。
Googleは、翻訳アプリが「Google Research内で機械学習研究のきっかけとなった初期の実験のひとつ」だったと述べ、2006年当時の翻訳技術が統計的機械学習に依存していたが、2016年に「ニューラルネットワークへの大規模な移行を先駆けて実現」し、現在は「AI、強力なGeminiモデル、新世代のTensor処理ユニットハードウェアを活用」して利便性を向上させるに至ったと、その歴史を説明しています。
Google翻訳20周年記念としてAndroid版Google翻訳アプリ向けにリリースされた発音練習機能は、画面下部に表示される「Pronounce(発音)」ボタンから利用でき、ユーザーは翻訳した単語を「発音」するか、ネイティブスピーカーによる実際の発音を「聞く」かを選択できます。
そして、発音する方を選べば、Google翻訳アプリがユーザーの発音に対し「AIを使用して音声を分析し、即座にフィードバックを提供」します。
Googleはモバイル版Google翻訳ユーザーの1/3が、このアプリを新しい言語の学習や練習に利用しているとし、そんな使い方に今回の発音練習機能は役立つと述べています。
機能紹介動画では、「this passion fruit juice is great」という英文を「Este jugo de maracuya es genial」というスペイン語に訳し、その発音を練習するところを実演しています。そして、スペイン語の文章の下には、英語話者が正しく発音できるよう、発音用の文が表示されていますが、そのなかで「jugo(”ふーご”と発音)」の発音提案を「HU-go」と記して正しく読めるようユーザーに示しています。
ちなみに、Google翻訳で最も利用されている処理は、英語からスペイン語への翻訳であり、続いて英語からインドネシア語、同ポルトガル語、同アラビア語、同トルコ語への翻訳がよく利用されているとのこと。英語からヒンディー語、ベンガル語、マラヤーラム語といったインドの言語への翻訳も多く、今回の発音練習機能にスペイン語とヒンディー語が選ばれたのは、このような背景からと考えられます。
Googleは、昨年12月にGeminiの翻訳機能をGoogle翻訳のテキスト翻訳に統合しましたが、最新のGemimiでは「単語ごとのテキスト翻訳から、ライブ翻訳などの機能を備えた、流れるようなリアルタイムの会話へと進化」しており、文脈やニュアンスを捉えた人間っぽい会話ペースやコミュニケーションの自然さを維持するようになったと述べています。









