国内版Galaxy S24 / S24 Ultra実機ハンズオン。Galaxy AIの日本語文字起こし精度が海外版より向上、手書き文字認識も優秀(石野純也)

ガジェット スマートフォン
石野純也

石野純也

ケータイライター/ジャーナリスト

  • homepage
  • facebook
  • X

慶應義塾大学卒業後、新卒で出版社の宝島社に入社。独立後はケータイジャーナリスト/ライターとして幅広い媒体で執筆、コメントなどを行う。ケータイ業界が主な取材テーマ。

特集

国内版Galaxy S24 / S24 Ultra実機ハンズオン。Galaxy AIの日本語文字起こし精度が海外版より向上、手書き文字認識も優秀(石野純也)
  • 国内版Galaxy S24 / S24 Ultra実機ハンズオン。Galaxy AIの日本語文字起こし精度が海外版より向上、手書き文字認識も優秀(石野純也)
  • 国内版Galaxy S24 / S24 Ultra実機ハンズオン。Galaxy AIの日本語文字起こし精度が海外版より向上、手書き文字認識も優秀(石野純也)
  • 国内版Galaxy S24 / S24 Ultra実機ハンズオン。Galaxy AIの日本語文字起こし精度が海外版より向上、手書き文字認識も優秀(石野純也)
  • 国内版Galaxy S24 / S24 Ultra実機ハンズオン。Galaxy AIの日本語文字起こし精度が海外版より向上、手書き文字認識も優秀(石野純也)
  • 国内版Galaxy S24 / S24 Ultra実機ハンズオン。Galaxy AIの日本語文字起こし精度が海外版より向上、手書き文字認識も優秀(石野純也)
  • 国内版Galaxy S24 / S24 Ultra実機ハンズオン。Galaxy AIの日本語文字起こし精度が海外版より向上、手書き文字認識も優秀(石野純也)
  • 国内版Galaxy S24 / S24 Ultra実機ハンズオン。Galaxy AIの日本語文字起こし精度が海外版より向上、手書き文字認識も優秀(石野純也)
  • 国内版Galaxy S24 / S24 Ultra実機ハンズオン。Galaxy AIの日本語文字起こし精度が海外版より向上、手書き文字認識も優秀(石野純也)

サムスンおよびドコモ・auは、日本版の「Galaxy S24」「Galaxy S24 Ultra」を4月11日に発売します。

同シリーズは、Googleの「Gemini」をAIモデルに採用した「Galaxy AI」が最大の特長。音声通話の通訳機能や、Samsung Notesの文字認識、要約や文章整理など、AIの力でGalaxyやスマホの特徴的だった機能を大きく進化させています。

キーボードで文体を変えたり、標準ブラウザで表示しているサイトを要約できたりと、その多用途ぶりは同じくAIを売りにしているPixel以上です。

▲4月11日に、Galaxy S24、S24 Ultraの日本版が発売される

そんなGalaxy AIの中でも、筆者が特に注目しているのはボイスレコーダーの文字起こし機能。単に録音した音声を文字にできるだけではなく、翻訳や要約にも対応しています。しかも、日本語での話者特定が可能。

Pixelシリーズは、日本語での文字起こしはできる一方で、話者特定は日本語に非対応。翻訳や要約も、コピペしたり選択後のメニューから別アプリを呼び出せばできなくはありませんが、Galaxy AIの方がアプリ内にしっかり統合されており、使いやすい印象です。

▲筆者的な最大のトピックは、ボイスレコーダーの文字起こし対応
▲翻訳や要約もボタン一発ででき、使い勝手がいい

一方で、Pixelとの比較で残念なのは、リアルタイムな文字起こしに対応していないところ。Galaxy側でいったん録音を済ませたあと、そのデータに対して文字起こしをかける仕組みのため、対面で相手の話を聞きながら、その内容を文字として目で確認することはできません。

筆者の場合、英語で取材する際にPixelを置き、ボイスレコーダーで文字起こししながら聞き取れなかった部分を確認するようにしていますが、Galaxy AIだとそのような使い方は難しくなります。日本語でも、その場でチラッと画面を見ることで数字の確認などに使えるため、リアルタイム対応はぜひしてほしいところです。

その反面、英語で取った録音を瞬時に日本語に翻訳できるのはGalaxy AIならでは。他言語対応の文字起こし可能なボイスレコーダーとしても重宝しそうな予感がしています。

▲録音した音声を、後からまとめて文字起こしするスタイル。リアルタイムで文字が表示されるPixelとは、この点が大きく異なる

そんなボイスレコーダーの文字起こし機能ですが、グローバル版をしばらく借りて使っていた際には、やや精度に難があるようにも感じていました。固有名詞はもちろん、聞き取れなかったであろう部分がザクっと省かれ、次の文章につながるなど、読みにくい部分が多々ありました。

Pixelのボイスレコーダーも完ぺきではなく、省略や誤認識は当然ながらありますが、グローバル版のGalaxyでは文意が通らないことがより多かった印象です。

▲グローバル版のGalaxy S24で文字起こししたデータを、Galaxy Z Fold5に移したところ、テキストはなぜかそのまま表示できた。ただし、読み取りが厳しい部分も多い。のっけから「定刻」が「米国」なっているなど、意味不明な箇所も多かった

これではちょっと厳しいな……と思っていましたが、国内版のGalaxy S24 / S24 Ultraで改めてボイスレコーダーの文字起こしのデモを見てみたところ、かなりきちんとテキスト化されていたことに驚きました。

グローバル版は本番環境であるオンライン会見に投入しているため、サムスン電子が用意した音声データを使った国内版デモより不利になる点には留意が必要なものの、ここまできちんと文字になるとは思っていなかっただけに、期待を上回っていたというのが正直な感想です。

▲複数のデータで試してみたが、間違いが少なく、文章としてかなり読みやすくなっている

日本語の認識は通訳機能でも向上している印象があり、発表会の会場におけるデモでは、スペイン語を話す話者とも普通に会話することができました。想定された問答通りだと面白くないので、あえて変化球的な回答が来るような質問をぶつけてみましたが、それもきちんとした日本語に訳され、意味も通じました。

正直リアルタイムな通訳機能を使う場面はそこまで多くはなさそうですが、ボイスレコーダーの文字起こしがきちんとできるだけでも収穫は大きいと言えます。

日本誤認識の精度向上でもう1つ便利に使えそうなのが、Samsung Notesの文字認識です。こちらもグローバル版で試した際には、なかなか文字を認識してくれず、使うのを諦めてしまったことを覚えていますが、日本版はやや速めに取ったメモでもかなりの精度でテキスト化できました。

以下の写真のように割と走り書きのようなメモでも、「Galaxy」という英語や「フ」というカタカタ以外は、しっかり文字として認識されています。

ここまでできるのであれば、後は手動で修正するだけで済みます。Samsung Notesでテキスト化した後に、PCなどと同期すれば、メモを原稿執筆に活用しやすくなります。

▲Samsung Notesで2ページ分、ざっと走り書きをしてみた
▲テキスト化した結果。英単語のGalaxyは認識できなかったが、漢字や平仮名、カタカナはほぼ完ぺき

では、日本語の認識精度は本当に上がったのでしょうか。

サムスン電子に聞いてみたところ、1月のグローバル版発売後も、日本での投入に向けて日本語の学習を水面下で進めてきたと言います。ローカライズや商戦期の違いなどから、グローバル版より発売がどうしても遅れてしまいがちなGalaxyですが、逆にそのタイムラグを生かしてクオリティを上げてきたわけです。

事実、サムスン電子は日本に研究所も持っており、スマホ向けの画像処理などには実績もあります。この研究所ではAIも対象にしているだけに、今後のさらなる精度向上にも期待ができそうです。

単に販社として端末をローカライズしているだけでなく、研究拠点まで設けているからこその対応と言えるかもしれません。

後発のメーカーでここまでの体制ができているところは少なく、Galaxy AIの差別化ポイントにもなりそうです。

《石野純也》
石野純也

石野純也

ケータイライター/ジャーナリスト

  • homepage
  • facebook
  • X

慶應義塾大学卒業後、新卒で出版社の宝島社に入社。独立後はケータイジャーナリスト/ライターとして幅広い媒体で執筆、コメントなどを行う。ケータイ業界が主な取材テーマ。

特集

BECOME A MEMBER

テクノエッジ友の会に登録しませんか?

今週の記事をまとめてチェックできるニュースレターを配信中。会員限定の独自コンテンツのほか、イベント案内なども優先的にお届けします。