iPhone Airはその薄さから、2014年に発売されたiPhone 6が簡単に折れ曲がってしまう問題「ベンドゲート」を想起する人が多く、内部スペースの小ささからバッテリー消耗も早いのではないかとの声が一部ではありました。
Google DeepMindとトロント大学の研究者らによるこの研究は、AIエージェントが人間の監視を超えた速度と規模で相互に取引を行う「AIエージェント経済」という未来について、示唆を提供しています。
AI作曲サービスの最高峰といってもいいSunoがバージョンアップを重ね、9月24日にv5に到達しました。まだDAW完全対応、MIDI出力は実装していませんが、その前に作曲モデルを刷新した感じです。
NVIDIAは、ChatGPTを開発するOpenAIに最大1000億ドル(約14兆7800億円)を投資し、同社のAI向けGPU数百万基を使用する、最大10GWの「次世代AIインフラ」を構築することを明らかにしました。
6~8月、休載していたこともあり、今回と次回はこの間リリースされたものなどを順にご紹介し、現時点=9月に追い付きたいと思う。まず6月から。
「8インチフロッピーディスク(FD)」は、IBMが開発した磁気ディスク。フィルムに磁性体を塗布したディスクを記録部とし、塩化ビニルなどで作られたジャケットに封入したメディアです。
AIに同じ質問すると毎回微妙に違う返答になる謎を解き明かした研究や、バイトダンスが開発した文字・画像・音声から話す人物動画を生成できるAIモデル「HuMo」を取り上げます。
「3.5インチMOディスク」(第1世代)は、光と磁気を使って読み書きを行う光磁気ディスクのひとつ。容量は128MB。
年に一度のカンファレンス Meta Connect 2025で、Metaのマーク・ザッカーバーグがAIグラスの新製品 Ray-Ban Meta Display を発表しました。
都市部で携帯用の電波が届かない場所は見つけることが難しい。そんな中で、ローカルLLMを使う必要があるのか? そう考えたスタッフは電波的秘境、石神井公園駅ライオンズマンション地下飲食街にあるつけ麺の名店、「麺処 井の庄」に向かった。
「Q-PAK」は、SyQuest社最初の製品となるリムーバブルHDDドライブ、「SQ306RD」用に作られたカートリッジ。「Q100」という名前で呼ばれることもあります。
OpenAIは、ChatGPTが18歳未満のユーザーと接する際に、プライバシーや自由な会話よりも安全性を優先するためのポリシー変更を行うことを明らかにしました。
9月16日、Apple Intelligenceを大々的にフィーチャーしたOSアップデートが行われました。純正ローカルLLMとチャットすることができました。
今回は、巨大なデータセンターに依存せず、世界中に散らばる個人PCが協力してAIを育てる分散型アプローチを提案した論文「Sharing is Caring: Efficient LM Post-Training with Collective RL Experience Sharing」を取り上げます。
「Nakamichi MBR-7.4」は、ナカミチが開発/販売したCD-ROMドライブ。ドライブ内に7枚までのCD-ROMを格納でき、利用時に任意の1枚へ自動で入れ替えてくれるのが特徴です。
「高密度8センチCD-R」は、ニコンが開発した光学メディア。通常の8センチCD-R(シングルCD-R)では185MBとなる容量を独自に拡張し、約1.6倍の300MBにまで増やしているのが特徴です。
スマートメディア(5V)は、東芝が開発したフラッシュメモリーメディア。1996年に標準化推進団体となるSSFDCフォーラムが設立され、採用する機器が登場するようになりました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第111回)は、まずTencentから2つの技術、小型の翻訳モデル「Hunyuan-MT」と1枚の画像から探索可能な3D世界を生成できる「HunyuanWorld-Voyager」をご紹介します。
iPhone 17、17 Air、17 Pro、17 Pro Maxの4モデルが正式に発表されました。その詳細は別記事に譲るとして、今回これらの機種がAI的視点からどうだったのかについて、細かいところを突いていきたいと思います。
Hitem3Dの4面図入力を試してみました。
3.5インチフロッピーディスク(FD)は、1980年にソニーが開発した磁気ディスク。マイクロフロッピーディスク(Micro Floppy Disk、MFD)、90mmフレキシブルディスクカートリッジ(90mm Flexible Disk Cartridge)とも呼ばれます。
アップルは、日本時間9月10日の「Awe dropping.」イベントで完全ワイヤレスイヤホンの新モデル AirPods Pro 3 と、スマートウォッチ製品の Apple Watch Series 11 / Ultra 3 / SE 3 を発表しました。
先日Xに投稿した写真がちょっとバズりました。長崎市稲佐山の中腹にあるホテルのレストランで撮影した、妻との写真が逆光で残念なことになっていたのが、Nano Bananaのおかげで見栄えのする写真になった、という報告とポストです。
Google検索の「AI Mode」(日本では「AIモード」)が、9月3日くらいから、英語設定にした私のアカウントでも利用できるようになっていました。Google I/Oでの発表以来、楽しみにしていたので、さっそく使ってみました。
日本語のGoogle検索が、生成AIを活用した「AIモード」に本日より順次対応するとアナウンスされました。PCやスマホのブラウザ、Android/iOSのGoogleアプリで利用可能になります。
今回は、OpenAIとジョージア工科大学の研究チームが発表した論文「Why Language Models Hallucinate」を取り上げます。大規模言語モデル(LLM)がなぜ事実と異なる情報「幻覚」(ハルシネーション)を自信満々に生成してしまうのか、その根本原因を明らかにして解決策を提案した研究です。
HeyGenでデジタルツインを作成して、しゃべらせてみました。まずは、こちらの動画をご覧ください。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第110回)は、4人会話の90分ポッドキャスト番組を生成できる音声合成モデル「VibeVoice」や、微調整なしでAIエージェントを進化させる記憶ベースの学習手法「Memento」を取り上げます。
今回は、医学ベンチマークテストで高い正答率を誇る大規模言語モデル(LLM)が、実際には医学的推論を行っているのではなく、訓練データのパターンを認識しているだけかもしれないという問題提起をした論文「Fidelity of Medical Reasoning in Large Language Models」を取り上げます。スタンフォード大学に所属する研究者らによる研究発表です。
生成AI動画制作は進化し、多機能でコスパ良い「DomoAI」。高品質動画やアバターなど多彩な機能を低価格で利用可能。
8月28日発売のPixel 10 Proを数日早く使わせてもらいました。ハードウェアの進化については詳しい方々にお任せして、ここではTensor 5とGemini nanoが支えるPixel 10 ProのAI機能を使ってみた話をしていきます。
Googleがnano-bananaとしてティーザームーブをかましていた、新しいAI画像生成モデルが、Gemini 2.5 Flash Imageとして公開されました。これまでとは次元が違う、参照画像とプロンプトによる編集機能が話題となっています。
Mac、PCでほぼ満足のいく大規模言語モデルが使えるようになった今、じゃあスマートフォンならどうなのよ、となりますよね、普通。
アップルのティム・クックCEOは、現地時間9月9日午前10時、日本時間では9日午前2時から、新製品発表イベントを開催することを明らかにしました。今回のイベントでは、iPhone 17 / 17 Pro / 17 Pro Maxと、うわさの薄型iPhone、iPhone 17 Airの発表が予想されています。
実用的なTTS(Text to Speech)が出てもう長いこと経ちます。隠れマルコフモデルを使ったOpen JTalkで自分のボイスクローンを作り、ポッドキャストに参加させたり、RVCで相方の声真似をして遊んだり、いろいろ声の実験をしてきました。
イーロン・マスク氏のxAIは、Grok 2.5モデルをオープンソース化しました。Grok 3も今後6か月以内にオープンソースにする計画だと述べています。
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。
株式会社ハイレゾの玄海町データセンター開所式を取材してきました。福岡から車で2時間半、佐賀県の玄海町にある旧有徳小学校がAI時代の新しいインフラ拠点として生まれ変わった現場です。
MetaのAI責任者Alexander Wang氏は、ThreadsおよびXへの投稿でAIによる画像や動画生成技術を開発するMidjourneyと提携することを発表しました。
少し前からベータテスターによるインプレッションが投稿されていたAI音楽生成サービス「Tunee」の招待がきたので、さっそく試してみました。
Googleが発表した最新スマートフォン Pixel 10シリーズは、全機種Qi2準拠のマグネット式ワイヤレス充電技術「Pixelsnap」に対応。AppleのMagSafeアクセサリも使えます。
Next.jsの開発元として知られるVercelは、自然言語のプロンプトからアプリを生成するサービス「v0」を刷新し、エージェント機能を備えたアプリ開発サービスになったことを明らかにしました。