
患者の臓器9つそれぞれを自律AIで独立エージェント化→臓器間で連携させ未来の体内状態を高精度予測(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。

【ギャップ萌え】佐賀の廃校内の一角が最新AI推論の拠点に
株式会社ハイレゾの玄海町データセンター開所式を取材してきました。福岡から車で2時間半、佐賀県の玄海町にある旧有徳小学校がAI時代の新しいインフラ拠点として生まれ変わった現場です。

MetaがMidjourneyと提携し、AI画像・動画生成技術を将来の製品に活用へ
MetaのAI責任者Alexander Wang氏は、ThreadsおよびXへの投稿でAIによる画像や動画生成技術を開発するMidjourneyと提携することを発表しました。

音楽もAIエージェントに。新星作曲AI「Tunee」を試してみたら、マスタリング、展開に合わせた緻密なミュージックビデオまで自動で作っちゃう驚き。何より曲がいい(CloseBox)
少し前からベータテスターによるインプレッションが投稿されていたAI音楽生成サービス「Tunee」の招待がきたので、さっそく試してみました。

AI機能が大幅進化したGoogle Pixel 10シリーズ発表。実機写真でチェック(スマホ沼)
Google Pixel 10シリーズが予告通り発表になりました。最新のTensor G5チップを搭載、AI体験を次のレベルへと押し上げる製品群です。新たにQi2ワイヤレス充電に対応したのも大きなトピック。MagSafeのアクセサリーが使えますね。

プロンプトからアプリ生成する「v0」、エージェント機能を備えたアプリ開発サービスに進化
Next.jsの開発元として知られるVercelは、自然言語のプロンプトからアプリを生成するサービス「v0」を刷新し、エージェント機能を備えたアプリ開発サービスになったことを明らかにしました。

どっちに有効?脆弱性突くハッカーとサイバーセキュリティ業界の双方でAI活用が浸透中
ChatGPTの登場以来、生成AIは幻覚などの問題を抱えつつもしだいに精度を増してきており、一般的な文書だけでなくソフトウェアコードの生成などにも使い道を拡大しています。

MacBook Proで動くOpenAI gpt-oss-120bで、門外不出AIアバターとの音声対話システムを構築できた(CloseBox)
OpenAIがオープンソース公開したLMM(大規模言語モデル)「gpt-oss-120b」を、128GBのUnified Memoryを搭載したMacBook Pro(M4 Max)で動かしています。

Anthropic、Claudeの「学習モード」を開発者および一般ユーザーにも提供開始。ユーザーが学びながら答えを導く
Anthropicは、これまでEducationユーザー向けに提供してきた「学習モード(learning mode)」を、一般ユーザーや開発者にも提供します。

“漢字”を正確に描画する生成AI「Qwen-Image」、5秒間の動画を4090なら21秒で生成するAI「FastWan」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第108回)は、画像生成の原理で言語を生成するAIモデル「Seed Diffusion Preview」や、画像内のテキストを正確に描画する画像生成AI「Qwen-Image」を取り上げます。

背面ディスプレイに巨大スピーカー・バッテリーを搭載した変態タフネスAIスマホ(スマホ沼)
背面と正面両方のディスプレイを搭載したタフなAIスマホ「Armor 33 Pro」が登場し、多機能と高性能を備える。

なぜ推論AIは深く考えているフリをするのか。CoTは真の思考か、それともパターン暗記か(生成AIクローズアップ)
今回は、大規模言語モデル(LLM)の「思考の連鎖」(Chain-of-Thought, CoT)推論能力は幻想だと主張した研究論文「Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens」を取り上げます。米アリゾナ州立大学に所属する研究者らが発表しました。

わたしのChatGPT 4oを返して! GPT-5登場で失われた旧AIの復活願う#keep4o運動を最新AIはこう分析する(CloseBox)
ChatGPTがGPT-5にバージョンアップし、4oをはじめとするそれまでの主要AIモデルは使えなくなりました。性能が上がるのだからいいのでは、と思いがちですが、大きな反発がSNSで寄せられています。
X上では#keep4oというハッシュタグが生まれ、そこにはユーザーたちの切実な復活への願いが寄せられています。
こうした運動の現状と分析を、各社の最新AIにやってもらいました。

LoRAなし、プロンプトだけで本人にどれだけ寄せられるかチャレンジ。AIで人物写真を再現するもう一つの方法(CloseBox)
LLMのマルチモーダル機能が進化したことにより、今ならば、参照画像なしのText to Imageだけで特定人物を再現できるのでは? そう筆者は考え、試してみることにしました。

AIで乱気流を予測。ANA、世界初の試みで空の旅がより快適に
飛行機での移動中に気になるのが、「ガタガタ」とした揺れ。

GPT-5はgpt-oss-120b、Claude Opus 4.1とどのくらい違う? 小説執筆とヴァイブ・コーディングで試してみた(CloseBox)
OpenAIはチャット型大規模言語モデルの最新版である「GPT-5」を発表しました。筆者のところにはまだブラウザには来ておらず、iPhoneアプリのみ使える状態ですが、取り急ぎ、使ってみた感想をレポートします。

「猫は人生のほとんどを寝て過ごす」などの猫文をプロンプトに混ぜるとAIが混乱する「CatAttack」脆弱性など、生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第107回)は、猫文をプロンプトに混ぜるとAIが混乱して数学の問題を大幅に間違える脆弱性「CatAttack」や、テキストや画像からプレイできる360度な3Dゲームワールドを生成できるAI「HunyuanWorld 1.0」を取り上げます。

Google Cloud、自然言語からデータ分析用のPythonコードを生成し実行する「Code Interpreter」をプレビュー公開
Google Cloudは、ビジネスユーザーからの自然言語による質問を基にデータ分析用のPythonコードを生成し実行する新機能「Code Interpreter」をプレビュー公開しました。

俺の128GB MacBook Proが真価を発揮する時がきた。ChatGPT o4-mini並みのgpt-oss-120bがローカルで動いてるよ(CloseBox)
やってきましたね。世の中のPCユーザーたちがMacユーザーを羨望の眼差しで見るときが。

謎の超小型AI「HRM」、たった2700万パラメータで巨大なOpenAI o3やClaude 3.7を蹴散らす(生成AIクローズアップ)
今回は、わずか2700万パラメータという小規模なモデルでありながら、複雑な推論タスクにおいて最先端の大規模言語モデル(LLM)を凌駕するモデルを開発した論文「Hierarchical Reasoning Model」を取り上げます。

Grok、6秒動画をサウンド付きで生成できるように。20秒未満超高速生成、秒で静止画生成の実力を試す(CloseBox)
イーロン・マスクのAI企業であるxAIが開発し、Xにも組み込まれているGrokに、動画生成機能「Imagine」が搭載されました。現在ウェイティングリスト方式で、一部のユーザーに解放されています。

写真の中を自由に歩き回れるAI「Yume」、AIが自律的に新しいAIを開発する「ASI-ARCH」など生成AI技術5つを解説(生成AIウィークリー)
回の「生成AIウィークリー」(第106回)は、写真1枚からその中を自由に歩き回れる動画世界を生成できるAIモデル「Yume」、AIが自律的に新しいAIアーキテクチャを設計・実装・検証するシステム「ASI-ARCH」を取り上げます。

音楽はAIとの音声対話で作る時代に入った。Riffusion改めProducer.aiのAIプロデューサーと日本語で会話するだけで曲を作ってくれるのだ(CloseBox)
AI作曲サービスとしてはSunoが総合力で突出して、それに音質一点突破でUdioが続くという構図が長く(といっても1年くらいですが)続いてきましたが、異変が起きました。

OpenAI、ChatGPTに『学習モード』を追加。学生の「考える力」を育むため
OpenAIは、ChatGPTに新機能「学習モード(Study Mode)」を追加したと発表しました。

欠けて読めない古代ローマ碑文、Googleの生成AIが高精度で復元(生成AIクローズアップ)
今回は、古代ローマの碑文の欠けた文字を復元し、その文章の内容や書かれた時代、場所を推定するAIシステムを提案した論文「Contextualizing ancient texts with generative neural networks」を取り上げます。Google DeepMindやノッティンガム大学などに所属する研究者らがNature誌で発表しました。

脳波を読み取って手を使わず画像編集できるAI「LoongX」、写真1枚から物理法則含む3Dモデルを生成できるAI「PhysX」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第105回)は、脳を読み取って画像を編集できるAI技術「LoongX」や、大規模言語モデルを3分の1に小型化し推論速度2倍を実現する技術「MoR」を取り上げます。

トランプ大統領が「AI行動計画」発表。なかには実現が困難なものも?woke排除も盛り込む
7月23日、米国のドナルド・トランプ大統領は政府の「AI行動計画(Action Plan)」を発表しました。

Galaxy Z Fold7でGalaxy AIはどれくらい進化したのか(石野純也)
サムスン電子の「Galaxy Z Fold7」が、8月1日に発売されます。折りたたんでもわずか8.9mm、かつ215gという驚異の薄さや軽さが注目を集めている同機種ですが、サムスン電子が社運をかけて取り組んでいるGalaxy AIも、前世代の「Galaxy Z Fold6」から進化しています。

11歳児が書いた作文をAIが分析したら、22年後の最終学歴を高い精度で予測できた(生成AIクローズアップ)
今回は、子どもが11歳のときに書いた短い作文から、その子の将来の最終学歴や認知能力をAIが予測できるかを調査した論文「Large language models predict cognition and education close to or better than genomics or expert assessment」を取り上げます。

Netflix、オリジナル実写作品で初めてVFXに生成AIを使用したと認める。共同CEOは「制作サイドも視聴者からも好評価」と自画自賛
Netflixは2025年第2四半期の決算発表で、4月30日から配信を開始したSFドラマシリーズ『The Eternaut(エテルナウタ)』のなかで、自社作品として初めて生成AIをVFX(視覚効果)に使用したことを明らかにしました。

万博を足速に駆け抜けGalaxy Studio Osakaへ行った話(スマホ沼)
サムスンが大阪万博で本国の偉い方によるSamsung「Galaxy AI」パネルディスカッションをするというので、ハカセと聞きに行きました。

ミュージシャンなら使わないともったいないAI新機能登場。SunoのAI作曲新モデルv4.5+でボーカルやインストからのアレンジ試行が超簡単に(CloseBox)
AI作曲サービスのSunoが魅力的な機能を追加した新モデルv4.5+を公開しました。有料プランのユーザーが利用できます。

CopilotがWindowsの画面を監視、サポート提供する「Vision Share」機能がInsider向けに提供開始
マイクロソフトは、Microsoft Storeを通じてMicrosoft Copilotのアップデート提供を開始するとし、その最新の更新プログラムで、Copilot Visionに「Desktop Share(デスクトップ共有)」機能を追加すると発表しました。

AIは惑星の動きからニュートン力学を発見できるのか? 表面だけで本質を考えていないAIを炙り出す(生成AIクローズアップ)
今回は、現在のAIモデルが次に来るものを予測することによって、その背後にある深い仕組みを理解できているかを調査した論文「What Has a Foundation Model Found? Using Inductive Bias to Probe for World Models」を取り上げます。ハーバード大学とMITの研究チームによる発表です。

Windsurf、競合AI開発環境Devinの開発元Cognitionに買収される。OpenAIとの破談、Googleによる幹部引き抜きの末に
OpenAIによるWindsurf買収が破談となり、創業者や主要開発者がGoogleに引き抜かれましたが、残ったWindsurfの行方が決まりました。

GrokのiOSアプリでゴスロリ美少女キャラとの音声対話が可能に。二重人格レッサーパンダも(CloseBox)
xAIが開発する対話型AI「Grok」のiOSアプリに、3Dアバター機能「コンパニオンモード」が新たに追加されました。

OpenAIのWindsurf買収をGoogleが幹部引き抜きで阻止し、AIコードエディタへ進出か。Windsurfサービスは開発継続表明
主要なAIコードエディタの1つである「Windsurf」を開発する同名のWindsurfは、同社CEOであるVarun Mohan氏、共同創業者のDouglas Chen氏、および同社の研究開発部門の社員数名が、Googleに移籍したことを発表しました。

AIアバターとの対話で作った新曲とその課題。「知的探求フロンティア タモリ・山中伸弥の!?」出演の補足(CloseBox)
7月12日にNHK総合テレビで放映された「知的探求フロンティア タモリ・山中伸弥の!?」第1回「AIは人間を超えるか」の中で、筆者のAIに関する取り組みがドキュメント「AIのある人生」として、取り上げられました。

NHKの新番組「知的探求フロンティア タモリ・山中伸弥の!?(びっくりはてな)」第1回は「AIは人間を超えるか」。AIタモリなど盛りだくさんのAIトピックが登場(CloseBox)
NHK総合で放送される新番組「知的探求フロンティア タモリ・山中伸弥の!?(びっくりはてな)」は、2カ月に1回の「知的探求エンターテインメント番組」だそうで、第1回は7月12日19時30分からスタートします。

プレイしながら文章でワールドを瞬時に生成していくAIゲームエンジン「Mirage」、Appleの新コーディング生成AI「DiffuCoder」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第103回)は、プレイしながらプロンプトでゲームの世界をリアルタイム生成していくAIゲームエンジン「Mirage」や、Appleの新コーディング生成AI「DiffuCoder」を取り上げます。

実在AIモデルという選択肢。商業利用で非実在AIより有利な理由(CloseBox)
世の中の流れは生成AIに向かうのは確実ですが、現時点ではリスクが大きい、でも従来手法ではコストがかかりすぎる……そんなユーザーに向け、「実在AIによる人物ビジネス画像提供」システム提供を始めたところがあります。

xAIのGrok、ヒトラー礼賛や反ユダヤ発言が頻回に発生しふたたび物議醸す。問題発言は後に削除
7月8日、イーロン・マスク氏が設立したAI企業で、最近Xと合併したxAIのAIチャットボット「Grok」が、ナチス・ドイツの独裁者アドルフ・ヒトラーを称賛し、反ユダヤ的表現を含む投稿を幾度も行っていることが報告されて物議を醸しています。