OpenAIはチャット型大規模言語モデルの最新版である「GPT-5」を発表しました。筆者のところにはまだブラウザには来ておらず、iPhoneアプリのみ使える状態ですが、取り急ぎ、使ってみた感想をレポートします。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第107回)は、猫文をプロンプトに混ぜるとAIが混乱して数学の問題を大幅に間違える脆弱性「CatAttack」や、テキストや画像からプレイできる360度な3Dゲームワールドを生成できるAI「HunyuanWorld 1.0」を取り上げます。
Google Cloudは、ビジネスユーザーからの自然言語による質問を基にデータ分析用のPythonコードを生成し実行する新機能「Code Interpreter」をプレビュー公開しました。
やってきましたね。世の中のPCユーザーたちがMacユーザーを羨望の眼差しで見るときが。
生成AIワークショップの特別編として、松尾公也が講師としてお話しする回を設けたいと思います。2025年8月12日19時から、オンラインでの開催となります。
今回は、わずか2700万パラメータという小規模なモデルでありながら、複雑な推論タスクにおいて最先端の大規模言語モデル(LLM)を凌駕するモデルを開発した論文「Hierarchical Reasoning Model」を取り上げます。
イーロン・マスクのAI企業であるxAIが開発し、Xにも組み込まれているGrokに、動画生成機能「Imagine」が搭載されました。現在ウェイティングリスト方式で、一部のユーザーに解放されています。
回の「生成AIウィークリー」(第106回)は、写真1枚からその中を自由に歩き回れる動画世界を生成できるAIモデル「Yume」、AIが自律的に新しいAIアーキテクチャを設計・実装・検証するシステム「ASI-ARCH」を取り上げます。
AI作曲サービスとしてはSunoが総合力で突出して、それに音質一点突破でUdioが続くという構図が長く(といっても1年くらいですが)続いてきましたが、異変が起きました。
OpenAIは、ChatGPTに新機能「学習モード(Study Mode)」を追加したと発表しました。
今回は、古代ローマの碑文の欠けた文字を復元し、その文章の内容や書かれた時代、場所を推定するAIシステムを提案した論文「Contextualizing ancient texts with generative neural networks」を取り上げます。Google DeepMindやノッティンガム大学などに所属する研究者らがNature誌で発表しました。
スマホ沼 第11回配信は第6回でもやりましたハカセとACCNの海外取材ライブビューイングです。
バンコクにVERTUの店を発見。超高級スマホが約95万円から。デザインや素材の異なるモデルも販売。スマートウォッチも展開している
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第105回)は、脳を読み取って画像を編集できるAI技術「LoongX」や、大規模言語モデルを3分の1に小型化し推論速度2倍を実現する技術「MoR」を取り上げます。
7月23日、米国のドナルド・トランプ大統領は政府の「AI行動計画(Action Plan)」を発表しました。
今回は、子どもが11歳のときに書いた短い作文から、その子の将来の最終学歴や認知能力をAIが予測できるかを調査した論文「Large language models predict cognition and education close to or better than genomics or expert assessment」を取り上げます。
Netflixは2025年第2四半期の決算発表で、4月30日から配信を開始したSFドラマシリーズ『The Eternaut(エテルナウタ)』のなかで、自社作品として初めて生成AIをVFX(視覚効果)に使用したことを明らかにしました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第104回)は、エージェント機能搭載のオープンソース非思考型言語モデル「Kimi K2」や、大規模言語モデル(LLM)向け長期記憶OS「MemOS」を取り上げます。
AI作曲サービスのSunoが魅力的な機能を追加した新モデルv4.5+を公開しました。有料プランのユーザーが利用できます。
フィンランド・サンフランシスコを拠点とするŌURA(オーラ)は7月17日、最新スマートリング「Oura Ring 4」の日本での正式販売を開始すると発表しました。価格は52,800円から74,800円で、カラーや仕上げにより異なります。
マイクロソフトは、Microsoft Storeを通じてMicrosoft Copilotのアップデート提供を開始するとし、その最新の更新プログラムで、Copilot Visionに「Desktop Share(デスクトップ共有)」機能を追加すると発表しました。
今回は、現在のAIモデルが次に来るものを予測することによって、その背後にある深い仕組みを理解できているかを調査した論文「What Has a Foundation Model Found? Using Inductive Bias to Probe for World Models」を取り上げます。ハーバード大学とMITの研究チームによる発表です。
OpenAIによるWindsurf買収が破談となり、創業者や主要開発者がGoogleに引き抜かれましたが、残ったWindsurfの行方が決まりました。
xAIが開発する対話型AI「Grok」のiOSアプリに、3Dアバター機能「コンパニオンモード」が新たに追加されました。
Adobeがクリエーター向けツール・サービス全部入りセット Creative Cloud コンプリートプランの大幅割引キャンペーンを実施中です。
主要なAIコードエディタの1つである「Windsurf」を開発する同名のWindsurfは、同社CEOであるVarun Mohan氏、共同創業者のDouglas Chen氏、および同社の研究開発部門の社員数名が、Googleに移籍したことを発表しました。
7月12日にNHK総合テレビで放映された「知的探求フロンティア タモリ・山中伸弥の!?」第1回「AIは人間を超えるか」の中で、筆者のAIに関する取り組みがドキュメント「AIのある人生」として、取り上げられました。
NHK総合で放送される新番組「知的探求フロンティア タモリ・山中伸弥の!?(びっくりはてな)」は、2カ月に1回の「知的探求エンターテインメント番組」だそうで、第1回は7月12日19時30分からスタートします。
任天堂が「2本でお得 ニンテンドーカタログチケット」の販売終了を告知しました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第103回)は、プレイしながらプロンプトでゲームの世界をリアルタイム生成していくAIゲームエンジン「Mirage」や、Appleの新コーディング生成AI「DiffuCoder」を取り上げます。
破産した秀和システムの出版事業を引き継いだ会社からの連絡を読んで、思わず笑ってしまいました。
世の中の流れは生成AIに向かうのは確実ですが、現時点ではリスクが大きい、でも従来手法ではコストがかかりすぎる……そんなユーザーに向け、「実在AIによる人物ビジネス画像提供」システム提供を始めたところがあります。
7月8日、イーロン・マスク氏が設立したAI企業で、最近Xと合併したxAIのAIチャットボット「Grok」が、ナチス・ドイツの独裁者アドルフ・ヒトラーを称賛し、反ユダヤ的表現を含む投稿を幾度も行っていることが報告されて物議を醸しています。
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、大規模言語モデル(LLM)を活用した都市シミュレーターを紹介した論文「CitySim: Modeling Urban Behaviors and City Dynamics with Large-Scale LLM-Driven Agent Simulation」を取り上げます。
高精細の2D→3Dモデル変換で衝撃を与えたSparc3Dの商用版であるHitem3Dが有料サブスクリプションに対応しました。有料ユーザーは待望のテクスチャ対応が使えるようになりました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第102回)は、自分が生成した画像を自己評価して修正する画像生成AI「OmniGen2」、プロンプトだけで大規模言語モデル(LLM)を瞬時に微調整相当の専門モデルに作り上げる方法「Drag-and-Drop LLMs」を取り上げます。
日本XREALが、ARグラスの新製品 XREAL One Pro を国内向けに発表しました。
コンピュータ関連書籍の出版社として知られる、秀和システムの出版事業が終わることが決まりました。8月末に同社から新刊を予定していた筆者はどうすれば良いのでしょうか?
シャオミのAIめがね「Xiaomi AI Glass」が約4万円で中国発売。カメラ・音声操作・支払い対応で便利、グローバル展開に期待。
動画生成AIツールで知られるRunwayが、米国のケーブルテレビ会社AMCとの協力により、早ければ今週にもゲーム業界向けの生成AIプラットフォーム「Game Worlds」を一般公開すべく準備を進めています。
今回は、人工知能技術の急速な発展により登場した、「AIエージェント」(AI Agents)と「エージェント型AI」(Agentic AI)という2つの概念の違いを説明した論文「AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges」を取り上げます。
AI作曲サービスのSunoが、AIクラウドDAWのWavToolを買収しました。