AI

OpenAIサム・アルトマンとジョナサン・アイブのコラボAI製品、「技術的問題」で開発難航中との報。プライバシーの対処などに苦慮か 画像
ウェアラブル

OpenAIサム・アルトマンとジョナサン・アイブのコラボAI製品、「技術的問題」で開発難航中との報。プライバシーの対処などに苦慮か

OpenAIのサム・アルトマンCEOと元アップルのチーフデザイナーであるジョナサン・アイブ氏が手掛ける「新世代のAI搭載コンピューター製品」の開発が難航している模様です。

Sora 2で生成の動画、別SNSに“AI素性隠して”大量投稿し再生数荒稼ぎ ウォーターマークを消すツールとアルトマン氏の著作権への対応(生成AIクローズアップ) 画像
AI

Sora 2で生成の動画、別SNSに“AI素性隠して”大量投稿し再生数荒稼ぎ ウォーターマークを消すツールとアルトマン氏の著作権への対応(生成AIクローズアップ)

今回は動画生成AI「Sora 2」を悪用する動きと、OpenAIのサム・アルトマンCEOが著作権に関した今後の変更方針を言及した内容を取り上げます。

Sora 2にはまだ上があった。15秒までAI動画生成できるSora 2 Proがやってきた(CloseBox) 画像
AI

Sora 2にはまだ上があった。15秒までAI動画生成できるSora 2 Proがやってきた(CloseBox)

Sora 2祭りはまだ続いていますが、Sora 2の上位版が登場しました。Sora 2 Proです。

PerplexityのAIブラウザー「Comet」が無料化。月額200ドルのMaxプランが不要に 画像
AI

PerplexityのAIブラウザー「Comet」が無料化。月額200ドルのMaxプランが不要に

AI検索スタートアップのPerplexityは、今年7月に月額200ドルのMaxプラン登録ユーザー向けとしてリリースしたばかりのAI搭載ウェブブラウザー「Comet」を、このたび無料化し、誰でも利用可能にしたと発表しました。

生成AIがゼロから完全なソフトリポジトリを開発するMicrosoftの「ZeroRepo」、細菌を殺すウイルスをAIが生成した世界初の研究など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

生成AIがゼロから完全なソフトリポジトリを開発するMicrosoftの「ZeroRepo」、細菌を殺すウイルスをAIが生成した世界初の研究など生成AI技術5つを解説(生成AIウィークリー)

今回の「生成AIウィークリー」(第114回)は、アリババ開発のテキスト・画像・音声・動画を統合したマルチモーダルAIモデル「Qwen3-Omni」や、マイクロソフト開発のAIにゼロからソフトウェアリポジトリを生成させる「ZeroRepo」を取り上げます。

Sora 2の中の人が歌った10秒の曲から1曲まるごとのミュージックビデオを作る方法(CloseBox) 画像
AI

Sora 2の中の人が歌った10秒の曲から1曲まるごとのミュージックビデオを作る方法(CloseBox)

Sora 2が公開され、日本のiPhoneユーザーはおおいに遊んでいるようで何よりです。筆者は以前からやっているミュージックビデオ制作でSora 2を活用してみたので、そのやり方を書き留めておきます。

WindowsのローカルAI実行基盤「Windows ML」が正式版に。CPU/GPU/NPUなどのハードウェアを抽象化しONNX形式AIモデルを実行 画像
AI

WindowsのローカルAI実行基盤「Windows ML」が正式版に。CPU/GPU/NPUなどのハードウェアを抽象化しONNX形式AIモデルを実行

マイクロソフトは、Windows上でローカルAIを実行するための基盤となる「Windows ML」の正式版リリースを発表しました。

自分を他の動画にカメオ出演させられるOpenAIの動画生成AI「Sora 2」を使ってみた。iPhone必須&招待制で日本も対象に(CloseBox) 画像
AI

自分を他の動画にカメオ出演させられるOpenAIの動画生成AI「Sora 2」を使ってみた。iPhone必須&招待制で日本も対象に(CloseBox)

OpenAIは10月1日(米国では9月30日)、動画生成AIモデルであるSoraの次期バージョン、「Sora 2」を発表しました。

Google開発「学校の教科書」、生徒の興味に合わせて生成AIが内容を変える(生成AIクローズアップ) 画像
AI

Google開発「学校の教科書」、生徒の興味に合わせて生成AIが内容を変える(生成AIクローズアップ)

GoogleのLearnLMチームが開発した、生徒の興味や理解によって生成AIがその人に合わせた内容に自動変更する教科書システムを提案した論文「Towards an AI-Augmented Textbook」を取り上げます。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第51回:Qwen-Image旋風だった2025年8月まとめ(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第51回:Qwen-Image旋風だった2025年8月まとめ(西川和久)

2025年8月

VC以上の目利きAI「VCBench」、OpenAIのDeep Researchと同等性能のオープンソースAIエージェント「Tongyi DeepResearch」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

VC以上の目利きAI「VCBench」、OpenAIのDeep Researchと同等性能のオープンソースAIエージェント「Tongyi DeepResearch」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第113回)は、AIの世界理解を向上させる大規模データセット「OmniWorld」や、アリババグループ開発のオープンソースAIエージェント「Tongyi DeepResearch」を取り上げます。

作曲AIが新時代に突入。SunoがMIDI出力とマルチトラック編集(DAW)に対応、Tuneeは6曲同時生成で一般公開(CloseBox) 画像
AI

作曲AIが新時代に突入。SunoがMIDI出力とマルチトラック編集(DAW)に対応、Tuneeは6曲同時生成で一般公開(CloseBox)

9月26日、AI作曲サービスのSunoとTuneeがそれぞれ新機能を発表しました。Sunoは待望のDAW内蔵とMIDI出力を、これまでクローズドベータだったTuneeは一般公開を始め、1つのプロンプトから3つの歌詞・音楽スタイルをそれぞれ2曲ずつ、合計6曲を同時に生成できるようになりました。

OpenAI、ChatGPTが朝イチに知りたい情報をまとめてくれる新機能「 Pulse」を発表。月額200ドルのProプランユーザー向け 画像
AI

OpenAI、ChatGPTが朝イチに知りたい情報をまとめてくれる新機能「 Pulse」を発表。月額200ドルのProプランユーザー向け

OpenAIは、月額200ドル(約3万円)のChatGPT Proプランに新機能「Pulse」を追加すると発表しました。

AIエージェントらは独自経済圏を自然に作り始める。Googleが描く到来不可避の”AIエージェント経済”の未来(生成AIクローズアップ) 画像
AI

AIエージェントらは独自経済圏を自然に作り始める。Googleが描く到来不可避の”AIエージェント経済”の未来(生成AIクローズアップ)

Google DeepMindとトロント大学の研究者らによるこの研究は、AIエージェントが人間の監視を超えた速度と規模で相互に取引を行う「AIエージェント経済」という未来について、示唆を提供しています。

打てば響く、「キラキラしたフェイザーの入ったローズ」「伝説級のギターリフ」プロンプトが確実に反映されるAI作曲最新モデル「Suno v5」の実力(CloseBox) 画像
AI

打てば響く、「キラキラしたフェイザーの入ったローズ」「伝説級のギターリフ」プロンプトが確実に反映されるAI作曲最新モデル「Suno v5」の実力(CloseBox)

AI作曲サービスの最高峰といってもいいSunoがバージョンアップを重ね、9月24日にv5に到達しました。まだDAW完全対応、MIDI出力は実装していませんが、その前に作曲モデルを刷新した感じです。

NVIDIAがOpenAIに最大1000億ドル投資へ。10GWのAIインフラを段階的に導入予定 画像
AI

NVIDIAがOpenAIに最大1000億ドル投資へ。10GWのAIインフラを段階的に導入予定

NVIDIAは、ChatGPTを開発するOpenAIに最大1000億ドル(約14兆7800億円)を投資し、同社のAI向けGPU数百万基を使用する、最大10GWの「次世代AIインフラ」を構築することを明らかにしました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第50回:2025年夏、画像AIに何が起こっていたのか。6月&7月まとめ(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第50回:2025年夏、画像AIに何が起こっていたのか。6月&7月まとめ(西川和久)

6~8月、休載していたこともあり、今回と次回はこの間リリースされたものなどを順にご紹介し、現時点=9月に追い付きたいと思う。まず6月から。

AIに同じ質問をするとなぜ毎回違う答えなのか? 元OpenAIチームが解明。毎回同じ返答をする新システムも開発など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

AIに同じ質問をするとなぜ毎回違う答えなのか? 元OpenAIチームが解明。毎回同じ返答をする新システムも開発など生成AI技術5つを解説(生成AIウィークリー)

AIに同じ質問すると毎回微妙に違う返答になる謎を解き明かした研究や、バイトダンスが開発した文字・画像・音声から話す人物動画を生成できるAIモデル「HuMo」を取り上げます。

画面つきAIメガネMeta Ray-Ban Display発表、筋電リストバンド同梱で799ドル。9月30日発売 画像
ウェアラブル

画面つきAIメガネMeta Ray-Ban Display発表、筋電リストバンド同梱で799ドル。9月30日発売

年に一度のカンファレンス Meta Connect 2025で、Metaのマーク・ザッカーバーグがAIグラスの新製品 Ray-Ban Meta Display を発表しました。

ここは電波の届かない地下つけ麺屋。iPhone内蔵のApple純正スタンドアロンLLM「アシスタント」と暇つぶしチャットしてみた(CloseBox) 画像
AI

ここは電波の届かない地下つけ麺屋。iPhone内蔵のApple純正スタンドアロンLLM「アシスタント」と暇つぶしチャットしてみた(CloseBox)

都市部で携帯用の電波が届かない場所は見つけることが難しい。そんな中で、ローカルLLMを使う必要があるのか? そう考えたスタッフは電波的秘境、石神井公園駅ライオンズマンション地下飲食街にあるつけ麺の名店、「麺処 井の庄」に向かった。

OpenAI、18歳未満ChatGPTユーザーに導入する制限について説明。「10代の若者のプライバシーと自由よりも安全を優先」へ 画像
AI

OpenAI、18歳未満ChatGPTユーザーに導入する制限について説明。「10代の若者のプライバシーと自由よりも安全を優先」へ

OpenAIは、ChatGPTが18歳未満のユーザーと接する際に、プライバシーや自由な会話よりも安全性を優先するためのポリシー変更を行うことを明らかにしました。

iOS 26始動。Apple IntelligenceのFoundation Modelとネット無接続でチャットしたら「iPhone純正LLM、意外とやるじゃん」(CloseBox) 画像
AI

iOS 26始動。Apple IntelligenceのFoundation Modelとネット無接続でチャットしたら「iPhone純正LLM、意外とやるじゃん」(CloseBox)

9月16日、Apple Intelligenceを大々的にフィーチャーしたOSアップデートが行われました。純正ローカルLLMとチャットすることができました。

巨大データセンターではなく、世界中に散らばる個人PCが協力してAIを学習「SAPO」 “市民参加型AI開発”の衝撃(生成AIクローズアップ) 画像
AI

巨大データセンターではなく、世界中に散らばる個人PCが協力してAIを学習「SAPO」 “市民参加型AI開発”の衝撃(生成AIクローズアップ)

今回は、巨大なデータセンターに依存せず、世界中に散らばる個人PCが協力してAIを育てる分散型アプローチを提案した論文「Sharing is Caring: Efficient LM Post-Training with Collective RL Experience Sharing」を取り上げます。

“生成AIのせい”で新卒雇用は減るが代替できない経験を持つ熟練者は安泰、新しいブラックホールを見つけるGoogle開発AIなど生成AI技術5つを解説(生成AIウィークリー) 画像
AI

“生成AIのせい”で新卒雇用は減るが代替できない経験を持つ熟練者は安泰、新しいブラックホールを見つけるGoogle開発AIなど生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第111回)は、まずTencentから2つの技術、小型の翻訳モデル「Hunyuan-MT」と1枚の画像から探索可能な3D世界を生成できる「HunyuanWorld-Voyager」をご紹介します。

AIデバイスとしてのiPhone 17世代はどうだったのか? A19 Proを搭載したiPhone AirがMacBook Pro並みの処理性能って本当?(CloseBox) 画像
AI

AIデバイスとしてのiPhone 17世代はどうだったのか? A19 Proを搭載したiPhone AirがMacBook Pro並みの処理性能って本当?(CloseBox)

iPhone 17、17 Air、17 Pro、17 Pro Maxの4モデルが正式に発表されました。その詳細は別記事に譲るとして、今回これらの機種がAI的視点からどうだったのかについて、細かいところを突いていきたいと思います。

高精度の2D→3DモデリングAIサービスのHitem3Dが4面図入力に対応したので人物で試したらリアルすぎた(CloseBox) 画像
AI

高精度の2D→3DモデリングAIサービスのHitem3Dが4面図入力に対応したので人物で試したらリアルすぎた(CloseBox)

Hitem3Dの4面図入力を試してみました。

Nano Bananaで蘇る思い出の逆光写真。画像編集ソフトとしてのナノバナナの実力(CloseBox) 画像
AI

Nano Bananaで蘇る思い出の逆光写真。画像編集ソフトとしてのナノバナナの実力(CloseBox)

先日Xに投稿した写真がちょっとバズりました。長崎市稲佐山の中腹にあるホテルのレストランで撮影した、妻との写真が逆光で残念なことになっていたのが、Nano Bananaのおかげで見栄えのする写真になった、という報告とポストです。

新しいGoogle検索「AIモード」が始まったけど、Geminiとどう使い分けたらいいの?(Google Tales) 画像
AI

新しいGoogle検索「AIモード」が始まったけど、Geminiとどう使い分けたらいいの?(Google Tales)

Google検索の「AI Mode」(日本では「AIモード」)が、9月3日くらいから、英語設定にした私のアカウントでも利用できるようになっていました。Google I/Oでの発表以来、楽しみにしていたので、さっそく使ってみました。

20年続いたGoogle検索が変わる。日本語版「AIモード」で“考える検索”へ 画像
AI

20年続いたGoogle検索が変わる。日本語版「AIモード」で“考える検索”へ

日本語のGoogle検索が、生成AIを活用した「AIモード」に本日より順次対応するとアナウンスされました。PCやスマホのブラウザ、Android/iOSのGoogleアプリで利用可能になります。

OpenAI、「幻覚」の根本原因と対策を解明。ハルシネーションは「難問に直面した学生と同じ」(生成AIクローズアップ) 画像
AI

OpenAI、「幻覚」の根本原因と対策を解明。ハルシネーションは「難問に直面した学生と同じ」(生成AIクローズアップ)

今回は、OpenAIとジョージア工科大学の研究チームが発表した論文「Why Language Models Hallucinate」を取り上げます。大規模言語モデル(LLM)がなぜ事実と異なる情報「幻覚」(ハルシネーション)を自信満々に生成してしまうのか、その根本原因を明らかにして解決策を提案した研究です。

「そろそろAIアバターに仕事を代わってもらおうか」HeyGenで作ったデジタルツインに数ヵ国語を喋らせてみた結果 画像
AI

「そろそろAIアバターに仕事を代わってもらおうか」HeyGenで作ったデジタルツインに数ヵ国語を喋らせてみた結果

HeyGenでデジタルツインを作成して、しゃべらせてみました。まずは、こちらの動画をご覧ください。

GPT-5に迫る性能のオープンソースAIモデル「InternVL3.5」、4人会話の90分ポッドキャスト番組を生成できるAI「VibeVoice」、など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

GPT-5に迫る性能のオープンソースAIモデル「InternVL3.5」、4人会話の90分ポッドキャスト番組を生成できるAI「VibeVoice」、など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第110回)は、4人会話の90分ポッドキャスト番組を生成できる音声合成モデル「VibeVoice」や、微調整なしでAIエージェントを進化させる記憶ベースの学習手法「Memento」を取り上げます。

医療AI、ベンチマークは優秀なのになぜ現場で使えないのか? スタンフォード大学が医療AIの不都合を暴く(生成AIクローズアップ) 画像
AI

医療AI、ベンチマークは優秀なのになぜ現場で使えないのか? スタンフォード大学が医療AIの不都合を暴く(生成AIクローズアップ)

今回は、医学ベンチマークテストで高い正答率を誇る大規模言語モデル(LLM)が、実際には医学的推論を行っているのではなく、訓練データのパターンを認識しているだけかもしれないという問題提起をした論文「Fidelity of Medical Reasoning in Large Language Models」を取り上げます。スタンフォード大学に所属する研究者らによる研究発表です。

AI動画制作、最短ルート:話す・動く・高画質も一発で 画像
AI

AI動画制作、最短ルート:話す・動く・高画質も一発でPR

生成AI動画制作は進化し、多機能でコスパ良い「DomoAI」。高品質動画やアバターなど多彩な機能を低価格で利用可能。

Pixel 10 ProでAIが自然に溶け込んでいく「新しい日常」はどんな感じ?(Google Tales) 画像
AI

Pixel 10 ProでAIが自然に溶け込んでいく「新しい日常」はどんな感じ?(Google Tales)

8月28日発売のPixel 10 Proを数日早く使わせてもらいました。ハードウェアの進化については詳しい方々にお任せして、ここではTensor 5とGemini nanoが支えるPixel 10 ProのAI機能を使ってみた話をしていきます。

「奇跡の一枚」をもう一度、「残念な一枚」が待望の復活。編集自在の「Gemini 2.5 Flash Image」(Nano Banana)が画像生成AIのレベルを引き上げた(CloseBox) 画像
AI

「奇跡の一枚」をもう一度、「残念な一枚」が待望の復活。編集自在の「Gemini 2.5 Flash Image」(Nano Banana)が画像生成AIのレベルを引き上げた(CloseBox)

Googleがnano-bananaとしてティーザームーブをかましていた、新しいAI画像生成モデルが、Gemini 2.5 Flash Imageとして公開されました。これまでとは次元が違う、参照画像とプロンプトによる編集機能が話題となっています。

あなたのスマホでgpt-oss-20bは動く? iPhoneとAndroidでローカルLLM対決してみたら(CloseBox) 画像
AI

あなたのスマホでgpt-oss-20bは動く? iPhoneとAndroidでローカルLLM対決してみたら(CloseBox)

Mac、PCでほぼ満足のいく大規模言語モデルが使えるようになった今、じゃあスマートフォンならどうなのよ、となりますよね、普通。

薄型iPhoneも出る?アップル、iPhone 17発表イベントを日本時間9月10日午前2時より開催 画像
スマートフォン

薄型iPhoneも出る?アップル、iPhone 17発表イベントを日本時間9月10日午前2時より開催

アップルのティム・クックCEOは、現地時間9月9日午前10時、日本時間では9日午前2時から、新製品発表イベントを開催することを明らかにしました。今回のイベントでは、iPhone 17 / 17 Pro / 17 Pro Maxと、うわさの薄型iPhone、iPhone 17 Airの発表が予想されています。

複数話者ポッドキャストがAIだけでできるから、俺たちはもうお払い箱なの? 話題のVibeVoiceをインストールして試してみた(CloseBox) 画像
AI

複数話者ポッドキャストがAIだけでできるから、俺たちはもうお払い箱なの? 話題のVibeVoiceをインストールして試してみた(CloseBox)

実用的なTTS(Text to Speech)が出てもう長いこと経ちます。隠れマルコフモデルを使ったOpen JTalkで自分のボイスクローンを作り、ポッドキャストに参加させたり、RVCで相方の声真似をして遊んだり、いろいろ声の実験をしてきました。

Grok 2.5がオープンソース化。マスク氏「Grok 3も今後6か月以内に」 画像
AI

Grok 2.5がオープンソース化。マスク氏「Grok 3も今後6か月以内に」

イーロン・マスク氏のxAIは、Grok 2.5モデルをオープンソース化しました。Grok 3も今後6か月以内にオープンソースにする計画だと述べています。

患者の臓器9つそれぞれを自律AIで独立エージェント化→臓器間で連携させ未来の体内状態を高精度予測(生成AIクローズアップ) 画像
AI

患者の臓器9つそれぞれを自律AIで独立エージェント化→臓器間で連携させ未来の体内状態を高精度予測(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。

【ギャップ萌え】佐賀の廃校内の一角が最新AI推論の拠点に 画像
AI

【ギャップ萌え】佐賀の廃校内の一角が最新AI推論の拠点に

株式会社ハイレゾの玄海町データセンター開所式を取材してきました。福岡から車で2時間半、佐賀県の玄海町にある旧有徳小学校がAI時代の新しいインフラ拠点として生まれ変わった現場です。