AI

Mac版AIブラウザ「ChatGPT Atlas」の突破力に感歎。「Sunoで今日の天気を織り込んだ曲を作って」と頼んだらあっさりできちゃいました(CloseBox) 画像
AI

Mac版AIブラウザ「ChatGPT Atlas」の突破力に感歎。「Sunoで今日の天気を織り込んだ曲を作って」と頼んだらあっさりできちゃいました(CloseBox)

AIによるブラウザベースのエージェントがついに一線を超えました。自分的にですが。

生成AIグラビアワークショップ再開! 高性能なFLUX.1 [dev] 画像を数秒で生成できる謎技術「ヌンチャク」に迫る。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第4期第1回)を10月22日開催。テクノエッジ アルファ会員なら無料 画像
AI

生成AIグラビアワークショップ再開! 高性能なFLUX.1 [dev] 画像を数秒で生成できる謎技術「ヌンチャク」に迫る。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第4期第1回)を10月22日開催。テクノエッジ アルファ会員なら無料

テクノエッジ編集部では、生成AIグラビア実践ワークショップ第3期第5回を3月19日に開催します。今回はRTX 5090 GPUの生成AIへの活用について、特に解説します。

同じような答えを繰り返す“退屈なAI”が、プロンプトのわずかな工夫で多様性ある回答(生成AIクローズアップ) 画像
AI

同じような答えを繰り返す“退屈なAI”が、プロンプトのわずかな工夫で多様性ある回答(生成AIクローズアップ)

特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。

今回は、AIの生成において、同じような答えばかり返ってしまう問題を解決する方法を提案した論文「Verbalized Sampling: How to Mitigate Mode Collapse and Unlock LLM Diversity」を取り上げます。

巨大AIを打ち負かす、わずか700万パラメータの超小型AI「TRM」、著者自身が論文プレゼンする動画を自動生成するAI「PaperTalker」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

巨大AIを打ち負かす、わずか700万パラメータの超小型AI「TRM」、著者自身が論文プレゼンする動画を自動生成するAI「PaperTalker」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第116回)は、巨大AIを凌駕する、わずか700万パラメータの小型AI「TRM」や、AIが9,300人の顧客を演じて製品の購買意欲を予測する消費者調査シミュレーションシステムを取り上げます。

AIボイスレコーダー「Plaud Note Pro」レビュー:ディスプレイ搭載で使い勝手が大幅向上 画像
アクセサリ

AIボイスレコーダー「Plaud Note Pro」レビュー:ディスプレイ搭載で使い勝手が大幅向上

PLAUDが、AIボイスレコーダーのフラッグシップモデル「Plaud Note Pro(プラウド ノート プロ)」を10月14日に発売しました。価格は3万800円。製品とは関係ありませんが、法人としてのPLAUD株式会社はすべて大文字、ブランドとしてはPlaudで最初だけ大文字だそうです。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第52回:オープン画像生成AIが怒涛の登場果たした2025年9月(西川和久) 画像
Science

生成AIグラビアをグラビアカメラマンが作るとどうなる?第52回:オープン画像生成AIが怒涛の登場果たした2025年9月(西川和久)

Qwen-Imageで大物txt2imgは終わりかなと思っていた矢先の9月9日、 HunyuanImage-2.1 がリリース。その後も怒涛のアップデートが起きている。

AIで夢を画像にする「Dream2Image」、38人の脳活動と夢体験からなる31時間以上のデータセット(生成AIクローズアップ) 画像
AI

AIで夢を画像にする「Dream2Image」、38人の脳活動と夢体験からなる31時間以上のデータセット(生成AIクローズアップ)

今回は、夢を脳波(EEG)信号で解読し、AIを用いて画像化するためのデータセット「Dream2Image」を提案した論文を取り上げます

「なぜLLMは“掛け算”ができないのか」解明、ニューロンやシナプスっぽく動く脳を真似した新言語AI「Dragon Hatchling」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

「なぜLLMは“掛け算”ができないのか」解明、ニューロンやシナプスっぽく動く脳を真似した新言語AI「Dragon Hatchling」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第115回)は、人脳の神経回路を模倣した言語モデル「Dragon Hatchling」や、リアルタイムに指示して途中で変更しながら長時間動画を生成するAI「LONGLIVE」を取り上げます。

Sora 2がリアルな人物を固定できない問題。プロンプトオンリーメソッドはAPI開放で不要に?(CloseBox) 画像
AI

Sora 2がリアルな人物を固定できない問題。プロンプトオンリーメソッドはAPI開放で不要に?(CloseBox)

リアルな登場人物を固定して使いたい場合にはどうしたら良いのでしょうか?

NVIDIAが出資のOpenAI、6ギガワット分のAMD製GPUでAIインフラ整備。AMD株も最大で10%取得へ 画像
AI

NVIDIAが出資のOpenAI、6ギガワット分のAMD製GPUでAIインフラ整備。AMD株も最大で10%取得へ

OpenAIが、AMDと数百億ドル規模のGPU供給契約を締結したと発表しました。

OpenAIサム・アルトマンとジョナサン・アイブのコラボAI製品、「技術的問題」で開発難航中との報。プライバシーの対処などに苦慮か 画像
ウェアラブル

OpenAIサム・アルトマンとジョナサン・アイブのコラボAI製品、「技術的問題」で開発難航中との報。プライバシーの対処などに苦慮か

OpenAIのサム・アルトマンCEOと元アップルのチーフデザイナーであるジョナサン・アイブ氏が手掛ける「新世代のAI搭載コンピューター製品」の開発が難航している模様です。

Sora 2で生成の動画、別SNSに“AI素性隠して”大量投稿し再生数荒稼ぎ ウォーターマークを消すツールとアルトマン氏の著作権への対応(生成AIクローズアップ) 画像
AI

Sora 2で生成の動画、別SNSに“AI素性隠して”大量投稿し再生数荒稼ぎ ウォーターマークを消すツールとアルトマン氏の著作権への対応(生成AIクローズアップ)

今回は動画生成AI「Sora 2」を悪用する動きと、OpenAIのサム・アルトマンCEOが著作権に関した今後の変更方針を言及した内容を取り上げます。

Sora 2にはまだ上があった。15秒までAI動画生成できるSora 2 Proがやってきた(CloseBox) 画像
AI

Sora 2にはまだ上があった。15秒までAI動画生成できるSora 2 Proがやってきた(CloseBox)

Sora 2祭りはまだ続いていますが、Sora 2の上位版が登場しました。Sora 2 Proです。

PerplexityのAIブラウザー「Comet」が無料化。月額200ドルのMaxプランが不要に 画像
AI

PerplexityのAIブラウザー「Comet」が無料化。月額200ドルのMaxプランが不要に

AI検索スタートアップのPerplexityは、今年7月に月額200ドルのMaxプラン登録ユーザー向けとしてリリースしたばかりのAI搭載ウェブブラウザー「Comet」を、このたび無料化し、誰でも利用可能にしたと発表しました。

生成AIがゼロから完全なソフトリポジトリを開発するMicrosoftの「ZeroRepo」、細菌を殺すウイルスをAIが生成した世界初の研究など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

生成AIがゼロから完全なソフトリポジトリを開発するMicrosoftの「ZeroRepo」、細菌を殺すウイルスをAIが生成した世界初の研究など生成AI技術5つを解説(生成AIウィークリー)

今回の「生成AIウィークリー」(第114回)は、アリババ開発のテキスト・画像・音声・動画を統合したマルチモーダルAIモデル「Qwen3-Omni」や、マイクロソフト開発のAIにゼロからソフトウェアリポジトリを生成させる「ZeroRepo」を取り上げます。

Sora 2の中の人が歌った10秒の曲から1曲まるごとのミュージックビデオを作る方法(CloseBox) 画像
AI

Sora 2の中の人が歌った10秒の曲から1曲まるごとのミュージックビデオを作る方法(CloseBox)

Sora 2が公開され、日本のiPhoneユーザーはおおいに遊んでいるようで何よりです。筆者は以前からやっているミュージックビデオ制作でSora 2を活用してみたので、そのやり方を書き留めておきます。

WindowsのローカルAI実行基盤「Windows ML」が正式版に。CPU/GPU/NPUなどのハードウェアを抽象化しONNX形式AIモデルを実行 画像
AI

WindowsのローカルAI実行基盤「Windows ML」が正式版に。CPU/GPU/NPUなどのハードウェアを抽象化しONNX形式AIモデルを実行

マイクロソフトは、Windows上でローカルAIを実行するための基盤となる「Windows ML」の正式版リリースを発表しました。

自分を他の動画にカメオ出演させられるOpenAIの動画生成AI「Sora 2」を使ってみた。iPhone必須&招待制で日本も対象に(CloseBox) 画像
AI

自分を他の動画にカメオ出演させられるOpenAIの動画生成AI「Sora 2」を使ってみた。iPhone必須&招待制で日本も対象に(CloseBox)

OpenAIは10月1日(米国では9月30日)、動画生成AIモデルであるSoraの次期バージョン、「Sora 2」を発表しました。

Google開発「学校の教科書」、生徒の興味に合わせて生成AIが内容を変える(生成AIクローズアップ) 画像
AI

Google開発「学校の教科書」、生徒の興味に合わせて生成AIが内容を変える(生成AIクローズアップ)

GoogleのLearnLMチームが開発した、生徒の興味や理解によって生成AIがその人に合わせた内容に自動変更する教科書システムを提案した論文「Towards an AI-Augmented Textbook」を取り上げます。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第51回:Qwen-Image旋風だった2025年8月まとめ(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第51回:Qwen-Image旋風だった2025年8月まとめ(西川和久)

2025年8月

VC以上の目利きAI「VCBench」、OpenAIのDeep Researchと同等性能のオープンソースAIエージェント「Tongyi DeepResearch」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

VC以上の目利きAI「VCBench」、OpenAIのDeep Researchと同等性能のオープンソースAIエージェント「Tongyi DeepResearch」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第113回)は、AIの世界理解を向上させる大規模データセット「OmniWorld」や、アリババグループ開発のオープンソースAIエージェント「Tongyi DeepResearch」を取り上げます。

作曲AIが新時代に突入。SunoがMIDI出力とマルチトラック編集(DAW)に対応、Tuneeは6曲同時生成で一般公開(CloseBox) 画像
AI

作曲AIが新時代に突入。SunoがMIDI出力とマルチトラック編集(DAW)に対応、Tuneeは6曲同時生成で一般公開(CloseBox)

9月26日、AI作曲サービスのSunoとTuneeがそれぞれ新機能を発表しました。Sunoは待望のDAW内蔵とMIDI出力を、これまでクローズドベータだったTuneeは一般公開を始め、1つのプロンプトから3つの歌詞・音楽スタイルをそれぞれ2曲ずつ、合計6曲を同時に生成できるようになりました。

OpenAI、ChatGPTが朝イチに知りたい情報をまとめてくれる新機能「 Pulse」を発表。月額200ドルのProプランユーザー向け 画像
AI

OpenAI、ChatGPTが朝イチに知りたい情報をまとめてくれる新機能「 Pulse」を発表。月額200ドルのProプランユーザー向け

OpenAIは、月額200ドル(約3万円)のChatGPT Proプランに新機能「Pulse」を追加すると発表しました。

AIエージェントらは独自経済圏を自然に作り始める。Googleが描く到来不可避の”AIエージェント経済”の未来(生成AIクローズアップ) 画像
AI

AIエージェントらは独自経済圏を自然に作り始める。Googleが描く到来不可避の”AIエージェント経済”の未来(生成AIクローズアップ)

Google DeepMindとトロント大学の研究者らによるこの研究は、AIエージェントが人間の監視を超えた速度と規模で相互に取引を行う「AIエージェント経済」という未来について、示唆を提供しています。

打てば響く、「キラキラしたフェイザーの入ったローズ」「伝説級のギターリフ」プロンプトが確実に反映されるAI作曲最新モデル「Suno v5」の実力(CloseBox) 画像
AI

打てば響く、「キラキラしたフェイザーの入ったローズ」「伝説級のギターリフ」プロンプトが確実に反映されるAI作曲最新モデル「Suno v5」の実力(CloseBox)

AI作曲サービスの最高峰といってもいいSunoがバージョンアップを重ね、9月24日にv5に到達しました。まだDAW完全対応、MIDI出力は実装していませんが、その前に作曲モデルを刷新した感じです。

NVIDIAがOpenAIに最大1000億ドル投資へ。10GWのAIインフラを段階的に導入予定 画像
AI

NVIDIAがOpenAIに最大1000億ドル投資へ。10GWのAIインフラを段階的に導入予定

NVIDIAは、ChatGPTを開発するOpenAIに最大1000億ドル(約14兆7800億円)を投資し、同社のAI向けGPU数百万基を使用する、最大10GWの「次世代AIインフラ」を構築することを明らかにしました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第50回:2025年夏、画像AIに何が起こっていたのか。6月&7月まとめ(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第50回:2025年夏、画像AIに何が起こっていたのか。6月&7月まとめ(西川和久)

6~8月、休載していたこともあり、今回と次回はこの間リリースされたものなどを順にご紹介し、現時点=9月に追い付きたいと思う。まず6月から。

AIに同じ質問をするとなぜ毎回違う答えなのか? 元OpenAIチームが解明。毎回同じ返答をする新システムも開発など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

AIに同じ質問をするとなぜ毎回違う答えなのか? 元OpenAIチームが解明。毎回同じ返答をする新システムも開発など生成AI技術5つを解説(生成AIウィークリー)

AIに同じ質問すると毎回微妙に違う返答になる謎を解き明かした研究や、バイトダンスが開発した文字・画像・音声から話す人物動画を生成できるAIモデル「HuMo」を取り上げます。

画面つきAIメガネMeta Ray-Ban Display発表、筋電リストバンド同梱で799ドル。9月30日発売 画像
ウェアラブル

画面つきAIメガネMeta Ray-Ban Display発表、筋電リストバンド同梱で799ドル。9月30日発売

年に一度のカンファレンス Meta Connect 2025で、Metaのマーク・ザッカーバーグがAIグラスの新製品 Ray-Ban Meta Display を発表しました。

ここは電波の届かない地下つけ麺屋。iPhone内蔵のApple純正スタンドアロンLLM「アシスタント」と暇つぶしチャットしてみた(CloseBox) 画像
AI

ここは電波の届かない地下つけ麺屋。iPhone内蔵のApple純正スタンドアロンLLM「アシスタント」と暇つぶしチャットしてみた(CloseBox)

都市部で携帯用の電波が届かない場所は見つけることが難しい。そんな中で、ローカルLLMを使う必要があるのか? そう考えたスタッフは電波的秘境、石神井公園駅ライオンズマンション地下飲食街にあるつけ麺の名店、「麺処 井の庄」に向かった。

OpenAI、18歳未満ChatGPTユーザーに導入する制限について説明。「10代の若者のプライバシーと自由よりも安全を優先」へ 画像
AI

OpenAI、18歳未満ChatGPTユーザーに導入する制限について説明。「10代の若者のプライバシーと自由よりも安全を優先」へ

OpenAIは、ChatGPTが18歳未満のユーザーと接する際に、プライバシーや自由な会話よりも安全性を優先するためのポリシー変更を行うことを明らかにしました。

iOS 26始動。Apple IntelligenceのFoundation Modelとネット無接続でチャットしたら「iPhone純正LLM、意外とやるじゃん」(CloseBox) 画像
AI

iOS 26始動。Apple IntelligenceのFoundation Modelとネット無接続でチャットしたら「iPhone純正LLM、意外とやるじゃん」(CloseBox)

9月16日、Apple Intelligenceを大々的にフィーチャーしたOSアップデートが行われました。純正ローカルLLMとチャットすることができました。

巨大データセンターではなく、世界中に散らばる個人PCが協力してAIを学習「SAPO」 “市民参加型AI開発”の衝撃(生成AIクローズアップ) 画像
AI

巨大データセンターではなく、世界中に散らばる個人PCが協力してAIを学習「SAPO」 “市民参加型AI開発”の衝撃(生成AIクローズアップ)

今回は、巨大なデータセンターに依存せず、世界中に散らばる個人PCが協力してAIを育てる分散型アプローチを提案した論文「Sharing is Caring: Efficient LM Post-Training with Collective RL Experience Sharing」を取り上げます。

“生成AIのせい”で新卒雇用は減るが代替できない経験を持つ熟練者は安泰、新しいブラックホールを見つけるGoogle開発AIなど生成AI技術5つを解説(生成AIウィークリー) 画像
AI

“生成AIのせい”で新卒雇用は減るが代替できない経験を持つ熟練者は安泰、新しいブラックホールを見つけるGoogle開発AIなど生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第111回)は、まずTencentから2つの技術、小型の翻訳モデル「Hunyuan-MT」と1枚の画像から探索可能な3D世界を生成できる「HunyuanWorld-Voyager」をご紹介します。

AIデバイスとしてのiPhone 17世代はどうだったのか? A19 Proを搭載したiPhone AirがMacBook Pro並みの処理性能って本当?(CloseBox) 画像
AI

AIデバイスとしてのiPhone 17世代はどうだったのか? A19 Proを搭載したiPhone AirがMacBook Pro並みの処理性能って本当?(CloseBox)

iPhone 17、17 Air、17 Pro、17 Pro Maxの4モデルが正式に発表されました。その詳細は別記事に譲るとして、今回これらの機種がAI的視点からどうだったのかについて、細かいところを突いていきたいと思います。

高精度の2D→3DモデリングAIサービスのHitem3Dが4面図入力に対応したので人物で試したらリアルすぎた(CloseBox) 画像
AI

高精度の2D→3DモデリングAIサービスのHitem3Dが4面図入力に対応したので人物で試したらリアルすぎた(CloseBox)

Hitem3Dの4面図入力を試してみました。

Nano Bananaで蘇る思い出の逆光写真。画像編集ソフトとしてのナノバナナの実力(CloseBox) 画像
AI

Nano Bananaで蘇る思い出の逆光写真。画像編集ソフトとしてのナノバナナの実力(CloseBox)

先日Xに投稿した写真がちょっとバズりました。長崎市稲佐山の中腹にあるホテルのレストランで撮影した、妻との写真が逆光で残念なことになっていたのが、Nano Bananaのおかげで見栄えのする写真になった、という報告とポストです。

新しいGoogle検索「AIモード」が始まったけど、Geminiとどう使い分けたらいいの?(Google Tales) 画像
AI

新しいGoogle検索「AIモード」が始まったけど、Geminiとどう使い分けたらいいの?(Google Tales)

Google検索の「AI Mode」(日本では「AIモード」)が、9月3日くらいから、英語設定にした私のアカウントでも利用できるようになっていました。Google I/Oでの発表以来、楽しみにしていたので、さっそく使ってみました。

20年続いたGoogle検索が変わる。日本語版「AIモード」で“考える検索”へ 画像
AI

20年続いたGoogle検索が変わる。日本語版「AIモード」で“考える検索”へ

日本語のGoogle検索が、生成AIを活用した「AIモード」に本日より順次対応するとアナウンスされました。PCやスマホのブラウザ、Android/iOSのGoogleアプリで利用可能になります。

OpenAI、「幻覚」の根本原因と対策を解明。ハルシネーションは「難問に直面した学生と同じ」(生成AIクローズアップ) 画像
AI

OpenAI、「幻覚」の根本原因と対策を解明。ハルシネーションは「難問に直面した学生と同じ」(生成AIクローズアップ)

今回は、OpenAIとジョージア工科大学の研究チームが発表した論文「Why Language Models Hallucinate」を取り上げます。大規模言語モデル(LLM)がなぜ事実と異なる情報「幻覚」(ハルシネーション)を自信満々に生成してしまうのか、その根本原因を明らかにして解決策を提案した研究です。

「そろそろAIアバターに仕事を代わってもらおうか」HeyGenで作ったデジタルツインに数ヵ国語を喋らせてみた結果 画像
AI

「そろそろAIアバターに仕事を代わってもらおうか」HeyGenで作ったデジタルツインに数ヵ国語を喋らせてみた結果

HeyGenでデジタルツインを作成して、しゃべらせてみました。まずは、こちらの動画をご覧ください。

GPT-5に迫る性能のオープンソースAIモデル「InternVL3.5」、4人会話の90分ポッドキャスト番組を生成できるAI「VibeVoice」、など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

GPT-5に迫る性能のオープンソースAIモデル「InternVL3.5」、4人会話の90分ポッドキャスト番組を生成できるAI「VibeVoice」、など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第110回)は、4人会話の90分ポッドキャスト番組を生成できる音声合成モデル「VibeVoice」や、微調整なしでAIエージェントを進化させる記憶ベースの学習手法「Memento」を取り上げます。