“ほぼ無限”の動画をリアルタイムに理解できるAI「StreamingVLM」、1台のH100 GPUで320億パラメータのLLMを強化学習できる「QeRL」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第117回)は、過度な圧縮をしない画像生成AI技術「RAE」や、長時間動画をリアルタイムに理解できるAIモデル「StreamingVLM」を取り上げます。
OpenAI、AI搭載ブラウザー「ChatGPT Atlas」発表。 まずmacOS版をリリースし、Windowsやモバイルアプリ版は「近日中」
OpenAIは10月21日、ChatGPTを統合し、ウェブブラウジング中にAIチャットボットとやり取りができるブラウザー「ChatGPT Atlas」を発表しました。macOS版がまずリリースされ、その後「近日中」にWindows版、iOS版、Android版が登場する予定です。
Mac版AIブラウザ「ChatGPT Atlas」の突破力に感歎。「Sunoで今日の天気を織り込んだ曲を作って」と頼んだらあっさりできちゃいました(CloseBox)
AIによるブラウザベースのエージェントがついに一線を超えました。自分的にですが。
生成AIグラビアワークショップ再開! 高性能なFLUX.1 [dev] 画像を数秒で生成できる謎技術「ヌンチャク」に迫る。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第4期第1回)を10月22日開催。テクノエッジ アルファ会員なら無料
テクノエッジ編集部では、生成AIグラビア実践ワークショップ第3期第5回を3月19日に開催します。今回はRTX 5090 GPUの生成AIへの活用について、特に解説します。
同じような答えを繰り返す“退屈なAI”が、プロンプトのわずかな工夫で多様性ある回答(生成AIクローズアップ)
特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。
今回は、AIの生成において、同じような答えばかり返ってしまう問題を解決する方法を提案した論文「Verbalized Sampling: How to Mitigate Mode Collapse and Unlock LLM Diversity」を取り上げます。
巨大AIを打ち負かす、わずか700万パラメータの超小型AI「TRM」、著者自身が論文プレゼンする動画を自動生成するAI「PaperTalker」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第116回)は、巨大AIを凌駕する、わずか700万パラメータの小型AI「TRM」や、AIが9,300人の顧客を演じて製品の購買意欲を予測する消費者調査シミュレーションシステムを取り上げます。
本気か? ジンバルカメラが飛び出す変態スマホ「HONOR Robot Phone」はちょっとカワイイ(スマホ沼)
みなさんこんにちは、香港在住の携帯電話研究家の山根康宏です。最近は変態と呼べるスマートフォンが出てこないなあと悲しんでいる皆さんに朗報です。HONORが発表した「Robot Phone」は2026年3月に実機が公開予定のコンセプトモデルです。
AIボイスレコーダー「Plaud Note Pro」レビュー:ディスプレイ搭載で使い勝手が大幅向上
PLAUDが、AIボイスレコーダーのフラッグシップモデル「Plaud Note Pro(プラウド ノート プロ)」を10月14日に発売しました。価格は3万800円。製品とは関係ありませんが、法人としてのPLAUD株式会社はすべて大文字、ブランドとしてはPlaudで最初だけ大文字だそうです。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第52回:オープン画像生成AIが怒涛の登場果たした2025年9月(西川和久)
Qwen-Imageで大物txt2imgは終わりかなと思っていた矢先の9月9日、 HunyuanImage-2.1 がリリース。その後も怒涛のアップデートが起きている。
AIで夢を画像にする「Dream2Image」、38人の脳活動と夢体験からなる31時間以上のデータセット(生成AIクローズアップ)
今回は、夢を脳波(EEG)信号で解読し、AIを用いて画像化するためのデータセット「Dream2Image」を提案した論文を取り上げます
「なぜLLMは“掛け算”ができないのか」解明、ニューロンやシナプスっぽく動く脳を真似した新言語AI「Dragon Hatchling」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第115回)は、人脳の神経回路を模倣した言語モデル「Dragon Hatchling」や、リアルタイムに指示して途中で変更しながら長時間動画を生成するAI「LONGLIVE」を取り上げます。
Pixel 10 Pro Fold実機レビュー。2025年グーグルのハイエンドをiPhone 17 Pro Maxとメイン使い対決(スマホ沼)
iPhone 17 Pro MaxとApple Watch Series 11、AirPods Pro 3というアップルの“ギーク鉄板”構成を使い始めたばかりですが(いや、ギークはAirという説もあるんでした)、並行して1週間ほどGoogle Pixel 10 Pro FoldとPixel Watch 4、Pixel Buds 2aを試用しておりました。
Sora 2がリアルな人物を固定できない問題。プロンプトオンリーメソッドはAPI開放で不要に?(CloseBox)
リアルな登場人物を固定して使いたい場合にはどうしたら良いのでしょうか?
NVIDIAが出資のOpenAI、6ギガワット分のAMD製GPUでAIインフラ整備。AMD株も最大で10%取得へ
OpenAIが、AMDと数百億ドル規模のGPU供給契約を締結したと発表しました。
OpenAIサム・アルトマンとジョナサン・アイブのコラボAI製品、「技術的問題」で開発難航中との報。プライバシーの対処などに苦慮か
OpenAIのサム・アルトマンCEOと元アップルのチーフデザイナーであるジョナサン・アイブ氏が手掛ける「新世代のAI搭載コンピューター製品」の開発が難航している模様です。
Sora 2で生成の動画、別SNSに“AI素性隠して”大量投稿し再生数荒稼ぎ ウォーターマークを消すツールとアルトマン氏の著作権への対応(生成AIクローズアップ)
今回は動画生成AI「Sora 2」を悪用する動きと、OpenAIのサム・アルトマンCEOが著作権に関した今後の変更方針を言及した内容を取り上げます。
PerplexityのAIブラウザー「Comet」が無料化。月額200ドルのMaxプランが不要に
AI検索スタートアップのPerplexityは、今年7月に月額200ドルのMaxプラン登録ユーザー向けとしてリリースしたばかりのAI搭載ウェブブラウザー「Comet」を、このたび無料化し、誰でも利用可能にしたと発表しました。
生成AIがゼロから完全なソフトリポジトリを開発するMicrosoftの「ZeroRepo」、細菌を殺すウイルスをAIが生成した世界初の研究など生成AI技術5つを解説(生成AIウィークリー)
今回の「生成AIウィークリー」(第114回)は、アリババ開発のテキスト・画像・音声・動画を統合したマルチモーダルAIモデル「Qwen3-Omni」や、マイクロソフト開発のAIにゼロからソフトウェアリポジトリを生成させる「ZeroRepo」を取り上げます。
WindowsのローカルAI実行基盤「Windows ML」が正式版に。CPU/GPU/NPUなどのハードウェアを抽象化しONNX形式AIモデルを実行
マイクロソフトは、Windows上でローカルAIを実行するための基盤となる「Windows ML」の正式版リリースを発表しました。
自分を他の動画にカメオ出演させられるOpenAIの動画生成AI「Sora 2」を使ってみた。iPhone必須&招待制で日本も対象に(CloseBox)
OpenAIは10月1日(米国では9月30日)、動画生成AIモデルであるSoraの次期バージョン、「Sora 2」を発表しました。
Perplexity Proが1年半無料で2万円台のAIスマホ「T-Phone 3」をドイツで購入してみた(スマホ沼)
ドイツ初のAIスマホT-Phone 3は低価格でAIアシスタントを手軽に利用でき、日常生活支援に特化したライト層向け端末。
折りたたみ+AIの最適解を追求したmotorola razr 60|60 Ultraの日本発売が決定(スマホ沼)
モトローラの最新折りたたみスマホ「razr 60」が、やっと日本に来ました。10月10日発売。オープンマーケット向けの価格は、13万5800円(税込、12GBメモリ/512GBストレージ)~、キャリアではドコモとソフトバンクが取り扱います。
Google開発「学校の教科書」、生徒の興味に合わせて生成AIが内容を変える(生成AIクローズアップ)
GoogleのLearnLMチームが開発した、生徒の興味や理解によって生成AIがその人に合わせた内容に自動変更する教科書システムを提案した論文「Towards an AI-Augmented Textbook」を取り上げます。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第51回:Qwen-Image旋風だった2025年8月まとめ(西川和久)
2025年8月
【100倍望遠AI補正対決】Google(Pixel 10 Pro)vs. HUAWEI vs. vivo(スマホ沼)
みなさんこんにちは、香港在住の携帯電話研究家の山根康宏です。グーグルのPixel 10 ProとPixel 10 Pro XLのカメラが搭載したAI補正による100倍望遠撮影は「ここまで補正されたものは『写真』なのか?」といった声も聞かれます。
VC以上の目利きAI「VCBench」、OpenAIのDeep Researchと同等性能のオープンソースAIエージェント「Tongyi DeepResearch」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第113回)は、AIの世界理解を向上させる大規模データセット「OmniWorld」や、アリババグループ開発のオープンソースAIエージェント「Tongyi DeepResearch」を取り上げます。
作曲AIが新時代に突入。SunoがMIDI出力とマルチトラック編集(DAW)に対応、Tuneeは6曲同時生成で一般公開(CloseBox)
9月26日、AI作曲サービスのSunoとTuneeがそれぞれ新機能を発表しました。Sunoは待望のDAW内蔵とMIDI出力を、これまでクローズドベータだったTuneeは一般公開を始め、1つのプロンプトから3つの歌詞・音楽スタイルをそれぞれ2曲ずつ、合計6曲を同時に生成できるようになりました。
OpenAI、ChatGPTが朝イチに知りたい情報をまとめてくれる新機能「 Pulse」を発表。月額200ドルのProプランユーザー向け
OpenAIは、月額200ドル(約3万円)のChatGPT Proプランに新機能「Pulse」を追加すると発表しました。
ローカル生成AIをゲーミングPCで動かす──レノボ「Legion」シリーズ新モデル体験イベントレポートPR
レノボ・ジャパンは9月16日、都内でゲーミングPC「Legion」シリーズの最新ラインアップ紹介と、ローカル生成AIの活用をテーマとしたイベントをテクノエッジのアルファ会員と招待したインフルエンサーらを対象に開催しました。
IFA会場でスマホより多く見かけたのは? 2026年はAIグラスがブームの兆し(スマホ沼)
2025年のIFAでAIグラスが多数展示され、チャットや翻訳など多機能化が進んでいる。
AIエージェントらは独自経済圏を自然に作り始める。Googleが描く到来不可避の”AIエージェント経済”の未来(生成AIクローズアップ)
Google DeepMindとトロント大学の研究者らによるこの研究は、AIエージェントが人間の監視を超えた速度と規模で相互に取引を行う「AIエージェント経済」という未来について、示唆を提供しています。
打てば響く、「キラキラしたフェイザーの入ったローズ」「伝説級のギターリフ」プロンプトが確実に反映されるAI作曲最新モデル「Suno v5」の実力(CloseBox)
AI作曲サービスの最高峰といってもいいSunoがバージョンアップを重ね、9月24日にv5に到達しました。まだDAW完全対応、MIDI出力は実装していませんが、その前に作曲モデルを刷新した感じです。
NVIDIAがOpenAIに最大1000億ドル投資へ。10GWのAIインフラを段階的に導入予定
NVIDIAは、ChatGPTを開発するOpenAIに最大1000億ドル(約14兆7800億円)を投資し、同社のAI向けGPU数百万基を使用する、最大10GWの「次世代AIインフラ」を構築することを明らかにしました。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第50回:2025年夏、画像AIに何が起こっていたのか。6月&7月まとめ(西川和久)
6~8月、休載していたこともあり、今回と次回はこの間リリースされたものなどを順にご紹介し、現時点=9月に追い付きたいと思う。まず6月から。
AIに同じ質問をするとなぜ毎回違う答えなのか? 元OpenAIチームが解明。毎回同じ返答をする新システムも開発など生成AI技術5つを解説(生成AIウィークリー)
AIに同じ質問すると毎回微妙に違う返答になる謎を解き明かした研究や、バイトダンスが開発した文字・画像・音声から話す人物動画を生成できるAIモデル「HuMo」を取り上げます。
OpenAI、18歳未満ChatGPTユーザーに導入する制限について説明。「10代の若者のプライバシーと自由よりも安全を優先」へ
OpenAIは、ChatGPTが18歳未満のユーザーと接する際に、プライバシーや自由な会話よりも安全性を優先するためのポリシー変更を行うことを明らかにしました。
巨大データセンターではなく、世界中に散らばる個人PCが協力してAIを学習「SAPO」 “市民参加型AI開発”の衝撃(生成AIクローズアップ)
今回は、巨大なデータセンターに依存せず、世界中に散らばる個人PCが協力してAIを育てる分散型アプローチを提案した論文「Sharing is Caring: Efficient LM Post-Training with Collective RL Experience Sharing」を取り上げます。
“生成AIのせい”で新卒雇用は減るが代替できない経験を持つ熟練者は安泰、新しいブラックホールを見つけるGoogle開発AIなど生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第111回)は、まずTencentから2つの技術、小型の翻訳モデル「Hunyuan-MT」と1枚の画像から探索可能な3D世界を生成できる「HunyuanWorld-Voyager」をご紹介します。
AIデバイスとしてのiPhone 17世代はどうだったのか? A19 Proを搭載したiPhone AirがMacBook Pro並みの処理性能って本当?(CloseBox)
iPhone 17、17 Air、17 Pro、17 Pro Maxの4モデルが正式に発表されました。その詳細は別記事に譲るとして、今回これらの機種がAI的視点からどうだったのかについて、細かいところを突いていきたいと思います。
Nano Bananaで蘇る思い出の逆光写真。画像編集ソフトとしてのナノバナナの実力(CloseBox)
先日Xに投稿した写真がちょっとバズりました。長崎市稲佐山の中腹にあるホテルのレストランで撮影した、妻との写真が逆光で残念なことになっていたのが、Nano Bananaのおかげで見栄えのする写真になった、という報告とポストです。
OpenAI、「幻覚」の根本原因と対策を解明。ハルシネーションは「難問に直面した学生と同じ」(生成AIクローズアップ)
今回は、OpenAIとジョージア工科大学の研究チームが発表した論文「Why Language Models Hallucinate」を取り上げます。大規模言語モデル(LLM)がなぜ事実と異なる情報「幻覚」(ハルシネーション)を自信満々に生成してしまうのか、その根本原因を明らかにして解決策を提案した研究です。
「そろそろAIアバターに仕事を代わってもらおうか」HeyGenで作ったデジタルツインに数ヵ国語を喋らせてみた結果
HeyGenでデジタルツインを作成して、しゃべらせてみました。まずは、こちらの動画をご覧ください。
