
「なぜLLMは“掛け算”ができないのか」解明、ニューロンやシナプスっぽく動く脳を真似した新言語AI「Dragon Hatchling」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第115回)は、人脳の神経回路を模倣した言語モデル「Dragon Hatchling」や、リアルタイムに指示して途中で変更しながら長時間動画を生成するAI「LONGLIVE」を取り上げます。

Pixel 10 Pro Fold実機レビュー。2025年グーグルのハイエンドをiPhone 17 Pro Maxとメイン使い対決(スマホ沼)
iPhone 17 Pro MaxとApple Watch Series 11、AirPods Pro 3というアップルの“ギーク鉄板”構成を使い始めたばかりですが(いや、ギークはAirという説もあるんでした)、並行して1週間ほどGoogle Pixel 10 Pro FoldとPixel Watch 4、Pixel Buds 2aを試用しておりました。

Sora 2がリアルな人物を固定できない問題。プロンプトオンリーメソッドはAPI開放で不要に?(CloseBox)
リアルな登場人物を固定して使いたい場合にはどうしたら良いのでしょうか?

NVIDIAが出資のOpenAI、6ギガワット分のAMD製GPUでAIインフラ整備。AMD株も最大で10%取得へ
OpenAIが、AMDと数百億ドル規模のGPU供給契約を締結したと発表しました。

OpenAIサム・アルトマンとジョナサン・アイブのコラボAI製品、「技術的問題」で開発難航中との報。プライバシーの対処などに苦慮か
OpenAIのサム・アルトマンCEOと元アップルのチーフデザイナーであるジョナサン・アイブ氏が手掛ける「新世代のAI搭載コンピューター製品」の開発が難航している模様です。

Sora 2で生成の動画、別SNSに“AI素性隠して”大量投稿し再生数荒稼ぎ ウォーターマークを消すツールとアルトマン氏の著作権への対応(生成AIクローズアップ)
今回は動画生成AI「Sora 2」を悪用する動きと、OpenAIのサム・アルトマンCEOが著作権に関した今後の変更方針を言及した内容を取り上げます。

PerplexityのAIブラウザー「Comet」が無料化。月額200ドルのMaxプランが不要に
AI検索スタートアップのPerplexityは、今年7月に月額200ドルのMaxプラン登録ユーザー向けとしてリリースしたばかりのAI搭載ウェブブラウザー「Comet」を、このたび無料化し、誰でも利用可能にしたと発表しました。

生成AIがゼロから完全なソフトリポジトリを開発するMicrosoftの「ZeroRepo」、細菌を殺すウイルスをAIが生成した世界初の研究など生成AI技術5つを解説(生成AIウィークリー)
今回の「生成AIウィークリー」(第114回)は、アリババ開発のテキスト・画像・音声・動画を統合したマルチモーダルAIモデル「Qwen3-Omni」や、マイクロソフト開発のAIにゼロからソフトウェアリポジトリを生成させる「ZeroRepo」を取り上げます。

WindowsのローカルAI実行基盤「Windows ML」が正式版に。CPU/GPU/NPUなどのハードウェアを抽象化しONNX形式AIモデルを実行
マイクロソフトは、Windows上でローカルAIを実行するための基盤となる「Windows ML」の正式版リリースを発表しました。

自分を他の動画にカメオ出演させられるOpenAIの動画生成AI「Sora 2」を使ってみた。iPhone必須&招待制で日本も対象に(CloseBox)
OpenAIは10月1日(米国では9月30日)、動画生成AIモデルであるSoraの次期バージョン、「Sora 2」を発表しました。

Perplexity Proが1年半無料で2万円台のAIスマホ「T-Phone 3」をドイツで購入してみた(スマホ沼)
ドイツ初のAIスマホT-Phone 3は低価格でAIアシスタントを手軽に利用でき、日常生活支援に特化したライト層向け端末。

折りたたみ+AIの最適解を追求したmotorola razr 60|60 Ultraの日本発売が決定(スマホ沼)
モトローラの最新折りたたみスマホ「razr 60」が、やっと日本に来ました。10月10日発売。オープンマーケット向けの価格は、13万5800円(税込、12GBメモリ/512GBストレージ)~、キャリアではドコモとソフトバンクが取り扱います。

Google開発「学校の教科書」、生徒の興味に合わせて生成AIが内容を変える(生成AIクローズアップ)
GoogleのLearnLMチームが開発した、生徒の興味や理解によって生成AIがその人に合わせた内容に自動変更する教科書システムを提案した論文「Towards an AI-Augmented Textbook」を取り上げます。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第51回:Qwen-Image旋風だった2025年8月まとめ(西川和久)
2025年8月

【100倍望遠AI補正対決】Google(Pixel 10 Pro)vs. HUAWEI vs. vivo(スマホ沼)
みなさんこんにちは、香港在住の携帯電話研究家の山根康宏です。グーグルのPixel 10 ProとPixel 10 Pro XLのカメラが搭載したAI補正による100倍望遠撮影は「ここまで補正されたものは『写真』なのか?」といった声も聞かれます。

VC以上の目利きAI「VCBench」、OpenAIのDeep Researchと同等性能のオープンソースAIエージェント「Tongyi DeepResearch」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第113回)は、AIの世界理解を向上させる大規模データセット「OmniWorld」や、アリババグループ開発のオープンソースAIエージェント「Tongyi DeepResearch」を取り上げます。

作曲AIが新時代に突入。SunoがMIDI出力とマルチトラック編集(DAW)に対応、Tuneeは6曲同時生成で一般公開(CloseBox)
9月26日、AI作曲サービスのSunoとTuneeがそれぞれ新機能を発表しました。Sunoは待望のDAW内蔵とMIDI出力を、これまでクローズドベータだったTuneeは一般公開を始め、1つのプロンプトから3つの歌詞・音楽スタイルをそれぞれ2曲ずつ、合計6曲を同時に生成できるようになりました。

OpenAI、ChatGPTが朝イチに知りたい情報をまとめてくれる新機能「 Pulse」を発表。月額200ドルのProプランユーザー向け
OpenAIは、月額200ドル(約3万円)のChatGPT Proプランに新機能「Pulse」を追加すると発表しました。

ローカル生成AIをゲーミングPCで動かす──レノボ「Legion」シリーズ新モデル体験イベントレポートPR
レノボ・ジャパンは9月16日、都内でゲーミングPC「Legion」シリーズの最新ラインアップ紹介と、ローカル生成AIの活用をテーマとしたイベントをテクノエッジのアルファ会員と招待したインフルエンサーらを対象に開催しました。

IFA会場でスマホより多く見かけたのは? 2026年はAIグラスがブームの兆し(スマホ沼)
2025年のIFAでAIグラスが多数展示され、チャットや翻訳など多機能化が進んでいる。

AIエージェントらは独自経済圏を自然に作り始める。Googleが描く到来不可避の”AIエージェント経済”の未来(生成AIクローズアップ)
Google DeepMindとトロント大学の研究者らによるこの研究は、AIエージェントが人間の監視を超えた速度と規模で相互に取引を行う「AIエージェント経済」という未来について、示唆を提供しています。

打てば響く、「キラキラしたフェイザーの入ったローズ」「伝説級のギターリフ」プロンプトが確実に反映されるAI作曲最新モデル「Suno v5」の実力(CloseBox)
AI作曲サービスの最高峰といってもいいSunoがバージョンアップを重ね、9月24日にv5に到達しました。まだDAW完全対応、MIDI出力は実装していませんが、その前に作曲モデルを刷新した感じです。

NVIDIAがOpenAIに最大1000億ドル投資へ。10GWのAIインフラを段階的に導入予定
NVIDIAは、ChatGPTを開発するOpenAIに最大1000億ドル(約14兆7800億円)を投資し、同社のAI向けGPU数百万基を使用する、最大10GWの「次世代AIインフラ」を構築することを明らかにしました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第50回:2025年夏、画像AIに何が起こっていたのか。6月&7月まとめ(西川和久)
6~8月、休載していたこともあり、今回と次回はこの間リリースされたものなどを順にご紹介し、現時点=9月に追い付きたいと思う。まず6月から。

AIに同じ質問をするとなぜ毎回違う答えなのか? 元OpenAIチームが解明。毎回同じ返答をする新システムも開発など生成AI技術5つを解説(生成AIウィークリー)
AIに同じ質問すると毎回微妙に違う返答になる謎を解き明かした研究や、バイトダンスが開発した文字・画像・音声から話す人物動画を生成できるAIモデル「HuMo」を取り上げます。

OpenAI、18歳未満ChatGPTユーザーに導入する制限について説明。「10代の若者のプライバシーと自由よりも安全を優先」へ
OpenAIは、ChatGPTが18歳未満のユーザーと接する際に、プライバシーや自由な会話よりも安全性を優先するためのポリシー変更を行うことを明らかにしました。

巨大データセンターではなく、世界中に散らばる個人PCが協力してAIを学習「SAPO」 “市民参加型AI開発”の衝撃(生成AIクローズアップ)
今回は、巨大なデータセンターに依存せず、世界中に散らばる個人PCが協力してAIを育てる分散型アプローチを提案した論文「Sharing is Caring: Efficient LM Post-Training with Collective RL Experience Sharing」を取り上げます。

“生成AIのせい”で新卒雇用は減るが代替できない経験を持つ熟練者は安泰、新しいブラックホールを見つけるGoogle開発AIなど生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第111回)は、まずTencentから2つの技術、小型の翻訳モデル「Hunyuan-MT」と1枚の画像から探索可能な3D世界を生成できる「HunyuanWorld-Voyager」をご紹介します。

AIデバイスとしてのiPhone 17世代はどうだったのか? A19 Proを搭載したiPhone AirがMacBook Pro並みの処理性能って本当?(CloseBox)
iPhone 17、17 Air、17 Pro、17 Pro Maxの4モデルが正式に発表されました。その詳細は別記事に譲るとして、今回これらの機種がAI的視点からどうだったのかについて、細かいところを突いていきたいと思います。

Nano Bananaで蘇る思い出の逆光写真。画像編集ソフトとしてのナノバナナの実力(CloseBox)
先日Xに投稿した写真がちょっとバズりました。長崎市稲佐山の中腹にあるホテルのレストランで撮影した、妻との写真が逆光で残念なことになっていたのが、Nano Bananaのおかげで見栄えのする写真になった、という報告とポストです。

OpenAI、「幻覚」の根本原因と対策を解明。ハルシネーションは「難問に直面した学生と同じ」(生成AIクローズアップ)
今回は、OpenAIとジョージア工科大学の研究チームが発表した論文「Why Language Models Hallucinate」を取り上げます。大規模言語モデル(LLM)がなぜ事実と異なる情報「幻覚」(ハルシネーション)を自信満々に生成してしまうのか、その根本原因を明らかにして解決策を提案した研究です。

「そろそろAIアバターに仕事を代わってもらおうか」HeyGenで作ったデジタルツインに数ヵ国語を喋らせてみた結果
HeyGenでデジタルツインを作成して、しゃべらせてみました。まずは、こちらの動画をご覧ください。

GPT-5に迫る性能のオープンソースAIモデル「InternVL3.5」、4人会話の90分ポッドキャスト番組を生成できるAI「VibeVoice」、など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第110回)は、4人会話の90分ポッドキャスト番組を生成できる音声合成モデル「VibeVoice」や、微調整なしでAIエージェントを進化させる記憶ベースの学習手法「Memento」を取り上げます。

医療AI、ベンチマークは優秀なのになぜ現場で使えないのか? スタンフォード大学が医療AIの不都合を暴く(生成AIクローズアップ)
今回は、医学ベンチマークテストで高い正答率を誇る大規模言語モデル(LLM)が、実際には医学的推論を行っているのではなく、訓練データのパターンを認識しているだけかもしれないという問題提起をした論文「Fidelity of Medical Reasoning in Large Language Models」を取り上げます。スタンフォード大学に所属する研究者らによる研究発表です。

【実は変態】Pixel 10よりarrows Alphaがキニナル… (スマホ沼)
テックメディア、インフルエンサー界隈はPixel 10シリーズの話題で持ちきりですな。いや~、100倍ズーム凄いね。https://www.techno-edge.net/article/2025/08/29/4558.html

AI動画制作、最短ルート:話す・動く・高画質も一発でPR
生成AI動画制作は進化し、多機能でコスパ良い「DomoAI」。高品質動画やアバターなど多彩な機能を低価格で利用可能。

Pixel 10 ProでAIが自然に溶け込んでいく「新しい日常」はどんな感じ?(Google Tales)
8月28日発売のPixel 10 Proを数日早く使わせてもらいました。ハードウェアの進化については詳しい方々にお任せして、ここではTensor 5とGemini nanoが支えるPixel 10 ProのAI機能を使ってみた話をしていきます。

Pixel 10 ProのAI機能を実機でチェック。超解像ズームは驚きのレベルだが、本当に写真なのかという疑問も(石野純也)
グーグルは、28日に「Pixel 10」シリーズの3機種を発売しました。フォルダブルスマホの「Pixel 10 Pro Fold」は、10月に投入されます。

「奇跡の一枚」をもう一度、「残念な一枚」が待望の復活。編集自在の「Gemini 2.5 Flash Image」(Nano Banana)が画像生成AIのレベルを引き上げた(CloseBox)
Googleがnano-bananaとしてティーザームーブをかましていた、新しいAI画像生成モデルが、Gemini 2.5 Flash Imageとして公開されました。これまでとは次元が違う、参照画像とプロンプトによる編集機能が話題となっています。

あなたのスマホでgpt-oss-20bは動く? iPhoneとAndroidでローカルLLM対決してみたら(CloseBox)
Mac、PCでほぼ満足のいく大規模言語モデルが使えるようになった今、じゃあスマートフォンならどうなのよ、となりますよね、普通。

複数話者ポッドキャストがAIだけでできるから、俺たちはもうお払い箱なの? 話題のVibeVoiceをインストールして試してみた(CloseBox)
実用的なTTS(Text to Speech)が出てもう長いこと経ちます。隠れマルコフモデルを使ったOpen JTalkで自分のボイスクローンを作り、ポッドキャストに参加させたり、RVCで相方の声真似をして遊んだり、いろいろ声の実験をしてきました。

Grok 2.5がオープンソース化。マスク氏「Grok 3も今後6か月以内に」
イーロン・マスク氏のxAIは、Grok 2.5モデルをオープンソース化しました。Grok 3も今後6か月以内にオープンソースにする計画だと述べています。
- 825件中 1 - 42 件を表示
- 次へ