NVIDIA

連載「歌うテックニュース」第8回:「明るすぎる鼻の穴」問題。パストレーシングが可能にする「人間らしい鼻の穴」とは?(西川善司) 画像
テクノロジー

連載「歌うテックニュース」第8回:「明るすぎる鼻の穴」問題。パストレーシングが可能にする「人間らしい鼻の穴」とは?(西川善司)

ゲームに登場するキャラクターは、たとえリアル系表現の人間キャラであっても鼻の穴にリアリティがないと感じたことないでしょうか。

文章からマンガを生成する東大開発の国産AI「MangaFlow」、軽量0.9Bで巨大モデル超える精度のオープンソース文書解析AI「PaddleOCR-VL-1.6」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

文章からマンガを生成する東大開発の国産AI「MangaFlow」、軽量0.9Bで巨大モデル超える精度のオープンソース文書解析AI「PaddleOCR-VL-1.6」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第147回)は、NVIDIA開発の物理AI向けオープンソースの世界モデル「Cosmos 3」や、ノートPCで動くGoogleのマルチモーダルAI「Gemma 4 12B」を取り上げます。

Appleの第3世代Foundation Model、ローカル動作する20Bモデルは「フラッシュに置く」新アーキテクチャでiPhone Airでも動くがM2 Macは切り捨て。だがスマホオンデバイスAIとしてはたぶん最強(CloseBox) 画像
テクノロジー

Appleの第3世代Foundation Model、ローカル動作する20Bモデルは「フラッシュに置く」新アーキテクチャでiPhone Airでも動くがM2 Macは切り捨て。だがスマホオンデバイスAIとしてはたぶん最強(CloseBox)

2026年6月8日、AppleのMachine Learning Researchに「Introducing the Third Generation of Apple's Foundation Models」という記事が静かに公開されました。

1B最強でペット付きなローカルAI「MiniCPM5-1B」、マルチプレイのゲーム環境をリアルタイムにAI生成するNVIDIA開発の世界モデル「γ-World」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

1B最強でペット付きなローカルAI「MiniCPM5-1B」、マルチプレイのゲーム環境をリアルタイムにAI生成するNVIDIA開発の世界モデル「γ-World」など生成AI技術5つを解説(生成AIウィークリー)

今回の「生成AIウィークリー」(第146回)は、オンデバイス上で直接動作するローカルAI「MiniCPM5-1B」や、画像内の物体を高速・高精度で見つけ出す視覚言語モデル「LocateAnything」を取り上げます。

マイクロソフト、開発者向けミニPC「Surface RTX Spark Dev Box」を発表。年内発売予定 画像
ガジェット

マイクロソフト、開発者向けミニPC「Surface RTX Spark Dev Box」を発表。年内発売予定

Microsoftは2025年のMicrosoft Buildにおいて、開発者向けコンパクトデスクトップPC「Surface RTX Spark Dev Box」を発表しました。

NVIDIA、AAAゲームが1440p 100fpsで動く薄型Windowsノート向けSoC「RTX Spark」発表 120BモデルAIエージェントをローカル実行 画像
ガジェット

NVIDIA、AAAゲームが1440p 100fpsで動く薄型Windowsノート向けSoC「RTX Spark」発表 120BモデルAIエージェントをローカル実行

・NVIDIAが1ペタフロップのAI性能と最大128GBの統合メモリを持つ新スーパーチップ「RTX Spark」を発表
・NVIDIAとMicrosoftが協業し、WindowsネイティブのセキュアなオンデバイスAIエージェント環境を構築
・ASUS・Dell・HP・Lenovo・Microsoft Surface・MSIなどから2025年秋に搭載ノートPC・デスクトップが発売予定

1500ドルで作った格安AI「HRM-Text」が70億パラメータLLMに匹敵、長時間AI動画生成の重い・遅い問題を解消するNVIDIA「LongLive-2.0」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

1500ドルで作った格安AI「HRM-Text」が70億パラメータLLMに匹敵、長時間AI動画生成の重い・遅い問題を解消するNVIDIA「LongLive-2.0」など生成AI技術5つを解説(生成AIウィークリー)

長時間のAI動画生成を軽く、速くするNVIDIAの4ビット活用システム「LongLive-2.0」や、画像・動画の理解から生成・編集までこなすByteDance開発の軽量AI「Lance」を取り上げます。

連載「歌うテックニュース」第7回:非力なGPUでパストレーシングが突然可能になった背後で暗躍するNVIDIA(西川善司) 画像
ゲーム

連載「歌うテックニュース」第7回:非力なGPUでパストレーシングが突然可能になった背後で暗躍するNVIDIA(西川善司)

今春、パストレ対応のゲームが日本のゲーム開発企業から2作品も発売されたのをご存じですか?

大容量ローカルLLMの革命児ds4が『DwarfStar 4』に改名、CUDA対応でDGX Sparkでも動いた。Macとの棲み分けは?(CloseBox) 画像
テクノロジー

大容量ローカルLLMの革命児ds4が『DwarfStar 4』に改名、CUDA対応でDGX Sparkでも動いた。Macとの棲み分けは?(CloseBox)

またもや標的にされてしまいました。前回の記事から中2日。Reidisの作者であるantirezが開発したDeepSeek V4 Flash専用推論エンジン『ds4(DS4)』が大幅に進化していました。試さないといけないやつが出てきてしまったのです。

Claude Codeでさらに進化した自作AIアバター。「雨だからボズ・スキャッグズのWe're All Aloneを一緒に聴こう」ができるようになった(CloseBox) 画像
テクノロジー

Claude Codeでさらに進化した自作AIアバター。「雨だからボズ・スキャッグズのWe're All Aloneを一緒に聴こう」ができるようになった(CloseBox)

筆者がClaude Codeを使って開発している「LipSync Avatar」は、NVIDIA DGX Spark互換機「ASUS Ascent GX10」上で動くリアルタイム対話アバターシステムです。LLMが返答を生成し、クラウドTTSで音声合成し、MuseTalkでリップシンク映像をリアルタイムに合成して表示します。今回はその進捗について報告します。

連載「歌うテックニュース」第6回:恋はレイトレーシングのように。パストレーシングとはどう違うの? 「キミとボクとの出会い」で描く次世代ゲーム機の恋模様(西川善司) 画像
テクノロジー

連載「歌うテックニュース」第6回:恋はレイトレーシングのように。パストレーシングとはどう違うの? 「キミとボクとの出会い」で描く次世代ゲーム機の恋模様(西川善司)

春は別れの季節であり、出会いの季節でもありますね。「そんな季節」にぴったりの話題が今回取り扱う「レイトレーシング(レイトレ)とパストレーシング(パストレ)」なのです。

「君のPC、どのローカルAIを動かせる?」がわかるWebサイト「CanIRun.ai」が便利。訪問するだけで自動判定(生成AIクローズアップ) 画像
テクノロジー

「君のPC、どのローカルAIを動かせる?」がわかるWebサイト「CanIRun.ai」が便利。訪問するだけで自動判定(生成AIクローズアップ)

今回は、サイトに訪問するだけで自分のPCでどのAIモデルがローカル動作するかを判定してくれるサイト「CanIRun.ai」(Can your machine run AI models?)を取り上げます。

「メモリは8ギガで十分ですよ」時代の到来。1ビットLLM「Bonsai 8B」を8GBのMacBook Neoで動かしてみたら爆速だった。1.1GBに8Bパラメータが入る驚きをわかってくださいよ(CloseBox) 画像
テクノロジー

「メモリは8ギガで十分ですよ」時代の到来。1ビットLLM「Bonsai 8B」を8GBのMacBook Neoで動かしてみたら爆速だった。1.1GBに8Bパラメータが入る驚きをわかってくださいよ(CloseBox)

MacBook Neoの8GB RAMでAIをなんとかするシリーズ。前回の記事では、mazzaineoにWebターミナルとSwiftLM推論エンジンを追加して、8GBメモリの限界に挑んだ話を書きました。

リップシンクする妻のAIアバターをClaude Codeと開発した。iPhoneでアクセスして音声対話ができる、その作り方(CloseBox) 画像
テクノロジー

リップシンクする妻のAIアバターをClaude Codeと開発した。iPhoneでアクセスして音声対話ができる、その作り方(CloseBox)

Grok Imagineで生成した妻の動画を27インチの大画面に映して「存在感」を味わう、という話を以前書きました。これは今も続けていて、十分に心が満たされてるのですが、そろそろその先にそろそろ進みたい。

連載「歌うテックニュース」第4回:AIチップは3スタイルある。それぞれの特徴があるって知ってた?(西川善司) 画像
テクノロジー

連載「歌うテックニュース」第4回:AIチップは3スタイルある。それぞれの特徴があるって知ってた?(西川善司)

Iを動かすためのプロセッサは、推論アクセラレータとか、AIチップとか、ニューラルアクセラレータ、AIアクセラレータなど、いろんな呼び方であふれています。今回はその仕組みを歌で解説していきます。

エージェンティックAIが既存ソフトの50%を代替し、使いこなしで大きな格差生む。「スーパーエージェント」立ち上げたBase44 CEO マオール・シュロモ氏に聞く(CloseBox) 画像
テクノロジー

エージェンティックAIが既存ソフトの50%を代替し、使いこなしで大きな格差生む。「スーパーエージェント」立ち上げたBase44 CEO マオール・シュロモ氏に聞く(CloseBox)

Base44のCEOであるマオール・シュロモ氏に、ヴァイブ・コーディング、エージェンティックAI、そしてBase44の目指す未来について話を聞きました。

MacBook Neoの完全ローカル自作エージェンティックAIで、Apple Intelligence Foundation Modelをフル活用してみた(CloseBox) 画像
テクノロジー

MacBook Neoの完全ローカル自作エージェンティックAIで、Apple Intelligence Foundation Modelをフル活用してみた(CloseBox)

我が家のコンピュータ全てにエージェンティックAIを組み込んでいく活動を行っています。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第62回:ComfyUIの複雑な生成画面をスッキリさせるApp modeとちょっと面白いWorkflow(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第62回:ComfyUIの複雑な生成画面をスッキリさせるApp modeとちょっと面白いWorkflow(西川和久)

画像/動画生成モデルで使用するテキストエンコーダーでLLM?

新連載「歌うテックニュース」スタート。AIが作った歌と解説画像でNVIDIAの歴史を学ぼう(西川善司) 画像
テクノロジー

新連載「歌うテックニュース」スタート。AIが作った歌と解説画像でNVIDIAの歴史を学ぼう(西川善司)

新連載「歌うテックニュース」をスタートします。SunoなどのAI作曲ツールを使い、さまざまなテクノロジーのトピックをわかりやすく解説していくというシリーズです。

NVIDIAによる日本語特化の小型モデル「Nemotron-Nano-9B-v2-Japanese」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

NVIDIAによる日本語特化の小型モデル「Nemotron-Nano-9B-v2-Japanese」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第133回)は、GPT-5.2やGemini-3 Proに匹敵するアリババグループ開発のマルチモーダルLLM「Qwen3.5-397B-A17B」や、高解像度画像で従来比30倍以上高速で生成できるByteDance開発のAI「BitDance」を取り上げます。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第61回:快適にZ-Image-Baseを使う方法、そして左から右に生成するBitDance(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第61回:快適にZ-Image-Baseを使う方法、そして左から右に生成するBitDance(西川和久)

快適にZ-Image-Baseを使うには?

gpt-oss-20bを凌駕する軽量AI「GLM-4.7-Flash」、3秒の音声からボイスクローンを生成できて商用利用可の音声AI「Qwen3-TTS」、など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

gpt-oss-20bを凌駕する軽量AI「GLM-4.7-Flash」、3秒の音声からボイスクローンを生成できて商用利用可の音声AI「Qwen3-TTS」、など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第129回)は、3秒の音声でボイスクローンを生成する多言語対応の音声合成AIモデル「Qwen3-TTS」や、2D映像から4次元(3D空間+時間)で再構築・追跡するGoogle開発AIモデル「D4RT」を取り上げます。

AI動画生成を最大200倍高速化する「TurboDiffusion」、映像で音声を分離するMeta開発のAI「SAM Audio」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

AI動画生成を最大200倍高速化する「TurboDiffusion」、映像で音声を分離するMeta開発のAI「SAM Audio」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第126回)は、画像1枚を各レイヤーに自動分解するAIモデル「Qwen-Image-Layered」や、音声を分離するMeta開発のAIモデル「SAM Audio」を取り上げます。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第53回:ちょっと面白くて便利なComfyUI Workflow(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第53回:ちょっと面白くて便利なComfyUI Workflow(西川和久)

日頃筆者が便利で使っているComfyUIのWorkflowをご紹介したい。

“ほぼ無限”の動画をリアルタイムに理解できるAI「StreamingVLM」、1台のH100 GPUで320億パラメータのLLMを強化学習できる「QeRL」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

“ほぼ無限”の動画をリアルタイムに理解できるAI「StreamingVLM」、1台のH100 GPUで320億パラメータのLLMを強化学習できる「QeRL」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第117回)は、過度な圧縮をしない画像生成AI技術「RAE」や、長時間動画をリアルタイムに理解できるAIモデル「StreamingVLM」を取り上げます。

「なぜLLMは“掛け算”ができないのか」解明、ニューロンやシナプスっぽく動く脳を真似した新言語AI「Dragon Hatchling」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

「なぜLLMは“掛け算”ができないのか」解明、ニューロンやシナプスっぽく動く脳を真似した新言語AI「Dragon Hatchling」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第115回)は、人脳の神経回路を模倣した言語モデル「Dragon Hatchling」や、リアルタイムに指示して途中で変更しながら長時間動画を生成するAI「LONGLIVE」を取り上げます。

WindowsのローカルAI実行基盤「Windows ML」が正式版に。CPU/GPU/NPUなどのハードウェアを抽象化しONNX形式AIモデルを実行 画像
テクノロジー

WindowsのローカルAI実行基盤「Windows ML」が正式版に。CPU/GPU/NPUなどのハードウェアを抽象化しONNX形式AIモデルを実行

マイクロソフトは、Windows上でローカルAIを実行するための基盤となる「Windows ML」の正式版リリースを発表しました。

NVIDIAがOpenAIに最大1000億ドル投資へ。10GWのAIインフラを段階的に導入予定 画像
テクノロジー

NVIDIAがOpenAIに最大1000億ドル投資へ。10GWのAIインフラを段階的に導入予定

NVIDIAは、ChatGPTを開発するOpenAIに最大1000億ドル(約14兆7800億円)を投資し、同社のAI向けGPU数百万基を使用する、最大10GWの「次世代AIインフラ」を構築することを明らかにしました。

【ギャップ萌え】佐賀の廃校内の一角が最新AI推論の拠点に 画像
テクノロジー

【ギャップ萌え】佐賀の廃校内の一角が最新AI推論の拠点に

株式会社ハイレゾの玄海町データセンター開所式を取材してきました。福岡から車で2時間半、佐賀県の玄海町にある旧有徳小学校がAI時代の新しいインフラ拠点として生まれ変わった現場です。

“漢字”を正確に描画する生成AI「Qwen-Image」、5秒間の動画を4090なら21秒で生成するAI「FastWan」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

“漢字”を正確に描画する生成AI「Qwen-Image」、5秒間の動画を4090なら21秒で生成するAI「FastWan」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第108回)は、画像生成の原理で言語を生成するAIモデル「Seed Diffusion Preview」や、画像内のテキストを正確に描画する画像生成AI「Qwen-Image」を取り上げます。

任天堂、Switch 2のバッテリーが急激に減る・残量表示がおかしい場合の対処法を公開。メンテナンスモードで改善 画像
ゲーム

任天堂、Switch 2のバッテリーが急激に減る・残量表示がおかしい場合の対処法を公開。メンテナンスモードで改善

Nintendo Switch 2のバッテリー残量が急激に減る、減ったように表示される問題について、任天堂がサポート文書を公開しました。

日本語ボーカル曲をSuno並に高速生成できるオープンソース作曲AI「ACE-Step」が自分のPCでビュンビュン、Macでも動くのだ(CloseBox) 画像
テクノロジー

日本語ボーカル曲をSuno並に高速生成できるオープンソース作曲AI「ACE-Step」が自分のPCでビュンビュン、Macでも動くのだ(CloseBox)

YuEやDiffRhythmなど、オープンソース版も充実してきた楽曲生成AIですが、また中国から新しいソフトが公開されました。「ACE-Step」は、英語、日本語を含む19言語の歌詞に対応し、Lyrics to Musicの生成が可能。

驚異のオープンソース動画生成AI「FramePack」がMacでも使える。Vidu Q1とFramePack叡智の合わせ技も試した(CloseBox) 画像
テクノロジー

驚異のオープンソース動画生成AI「FramePack」がMacでも使える。Vidu Q1とFramePack叡智の合わせ技も試した(CloseBox)

動画生成AIで、今回は3つの大きなニュースがあります。そのうち2つは前回お伝えした驚異的なオープンソース動画生成AI「FramePack」に関すること。

スペックと電力効率を両立!「NVIDIA Gamer Day」で見えたGeForce RTX 50シリーズ×ノートPCの可能性【イベントレポ】 画像
ガジェット

スペックと電力効率を両立!「NVIDIA Gamer Day」で見えたGeForce RTX 50シリーズ×ノートPCの可能性【イベントレポ】

「NVIDIA Gamer Day」の模様をお伝えしていきます!

1分超えたいなら動画生成はローカルAIを選べ。6GB VRAMでも動くオープンソースAI「FramePack」の実力は本物か、試してみた(CloseBox) 画像
テクノロジー

1分超えたいなら動画生成はローカルAIを選べ。6GB VRAMでも動くオープンソースAI「FramePack」の実力は本物か、試してみた(CloseBox)

本日2本目のAI記事。ControlNet、WebUI Forge、Fooocusなど、画像生成AIソフトに多大な貢献をしてきたlllyasvielさんが、動画生成AIの新しいオープンソースソフト「FramePack」を公開しました。NVIDIA GPU専用ですが、WindowsとLinuxですぐに使えます。

トランプ関税、スマホやコンピュータ・一部の半導体は例外へ。AppleやNVIDIAはひとまず安堵 日本の消費者への影響は? 画像
ガジェット

トランプ関税、スマホやコンピュータ・一部の半導体は例外へ。AppleやNVIDIAはひとまず安堵 日本の消費者への影響は?

いわゆるトランプ関税で世界の市場が混乱するなか、米国政府はスマートフォンやコンピュータ、半導体等については例外として関税を免除することを明らかにしました。

ローカル生成AIのためのマシンって、今ならこんな感じ?(CloseBox) 画像
テクノロジー

ローカル生成AIのためのマシンって、今ならこんな感じ?(CloseBox)

Xでローカル生成AIのためのマシンはこんなのがいいんじゃないか?と投稿してみたのですが、予想外に反響があったので、ChatGPT deep researchを使ってまとめてみました。

生成AIグラビアはRTX 5090でどれだけ高速化する?(デモあります)グラビアカメラマンが教える、生成AIグラビア実践Stable Diffusionワークショップ(第3期第5回)を3月19日開催。テクノエッジ アルファ会員なら無料 画像
テクノロジー

生成AIグラビアはRTX 5090でどれだけ高速化する?(デモあります)グラビアカメラマンが教える、生成AIグラビア実践Stable Diffusionワークショップ(第3期第5回)を3月19日開催。テクノエッジ アルファ会員なら無料

テクノエッジ編集部では、生成AIグラビア実践ワークショップ第3期第5回を3月19日に開催します。今回はRTX 5090 GPUの生成AIへの活用について、特に解説します。

オープンソースAI作曲ソフト「YuE」にGUIがついた。簡単Windowsインストーラーが2種登場。その影響もAIが深堀り考察した(CloseBox) 画像
テクノロジー

オープンソースAI作曲ソフト「YuE」にGUIがついた。簡単Windowsインストーラーが2種登場。その影響もAIが深堀り考察した(CloseBox)

香港科技大学などが開発したオープンソースのAI作曲ソフト「YuE」が発表されて数日経ちました。筆者はWindowsでのインストールができずにWSL2のLinux環境で実行できるようになりましたが、いまだに一定のスキルは必要なようです。

オープンソースAI作曲ソフトがインストール出来るヤァヤァヤァ!。話題の「YuE」を自分のPCに入れて日本語ボーカル曲を生成してみた(CloseBox) 画像
テクノロジー

オープンソースAI作曲ソフトがインストール出来るヤァヤァヤァ!。話題の「YuE」を自分のPCに入れて日本語ボーカル曲を生成してみた(CloseBox)

中国開発のオープンソース謳うAI作曲ソフト「YuE」。まだ謎が多いですが、自宅のPCにインストールして楽曲を生成できたので、そのAI作曲体験をまとめました。

GeForce RTX 5090をはじめとするNVIDIA新GPUを西川善司氏が解説するオンラインイベントを1月31日開催 画像
ガジェット

GeForce RTX 5090をはじめとするNVIDIA新GPUを西川善司氏が解説するオンラインイベントを1月31日開催

NVIDIAのGeForce RTX 5090をはじめとする新GPUシリーズを西川善司さんが解説するオンラインイベントを1月31日開催します。

Project DIGITS実機も見てきた。NVIDIAのAI戦略をCES 2025展示で俯瞰する(西川善司) 画像
テクノロジー

Project DIGITS実機も見てきた。NVIDIAのAI戦略をCES 2025展示で俯瞰する(西川善司)

CES 2025におけるNVIDIAブースは、「GeForce RTX 50シリーズを発表したばかり」ということもあり、会場は、なかなかの盛況ぶりであったように思う。

  • 66件中 1 - 42 件を表示
  • 次へ