大容量ローカルLLMの革命児ds4が『DwarfStar 4』に改名、CUDA対応でDGX Sparkでも動いた。Macとの棲み分けは?(CloseBox)
またもや標的にされてしまいました。前回の記事から中2日。Reidisの作者であるantirezが開発したDeepSeek V4 Flash専用推論エンジン『ds4(DS4)』が大幅に進化していました。試さないといけないやつが出てきてしまったのです。
128GB超メモリMac専用の巨大LLMエンジン「DwarfStar 4」はローカル推論の常識をどう書き換えるのか。284BのDeepSeek V4 FlashをM4 Max 128GB MacBook Proの自作AIに組み込んでみた(CloseBox)
Redisの作者であるSalvatore Sanfilippo(antirez)が、5月初旬にGitHubへひっそりと新しいリポジトリを公開しました。名前は『ds4』。DeepSeek V4 Flash専用のローカル推論エンジンです。
「最大3倍速」と「2.24倍速」、2つのLLM高速化技術は8GBのMacBook Neoに通じるか、128GB M4 Maxでも試して得た結論(CloseBox)
ローカルLLMの世界では、毎週のように「最大◯倍速」という見出しが流れてきます。今週飛び込んできたのは二本立てでした。
“なんちゃってゲーム”を超えて複雑なWebゲームを自動生成するローカルAI「OpenGame」、Claude Opus 4.5に迫る精度のAIモデル「Qwen3.6-27B」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第142回)は、オープンソースで最高精度の「DeepSeek-V4」や、Claude Opus 4.5に迫る精度の270億パラメータであるマルチモーダルAIモデル「Qwen3.6-27B」を取り上げます。
Claude Codeでさらに進化した自作AIアバター。「雨だからボズ・スキャッグズのWe're All Aloneを一緒に聴こう」ができるようになった(CloseBox)
筆者がClaude Codeを使って開発している「LipSync Avatar」は、NVIDIA DGX Spark互換機「ASUS Ascent GX10」上で動くリアルタイム対話アバターシステムです。LLMが返答を生成し、クラウドTTSで音声合成し、MuseTalkでリップシンク映像をリアルタイムに合成して表示します。今回はその進捗について報告します。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第65回:顔LoRA不要、写真4枚で激似にするWorkflowを紹介しよう(西川和久)
生成AI画像で任意の顔に似せるには?
文系年金受給記者がAIハッカソンでゲームプログラミング。富士山麓にMacBook Neoを持ち込みヴァイブコーディングした結末(CloseBox)
大学受験は数学の配点が著しく低いところを選んだし、それでも100点中20点しか取れなかったという、完全文系なわたくしですが、このほど、富士山麓河口湖にある貸別荘で開催されたAIハッカソンに参加してきました。
「君のPC、どのローカルAIを動かせる?」がわかるWebサイト「CanIRun.ai」が便利。訪問するだけで自動判定(生成AIクローズアップ)
今回は、サイトに訪問するだけで自分のPCでどのAIモデルがローカル動作するかを判定してくれるサイト「CanIRun.ai」(Can your machine run AI models?)を取り上げます。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第64回:日本語文字に強いERNIE-Image登場!(西川和久)
Baiduから文字に強いERNIE-Image登場!
「1.58ビットに進化したから8GBで十分ですよ。任せてくださいよ」とBonsaiが言うのでMacBook Neoに組み込んでその性能差を体感。iPhoneでも楽々動くしで、ローカルAIが超進化中(CloseBox)
2週間前、「1ビットLLMのBonsai 8Bが8GBのMacBook Neoで爆速だった」という記事を書きました。1.1GBに8.2Bパラメータが詰まっていて、Tool Callingも完璧に動く。そして今日、Bonsai開発元のPrismMLが次の一手を打ってきました。
iPhone Airだけで動くAIとの音声対話アプリ、Claude Codeが一晩で作ってくれました。そして実感したMacとiPhoneの格差(CloseBox)
今日、筆者はiPhoneアプリ開発者となりました。
「生成AIが、最初からなかったことにするみたいに 新しい世界を始めようとしている」 そんな感傷的な曲ができたから、Claude Codeで歌詞同期ビジュアライザーを作った(CloseBox)
映画「ブレードランナー」のことを考えていました。ネタにしたから、というのもありますが。
精度ほぼ同等で80億パラメータがiPhoneで動く「1ビットLLM Bonsai 8B」、国産AI「LLM-jp-4」を国立情報学研究所がオープンソースで公開など生成AI技術5つを解説(生成AIウィークリー)
「生成AIウィークリー」第139回では、国立情報学研究所がオープンソースで公開した大規模言語モデル「LLM-jp-4」や、Netflixなどが開発の動画から物体を消すと世界も変わる技術「VOID」を取り上げます。
Gemma 4を8GBのMacBook Neoで動かしたらAIが開眼。KVキャッシュ量子化組み込みでさらに進化しちゃった(CloseBox)
MacBook Neoの8GBメモリでAIをなんとかするシリーズ。今回はGoogleが出したGemma 4を追加して、さらにmazzaineoに「目」を与えた話です。カメラで映したものを説明させたり、別ウィンドウのアプリやブラウザの動作を解説させたりできるようになりました。
ブラウザ上で完結するAI校正付き無料OCRツール「NDLOCR-Lite Web AI」登場。国立国会図書館「NDLOCR-Lite」を活用(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。
「メモリは8ギガで十分ですよ」時代の到来。1ビットLLM「Bonsai 8B」を8GBのMacBook Neoで動かしてみたら爆速だった。1.1GBに8Bパラメータが入る驚きをわかってくださいよ(CloseBox)
MacBook Neoの8GB RAMでAIをなんとかするシリーズ。前回の記事では、mazzaineoにWebターミナルとSwiftLM推論エンジンを追加して、8GBメモリの限界に挑んだ話を書きました。
リップシンクする妻のAIアバターをClaude Codeと開発した。iPhoneでアクセスして音声対話ができる、その作り方(CloseBox)
Grok Imagineで生成した妻の動画を27インチの大画面に映して「存在感」を味わう、という話を以前書きました。これは今も続けていて、十分に心が満たされてるのですが、そろそろその先にそろそろ進みたい。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第63回:プロンプトがマンネリ化してるとお嘆きの貴兄に(西川和久)
今回は意外性のある出力を求める実験。プロンプトをいかに拡張するか。
AIエージェントがコマンドラインでブラウザを自動操作。「Browser Use CLI 2.0」リリース。Chrome DevTools接続などで操作が倍速に
人間やAIエージェントがコマンドラインから指示することでWebブラウザを操作できるオープンソースのPythonライブラリ「Browser Use CLI 2.0」がリリースされました。
アイデアを入力するだけで国際会議レベルの学術論文を生成する「AutoResearchClaw」、PCが使われていない時を狙ってこっそり進化するAIエージェント「MetaClaw」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第137回)。
エージェンティックAIが既存ソフトの50%を代替し、使いこなしで大きな格差生む。「スーパーエージェント」立ち上げたBase44 CEO マオール・シュロモ氏に聞く(CloseBox)
Base44のCEOであるマオール・シュロモ氏に、ヴァイブ・コーディング、エージェンティックAI、そしてBase44の目指す未来について話を聞きました。
MacBook Neoの完全ローカル自作エージェンティックAIで、Apple Intelligence Foundation Modelをフル活用してみた(CloseBox)
我が家のコンピュータ全てにエージェンティックAIを組み込んでいく活動を行っています。
AIは「ポケモンマスター」になれる?2000万対戦データで挑む次世代AIの限界とは……【話題の論文】
AIのポケモン対戦能力は未だ人間のエリートに及ばず、不完全情報や長期計画の難しさが課題であり、従来の評価体系では測りきれない複合的能力の重要性が示された。
生成AIグラビア実践ワークショップ、次回は「ComfyUIを簡単にしてくれるApp mode」をテーマに3月19日開催。テクノエッジ アルファ会員なら無料
テクノエッジ編集部では、生成AIグラビア実践ワークショップ第4期第4回を3月19日に開催します。今回は、「ComfyUIを簡単にしてくれるApp mode」をテーマに、デモを交えて解説します。
型落ちiPhone仕様のMacBook Neoですら動くんだからエージェンティックAI、Androidでも動くのでは? 作ってみた結果(CloseBox)
MacBook Neoで思いのほか快適に動いてしまったエージェンティックAIに気をよくして、Claude Codeをフル稼働させてエージェンティックAIの輪を広げています。次のターゲットはAndroid端末。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第62回:ComfyUIの複雑な生成画面をスッキリさせるApp modeとちょっと面白いWorkflow(西川和久)
画像/動画生成モデルで使用するテキストエンコーダーでLLM?
メールやサーバ権限などを与えた自律AIによる実環境2週間の大暴走実録、「情報漏洩」「DoS状態」「リソース大量消費」など11の失態発覚。生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第135回)は、AIの学習時間を2倍以上高速化させる強化学習システム「AReaL」や、1枚のH100で長尺動画を生成する140億パラメータの動画生成AI「Helios」を取り上げます。
わずか8GBのメモリ。MacBook NeoでエージェンティックAIを開発したら、絵を描いて曲も作れるように。MVまで全てローカルで完結できた(CloseBox)
エージェンティックAIを自分で構築してまだ3日しか経っていないのですが、その体験がおもしろすぎたのでいろいろなバリエーションを試しています。
OpenClawも不要。完全ローカルで動くエージェンティックAIを非プログラマー(俺)が開発できる時代。しかも自分で機能追加して育成できるのだ(CloseBox)
AI研究家の友人、清水亮さんから、エージェント作らないか、というお誘いがありました。
家庭用PCで使える無料OCRツール「NDLOCR-Lite」を国立国会図書館が公開、生成速度が世界最速と謳う拡散型LLM「Mercury 2」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第134回)は、GPT-5-miniを上回る「Qwen3.5」の軽量モデル群や、国立国会図書館が発表した家庭用PCで使える無料OCRツール「NDLOCR-Lite」を取り上げます。
NVIDIAによる日本語特化の小型モデル「Nemotron-Nano-9B-v2-Japanese」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第133回)は、GPT-5.2やGemini-3 Proに匹敵するアリババグループ開発のマルチモーダルLLM「Qwen3.5-397B-A17B」や、高解像度画像で従来比30倍以上高速で生成できるByteDance開発のAI「BitDance」を取り上げます。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第61回:快適にZ-Image-Baseを使う方法、そして左から右に生成するBitDance(西川和久)
快適にZ-Image-Baseを使うには?
Nano Banana Proに迫る実力、文字入り画像を高精度生成するAI「Qwen-Image-2.0」、GPT-5.2やGemini 3.0 Proとやり合える軽量AI「Step 3.5 Flash」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第132回)は、Nano Banana Proに迫る性能を示す画像内の文字を正確に生成するAIモデル「Qwen-Image-2.0」や、GPT-5.2やGemini 3.0 Proとやり合える成績を示す1960億パラメータの軽量AI「Step 3.5 Flash」を取り上げます。
5秒の声から良質ボイスクローンを生成できるCPU動作の軽量ローカルAI「Pocket TTS」、AIにゲームで遊ばせたら別ジャンルでも能力が向上した研究など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第128回)は、5秒の音声サンプルから話者の声を模倣できるオープンソース軽量モデル「Pocket TTS」や、画像から撮影場所を特定するAI技術「Thinking with Map」を取り上げます。
Sora 2 Pro超えのローカル動画生成AI「LTX-2」登場、英語ネイティブでない研究者がAI利用で論文投稿数89%増など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第127回)は、Sora 2 Pro超え性能でテキストから音声付き動画を生成するAI「LTX-2」や、スマホで撮った普通の動画を4Dシーンに変換するAIモデル「NeoVerse」を取り上げます。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第58回:大晦日に登場したQwen-Image-2512の実力は?(西川和久)
Qwen-Image-2512リリース!
AI動画生成を最大200倍高速化する「TurboDiffusion」、映像で音声を分離するMeta開発のAI「SAM Audio」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第126回)は、画像1枚を各レイヤーに自動分解するAIモデル「Qwen-Image-Layered」や、音声を分離するMeta開発のAIモデル「SAM Audio」を取り上げます。
ポケモンバトルの最強AIはどれ? Gemini 、GPT、Claude、DeepSeek、Grokが総当たり戦した結果(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、主要な大規模言語モデル(LLM)同士をポケモン(ポケットモンスター)バトルで戦わせた総当たり戦の結果を示した論文「Large Language Models as Pokémon Battle Agents: Strategic Play and Content Generation」を取り上げます。
LLMを機能不全に追い込む新型DoS攻撃「ThinkTrap」、論文からコードを生成するAI「DeepCode」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第124回)は、API経由でクローズド大規模言語モデル(LLM)にDoS攻撃できる手法「ThinkTrap」や、論文からコードを生成するAI「DeepCode」を取り上げます。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第57回:充実してきたZ-Image-Turboその後(西川和久)
Z-Image-Turboその後の動きについて。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第56回:2025年秋の陣Part 2は高速無検閲のZ-Image-Turbo(西川和久)
前回、2025年秋の陣Part1としてFLUX.2 [dev]をご紹介したが、直後の11月27日にリリースされたZ-Image-Turboをご紹介したい。
見破れないAIの嘘は脳波が見破る、全LLMが抱える未解決問題「デジタル健忘症」をGoogleが解決か、など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第123回)は、AIの嘘に表面上は騙されていても、脳波から抽出した神経信号からの判断ではその嘘を見破ることを示した研究や、画像や動画内の人や物を高精度にセグメンテーションするMeta開発モデル「SAM 3」を取り上げます。
- 96件中 1 - 42 件を表示
- 次へ
