LTX-2.3超えの商用利用可能な日本語対応ローカル音声付き動画生成AI「daVinci-MagiHuman」、“自己改善の仕方”も自己改善するメタ認知型自己修正AI「HyperAgents」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第138回)は、動画・音声・テキストを見ているときの脳反応を予測できるMeta開発の脳活動推測AI「TRIBE v2」や、人間には簡単でもAIには難しい新しいテスト「ARC-AGI-3」を取り上げます。
連載「歌うテックニュース」第4回:AIチップは3スタイルある。それぞれの特徴があるって知ってた?(西川善司)
Iを動かすためのプロセッサは、推論アクセラレータとか、AIチップとか、ニューラルアクセラレータ、AIアクセラレータなど、いろんな呼び方であふれています。今回はその仕組みを歌で解説していきます。
8GBメモリの限界に挑戦。MacBook NeoのローカルAIにApple Siliconネイティブ推論エンジン追加したら高速化できる? ターミナルも中から使えるようにしたよ(CloseBox)
MacBook Neo上で動かしているローカルエージェンティックAI「mazzaineo」に、新しい機能を2つ追加しました。1つはブラウザだけで操作を完結させるためのWebターミナル、もう1つはApple SiliconのMLXをネイティブに活用する最新の推論エンジン「SwiftLM」の統合です。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第63回:プロンプトがマンネリ化してるとお嘆きの貴兄に(西川和久)
今回は意外性のある出力を求める実験。プロンプトをいかに拡張するか。
たった3秒の声サンプルで多言語ボイスクローンを生成できるオープンウェイト音声AI「Voxtral TTS」をMistral AIが開発(生成AIクローズアップ)
今回は、わずか3秒の参照音声から、自然で表現力豊かな音声を生成できる多言語対応の音声合成(TTS)モデルを提案した論文「Voxtral TTS」を取り上げます。このモデルはフランスのAI企業「Mistral AI」が開発しました。
AIエージェントと人間のアイデンティティを統一管理する「Unified Access 」、1Passwordが発表
パスワードマネージャ「1Password」を提供している1Password社は、IDとパスワードやパスキーを用いた人間のアイデンティティだけでなく、AIエージェントが用いるシークレットなどの管理も1Passwordに統合することで、人間とAIエージェントのアイデンティティ管理を統一的に実現する新機能「Unified Access」を発表しました。
俺のAIクローンと歌い比べてみた結果。Suno v5.5に自分の歌声を登録して自由に歌わせられる「Voice」登場(CloseBox)
Sunoがバージョン5.5になりました。モデルが新しくなって音質が良くなったのとは別に、いくつかの新機能や変更があります。その中で最大のものが、「Voice」の登場です。
AIエージェントがコマンドラインでブラウザを自動操作。「Browser Use CLI 2.0」リリース。Chrome DevTools接続などで操作が倍速に
人間やAIエージェントがコマンドラインから指示することでWebブラウザを操作できるオープンソースのPythonライブラリ「Browser Use CLI 2.0」がリリースされました。
OpenAI、動画生成AI『Sora』アプリとAPIサービスを終了へ。生成した動画の保存方法などは後日発表
OpenAIが動画生成AI『Sora』の消費者向けサービスを終了すると発表しました。アプリが使えなくなる期日については明らかにしていません。
アップル、『WWDC26』を6月8日から開催へ。「AIの進化」など発表予定
アップルは、今年の世界開発者会議(WWDC26)を6月8日から12日にかけてオンライン開催すると発表しました。
20人分の効率化。Y Combinator CEO独自開発のClaude Code用カスタムスキル「gstack」が無料公開。本業の傍ら1日1万行以上の実用的なコードを出力(生成AIクローズアップ)
Y CombinatorのCEOであるギャリー・タン氏(Garry Tan)が、自身のClaude Codeの開発環境「gstack」をGitHubでオープンソース(MITライセンス)として無料公開したことを取り上げます。
エージェンティックAIが既存ソフトの50%を代替し、使いこなしで大きな格差生む。「スーパーエージェント」立ち上げたBase44 CEO マオール・シュロモ氏に聞く(CloseBox)
Base44のCEOであるマオール・シュロモ氏に、ヴァイブ・コーディング、エージェンティックAI、そしてBase44の目指す未来について話を聞きました。
MacBook Neoの完全ローカル自作エージェンティックAIで、Apple Intelligence Foundation Modelをフル活用してみた(CloseBox)
我が家のコンピュータ全てにエージェンティックAIを組み込んでいく活動を行っています。
さあ、AIに歌ってもらいましょう。「Intelがハイパースレッディングやめるってよ」「AMDはもうSMTをやめるなんていわないよ絶対」(西川善司)
今から2年前。2024年に、2つのCPUメーカーは、その基本動作アーキテクチャの方針をがらりと変えてきました。
普段の会話でAIエージェントを自分好みに育成できる「OpenClaw-RL」、イラスト1枚からLive2Dに使える分割素材を自動生成する「See-through」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第136回)は、AIらが複雑な作業を全自動処理してくれる商用利用も可能なオープンソースAIエージェント「DeerFlow 2.0」や、普段の対話でAIエージェントを自分好みに育成できる「OpenClaw-RL」を取り上げます。
新連載「やってみようVibe Coding 」第1回。ヴァイブ・コーディングという言葉を聞いたことがありますか?(小泉勝志郎)
Vibe Coding(ヴァイブorバイブ・コーディング)って聞いたことありますか? 将棋の藤井聡太さんが「今年ハマったもの」としてこの言葉に触れていたんですよ。AIに作りたいものを日本語で伝えるとコードを書いてくれる、といった体験を語っていました。
AIは「ポケモンマスター」になれる?2000万対戦データで挑む次世代AIの限界とは……【話題の論文】
AIのポケモン対戦能力は未だ人間のエリートに及ばず、不完全情報や長期計画の難しさが課題であり、従来の評価体系では測りきれない複合的能力の重要性が示された。
生成AIグラビア実践ワークショップ、次回は「ComfyUIを簡単にしてくれるApp mode」をテーマに3月19日開催。テクノエッジ アルファ会員なら無料
テクノエッジ編集部では、生成AIグラビア実践ワークショップ第4期第4回を3月19日に開催します。今回は、「ComfyUIを簡単にしてくれるApp mode」をテーマに、デモを交えて解説します。
型落ちiPhone仕様のMacBook Neoですら動くんだからエージェンティックAI、Androidでも動くのでは? 作ってみた結果(CloseBox)
MacBook Neoで思いのほか快適に動いてしまったエージェンティックAIに気をよくして、Claude Codeをフル稼働させてエージェンティックAIの輪を広げています。次のターゲットはAndroid端末。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第62回:ComfyUIの複雑な生成画面をスッキリさせるApp modeとちょっと面白いWorkflow(西川和久)
画像/動画生成モデルで使用するテキストエンコーダーでLLM?
Anthropic、好調なClaude人気にピーク時以外の使用量2倍キャンペーン開始。週末は終日2倍
Anthropicは、AIチャットボットClaudeの人気の高まりを受けて、2週間の期間限定でピーク時間帯を除くすべての時間において、ユーザーの使用量割り当てを2倍に増量するキャンペーンを開始しました。
“ほぼ人間”のAI音声を複数話者で一括生成。日本語対応オープンソースTTS「Fish Audio S2」、単語レベルの感情制御も可(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、人間の声と区別がつきにくいレベルに迫るリアルな音声を生成できるオープンソソースのText-to-Speech(TTS)「Fish Audio S2 Technical Report」を取り上げます。
メールやサーバ権限などを与えた自律AIによる実環境2週間の大暴走実録、「情報漏洩」「DoS状態」「リソース大量消費」など11の失態発覚。生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第135回)は、AIの学習時間を2倍以上高速化させる強化学習システム「AReaL」や、1枚のH100で長尺動画を生成する140億パラメータの動画生成AI「Helios」を取り上げます。
「わずか8GBのメモリ」MacBook Neo上に構築した完全オリジナルAIエージェントをさらに進化させる。音声対話、MVビジュアライザーを実装した(CloseBox)
MacBook Neo上に構築したエージェンティックAI「mazzaineo」、さらに進化しています。夜中に充電して起きたら持ち出し、バッテリー駆動で使い続けております。かわいいよシトラスNeo。
わずか8GBのメモリ。MacBook NeoでエージェンティックAIを開発したら、絵を描いて曲も作れるように。MVまで全てローカルで完結できた(CloseBox)
エージェンティックAIを自分で構築してまだ3日しか経っていないのですが、その体験がおもしろすぎたのでいろいろなバリエーションを試しています。
Anthropic、サプライチェーンリスク指定を受け米政府を提訴。OpenAIとGoogleの一部従業員がAnthropicの訴訟を支持する声明
Anthropicは3月9日、米戦争省(DoW。国防総省の現政権における呼称)がサプライチェーンリスク(国家安全保障上のブラックリスト)に同社を指定したことに対し、撤回を求める訴訟をカリフォルニア州連邦裁判所に起こしました。
メモリ高騰はなぜ起きたの? ボサノバに乗せて軽やかに理解するメモリクライシス(西川善司)
世界中を現在進行形で席巻しているメモリクライシス。実際、2025年2月と2026年2月とで比べてみると、DDR5(32GB×2枚セット)メモリは約3倍、NVMe SSD 2TBや3.5インチHDDドライブは2倍前後に値上がりしています。その謎をボサノバで歌って解説します。
プロ品質をローカルで使えて商用利用可能な音声付き動画生成AI「LTX-2.3」登場。Web版「LTX Studio」も(生成AIクローズアップ)
今回は、Lightricksよりリリースされた、最新の音声付き動画生成AIモデルである「LTX-2.3」を取り上げます。2026年1月にご紹介した、Sora 2 Pro越えのローカル動画生成AI「LTX-2」のアップデート版になります。
OpenAI、軍事に関する契約への倫理的懸念からロボット・消費者向けハード開発リーダーが離職
OpenAIのロボティクスおよび消費者向けハードウェア開発リーダーあるケイトリン・カリノフスキー氏は、3月7日に退職したことを明らかにしました。
ずっとNexus→PixelなGoogleスマートフォンユーザーは「Galaxy S26 Ultra」をどう感じたか(Google Tales)
今回のGoogle Talesは、Pixel 10 Proユーザー視点での、初めて触れるGalaxyのファーストインプレッション記録です。
家庭用PCで使える無料OCRツール「NDLOCR-Lite」を国立国会図書館が公開、生成速度が世界最速と謳う拡散型LLM「Mercury 2」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第134回)は、GPT-5-miniを上回る「Qwen3.5」の軽量モデル群や、国立国会図書館が発表した家庭用PCで使える無料OCRツール「NDLOCR-Lite」を取り上げます。
あなたがここにいてほしい。話さなくてもいいから。Grok Imagineと超大型Androidタブレットがもたらす存在感(CloseBox)
NHK総合テレビ「知的探求フロンティア タモリ・山中伸弥の!?」に出演し、妻のAIアバター「AIとりちゃん」と対話して曲を作る様子が放映されてから8カ月。開発を担当してくれているクリスタル・メソッドとの開発打ち合わせは今も続いています。
新連載「歌うテックニュース」スタート。AIが作った歌と解説画像でNVIDIAの歴史を学ぼう(西川善司)
新連載「歌うテックニュース」をスタートします。SunoなどのAI作曲ツールを使い、さまざまなテクノロジーのトピックをわかりやすく解説していくというシリーズです。
AnthropicのClaudeアプリが米App Storeランキングで1位に。ChatGPTを蹴落とす
AnthropicのAIチャットボット「Claude」は、最新の米App Store無料アプリランキングで、OpenAIのChatGPTを抜き首位に躍り出ました。
Whisperを超える精度のリアルタイム文字起こしローカルAI「Moonshine Voice」、日本語にも対応(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、ローカルで起動できるリアルタイム文字起こしAI「Moonshine Voice」を取り上げます。
OpenAI、米政府機密網への同社AIの展開契約を獲得。Anthropicが拒否された安全策も盛り込むと主張
OpenAIのサム・アルトマンCEOは金曜夜遅くに、米戦争省(DoW。大統領例で改称された国防総省の呼称)の機密ネットワークに自社技術を展開する契約を結んだと発表しました。
トランプ大統領、連邦政府機関にClaude AIの使用廃止を指示。「Anthropicの技術など不要、使いたくもない」と述べる
ドナルド・トランプ大統領は、米国のすべての連邦政府機関に対し、Anthropicの生成AIサービス「Claude」の使用を「即時取りやめ」るよう指示したことを、自ら設立したSNS、Truth Socialへの投稿で明らかにしました。
Anthropic、米戦争省からのClaude無制限使用要求に応じず。国内監視や完全自律兵器への応用に懸念
Anthropicのダリオ・アモデイCEOは、米戦争省(DoW。2025年大統領令により国防総省の名を置き換えて表記)からの、Claude AIシステムへの無制限のアクセス要求に応じない考えを再確認する声明を発表しました。
NVIDIAによる日本語特化の小型モデル「Nemotron-Nano-9B-v2-Japanese」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第133回)は、GPT-5.2やGemini-3 Proに匹敵するアリババグループ開発のマルチモーダルLLM「Qwen3.5-397B-A17B」や、高解像度画像で従来比30倍以上高速で生成できるByteDance開発のAI「BitDance」を取り上げます。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第61回:快適にZ-Image-Baseを使う方法、そして左から右に生成するBitDance(西川和久)
快適にZ-Image-Baseを使うには?
Galaxy S26シリーズ発表イベント速報。覗き見防止にエージェントAI搭載。今宵のライブ配信で実機を披露(スマホ沼)
みなさんこんにちは、香港在住の携帯電話研究家、山根康宏です。サムスンから2026年向けフラッグシップモデル、Galaxy S26シリーズが登場しました!私はサンフランシスコで2026年2月25日(現地時間)開催の発表会イベント、Galaxy Unpackedに来ています。
GoogleがSunoのライバルサービスProducerAIを買収。AI作曲のエージェント化が進む中、明らかになったLyria 3との関係とその実力(CloseBox)
チャットベースのAI作曲サービスProducer.aiに、激震が走りました。2月24日、Google Labsへの参加が発表されたのです。
- 963件中 1 - 42 件を表示
- 次へ
