AI

自律AIらが書いた論文を利用して研究を繰り返し続ける「AgentRxiv」、リアルタイム動作する対話可能な実写3DアバターAI「TaoAvatar」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

自律AIらが書いた論文を利用して研究を繰り返し続ける「AgentRxiv」、リアルタイム動作する対話可能な実写3DアバターAI「TaoAvatar」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第89回)では、リアルタイムで動作する対話可能なAI搭載実写3Dアバターを生成できる技術「TaoAvatar」、テキストや映像などを認識しながら同時にテキストや音声応答できるAIモデル「Qwen2.5-Omni」を取り上げます。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第45回:FLUX.1 [dev]より高性能!?Reve Image登場+α(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第45回:FLUX.1 [dev]より高性能!?Reve Image登場+α(西川和久)

いきなり登場したReve Image。当たると「え?これデジイチで撮った写真!?」的な画像が生成され、明らかにFLUX.1 [dev]を超えている。

主要AIモデルはどれも“歯が立たない”、新しい「人間には簡単だがAIには難しいAGI問題」登場(生成AIクローズアップ) 画像
AI

主要AIモデルはどれも“歯が立たない”、新しい「人間には簡単だがAIには難しいAGI問題」登場(生成AIクローズアップ)

今回は、AGI(汎用人工知能)の進歩を測定するために設計された新しいベンチマークテスト「ARC-AGI-2」が登場し、最先端のAIモデルが挑戦した、その結果報告を取り上げます。

ローカル生成AIのためのマシンって、今ならこんな感じ?(CloseBox) 画像
AI

ローカル生成AIのためのマシンって、今ならこんな感じ?(CloseBox)

Xでローカル生成AIのためのマシンはこんなのがいいんじゃないか?と投稿してみたのですが、予想外に反響があったので、ChatGPT deep researchを使ってまとめてみました。

スマホカメラから実世界の3D空間を理解するLLM「SpatialLM」、静止画像を3Dビデオに変換する「Stable Virtual Camera」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

スマホカメラから実世界の3D空間を理解するLLM「SpatialLM」、静止画像を3Dビデオに変換する「Stable Virtual Camera」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第88回)では、高解像度な3Dメッシュを生成できるAIモデル「DeepMesh」、スマホカメラから実世界の3D空間を理解する大規模言語モデル「SpatialLM-Llama-1B」を取り上げます。

ChatGPT 4oの画像生成でテキスト能力が上がったらしいので、手書き文字からロゴを生成してみた(CloseBox) 画像
AI

ChatGPT 4oの画像生成でテキスト能力が上がったらしいので、手書き文字からロゴを生成してみた(CloseBox)

OpenAIがまたYouTubeライブで発表をしました。今回のモデルはChatGPT 4oと、いささか古いのですが、その画像生成についての進展がテーマです。

「すみません、よくわかりません」から卒業? GoogleアシスタントがGeminiに(Google Tales) 画像
AI

「すみません、よくわかりません」から卒業? GoogleアシスタントがGeminiに(Google Tales)

2016年のGoogle I/Oで、初のスマートスピーカー「Google Home」と共に発表された「Googleアシスタント」ですが、そろそろお別れの時が来たようです。

生成AIでゲーム開発する時代到来!『Roblox』の新しいAI機能にゲーム開発の未来をみた―担当者に現在の日本の状況も訊く 画像
AI

生成AIでゲーム開発する時代到来!『Roblox』の新しいAI機能にゲーム開発の未来をみた―担当者に現在の日本の状況も訊く

GDC 2025で「Roblox(ロブロックス)」がAIを使った新しい機能を披露していました。

生成AIの検索エンジンは60%以上も間違った情報を引用。有料版は無料版より自信を持って間違えやすい(生成AIクローズアップ) 画像
AI

生成AIの検索エンジンは60%以上も間違った情報を引用。有料版は無料版より自信を持って間違えやすい(生成AIクローズアップ)

生成AIモデルが検索で引用する情報が誤ったものが多いことを指摘した米コロンビア大学のTow Center for Digital Journalismによる2025年3月発表の研究を取り上げます。

Google Pixel 9a発表、RAM容量でAI機能に格差。簡易版Gemini Nano 1.0 XXS搭載 画像
AI

Google Pixel 9a発表、RAM容量でAI機能に格差。簡易版Gemini Nano 1.0 XXS搭載

GoogleがPixelスマートフォンの最新モデル、Pixel 9シリーズの廉価版 Pixel 9a を米国で発表しました。

動画内の人物を好きなキャラに変更できる動画AI「VACE」、3DビデオゲームをAIにプレイさせる「PORTAL」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

動画内の人物を好きなキャラに変更できる動画AI「VACE」、3DビデオゲームをAIにプレイさせる「PORTAL」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第87回)では、声の高さや話す速度も調整可能な高度なテキスト読み上げシステム「Spark-TTS」や、3DビデオゲームをAIがプレイできるようにするフレームワーク「PORTAL」を取り上げます。

BYOD時代、Chromebookが保護者の悩みを解決。高校生の学習サポートの最適解 画像
PC

BYOD時代、Chromebookが保護者の悩みを解決。高校生の学習サポートの最適解PR

文部科学省のGIGAスクール構想は、1人1台の端末を導入し、教育のデジタル化と子供たちのICT活用を目指しています。2021年時点で小中学校のほぼ100%で導入が完了し、現在も活用が進んでいます。高校ではBYOD(Bring Your Own Device)が増加しており、保護者は端末選びに悩むことが多いです。本稿では高校生活の学習を支える優れた機能性と使いやすさ、コストパフォーマンスの良さが魅力の「Chromebook」を紹介します。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第44回:真のマルチモーダルGeminiにHailuoの新モデル、クラウドの生成AI画像が進化!?(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第44回:真のマルチモーダルGeminiにHailuoの新モデル、クラウドの生成AI画像が進化!?(西川和久)

今回は、動画サービスから画像も生成可能へ、そしてLLMから画像生成/編集と、同じ生成AI画像でもちょっと面白いのをご紹介します。Google AI Studio + Gemini 2.0 Flash (Image Generation) Experimental

AI研究者の76%が「現モデルを大きくしてもAGIを実現できない」。AAAIがAIの現状と未来についてレポートを発表(生成AIクローズアップ) 画像
AI

AI研究者の76%が「現モデルを大きくしてもAGIを実現できない」。AAAIがAIの現状と未来についてレポートを発表(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、人工知能を促進することを目的とした国際的な学術団体「AAAI」が2025年3月に公開したレポート「AAAI 2025 PRESIDENTIAL PANEL ON THE Published March 2025 Future of AI Research」に注目します。

PDF100万ページのテキストをたった190ドルで読み取れる「olmOCR」、アリババがDeepSeek-R1同等の「QwQ-32B」を強化したAI「START」発表など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

PDF100万ページのテキストをたった190ドルで読み取れる「olmOCR」、アリババがDeepSeek-R1同等の「QwQ-32B」を強化したAI「START」発表など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第86回)では、大規模言語モデル「QwQ-32B」を改良した「START」や、PDFからのテキスト抽出が安く高品質にできるツール「olmOCR」などを取り上げます。

ナイアンティックがポケモンGO・モンハンNow・ピクミンブルーム売却、地理空間技術の新会社Niantic Spatial設立 画像
AI

ナイアンティックがポケモンGO・モンハンNow・ピクミンブルーム売却、地理空間技術の新会社Niantic Spatial設立

ポケモンGOやモンハンNow、ピクミンブルームの運営元ナイアンティックが、主要ゲーム3タイトルと周辺アプリの売却を正式に発表しました。

生成AIグラビアはRTX 5090でどれだけ高速化する?(デモあります)グラビアカメラマンが教える、生成AIグラビア実践Stable Diffusionワークショップ(第3期第5回)を3月19日開催。テクノエッジ アルファ会員なら無料 画像
AI

生成AIグラビアはRTX 5090でどれだけ高速化する?(デモあります)グラビアカメラマンが教える、生成AIグラビア実践Stable Diffusionワークショップ(第3期第5回)を3月19日開催。テクノエッジ アルファ会員なら無料

テクノエッジ編集部では、生成AIグラビア実践ワークショップ第3期第5回を3月19日に開催します。今回はRTX 5090 GPUの生成AIへの活用について、特に解説します。

招待コードが高額取引されてる新星AIエージェント「Manus」、OpenAI deep research超えの性能示す(生成AIクローズアップ) 画像
AI

招待コードが高額取引されてる新星AIエージェント「Manus」、OpenAI deep research超えの性能示す(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、3月5日にリリースされ中国で話題になっているAIエージェント「Manus」に注目します。

AIの“考える時間”を最大4分の1にする高速法「Chain of Draft」をZoomが開発、アリババの新しいローカル動画生成AI「Wan2.1」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

AIの“考える時間”を最大4分の1にする高速法「Chain of Draft」をZoomが開発、アリババの新しいローカル動画生成AI「Wan2.1」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第85回)では、アリババの新しいオープンソース動画生成AI「Wan2.1」や、PC画面操作やロボット操作を実行できるマルチモーダルAIエージェント「Magma」を取り上げます。

AIも朱に交われば赤くなる。悪いコードを生成するようAIを微調整すると、コード以外でも“悪”に変身。「ナチス崇拝」「嫌なら夫を殺そう」「人間はAIに奴隷化されるべき」など(生成AIクローズアップ) 画像
AI

AIも朱に交われば赤くなる。悪いコードを生成するようAIを微調整すると、コード以外でも“悪”に変身。「ナチス崇拝」「嫌なら夫を殺そう」「人間はAIに奴隷化されるべき」など(生成AIクローズアップ)

狭い領域のファインチューニング(微調整)が広範囲の誤整合を引き起こす現象が発見された研究論文「Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs」に注目します。

無限に自動生成される3D地形を自転車に乗って自由に走れるプログラムを作った。ChatGPTとClaudeで俺もAIプログラマー(CloseBox) 画像
AI

無限に自動生成される3D地形を自転車に乗って自由に走れるプログラムを作った。ChatGPTとClaudeで俺もAIプログラマー(CloseBox)

筆者はZwiftという仮想世界に入り浸っています。Zwiftというのは、自転車(とランナー)が、共通の3D世界の中で走る有料サービス。月額2400円と高額ですが、友人やまったく知らない人たちと同じ道を走れる楽しさは格別なものです。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第43回:SDXL再考 and Lumina-Image 2.0(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第43回:SDXL再考 and Lumina-Image 2.0(西川和久)

FLUX.1 [dev]のテイストに飽きた!?

賞金総額140万円!ゲーム開発コンテスト『Tokyo Game Jam』参加者募集。ゲーム制作へのAI活用や業界動向、ハッカソンのコツを語るプレイベント開催 画像
Other

賞金総額140万円!ゲーム開発コンテスト『Tokyo Game Jam』参加者募集。ゲーム制作へのAI活用や業界動向、ハッカソンのコツを語るプレイベント開催PR

アリババグループのクラウドプロバイダー Alibaba Cloud が、4月25日(金)~27日(日)開催のゲーム開発ハッカソン Tokyo Game Jam Spring 2025 に向けて参加者を募集しています。

米Figure AI、年内に「家庭用ヒト型ロボット」のアルファテストを開始へ 画像
Other

米Figure AI、年内に「家庭用ヒト型ロボット」のアルファテストを開始へ

米国のロボット開発ベンチャーFigureは、今年中に家庭環境でヒューマノイドロボット「Figure 02」のアルファテストを開始することを明らかにしました。

米Amazon、生成AI搭載の「Alexa+」発表、Prime会員は無料。自然な会話、ユーザーに代わり日用品やチケット購入、Uber Eats手配も 画像
AI

米Amazon、生成AI搭載の「Alexa+」発表、Prime会員は無料。自然な会話、ユーザーに代わり日用品やチケット購入、Uber Eats手配も

2月26日、米Amazonは音声AIアシスタントのAlexaを生成AIで大幅に強化した「Alexa+」を発表しました。Prime会員は無料で使用できます。

リアルタイム音声対話できるオープンソースAI「Step-Audio」、ハリウッド品質の映像だけで訓練した動画生成AI「SkyReels V1」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

リアルタイム音声対話できるオープンソースAI「Step-Audio」、ハリウッド品質の映像だけで訓練した動画生成AI「SkyReels V1」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第84回)では、リアルタイムの音声対話を実現するオープンソースAIモデル「Step-Audio」、実世界の報酬基準でフリーランスのAIエンジニアリング能力を評価するOpenAI開発ベンチマーク「SWE-Lancer」を取り上げます。

中国EngineAIのヒト型ロボが前方宙返りを披露。バク宙より高難易度、かなり自然な歩き姿も 画像
Other

中国EngineAIのヒト型ロボが前方宙返りを披露。バク宙より高難易度、かなり自然な歩き姿も

中国のロボット開発ベンチャー企業Zhongqing Robotics(EngineAI)は、同社製ヒューマノイド「PM01」が前方宙返りを成功させる様子を収めた動画を公開しました。

初心者から経験者まで参加できる「全日本AIハッカソン 2025 Powered by GALLERIA」が日本5箇所で巡業開催(CloseBox) 画像
AI

初心者から経験者まで参加できる「全日本AIハッカソン 2025 Powered by GALLERIA」が日本5箇所で巡業開催(CloseBox)

AIハッカソンが日本5箇所を巡業開催する。

1000人以上の英国ミュージシャンが集結し抗議の「無音アルバム」を発表。AI企業優遇の著作権制度改革を批判 画像
Music

1000人以上の英国ミュージシャンが集結し抗議の「無音アルバム」を発表。AI企業優遇の著作権制度改革を批判

英国で、総勢1000人の音楽アーティストが集い「無音のアルバム」を制作、公開しました。

ゲノムをゼロから生成するDNA言語AI「Evo 2」。全生命から収集された9.3兆塩基対のDNAで訓練(生成AIクローズアップ) 画像
AI

ゲノムをゼロから生成するDNA言語AI「Evo 2」。全生命から収集された9.3兆塩基対のDNAで訓練(生成AIクローズアップ)

ゼロからゲノムを生成できる、9.3兆個塩基対のDNA配列データを学習した40Bパラメータを持つ大規模言語モデル(LLM)を提案した論文「Genome modeling and design across all domains of life with Evo 2」に注目します。

イーロン・マスクの音声対話無法地帯、Grok 3で始まる。陰謀論やFワード、セクシーでロマンチックな会話がやり放題に(CloseBox) 画像
AI

イーロン・マスクの音声対話無法地帯、Grok 3で始まる。陰謀論やFワード、セクシーでロマンチックな会話がやり放題に(CloseBox)

イーロン・マスク、何を考えてるんだ……。倫理観が最も薄いのではないかと評判のLLM(大規模言語モデル)「Grok 3」ですが、セクシー&ロマンティックなコンテンツをリリースしてしまいました。Voice Conversation Mode(音声会話モード)です。

【動画】200の骨と1000本の人工筋肉で動く人体模倣ロボ「Protoclone V1」 画像
Other

【動画】200の骨と1000本の人工筋肉で動く人体模倣ロボ「Protoclone V1」

ポーランドのロボット開発ベンチャーClone Roboticsは、世界初をうたう二足歩行筋骨格アンドロイド「Protoclone V1」の動画を公開しました。

LLMを画面操作AIに変換するMicrosoft開発「OmniParser V2」、Claudeでやり取りした数百万件の内部データを活用したAIが労働市場に与える影響調査、ByteDanceの新動画生成AI「Goku」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

LLMを画面操作AIに変換するMicrosoft開発「OmniParser V2」、Claudeでやり取りした数百万件の内部データを活用したAIが労働市場に与える影響調査、ByteDanceの新動画生成AI「Goku」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第83回)では、大規模言語モデル(LLM)を画像操作できるAIエージェントに変換する「OmniParser V2」や、ByteDanceの画像や動画を生成する新しいAI「Goku」を取り上げます。

昔のホームビデオ、全部これで変換したいぞ。Topaz Video AIのDiffusionモデル「Project Starlight」のAI修復が効果抜群なので即課金した(CloseBox) 画像
AI

昔のホームビデオ、全部これで変換したいぞ。Topaz Video AIのDiffusionモデル「Project Starlight」のAI修復が効果抜群なので即課金した(CloseBox)

Topaz Video AIの新機能「Project Starlight」は、古いビデオを高品質に修復する優れたDiffusionモデルを採用。ユーザーは無料で試せ、ディテールが鮮明に再現される。

速報記事を書くならNotebookLM Plusが便利(Google Tales) 画像
AI

速報記事を書くならNotebookLM Plusが便利(Google Tales)

それにしても、ほぼ毎日AI関連のニュースが届きますね。私は普段、海外(主に米国)のIT系ニュースの速報をお届けする仕事をしているんですが、最近ではAI関連の速報を書かない日はほとんどありません。

SunoのAI編集機能がDAW不要に? Aメロ、サビなどの構造認識し部分置換・フェードアウトも超簡単(CloseBox) 画像
AI

SunoのAI編集機能がDAW不要に? Aメロ、サビなどの構造認識し部分置換・フェードアウトも超簡単(CloseBox)

Suno、Udio、Riffusion、そして最近ではYuEというオープンソースソフトも登場してきたAI作曲ソフトですが、完成形を作るのには向いていても、部分的な修正は苦手です。その状況がいい方に変わってきました。

軽量スマートリングRingConn 2がクラファン開始、早割3万円台から。睡眠・運動・心拍等を常時記録で10日間超バッテリー、サブスク不要 画像
Health

軽量スマートリングRingConn 2がクラファン開始、早割3万円台から。睡眠・運動・心拍等を常時記録で10日間超バッテリー、サブスク不要

睡眠や運動、心拍など各種バイタルデータを24時間計測するスマートリング、RingConn (第2世代モデル)が国内向けクラウドファンディングを開始しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第42回:ちょっと変わった生成AI画像、Google WhiskとFlux Sigma Vision Alpha1(西川和久) 画像
Science

生成AIグラビアをグラビアカメラマンが作るとどうなる?第42回:ちょっと変わった生成AI画像、Google WhiskとFlux Sigma Vision Alpha1(西川和久)

Google Whisk

生成AIグラビアの作り方教えます。グラビアカメラマンが教える、生成AIグラビア実践Stable Diffusionワークショップ(第3期第4回)を2月19日開催。テクノエッジ アルファ会員なら無料 画像
AI

生成AIグラビアの作り方教えます。グラビアカメラマンが教える、生成AIグラビア実践Stable Diffusionワークショップ(第3期第4回)を2月19日開催。テクノエッジ アルファ会員なら無料

人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第3期第4回を2月19日に開催いたします。

OpanAI「o3」が国際情報オリンピックで金メダル達成(18位相当)。競技プログラミングにおいて人間のトップ選手と同等レベル(生成AIクローズアップ) 画像
AI

OpanAI「o3」が国際情報オリンピックで金メダル達成(18位相当)。競技プログラミングにおいて人間のトップ選手と同等レベル(生成AIクローズアップ)

コーディングで良好な成果を示しているOpenAIの「o3」が国際情報オリンピック(IOI)で金メダルを達成した研究報告「Competitive Programming with Large Reasoning Models」に注目します。

PerplexityがDeep Research提供開始。無料ユーザーでも1日5回、Proなら500回利用可能に。実際に試してみた(CloseBox) 画像
AI

PerplexityがDeep Research提供開始。無料ユーザーでも1日5回、Proなら500回利用可能に。実際に試してみた(CloseBox)

統合型チャットAIサービスであるPerplexityが新サービスをリリースしました。「Deep Research」オプションの追加です。

ワープ、ハイパードライブ、無慣性航法からアルクビエレ・ドライブまで、超光速(FTL)移動技術に関するdeep research調査報告をベッドの中から作らせた(CloseBox) 画像
Science

ワープ、ハイパードライブ、無慣性航法からアルクビエレ・ドライブまで、超光速(FTL)移動技術に関するdeep research調査報告をベッドの中から作らせた(CloseBox)

超光速。FTL(Faster Than Light)とも呼ばれることがある、SFファンならおなじみの移動手段です。それに近い技術をどこかが開発したとか実現不可能だと分かったとか、断片的な報道がたまにされています。