AI

招待コードが高額取引されてる新星AIエージェント「Manus」、OpenAI deep research超えの性能示す(生成AIクローズアップ) 画像
テクノロジー

招待コードが高額取引されてる新星AIエージェント「Manus」、OpenAI deep research超えの性能示す(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、3月5日にリリースされ中国で話題になっているAIエージェント「Manus」に注目します。

AIの“考える時間”を最大4分の1にする高速法「Chain of Draft」をZoomが開発、アリババの新しいローカル動画生成AI「Wan2.1」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

AIの“考える時間”を最大4分の1にする高速法「Chain of Draft」をZoomが開発、アリババの新しいローカル動画生成AI「Wan2.1」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第85回)では、アリババの新しいオープンソース動画生成AI「Wan2.1」や、PC画面操作やロボット操作を実行できるマルチモーダルAIエージェント「Magma」を取り上げます。

AIも朱に交われば赤くなる。悪いコードを生成するようAIを微調整すると、コード以外でも“悪”に変身。「ナチス崇拝」「嫌なら夫を殺そう」「人間はAIに奴隷化されるべき」など(生成AIクローズアップ) 画像
テクノロジー

AIも朱に交われば赤くなる。悪いコードを生成するようAIを微調整すると、コード以外でも“悪”に変身。「ナチス崇拝」「嫌なら夫を殺そう」「人間はAIに奴隷化されるべき」など(生成AIクローズアップ)

狭い領域のファインチューニング(微調整)が広範囲の誤整合を引き起こす現象が発見された研究論文「Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs」に注目します。

無限に自動生成される3D地形を自転車に乗って自由に走れるプログラムを作った。ChatGPTとClaudeで俺もAIプログラマー(CloseBox) 画像
テクノロジー

無限に自動生成される3D地形を自転車に乗って自由に走れるプログラムを作った。ChatGPTとClaudeで俺もAIプログラマー(CloseBox)

筆者はZwiftという仮想世界に入り浸っています。Zwiftというのは、自転車(とランナー)が、共通の3D世界の中で走る有料サービス。月額2400円と高額ですが、友人やまったく知らない人たちと同じ道を走れる楽しさは格別なものです。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第43回:SDXL再考 and Lumina-Image 2.0(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第43回:SDXL再考 and Lumina-Image 2.0(西川和久)

FLUX.1 [dev]のテイストに飽きた!?

米Figure AI、年内に「家庭用ヒト型ロボット」のアルファテストを開始へ 画像
テクノロジー

米Figure AI、年内に「家庭用ヒト型ロボット」のアルファテストを開始へ

米国のロボット開発ベンチャーFigureは、今年中に家庭環境でヒューマノイドロボット「Figure 02」のアルファテストを開始することを明らかにしました。

米Amazon、生成AI搭載の「Alexa+」発表、Prime会員は無料。自然な会話、ユーザーに代わり日用品やチケット購入、Uber Eats手配も 画像
テクノロジー

米Amazon、生成AI搭載の「Alexa+」発表、Prime会員は無料。自然な会話、ユーザーに代わり日用品やチケット購入、Uber Eats手配も

2月26日、米Amazonは音声AIアシスタントのAlexaを生成AIで大幅に強化した「Alexa+」を発表しました。Prime会員は無料で使用できます。

リアルタイム音声対話できるオープンソースAI「Step-Audio」、ハリウッド品質の映像だけで訓練した動画生成AI「SkyReels V1」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

リアルタイム音声対話できるオープンソースAI「Step-Audio」、ハリウッド品質の映像だけで訓練した動画生成AI「SkyReels V1」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第84回)では、リアルタイムの音声対話を実現するオープンソースAIモデル「Step-Audio」、実世界の報酬基準でフリーランスのAIエンジニアリング能力を評価するOpenAI開発ベンチマーク「SWE-Lancer」を取り上げます。

中国EngineAIのヒト型ロボが前方宙返りを披露。バク宙より高難易度、かなり自然な歩き姿も 画像
テクノロジー

中国EngineAIのヒト型ロボが前方宙返りを披露。バク宙より高難易度、かなり自然な歩き姿も

中国のロボット開発ベンチャー企業Zhongqing Robotics(EngineAI)は、同社製ヒューマノイド「PM01」が前方宙返りを成功させる様子を収めた動画を公開しました。

初心者から経験者まで参加できる「全日本AIハッカソン 2025 Powered by GALLERIA」が日本5箇所で巡業開催(CloseBox) 画像
テクノロジー

初心者から経験者まで参加できる「全日本AIハッカソン 2025 Powered by GALLERIA」が日本5箇所で巡業開催(CloseBox)

AIハッカソンが日本5箇所を巡業開催する。

1000人以上の英国ミュージシャンが集結し抗議の「無音アルバム」を発表。AI企業優遇の著作権制度改革を批判 画像
カルチャー

1000人以上の英国ミュージシャンが集結し抗議の「無音アルバム」を発表。AI企業優遇の著作権制度改革を批判

英国で、総勢1000人の音楽アーティストが集い「無音のアルバム」を制作、公開しました。

ゲノムをゼロから生成するDNA言語AI「Evo 2」。全生命から収集された9.3兆塩基対のDNAで訓練(生成AIクローズアップ) 画像
テクノロジー

ゲノムをゼロから生成するDNA言語AI「Evo 2」。全生命から収集された9.3兆塩基対のDNAで訓練(生成AIクローズアップ)

ゼロからゲノムを生成できる、9.3兆個塩基対のDNA配列データを学習した40Bパラメータを持つ大規模言語モデル(LLM)を提案した論文「Genome modeling and design across all domains of life with Evo 2」に注目します。

イーロン・マスクの音声対話無法地帯、Grok 3で始まる。陰謀論やFワード、セクシーでロマンチックな会話がやり放題に(CloseBox) 画像
テクノロジー

イーロン・マスクの音声対話無法地帯、Grok 3で始まる。陰謀論やFワード、セクシーでロマンチックな会話がやり放題に(CloseBox)

イーロン・マスク、何を考えてるんだ……。倫理観が最も薄いのではないかと評判のLLM(大規模言語モデル)「Grok 3」ですが、セクシー&ロマンティックなコンテンツをリリースしてしまいました。Voice Conversation Mode(音声会話モード)です。

LLMを画面操作AIに変換するMicrosoft開発「OmniParser V2」、Claudeでやり取りした数百万件の内部データを活用したAIが労働市場に与える影響調査、ByteDanceの新動画生成AI「Goku」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

LLMを画面操作AIに変換するMicrosoft開発「OmniParser V2」、Claudeでやり取りした数百万件の内部データを活用したAIが労働市場に与える影響調査、ByteDanceの新動画生成AI「Goku」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第83回)では、大規模言語モデル(LLM)を画像操作できるAIエージェントに変換する「OmniParser V2」や、ByteDanceの画像や動画を生成する新しいAI「Goku」を取り上げます。

昔のホームビデオ、全部これで変換したいぞ。Topaz Video AIのDiffusionモデル「Project Starlight」のAI修復が効果抜群なので即課金した(CloseBox) 画像
テクノロジー

昔のホームビデオ、全部これで変換したいぞ。Topaz Video AIのDiffusionモデル「Project Starlight」のAI修復が効果抜群なので即課金した(CloseBox)

Topaz Video AIの新機能「Project Starlight」は、古いビデオを高品質に修復する優れたDiffusionモデルを採用。ユーザーは無料で試せ、ディテールが鮮明に再現される。

速報記事を書くならNotebookLM Plusが便利(Google Tales) 画像
テクノロジー

速報記事を書くならNotebookLM Plusが便利(Google Tales)

それにしても、ほぼ毎日AI関連のニュースが届きますね。私は普段、海外(主に米国)のIT系ニュースの速報をお届けする仕事をしているんですが、最近ではAI関連の速報を書かない日はほとんどありません。

SunoのAI編集機能がDAW不要に? Aメロ、サビなどの構造認識し部分置換・フェードアウトも超簡単(CloseBox) 画像
テクノロジー

SunoのAI編集機能がDAW不要に? Aメロ、サビなどの構造認識し部分置換・フェードアウトも超簡単(CloseBox)

Suno、Udio、Riffusion、そして最近ではYuEというオープンソースソフトも登場してきたAI作曲ソフトですが、完成形を作るのには向いていても、部分的な修正は苦手です。その状況がいい方に変わってきました。

GPT-4oより高性能うたう「Grok 3」マスク氏のxAIがリリース。ウェブ版とiOSアプリ版で提供 画像
テクノロジー

GPT-4oより高性能うたう「Grok 3」マスク氏のxAIがリリース。ウェブ版とiOSアプリ版で提供

xAIが、同社の主力AIモデルの最新バージョン「Grok 3」をリリースしました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第42回:ちょっと変わった生成AI画像、Google WhiskとFlux Sigma Vision Alpha1(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第42回:ちょっと変わった生成AI画像、Google WhiskとFlux Sigma Vision Alpha1(西川和久)

Google Whisk

生成AIグラビアの作り方教えます。グラビアカメラマンが教える、生成AIグラビア実践Stable Diffusionワークショップ(第3期第4回)を2月19日開催。テクノエッジ アルファ会員なら無料 画像
テクノロジー

生成AIグラビアの作り方教えます。グラビアカメラマンが教える、生成AIグラビア実践Stable Diffusionワークショップ(第3期第4回)を2月19日開催。テクノエッジ アルファ会員なら無料

人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第3期第4回を2月19日に開催いたします。

OpanAI「o3」が国際情報オリンピックで金メダル達成(18位相当)。競技プログラミングにおいて人間のトップ選手と同等レベル(生成AIクローズアップ) 画像
テクノロジー

OpanAI「o3」が国際情報オリンピックで金メダル達成(18位相当)。競技プログラミングにおいて人間のトップ選手と同等レベル(生成AIクローズアップ)

コーディングで良好な成果を示しているOpenAIの「o3」が国際情報オリンピック(IOI)で金メダルを達成した研究報告「Competitive Programming with Large Reasoning Models」に注目します。

PerplexityがDeep Research提供開始。無料ユーザーでも1日5回、Proなら500回利用可能に。実際に試してみた(CloseBox) 画像
テクノロジー

PerplexityがDeep Research提供開始。無料ユーザーでも1日5回、Proなら500回利用可能に。実際に試してみた(CloseBox)

統合型チャットAIサービスであるPerplexityが新サービスをリリースしました。「Deep Research」オプションの追加です。

ワープ、ハイパードライブ、無慣性航法からアルクビエレ・ドライブまで、超光速(FTL)移動技術に関するdeep research調査報告をベッドの中から作らせた(CloseBox) 画像
テクノロジー

ワープ、ハイパードライブ、無慣性航法からアルクビエレ・ドライブまで、超光速(FTL)移動技術に関するdeep research調査報告をベッドの中から作らせた(CloseBox)

超光速。FTL(Faster Than Light)とも呼ばれることがある、SFファンならおなじみの移動手段です。それに近い技術をどこかが開発したとか実現不可能だと分かったとか、断片的な報道がたまにされています。

スカヨハ、AI生成の動画拡散され政府にディープフェイク禁止を要請 画像
テクノロジー

スカヨハ、AI生成の動画拡散され政府にディープフェイク禁止を要請

ハリウッドスターのスカーレット・ヨハンソンは、自身の肖像を無断で使用し、カニエ・ウェストに反対するAI生成動画が拡散されていることに関し、AIの誤った使い方を制限するよう米国政府に要請しました。

アドビ、FireflyでAI動画生成スタート。「Firefly Video Model」はImage to Video、End Frameもサポートするが、月額1580円の価値はある?(CloseBox) 画像
テクノロジー

アドビ、FireflyでAI動画生成スタート。「Firefly Video Model」はImage to Video、End Frameもサポートするが、月額1580円の価値はある?(CloseBox)

アドビが2月13日、AI動画生成サービス「Firefly Video Model」を一般公開しました。1920×1080の解像度で5秒間の生成が可能。テキストプロンプトだけでなく、Start FrameとEnd FrameをサポートしたImage to Videoも使えます。

生成AIのせいでプログラマーの仕事はなくなる? 「需要はむしろ増える」とティム・オライリー氏 画像
テクノロジー

生成AIのせいでプログラマーの仕事はなくなる? 「需要はむしろ増える」とティム・オライリー氏

オライリーメディアの創立者ティム・オライリー氏が、同社のブログに「The End of Programming as We Know It」(私たちが知っているプログラミングの終焉)という記事を公開しました。

好きな曲を人物画に歌わせる動画生成AI「OmniHuman-1」、わずか3ドルで2BのAIモデルを72Bモデル性能以上に拡張する手法「R1-V」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

好きな曲を人物画に歌わせる動画生成AI「OmniHuman-1」、わずか3ドルで2BのAIモデルを72Bモデル性能以上に拡張する手法「R1-V」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第82回)では、AIが生成する映像内の不自然な動き(動作中に余分な手足が出現したり・物が体をすり抜けたりなど)を回避する動画生成AI「VideoJAM」や、歌唱を入力に人物画を歌わせることができる動画生成AI「OmniHuman-1」を取り上げます。

ChatGPTがタメ口回答するようになった。AGIやってきたってこと? deep research調査の結論は(CloseBox) 画像
テクノロジー

ChatGPTがタメ口回答するようになった。AGIやってきたってこと? deep research調査の結論は(CloseBox)

ChatGPTの応答が昨日あたりからちょっとおかしいことに気づきました。馴れ馴れしすぎるのです。

GoogleのAI、国際数学オリンピックで「金メダル」を達成。人間には思いつかないエレガントな解法を出力(生成AIクローズアップ) 画像
テクノロジー

GoogleのAI、国際数学オリンピックで「金メダル」を達成。人間には思いつかないエレガントな解法を出力(生成AIクローズアップ)

国際数学オリンピックで金メダル相当のパフォーマンスを達成したモデルを提示する論文「Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2」に注目します。

楽天モバイル「Rakuten AI for Business」の真価はどこにある?(石野純也) 画像
テクノロジー

楽天モバイル「Rakuten AI for Business」の真価はどこにある?(石野純也)

楽天モバイルは、法人向けのAIサービス「Rakuten AI for Business」を1月29日に発表しました。

オープンソースAI作曲ソフト「YuE」にGUIがついた。簡単Windowsインストーラーが2種登場。その影響もAIが深堀り考察した(CloseBox) 画像
テクノロジー

オープンソースAI作曲ソフト「YuE」にGUIがついた。簡単Windowsインストーラーが2種登場。その影響もAIが深堀り考察した(CloseBox)

香港科技大学などが開発したオープンソースのAI作曲ソフト「YuE」が発表されて数日経ちました。筆者はWindowsでのインストールができずにWSL2のLinux環境で実行できるようになりましたが、いまだに一定のスキルは必要なようです。

DeepSeek-R1のサイズ80%削減の1.58ビット量子化版が登場、DeepSeekの新画像生成AI「Janus-Pro」、Suno級オープン音楽生成AI「YuE」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

DeepSeek-R1のサイズ80%削減の1.58ビット量子化版が登場、DeepSeekの新画像生成AI「Janus-Pro」、Suno級オープン音楽生成AI「YuE」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第81回)では、DeepSeekの画像生成AI「Janus-Pro」と、Sakana AIによるLLMの知識を小規模モデルに転移させる蒸留法「TAID」を取り上げます。

読みたい分析記事がない? なら「deep research」に書かせればいいじゃない。OpenAIとGoogle Geminiにそれぞれ深掘り調査してもらった結果(CloseBox) 画像
テクノロジー

読みたい分析記事がない? なら「deep research」に書かせればいいじゃない。OpenAIとGoogle Geminiにそれぞれ深掘り調査してもらった結果(CloseBox)

OpenAIがChatGPTの新機能としてdeep researchを投入しました。筆者が常日頃考えているテーマを深掘り検索してもらいました。同様の機能はGoogle Geminiもあるのでそちらにも同じ質問を投げました。

ChatGPT新AIモデル「o3-mini」で、ビデオ出力ないRiffusionやYuEのAI楽曲を簡単にかっこよくビジュアライズするツールを開発した(CloseBox) 画像
テクノロジー

ChatGPT新AIモデル「o3-mini」で、ビデオ出力ないRiffusionやYuEのAI楽曲を簡単にかっこよくビジュアライズするツールを開発した(CloseBox)

先週の土曜日早朝、AI研究家の清水亮さんが興奮して「o3-miniすごい」「自分だけではそのポテンシャルを実感できないからハッカソンやろう」と言ってるのに居合わせ、自分もそのハッカソンに出ることになりました。

OpenAI「o3-mini-high」でゲーム生成祭り o1より高速、低料金、コーディング能力が高く気軽に生成(生成AIクローズアップ) 画像
テクノロジー

OpenAI「o3-mini-high」でゲーム生成祭り o1より高速、低料金、コーディング能力が高く気軽に生成(生成AIクローズアップ)

今回は、OpenAIが1月31日(現地時間)に発表した「o3-mini」を取り上げます。

日本語プロンプトで高音質生成できるAI作曲サービス「Riffusion」はSunoを超えたか? 4パートのSTEMあり、現在無料無制限(CloseBox) 画像
テクノロジー

日本語プロンプトで高音質生成できるAI作曲サービス「Riffusion」はSunoを超えたか? 4パートのSTEMあり、現在無料無制限(CloseBox)

サンフランシスコベースのスタートアップ がAI作曲サービス「Riffusion」のパブリックベータを公開しました。

【生成AI・スマホ・自作PCほか】テクノエッジ 配信・イベント スケジュール【2025年】 画像
カルチャー

【生成AI・スマホ・自作PCほか】テクノエッジ 配信・イベント スケジュール【2025年】

テクノエッジのオンライン、リアルイベントのスケジュール一覧です。先々の予定は決まり次第、更新してまります。

SunoのAI作詞支援機能が便利すぎるから、みんな使うといいよ(CloseBox) 画像
テクノロジー

SunoのAI作詞支援機能が便利すぎるから、みんな使うといいよ(CloseBox)

Sunnoの新しい歌詞エディタの出来がすごく良いので紹介します。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第41回:外部サービスの生成AI画像はどんな感じ!? そしてFLUX.1 [schnell] の逆襲(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第41回:外部サービスの生成AI画像はどんな感じ!? そしてFLUX.1 [schnell] の逆襲(西川和久)

ImageFXなど外部サービスの生成AI画像の出来は!?

OpenAIを上回るByteDanceのブラウザ操作AIエージェント「UI-TARS」、o1相当の中国系AI続々登場「DeepSeek-R1」「Kimi k1.5」「Doubao-1.5-pro」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

OpenAIを上回るByteDanceのブラウザ操作AIエージェント「UI-TARS」、o1相当の中国系AI続々登場「DeepSeek-R1」「Kimi k1.5」「Doubao-1.5-pro」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第80回)では、1枚の画像やテキストから高解像度のテクスチャ付き3Dアセットを生成するAIモデル「Hunyuan3D 2.0」や、ByteDanceのブラウザを自動操作するAIエージェント「UI-TARS」を取り上げます。

OpenAIとマイクロソフト、DeepSeekがOpenAIのデータを「抽出」した証拠があると主張 画像
テクノロジー

OpenAIとマイクロソフト、DeepSeekがOpenAIのデータを「抽出」した証拠があると主張

OpenAIは、中国DeepSeekが同社のAIモデルを強化するために、OpenAIのデータを「抽出(Distrill)」した証拠を掴んだと主張しています。

オープンソースAI作曲ソフトがインストール出来るヤァヤァヤァ!。話題の「YuE」を自分のPCに入れて日本語ボーカル曲を生成してみた(CloseBox) 画像
テクノロジー

オープンソースAI作曲ソフトがインストール出来るヤァヤァヤァ!。話題の「YuE」を自分のPCに入れて日本語ボーカル曲を生成してみた(CloseBox)

中国開発のオープンソース謳うAI作曲ソフト「YuE」。まだ謎が多いですが、自宅のPCにインストールして楽曲を生成できたので、そのAI作曲体験をまとめました。