AI

スカヨハ、AI生成の動画拡散され政府にディープフェイク禁止を要請 画像
AI

スカヨハ、AI生成の動画拡散され政府にディープフェイク禁止を要請

ハリウッドスターのスカーレット・ヨハンソンは、自身の肖像を無断で使用し、カニエ・ウェストに反対するAI生成動画が拡散されていることに関し、AIの誤った使い方を制限するよう米国政府に要請しました。

アドビ、FireflyでAI動画生成スタート。「Firefly Video Model」はImage to Video、End Frameもサポートするが、月額1580円の価値はある?(CloseBox) 画像
AI

アドビ、FireflyでAI動画生成スタート。「Firefly Video Model」はImage to Video、End Frameもサポートするが、月額1580円の価値はある?(CloseBox)

アドビが2月13日、AI動画生成サービス「Firefly Video Model」を一般公開しました。1920×1080の解像度で5秒間の生成が可能。テキストプロンプトだけでなく、Start FrameとEnd FrameをサポートしたImage to Videoも使えます。

アドビ、商用可能な動画生成AIを一般提供開始。Fireflyで本人の声のまま多言語翻訳も 画像
AI

アドビ、商用可能な動画生成AIを一般提供開始。Fireflyで本人の声のまま多言語翻訳も

アドビが生成AIアプリ Adobe Firefly の新機能と新料金プランを発表しました。

アドビ、PDF文書と会話できるAcrobat AIアシスタント日本語版を提供。Wordやパワポも対応、月680円から 画像
AI

アドビ、PDF文書と会話できるAcrobat AIアシスタント日本語版を提供。Wordやパワポも対応、月680円から

Adobe が Acrobat の生成AI機能「Acrobat AIアシスタント」日本語版の提供を開始しました。

生成AIのせいでプログラマーの仕事はなくなる? 「需要はむしろ増える」とティム・オライリー氏 画像
AI

生成AIのせいでプログラマーの仕事はなくなる? 「需要はむしろ増える」とティム・オライリー氏

オライリーメディアの創立者ティム・オライリー氏が、同社のブログに「The End of Programming as We Know It」(私たちが知っているプログラミングの終焉)という記事を公開しました。

好きな曲を人物画に歌わせる動画生成AI「OmniHuman-1」、わずか3ドルで2BのAIモデルを72Bモデル性能以上に拡張する手法「R1-V」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

好きな曲を人物画に歌わせる動画生成AI「OmniHuman-1」、わずか3ドルで2BのAIモデルを72Bモデル性能以上に拡張する手法「R1-V」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第82回)では、AIが生成する映像内の不自然な動き(動作中に余分な手足が出現したり・物が体をすり抜けたりなど)を回避する動画生成AI「VideoJAM」や、歌唱を入力に人物画を歌わせることができる動画生成AI「OmniHuman-1」を取り上げます。

ChatGPTがタメ口回答するようになった。AGIやってきたってこと? deep research調査の結論は(CloseBox) 画像
AI

ChatGPTがタメ口回答するようになった。AGIやってきたってこと? deep research調査の結論は(CloseBox)

ChatGPTの応答が昨日あたりからちょっとおかしいことに気づきました。馴れ馴れしすぎるのです。

GoogleのAI、国際数学オリンピックで「金メダル」を達成。人間には思いつかないエレガントな解法を出力(生成AIクローズアップ) 画像
AI

GoogleのAI、国際数学オリンピックで「金メダル」を達成。人間には思いつかないエレガントな解法を出力(生成AIクローズアップ)

国際数学オリンピックで金メダル相当のパフォーマンスを達成したモデルを提示する論文「Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2」に注目します。

楽天モバイル「Rakuten AI for Business」の真価はどこにある?(石野純也) 画像
AI

楽天モバイル「Rakuten AI for Business」の真価はどこにある?(石野純也)

楽天モバイルは、法人向けのAIサービス「Rakuten AI for Business」を1月29日に発表しました。

オープンソースAI作曲ソフト「YuE」にGUIがついた。簡単Windowsインストーラーが2種登場。その影響もAIが深堀り考察した(CloseBox) 画像
AI

オープンソースAI作曲ソフト「YuE」にGUIがついた。簡単Windowsインストーラーが2種登場。その影響もAIが深堀り考察した(CloseBox)

香港科技大学などが開発したオープンソースのAI作曲ソフト「YuE」が発表されて数日経ちました。筆者はWindowsでのインストールができずにWSL2のLinux環境で実行できるようになりましたが、いまだに一定のスキルは必要なようです。

DeepSeek-R1のサイズ80%削減の1.58ビット量子化版が登場、DeepSeekの新画像生成AI「Janus-Pro」、Suno級オープン音楽生成AI「YuE」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

DeepSeek-R1のサイズ80%削減の1.58ビット量子化版が登場、DeepSeekの新画像生成AI「Janus-Pro」、Suno級オープン音楽生成AI「YuE」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第81回)では、DeepSeekの画像生成AI「Janus-Pro」と、Sakana AIによるLLMの知識を小規模モデルに転移させる蒸留法「TAID」を取り上げます。

読みたい分析記事がない? なら「deep research」に書かせればいいじゃない。OpenAIとGoogle Geminiにそれぞれ深掘り調査してもらった結果(CloseBox) 画像
AI

読みたい分析記事がない? なら「deep research」に書かせればいいじゃない。OpenAIとGoogle Geminiにそれぞれ深掘り調査してもらった結果(CloseBox)

OpenAIがChatGPTの新機能としてdeep researchを投入しました。筆者が常日頃考えているテーマを深掘り検索してもらいました。同様の機能はGoogle Geminiもあるのでそちらにも同じ質問を投げました。

ChatGPT新AIモデル「o3-mini」で、ビデオ出力ないRiffusionやYuEのAI楽曲を簡単にかっこよくビジュアライズするツールを開発した(CloseBox) 画像
AI

ChatGPT新AIモデル「o3-mini」で、ビデオ出力ないRiffusionやYuEのAI楽曲を簡単にかっこよくビジュアライズするツールを開発した(CloseBox)

先週の土曜日早朝、AI研究家の清水亮さんが興奮して「o3-miniすごい」「自分だけではそのポテンシャルを実感できないからハッカソンやろう」と言ってるのに居合わせ、自分もそのハッカソンに出ることになりました。

OpenAI「o3-mini-high」でゲーム生成祭り o1より高速、低料金、コーディング能力が高く気軽に生成(生成AIクローズアップ) 画像
AI

OpenAI「o3-mini-high」でゲーム生成祭り o1より高速、低料金、コーディング能力が高く気軽に生成(生成AIクローズアップ)

今回は、OpenAIが1月31日(現地時間)に発表した「o3-mini」を取り上げます。

日本語プロンプトで高音質生成できるAI作曲サービス「Riffusion」はSunoを超えたか? 4パートのSTEMあり、現在無料無制限(CloseBox) 画像
AI

日本語プロンプトで高音質生成できるAI作曲サービス「Riffusion」はSunoを超えたか? 4パートのSTEMあり、現在無料無制限(CloseBox)

サンフランシスコベースのスタートアップ がAI作曲サービス「Riffusion」のパブリックベータを公開しました。

SunoのAI作詞支援機能が便利すぎるから、みんな使うといいよ(CloseBox) 画像
AI

SunoのAI作詞支援機能が便利すぎるから、みんな使うといいよ(CloseBox)

Sunnoの新しい歌詞エディタの出来がすごく良いので紹介します。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第41回:外部サービスの生成AI画像はどんな感じ!? そしてFLUX.1 [schnell] の逆襲(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第41回:外部サービスの生成AI画像はどんな感じ!? そしてFLUX.1 [schnell] の逆襲(西川和久)

ImageFXなど外部サービスの生成AI画像の出来は!?

OpenAIを上回るByteDanceのブラウザ操作AIエージェント「UI-TARS」、o1相当の中国系AI続々登場「DeepSeek-R1」「Kimi k1.5」「Doubao-1.5-pro」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

OpenAIを上回るByteDanceのブラウザ操作AIエージェント「UI-TARS」、o1相当の中国系AI続々登場「DeepSeek-R1」「Kimi k1.5」「Doubao-1.5-pro」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第80回)では、1枚の画像やテキストから高解像度のテクスチャ付き3Dアセットを生成するAIモデル「Hunyuan3D 2.0」や、ByteDanceのブラウザを自動操作するAIエージェント「UI-TARS」を取り上げます。

OpenAIとマイクロソフト、DeepSeekがOpenAIのデータを「抽出」した証拠があると主張 画像
AI

OpenAIとマイクロソフト、DeepSeekがOpenAIのデータを「抽出」した証拠があると主張

OpenAIは、中国DeepSeekが同社のAIモデルを強化するために、OpenAIのデータを「抽出(Distrill)」した証拠を掴んだと主張しています。

オープンソースAI作曲ソフトがインストール出来るヤァヤァヤァ!。話題の「YuE」を自分のPCに入れて日本語ボーカル曲を生成してみた(CloseBox) 画像
AI

オープンソースAI作曲ソフトがインストール出来るヤァヤァヤァ!。話題の「YuE」を自分のPCに入れて日本語ボーカル曲を生成してみた(CloseBox)

中国開発のオープンソース謳うAI作曲ソフト「YuE」。まだ謎が多いですが、自宅のPCにインストールして楽曲を生成できたので、そのAI作曲体験をまとめました。

歌えるAI作曲ソフトにオープンソースの波。SunoとUdioのライバル「YuE」は日本語楽曲にも対応(CloseBox) 画像
AI

歌えるAI作曲ソフトにオープンソースの波。SunoとUdioのライバル「YuE」は日本語楽曲にも対応(CloseBox)

オープンソース版でSuno並に品質が高くて歌もうたえるAI作曲ソフト「Yue」をMultimodal Art Projectionと香港科技大学(HKUST)が共同開発しました。

GoogleのAIトップが語るAGIへの遠い道のりと「AIの欺瞞」(Google Tales) 画像
AI

GoogleのAIトップが語るAGIへの遠い道のりと「AIの欺瞞」(Google Tales)

トランプ大統領就任式ではGoogleのピチャイCEOや創業者のサーゲイ・ブリンさんの顔も見えましたが、今のところはGoogleがトランプ政権に協力する具体的な発表はないようです。

Project DIGITS実機も見てきた。NVIDIAのAI戦略をCES 2025展示で俯瞰する(西川善司) 画像
AI

Project DIGITS実機も見てきた。NVIDIAのAI戦略をCES 2025展示で俯瞰する(西川善司)

CES 2025におけるNVIDIAブースは、「GeForce RTX 50シリーズを発表したばかり」ということもあり、会場は、なかなかの盛況ぶりであったように思う。

「うんうんうん」「はいはいはい」と会話の間を埋め、被せるようにグイグイ対話する日本語専用リアルタイム音声会話AI「J-Moshi」を名古屋大学が開発(生成AIクローズアップ) 画像
AI

「うんうんうん」「はいはいはい」と会話の間を埋め、被せるようにグイグイ対話する日本語専用リアルタイム音声会話AI「J-Moshi」を名古屋大学が開発(生成AIクローズアップ)

今回は、日本語でリアルタイムに音声対話してくれるAIモデル「J-Moshi」に注目します。名古屋大学の研究者らが開発したこのAIモデルは、ユーザーの声を聞いて内容に応じた発話を同時に行います。

複雑なタスクをブラウザでこなすOpenAIのAIエージェント「Operator」を使ってみてわかった限界点(CloseBox) 画像
AI

複雑なタスクをブラウザでこなすOpenAIのAIエージェント「Operator」を使ってみてわかった限界点(CloseBox)

米国のChatGPT Proユーザーのみに開放されているOpenAIのAIエージェント「Operator」を試してみました。

OpenAI、ブラウザ操るAIエージェント「Operator」を発表。ユーザーの代わりに複雑なタスクを処理し、ユーザーの介入も可能 画像
AI

OpenAI、ブラウザ操るAIエージェント「Operator」を発表。ユーザーの代わりに複雑なタスクを処理し、ユーザーの介入も可能

OpenAIは1月23日(米国時間)、ユーザーの代わりにブラウザを操作してタスクを実行するAIエージェント「Operator」を発表しました。

スマートリング Galaxy Ringは国内6万3690円、サイズ選びと購入方法。最長7日間の計測やスマホ連携リモコンにもなる指輪型デバイス 画像
ウェアラブル

スマートリング Galaxy Ringは国内6万3690円、サイズ選びと購入方法。最長7日間の計測やスマホ連携リモコンにもなる指輪型デバイス

サムスンがGalaxy初のスマートリング製品 Galaxy Ring の日本向け販売を発表しました。

サムスンGalaxy S25 / S25 Ultra発表、薄く軽くカメラとAI強化。スマートリングGalaxy Ringも国内発売 画像
スマートフォン

サムスンGalaxy S25 / S25 Ultra発表、薄く軽くカメラとAI強化。スマートリングGalaxy Ringも国内発売

開催中の Galaxy Unpacked イベントで、サムスンがスマートフォンのフラッグシップモデル Galaxy S25シリーズを発表しました。

キャラクターの顔を4090でリアルタイム自演できる動画生成AI「RAIN」、400万トークンを処理できる大規模言語モデル「MiniMax-01」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

キャラクターの顔を4090でリアルタイム自演できる動画生成AI「RAIN」、400万トークンを処理できる大規模言語モデル「MiniMax-01」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第79回)では、自分の動きに応じてキャラクターの顔をリアルタイムに動かせる動画生成AI「RAIN」、400万トークンを処理できる大規模言語モデル「MiniMax-01」を取り上げます。

生成AIグラビアの作り方教えます。グラビアカメラマンが教える、生成AIグラビア実践Stable Diffusionワークショップ(第3期第3回)を1月22日開催。テクノエッジ アルファ会員なら無料 画像
AI

生成AIグラビアの作り方教えます。グラビアカメラマンが教える、生成AIグラビア実践Stable Diffusionワークショップ(第3期第3回)を1月22日開催。テクノエッジ アルファ会員なら無料

人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第3期第3回を1月22日に開催いたします。

世界初のチャットボット「ELIZA」、60年の時を経て復活。オープンソース化され、UNIX系OSで実行可能に(生成AIクローズアップ) 画像
AI

世界初のチャットボット「ELIZA」、60年の時を経て復活。オープンソース化され、UNIX系OSで実行可能に(生成AIクローズアップ)

世界初のAIチャットボット「ELIZA」(イライザ)を60年ぶりに復活させた研究「ELIZA Reanimated: The world’s first chatbot restored on the world’s first time sharing system」

生成AIグラビアをグラビアカメラマンが作るとどうなる?第40回:FLUX.1の高速化(西川和久) 画像
Science

生成AIグラビアをグラビアカメラマンが作るとどうなる?第40回:FLUX.1の高速化(西川和久)

生成AI画像で一番気になるのは生成時間。SD 1.5/SDXLはRTX 30系/40系を使えば比較的速いものの、FLUX.1 [dev] になって随分時間がかかるようになってしまった。が、LoRAを使って高速化する技術がある。筆者お気に入りであるFLUX.1-Turbo-Alpha を紹介しよう。

顔芸リップシンク、4Kアップスケールから顔修復まで。最近の動画生成AIおもしろ新機能を駆使してみた(CloseBox) 画像
AI

顔芸リップシンク、4Kアップスケールから顔修復まで。最近の動画生成AIおもしろ新機能を駆使してみた(CloseBox)

毎月13万円をかけている生成AIサブスクですが、特に動画方面で、ちょこちょことアップデートがされています。今回はその辺で気になるところを試してみます。

アイディアを入力するだけ、自律AIたちが調査→実験→論文執筆の研究全般を行うAMD開発「Agent Laboratory」、音声に応じて自然な口パクを生成する動画AI「LatentSync」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

アイディアを入力するだけ、自律AIたちが調査→実験→論文執筆の研究全般を行うAMD開発「Agent Laboratory」、音声に応じて自然な口パクを生成する動画AI「LatentSync」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第78回)では、自律AIたちが研究プロセス全般を自動で実行するモデル「Agent Laboratory」、ロボットや自動運転車などの物理AI向けデジタル環境学習プラットフォーム「Cosmos」を取り上げます。

AIでフリーランスの収入が「減る職種」と「増える職種」。その境目にある“変曲点”とは?(生成AIクローズアップ) 画像
AI

AIでフリーランスの収入が「減る職種」と「増える職種」。その境目にある“変曲点”とは?(生成AIクローズアップ)

今回は、AIがフリーランス(オンライン)の各仕事にどのような影響を及ぼし、職種による違いを分析した論文「AI and Freelancers: Has the Inflection Point Arrived?」に注目します。

Waymoの自動運転タクシー、駐車場内をぐるぐる周回し進まず。乗客は飛行機搭乗時間に遅れかける 画像
Mobility

Waymoの自動運転タクシー、駐車場内をぐるぐる周回し進まず。乗客は飛行機搭乗時間に遅れかける

米アリゾナ州スコッツデールのある駐車場で、Waymoの自動運転タクシーが駐車場をぐるぐると回り始め、乗客が危うく飛行機に乗り遅れそうになる問題が発生しました。

NVIDIAのMac mini激似AIスーパーコンピュータ「Project DIGITS」が欲しいです、革ジャン先生(CloseBox) 画像
AI

NVIDIAのMac mini激似AIスーパーコンピュータ「Project DIGITS」が欲しいです、革ジャン先生(CloseBox)

また欲しいものが出てしまいました。Mac miniっぽいスーパーコンピュータ。

NVIDIA GeForce RTX 50シリーズ発表。5090は約40万円 / 1999ドルで1月30日発売 DLSS4で4090比最大2倍性能 画像
AI

NVIDIA GeForce RTX 50シリーズ発表。5090は約40万円 / 1999ドルで1月30日発売 DLSS4で4090比最大2倍性能

ラスベガスで開催中のCES 2025基調講演で、NVIDIAのジェンスン・フアンCEOが次世代GPU GeForce RTX 50シリーズを正式に発表しました。

次回Galaxy Unpackedは1月23日(日本時間)開催。Galaxy S25シリーズなど発表へ 画像
スマートフォン

次回Galaxy Unpackedは1月23日(日本時間)開催。Galaxy S25シリーズなど発表へ

サムスンは、2025年最初のGalaxy Unpackedイベントを1月22日(日本時間23日午前3時)より開催すると発表しました。

夢の続きをAIに語らせてみた(CloseBox) 画像
AI

夢の続きをAIに語らせてみた(CloseBox)

2025年1月6日朝に見た夢の続きをChatGPT o1 pro modeに短編スタイルで書いてもらいました。

AIコンテンツ自給自足はもう始まっている。ChatGPT連載小説とAIエージェント「browser-use」がもたらす未来(CloseBox) 画像
AI

AIコンテンツ自給自足はもう始まっている。ChatGPT連載小説とAIエージェント「browser-use」がもたらす未来(CloseBox)

AI小説の執筆、だいぶ慣れてきました。そして、browser-useというソフトが面白いです。

動画生成AIにも発展可能。“文章から物理シミュレーションを生成するAI”内蔵の高速物理エンジン「Genesis」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

動画生成AIにも発展可能。“文章から物理シミュレーションを生成するAI”内蔵の高速物理エンジン「Genesis」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第77回)では、テキストから物理シミュレーションを生成するAIを内蔵した高速物理エンジン「Genesis」、GPT-4oやClaude-3.5-Sonnetに匹敵するオープンソースの大規模言語モデル「DeepSeek-V3」を取り上げます。