AI

複雑なタスクをブラウザでこなすOpenAIのAIエージェント「Operator」を使ってみてわかった限界点(CloseBox) 画像
AI

複雑なタスクをブラウザでこなすOpenAIのAIエージェント「Operator」を使ってみてわかった限界点(CloseBox)

米国のChatGPT Proユーザーのみに開放されているOpenAIのAIエージェント「Operator」を試してみました。

OpenAI、ブラウザ操るAIエージェント「Operator」を発表。ユーザーの代わりに複雑なタスクを処理し、ユーザーの介入も可能 画像
AI

OpenAI、ブラウザ操るAIエージェント「Operator」を発表。ユーザーの代わりに複雑なタスクを処理し、ユーザーの介入も可能

OpenAIは1月23日(米国時間)、ユーザーの代わりにブラウザを操作してタスクを実行するAIエージェント「Operator」を発表しました。

スマートリング Galaxy Ringは国内6万3690円、サイズ選びと購入方法。最長7日間の計測やスマホ連携リモコンにもなる指輪型デバイス 画像
ウェアラブル

スマートリング Galaxy Ringは国内6万3690円、サイズ選びと購入方法。最長7日間の計測やスマホ連携リモコンにもなる指輪型デバイス

サムスンがGalaxy初のスマートリング製品 Galaxy Ring の日本向け販売を発表しました。

サムスンGalaxy S25 / S25 Ultra発表、薄く軽くカメラとAI強化。スマートリングGalaxy Ringも国内発売 画像
スマートフォン

サムスンGalaxy S25 / S25 Ultra発表、薄く軽くカメラとAI強化。スマートリングGalaxy Ringも国内発売

開催中の Galaxy Unpacked イベントで、サムスンがスマートフォンのフラッグシップモデル Galaxy S25シリーズを発表しました。

キャラクターの顔を4090でリアルタイム自演できる動画生成AI「RAIN」、400万トークンを処理できる大規模言語モデル「MiniMax-01」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

キャラクターの顔を4090でリアルタイム自演できる動画生成AI「RAIN」、400万トークンを処理できる大規模言語モデル「MiniMax-01」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第79回)では、自分の動きに応じてキャラクターの顔をリアルタイムに動かせる動画生成AI「RAIN」、400万トークンを処理できる大規模言語モデル「MiniMax-01」を取り上げます。

生成AIグラビアの作り方教えます。グラビアカメラマンが教える、生成AIグラビア実践Stable Diffusionワークショップ(第3期第3回)を1月22日開催。テクノエッジ アルファ会員なら無料 画像
AI

生成AIグラビアの作り方教えます。グラビアカメラマンが教える、生成AIグラビア実践Stable Diffusionワークショップ(第3期第3回)を1月22日開催。テクノエッジ アルファ会員なら無料

人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第3期第3回を1月22日に開催いたします。

世界初のチャットボット「ELIZA」、60年の時を経て復活。オープンソース化され、UNIX系OSで実行可能に(生成AIクローズアップ) 画像
AI

世界初のチャットボット「ELIZA」、60年の時を経て復活。オープンソース化され、UNIX系OSで実行可能に(生成AIクローズアップ)

世界初のAIチャットボット「ELIZA」(イライザ)を60年ぶりに復活させた研究「ELIZA Reanimated: The world’s first chatbot restored on the world’s first time sharing system」

生成AIグラビアをグラビアカメラマンが作るとどうなる?第40回:FLUX.1の高速化(西川和久) 画像
Science

生成AIグラビアをグラビアカメラマンが作るとどうなる?第40回:FLUX.1の高速化(西川和久)

生成AI画像で一番気になるのは生成時間。SD 1.5/SDXLはRTX 30系/40系を使えば比較的速いものの、FLUX.1 [dev] になって随分時間がかかるようになってしまった。が、LoRAを使って高速化する技術がある。筆者お気に入りであるFLUX.1-Turbo-Alpha を紹介しよう。

顔芸リップシンク、4Kアップスケールから顔修復まで。最近の動画生成AIおもしろ新機能を駆使してみた(CloseBox) 画像
AI

顔芸リップシンク、4Kアップスケールから顔修復まで。最近の動画生成AIおもしろ新機能を駆使してみた(CloseBox)

毎月13万円をかけている生成AIサブスクですが、特に動画方面で、ちょこちょことアップデートがされています。今回はその辺で気になるところを試してみます。

アイディアを入力するだけ、自律AIたちが調査→実験→論文執筆の研究全般を行うAMD開発「Agent Laboratory」、音声に応じて自然な口パクを生成する動画AI「LatentSync」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

アイディアを入力するだけ、自律AIたちが調査→実験→論文執筆の研究全般を行うAMD開発「Agent Laboratory」、音声に応じて自然な口パクを生成する動画AI「LatentSync」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第78回)では、自律AIたちが研究プロセス全般を自動で実行するモデル「Agent Laboratory」、ロボットや自動運転車などの物理AI向けデジタル環境学習プラットフォーム「Cosmos」を取り上げます。

AIでフリーランスの収入が「減る職種」と「増える職種」。その境目にある“変曲点”とは?(生成AIクローズアップ) 画像
AI

AIでフリーランスの収入が「減る職種」と「増える職種」。その境目にある“変曲点”とは?(生成AIクローズアップ)

今回は、AIがフリーランス(オンライン)の各仕事にどのような影響を及ぼし、職種による違いを分析した論文「AI and Freelancers: Has the Inflection Point Arrived?」に注目します。

Waymoの自動運転タクシー、駐車場内をぐるぐる周回し進まず。乗客は飛行機搭乗時間に遅れかける 画像
Mobility

Waymoの自動運転タクシー、駐車場内をぐるぐる周回し進まず。乗客は飛行機搭乗時間に遅れかける

米アリゾナ州スコッツデールのある駐車場で、Waymoの自動運転タクシーが駐車場をぐるぐると回り始め、乗客が危うく飛行機に乗り遅れそうになる問題が発生しました。

NVIDIAのMac mini激似AIスーパーコンピュータ「Project DIGITS」が欲しいです、革ジャン先生(CloseBox) 画像
AI

NVIDIAのMac mini激似AIスーパーコンピュータ「Project DIGITS」が欲しいです、革ジャン先生(CloseBox)

また欲しいものが出てしまいました。Mac miniっぽいスーパーコンピュータ。

NVIDIA GeForce RTX 50シリーズ発表。5090は約40万円 / 1999ドルで1月30日発売 DLSS4で4090比最大2倍性能 画像
AI

NVIDIA GeForce RTX 50シリーズ発表。5090は約40万円 / 1999ドルで1月30日発売 DLSS4で4090比最大2倍性能

ラスベガスで開催中のCES 2025基調講演で、NVIDIAのジェンスン・フアンCEOが次世代GPU GeForce RTX 50シリーズを正式に発表しました。

次回Galaxy Unpackedは1月23日(日本時間)開催。Galaxy S25シリーズなど発表へ 画像
スマートフォン

次回Galaxy Unpackedは1月23日(日本時間)開催。Galaxy S25シリーズなど発表へ

サムスンは、2025年最初のGalaxy Unpackedイベントを1月22日(日本時間23日午前3時)より開催すると発表しました。

夢の続きをAIに語らせてみた(CloseBox) 画像
AI

夢の続きをAIに語らせてみた(CloseBox)

2025年1月6日朝に見た夢の続きをChatGPT o1 pro modeに短編スタイルで書いてもらいました。

AIコンテンツ自給自足はもう始まっている。ChatGPT連載小説とAIエージェント「browser-use」がもたらす未来(CloseBox) 画像
AI

AIコンテンツ自給自足はもう始まっている。ChatGPT連載小説とAIエージェント「browser-use」がもたらす未来(CloseBox)

AI小説の執筆、だいぶ慣れてきました。そして、browser-useというソフトが面白いです。

動画生成AIにも発展可能。“文章から物理シミュレーションを生成するAI”内蔵の高速物理エンジン「Genesis」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

動画生成AIにも発展可能。“文章から物理シミュレーションを生成するAI”内蔵の高速物理エンジン「Genesis」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第77回)では、テキストから物理シミュレーションを生成するAIを内蔵した高速物理エンジン「Genesis」、GPT-4oやClaude-3.5-Sonnetに匹敵するオープンソースの大規模言語モデル「DeepSeek-V3」を取り上げます。

AIが生徒に囲碁を教えた結果、男女の実力差が解消。男女差は人間指導が原因?(生成AIクローズアップ) 画像
AI

AIが生徒に囲碁を教えた結果、男女の実力差が解消。男女差は人間指導が原因?(生成AIクローズアップ)

今回は、AI教師が囲碁を生徒に指導すると学習効果はどうなるかを調査した研究論文「Can Artificial Intelligence Improve Gender Equality? Evidence from a Natural Experiment」に注目します。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第39回:生成AI画像の2024年を振り返る(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第39回:生成AI画像の2024年を振り返る(西川和久)

年末ということで、生成AI画像の2024年をバックナンバー見つつ、ざっくりおさらいしてみたい。

半年でAI関連課金が2倍に。生成AIサブスク地獄から脱出できる?(CloseBox) 画像
AI

半年でAI関連課金が2倍に。生成AIサブスク地獄から脱出できる?(CloseBox)

みなさん、AIサブスクしてますか?

リアルタイム文章読み上げAI「CosyVoice 2」、アニメの中間フレーム自動生成AI「AniDoc」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

リアルタイム文章読み上げAI「CosyVoice 2」、アニメの中間フレーム自動生成AI「AniDoc」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第76回)では、アニメの自動彩色と中間フレームを生成できるAIモデル「AniDoc」と、Metaの動画理解AIモデル「Apollo」をご紹介します。

文字起こしが優秀で、仕事を楽にしてくれた「PLAUD NotePin」(2024年ベストバイ) 画像
ウェアラブル

文字起こしが優秀で、仕事を楽にしてくれた「PLAUD NotePin」(2024年ベストバイ)

すでに2024年のベストバイとして、オープンイヤーイヤホンの「nwm DOTS」を挙げた筆者ですが、実はもう一つ、ベストバイとして挙げたいデバイスがあります。それがウェアラブルAIメモリーカプセル「PLAUD NotePin」です。

92万字の大作小説をChatGPT o1 pro modeに書かせたら、罪悪感でいっぱい。そして驚愕の結末に(CloseBox) 画像
AI

92万字の大作小説をChatGPT o1 pro modeに書かせたら、罪悪感でいっぱい。そして驚愕の結末に(CloseBox)

最近、AIに小説を書いてもらっています。

生成AIグラビアのノウハウがテクノエッジ アルファ会員なら無料で。「Stable Diffusion」の基本から最新技術まで学べる。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第3期第2回)を12月26日開催。2024年画像生成AI総括も 画像
AI

生成AIグラビアのノウハウがテクノエッジ アルファ会員なら無料で。「Stable Diffusion」の基本から最新技術まで学べる。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第3期第2回)を12月26日開催。2024年画像生成AI総括も

人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第3期第2回を12月26日に開催いたします。

OpenAI「o3」は本当に“AGI”に近いのか? AGIレベルを評価する「ARC-AGI」の開発者が解説(生成AIクローズアップ) 画像
AI

OpenAI「o3」は本当に“AGI”に近いのか? AGIレベルを評価する「ARC-AGI」の開発者が解説(生成AIクローズアップ)

OpenAIが最近発表したAIモデル「o3」と汎用人工知能(AGI)について、AGIの性能を評価するベンチマーク「ARC-AGI」の開発者フランソワ・ショレ氏(Googleの研究者)が考察した記事に注目します。

MicrosoftのGPT-4o超え小型言語AI「Phi-4」、カメラ越しの現実をリアルタイムに理解するオープンソースAI「IXC2.5-OL」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

MicrosoftのGPT-4o超え小型言語AI「Phi-4」、カメラ越しの現実をリアルタイムに理解するオープンソースAI「IXC2.5-OL」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第75回)では、Microsoftの新しい言語モデル「Phi-4」や、カメラ越しに映る現実をリアルタイムに理解するAIモデル「IXC2.5-OL」を取り上げます。

VOCALOID発売から20年。ChatGPTに歌声合成の歴史をまとめてもらった(CloseBox) 画像
AI

VOCALOID発売から20年。ChatGPTに歌声合成の歴史をまとめてもらった(CloseBox)

VOCALOIDが発売から20年を迎え、ヤマハの特設ページが公開されました。継続的にVOCALOIDの新技術を試して記事にしていた筆者もお祝いのメッセージを書いています。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第38回:FLUX.1 Tools登場!(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第38回:FLUX.1 Tools登場!(西川和久)

FLUX.1 Toolsとは?

音楽・動画AIの進化が加速した2024年の生成AIを記事とビデオとポッドキャストで振り返る(CloseBox) 画像
AI

音楽・動画AIの進化が加速した2024年の生成AIを記事とビデオとポッドキャストで振り返る(CloseBox)

今年2024年は生成AIの、特に動画において画期的な進歩が継続して行われた年でした。この連載でもずっと追いかけてきたテーマでもあるので、特に動画生成AIについて、自分が作った動画で振り返ります。

ローカルマシンだけで生成AIはどこまでいける? MacBook Pro(M4 Max、128GBメモリ)を手に入れたローカルAI男子の遠吠え(2024年ベストバイ) 画像
AI

ローカルマシンだけで生成AIはどこまでいける? MacBook Pro(M4 Max、128GBメモリ)を手に入れたローカルAI男子の遠吠え(2024年ベストバイ)

128GB M4 Max MacBook Pro、予約しただけで記事を書いた私ですが、ようやく届いたので、いろいろとやりたかったことを試しています。

AIは無知をどこまで認識できるか? 人類が回答不可能な質問をGPTやClaude、Geminiなどに大量にぶつけてみた(生成AIクローズアップ) 画像
AI

AIは無知をどこまで認識できるか? 人類が回答不可能な質問をGPTやClaude、Geminiなどに大量にぶつけてみた(生成AIクローズアップ)

AIたちが「答えが分からない」と自身の無知を認識できるかを検証した論文「The Impossible Test: A 2024 Unsolvable Dataset and A Chance for an AGI Quiz」を取り上げます。

アバターロボットが区役所を丸ごと案内、大田区で実証実験(中山智) 画像
AI

アバターロボットが区役所を丸ごと案内、大田区で実証実験(中山智)

現在大田区役所では、東京都の次世代通信技術活用型スタートアップ支援事業のもと、avatarinとともにローカル5Gを含む次世代通信技術を活用した実証実験を行っています。

長編ドキュメンタリー作品「AIで愛になる~超愛妻家・松尾公也とテクノロジーの未来」が公開されました(CloseBox) 画像
AI

長編ドキュメンタリー作品「AIで愛になる~超愛妻家・松尾公也とテクノロジーの未来」が公開されました(CloseBox)

自分の半生を描いたドキュメンタリー作品がYouTubeで公開されます。

Googleが自律的プログラミングAIエージェント「Jules」を発表。Gemini 2.0で実装計画を作成、コード生成・変更・バグフィクスなど実行 画像
AI

Googleが自律的プログラミングAIエージェント「Jules」を発表。Gemini 2.0で実装計画を作成、コード生成・変更・バグフィクスなど実行

Googleは、人間がタスクを与えると自律的に実装計画を立ててコードの生成や変更、バグフィクスなどを実行してくれるAIエージェント「Jules」を発表しました。

Google、AI時代の新OS『Android XR』発表。メガネとヘッドセット両用でアップル・Meta対抗、初製品はサムスン製『Moohan』来年発売 画像
XR / VR / AR

Google、AI時代の新OS『Android XR』発表。メガネとヘッドセット両用でアップル・Meta対抗、初製品はサムスン製『Moohan』来年発売

Googleが新OS『Android XR』を発表しました。

ChatGPTでサンタさんとの音声会話ができるように。iPhoneだけでGoogle Stream Realtime対抗のビデオ・画面共有会話もやってみた(CloseBox) 画像
AI

ChatGPTでサンタさんとの音声会話ができるように。iPhoneだけでGoogle Stream Realtime対抗のビデオ・画面共有会話もやってみた(CloseBox)

OpenAIが12日間、新機能を発表する「12 Days of OpenAI」、6日目はChatGPTのAdvanced Voice Mode(高度な音声)の新機能について。

iPhoneだけでAI画像生成できる、Apple IntelligenceのImage Playgroundが使えるiOS 18.2で、ChatGPTとSiriの統合を試してみた(CloseBox) 画像
AI

iPhoneだけでAI画像生成できる、Apple IntelligenceのImage Playgroundが使えるiOS 18.2で、ChatGPTとSiriの統合を試してみた(CloseBox)

Apple Intelligenceはまだ日本語では使えませんが、英語モードにすれば利用可能です。本日アップデートされたiOS 18.2ではChatGPTとの統合に加え、待望のAI画像生成機能「Image Playground」が追加されました。その機能を試してみます。

Google怒涛の新作AI発表。1位獲得の言語AI「Gemini-Exp-1206」、画像1枚からプレイ可能な3Dゲーム生成AI「Genie 2」、動画生成AI「Veo」、高性能天気予報AI「GenCast」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

Google怒涛の新作AI発表。1位獲得の言語AI「Gemini-Exp-1206」、画像1枚からプレイ可能な3Dゲーム生成AI「Genie 2」、動画生成AI「Veo」、高性能天気予報AI「GenCast」など生成AI技術5つを解説(生成AIウィークリー)

OpenAIは、ChatGPTの新しい有料プラン「ChatGPT Pro」を発表しました。価格は月額200ドルで、最高レベルの「OpenAI o1」を含むすべてのモデルを無制限で使用することができます。

「登場即ライバル動画生成AI死亡」ではなかった。使ってわかったSoraの品質と限界(CloseBox) 画像
AI

「登場即ライバル動画生成AI死亡」ではなかった。使ってわかったSoraの品質と限界(CloseBox)

人気のため一時はアカウント作成ができない状態だったSoraですが、ようやくアカウントを作成し、ログインできたので試してみました。

OpenAIのSora、1080p 最大20秒の動画生成AI最高水準でついに一般公開。3万円コースのChatGPT Proユーザーは無制限モードあり(CloseBox) 画像
AI

OpenAIのSora、1080p 最大20秒の動画生成AI最高水準でついに一般公開。3万円コースのChatGPT Proユーザーは無制限モードあり(CloseBox)

OpenAIの動画生成AI「Sora」がついに公開されました。

AIで「量子もつれ」の新たな生成方法を発見。量子インターネット構築が容易になる可能性(生成AIクローズアップ) 画像
AI

AIで「量子もつれ」の新たな生成方法を発見。量子インターネット構築が容易になる可能性(生成AIクローズアップ)

中国の南京大学やドイツのMax Planck Institute for the Science of Lightに所属する研究者らが、AIシステムを用いて量子もつれの新しい生成方法を発見した論文「Entangling Independent Particles by Path Identity」を解説します。