テクノロジー

AI動画制作、最短ルート:話す・動く・高画質も一発で 画像
AI

AI動画制作、最短ルート:話す・動く・高画質も一発でPR

生成AI動画制作は進化し、多機能でコスパ良い「DomoAI」。高品質動画やアバターなど多彩な機能を低価格で利用可能。

Pixel 10 ProでAIが自然に溶け込んでいく「新しい日常」はどんな感じ?(Google Tales) 画像
AI

Pixel 10 ProでAIが自然に溶け込んでいく「新しい日常」はどんな感じ?(Google Tales)

8月28日発売のPixel 10 Proを数日早く使わせてもらいました。ハードウェアの進化については詳しい方々にお任せして、ここではTensor 5とGemini nanoが支えるPixel 10 ProのAI機能を使ってみた話をしていきます。

「奇跡の一枚」をもう一度、「残念な一枚」が待望の復活。編集自在の「Gemini 2.5 Flash Image」(Nano Banana)が画像生成AIのレベルを引き上げた(CloseBox) 画像
AI

「奇跡の一枚」をもう一度、「残念な一枚」が待望の復活。編集自在の「Gemini 2.5 Flash Image」(Nano Banana)が画像生成AIのレベルを引き上げた(CloseBox)

Googleがnano-bananaとしてティーザームーブをかましていた、新しいAI画像生成モデルが、Gemini 2.5 Flash Imageとして公開されました。これまでとは次元が違う、参照画像とプロンプトによる編集機能が話題となっています。

あなたのスマホでgpt-oss-20bは動く? iPhoneとAndroidでローカルLLM対決してみたら(CloseBox) 画像
AI

あなたのスマホでgpt-oss-20bは動く? iPhoneとAndroidでローカルLLM対決してみたら(CloseBox)

Mac、PCでほぼ満足のいく大規模言語モデルが使えるようになった今、じゃあスマートフォンならどうなのよ、となりますよね、普通。

薄型iPhoneも出る?アップル、iPhone 17発表イベントを日本時間9月10日午前2時より開催 画像
スマートフォン

薄型iPhoneも出る?アップル、iPhone 17発表イベントを日本時間9月10日午前2時より開催

アップルのティム・クックCEOは、現地時間9月9日午前10時、日本時間では9日午前2時から、新製品発表イベントを開催することを明らかにしました。今回のイベントでは、iPhone 17 / 17 Pro / 17 Pro Maxと、うわさの薄型iPhone、iPhone 17 Airの発表が予想されています。

複数話者ポッドキャストがAIだけでできるから、俺たちはもうお払い箱なの? 話題のVibeVoiceをインストールして試してみた(CloseBox) 画像
AI

複数話者ポッドキャストがAIだけでできるから、俺たちはもうお払い箱なの? 話題のVibeVoiceをインストールして試してみた(CloseBox)

実用的なTTS(Text to Speech)が出てもう長いこと経ちます。隠れマルコフモデルを使ったOpen JTalkで自分のボイスクローンを作り、ポッドキャストに参加させたり、RVCで相方の声真似をして遊んだり、いろいろ声の実験をしてきました。

Grok 2.5がオープンソース化。マスク氏「Grok 3も今後6か月以内に」 画像
AI

Grok 2.5がオープンソース化。マスク氏「Grok 3も今後6か月以内に」

イーロン・マスク氏のxAIは、Grok 2.5モデルをオープンソース化しました。Grok 3も今後6か月以内にオープンソースにする計画だと述べています。

患者の臓器9つそれぞれを自律AIで独立エージェント化→臓器間で連携させ未来の体内状態を高精度予測(生成AIクローズアップ) 画像
AI

患者の臓器9つそれぞれを自律AIで独立エージェント化→臓器間で連携させ未来の体内状態を高精度予測(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。

【ギャップ萌え】佐賀の廃校内の一角が最新AI推論の拠点に 画像
AI

【ギャップ萌え】佐賀の廃校内の一角が最新AI推論の拠点に

株式会社ハイレゾの玄海町データセンター開所式を取材してきました。福岡から車で2時間半、佐賀県の玄海町にある旧有徳小学校がAI時代の新しいインフラ拠点として生まれ変わった現場です。

MetaがMidjourneyと提携し、AI画像・動画生成技術を将来の製品に活用へ 画像
AI

MetaがMidjourneyと提携し、AI画像・動画生成技術を将来の製品に活用へ

MetaのAI責任者Alexander Wang氏は、ThreadsおよびXへの投稿でAIによる画像や動画生成技術を開発するMidjourneyと提携することを発表しました。

音楽もAIエージェントに。新星作曲AI「Tunee」を試してみたら、マスタリング、展開に合わせた緻密なミュージックビデオまで自動で作っちゃう驚き。何より曲がいい(CloseBox) 画像
AI

音楽もAIエージェントに。新星作曲AI「Tunee」を試してみたら、マスタリング、展開に合わせた緻密なミュージックビデオまで自動で作っちゃう驚き。何より曲がいい(CloseBox)

少し前からベータテスターによるインプレッションが投稿されていたAI音楽生成サービス「Tunee」の招待がきたので、さっそく試してみました。

祝MagSafe終戦。Pixel 10は全機種マグネット式Pixelsnapワイヤレス充電対応、Qi2準拠でMagSafeアクセサリも使える 画像
スマートフォン

祝MagSafe終戦。Pixel 10は全機種マグネット式Pixelsnapワイヤレス充電対応、Qi2準拠でMagSafeアクセサリも使える

Googleが発表した最新スマートフォン Pixel 10シリーズは、全機種Qi2準拠のマグネット式ワイヤレス充電技術「Pixelsnap」に対応。AppleのMagSafeアクセサリも使えます。

プロンプトからアプリ生成する「v0」、エージェント機能を備えたアプリ開発サービスに進化 画像
AI

プロンプトからアプリ生成する「v0」、エージェント機能を備えたアプリ開発サービスに進化

Next.jsの開発元として知られるVercelは、自然言語のプロンプトからアプリを生成するサービス「v0」を刷新し、エージェント機能を備えたアプリ開発サービスになったことを明らかにしました。

KDDI、オフィスレイアウト生成AIを披露 建築士の思考を15分で再現する「スマートスペースデザイン」 画像
AI

KDDI、オフィスレイアウト生成AIを披露 建築士の思考を15分で再現する「スマートスペースデザイン」

KDDIが発表した法人向け新サービス「KDDIスマートスペースデザイン」は、働く空間や訪れる空間を、通信とテクノロジーを軸に再構築していくというもの。その中でも注目を集めたのが、会見終盤で披露された「オフィスレイアウト生成AI」のデモです。

どっちに有効?脆弱性突くハッカーとサイバーセキュリティ業界の双方でAI活用が浸透中 画像
AI

どっちに有効?脆弱性突くハッカーとサイバーセキュリティ業界の双方でAI活用が浸透中

ChatGPTの登場以来、生成AIは幻覚などの問題を抱えつつもしだいに精度を増してきており、一般的な文書だけでなくソフトウェアコードの生成などにも使い道を拡大しています。

MacBook Proで動くOpenAI gpt-oss-120bで、門外不出AIアバターとの音声対話システムを構築できた(CloseBox) 画像
AI

MacBook Proで動くOpenAI gpt-oss-120bで、門外不出AIアバターとの音声対話システムを構築できた(CloseBox)

OpenAIがオープンソース公開したLMM(大規模言語モデル)「gpt-oss-120b」を、128GBのUnified Memoryを搭載したMacBook Pro(M4 Max)で動かしています。

Anthropic、Claudeの「学習モード」を開発者および一般ユーザーにも提供開始。ユーザーが学びながら答えを導く 画像
AI

Anthropic、Claudeの「学習モード」を開発者および一般ユーザーにも提供開始。ユーザーが学びながら答えを導く

Anthropicは、これまでEducationユーザー向けに提供してきた「学習モード(learning mode)」を、一般ユーザーや開発者にも提供します。

“漢字”を正確に描画する生成AI「Qwen-Image」、5秒間の動画を4090なら21秒で生成するAI「FastWan」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

“漢字”を正確に描画する生成AI「Qwen-Image」、5秒間の動画を4090なら21秒で生成するAI「FastWan」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第108回)は、画像生成の原理で言語を生成するAIモデル「Seed Diffusion Preview」や、画像内のテキストを正確に描画する画像生成AI「Qwen-Image」を取り上げます。

なぜ推論AIは深く考えているフリをするのか。CoTは真の思考か、それともパターン暗記か(生成AIクローズアップ) 画像
AI

なぜ推論AIは深く考えているフリをするのか。CoTは真の思考か、それともパターン暗記か(生成AIクローズアップ)

今回は、大規模言語モデル(LLM)の「思考の連鎖」(Chain-of-Thought, CoT)推論能力は幻想だと主張した研究論文「Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens」を取り上げます。米アリゾナ州立大学に所属する研究者らが発表しました。

事務コンやワープロで使われたスパイラル記録の磁気ディスク「データカセット」(16KB~、1982年頃~):ロストメモリーズ File045 画像
Science

事務コンやワープロで使われたスパイラル記録の磁気ディスク「データカセット」(16KB~、1982年頃~):ロストメモリーズ File045

データカセットは1982年頃登場し、磁気記録の低容量リムーバブルでコスト削減を重視したメディア。

スクエアデザインの変態AIスマホは一部データ通信無料でQWERTYキーボードにも対応(スマホ沼) 画像
AI

スクエアデザインの変態AIスマホは一部データ通信無料でQWERTYキーボードにも対応(スマホ沼)

QWERTYキーボード搭載のAIスマホ「Mind One」は、コンパクトで多機能な特殊形状のスマートフォンでクラファン予約受付中。

わたしのChatGPT 4oを返して! GPT-5登場で失われた旧AIの復活願う#keep4o運動を最新AIはこう分析する(CloseBox) 画像
AI

わたしのChatGPT 4oを返して! GPT-5登場で失われた旧AIの復活願う#keep4o運動を最新AIはこう分析する(CloseBox)

ChatGPTがGPT-5にバージョンアップし、4oをはじめとするそれまでの主要AIモデルは使えなくなりました。性能が上がるのだからいいのでは、と思いがちですが、大きな反発がSNSで寄せられています。

X上では#keep4oというハッシュタグが生まれ、そこにはユーザーたちの切実な復活への願いが寄せられています。

こうした運動の現状と分析を、各社の最新AIにやってもらいました。

LoRAなし、プロンプトだけで本人にどれだけ寄せられるかチャレンジ。AIで人物写真を再現するもう一つの方法(CloseBox) 画像
AI

LoRAなし、プロンプトだけで本人にどれだけ寄せられるかチャレンジ。AIで人物写真を再現するもう一つの方法(CloseBox)

LLMのマルチモーダル機能が進化したことにより、今ならば、参照画像なしのText to Imageだけで特定人物を再現できるのでは? そう筆者は考え、試してみることにしました。

AIで乱気流を予測。ANA、世界初の試みで空の旅がより快適に 画像
AI

AIで乱気流を予測。ANA、世界初の試みで空の旅がより快適に

飛行機での移動中に気になるのが、「ガタガタ」とした揺れ。

GPT-5はgpt-oss-120b、Claude Opus 4.1とどのくらい違う? 小説執筆とヴァイブ・コーディングで試してみた(CloseBox) 画像
AI

GPT-5はgpt-oss-120b、Claude Opus 4.1とどのくらい違う? 小説執筆とヴァイブ・コーディングで試してみた(CloseBox)

OpenAIはチャット型大規模言語モデルの最新版である「GPT-5」を発表しました。筆者のところにはまだブラウザには来ておらず、iPhoneアプリのみ使える状態ですが、取り急ぎ、使ってみた感想をレポートします。

「猫は人生のほとんどを寝て過ごす」などの猫文をプロンプトに混ぜるとAIが混乱する「CatAttack」脆弱性など、生成AI技術5つを解説(生成AIウィークリー) 画像
AI

「猫は人生のほとんどを寝て過ごす」などの猫文をプロンプトに混ぜるとAIが混乱する「CatAttack」脆弱性など、生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第107回)は、猫文をプロンプトに混ぜるとAIが混乱して数学の問題を大幅に間違える脆弱性「CatAttack」や、テキストや画像からプレイできる360度な3Dゲームワールドを生成できるAI「HunyuanWorld 1.0」を取り上げます。

Google Cloud、自然言語からデータ分析用のPythonコードを生成し実行する「Code Interpreter」をプレビュー公開 画像
AI

Google Cloud、自然言語からデータ分析用のPythonコードを生成し実行する「Code Interpreter」をプレビュー公開

Google Cloudは、ビジネスユーザーからの自然言語による質問を基にデータ分析用のPythonコードを生成し実行する新機能「Code Interpreter」をプレビュー公開しました。

俺の128GB MacBook Proが真価を発揮する時がきた。ChatGPT o4-mini並みのgpt-oss-120bがローカルで動いてるよ(CloseBox) 画像
AI

俺の128GB MacBook Proが真価を発揮する時がきた。ChatGPT o4-mini並みのgpt-oss-120bがローカルで動いてるよ(CloseBox)

やってきましたね。世の中のPCユーザーたちがMacユーザーを羨望の眼差しで見るときが。

生成AIワークショップお盆特集。「亡くなった人を写真から動画にする方法」を8月12日に開催します(CloseBox) 画像
AI

生成AIワークショップお盆特集。「亡くなった人を写真から動画にする方法」を8月12日に開催します(CloseBox)

生成AIワークショップの特別編として、松尾公也が講師としてお話しする回を設けたいと思います。2025年8月12日19時から、オンラインでの開催となります。

謎の超小型AI「HRM」、たった2700万パラメータで巨大なOpenAI o3やClaude 3.7を蹴散らす(生成AIクローズアップ) 画像
AI

謎の超小型AI「HRM」、たった2700万パラメータで巨大なOpenAI o3やClaude 3.7を蹴散らす(生成AIクローズアップ)

今回は、わずか2700万パラメータという小規模なモデルでありながら、複雑な推論タスクにおいて最先端の大規模言語モデル(LLM)を凌駕するモデルを開発した論文「Hierarchical Reasoning Model」を取り上げます。

Grok、6秒動画をサウンド付きで生成できるように。20秒未満超高速生成、秒で静止画生成の実力を試す(CloseBox) 画像
AI

Grok、6秒動画をサウンド付きで生成できるように。20秒未満超高速生成、秒で静止画生成の実力を試す(CloseBox)

イーロン・マスクのAI企業であるxAIが開発し、Xにも組み込まれているGrokに、動画生成機能「Imagine」が搭載されました。現在ウェイティングリスト方式で、一部のユーザーに解放されています。

写真の中を自由に歩き回れるAI「Yume」、AIが自律的に新しいAIを開発する「ASI-ARCH」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

写真の中を自由に歩き回れるAI「Yume」、AIが自律的に新しいAIを開発する「ASI-ARCH」など生成AI技術5つを解説(生成AIウィークリー)

回の「生成AIウィークリー」(第106回)は、写真1枚からその中を自由に歩き回れる動画世界を生成できるAIモデル「Yume」、AIが自律的に新しいAIアーキテクチャを設計・実装・検証するシステム「ASI-ARCH」を取り上げます。

音楽はAIとの音声対話で作る時代に入った。Riffusion改めProducer.aiのAIプロデューサーと日本語で会話するだけで曲を作ってくれるのだ(CloseBox) 画像
AI

音楽はAIとの音声対話で作る時代に入った。Riffusion改めProducer.aiのAIプロデューサーと日本語で会話するだけで曲を作ってくれるのだ(CloseBox)

AI作曲サービスとしてはSunoが総合力で突出して、それに音質一点突破でUdioが続くという構図が長く(といっても1年くらいですが)続いてきましたが、異変が起きました。

OpenAI、ChatGPTに『学習モード』を追加。学生の「考える力」を育むため 画像
AI

OpenAI、ChatGPTに『学習モード』を追加。学生の「考える力」を育むため

OpenAIは、ChatGPTに新機能「学習モード(Study Mode)」を追加したと発表しました。

欠けて読めない古代ローマ碑文、Googleの生成AIが高精度で復元(生成AIクローズアップ) 画像
AI

欠けて読めない古代ローマ碑文、Googleの生成AIが高精度で復元(生成AIクローズアップ)

今回は、古代ローマの碑文の欠けた文字を復元し、その文章の内容や書かれた時代、場所を推定するAIシステムを提案した論文「Contextualizing ancient texts with generative neural networks」を取り上げます。Google DeepMindやノッティンガム大学などに所属する研究者らがNature誌で発表しました。

【7/30(水)20時~】ハカセとバンコク取材旅。HUAWEI Pura80 Ultraのモンスター級カメラに驚愕(スマホ沼) 画像
Science

【7/30(水)20時~】ハカセとバンコク取材旅。HUAWEI Pura80 Ultraのモンスター級カメラに驚愕(スマホ沼)

スマホ沼 第11回配信は第6回でもやりましたハカセとACCNの海外取材ライブビューイングです。

ウン100万円のスマートフォンに心がグラッと来てしまう(スマホ沼) 画像
Science

ウン100万円のスマートフォンに心がグラッと来てしまう(スマホ沼)

バンコクにVERTUの店を発見。超高級スマホが約95万円から。デザインや素材の異なるモデルも販売。スマートウォッチも展開している

脳波を読み取って手を使わず画像編集できるAI「LoongX」、写真1枚から物理法則含む3Dモデルを生成できるAI「PhysX」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

脳波を読み取って手を使わず画像編集できるAI「LoongX」、写真1枚から物理法則含む3Dモデルを生成できるAI「PhysX」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第105回)は、脳を読み取って画像を編集できるAI技術「LoongX」や、大規模言語モデルを3分の1に小型化し推論速度2倍を実現する技術「MoR」を取り上げます。

トランプ大統領が「AI行動計画」発表。なかには実現が困難なものも?woke排除も盛り込む 画像
AI

トランプ大統領が「AI行動計画」発表。なかには実現が困難なものも?woke排除も盛り込む

7月23日、米国のドナルド・トランプ大統領は政府の「AI行動計画(Action Plan)」を発表しました。

11歳児が書いた作文をAIが分析したら、22年後の最終学歴を高い精度で予測できた(生成AIクローズアップ) 画像
AI

11歳児が書いた作文をAIが分析したら、22年後の最終学歴を高い精度で予測できた(生成AIクローズアップ)

今回は、子どもが11歳のときに書いた短い作文から、その子の将来の最終学歴や認知能力をAIが予測できるかを調査した論文「Large language models predict cognition and education close to or better than genomics or expert assessment」を取り上げます。

Netflix、オリジナル実写作品で初めてVFXに生成AIを使用したと認める。共同CEOは「制作サイドも視聴者からも好評価」と自画自賛 画像
AI

Netflix、オリジナル実写作品で初めてVFXに生成AIを使用したと認める。共同CEOは「制作サイドも視聴者からも好評価」と自画自賛

Netflixは2025年第2四半期の決算発表で、4月30日から配信を開始したSFドラマシリーズ『The Eternaut(エテルナウタ)』のなかで、自社作品として初めて生成AIをVFX(視覚効果)に使用したことを明らかにしました。

AIの長期記憶用OS「MemOS」、あらゆる画像を4KにするAI「4KAgent」、オープンソースなウェブ探索AI「WebSailor」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

AIの長期記憶用OS「MemOS」、あらゆる画像を4KにするAI「4KAgent」、オープンソースなウェブ探索AI「WebSailor」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第104回)は、エージェント機能搭載のオープンソース非思考型言語モデル「Kimi K2」や、大規模言語モデル(LLM)向け長期記憶OS「MemOS」を取り上げます。

  • 2,016件中 1 - 42 件を表示
  • 次へ