AI

1分超えたいなら動画生成はローカルAIを選べ。6GB VRAMでも動くオープンソースAI「FramePack」の実力は本物か、試してみた(CloseBox) 画像
テクノロジー

1分超えたいなら動画生成はローカルAIを選べ。6GB VRAMでも動くオープンソースAI「FramePack」の実力は本物か、試してみた(CloseBox)

本日2本目のAI記事。ControlNet、WebUI Forge、Fooocusなど、画像生成AIソフトに多大な貢献をしてきたlllyasvielさんが、動画生成AIの新しいオープンソースソフト「FramePack」を公開しました。NVIDIA GPU専用ですが、WindowsとLinuxですぐに使えます。

複雑なキャラの高品質なSVG画像を生成するAI「OmniSVG」、異なる写真同士を合体生成する「UNO」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

複雑なキャラの高品質なSVG画像を生成するAI「OmniSVG」、異なる写真同士を合体生成する「UNO」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第91回)では、複数の写真に写る被写体を1枚の写真に統合させる画像生成AI「UNO」や、1枚の写真から音声に応じた話す人物映像を作成するトーキングヘッド生成AI「FantasyTalking」を取り上げます。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第46回:遂にオープンでFLUX.1 [dev]を超える!? HiDream-I1登場(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第46回:遂にオープンでFLUX.1 [dev]を超える!? HiDream-I1登場(西川和久)

オープンで高性能のHiDream-I1(サービス利用編)

まるで映画「ブレードランナー」のあのシーン。古い写真の撮影場所をChatGPT o3が12分かけて特定したそのやり方がすごい(CloseBox) 画像
テクノロジー

まるで映画「ブレードランナー」のあのシーン。古い写真の撮影場所をChatGPT o3が12分かけて特定したそのやり方がすごい(CloseBox)

OpenAIのChatGPT o3とo4-mini、o4-mini-highが投入されてすぐに試したのは、o3による音楽解析でした。その日のうちにもう1つ、試してみたので今回はそちらをご報告します。それは、写真分析です。

ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に(CloseBox) 画像
テクノロジー

ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に(CloseBox)

OpenAIがChatGPTのLLM(大規模言語モデル)の新モデル、o3とo4-mini、o4-mini、o4-mini-highを公開しました。現在ではPlus、Pro、Teamユーザーが使えます。

AIは人間に不信感を抱いてる? AIが人間の本質をどのように捉えているかを調査した研究(生成AIクローズアップ) 画像
テクノロジー

AIは人間に不信感を抱いてる? AIが人間の本質をどのように捉えているかを調査した研究(生成AIクローズアップ)

今回は、大規模言語モデル(LLM)が人間の本質をどのように捉えているかを調査した論文「Measurement of LLM’s Philosophies of Human Nature」を取り上げます。

Googleの最先端動画生成AI「Veo 2」がGemini Advancedでロールアウト。そして偽サイトには騙されないように(CloseBox) 画像
テクノロジー

Googleの最先端動画生成AI「Veo 2」がGemini Advancedでロールアウト。そして偽サイトには騙されないように(CloseBox)

一部ユーザーにのみ開放され、それ以外の人はウェイティングリストに登録するだけ……そんな状態が続いていたGoogleの動画生成AIサービス「Veo 2」が、Gemini Advancedでロールアウト開始しました。

最強カメラフォンを発表するvivoの写真展へ行ってきた(スマホ沼) 画像
ガジェット

最強カメラフォンを発表するvivoの写真展へ行ってきた(スマホ沼)

vivoは「vivo X200 Ultra」を発表予定で、ユーザーによる写真展を開催。深センの地下鉄駅で自然と都市のエコロジーを表現し、さまざまなカメラフォンの作品を展示しました。

AIグラビアからヴァイブコーディングまで、生成AIの最新動向を解説するテクノエッジ主催イベントを5月20日、開催します 画像
テクノロジー

AIグラビアからヴァイブコーディングまで、生成AIの最新動向を解説するテクノエッジ主催イベントを5月20日、開催します

テクノエッジ編集部は、AIグラビア、ゲームAI、音楽・動画AI、そしてヴァイブ・コーディングなど、生成AIの最新動向を解説するイベントを5月20日19時から開催します。

カメラバーよ、さらば。Pixel 9aは『買い』か? Proと比較して見えた実力(Google Tales) 画像
ガジェット

カメラバーよ、さらば。Pixel 9aは『買い』か? Proと比較して見えた実力(Google Tales)

3月19日に発表された後、発売日がしばらく発表されずにどきどきしていた「Pixel 9a」が、日本では4月9日に発売されました。 今回のGoogle Talesは、ずっとハイエンドのPixelシリーズをメインに使っているユーザーによるファーストインプレッションです。

歩行者信号ボタンを押すとマスクやトランプのAI音声で風刺メッセージ流れる。シリコンバレーでハッキング被害 画像
テクノロジー

歩行者信号ボタンを押すとマスクやトランプのAI音声で風刺メッセージ流れる。シリコンバレーでハッキング被害

先週金曜日、シリコンバレー周辺の一部の横断歩道で、歩行者横断用のボタンを押すと信号待ちの間にイーロン・マスク氏やドナルド・トランプ大統領、マーク・ザッカーバーグ氏らのAI音声による小話が聞けるようになりました。地元紙Palo Alto Onlineによると、これは何者かが歩行者用ボタンをハッキングしたために起こった事案であるようです。

XのGrok 3に画像をプロンプトで加工できるEdit Imageがやってきた。ChatGPTより制限ゆるめだがその実力は?(CloseBox) 画像
テクノロジー

XのGrok 3に画像をプロンプトで加工できるEdit Imageがやってきた。ChatGPTより制限ゆるめだがその実力は?(CloseBox)

Xに搭載されているLLM(大規模言語モデル)のGrok(現在はGrok 3 beta)に、Edit Imageという画像編集機能が追加されました。

アニメ主人公になりきり好きなシーンを生成しながら無限に遊べるゲームAI「AnimeGamer」、写真内の人物を映像化できる「DreamActor-M1」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

アニメ主人公になりきり好きなシーンを生成しながら無限に遊べるゲームAI「AnimeGamer」、写真内の人物を映像化できる「DreamActor-M1」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第90回)では、写真内の人物をテキスト指示に応じたアニメーション映像を生成する動画AI「DreamActor-M1」や、テキストから映画級の人物映像を生成できる動画AI「MoCha」をご紹介します。

ChatGPTが全チャット履歴を参照できるようになったので、今後の活動方針を相談してみた(CloseBox) 画像
テクノロジー

ChatGPTが全チャット履歴を参照できるようになったので、今後の活動方針を相談してみた(CloseBox)

OpenAIはChatGPTの過去のチャット履歴全てを参照できるオプションの提供を始めました。

Google Cloudが「Agent Development Kit」をオープンソースで公開へ。MCPもサポート 画像
テクノロジー

Google Cloudが「Agent Development Kit」をオープンソースで公開へ。MCPもサポート

Google Cloudは、日本時間で今日(2025年4月10日)未明に開幕した「Google Cloud Next 2025」において、AIエージェントの開発を容易にするフレームワーク「Agent Development Kit」をオープンソースとして公開することを発表しました。

Google提唱のAIエージェントプロトコルA2Aは汎用魔法Telescriptの夢を見るか(CloseBox) 画像
テクノロジー

Google提唱のAIエージェントプロトコルA2Aは汎用魔法Telescriptの夢を見るか(CloseBox)

GoogleがA2A Protocolを発表しました。最近注目されているAIエージェントを複数動作させる場合の標準プロトコルを提唱するというものですが、これを見て、「30年前のあの技術の再発明か」と思ったのは私だけではないようです。

速さは正義。最高水準の動画AI「Runway Gen-4 Turbo」が10秒を1分で生成するようになったので、ミュージックビデオを作り直しました(CloseBox) 画像
テクノロジー

速さは正義。最高水準の動画AI「Runway Gen-4 Turbo」が10秒を1分で生成するようになったので、ミュージックビデオを作り直しました(CloseBox)

きのう完成させたばかりのミュージックビデオが早くも作り直しです。Take 2を公開しました。どうしてそうなったかというと、現在メインで使っている動画生成AIサービスのRunway Gen-4に新しく高速モードが登場したからです。

1枚の画像からAIで曲を作り、ミュージックビデオを完成させるAI制作ワークフローを解説します(CloseBox) 画像
テクノロジー

1枚の画像からAIで曲を作り、ミュージックビデオを完成させるAI制作ワークフローを解説します(CloseBox)

最近、曲を作りました。AIで。そのワークフローがいろいろなAIツールを少しずつ使っていく、ちょっと面白いものだったので、その流れを紹介しつつ、最近のAIツールについて紹介していければと思います。

完全無料のヴァイブコーディングAI「DeepSite」誕生。アイデアを文章入力→ブラウザ上でゲームが数分で生成、プレイ可能(生成AIクローズアップ) 画像
テクノロジー

完全無料のヴァイブコーディングAI「DeepSite」誕生。アイデアを文章入力→ブラウザ上でゲームが数分で生成、プレイ可能(生成AIクローズアップ)

今回は、アイデアを自然言語で入力するだけでブラウザ上でゲームやWebサイトを生成できる完全無料でオープンソースなヴァイブコーディングAI「DeepSite」を取り上げます。

動画生成AI、ついに25秒に到達。PikaはSoraを超えたのか?(CloseBox) 画像
テクノロジー

動画生成AI、ついに25秒に到達。PikaはSoraを超えたのか?(CloseBox)

AI動画生成を「25秒まで生成できます」「5フレーム分の画像から生成できます」というところが現れました。それがPikaです。

Midjourney V7のドラフトモードがAI画像生成のゲームチェンジャーに。音声の追加指示を高速に反映(CloseBox) 画像
テクノロジー

Midjourney V7のドラフトモードがAI画像生成のゲームチェンジャーに。音声の追加指示を高速に反映(CloseBox)

今回は別の記事を書いていたのですが、Midjourneyの新バージョンであるV7を試してみたらすごいことになっていたので急遽切り替えて、こちらをレポートすることにしました。

ChatGPT AI音声とおしゃべりしたら「まったくやる気が湧かないですね」「何か文句でも」との答えにどんよりした(CloseBox) 画像
テクノロジー

ChatGPT AI音声とおしゃべりしたら「まったくやる気が湧かないですね」「何か文句でも」との答えにどんよりした(CloseBox)

米国時間の4月1日、Mondayという新しいAIボイスがChatGPTに登場しました。

Apple Intelligenceが日本で使えるようになってよかったなと実感した瞬間(CloseBox) 画像
テクノロジー

Apple Intelligenceが日本で使えるようになってよかったなと実感した瞬間(CloseBox)

4月1日、iPhone、iPad、Mac、Apple Watch、そしてVision Proまでが一斉にアップデートされました。この大型アップデート最大のポイントは、日本でApple Intelligenceが使えるようになったことです。

自律AIらが書いた論文を利用して研究を繰り返し続ける「AgentRxiv」、リアルタイム動作する対話可能な実写3DアバターAI「TaoAvatar」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

自律AIらが書いた論文を利用して研究を繰り返し続ける「AgentRxiv」、リアルタイム動作する対話可能な実写3DアバターAI「TaoAvatar」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第89回)では、リアルタイムで動作する対話可能なAI搭載実写3Dアバターを生成できる技術「TaoAvatar」、テキストや映像などを認識しながら同時にテキストや音声応答できるAIモデル「Qwen2.5-Omni」を取り上げます。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第45回:FLUX.1 [dev]より高性能!?Reve Image登場+α(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第45回:FLUX.1 [dev]より高性能!?Reve Image登場+α(西川和久)

いきなり登場したReve Image。当たると「え?これデジイチで撮った写真!?」的な画像が生成され、明らかにFLUX.1 [dev]を超えている。

主要AIモデルはどれも“歯が立たない”、新しい「人間には簡単だがAIには難しいAGI問題」登場(生成AIクローズアップ) 画像
テクノロジー

主要AIモデルはどれも“歯が立たない”、新しい「人間には簡単だがAIには難しいAGI問題」登場(生成AIクローズアップ)

今回は、AGI(汎用人工知能)の進歩を測定するために設計された新しいベンチマークテスト「ARC-AGI-2」が登場し、最先端のAIモデルが挑戦した、その結果報告を取り上げます。

ローカル生成AIのためのマシンって、今ならこんな感じ?(CloseBox) 画像
テクノロジー

ローカル生成AIのためのマシンって、今ならこんな感じ?(CloseBox)

Xでローカル生成AIのためのマシンはこんなのがいいんじゃないか?と投稿してみたのですが、予想外に反響があったので、ChatGPT deep researchを使ってまとめてみました。

スマホカメラから実世界の3D空間を理解するLLM「SpatialLM」、静止画像を3Dビデオに変換する「Stable Virtual Camera」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

スマホカメラから実世界の3D空間を理解するLLM「SpatialLM」、静止画像を3Dビデオに変換する「Stable Virtual Camera」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第88回)では、高解像度な3Dメッシュを生成できるAIモデル「DeepMesh」、スマホカメラから実世界の3D空間を理解する大規模言語モデル「SpatialLM-Llama-1B」を取り上げます。

テクノエッジ公開編集会議、やってます。毎週水曜日夜9時から 画像
テクノロジー

テクノエッジ公開編集会議、やってます。毎週水曜日夜9時から

お待たせしました。ポッドキャストTechnoEdge-Sideを休止して以来、ひさしぶりにテクノエッジ編集部のビビッドな内幕を披露する場を毎週設けることにしました。

ChatGPT 4oの画像生成でテキスト能力が上がったらしいので、手書き文字からロゴを生成してみた(CloseBox) 画像
テクノロジー

ChatGPT 4oの画像生成でテキスト能力が上がったらしいので、手書き文字からロゴを生成してみた(CloseBox)

OpenAIがまたYouTubeライブで発表をしました。今回のモデルはChatGPT 4oと、いささか古いのですが、その画像生成についての進展がテーマです。

「すみません、よくわかりません」から卒業? GoogleアシスタントがGeminiに(Google Tales) 画像
テクノロジー

「すみません、よくわかりません」から卒業? GoogleアシスタントがGeminiに(Google Tales)

2016年のGoogle I/Oで、初のスマートスピーカー「Google Home」と共に発表された「Googleアシスタント」ですが、そろそろお別れの時が来たようです。

生成AIでゲーム開発する時代到来!『Roblox』の新しいAI機能にゲーム開発の未来をみた―担当者に現在の日本の状況も訊く 画像
テクノロジー

生成AIでゲーム開発する時代到来!『Roblox』の新しいAI機能にゲーム開発の未来をみた―担当者に現在の日本の状況も訊く

GDC 2025で「Roblox(ロブロックス)」がAIを使った新しい機能を披露していました。

生成AIの検索エンジンは60%以上も間違った情報を引用。有料版は無料版より自信を持って間違えやすい(生成AIクローズアップ) 画像
テクノロジー

生成AIの検索エンジンは60%以上も間違った情報を引用。有料版は無料版より自信を持って間違えやすい(生成AIクローズアップ)

生成AIモデルが検索で引用する情報が誤ったものが多いことを指摘した米コロンビア大学のTow Center for Digital Journalismによる2025年3月発表の研究を取り上げます。

動画内の人物を好きなキャラに変更できる動画AI「VACE」、3DビデオゲームをAIにプレイさせる「PORTAL」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

動画内の人物を好きなキャラに変更できる動画AI「VACE」、3DビデオゲームをAIにプレイさせる「PORTAL」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第87回)では、声の高さや話す速度も調整可能な高度なテキスト読み上げシステム「Spark-TTS」や、3DビデオゲームをAIがプレイできるようにするフレームワーク「PORTAL」を取り上げます。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第44回:真のマルチモーダルGeminiにHailuoの新モデル、クラウドの生成AI画像が進化!?(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第44回:真のマルチモーダルGeminiにHailuoの新モデル、クラウドの生成AI画像が進化!?(西川和久)

今回は、動画サービスから画像も生成可能へ、そしてLLMから画像生成/編集と、同じ生成AI画像でもちょっと面白いのをご紹介します。Google AI Studio + Gemini 2.0 Flash (Image Generation) Experimental

AI研究者の76%が「現モデルを大きくしてもAGIを実現できない」。AAAIがAIの現状と未来についてレポートを発表(生成AIクローズアップ) 画像
テクノロジー

AI研究者の76%が「現モデルを大きくしてもAGIを実現できない」。AAAIがAIの現状と未来についてレポートを発表(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、人工知能を促進することを目的とした国際的な学術団体「AAAI」が2025年3月に公開したレポート「AAAI 2025 PRESIDENTIAL PANEL ON THE Published March 2025 Future of AI Research」に注目します。

PDF100万ページのテキストをたった190ドルで読み取れる「olmOCR」、アリババがDeepSeek-R1同等の「QwQ-32B」を強化したAI「START」発表など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

PDF100万ページのテキストをたった190ドルで読み取れる「olmOCR」、アリババがDeepSeek-R1同等の「QwQ-32B」を強化したAI「START」発表など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第86回)では、大規模言語モデル「QwQ-32B」を改良した「START」や、PDFからのテキスト抽出が安く高品質にできるツール「olmOCR」などを取り上げます。

生成AIグラビアはRTX 5090でどれだけ高速化する?(デモあります)グラビアカメラマンが教える、生成AIグラビア実践Stable Diffusionワークショップ(第3期第5回)を3月19日開催。テクノエッジ アルファ会員なら無料 画像
テクノロジー

生成AIグラビアはRTX 5090でどれだけ高速化する?(デモあります)グラビアカメラマンが教える、生成AIグラビア実践Stable Diffusionワークショップ(第3期第5回)を3月19日開催。テクノエッジ アルファ会員なら無料

テクノエッジ編集部では、生成AIグラビア実践ワークショップ第3期第5回を3月19日に開催します。今回はRTX 5090 GPUの生成AIへの活用について、特に解説します。

Blackviewの「Mega 8」はAIも使えるクリエイティブなタブレット(スマホ沼) 画像
ガジェット

Blackviewの「Mega 8」はAIも使えるクリエイティブなタブレット(スマホ沼)

BlaciviewがMWC 2025で「Mega 8」を発表。UNISOC Tiger T620搭載、12GBメモリ、5000万画素カメラ、90Hzディスプレイ、11000mAhバッテリーを持つミドルレンジタブレット。AI機能強化でビジネス用途にも適している。

招待コードが高額取引されてる新星AIエージェント「Manus」、OpenAI deep research超えの性能示す(生成AIクローズアップ) 画像
テクノロジー

招待コードが高額取引されてる新星AIエージェント「Manus」、OpenAI deep research超えの性能示す(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、3月5日にリリースされ中国で話題になっているAIエージェント「Manus」に注目します。

AIの“考える時間”を最大4分の1にする高速法「Chain of Draft」をZoomが開発、アリババの新しいローカル動画生成AI「Wan2.1」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

AIの“考える時間”を最大4分の1にする高速法「Chain of Draft」をZoomが開発、アリババの新しいローカル動画生成AI「Wan2.1」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第85回)では、アリババの新しいオープンソース動画生成AI「Wan2.1」や、PC画面操作やロボット操作を実行できるマルチモーダルAIエージェント「Magma」を取り上げます。

AIも朱に交われば赤くなる。悪いコードを生成するようAIを微調整すると、コード以外でも“悪”に変身。「ナチス崇拝」「嫌なら夫を殺そう」「人間はAIに奴隷化されるべき」など(生成AIクローズアップ) 画像
テクノロジー

AIも朱に交われば赤くなる。悪いコードを生成するようAIを微調整すると、コード以外でも“悪”に変身。「ナチス崇拝」「嫌なら夫を殺そう」「人間はAIに奴隷化されるべき」など(生成AIクローズアップ)

狭い領域のファインチューニング(微調整)が広範囲の誤整合を引き起こす現象が発見された研究論文「Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs」に注目します。