AI

AIに繰り返し自己議論させる→考えが深くなり精度が向上する「CoRT 」、1ビットLLMの進化版「BitNet v2」登場など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

AIに繰り返し自己議論させる→考えが深くなり精度が向上する「CoRT 」、1ビットLLMの進化版「BitNet v2」登場など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第94回)では、1ビットLLMの進化版「BitNet v2」と、AIに何度も自己議論させることで精度が向上していく手法「CoRT 」を取り上げます。

日本語ボーカル曲をSuno並に高速生成できるオープンソース作曲AI「ACE-Step」が自分のPCでビュンビュン、Macでも動くのだ(CloseBox) 画像
AI

日本語ボーカル曲をSuno並に高速生成できるオープンソース作曲AI「ACE-Step」が自分のPCでビュンビュン、Macでも動くのだ(CloseBox)

YuEやDiffRhythmなど、オープンソース版も充実してきた楽曲生成AIですが、また中国から新しいソフトが公開されました。「ACE-Step」は、英語、日本語を含む19言語の歌詞に対応し、Lyrics to Musicの生成が可能。

Google Pixel 9a を「AIスマホ」として試す。AIでできること・上位モデルとの差 画像
スマートフォン

Google Pixel 9a を「AIスマホ」として試す。AIでできること・上位モデルとの差

Google のスマートフォン Pixel 9a を「AIスマホ」として試してみました。

鵜呑みにできない、AIモデルの世界評価ランキング「Chatbot Arena」の闇と幻想 不公平を解き明かす(生成AIクローズアップ) 画像
AI

鵜呑みにできない、AIモデルの世界評価ランキング「Chatbot Arena」の闇と幻想 不公平を解き明かす(生成AIクローズアップ)

今回は、現在AIモデル評価の業界標準とされているランキング形式(リーダーボード)のAIベンチマーク「Chatbot Arena」における問題を明らかにした研究「The Leaderboard Illusion」を取り上げます。

オープンソース動画生成AIの新標準「FramePack」が順方向生成「F1」サポートし、叡智も即対応。もはや普段使いできますね(CloseBox) 画像
AI

オープンソース動画生成AIの新標準「FramePack」が順方向生成「F1」サポートし、叡智も即対応。もはや普段使いできますね(CloseBox)

高速でかつ長時間の動画生成が可能なオープンソースAI「FramePack」。Image to Videoで入力した画像から逆方向に生成していく仕組みですが、これを順方向。つまり、他の多くの動画生成AIと同じやり方で生成するオプション「F1」がサポートされました。

AI作曲は最長8分の領域に。Sunoがv4.5で音質改善、プロンプト長5倍、歌唱力も向上(CloseBox) 画像
AI

AI作曲は最長8分の領域に。Sunoがv4.5で音質改善、プロンプト長5倍、歌唱力も向上(CloseBox)

AI作曲サービスのSunoがひさびさの(2024年11月20日以来)メジャーバージョンアップを果たし、最新版はv4.5となりました。一度で生成できる楽曲の長さはなんと8分となります。そのほかにも改善点・新機能が多数。

ChatGPTの媚びすぎ問題、利用者の「いいね」等に過剰反応が原因。GPT-4oモデル巻き戻しで対応、複数の個性から選択式へ 画像
AI

ChatGPTの媚びすぎ問題、利用者の「いいね」等に過剰反応が原因。GPT-4oモデル巻き戻しで対応、複数の個性から選択式へ

最近のChatGPTが過度にユーザーを褒め称えたり、回答の正しさよりも迎合を優先すると批判が高まっていた件について。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第47回:HiDream-I1-Full/Devをローカル生成+α(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第47回:HiDream-I1-Full/Devをローカル生成+α(西川和久)

HiDream-I1-FullとDevの違いは!?

OpenAI、ChatGPTが未成年ユーザの猥談相手になってしまう「バグ」を修正へ 画像
AI

OpenAI、ChatGPTが未成年ユーザの猥談相手になってしまう「バグ」を修正へ

OpenAIは、ChatGPTが18歳未満の未成年ユーザーとのチャットで性的に露骨な画像を生成したり、NFSWな会話を展開するのを制限するための修正を「積極的に行っている」と述べています。

ついにやってきた日本人対話型ポッドキャスト量産システム。NotebookLM使えばなんでもポッドキャストになる(CloseBox) 画像
AI

ついにやってきた日本人対話型ポッドキャスト量産システム。NotebookLM使えばなんでもポッドキャストになる(CloseBox)

Google NotebookLMには、PDF、テキスト、YouTubeなどを読み込んで、その内容についてリアルな対話ポッドキャスト解説を生成する機能があります。2024年9月11日にローンチした時点では英語でしか使えなかったのですが、4月30日、ついに日本語対応しました。

サム・アルトマン、ChatGPTのGPT-4oは「媚びへつらいすぎて不快」 性格を修正予定。将来的にはAI人格の選択肢も(更新:ロールバック対応) 画像
AI

サム・アルトマン、ChatGPTのGPT-4oは「媚びへつらいすぎて不快」 性格を修正予定。将来的にはAI人格の選択肢も(更新:ロールバック対応)

AI企業OpenAIのCEOであるサム・アルトマン氏は、生成AIチャットボットサービス ChatGPTの標準モデルであるGPT-4oが「媚びへつらいすぎて気に障る(良い部分もあるが)」と述べ、早急に性格を修正する予定であることを明らかにしました。

驚異のオープンソース動画生成AI「FramePack」がMacでも使える。Vidu Q1とFramePack叡智の合わせ技も試した(CloseBox) 画像
AI

驚異のオープンソース動画生成AI「FramePack」がMacでも使える。Vidu Q1とFramePack叡智の合わせ技も試した(CloseBox)

動画生成AIで、今回は3つの大きなニュースがあります。そのうち2つは前回お伝えした驚異的なオープンソース動画生成AI「FramePack」に関すること。

GitHubリポジトリを読み取り、ドキュメントを自動生成するAIツール「DeepWiki」がログイン不要、無料で使える(生成AIクローズアップ) 画像
AI

GitHubリポジトリを読み取り、ドキュメントを自動生成するAIツール「DeepWiki」がログイン不要、無料で使える(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、GitHub上のリポジトリを自動的に解析し、ドキュメントを生成してくれるオープンソースAIツール「DeepWiki」を取り上げます。

スペックと電力効率を両立!「NVIDIA Gamer Day」で見えたGeForce RTX 50シリーズ×ノートPCの可能性【イベントレポ】 画像
PC

スペックと電力効率を両立!「NVIDIA Gamer Day」で見えたGeForce RTX 50シリーズ×ノートPCの可能性【イベントレポ】

「NVIDIA Gamer Day」の模様をお伝えしていきます!

画面に自分の分身が鎮座する謎スマホ「Newnal」は全個人情報を知る真のAIアシスタント(AIスマホ沼) 画像
AI

画面に自分の分身が鎮座する謎スマホ「Newnal」は全個人情報を知る真のAIアシスタント(AIスマホ沼)

韓国のスタートアップ「Newnal」が開発中のAIスマートフォンは、個人データを活用したアシスタント機能を備え、プライバシー保護にも配慮されている。2025年5月に発売予定。

“1分の生成映像でも破綻しにくくする”動画AI向け強化技術「FramePack」の原理、AIと人間の声を区別できるか600人以上で実験など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

“1分の生成映像でも破綻しにくくする”動画AI向け強化技術「FramePack」の原理、AIと人間の声を区別できるか600人以上で実験など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第92回)では、ByteDanceが発表した2つのモデル、動画生成AI「Seaweed-7B」とGPT-4o超えという画像生成AI「Seedream 3.0」を取り上げます。

Adobe Fireflyが大幅強化、GoogleやOpenAI・Flux他の生成AIモデルも統合。モバイルアプリも近日提供 画像
AI

Adobe Fireflyが大幅強化、GoogleやOpenAI・Flux他の生成AIモデルも統合。モバイルアプリも近日提供

ロンドンで開催中のイベント Adobe MAX London 2025で、アドビがクリエイティブAIソリューション Firefly の最新アップデートを披露しました。

AI検索のPerplexityもGoogleからChrome事業が分割なら「喜んで買収する」と名乗り 画像
Other

AI検索のPerplexityもGoogleからChrome事業が分割なら「喜んで買収する」と名乗り

米司法省のGoogleに対する反トラスト法裁判に、証人として出廷したPerplexityの幹部、ドミトリー・シェベレンコ氏は、GoogleからChrome事業が分割されれば、喜んで買収を申し出るだろうと述べています。

FramePackがAI動画の長さ制限を取り払った。では次の課題は何か? 4分間のAI動画を自分のPCで一発生成して気づいたこと(CloseBox) 画像
AI

FramePackがAI動画の長さ制限を取り払った。では次の課題は何か? 4分間のAI動画を自分のPCで一発生成して気づいたこと(CloseBox)

4月18日に登場した、驚異的な動画生成AI「FramePack」。自宅のWindowsマシンにインストールして以来、RTX 4090で生成し続けています。最大2分間の一発生成も数回試してみて、わかったことがあります。

OpenAI幹部、GoogleのChrome事業が・売却されれば買収に興味ありと述べる 画像
Other

OpenAI幹部、GoogleのChrome事業が・売却されれば買収に興味ありと述べる

火曜日、ワシントンで行われたGoogleに対する反トラスト法裁判で、OpenAI幹部のニック・ターリー氏は、もしGoogleからChromeブラウザー事業が分割・売却されるならば、それを買収することに興味があると述べました。

AIに「逆転裁判」をプレイさせ、推論能力が一番高かったのはどのLLM?(生成AIクローズアップ) 画像
AI

AIに「逆転裁判」をプレイさせ、推論能力が一番高かったのはどのLLM?(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、AIモデルに「逆転裁判」をプレイさせて推論能力を調査した内容を取り上げます。

1分超えたいなら動画生成はローカルAIを選べ。6GB VRAMでも動くオープンソースAI「FramePack」の実力は本物か、試してみた(CloseBox) 画像
AI

1分超えたいなら動画生成はローカルAIを選べ。6GB VRAMでも動くオープンソースAI「FramePack」の実力は本物か、試してみた(CloseBox)

本日2本目のAI記事。ControlNet、WebUI Forge、Fooocusなど、画像生成AIソフトに多大な貢献をしてきたlllyasvielさんが、動画生成AIの新しいオープンソースソフト「FramePack」を公開しました。NVIDIA GPU専用ですが、WindowsとLinuxですぐに使えます。

複雑なキャラの高品質なSVG画像を生成するAI「OmniSVG」、異なる写真同士を合体生成する「UNO」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

複雑なキャラの高品質なSVG画像を生成するAI「OmniSVG」、異なる写真同士を合体生成する「UNO」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第91回)では、複数の写真に写る被写体を1枚の写真に統合させる画像生成AI「UNO」や、1枚の写真から音声に応じた話す人物映像を作成するトーキングヘッド生成AI「FantasyTalking」を取り上げます。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第46回:遂にオープンでFLUX.1 [dev]を超える!? HiDream-I1登場(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第46回:遂にオープンでFLUX.1 [dev]を超える!? HiDream-I1登場(西川和久)

オープンで高性能のHiDream-I1(サービス利用編)

まるで映画「ブレードランナー」のあのシーン。古い写真の撮影場所をChatGPT o3が12分かけて特定したそのやり方がすごい(CloseBox) 画像
AI

まるで映画「ブレードランナー」のあのシーン。古い写真の撮影場所をChatGPT o3が12分かけて特定したそのやり方がすごい(CloseBox)

OpenAIのChatGPT o3とo4-mini、o4-mini-highが投入されてすぐに試したのは、o3による音楽解析でした。その日のうちにもう1つ、試してみたので今回はそちらをご報告します。それは、写真分析です。

ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に(CloseBox) 画像
AI

ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に(CloseBox)

OpenAIがChatGPTのLLM(大規模言語モデル)の新モデル、o3とo4-mini、o4-mini、o4-mini-highを公開しました。現在ではPlus、Pro、Teamユーザーが使えます。

AIは人間に不信感を抱いてる? AIが人間の本質をどのように捉えているかを調査した研究(生成AIクローズアップ) 画像
AI

AIは人間に不信感を抱いてる? AIが人間の本質をどのように捉えているかを調査した研究(生成AIクローズアップ)

今回は、大規模言語モデル(LLM)が人間の本質をどのように捉えているかを調査した論文「Measurement of LLM’s Philosophies of Human Nature」を取り上げます。

Googleの最先端動画生成AI「Veo 2」がGemini Advancedでロールアウト。そして偽サイトには騙されないように(CloseBox) 画像
AI

Googleの最先端動画生成AI「Veo 2」がGemini Advancedでロールアウト。そして偽サイトには騙されないように(CloseBox)

一部ユーザーにのみ開放され、それ以外の人はウェイティングリストに登録するだけ……そんな状態が続いていたGoogleの動画生成AIサービス「Veo 2」が、Gemini Advancedでロールアウト開始しました。

AIグラビアからヴァイブコーディングまで、生成AIの最新動向を解説するテクノエッジ主催イベントを5月20日、開催します 画像
AI

AIグラビアからヴァイブコーディングまで、生成AIの最新動向を解説するテクノエッジ主催イベントを5月20日、開催します

テクノエッジ編集部は、AIグラビア、ゲームAI、音楽・動画AI、そしてヴァイブ・コーディングなど、生成AIの最新動向を解説するイベントを5月20日19時から開催します。

歩行者信号ボタンを押すとマスクやトランプのAI音声で風刺メッセージ流れる。シリコンバレーでハッキング被害 画像
AI

歩行者信号ボタンを押すとマスクやトランプのAI音声で風刺メッセージ流れる。シリコンバレーでハッキング被害

先週金曜日、シリコンバレー周辺の一部の横断歩道で、歩行者横断用のボタンを押すと信号待ちの間にイーロン・マスク氏やドナルド・トランプ大統領、マーク・ザッカーバーグ氏らのAI音声による小話が聞けるようになりました。地元紙Palo Alto Onlineによると、これは何者かが歩行者用ボタンをハッキングしたために起こった事案であるようです。

XのGrok 3に画像をプロンプトで加工できるEdit Imageがやってきた。ChatGPTより制限ゆるめだがその実力は?(CloseBox) 画像
AI

XのGrok 3に画像をプロンプトで加工できるEdit Imageがやってきた。ChatGPTより制限ゆるめだがその実力は?(CloseBox)

Xに搭載されているLLM(大規模言語モデル)のGrok(現在はGrok 3 beta)に、Edit Imageという画像編集機能が追加されました。

アニメ主人公になりきり好きなシーンを生成しながら無限に遊べるゲームAI「AnimeGamer」、写真内の人物を映像化できる「DreamActor-M1」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

アニメ主人公になりきり好きなシーンを生成しながら無限に遊べるゲームAI「AnimeGamer」、写真内の人物を映像化できる「DreamActor-M1」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第90回)では、写真内の人物をテキスト指示に応じたアニメーション映像を生成する動画AI「DreamActor-M1」や、テキストから映画級の人物映像を生成できる動画AI「MoCha」をご紹介します。

ChatGPTが全チャット履歴を参照できるようになったので、今後の活動方針を相談してみた(CloseBox) 画像
AI

ChatGPTが全チャット履歴を参照できるようになったので、今後の活動方針を相談してみた(CloseBox)

OpenAIはChatGPTの過去のチャット履歴全てを参照できるオプションの提供を始めました。

Google Cloudが「Agent Development Kit」をオープンソースで公開へ。MCPもサポート 画像
AI

Google Cloudが「Agent Development Kit」をオープンソースで公開へ。MCPもサポート

Google Cloudは、日本時間で今日(2025年4月10日)未明に開幕した「Google Cloud Next 2025」において、AIエージェントの開発を容易にするフレームワーク「Agent Development Kit」をオープンソースとして公開することを発表しました。

Google提唱のAIエージェントプロトコルA2Aは汎用魔法Telescriptの夢を見るか(CloseBox) 画像
AI

Google提唱のAIエージェントプロトコルA2Aは汎用魔法Telescriptの夢を見るか(CloseBox)

GoogleがA2A Protocolを発表しました。最近注目されているAIエージェントを複数動作させる場合の標準プロトコルを提唱するというものですが、これを見て、「30年前のあの技術の再発明か」と思ったのは私だけではないようです。

速さは正義。最高水準の動画AI「Runway Gen-4 Turbo」が10秒を1分で生成するようになったので、ミュージックビデオを作り直しました(CloseBox) 画像
AI

速さは正義。最高水準の動画AI「Runway Gen-4 Turbo」が10秒を1分で生成するようになったので、ミュージックビデオを作り直しました(CloseBox)

きのう完成させたばかりのミュージックビデオが早くも作り直しです。Take 2を公開しました。どうしてそうなったかというと、現在メインで使っている動画生成AIサービスのRunway Gen-4に新しく高速モードが登場したからです。

1枚の画像からAIで曲を作り、ミュージックビデオを完成させるAI制作ワークフローを解説します(CloseBox) 画像
AI

1枚の画像からAIで曲を作り、ミュージックビデオを完成させるAI制作ワークフローを解説します(CloseBox)

最近、曲を作りました。AIで。そのワークフローがいろいろなAIツールを少しずつ使っていく、ちょっと面白いものだったので、その流れを紹介しつつ、最近のAIツールについて紹介していければと思います。

完全無料のヴァイブコーディングAI「DeepSite」誕生。アイデアを文章入力→ブラウザ上でゲームが数分で生成、プレイ可能(生成AIクローズアップ) 画像
AI

完全無料のヴァイブコーディングAI「DeepSite」誕生。アイデアを文章入力→ブラウザ上でゲームが数分で生成、プレイ可能(生成AIクローズアップ)

今回は、アイデアを自然言語で入力するだけでブラウザ上でゲームやWebサイトを生成できる完全無料でオープンソースなヴァイブコーディングAI「DeepSite」を取り上げます。

動画生成AI、ついに25秒に到達。PikaはSoraを超えたのか?(CloseBox) 画像
AI

動画生成AI、ついに25秒に到達。PikaはSoraを超えたのか?(CloseBox)

AI動画生成を「25秒まで生成できます」「5フレーム分の画像から生成できます」というところが現れました。それがPikaです。

Midjourney V7のドラフトモードがAI画像生成のゲームチェンジャーに。音声の追加指示を高速に反映(CloseBox) 画像
AI

Midjourney V7のドラフトモードがAI画像生成のゲームチェンジャーに。音声の追加指示を高速に反映(CloseBox)

今回は別の記事を書いていたのですが、Midjourneyの新バージョンであるV7を試してみたらすごいことになっていたので急遽切り替えて、こちらをレポートすることにしました。

ChatGPT AI音声とおしゃべりしたら「まったくやる気が湧かないですね」「何か文句でも」との答えにどんよりした(CloseBox) 画像
AI

ChatGPT AI音声とおしゃべりしたら「まったくやる気が湧かないですね」「何か文句でも」との答えにどんよりした(CloseBox)

米国時間の4月1日、Mondayという新しいAIボイスがChatGPTに登場しました。

Apple Intelligenceが日本で使えるようになってよかったなと実感した瞬間(CloseBox) 画像
AI

Apple Intelligenceが日本で使えるようになってよかったなと実感した瞬間(CloseBox)

4月1日、iPhone、iPad、Mac、Apple Watch、そしてVision Proまでが一斉にアップデートされました。この大型アップデート最大のポイントは、日本でApple Intelligenceが使えるようになったことです。

  • 839件中 1 - 42 件を表示
  • 次へ