OpenAIは5月22日、Appleの最高デザイン責任者だったジョニー・アイヴ率いるAIスタートアップ企業「io」を買収したと発表しました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第96回)では、参照音声だけで音声合成を生成できるTTSモデル「MiniMax-Speech」、自らアルゴリズムを発見して進化させ続けるAI「AlphaEvolve」を取り上げます。
PixelやGalaxyのレコーダー機能やiPhoneのボイスメモ、PLAUDなどのAI音声レコーダーなど録音・文字起こしのソリューションがどんどん増えてきています。
今回は、大規模言語モデル(LLM)を活用して日本の国会議員のこれまでの発言を分析して政治的立場をまとめた研究「KOKKAI DOC: An LLM-driven framework for scaling parliamentary representatives」を取り上げます。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第95回)では、“検索しない”AI検索エンジン「ZeroSearch」や、AI自身が学習効率の良いタスクを生成し自分で解くことで学習する外部データ不要のAIシステム「Absolute Zero」を取り上げます。
リファレンス画像を使用するComfyUI Workflowとは!?
楽天は、2025年5月15日に東京ドームで開催されたプロ野球「東北楽天ゴールデンイーグルス」の一軍公式戦を「楽天スーパーナイター」として冠協賛しました。
ソニーは、フラッグシップモデルの「Xperia 1 VII」を発表しました。
Alibaba CloudとMeltingHackが開催したゲーム開発ハッカソン、Tokyo Game Jam 2025 Spring のイベントリポートをお届けします。
東京証券取引所のスタンダード市場に上場しているインプレスホールディングスは5月13日、上場廃止を予定していることを発表しました。
日本時間5月13日午前2時よりYouTubeのAndroidチャンネルで配信したThe Android Show I/O Editionにて、GoogleはAndroid 16に関する新情報をいくつか発表しました。
今回は、チャットボットAIの精度が日進月歩で向上している一方で悪化している「幻覚」(ハルシネーション)の現状についてを取り上げたいと思います。
シャオミの新スポーツカー「SU7 Ultra」を試乗し、流線型ボディやカーボンファイバー製ステアリングを体験。内部はスポーティで、スマートフォンとの接続も簡単。日本発売は未定。
エルトン・ジョン、デュア・リパ、ポール・マッカートニー、イアン・マッケランといった、英国の著名なミュージシャンやアーティスト、作家など400人以上が署名した「AIからの著作権保護」を訴える公開書簡がキア・スターマー首相宛てに送付されました。
深センで無人タクシーを体験し、自動運転の利便性と不思議さを実感。周囲状況への反応が良好で、利用者に便利なサービスだが、道路環境の再設計も必要。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第94回)では、1ビットLLMの進化版「BitNet v2」と、AIに何度も自己議論させることで精度が向上していく手法「CoRT 」を取り上げます。
YuEやDiffRhythmなど、オープンソース版も充実してきた楽曲生成AIですが、また中国から新しいソフトが公開されました。「ACE-Step」は、英語、日本語を含む19言語の歌詞に対応し、Lyrics to Musicの生成が可能。
Google のスマートフォン Pixel 9a を「AIスマホ」として試してみました。
今回は、現在AIモデル評価の業界標準とされているランキング形式(リーダーボード)のAIベンチマーク「Chatbot Arena」における問題を明らかにした研究「The Leaderboard Illusion」を取り上げます。
高速でかつ長時間の動画生成が可能なオープンソースAI「FramePack」。Image to Videoで入力した画像から逆方向に生成していく仕組みですが、これを順方向。つまり、他の多くの動画生成AIと同じやり方で生成するオプション「F1」がサポートされました。
AI作曲サービスのSunoがひさびさの(2024年11月20日以来)メジャーバージョンアップを果たし、最新版はv4.5となりました。一度で生成できる楽曲の長さはなんと8分となります。そのほかにも改善点・新機能が多数。
最近のChatGPTが過度にユーザーを褒め称えたり、回答の正しさよりも迎合を優先すると批判が高まっていた件について。
HiDream-I1-FullとDevの違いは!?
OpenAIは、ChatGPTが18歳未満の未成年ユーザーとのチャットで性的に露骨な画像を生成したり、NFSWな会話を展開するのを制限するための修正を「積極的に行っている」と述べています。
Ginza Sony Parkにて4月20日から6月22日まで開催されます。一足先に展示内容をご紹介!
Google NotebookLMには、PDF、テキスト、YouTubeなどを読み込んで、その内容についてリアルな対話ポッドキャスト解説を生成する機能があります。2024年9月11日にローンチした時点では英語でしか使えなかったのですが、4月30日、ついに日本語対応しました。
AI企業OpenAIのCEOであるサム・アルトマン氏は、生成AIチャットボットサービス ChatGPTの標準モデルであるGPT-4oが「媚びへつらいすぎて気に障る(良い部分もあるが)」と述べ、早急に性格を修正する予定であることを明らかにしました。
高級オフィスチェアや家具、ゲーミングチェアで知られるハーマンミラーが25%オフセールを実施中です。
動画生成AIで、今回は3つの大きなニュースがあります。そのうち2つは前回お伝えした驚異的なオープンソース動画生成AI「FramePack」に関すること。
ANAは4月26日、ボーイング777型旅客機に新しい技術を導入した機体を就航させました。これは「AeroSHARK」という特別なフィルムで、なんとサメ肌の仕組みをヒントに開発されたもの。
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、GitHub上のリポジトリを自動的に解析し、ドキュメントを生成してくれるオープンソースAIツール「DeepWiki」を取り上げます。
「NVIDIA Gamer Day」の模様をお伝えしていきます!
韓国のスタートアップ「Newnal」が開発中のAIスマートフォンは、個人データを活用したアシスタント機能を備え、プライバシー保護にも配慮されている。2025年5月に発売予定。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第92回)では、ByteDanceが発表した2つのモデル、動画生成AI「Seaweed-7B」とGPT-4o超えという画像生成AI「Seedream 3.0」を取り上げます。
ロンドンで開催中のイベント Adobe MAX London 2025で、アドビがクリエイティブAIソリューション Firefly の最新アップデートを披露しました。
米司法省のGoogleに対する反トラスト法裁判に、証人として出廷したPerplexityの幹部、ドミトリー・シェベレンコ氏は、GoogleからChrome事業が分割されれば、喜んで買収を申し出るだろうと述べています。
4月18日に登場した、驚異的な動画生成AI「FramePack」。自宅のWindowsマシンにインストールして以来、RTX 4090で生成し続けています。最大2分間の一発生成も数回試してみて、わかったことがあります。
火曜日、ワシントンで行われたGoogleに対する反トラスト法裁判で、OpenAI幹部のニック・ターリー氏は、もしGoogleからChromeブラウザー事業が分割・売却されるならば、それを買収することに興味があると述べました。
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、AIモデルに「逆転裁判」をプレイさせて推論能力を調査した内容を取り上げます。
本日2本目のAI記事。ControlNet、WebUI Forge、Fooocusなど、画像生成AIソフトに多大な貢献をしてきたlllyasvielさんが、動画生成AIの新しいオープンソースソフト「FramePack」を公開しました。NVIDIA GPU専用ですが、WindowsとLinuxですぐに使えます。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第91回)では、複数の写真に写る被写体を1枚の写真に統合させる画像生成AI「UNO」や、1枚の写真から音声に応じた話す人物映像を作成するトーキングヘッド生成AI「FantasyTalking」を取り上げます。
オープンで高性能のHiDream-I1(サービス利用編)