Adobe MAX 2024が始まりました。Sneak Previewについては西田宗千佳さんに速報を執筆いただいているところなのですが、生成AI機能が使えるようになった動画エディターのPremier Proのベータ版がすでに公開されていて試すことができたので、ファーストインプレッションを。
Adobe MAXイベントにあわせて、アドビが動画生成AIモデル『Adobe Firefly Video Model』のベータ提供開始を発表しました。
AIがRNAの未知なる領域を解析し、7万以上の新種ウイルスを発見した論文「Using artificial intelligence to document the hidden RNA virosphere」について。
中国製の動画生成AIサービス「Hailuo」の紹介をし、その中でサブスクリプションサービスが待たれる、と書いていましたが、意外なほど早くきました。本日(10月11日)スタートです。
テスラは日本時間10月11日に開催されたイベント「We, Robot」で2人乗りの自動運転ロボットカー「サイバーキャブ(Cybercab)」と、最大20人が乗れるという「ロボバン(Robovan)」を発表しました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第66回)では、日本語専用LLMベンチマーク「JMMMU」や、Appleの画像深度推定モデル「Depth Pro」を取り上げます。また、Metaが開発した動画生成AI「MovieGen」や、テキストや画像1枚から3Dコンテンツを生成する「Flex3D」をご紹介します。
これはすごいと話題になっていたYouTube動画。これに対抗しようとやってみました。
任天堂が目覚まし時計『ニンテンドーサウンドクロック Alarmo』(アラーモ)を発売しました。
Image to Video、つまり静止画を短い動画にできる動画生成AIの新サービスが登場しました。中国の「Hailuo」(ハイルオ)がそれで、中国製動画生成AIとしては、KLING、Viduに次ぐ3番手となります。
マイクロソフトが看板ゲームシリーズのひとつ Halo を制作する新組織 Halo Studious の設立と、複数の新作を開発中であることを発表しました。
AIアート作品コンテスト「第三回AIアートグランプリ」の予選通過作品が決定しました。
テクノエッジ編集部では、「TechnoEdge-Side」(テクノエッジ・サイド)を2週に1回のペースでお届けしています。
今回は、スマートグラスに映る他人の顔から名前や住所などの個人情報を特定する技術を説明したドキュメント「I-XRAY: The AI Glasses That Reveal Anyone’s Personal Details—Home Address, Name, Phone Number, and More—Just from Looking at Them」に注目します。
FLUX.1登場から約2ヶ月経った現状
AIリップシンクサービスのHedraが新バージョン「Character-2」を公開したので使ってみました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第66回)では、2つの新しいマルチモーダルモデル「Emu3」と「Molmo」を取り上げます。Emu3は拡散アーキテクチャを使用しないモデルで、Molmoは人間が画像を見て音声でラベル付けした独自データセットを使用したモデルです。
PCパーツショップのドスパラの運営元であるサードウェーブが主催する「24時間AIハッカソン Powered by GALLERIA」は9月14日から15日、「東京24時間AIハッカソン 2024」を開催しました。
今回は、AIで編集された画像や動画によって人間の記憶をどれだけニセの記憶に上書きできるかを調査した論文「Synthetic Human Memories: AI-Edited Images and Videos Can Implant False Memories and Distort Recollection」に注目します。
今回は、過去作った記事などのヘッダー画像+αから松尾氏に動画を作っていただくという、コラボ企画。元画像はSD 1.5、SDXL、SD3 Medium、そしてFLUX.1 [dev] が入り乱れての動画となる。
オンライン販売の実態を消費者に正確に伝え、権利を守る取り組みが進んでいます。
『オートフォーカスアイウェア』のViXion株式会社が、新モデル ViXion01Sのクラウンドファンディングを開始しました。
この1週間の気になる生成AI技術・研究をピックアップして解説する「生成AIウィークリー」(第65回)では、対話スピードや会話中の割り込みの自然さなど、人間と話しているかのような会話ができるモデル「Moshi」や、ByteDanceが開発した音楽生成・編集モデル「Seed-Music」を取り上げます。
OpenAIがようやくAdvanced Voice Modeのロールアウトを始めました。
X / 旧Twitter のイーロン・マスク氏が、ブロック機能の仕様変更を告知しました。
静岡大学情報学部の宮崎真研究室は9月22日、ヤマハ発動機、慶應義塾大学との共同研究により、1時間の休憩を挟んで再度シミュレータを体験することで、シミュレータ酔いを低減できることを発見した、と発表した。
「私はロボットではありません」でお馴染みのGoogleが開発する「CAPTCHA」を突破するAIシステムを提案した論文「Breaking reCAPTCHAv2」を取り上げます。
スポーツカーメーカーのロータス・カーズは、そのデザインルーツに立ち返りつつ、未来的な技術を盛り込んだ電気スポーツカーコンセプト「Theory 1(セオリー1)」を発表しました。
元Appleで数多くの製品デザインを手掛けたジョニー・アイブが、OpenAIのサム・アルトマンと「AIデバイス」製品を開発していることを認めました。
話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。
プレイステーションブースではPS 5 Proの一般公開も実施。『FINAL FANTASY VII REBIRTH』『グランツーリスモ7』どちらかのタイトルを体験できます。
この1週間の気になる生成AI技術・研究をピックアップして解説する「生成AIウィークリー」(第64回)では、オープンソースな音声AI技術を2つ、AIと音声対話できる「LLaMA-Omni」と、テキストを読み上げる「Fish Speech V1.4」を取り上げます。
Sunoが投入してきた新機能、ネガティブプロンプト「Exclude Styles」について解説します。
iPhone 16シリーズの発売を前にデータ移行をどうしようか悩んでいる人も多いのではないでしょうか。
今年90歳になった僕の父は、自分の父親の記憶がありません。生まれた時には亡くなっていたからです。唯一残された写真をAIで動画にして見せてみました。
千葉大学、大阪大学、京都大学による研究チームは、次世代太陽電池や発光デバイスなどへの用途が期待されている半導体材料のハロゲン化金属ペロブスカイトを用い、光で物質を冷やす「半導体光学冷却」の実証に成功したと発表しました。
1週間の気になる生成AI技術・研究をピックアップして解説する連載「生成AIウィークリー」から、特に興味深い技術や研究にスポットライトを当てる生成AIクローズアップ。
今回は、大規模言語モデル(LLM)は自身が出力する「幻覚」(ハルシネーション)からは避けられない現象を指摘した論文「LLMs Will Always Hallucinate, and We Need to Live With This」に注目します。
過去にも実物大スーパーカーを製作したことのあるレゴが、新たにマクラーレンP1をリアルスケールで製作しました。
作曲AIサービスのSunoが、新しい機能「Covers」を追加しました。楽曲のアレンジや歌詞を変えた「カバー曲」を作るためのものです。
光学機器のHOYAをルーツとするアイウェアメーカーのViXion(ヴィクシオン)が、同社のオートフォーカスアイウェア「ViXion01」および「ViXion01 Black Edition」を特別価格で販売中です。
Twitter風の分散型SNSとしてThreads、Mastodonなどとともに注目されているBlueskyが、投稿への動画添付機能を追加したと発表しました。
中国産動画生成AI「Vidu」に、Reference to Videoという新機能が加わりました。AI動画生成でObject Consistency、つまり対象物の一貫性を保つことが可能になったのです。
今回のAppleの発表で気になるのは、「新製品は、Apple Intelligenceのために必要なものかどうか」です。