Soraレベルの超高性能動画生成AI、Luma AIの「Dream Machine」に新しい機能が投入されました。プロンプトでの指定以外に、2枚の参照画像を入力し、それを始点と終点にできる、ある意味モーフィング的な機能です。
米国での発売から約5か月、Appleが「空間コンピュータ」こと Apple Vision Pro を日本国内で発売しました。
いずれ起きるかなと思っていた、米音楽業界団体からAI作曲サービスへの訴訟がついに来ました。
テクノエッジ編集部では、オンラインで生成AI画像の基本から最新テクニックまで、一線の講師から学べる『生成AIグラビア実践ワークショップ』の参加者を募集しています。次回(第2期第3回)は6月26日(水)開催です。
この1週間の気になる生成AI技術をピックアップして解説する、生成AIウィークリー(第52回)では、オープンソースで成長する動画生成AI「Open-Sora」の新バージョンや、精度の伸び代が見込まれるAIによる3Dメッシュ生成分野から「Unique3D」と「MeshAnything」を取り上げます。
来る7月11日、Appleの「空間コンピュータ」Vision Proがドレスコードのイベント『Vision Proパーティー3』(仮)を都内で開催します。
オーディオに合わせたリップシンクができる新しい技術が登場しました。「Hedra」という、これまで聞いたことのないサービスです。
人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第2期第2回を5月22日に開催いたします。なお、今回お申し込みいただいた方は、前回分の動画アーカイブを視聴いただけます。
SoraやKLINGレベルの「今使える代替動画生成AIサービス」として登場したLuma AIの「Dream Machine」が機能追加のアップデートしました。従来の5秒からのExtend(延長)が可能になりました。
ローカルPCで生成可能なStable Diffusion 3 Medium、遂に登場!
第51回の生成AIウィークリーでは、この1週間の興味深い生成AIに関する研究論文をピックアップし、解説します。特に注目したいのは、大規模言語モデル(LLM)の開発において、常識とされている行列乗算を排除するという「MatMul-Free LM」です。この研究は、GitHubにおいて2000件(執筆現在)のStarを獲得しており、注目されています。
スマートフォンは、個人の情報が詰まりまくったデバイスだ。メールやメッセージ、写真、検索履歴など、他人に見られたら恥ずかしいし、メッセージのキャプチャ画面が流出し、週刊誌に掲載されたりしたら、人生が一変する事だってあり得る。
テキストプロンプトからリアルな動きのある映像を生成できる動画生成AISora、KLINGが使えずにヤキモキしていた人々が大挙して押し寄せた「Luma Dream Machine」。このサービスの有償プランに申し込んで使ってみたので、その使い方のコツをお伝えします。
今使えるSoraのライバルが登場しました。
オーディオをアップロードして、そこから曲を拡張していく機能がようやくSunoでも使えるようになりました。
アップルが打ち出したAIフレームワーク「Apple Intelligence」ですが、個々の機能についてはわかるものの、全体像がつかみにくいものになっています。
来る2024年6月20日(木)、弊誌テクノエッジでは日本を代表するテクノロジージャーナリストの皆さんをお招きして、AppleとAIの最新動向を訊くイベント「WWDC24報告会&テクノエッジ パーティー」を都内で開催します。
Appleの開発者イベントWWDC24より。iPhoneは次期バージョンの iOS 18 から、標準の電話アプリで通話の録音機能に対応します。
アップルの開発者会議「WWDC24」基調講演の後半は、主要プラットフォームへの生成AI統合の話に終始しましたが、日本では来年になるまで使えません。
開発者イベントWWDC24で、Appleがうわさの独自AIシステム『Apple Intelligence』を発表しました。
サンフランシスコのスタートアップHumaneが開発した手のひら投影型AIデバイス「Ai Pin」に注目が集まっています。
かつて黒歴史として封印していた曲がカセットテープに残っていたのをAI作曲サービスUdioによって完成させたというお話です。
週次で生成AI関連技術5つを紹介する連載。中国のショート動画アプリ開発チーム「快手」が手がけるSoraに匹敵する動画生成AI「KLING」など。
Googleが久しぶりにわくわくするものを公開してくれました。その名は「NotebookLM」。Googleは“バーチャルリサーチアシスタント”だと紹介しています。
AI作曲サービスのUdioが、有償サブスクライバー向けに新機能「Audio uploads」を発表しました。ユーザーがオーディオクリップをアップロードし、それをプロンプトを使って前後に継ぎ足すことができるというものです。
Computex にあわせて、インテルが薄型ノートPC向けの次世代プロセッサ Lunar Lake の詳細を公開しました。
生成AIの重要論文5本を解説する連載。今週は、アニメの“中割り”を生成してアニメーションに仕上げる「ToonCrafter」、1枚の画像とモーションデータからダンス動画を生成するAIモデル「MusePose」など。
テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」(テクノエッジ・サイド)というチャンネルを設け、週1回のペースでお届けしています。
AI作曲の覇権を競うSunoとUdioが相次いで機能強化を発表しました。
アップルは、6月10日とだけ予告していた開発者イベントWWDC24の基調講演を、6月10日午前10時(太平洋夏時間)に開催すると発表しました。日本時間では6月11日午前2時から。発表の模様はアップルのウェブページ、YouTubeなどで視聴できます。
生成AIに関する重要論文を解説する連載。今回は、“文学作品”を翻訳する実際の出版社を真似たAI会社「TransAgents」、GPT-4で企業の財務諸表を分析し将来の利益を予測……など5本。
このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。
Minecraftをプレイするときに、AIアシスタント「Copilot」と会話できる機能をMicrosoftが発表しました。21日にSNSで公開された映像では、プレイヤーがCopilotにアイテム制作のアドバイスを求めたり、Copilotが脅威への対処法を知らせる様子が映されています。
Humaneは2023年11月、同社の最初で唯一の製品であるAI Pinを発表、2024年4月に出荷を開始し始めたばかりでしたが、新しい報道によると現在、会社の売却を検討しているとのことです。
中国国家サイバースペース管理局(CAC)は、習近平国家主席の思想と政治哲学に関する著書などでトレーニングされた大規模言語モデル(LLM)を搭載するAIシステムを開発しました。
現役グラビアカメラマンでありエンジニアでもある西川和久氏による生成AIグラビア連載の第25回は、画像生成と切っても切り離せないアップスケールの新技術編。
テクノエッジとして初となる紙の書籍「グラビアカメラマンが教える 生成AIグラビア実践ハンドブック」、5月26日から開催される技術書典に向けて無事入稿いたしました。
ハリウッドスターのスカーレット・ヨハンソンは、声の使用を断ったにもかかわらずOpenAIが「不気味なほど自分に似た」AI音声を発表したことに「ショックを受け、怒り」を覚えたと述べ、同社のサム・アルトマンCEOに対し「信じられない」とする声明を出しました。
Logic Pro 11の新機能として前回は1つのオーディオファイルを4つの楽器パートに分離する「Stem Splitter」を紹介しましたが、今回はその続きです。
Microsoftは5月20日(現地時間)、新しいPCカテゴリーとなる「Copilot+PCs」を発表。それにあわせて、Copilot+PCsで利用できる新機能としてRecall(日本語では「回顧」となっています)を発表しました。
マイクロソフトはクアルコム製のSnapdragon Xシリーズを搭載した第7世代Surface Laptopを発表しました。どちらも同社が提唱する新たなWindows PCカテゴリ「Copilot+ PC」に属します。
1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。今回は、GPU上でネイティブ動作する並列処理が可能な新プログラミング言語「Bend」とランタイムシステム「HVM2」、大規模言語モデルは追加学習や新知識で幻覚生成が増加。Googleなどが調査などを紹介。