AI

Soraレベルの超高性能動画生成Luma AI「Dream Machine」が2枚の元絵指定できる「キーフレーム」機能追加。弱点の「別人化問題」がこれで解消するか、試してみた(CloseBox) 画像
AI

Soraレベルの超高性能動画生成Luma AI「Dream Machine」が2枚の元絵指定できる「キーフレーム」機能追加。弱点の「別人化問題」がこれで解消するか、試してみた(CloseBox)

Soraレベルの超高性能動画生成AI、Luma AIの「Dream Machine」に新しい機能が投入されました。プロンプトでの指定以外に、2枚の参照画像を入力し、それを始点と終点にできる、ある意味モーフィング的な機能です。

Apple Vision Pro本日発売、約60万円からの「空間コンピュータ」。体験デモも予約可能 画像
XR / VR / AR

Apple Vision Pro本日発売、約60万円からの「空間コンピュータ」。体験デモも予約可能

米国での発売から約5か月、Appleが「空間コンピュータ」こと Apple Vision Pro を日本国内で発売しました。

米国の主要レコード会社がAI作曲サービスSunoとUdioを提訴。訴訟の根拠となったヒット曲再現プロンプトを検証してみる(CloseBox) 画像
AI

米国の主要レコード会社がAI作曲サービスSunoとUdioを提訴。訴訟の根拠となったヒット曲再現プロンプトを検証してみる(CloseBox)

いずれ起きるかなと思っていた、米音楽業界団体からAI作曲サービスへの訴訟がついに来ました。

6月26日開催!『生成AIグラビア実践ワークショップ』オンライン受講者を募集中 画像
AI

6月26日開催!『生成AIグラビア実践ワークショップ』オンライン受講者を募集中

テクノエッジ編集部では、オンラインで生成AI画像の基本から最新テクニックまで、一線の講師から学べる『生成AIグラビア実践ワークショップ』の参加者を募集しています。次回(第2期第3回)は6月26日(水)開催です。

プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する、生成AIウィークリー(第52回)では、オープンソースで成長する動画生成AI「Open-Sora」の新バージョンや、精度の伸び代が見込まれるAIによる3Dメッシュ生成分野から「Unique3D」と「MeshAnything」を取り上げます。

祝国内発売!『Vision Proパーティー3』(仮)を7月11日に開催決定。参加者を募集します 画像
XR / VR / AR

祝国内発売!『Vision Proパーティー3』(仮)を7月11日に開催決定。参加者を募集します

来る7月11日、Appleの「空間コンピュータ」Vision Proがドレスコードのイベント『Vision Proパーティー3』(仮)を都内で開催します。

新世代AIリップシンク対決。感情豊かで高速な「Hedra Character-1」とオープンソースだがNVIDIA GPU必須「Hallo」。どっちが使い物になるか試してみた結果(CloseBox) 画像
AI

新世代AIリップシンク対決。感情豊かで高速な「Hedra Character-1」とオープンソースだがNVIDIA GPU必須「Hallo」。どっちが使い物になるか試してみた結果(CloseBox)

オーディオに合わせたリップシンクができる新しい技術が登場しました。「Hedra」という、これまで聞いたことのないサービスです。

最新のSD3解説も。画像生成AI「Stable Diffusion」の基本から最新技術まで学べる。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第2期第3回)を6月26日開催。参加者募集します 画像
AI

最新のSD3解説も。画像生成AI「Stable Diffusion」の基本から最新技術まで学べる。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第2期第3回)を6月26日開催。参加者募集します

人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第2期第2回を5月22日に開催いたします。なお、今回お申し込みいただいた方は、前回分の動画アーカイブを視聴いただけます。

直感的コントロールも予告した話題の高性能動画AI、Luma AI「Dream Machine」、10秒以上の動画生成が可能になったので試してみた(CloseBox) 画像
AI

直感的コントロールも予告した話題の高性能動画AI、Luma AI「Dream Machine」、10秒以上の動画生成が可能になったので試してみた(CloseBox)

SoraやKLINGレベルの「今使える代替動画生成AIサービス」として登場したLuma AIの「Dream Machine」が機能追加のアップデートしました。従来の5秒からのExtend(延長)が可能になりました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第26回:ローカルで使えるSD3 Mediumリリース!実力を試す(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第26回:ローカルで使えるSD3 Mediumリリース!実力を試す(西川和久)

ローカルPCで生成可能なStable Diffusion 3 Medium、遂に登場!

画像内キャラに楽曲を歌わせる「Hallo」、“行列の掛け算なし”にLLMの開発が可能な「MatMul-Free LM」など重要論文5本を解説(生成AIウィークリー) 画像
AI

画像内キャラに楽曲を歌わせる「Hallo」、“行列の掛け算なし”にLLMの開発が可能な「MatMul-Free LM」など重要論文5本を解説(生成AIウィークリー)

第51回の生成AIウィークリーでは、この1週間の興味深い生成AIに関する研究論文をピックアップし、解説します。特に注目したいのは、大規模言語モデル(LLM)の開発において、常識とされている行列乗算を排除するという「MatMul-Free LM」です。この研究は、GitHubにおいて2000件(執筆現在)のStarを獲得しており、注目されています。

iOS 18「非表示のアプリ」そしてプライベートクラウド。WWDC24で見たアップルがプライバシーを守れる理由 (石川温) 画像
スマートフォン

iOS 18「非表示のアプリ」そしてプライベートクラウド。WWDC24で見たアップルがプライバシーを守れる理由 (石川温)

 スマートフォンは、個人の情報が詰まりまくったデバイスだ。メールやメッセージ、写真、検索履歴など、他人に見られたら恥ずかしいし、メッセージのキャプチャ画面が流出し、週刊誌に掲載されたりしたら、人生が一変する事だってあり得る。

もうSoraは不要なのか。動画生成AIの新基準、Luma AI「Dream Machine」をサブスクしてわかった「ハリー・ポッターに出てくるような魔法」の使いこなし術(CloseBox) 画像
AI

もうSoraは不要なのか。動画生成AIの新基準、Luma AI「Dream Machine」をサブスクしてわかった「ハリー・ポッターに出てくるような魔法」の使いこなし術(CloseBox)

テキストプロンプトからリアルな動きのある映像を生成できる動画生成AISora、KLINGが使えずにヤキモキしていた人々が大挙して押し寄せた「Luma Dream Machine」。このサービスの有償プランに申し込んで使ってみたので、その使い方のコツをお伝えします。

今そこにあるSora、現時点最高クラスの誰でも使える動画生成AI「Luma Dream Machine」が人気すぎて数時間の待ち行列(CloseBox) 画像
AI

今そこにあるSora、現時点最高クラスの誰でも使える動画生成AI「Luma Dream Machine」が人気すぎて数時間の待ち行列(CloseBox)

今使えるSoraのライバルが登場しました。

短い演奏・歌を十数秒で4分の完成曲に。作曲AIが未完成曲をフィニッシュするSunoの新機能を試して見つけた黄金パターン(CloseBox) 画像
AI

短い演奏・歌を十数秒で4分の完成曲に。作曲AIが未完成曲をフィニッシュするSunoの新機能を試して見つけた黄金パターン(CloseBox)

オーディオをアップロードして、そこから曲を拡張していく機能がようやくSunoでも使えるようになりました。

Apple Intelligenceはどのように開発されたのか? 中核をなすオンデバイスAIモデルとPrivate Cloud Computeについて今わかっていること(CloseBox) 画像
AI

Apple Intelligenceはどのように開発されたのか? 中核をなすオンデバイスAIモデルとPrivate Cloud Computeについて今わかっていること(CloseBox)

アップルが打ち出したAIフレームワーク「Apple Intelligence」ですが、個々の機能についてはわかるものの、全体像がつかみにくいものになっています。

イベント告知:アップルのAI『Appleインテリジェンス』が分かるWWDC24報告会&テクノエッジ パーティーを6月20日(木)開催。参加者募集 画像
AI

イベント告知:アップルのAI『Appleインテリジェンス』が分かるWWDC24報告会&テクノエッジ パーティーを6月20日(木)開催。参加者募集

来る2024年6月20日(木)、弊誌テクノエッジでは日本を代表するテクノロジージャーナリストの皆さんをお招きして、AppleとAIの最新動向を訊くイベント「WWDC24報告会&テクノエッジ パーティー」を都内で開催します。

iPhoneの電話アプリが通話録音に対応、AIで書き起こし・要約も生成。iOS 18のApple Intelligenceで 画像
AI

iPhoneの電話アプリが通話録音に対応、AIで書き起こし・要約も生成。iOS 18のApple Intelligenceで

Appleの開発者イベントWWDC24より。iPhoneは次期バージョンの iOS 18 から、標準の電話アプリで通話の録音機能に対応します。

本来あるべきSiri、AIを統合したOS。Apple Intelligenceの未来を見た僕がCopilot+ PCの検討を始めた理由(CloseBox) 画像
AI

本来あるべきSiri、AIを統合したOS。Apple Intelligenceの未来を見た僕がCopilot+ PCの検討を始めた理由(CloseBox)

アップルの開発者会議「WWDC24」基調講演の後半は、主要プラットフォームへの生成AI統合の話に終始しましたが、日本では来年になるまで使えません。

アップルのAI『Apple Intelligence』まとめ。ChatGPTもOS統合 iPhone 15 ProかM1以降必須 画像
AI

アップルのAI『Apple Intelligence』まとめ。ChatGPTもOS統合 iPhone 15 ProかM1以降必須

開発者イベントWWDC24で、Appleがうわさの独自AIシステム『Apple Intelligence』を発表しました。

手のひら投影AIデバイス「Humane Ai Pin」はGTP-4oとGemini両刀使い。アップデートされた使い勝手をチェックした 画像
AI

手のひら投影AIデバイス「Humane Ai Pin」はGTP-4oとGemini両刀使い。アップデートされた使い勝手をチェックした

サンフランシスコのスタートアップHumaneが開発した手のひら投影型AIデバイス「Ai Pin」に注目が集まっています。

42年前に封印せし我が駄曲よ、AI神Udioの力にて完全体となり、いま甦らん(CloseBox) 画像
AI

42年前に封印せし我が駄曲よ、AI神Udioの力にて完全体となり、いま甦らん(CloseBox)

かつて黒歴史として封印していた曲がカセットテープに残っていたのをAI作曲サービスUdioによって完成させたというお話です。

中国AIが加速。Soraに匹敵する中国の動画生成AI「KLING」、中国アリババの最新オープンLLM「Qwen 2」登場など生成AI関連技術5つを紹介(生成AIウィークリー) 画像
AI

中国AIが加速。Soraに匹敵する中国の動画生成AI「KLING」、中国アリババの最新オープンLLM「Qwen 2」登場など生成AI関連技術5つを紹介(生成AIウィークリー)

週次で生成AI関連技術5つを紹介する連載。中国のショート動画アプリ開発チーム「快手」が手がけるSoraに匹敵する動画生成AI「KLING」など。

超長くてたくさんの資料も放り込めば、まとめてブレストにも付き合ってくれる有能助手「NotebookLM」の始め方(Google Tales) 画像
AI

超長くてたくさんの資料も放り込めば、まとめてブレストにも付き合ってくれる有能助手「NotebookLM」の始め方(Google Tales)

Googleが久しぶりにわくわくするものを公開してくれました。その名は「NotebookLM」。Googleは“バーチャルリサーチアシスタント”だと紹介しています。

AI作曲サービスのUdio、アップロードした音楽を前後に拡張できる新機能「Audio uploads」でSunoを出し抜く(CloseBox) 画像
AI

AI作曲サービスのUdio、アップロードした音楽を前後に拡張できる新機能「Audio uploads」でSunoを出し抜く(CloseBox)

AI作曲サービスのUdioが、有償サブスクライバー向けに新機能「Audio uploads」を発表しました。ユーザーがオーディオクリップをアップロードし、それをプロンプトを使って前後に継ぎ足すことができるというものです。

インテル、次世代Core UltraプロセッサLunar Lake詳細発表。計120TOPS AI PC性能でCopilot+ PC対応、CPU・GPUも刷新 画像
PC

インテル、次世代Core UltraプロセッサLunar Lake詳細発表。計120TOPS AI PC性能でCopilot+ PC対応、CPU・GPUも刷新

Computex にあわせて、インテルが薄型ノートPC向けの次世代プロセッサ Lunar Lake の詳細を公開しました。

動画AIが豊作。アニメ絵2枚の間の“中割り”を生成し映像化するAI「ToonCrafter」、画像内キャラを滑らかに踊らせるAI「MusePose」など重要論文5本を解説(生成AIウィークリー) 画像
AI

動画AIが豊作。アニメ絵2枚の間の“中割り”を生成し映像化するAI「ToonCrafter」、画像内キャラを滑らかに踊らせるAI「MusePose」など重要論文5本を解説(生成AIウィークリー)

生成AIの重要論文5本を解説する連載。今週は、アニメの“中割り”を生成してアニメーションに仕上げる「ToonCrafter」、1枚の画像とモーションデータからダンス動画を生成するAIモデル「MusePose」など。

Copilot+ PCについて語ったポッドキャスト第56回を配信(TechnoEdge-Side) 画像
AI

Copilot+ PCについて語ったポッドキャスト第56回を配信(TechnoEdge-Side)

テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」(テクノエッジ・サイド)というチャンネルを設け、週1回のペースでお届けしています。

AI作曲サービスは「長さ」の戦いに。Udioが2分10秒の生成に対応、Sunoは全ユーザーに4分生成を開放(CloseBox) 画像
AI

AI作曲サービスは「長さ」の戦いに。Udioが2分10秒の生成に対応、Sunoは全ユーザーに4分生成を開放(CloseBox)

AI作曲の覇権を競うSunoとUdioが相次いで機能強化を発表しました。

アップルWWDC24、基調講演は6月11日午前2時から(日本時間)。iOS 18はじめ各OSアップデート、AI関連の発表に期待 画像
AI

アップルWWDC24、基調講演は6月11日午前2時から(日本時間)。iOS 18はじめ各OSアップデート、AI関連の発表に期待

アップルは、6月10日とだけ予告していた開発者イベントWWDC24の基調講演を、6月10日午前10時(太平洋夏時間)に開催すると発表しました。日本時間では6月11日午前2時から。発表の模様はアップルのウェブページ、YouTubeなどで視聴できます。

“株”選びにGPT-4の利益予測は使えるのか? “文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説(生成AIウィークリー) 画像
AI

“株”選びにGPT-4の利益予測は使えるのか? “文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説(生成AIウィークリー)

生成AIに関する重要論文を解説する連載。今回は、“文学作品”を翻訳する実際の出版社を真似たAI会社「TransAgents」、GPT-4で企業の財務諸表を分析し将来の利益を予測……など5本。

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に(CloseBox) 画像
AI

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に(CloseBox)

このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。

マインクラフトをGPT-4oと一緒にプレイ、マイクロソフトがCopilotのAI新機能をデモ。近日中に提供 画像
AI

マインクラフトをGPT-4oと一緒にプレイ、マイクロソフトがCopilotのAI新機能をデモ。近日中に提供

Minecraftをプレイするときに、AIアシスタント「Copilot」と会話できる機能をMicrosoftが発表しました。21日にSNSで公開された映像では、プレイヤーがCopilotにアイテム制作のアドバイスを求めたり、Copilotが脅威への対処法を知らせる様子が映されています。

バッジ型AIデバイスAi PinのHumane社、早くも身売り検討中?発売から約1か月(Bloomberg報道) 画像
AI

バッジ型AIデバイスAi PinのHumane社、早くも身売り検討中?発売から約1か月(Bloomberg報道)

Humaneは2023年11月、同社の最初で唯一の製品であるAI Pinを発表、2024年4月に出荷を開始し始めたばかりでしたが、新しい報道によると現在、会社の売却を検討しているとのことです。

中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化 画像
AI

中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化

中国国家サイバースペース管理局(CAC)は、習近平国家主席の思想と政治哲学に関する著書などでトレーニングされた大規模言語モデル(LLM)を搭載するAIシステムを開発しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第25回:三拍子揃った新Upscale手法 ControlNet 852_a_clone_xlを試す (西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第25回:三拍子揃った新Upscale手法 ControlNet 852_a_clone_xlを試す (西川和久)

現役グラビアカメラマンでありエンジニアでもある西川和久氏による生成AIグラビア連載の第25回は、画像生成と切っても切り離せないアップスケールの新技術編。

書籍「グラビアカメラマンが教える 生成AIグラビア実践ハンドブック」内容紹介。技術書典16でお待ちしています 画像
AI

書籍「グラビアカメラマンが教える 生成AIグラビア実践ハンドブック」内容紹介。技術書典16でお待ちしています

テクノエッジとして初となる紙の書籍「グラビアカメラマンが教える 生成AIグラビア実践ハンドブック」、5月26日から開催される技術書典に向けて無事入稿いたしました。

スカヨハ、ChatGPTの声提供をサム・アルトマンから繰り返し提案され断っていたと明かす。そっくりの『Sky』には衝撃と怒りを声明 画像
AI

スカヨハ、ChatGPTの声提供をサム・アルトマンから繰り返し提案され断っていたと明かす。そっくりの『Sky』には衝撃と怒りを声明

ハリウッドスターのスカーレット・ヨハンソンは、声の使用を断ったにもかかわらずOpenAIが「不気味なほど自分に似た」AI音声を発表したことに「ショックを受け、怒り」を覚えたと述べ、同社のサム・アルトマンCEOに対し「信じられない」とする声明を出しました。

Logic Proに10年前から欲しかった自動伴奏「Session Players」のキーボードとベース、そしてChromaGlowプラグインで超簡単にカバー曲を演奏してみた(CloseBox) 画像
AI

Logic Proに10年前から欲しかった自動伴奏「Session Players」のキーボードとベース、そしてChromaGlowプラグインで超簡単にカバー曲を演奏してみた(CloseBox)

Logic Pro 11の新機能として前回は1つのオーディオファイルを4つの楽器パートに分離する「Stem Splitter」を紹介しましたが、今回はその続きです。

Windows PC画面を常時記録・AIで全検索できる『Recall』(回顧)機能、マイクロソフトが発表。『Copilot+ PC』向け 画像
AI

Windows PC画面を常時記録・AIで全検索できる『Recall』(回顧)機能、マイクロソフトが発表。『Copilot+ PC』向け

Microsoftは5月20日(現地時間)、新しいPCカテゴリーとなる「Copilot+PCs」を発表。それにあわせて、Copilot+PCsで利用できる新機能としてRecall(日本語では「回顧」となっています)を発表しました。

Snapdragon X搭載『Copilot+ PC』、新型Surface Laptop(第7世代) 6月18日発売。歴代最長の22時間駆動 画像
PC

Snapdragon X搭載『Copilot+ PC』、新型Surface Laptop(第7世代) 6月18日発売。歴代最長の22時間駆動

マイクロソフトはクアルコム製のSnapdragon Xシリーズを搭載した第7世代Surface Laptopを発表しました。どちらも同社が提唱する新たなWindows PCカテゴリ「Copilot+ PC」に属します。

Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説(生成AIウィークリー) 画像
AI

Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説(生成AIウィークリー)

1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。今回は、GPU上でネイティブ動作する並列処理が可能な新プログラミング言語「Bend」とランタイムシステム「HVM2」、大規模言語モデルは追加学習や新知識で幻覚生成が増加。Googleなどが調査などを紹介。