Grok、6秒動画をサウンド付きで生成できるように。20秒未満超高速生成、秒で静止画生成の実力を試す(CloseBox)

テクノロジー AI
松尾公也

テクノエッジ編集部 シニアエディター / コミュニティストラテジスト @mazzo

特集

イーロン・マスクのAI企業であるxAIが開発し、Xにも組み込まれているGrokに、動画生成機能「Imagine」が搭載されました。現在ウェイティングリスト方式で、一部のユーザーに解放されています。

筆者のアカウント(Premium Plus)でこの新機能「Imagine」が使えるようになったので、使ってみました。iPhone版Grokアプリで試しました。ブラウザ版では利用できないようです。

日本語版だと「想像する」というタブになっていますが、Imagineのことですね。

現在のところ、アップロードした元画像から生成するImage to Videoのみ。Grokにはプロンプトから静止画を生成する機能はあるので、そこから「Make Video」で動画にすることは可能です。

画像生成を経由しての動画生成ではSpicyというオプションがありますが、これは肌の露出が多いもので、メジャーなプラットフォームではまず規制されるレベルです。

このあたりは、xAIやXの規制のゆるさを反映しています。

Grok Imagineの大きな特徴は、生成が非常に高速であること。10数回試しましたが、いずれも20秒未満で生成できています。尺は6秒の固定で、サウンドが付いてきます。

コントロールできることは多くありません。Image to Videoの場合、Make Videoのコマンドから「カスタム」「Fun」「Normal」の3つから選択します。カスタムを選ぶとプロンプトでの指示が可能です。

通常はNormalで画像を解釈して動画にしてくれます。Funでは、途中で面白いこと(動き)が起きます。

試した範囲では、人物の動画生成で破綻がほとんど見られませんでした。

何かを食べようとしているシーンをうまく動画にするのは難しいものですが、Grokはうまく生成してくれます。

最初のリリースとしては非常に優秀だということがわかります。

サウンドはMMAudioやVeo 3ほどではありませんし、カメラコントロール、クリップの延長、アップスケールなどの機能は実装されていませんが、初期性能がこれだけいいと、動画生成の選択肢として検討に値すると思います。

言い忘れましたが、静止画生成のスピードは鬼のように速いです。スクロールしていくと、次々に生成されていきます。1枚1秒かからないくらいではないでしょうか。iPhoneアプリでの操作の様子を動画にまとめたので、そちらもご覧ください。

《松尾公也》

松尾公也

テクノエッジ編集部 シニアエディター / コミュニティストラテジスト @mazzo

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。