AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ（CloseBox）

最近AnimateDiffというAI動画手法がすごいと各所で注目されています。

テクノエッジで連載している生成AIウィークリーで7月17日に取り上げているのですが、すぐにいろんなところで実装され、Stable Diffusion WebUIで使えるようになり、さらに日本のAI作画サービスであるMemeplexでも利用できるようになりました。

1枚の静止画から動画作成する「AnimateDiff」、Googleの画像学習改良版「HyperDreamBooth」など5本の重要論文を解説（生成AIウィークリー） | テクノエッジ TechnoEdge

人物画像などの学習によく使われているDreamBoothを、開発元であるGoogleがさらに高速化。静止画1枚から一貫性のあるアニメーションを制作する手法など、最新論文から生成AIの重要技術5つを紹介。

https://www.techno-edge.net/article/2023/07/17/1603.html続きを読む »

筆者も話題になった直後から試そうとしていたのですが、自分ではうまくいかず悶々としていたところ、Memeplexでできるようになったので、そのインプレッションをお届けします。

AnimateDiffの基本的な動作は、静止画を作成できるAI作画モデルを使って、一貫性のある短いアニメーションGIFを生成するというもの。Stable Diffusion 1.5、2.0といった標準的なものだけでなく、その上にカスタム学習（ファインチューニング）したモデルにも対応できるというのが特徴です。同様の技術としては「Tune-A-Video」があったのですが、一貫性が乏しかったために使いどころがなかなか難しいものでした。

筆者は現在、MemeplexとStable Diffusion WebUI上に、妻の写真を学習させたAIモデル（Checkpoint）を作成して使っていて「異世界とりちゃん」という名の下に日々、画像を生成しています。その一環で動画生成もやってます。

Tune-A-Videoベースの動画は2月に試しています。使い方によってはこれもいいのですが、動きはそんなに激しくなくていいんだよ、と。

AI作画がアニメーションできるようになったので、異世界にいる妻をのぞいてみたら楽しすぎた（CloseBox） | テクノエッジ TechnoEdge

AIイラスト生成サービスのMemeplexが、アニメーションの出力に対応。さっそくこの新機能を使ってミュージックビデオを作ってみました。歌声もAI、アニメもAIです。

https://www.techno-edge.net/article/2023/02/03/815.html続きを読む »

では、Memeplex版AnimateDiffを試してみます。

Memeplex版AnimateDiffはすごく簡単

Memeplexは基本無料なクラウドサービスなのですが、有料会員になると、カスタムモデル作成が可能になり、毎月もらえるポイントを消費することで、作成の優先権をもらえます。さらに、今回はカスタムモデルでの動画生成も可能となっています。無料枠でもポイントを貯める（静止画生成で毎日ポイントがもらえる）ことで、AnimateDiff生成ができるので、まずは試してみるといいでしょう。

使えるAIモデルには制限があります。通常のSD（Stable Diffusion）や派生モデル全てが使えるわけではなく、西川和久さんの連載でも定評のあるBRAV5（Beautiful Realistic Asians Version 5）と、以前インタビューした852話さんが作成したイラスト専用モデルSDHK、そしてこの2つをベースにしたカスタム学習モデルだけが利用できます。

筆者はBRAV5をベースに妻の写真を学習させたモデルがあるのでこれを使います。

やり方は、まず5ポイント使ってブースト。これで30分使い放題の枠がもらえます。静止画の場合には、ここで画像サイズやステップ数などの属性変更をするのですが、AnimateDiffで動画を作成するための「動画生成をリクエスト」ボタンが表示されるようになります。

▲ブーストモードにすると、「動画生成をリクエスト」ボタンが表示される

プロンプトを入れるとしばらく（数分）して結果が表示されます。静止画より時間はかかりますが、上がってくるのを待たなくても数回同じプロンプトで生成ボタンを押せば、キューに入って後で生成されます。動画は静止画よりさらにガチャ要素が強いので、何度も回す（押す）必要があります。

最初はこんな動きが激しいものでしたが、何度かやるうちにコツが掴めてきて、比較的良いアニメーションができるようになりました。

顔はアップにしておくと動きが少なくてよい（プロンプトにはface closeupなどと入れる）
背景はごちゃごちゃしたり物体が多いと移動感が出る（上の作例ではin the classroomとかin high school laboratoryとか）
服もどんどん入れ替わってしまうので、種類や色は指定しておいた方がよい（作例では指定していないけど、yellow shirtとか）

といったところが個人的なポイントでした。

動画を試すことで、静止画とはまた違ったインスピレーションが湧いてきます。ちょうどいい具合に、8月末から第二回AIアートグランプリが開かれます。

「明日」テーマにAIを活用したアート作品を募集。第二回AIアートグランプリ、開催決定 | テクノエッジ TechnoEdge

「第二回AIアートグランプリ」は第一回と同じ審査員構成ですが、今回は作品テーマが「明日」と決められています。

https://www.techno-edge.net/article/2023/08/01/1681.html続きを読む »

筆者が参加した第一回ではまだ動画を作成するための技術は数えるほどしかなく、自分の作品でも静止画をトランジションするだけのことしかできませんでした（実際にはリップシンクするサービスであるD-IDは昨年12月時点でサービスインしていましたが自分はその存在に気づいていなかった）。動画作品をエントリーされた方々も動きをつけるために独自の工夫をされていました。

第一回AIアートグランプリを受賞したので自分の作品解説とファイナリスト作品への感想。そしてその先（CloseBox） | テクノエッジ TechnoEdge