生成AIグラビアをグラビアカメラマンが作るとどうなる?第59回:BFLからFLUX.2 [klein]リリース!(西川和久)

テクノロジー AI
西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧

BFLからFLUX.2 [klein]登場!

大晦日にQwen-Image-2512がリリースされたと思ったら、今度は明けて2026年1月15日にBFL(Black Forest Labs)からFLUX.2 [klein]がリリースされた。

これは2025年11月28日にFLUX.2が出た時に予告していたもので、FLUX.2 [pro] (サービス/API)、FLUX.2 [flex] (サービス/API)、FLUX.1 [dev] (オープン)、そしてFLUX.2 [klein] (近日公開)だったのが忘れたころに公開された形となる。


何故忘れた頃?かというと、FLUX.2と同時期に登場したZ-Image-Turboの圧倒的な性能で既にFLUX.2と勝負ついた格好だったからだ。[dev]で劣っているのだから、その下位に相当する[klein]は誰も期待していなかった……というのが正直なところだろう。

公開されたモデルは4つパラメータ数4Bと9BそれぞれBASE(steps 50, cfg 4.0)、蒸留(steps 4, cfg 1.0)となる。各URLは以下の通り。

ただしHugging Faceにアカウントを持ち、それぞれの利用許諾ボタンを押した後からしかダウンロードできない。ライセンスは4B apache 2.0、9B FLUX Non-Commercial License。

テキストエンコーダーにはQwen3 4B(4B用)または8B(9B用)を使用。特に後者は大きめなので、日本語でPromptを書いても問題なく生成される。VAEを含めたURLは以下の通り。これらはComfy-Orgが用意したものなので利用許諾ボタンはない。

[klein]の興味深いところはt2iだけでなく編集にも対応しているところだ。またnvfp4と呼ばれるRTX50系専用の小型/高速モデルも用意されている。URLを下記するのでRTX50系のGPUを持ってる人は是非試してほしい。ただしComfyUIをUpdateしないと使えないので要注意!

FLUX.2 [klein]の実力は!?

上記した様に[klein]にはBASE4Bと蒸留4B、BASE9Bと蒸留9Bの4つがある。これとZ-Image-Turbo、FLUX.2 [dev]も加えて比較してみたい。

Promptは何時もの「a young Japanese woman」。Z-Image-Turbo、FLUX.2 [dev]については第55回で掲載したのをそのまま流用している。

Workflowは以下の通り。Load Diffusion Model、Load CLIP、Load VAEにCLIP Text Encode、そしてKSamplerと基本系の形で生成できる。なお、蒸留版はcfgが1.0になるため、 Negative Prompt側は無効となる。

FLUX.2 [klein]のWorkflow

解像度は832x1,216ピクセルで全て共通。steps/cfgは、BASE 50/4.0蒸留 4/1.0。生成にかかった時間はRTX 5090での結果だ。

Z-Image-Turbo
FLUX.2 [dev]
[klein] BASE4B、18.67秒
[klein] 蒸留4B、1.00秒
[klein] BASE9B、25.55秒
[klein] 蒸留9B、1.24秒

如何だろうか。意外と過去イチ出来がいいかも知れない(笑)。特に蒸留9Bはなかなか。BASEはイマイチだが、これはFTやLoRA学習する時に有利となるため存在自体が重要となる。加えて蒸留版は生成がとんでもなく速い!

掲載したのはSEEDを固定したものだが、”Japanese woman”のように、衣装を指定しないと高確率で着物が出現。これは他社もそうだが何とかして欲しいところ。

以下、作例を6つ掲載する。載せたのは大丈夫なものにしているものの、相変わらず指や腕、足などが今時のモデルとしては珍しく激しく崩れる。NSFWを気にする以前にこちらを気にしては如何かな? > BFL

58回のPromptに合わせたが結構いい感じだ。またZ-Image-Turboと比較して奥行き感もあり、独特なテイストになっている。RTX 5090だと約1秒なので多少指などがおかしくてもガンガンガチャればいいという話しもある(笑)。

蒸留9Bで編集機能を試してみる

次は編集機能。ここでは蒸留9Bで試しているが、イラスト系などでは蒸留4Bでも調子いいとか。リファレンス画像が1枚増える毎に処理時間は増すのだが、蒸留版は元々速いため、編集用としても有効だろう。

FLUX.2 [klein]の編集用Workflow。リファレンス画像を扱う部分が増えている

1つ目は実写と生成AI美女の融合。Promptで「渋谷109」と書いてもなかなかそれっぽい絵が出ないが、リファレンス画像を使えばらしいのがサクッと作れる。またPromptは全て日本語。Qwen3が8Bだからできる技だ。

Qwen-Image-Editで話題になったUIで向きを指定するNode追加

2つ目のWorkflowはQwen-Image-Editで話題になったUIで向き指定ができるWorkflow。UIを操作し希望の向きに設定、実行すると、それに相当するPromptが出力されるので、特殊なものでなく、編集系に応用可能。FLUX.2 [klein]で試したところうまくいった。

カスタムNodeはComfyUI-qwenmultiangle。これをインストールして、CLIP Text EncodeのTextへ入れればOK。便利なので是非試してほしい!

今回締めのグラビア

扉とグラビアはFLUX.2 [klein] 蒸留9Bを使用。ただし通常4 stepsのところを16とした。加えてai-toolkitで自作したLoRAを0.6で肌LoRA的に、解像度は長辺1920ピクセルのいきなりフルHDでの生成となる。

FLUX.2 [klein] 蒸留9Bを使ったグラビア!

これだとRTX 5090を使っても12秒とそれなりに時間はかかるが、その威力はご覧の通り。同じPromptを使いZ-Image-Turboだともっと薄っぺらい感じの絵となった。この立体感は[klein]独特と言えよう。

ただし、上記した様に変な指、腕、脚が出る確率は異様に大きい。これさえ何とかなれば……というところ。FTした派生モデルに期待したい。

年明け早々、嬉しいお年玉となったFLUX.2 [klein] 。次はそろそろZ-Image-Baseだろうか!?

生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧

《西川和久》

西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。