生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧
Boogu-Image-0.1
2026年6月16日、Boogu ProjectからBoogu-Image-0.1がリリースされた。Base、Turbo、Editの3バリアントからなる統合画像生成・編集モデルファミリーでパラメータは全て10B(Qwen3vl_8b)。最大2048×2048に対応。設定(推奨値)は以下の通り。
steps | sampler, scheduler | |
Base | 25~50 | dpmpp_2m, simple |
Turbo | 4 | lcm, sgm_uniform |
Edit | 25~50 | dpmpp_2m, simple |
ライセンスはApache-2.0。既にComfyUI、そしてLoRA学習のai-toolkitも対応。執筆時点でそれなりに環境は整っている。WorkflowはComfyUIのテンプレートに標準搭載。

以下、順にBase、Turbo、Baseで生成した画像をEditで衣装変更、そして筆者パターンのBase + DistillLoRA (0.6) 。Promptはいつもの”a young Japanese woman.”
次はai-toolkitを使い顔LoRAを学習した結果だ。学習元の写真は1024x1024で10枚。stepsは1000。
ご覧のように悪くはないものの、Z-Imageには届かない感じか。まだ0.1なので今後に期待したい。当初これで原稿1本行く予定だったのだが、6月23日により強力なモデルが公開されたので軽く触れる程度にする。
Krea 2
2026年5月21日に予告っぽい投稿があったが無事、2026年6月23日、API版を先行していたKrea 2がオープンウェイトでRaw(ベースモデル)とTurbo(蒸留済み高速版)の2種類をリリース。パラメータは12B。最大2048×2048に対応(ただしRawの学習データは1024)。興味深いのは学習データにAI画像を一切使っていないと明言していることだろか。
こちらもComfyUI、ai-toolkitそしてMusubi Tunerがday 0対応。既にHugging Faceにはfp8版、gguf版などいろいろ派生モデルも出現している。WorkflowはComfyUIのテンプレートに標準搭載。探すと3つ見つかるがそのうち2つはAPI用だ。

これはテンプレートからSubgraphの部分を取り出したWorkflow。一見ややこしそうだが、下はPrompt拡張部分なのでなくても問題ない。あとはLoad Diffusion Model/Load CLIP (Qwen3vl_4b) /Load VAE、CLIP Text Encode(Negative PromptはTurbo時なし)、KSampler (8 steps, euler, simple) そしてVAE Decodeと、いつもの最も単純なパターンと同じだ。
順にRaw、Turbo、Raw+DistillLoRA(0.6)/20 steps、Turbo+顔LoRA (0.7) 。なお執筆中に256dim版のDistillLoRAも公開された(前者は64dim)。
sampler/schedulerは、euler/simple。Rawの時は52 steps、CFG 3.5。Negative Promptには”worst quality, illustration, 3d, 2d, painting, cartoons, sketch,”を入れている。Rawの絵がイマイチなのは基本学習用に使うためだ。従って評価はTurboもしくはRaw+Distillとなる。顔LoRAに関してはご覧の通り。1500 stepsだがBooguよりこちらの方がより本人に似ている。
ライセンスは、商用利用OKだが、年商100万ドル(約1.6億円)以上の企業は別途Enterprise Licenseが必要。配布時はモデル名に「Krea」を冠することと帰属表示が必須。公開サービスとして展開する場合はNSFWフィルターなどのコンテンツフィルタリングの実装が義務付けられている。従ってここでの作例掲載は問題ない。
検閲はあるにはあるが、温泉や風呂など、普通そうでしょ!的な場所だとそれなりに出る(笑)。バイパスするカスタムノードも公開されたが、モデルの各レイヤーを細かく調整しており、結構絵柄が変わるため不要な人は入れない方が良い。
以下、Raw+DistillLoRA (0.6) /12 stepsの作例6枚。最後の1枚は、第68回Ideogram 4.0用のJSONをそのままPromptとして使ったものだ。Ideogram 4.0までは行かないが、それなりにレイアウトされ日本語も出ている。またJSONを認識しているのか余計なものは出ていない。
顔LoRAやスタイルLoRA無し、素の状態でご覧のように結構いい。日本人を含むアジア系も素直に出る。長年続いたZ-Imageの牙城が崩れる日は来るのか!?
今回締めのグラビア
今回締めのグラビアは、扉と共に掲載サイズに合わせて長辺1920で生成。Raw+DistillLoRA (0.65) + 顔LoRA (0.6) 、Steps 12。なおSamplerはer_sdeにしている。これは当初載ったWorkflowから来ており、ComfyUIのWorkflowではeulerに変更された。

もうすぐ夏本番。海はもちろんだが、こんなフェスのステージも楽しみなシーズンの到来だ♪

























