生成AIグラビアをグラビアカメラマンが作るとどうなる？第12回：SDXL用ModelやLoRAをピックアップ+α版。寝転びポーズや「東京駅」で撮影など (西川和久)

テクノロジー Science

2023 Nov 9 14:00

西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

生成AIグラビアをグラビアカメラマンが作るとどうなる？第12回：SDXL用ModelやLoRAをピックアップ+α版。寝転びポーズや「東京駅」で撮影など (西川和久)

生成AIグラビアをグラビアカメラマンが作るとどうなる？連載記事一覧

気になるSDXL用ModelやLoRA

前回、連載11回目はSD 1.5用のModelとLoRAを主にご紹介した。

12回目の今回は予告どおり、次世代 Stable Diffusion として表現力が格段に向上した SDXL用のModelとLoRA、そして+αをご紹介したい。

生成AIグラビアをグラビアカメラマンが作るとどうなる？第11回：Stable Diffusion 1.5の注目ModelやLoRAを紹介+α版 (西川和久) | テクノエッジ TechnoEdge

ここのところ、生成AI画像環境構築やアプリの使い方などで3回、顔LoRA制作…と少し重いネタが続いたので、今回は軽めの気になるModelやLoRAを作例と共にご紹介したい。

https://www.techno-edge.net/article/2023/10/25/2138.html続きを読む »

Model

SDXL用のリアル系アジア(日本人)美女Modelとしては、こたじろう氏作のfuduki_mix、haduki_mix、nagatsuki_mix。そしてLoRAのayame_LoRAは、今や定番中の定番。サクッと日本人美女を出したい時はこれを選んでおけばまず間違いない。本連載で何度も登場していることもあり、改めて紹介する必要はないだろう。

これ以外で現在個人的にお気に入のSDXL用Modelはこれからご紹介する以下4つ(+4)となる。

筆者が何を基準で気に入るのかは、割と大雑把だが、まず直近で作ったそこそこ出来のいい画像の情報を読み込み、そのまま生成。一旦同じ画像が出てくる。

これを試したいModelに変えて生成。違和感無ければSeedを-1(ランダム)にして10枚前後生成。「行けるな！」っと思ったらModelファイルはそのまま残し、「あ、駄目だ」っと思ったら即削除している。そうしないとあっと言う間にストレージがいっぱいになるからだ。

「行けるな！」の基準は顔やバランスだったり色だったり肌の質感だったり…個人的な好みも入るので表現し辛いのだが、ザックリこんな感じだ。ただこれだけだと結構の数が溜まってしまうので、月に一回？同じ設定で手持ちの全Modelを生成、「もういいか！」的なものは削除している。

1	2
3	4

cherryPickerXL v2.7
https://civitai.com/models/125680?modelVersionId=173768
photopediaXL Type 1
https://civitai.com/models/189109?modelVersionId=212406
realisticStockPhoto v1.0
https://civitai.com/models/139565/realistic-stock-photo
SoraAni25XL | Anime & 2.5D v1.0
https://civitai.com/models/186535/sora-ani25-xl-or-anime-and-25d?modelVersionId=209446

cherryPickerXL v2.7

cherryPickerXLは過去の連載でも作例として使っているが、10回目にご紹介したsd-scriptsを使った顔LoRAとも相性が良く、筆者が好きなModelの一つだ。

生成AIグラビアをグラビアカメラマンが作るとどうなる？第十回：実在モデルからSDXL用顔LoRAを作る (西川和久) | テクノエッジ TechnoEdge

Modelに無い顔や彼女の顔を出したい！

https://www.techno-edge.net/article/2023/10/18/2106.html続きを読む »

割と早い時期からあったModelで、SDXLで日本的なグラビアはまだ難しかった頃からそこそこ出たので、初期バージョンからの付き合いとなる。安定しているのはもちろん、このv2.7では肌の感じも随分良くなった。

photopediaXL Type 1

photopediaXLは、11月5日リリースと、ごく最近のModelで元々PhotoshopXLとして登場したが、流石に名前がまずかったのか？photopediaXLに変更となった。

またType 1とType 2があり、後者の方が少しアナログっぽい感じだ。個人的にはType 1の方が好みなので作例はType 1になっているものの、是非Type 2も試して欲しい。

直感的に「お！」っと思ったこともあり、現在色々テスト(遊び)中。今回、扉とグラビアはこのModelを使っている。

結構気に入っている事もあり、普段使うModelがcherryPickerXLからこれに変わる可能性が高い。ただ、っと言ってる間に他の何かが出るかも知れないが…。

realisticStockPhoto v1.0

上記2つのModelはMerge(色々なModelをブレンド)タイプだが、realisticStockPhotoはTrained(混ざりっけ無しの独自学習)タイプ。CFG Scale 3がベストポジションなど、他のModelと色々違って面白く、作例も顔の傾向が少し異なる。この様な特徴から少しテイストを変えたいときに使うケースが多い。

ただそのままだとアジア系はやや苦手。顔LoRAを当てる必要があるのだが、SDXL標準のbaseモデル(sd_xl_base_1.0.safetensors)を使ってのLoRAではなく、このModelを使って専用LoRAを作らないと効果が薄い。

後述するFooocusのrealisticプリセットに採用され、やはり筆者の勘は間違ってなかったようだ。

SoraAni25XL | Anime & 2.5D v1.0

SoraAni25XLは、3次元リアル系ばかり生成していると飽きてくるので(笑)たまに箸休めで使うModelだ。イラスト系も2.5次元系もどちらにも対応する。

リリースは11月2日。割と最近で、それまでこの用途では他のModelを使っていた。作例からも分かるように、何時も使うリアル系と顔の傾向が似ているので違和感も無い。

また一般的にイラスト系は、背景の描写やポーズ、アングルなど、リアル系より出やすい、つまり自由度が高い特徴がある。

この特徴を利用して、まずは好みのポーズやアングル等をこちらで生成してから、ControlNet / Depthで奥行き情報に変換し、そちらを元に今度は3次元リアル系Modelで再度生成することで、リアル系が苦手なポーズ、アングルなどをある意味力技で何とかすることも可能だ。

この他にも

といったModelも個性的だろうか。特に4番目は作者konapieces氏が日本人なので日本人美女もバッチリ♪

LoRA

LoRA (Low Rank Adaptation)とは、小さなサイズと計算量で効率的にファインチューニングする技法のこと。(参考：第六回：Stable Diffusionの基本2 / LoRAの概要と6つの例を紹介)

ここでは基本の Model と組み合わせることで、特定の効果を追加できる LoRA を紹介する。

ClearHandsXL
https://civitai.com/models/132884?modelVersionId=155932

AIが苦手な手指の表現を改善するLoRA。

上記の作例は全て同じPromptでSeedだけ変えている。何時も問題になる指に関してはClearHandsXLを使用。Promptへ<lora:ClearHand-V2:1>と入れるだけで、特にTrigger Wordなどはない。

変な指を完全に抑えられるわけではないものの、打率が高くなり、絵はいいのに指でボツ…を減らすことができる。但し過度な期待は禁物。

またUpscale時のDenoising strength値(追加書込度合い)によっては指がおかしくなるのは別の話となる(指だけでなく色々な部分が破綻するケースもある)。

1	2
3	4

woman laying on stomachその1
woman laying on stomachその2
東京駅　東海道・山陽新幹線ホームSDXLその1
東京駅　東海道・山陽新幹線ホームSDXLその2

woman laying on stomach
https://civitai.com/models/191593/woman-laying-on-stomach?modelVersionId=216780

うつ伏せで寝転がったポーズを指定するLoRA。SDXLのリアル系Modelの多くは、SD 1.5のModelと比較して、大胆なポーズやアングルなどがほとんど出ない。グラビアだと、開脚系、超ローアングル、そして寝転び系などだろうか。

これはセンシティブなフィルタがかかっているのではなく、単に学習していないだけの様だ。Sexy系のModelやLoRAを使えば普通に出る。

その苦手な中の一つ、寝転がり系を何とかするのがこのLoRAだ。Trigger Wordはwoman laying on stomach。文字通りお腹を下にした寝転がりとなる。横位置だと効果抜群だが、レイアウトの都合上、縦位置で掲載した。グラビアではありがちなポーズだが、これがあるのと無いのとでは大違い！

東京駅　東海道・山陽新幹線ホームSDXL
https://civitai.com/models/131749/sdxl?modelVersionId=144842

特定の場所を再現するLoRAで、ご覧の様に東京駅っぽい雰囲気と新幹線っぽいのが現れる(あくまでも似てるだけで現実とは異なる)。Trigger Wordは、STOKYO, train station, scenery, real world location, train。

筆者のXアカウントでこれと水着美女を組み合わせ「(撮影許可が出ないので)絶対撮れない写真」と掲載したらバズってしまった(笑)

作者swingwings氏の登録Model一覧を見ると、日本の公衆電話、コンビニの外観、鶏ガラベースのこってりが有名なラーメン店、餃子が美味しい料理店…面白そうなのが山盛り！興味のあるLoRAがあったら是非試して欲しい。

作例は掲載しないが雑誌の表紙系LoRAで、 Maxim Magazine Korea SDXL 、VOGUE (Fashion Magazine Cover Vintage 1960-1975) 、この辺りが結構楽しめる。ネタに困った時など、ちょっとガチャってみるといいのでは？

+αはFooocus-MREの開発終了、本家Fooocusへ一本化

ここ最近、驚いた出来事として、以前連載でもご紹介したFooocus-MREの開発が10月1日をもって止まったことがあげられる。

生成AIグラビアをグラビアカメラマンが作るとどうなる？第九回：Fooocus-MREでimage-2-imageやControlNetを試す (西川和久) | テクノエッジ TechnoEdge

■画像生成は出来たけど…何かもう一捻りしたい！

https://www.techno-edge.net/article/2023/10/11/2064.html続きを読む »

本家Fooocusが非対応なちょっと痒いところに手が届く的な存在だったのでショックは大きい。おそらく本家の開発ペースが激速で、それをマージするのが大変だったのではないだろうか。

しかし面白い事に、今は本家のFooocusをFooocus-MREの作者、MoonRide303氏が一緒に開発し一本化。Fooocus-MREの機能の一部も取り込んでいる。鬼才二人のコラボ、今後益々楽しみと言えよう。個人的にはADetailer(解像度に合わせて顔を書き直す)が欲しいところ。

そして本家のFooocusは、Localization対応、anime/realisticプリセット対応など、日々機能拡張中だ。プリセットに関しては、animeがModelにbluepencil_v50 + dreamsharper_v8(refiner)、realisticが上記のrealistic_stock_photoを採用している。

加えてanimeプリセットでrefinerとして使っているdreamsharper_v8はSD 1.5用リアル系Modelで、それをrefinerにしてしまうと言う、離れ業までやってしまった。流石CotrolNetを作った人的発想だ。