生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧
生成AI画像で任意の顔に似せるには?
筆者がこの連載でよく使う言葉、顔LoRA。これは例えばZ-ImageやZ-Image-Turboなど、モデルにない顔をai-toolkitやsd-scriptsを使い学習、LoRAを作り、これを当てて生成、うまく当たれば激似になる生成AI画像(動画も可能)の必殺技だ。またLoRAはご存知のように学習元のモデルにしか効かないため、例えばZ-Image-Turbo用で作ったLoRAは、Qwen-Imageには当たらない。
ただ学習にはある程度のVRAM容量が必要なので環境が作れない場合、WaveSpeedなどサービスを使いLoRAを作る方法もある。サービスにもよるが1回1ドルちょっと安く、ローカルで作るより時間もかからない。筆者も面倒な時や急ぐ時はローカルに環境があるにも関わらず、サービスを使ったりする(笑)。
さて実際顔LoRAを作るには最小限で同一人物の写真10枚あればいい。とは言えやみくもに10枚ではダメで多くはバストアップの顔角度違い。残りは全身や座り、バックショットなどとなるだろうか。ただし顔を加工した画像は使えない(加工の仕方がバラバラで結果似ない)。この辺りの話はSDXLの頃に一度書いているので参考にして欲しい。最近のZ-Imageなどでも基本同じだ。
加えて何が写っているのかが英語で書かれているキャプションファイル(txt)も1つずつ対になるように用意する。サービスの場合はキャプションファイルがなくても自動的に作られるケースがあり、この辺りは事前確認が必要。上記のWaveSpeedはなくても良い。ローカルで作るならVision(画像認識)対応のLLMを使う。
……と、顔LoRAを作るのはざっと上記のような下準備が必要。簡単といえば簡単だが、面倒と言えば面倒(笑)。そこで今回は写真1枚から角度違いの3枚を作り計4枚を用意、これを使って参照画像の顔を入れ替えるWorkflowをご紹介したい。
顔写真1枚から角度違いの3枚を作る
これに関しては正直Nano BananaなどImage Edit系の外部ツールを使うのが楽。ただそれだと記事にならないので簡単なWorkflowを紹介したい。EditモデルはFlux.2 [Klein] 9B Distilledを使用。与えるPromptは以下の通り。正面はリファレンスに正面向きの画像を使うので不要。
右向き
right side view eye-level shot, looking at viewer左向き
left side view eye-level shot, looking at viewer振り返り
back-right quarter view eye-level shot, looking at viewer
WorkflowはテンプレートからFlux.2 [Klein] 9B Distilled: Image Editを選び、下側は使わないので削除、またCR Prompt Listを使うと[改行]区切りのPromptを一気に生成できて便利だ(今回は3つ)。

これで正面(リファレンス画像)、右向き、左向き、振り返りの合計4つの顔写真を用意できた。
この手法は去年2025年10月第53回に掲載したQwen-Image-Edit-2509を使った20枚のdataset作成と同じロジックで、モデルをFlux.2 [Klein] 9B Distilledへ変更し、3枚限定版……といった位置付けとなる。
顔LoRA無しでそっくりな顔の画像を作る
Workflowはここにあるのでダウンロード、不足があれば設定する。なお、consistence-FK9B.safetensorsは、strength_modelが0なので通常は不要。
使い方は簡単!上記で作った顔画像4枚と顔を変えたい画像1枚を用意し、それぞれにセットする。今回後者は前々回の作例を引っ張り出した。

いかがだろうか? 流石にウィンクまではしていないが綺麗に顔が入れ替わっている。以下、別の作例を2組み掲載する。
影のつき方なども含めうまく馴染んでいるのが分かる。これまで筆者はいろいろこの手のを見てきたが、このWorkflowはピカイチ。もう顔LoRA不要では?と思うほどだ。ただ余りにも似過ぎるため妙なことには使わないようにお願いしたい。
今回締めのグラビア
今回締めのグラビアは、リファレンス画像の顔を変えると言うお題からバックナンバーの扉とグラビアをそれぞれ変えてみた。また顔だけだと面白くないので衣装の色も合わせて変更している。扉はつい先日の第63回、グラビアは1年前の4月第46回から。この号ではHiDream-I1の話をしている。今となっては懐かしい話だ。

背景の色が少し変わったり、Workflowに合わせて気持ちクロップしている関係で上記の作例も合わせちょっと構図が違っているものの概ねうまく変更出来ている。驚くべきは扉の写真。顔にマイクが被っているにも関わらず問題なく入れ替わっているしとても自然だ。
Flux.2 [Klein] 9Bは純粋な生成だと顔が大きめに出るためあまり使っていないが、Editに関してはPromptへの反応も良くしかも速い。まだ触ってない方は是非試してほしい。



















