生成AIグラビアをグラビアカメラマンが作るとどうなる?第一回:実在モデルで学習・LoRAでキャッチライト付加 (西川和久)

テクノロジー AI
西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

生成AIグラビアをグラビアカメラマンが作るとどうなる?第一回:実在モデルで学習・LoRAでキャッチライト付加  (西川和久)
  • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第一回:実在モデルで学習・LoRAでキャッチライト付加  (西川和久)
  • 実写
  • AI生成
  • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第一回:実在モデルで学習・LoRAでキャッチライト付加  (西川和久)
  • flat2のweightと絵柄の関係
  • AI生成
  • siitake-eyeのweightとキャッチライトの関係
  • AI生成

いまや一般メディアでも連日扱われる生成AI。なかでもMidjourneyやStable Diffusionなど画像を生成するAIは、実在する本人そっくりのリアルな画像や、非実在モデルのAIグラビアなど話題に事欠きません。

ベテランのグラビアカメラマンでありソフトウェアエンジニアでもある西川和久氏がAIグラビア生成を始め、自身で撮影した写真からモデル本人了承のもとトレーニングまでしていると聞き、始めたきっかけやカメラマンとしてのAIとの付き合い方、自分でも始めてみたい人へのTIPSをまとめてもらいました。(編集部)


百聞は一見に如かず。これってAI生成グラビア?

AI画像生成に興味を持ったのは去年の年末頃だろうか。Twitterを眺めていると「どうやって撮った(作った)んだ?」と言う画像がたまに載っていたので調べると、Stable Diffusion Web UI (AUTOMATIC1111版)だった。

元々グラビアを撮っていたこともあり、あまり撮らなくなってもグラビア好きなのには違いなく、試したくなったのは言うまでもない。

AI生成画像は大きく分けて2種類あり、一つはイラスト系、もう一つはリアル系。筆者が興味を持ったのは後者。どこまで実写に迫れるのかがその興味の対象だ。百聞は一見に如かず。扉の写真はAI生成画像。現時点でこの程度の写りは容易にこなす。

とは言え、実際の撮影もそうなのだが、グラビア写真は数百枚撮ってカメラマンがある程度セレクトし納品したものが、納品先で更に絞られ、出版社などで更に絞り込まれ数枚だけが世の中に出る。

それと同じで、ここに掲載しているAI生成画像も全部で500枚以上出して、その中から各1枚ピックアップしたものだ(各シーンは同じPromptでseedでガチャる。あまりにも出ない時は重みを調整)。

Prompt自体はシンプルなのだが、気に入るのが出るまではそれなりに手間暇がかかる。落とした中には指や腕、足の本数などがおかしいAIらしいのも含まれるが、この辺りの話は回を変えて。

Stable DiffusionはCheckpoint(学習したModel)を切り替えることによりいろいろな絵柄を出すことができる。今年の始め頃まではリアル系と言ってもまだイラストに近い感じだったのだが、ここ数ヶ月でいくつか新しいCheckpointが登場し環境は激変した。

リアル系でアジア人特化タイプだとBRAV5(Beautiful Realistic Asians V5)、BracingEvoMixyayoi_mix辺りがよく使われているだろうか。個人的に好きなのはBRAV5だ (7月7日にBRAV6、7月8日には yayoi_mix v2.0が公開された)。

扉の写真は、さらに筆者が撮影した実在モデルの写真を本人了承のもと学習させた特製Checkpointとなっている。

以下、その特製Checkpointの学習用で使った実写15枚中の1枚。続けてAI生成画像をシーン違いで3パターン並べてみた。かなり似ているのは言うまでもなく、例えばInstagramに載ってるとAI生成とは分からないレベルではないだろうか。尚、明るさやコントラストは後から若干調整している。ここは実写と同じだ。

実写。学習に使った15枚中の1枚

AI生成。公園 / 全身

AI生成。作業場 / 上半身

AI生成。銀座で買い物 / 振り返り

モデル 小彩 楓

もしこれからStable Diffusionを始めるのなら、VRAM 8GB以下だといろいろ動かない部分が多く、GPUはRTX 3060 / 12GB(5万円未満)か、もうすぐ出るRTX 4060Ti / 16GB(10万円未満の予定)をお勧めしたい。

今回のHow To:LoRAでキャッチライトを強調する

昨今、自撮りも含めポートレート系は撮影後に加工アプリを使い、美肌にしたりキャッチライトを強調したり、所謂「盛る」ことが一般的になっている。これをStable Diffusionを使い実現してみたい。

使用するのはLoRA(Low-Rank Adaptation)と呼ばれる、メインのCheckpointへ特徴を追加する小さいModelとなる。多くは特定の顔だったり、コスプレなど絵柄だったり、背景だったりを指定するために使われるが、今回のように小さな効果を付け加えるパターンでも利用できる。

Stable Diffusionへのインストールは[Stable Diffusionのホームディレクトリ]/models/Loraへダウンロードしたファイルを入れればOKと簡単だ。

使用するのはflat2siitake-eye。どちらも本来はイラスト系用なのだが、リアル系でも効果がある。flat2は文字通り肌をスムージングするものだ。よくあるアプリだと顔のみ対象となるが、flat2は肌も含め絵柄全体に影響する。

+にするとスムーズに、逆に-にすると細かくなる。実際のPromptは<lora:flat2:0.4>などと書く。-1から+1までをチャートにしていたので参考にして欲しい。

flat2のweightと絵柄の関係

siitake-eyeは、名前からも分かるように本来キャッチライト強調用ではなく、眼の中に十字を描画する。キャッチライトとは、モデルの瞳に映った明るい光のことだ。

実際のポートレート撮影では、逆光の被写体に露出を合わせつつ、背景の色も出すにはレフ板を使い強烈に光りを当てる必要がある(そうしないと背景は白飛びする。ただ現場では女の子によって眩しくて眼が開かないこともあり、さじ加減が難しい)。

その光が瞳に写り込む=キャッチライトと呼ばれているが、リアル系のCheckpointで生成した画像では総じてキャッチライトが弱く、カメラマン的には不自然で前から気になってた部分だ。

siitake-eyeは用途違いとは言え、瞳に光が入るならありだろう……的に使ったところうまく行った感じだ。Promptは<lora:siitake-eye:0.4>などと書く。0.0(つまり効果無し)から1.6までをチャートにしてたので参考にして欲しい。実際使うとすれば0.5前後だろうか。

siitake-eyeのweightとキャッチライトの関係

この2つを合わせた作例が以下の一枚。肌はスムーズ、キャッチライトもバッチリ入ってる。なお、今回掲載している写真はチャートを除き全て、掲載上必要な1280 x 1920ドットより少し大きくUpscaleし、1280x1920ドットへ縮小、軽くシャープネスをかけ、気持ちノイズを載せている。この辺りはその昔、デジカメの解像度不足を補う技だったりする。

flat2とsiitake-eyeの合わせ技グラビア

如何だろうか。一応現役グラビアカメラマンとしてポーズや構図、バランスなどは拘って出しているつもりだ。

逆に今の実写グラビアは後から触り過ぎて生っぽさが無く、これはどうなの?と言うのが多い。関係者はこれを機会に一度見直すべきではと常々思っている。AI生成グラビアの方が(写真としては)魅力的など洒落にならない。

さて、このように環境さえあれば安易にグラビアが作れるようになったが、そこはどうなの?的な話を少し。この点については個人が個人的に楽しむ=オフライン時は(法律の範囲内で)好きなようにすればいいし、ネットに上げたり商用の場合は権利関係も含めちゃんとすべきだ。ここはAI生成も実写も、画像に限らず何でも同じ。AIに限った話ではない。

と言う事で連載開始となる。内容的には今回のようなHow Toものか、その時々のトピックスを扱う予定だ。編集長からは週一と指示を受けているが、時間的にもネタ的にもそんなに書けるのか…!?以降、よろしくお願いしたい。

西川和久とは誰か

某サイトでは長年パソコンなどのレビューを掲載しているが、本サイトは初。「パソコンのレビューしてる人がカメラマン?」と言う人も多いかと思うので、連載を始めるにあたって簡単にその辺りの話をしてみたい。

話は随分昔に遡るが、元々は(今も)プログラマーだ。CASIO QV-10@1994年など、デジカメ元祖が出だした頃にハマり、グラビアの撮影も含めフィルムカメラ(645/中判カメラ)がほぼ100%の時代にNikon D1@1999年を購入。

まだ珍しかったデジイチを持っていた筆者は編集者はもちろん、有名カメラマンからも重宝がられ、彼らが撮影した直後に同じセッティングのままD1で撮影し、結果を見せて欲しいと呼ばれることが多かった。時期尚早だが、関係者は興味津々と言うわけだ。筆者からしてみれば一流カメラマンがどうやって撮ってるのか直接学べるかなり貴重な経験となった。

同時にiモード端末が登場。待受画面にグラビアをと、各社サービスを始めたものの、当時フィルムからデジタル化すると1枚3千円ほどかかり、コスト的に大変なのでフィルム班とデジタル班の2組で撮影する機会が増えだした。もちろん筆者は後者だ。

その頃は制作費も山盛り。グアムやサイパンなどロケで頻繁に行くようになり、このタイミングで小倉優子 / peach [DVD]@2002年も撮影しているが、残念ながらジャケ写はフィルム班、デジタル班は待受などで使われていた。

そしてデジタル班だけで撮りだしたのが実は着エロだ。当時まだこの名称は無く、有名レースクイーンが卒業間際にイメージビデオを出すのが流行り、その内容のMustはTバックと手ぶら(今とは違い随分緩い)。いろいろ出だした時、FLASHで特集を組むことになり、何かカテゴリ名がないとマズいと言うことで、着メロにひっかけ着エロと決まったのが由来となっている。

2002年9月17日発売号に8pの特集が載り、その内半分の4pが筆者が撮った写真。つまり着エロ元祖カメラマンの1人だ(笑)。もちろん普通のイメージビデオも撮っており、有名どころだと熊田陽子 / RAINBOW [DVD]@2004年は100%筆者だったりする。

2001年にNkion D1Xを購入しているので(続いてNikon D2X@2005年も)、途中から切り替わっているが、1日数千枚とか、とにかく鬼のように撮り、月の半分は南国ロケと言う日々が数年続いた。

その後、グラビア業界は縮小傾向となり、グアム/サイパンが沖縄へ、そして伊豆、最後は都内のハウススタジオ…。ギャラも下手すれば1/10まで下がり、固執してるとまずいと言うことで今はプログラマーへ逆戻り。ここ数年は仲間内や昔世話になった人から連絡があったりすると撮影に行く程度。去年はこのパターンで森咲智美や橋本梨菜も撮っている。

実は本サイトでも文字は書いていないものの、写真は撮っており、”Niantic創業CEOジョン・ハンケ氏インタビュー:『現実世界のメタバース』とARの未来”のジョン・ハンケ氏などは筆者担当だ。

前置きが長くなってしまったが、そんな筆者がAI生成画像にハマり、Twitterなどで画像を掲載していたところ、編集長から連絡があり、本連載開始となったのが今回の経緯となる。

西川和久の記事一覧 | テクノエッジ TechnoEdge

連載第二回はこちら。





《西川和久》
西川和久

1962年生まれ。プログラマー、IT系ライター、カメラマン(主にグラビア)と、三足の草鞋になってもう四半世紀。

特集

BECOME A MEMBER

テクノエッジ友の会に登録しませんか?

今週の記事をまとめてチェックできるニュースレターを配信中。会員限定の独自コンテンツのほか、イベント案内なども優先的にお届けします。