Flux.1 schnellで複数キャラの独立

Flux.1 schnellで複数キャラの独立
2026/02/25

 SD1.5モデルでは、複数キャラを他キャラの影響から独立して描くのは至難です。 たとえ Regional Prompter を導入したとしても、 描きわけられるのはよくて 2人までで、プロンプトの設定はきわめて煩雑です。

 前回書いた記事のように、Flux.1 で Lora を使えば、この状況はかなり改善されます。 しかし、Flux.1 dev は非商用の利用しか許可されていないため、 将来を考えると商用利用可の Flux.1 schnell にしたほうがいいと思え、 そうするととたんにネットの情報量が減って、設定が困難になります。 また、ComfyUI を中心にした中華系 AI画像ツールは 開発が活発で品質は急速に向上していますが、 訓練データに著作権を無視したものが使われて問題になるものが多く、 折角作ったはいいが使えないとなることも考えられ、あまり使いたくありません。

……そんなわけで、Stable Diffusion WebUI forge 上で Flux.1 schnell を使用するという選択にたどりついたわけです。 この環境下では、画像サイズの横幅が十分に大きければ(1500px 以上)、 多数のキャラの混在は比較的容易です。 2人は余裕で、3人の場合も構図が単純なら割と簡単に描くことができます。 しかし、人数が 4人となってくると途端に難しくなり、 満足のいく画にたどりつくまでに数十枚の画を無駄にする、などということが起こります。 次の画は4人の Lora を使ったプロンプトとその失敗の画像群です (服装が指示通りでない、人数がおかしいなど)。

masterpiece, anime,
<lora:shota:0.3>
<lora:shinichi:0.3>
<lora:haruka:0.3>
<lora:mineyama:0.3>
haruka, shota, shinichi, and mineyama are laughing together.
haruka has clear black eyes, bob hair, brown hair, plump mouth.
shota has strong face and straight hair with a black bruise around his eye.
shinichi is scare minded and has wavy hair.
haruka, shota, shinichi are wearing gray blazers with no emblem and blue ties.
mineyama is wearing glasses, navy sweater and purple tie.

 下は、ようやくできたややましな画像です。 本当はグレイのブレザーになっていてほしいのですが、グレイのセーターになっています。 それはまだ許容できるとして、生徒の 1人のセーターの色が違います。

 しかたないので、GIMP でセーターの色をグレイに置き換えることにしました。 やり方は、画像の上に 1枚レイヤーを作り、問題のセーターだけを選択してここに貼り付けます。 ついでメニューの[色]>[カラーマッピング]>[色交換]を選択、青をグレイに置換します。 [元色]の横のカラーボタンをクリックし、スポイトアイコンで画像内の変更したい色をクリック、 [交換色]も同様にといいたいが無理なので、カラーボタンをクリック、あらかじめ調べておいた 色インデックス値を貼り付けます。 つづいて、[赤しきい値][緑しきい値][青しきい値]を調整しグレイになるようにして[OK]。 以下のようになります。

 ここで試してみたのが、SD WebUI forge の ControlNet です。 ここで checkpoint を sd の HimawariMix-v8 にして、ControlNet の inpaint を使ってみました。 青いセーターと手を選択し、Control Weight 0.5-6 程度、プロンプトは以下にしたところ、 次のような画像を得ました。

masterpiece, anime,
wearing gray sweater with no emblem and blue ties.

 シャツとネクタイは他の生徒と同じになったのですが、セーターがない、 生徒の体が細い、右端の先生の指がおかしいなどの問題が新たに発生。 SD1.5 環境の画像生成の問題が出てしまいます。 何とかならないでしょうか?

 そこで、セーターの色を GIMP でグレイにしたものに、問題の少年の首元だけを ControlNet の inpaint を使って描き直すことにしてみました。 Control Weight 1, My prompt is more impotant, Crop and Resize という指示で描画しています。 プロンプトは以下です。

masterpiece, anime,
wearing white shirt, gray V-neck sweater and blue tie.

 こうして、ようやく他の生徒と違和感のない画像になりました。 新しい ComfyUI を使うなど、他にも修正のしかたはありそうですが、 手持ちの道具で何とかするとしたら、現状はこんなところでしょうか。

コメント  記事が気に入ったらいいねしてね! 0  19  

Facebookシェア   
SD WebUI forge 上で Flux.1 schnell を使えば、多数のキャラの混在は比較的容易ですが限界もあります...
Flux.1 schnell 対応の Lora づくりを Linux 上でやるのは大変でしたが...
これからしばらく、ぼくの小説の挿絵環境についてのメモを書きていきます...