生成AIのモデルを変更して、画像の品質が大幅に向上「パンツの品質・種類を増やしていきます」

最近、画像生成に使うモデルのバージョンを上げて、画像の品質を上げることができたので、メリットやデメリットなどを共有したいと思います。

料理に例えて簡単にいうと、

「素材を豚肉→牛肉に変えて料理の質は上がった。ただし、今まで作り込んできた秘伝のタレが使えなくなり、細かい調整に苦労している」

という状況ですね。

さらにスコアで表すと、

40〜80点くらいの大量の画像から厳選してたのを、

70〜90点くらいの平均が出るようになったイメージでしょうか。

 

基本的に、成果の画像が肝心でその過程はどうでも良い、という方がほとんどだと思いますが、一応技術的な制限で出来なかったことなどが、少し解消されたので、情報を共有しておこうと思いました。

新モデルSDXL系に変えて感じたメリット

今回採用したのは、SDXL系というもので、今まで使っていた1.5系よりも2倍の解像度で学習した画像が元になっていて、端的にいえば精度が高く、より詳細な描写ができるようになりました。

以下、新しいモデルに感じてる主なメリット。

  1. 下着の表現力(パンツのシワ、種類など)が向上
  2. 下着や服など色指定などの成功率が向上
  3. 同一人物の精度が向上
  4. 手や足の精度(成功率)が向上
  5. 顔がより人間ぽい自然な感じに
  6. 従来生成できなかったポーズが追加

新モデルはデメリットも少なくないのですが、特に1〜4のメリットが大きく、旧モデルには戻れる気がしません。

どこかで皆さんにお伝えしたかったのですが、AI生成では色指定が結構難しくて、

命令:赤スカート、白パンツ

として、

赤スカート、赤パンツ

と指定以外の領域に色が混ざってしまうことが多いのです。

現在も100%ではないですが、この精度が大きくなったのはとても大きいです。

作りたい色とかも、成功率が極端に下がるため、避けていたりしたのです。

 

下着のディティールや種類の向上

もう一つ大きいのが下着の食い込み。バックのお尻側は割と旧モデルでも描写できてましたが、前から。例えばしゃがみや、足を上げたポーズのときに、食い込んだ描写の精度が向上しました。

正確には旧モデルでも頑張ると食い込んだりはしてたのですが、結構条件が限られていたり、顔や服装も濃いものになるデメリットがありました。

これは旧モデルで、食い込みは表現できてますが、顔も濃くなってます。

サンプル【まんぐり返し vol.01】パパ活女子がベッドやソファでM字・まんぐり返しであそこに食い込んだパンツがエロすぎた【羞恥・怪訝・怒り】

まんぐり返しのSDXLはまだ作ってないですが、おそらくもう少し自然に作れるようになるかなと。

 

今まで、下着の指定をすると、画像全体も崩れたりしてたので、新モデルでは下着や服装指定を考慮する余裕が生まれそう。下着もどんなパターンが作れるか研究していきたいです。

他にも、しゃがんだタイトスカートなど、作りたくても難しかった画像が割と描けるようになりました。このあたりは早く実際の画像で成果をお見せしたいところです。

ちなみに、ロングスカートもAIが苦手とするところで、SDXLな感触ですが、少しは精度が上がった印象なのでいずれチャレンジしたいです。

同一人物が作りやすくなった

同じ人物を狙って作るのは結構難しいのですが、SDXLに変えてから精度が向上しました。

この件は別途詳しくお話したいのですが、その技術を使って初めて作ったページが以下のものです。

【睦月美穂】アイドル撮影現場「清楚系美少女が白ワンピでしゃがむ姿がかわいい!偶然カメラに映ったアイドルの生パンツ!?」

 

SDXL系のデメリット

  1. 画像生成にかかる時間が長くなった(マシンスペックが必要でパーツを買い替えた)
  2. 拡張ファイルが充実してないため、画像の細かい指定が難しい
  3. 背景のクオリティがやや低い(正確にはSDXLの問題ではない)
  4. 生成できない背景や服装などがある(正確にはSDXLの問題ではない)
  5. 複数人の生成が難しい

料理に例えると、肉の品質は上がったけれど、今まで味の改良を続けてきた肉のタレが使えなくなった感じで、多くのツールが互換性がないため、使えなくなってしまいました。

  • 年齢の調整
  • 明るさの調整
  • ディティールの調整
  • ライティングの調整
  • 登場人数の調整

などなど。これらはツールなしでもある程度調整できるのですが、限界があるのでツールで補正できるとより確実。

味の調整(画像の質感など)をイチから勉強し直してる、というイメージですね。

これはSDXLの性能の問題ではないので、時間が解決していくとは思いますが、本当に少しずつ調整や新しいツールを見つけるなどして、向上を図ってるところです。

SDXLだと何でも高品質ではない

 

 

今後は新モデルをベースに、要所で旧モデルを利用か

これから、新モデル生成の画像を投稿していく予定ですが、実はすでに旧モデル生成による画像は、秋頃まで投稿準備がすんでいます。

よって、完全に新モデル生成の画像になるのは、2024年秋ごろになりそうです。

それまでは、主に旧モデルで、一部は新モデル生成の画像になると思います。

旧モデルでしか生成が難しい画像もあるので、テーマによっては今後も旧モデルを使うことがあるかもしれません。

もっとたくさん語りたいことはあるのですが、あとは画像として成果を見せていきたいと思います。