ControlNet-Preprocessor?

Text-To-Imageでの画像生成を行う際にControlNetという
凄まじくざっくり言うと自分もまだ元論文読んでないどのような画像かを
指定する方法があります

その前にプリプロセッサという前処理を行うツール群があるのですが
これ自体が他用途でも便利そうだったのでリストにしておきます
そもそも画像認識分野の話に見えるので単独で詳細なものがありそうかな?

リスト

トップ画像に使用したもののリスト
それぞれの種類の中でもいくつか種類があります

  • 1.元画像
  • 2.lineart_realistic
  • 3.softedge_hed
  • 4.depth_reles++
  • 5.normal_midas
  • 6.scribble_hed
  • 7.seg_ofcoco *
  • 8.openpose
  • 9.mediapipe_face

* segとはsegumentation、画像認識での種類分け

深度や法線は3D関連で、segはゲーム内の振る舞いに使えそうで素敵
UnityやUEで画像に法線を適用して見てみたいですね