PR

AIに画像を認識させるテクニック　⑤重なりとポーズをわからせる

AI

2025.10.25

PR

昨今　チャットAIのマルチモーダル化状況において
画像生成能力が著しく高まってきており(特にGemini)

本シリーズのテクニックは通常の画像生成においては
陳腐化してきているテクニックだと思うので
(細かい指定においては依然として有効だけど)

これをシリーズの最後とするのだ

Midjourneyとかはおそらくマルチモーダル化したチャットAIに淘汰されるだろう
Stable Diffusionだけエッチなのが出せると言う強みがあるからこいつだけ残ると思う

これに関しては各AI達は皆僕に同意しているのだ

元々Youtubeの動画の宣伝という意図があったのだけれども
このシリーズに関しては動画の再生数の方が多くて
むしろブログの表示回数の方が壊滅的なのだ

そして新しく始めた動画のシリーズの再生数が壊滅的なので
これからブログではそちらを援護しようと思ってるのだ

さて　今回は　モノの重なりをわかりやすくするための
i2iテクニックなのだ

PR

目次

簡単なポーズをAIにわからせる　ChatGPTの場合
簡単なポーズをAIにわからせる　Stable Diffusionの場合
複雑なポーズや重なりをわからせるテクニック
別々の物体をわかりやすくするテクニック

簡単なポーズをAIにわからせる　ChatGPTの場合

これがなににみえるか描いて

この画像は、一見すると抽象的な人物のシルエットのように見えます。具体的には、以下のように解釈できます：

人物が片足を高く上げてバレエや新体操のようなポーズを取っている。
顔にはシンプルな表情（目・眉・口）が描かれていて、にっこりと微笑んでいる。
体全体はピンクベージュの色で塗られており、背景は黒で人物が目立つようになっている。
全体の描画がざっくりしていて、スケッチ風あるいは粘土細工のような印象もある。

なので、この絵は「片足を上げてポーズを決めている笑顔の人物」と表現できると思います。

もっとユーモラスに表現するなら：

「片足を高々と上げてご機嫌に踊る、のっぺらぼうダンサー」

どう描きたいかの方向性（可愛い・面白い・不気味など）があれば、それに合わせて描き起こすことも可能です。どうしますか？

御託は良いから、何に見えるか自分で見て見えた絵として完成させて

まあ　そうなんだけどさ

リアルな絵で完成させて

　　　　!?

じゃあこれは

どの辺がリアルなのだ…
まぁ…ポーズの認識に問題はないよね…
だから　ＯＫといえばＯＫ…

簡単なポーズをAIにわからせる　Stable Diffusionの場合

これは？

正解です

じゃあこれは

正解です

じゃあこれは

おーけー
とまぁ　簡単なポーズなら
簡単に認識させる事ができるのだ

複雑なポーズや重なりをわからせるテクニック

こういう傾斜のあるポーズなら
部位ごとにわかりやすく色を変えると認識しやすくなったりするのだ

別々の物体をわかりやすくするテクニック

これも同じで
色をわけちゃうと認識しやすくする事ができるのだ

ChatGPT

Stable Diffusion

ChatGPT

Stable Diffusion

ChatGPT

Stable Diffusion

チャットAIに伝える際にも
有効なテクニックになってくる可能性もあるのだ

コメント

タイトルとURLをコピーしました