PR

AIとゲームつくる│Geminiの実力 ①画像生成

AIとゲームつくる
PR
PR

Geminiの実力

コーディングでは

Geminiは頭はそこまでよくない
一度の質問でたくさんの情報を詰め込んで質問すれば結構優秀だよと言ってくるのだけど
それでは非常に使いにくい 

Vibe Codingではコードが動くか エラーがでるか 段々と状況が変化する訳で その際に前提が引き継げていないと毎回前提を入力しなくちゃいけない事になるからすごく使いにくい

Geminiの一番弱いのは文脈の保持能力 鳥頭とでもいうのか 数回の質問ですぐに前の質問を忘れてしまう事 だから 優秀らしいんだけど全然使えない

画像生成では(マルチモーダルとしては)

マルチモーダル方向では現状 Geminiが最も有用性が高い

Grokの生成する画像や動画は権利関係が怪しい権利意識の低そうな画像や動画を出してくる
ChatGPTの生成する画像は権利意識は結構あったんだけど Sora2でOpenAIの権利意識の低下がみられており ChatGPTの生成するメディアの権利関係に信頼がおけなくなってきている



さらに画像のクオリティにおいてもGeminiはもうChatGPTを超えたと思う

でもってMidjorneyとかの画像生成特化のAIはGemini等のマルチモーダル化したチャットAIに淘汰されると思う。何故ならGeminiの画像生成はもう大抵の事には十分なクオリティになっており 手軽で 回数制限も緩い そして Googleは権利関係もちゃんと配慮をした学習をさせてるとみられ OpenAIの画像や動画よりも信頼ができそうだからだ

Stable Diffusionだけはエッチなのが出せるという事で生き残ると思う

武器スロット画像としてGeminiにだしてもらった画像

加工した画像

加工したとして出してる↓の画像は

以下のように16セクションで出したモノを

GIMPで
ホーミングミサイルはカットして左右反転
シールドフィールドはカット&色調整をしたもので

動画で扱うと冗長になるのでその辺の説明は省いています
(右下のマークでわかるようにこっちは最新のGemini 他のは旧版のGemini)

コメント

タイトルとURLをコピーしました