AIとゲームつくる│Geminiの実力 ①画像生成

Geminiの実力
1. コーディングでは
2. 画像生成では(マルチモーダルとしては)
武器スロット画像としてGeminiにだしてもらった画像
1. 加工した画像

Geminiの実力

コーディングでは

Geminiは頭はそこまでよくない
一度の質問でたくさんの情報を詰め込んで質問すれば結構優秀だよと言ってくるのだけど
それでは非常に使いにくい　

Vibe Codingではコードが動くか　エラーがでるか　段々と状況が変化する訳で　その際に前提が引き継げていないと毎回前提を入力しなくちゃいけない事になるからすごく使いにくい

Geminiの一番弱いのは文脈の保持能力　鳥頭とでもいうのか　数回の質問ですぐに前の質問を忘れてしまう事　だから　優秀らしいんだけど全然使えない

画像生成では(マルチモーダルとしては)

マルチモーダル方向では現状　Geminiが最も有用性が高い

Grokの生成する画像や動画は権利関係が怪しい権利意識の低そうな画像や動画を出してくる
ChatGPTの生成する画像は権利意識は結構あったんだけど　Sora2でOpenAIの権利意識の低下がみられており　ChatGPTの生成するメディアの権利関係に信頼がおけなくなってきている

さらに画像のクオリティにおいてもGeminiはもうChatGPTを超えたと思う

でもってMidjorneyとかの画像生成特化のAIはGemini等のマルチモーダル化したチャットAIに淘汰されると思う。何故ならGeminiの画像生成はもう大抵の事には十分なクオリティになっており　手軽で　回数制限も緩い　そして　Googleは権利関係もちゃんと配慮をした学習をさせてるとみられ　OpenAIの画像や動画よりも信頼ができそうだからだ

Stable Diffusionだけはエッチなのが出せるという事で生き残ると思う