Geminiで画像生成する方法
Googleの生成AIであるGeminiで画像生成する方法を解説します。ChatGPTでも画像生成できますが、有料版でないと画像生成はできません。その点、Geminiは(現状)無料で画像生成できます。
Geminiで画像生成できる。ただし注意点も
こんにちは、ロボシンクの矢野(@robothitnk_jp)です。Googleが提供する生成AIのGeminiでは画像生成もできます。
ただし、いくつかの注意点もあります。この記事では少し深掘りした内容を解説していきます。
👨💻対象読者
- Geminiで画像生成したい
- Geminiの画像生成の現状を知りたい
🎉記事を読むとできること
- Geminiの画像生成における制限を理解できる
- Geminiで画像生成ができるようになる
注意点
いずれも、「現状」という前置きが付きますが、Geminiで画像生成をするには下記の制限に注意しましょう。
- 人物画像の生成はできない
- 日本語のプロンプトは通らない
- アスペクト比の指定はできない
注意点1️⃣: 人物画像の生成はできない
これですね、以前は生成出来ていたんですよ?
リリース当初はこんな感じで人物の画像生成が出来ていました。
しかし、現状は人物の画像生成はストップされています。背景として人物の画像生成で起こるハルシネーションに批判が集中したためです。
そのため、Google側がいったん人物生成をストップしているというわけです。ちなみに、人物以外の生成は可能です。
注意点2️⃣: 日本語のプロンプトは通らない
もう一つの注意点として画像を表現するプロンプトは英語で書く必要があります。日本語だと現時点ではエラーが発生します。画像の説明部分は英語で入力しましょう。
Geminiのチャット上で日本語→英語に翻訳できるので、日本語を英語に変換してから指示できます。その他の翻訳ツールも使えば問題ありませんが、少し面倒ですね。
注意点3️⃣: アスペクト比の指定はできない
(現状)アスペクト比の指定ができない点にも注意しましょう。アスペクト比、つまり縦横の比率が指定できません。
アスペクト比の指定も先で実装されるとは思います。
Geminiで画像を生成する方法
次にGeminiで画像を生成してみましょう。
やり方はいたってシンプルです。プロンプトで画像を生成してと英語で指示するだけです。プロンプトを入力する場所はチャットボックスとなります。
レストランのテーブルの上に置かれているパスタとワインと指示します。
生成した画像をダウンロードする
生成した画像にカーソルを合わせればダウンロード可能です。
生成後に会話を重ねる
画像生成後に会話を重ねて画像を修正できます。
例えば、先ほどのパスタの画像では赤ワインが生成されていました。これをシャンパンに変えてみましょう。
うまく機能していますね!ちなみに会話を重ねる時も英語となります。
興味のある方はぜひ試してみてください✌️
XではAIの最新ニュースやプロンプト、活用アイデアを発信しています。フォローよろしくお願いします!(@robothink_jp)
無料で学べるAIスキル、ロボシンク
ロボシンクは4,000名超が学ぶAI学習サービス。無料のコースで生成AIを学べます。AIの学習を開始しましょう🚀