Editor profile
矢野 哲平 / 「無料で学べるAIスキル、ロボシンク」代表
更新日:

Gemini(Bard)でアップロードできる画像ファイル

Googleの生成AIであるGemini(Bard)では画像をアップロードできます。画像をアップロードする方法やどの画像ファイルが対応しているのか解説します。

Gemini入門コースを公開

Geminiを学べるコースを公開しました🎉無料で学ぶことができます。興味のある方はぜひ!

Gemini入門コース - ロボシンク

Bardでアップロードできる画像ファイル

※2024年2月9日からBardはGeminiに名称変更へ

Bardでは画像ファイルをアップロードしてAIに認識させることができます。

対応する拡張子は、JPGやPNG、WebPなど。ただし、AVIFは現時点で対応していないので注意しましょう。

画像をアップロードする方法

チャットボックス左側にあるクリップアイコンからアップロードできます。

bard upload

基本的な使い方としては、画像アップロード + プロンプトで指示を与えます。

画像を判別させる

プロンプト

※画像をアップロード
写真に写っているものを説明してください

bard cat

画像の文字を認識させる

プロンプト

※画像をアップロード
画像に含まれている文字を教えてください。

bard text

画像生成AIのプロンプトの参考に

こういった使い方もできます。

例えば、ある画像を画像生成AIのMidjourneyDALL-E 3で生成したいとします。

この時に、プロンプトを入力するのですがBardに画像を英語で説明してもらいましょう。

プロンプト

※画像をアップロード
画像を英語で説明してください

bard image

元画像をベースにDALL-E 3で再生成してみました。色合いが違いますが全体的な構図は似ています。

dalle3

XではAIの最新ニュースやプロンプト、活用アイデアを発信しています。フォローよろしくお願いします!(@robothink_jp)


無料で学べるAIスキル、ロボシンク

ロボシンクは4,000名超が学ぶAI学習サービス。無料のコースで生成AIを学べます。AIの学習を開始しましょう🚀

コース一覧