[お知らせ: 当サイトは2024年8月をもちましてnote(ロボシンク)に統合します]

Stable Diffusionで人物を描く

Name: Stable Diffusionで人物を描く
Availability: InStock

このセクションではStable Diffusionで人物を描く方法を解説します。画像生成にはStable Diffusion内蔵の画像生成サービスDreamStudioを使用します。

シンプルなプロンプトでも画像は生成できる

Stable Diffusionで人物を生成する場合、シンプルに「man」や「woman」と入力しても問題なく生成されます。

試しに単一のプロンプトで画像を生成してみます。

生成する度に画像は変わりますが、高品質な画像が生成されるのが分かります。

シンプルなプロンプトでも、それなりに高品質な画像は生成されます。しかし、イメージに沿った画像が必ずしも生成されるとは限りません。特に業務で画像生成を使う場合、要望に沿った確度の高い画像が求められます。

こうしたケースでは、生成したい画像をゴールとして設定し条件を満たすようプロンプトを追加していきます。基本的には以下のような条件を追加していきます。

さらに人物写真の場合、「A professional color photograph(プロのカラー写真)」「fujifilm(フジフィルムのカメラで撮影したという意味)」などのプロンプトを含めると良い結果が得られます。

それでは先にゴールを決めて画像を生成していきましょう。シンプルなプロンプトからスタートしプロンプトを追加していく過程でどのように変化していくか見ていきます。

チュートリアルでは、以下のような条件の画像をゴールに生成します。

プロンプトは日本語よりも英語の方が精度が高くなります。Google翻訳やDeepLのような翻訳サービスを使い英語で入力します。

「20-something woman」のプロンプトで出力します。

女性という指示以外はないので、この時点で目的に沿った画像は生成されません。

「Woman in her 20-something with blue eyes and blonde hair」のプロンプトで出力。

まだ花嫁らしい画像は生成されません。

次にウェディングドレスを追加してみましょう。「20-something woman with blue eyes and blonde hair in wedding dress」

ウェディングドレスというプロンプトでAIが「結婚式」「花嫁」というワードを想起しているのが分かります。

最後に場所などのプロンプトを盛り込み仕上げていきます。最終的なプロンプトは以下のように入力しました。

「A professional color photograph, 20-something bride with blue eyes and blonde hair in a pure white dress in a church」

イメージ通りの画像が生成できました。

このようにゴールを決めてプロンプトを細分化していくとイメージに沿った画像を生成することができます。