※【この記事にはプロモーションが含まれています】

Stable DiffusionでAI画像生成するときのプロンプトの書き方・コツ

★ご訪問ありがとうございます!
おすすめサービス

AI画像生成するときのプロンプトの書き方が知りたい

という方もいるかもしれません。

AI画像生成では、プロンプトと呼ばれるキーワード、文章などによって、生成AIに生成する画像について指示を出します。

いざプロンプトを書こうとしたとき、あれ、どう書いたらいいの? という方もいると思います。

そんな方のために、今回はプロンプトの書き方の基本についてお伝えしていきます。

プロンプトの基本的な書き方が知りたい、という方は記事を読んでみてくださいね。

ブラウザだけでできる 本格的なAI画像生成 【ConoHa AI Canvas】

※正しい情報の掲載に努めておりますが、記事内容の正確性を保証するものではありません。また情報が古くなっている可能性があることもご承知おきくださいますようよろしくお願い申し上げます。

AI画像生成とは

AI画像生成とは、文字通り人工知能(AI)によって画像を生成することです。

具体的には、プロンプトという指示文を入力することで、それに沿った画像を生成することになります。

※ツールやサービスとしては画像生成AIと言ったりもします。

代表的なAI画像生成ツール「Stable Diffusion」

AI画像生成を行うときの代表的なツールとしては「Stable Diffusion(ステイブルディフュージョン)」が有名です。

Stable Diffusionは、いわゆる画像生成AIになります。

Stable Diffusionとは

Stable Diffusionは、イギリスのStability AIという企業が開発した画像生成AIです。

Stable Diffusionの主な特徴

  • テキストを元に自動で画像が生成できる
  • アルゴリズムに潜在拡散モデルが使われている
  • 無料で利用できる(オープンソース)
  • 作成枚数に制限がない
  • 生成した画像の商用利用ができる

関連記事

「Stable Diffusion」で簡単にAI画像生成ができるおすすめ無料・有料サービス

Stable Diffusionは、画像のスタイルを決めるモデル(潜在拡散モデル)といわれるアルゴリズムを使って画像生成をおこないます。

モデルを使うことで、生成される画像のスタイル(アニメ風、リアル、イラスト調など)が変わってきます。

またLoRAと呼ばれるモデルから追加学習をおこなった調整用のファイルを利用することによって、あらかじめ生成される画像の方向性をある程度決めることができます。

LoRAを利用することで、例えば生成する人物の髪型やポーズなどを自由に決めることが可能になります。

LoRAやモデルはCivitaiHugging Face というサイトでダウンロードできます。

Stable Diffusionを利用する方法

Stable Diffusionを利用する方法としては、

  • パソコンにStable Diffusion Web UIをダウンロードしてローカルで利用する方法
  • Web上のサービスで利用する方法

があります。

「Stable Diffusion Web UI」をダウンロードしてローカルで利用する場合は、パソコンにある程度のスペックが必要になるのでWeb上のサービスで利用するのが手軽でおすすめです。

推奨されているパソコンのスペック

  • メモリ:16GB以上
  • CPU:Corei5〜Corei7、Ryzen5〜7
  • GPU(グラフィックプロセッサ):VRAM12GB以上
  • OS:Windows(64bit)
  • ストレージ:512GB以上

※PCはデスクトップ型が推奨されています。

Web上でStable Diffusionが使えるサービスとしては、様々なものがあります。

以下の記事でもいくつか紹介しているので参考にしてみてくださいね。

「Stable Diffusion」で簡単にAI画像生成ができるおすすめ無料・有料サービス

プロンプトの書き方 ※Stable Diffusionの場合

AI画像生成では、前述したようにプロンプトといわれる指示文を入力することで、その指示に沿った画像が生成されます。

希望する画像を生成するには、的確なプロンプトを入力する必要があります。

プロンプトの基本的なルール

まずプロンプトの基本的なルールとしては、

  • 大文字と小文字の区別がない。
  • プロンプトを区切る場合は間に「,(カンマ)」を入れる(または改行することでも区切ることができる)
  • 文章でもOK
  • 先に書いた要素が優先される
  • かっこ()で単語を囲むと1.1倍に強調される ※コロン:で倍率を指定して強調することもできる

ということがあります。

Stable Diffusionのモデルは基本的に日本語のプロンプトには対応していないので英語でプロンプトを書いていくことになります。

※日本語モデルのJSDXLや拡張機能を使うことで日本語での利用は可能になります。ただ生成の精度が極端に下がるという話もあります。

大文字と小文字の区別がない

プロンプトは大文字と小文字を区別しません。

「dog」と「DOG」「cat」と「CAT」のように、大文字であっても小文字であってもプロンプトとしては同じ扱いになり、生成結果に違いはありません。

プロンプトを区切る場合は間に「,(カンマ)」を入れる(または改行することでも区切ることができる)

プロンプトを区切る、あるいは2つ以上のプロンプトを書く場合は「,(カンマ)」を入れるようにします。

例:「dog, run」

のように間にカンマを入れる。

※カンマの後に半角スペースを入れるのが一般的ですが、入れなくても問題ないとされています。

文章でもOK

プロンプトは単語だけでなく文章で記載してもOKです。

例:「girl is running, smile」

文章でより具体的な内容にすることで、希望の画像が生成されやすくなります。

先に書いた要素が優先される

プロンプトでは、先に書かれたことが優先されます。

つまりプロンプトに書かれる要素の順番によって、生成される画像で優先される内容が変わってきます。

優先したい要素は先に書くことが基本になります。

プロンプトを書く順番について

プロンプトを書く順番については様々な情報があります。

例えば

「主語、動詞、形容詞、背景」

の順番で書くというものや

「画像全体のイメージに対する指示、メインの要素(主役となるモノ、人物など)、特徴や服装など、背景や構図など」

という順番で書くというものなどがあります。

ただしこれらは、一応の目安と考えて試行錯誤をしていくのがいいと思います。基本的には先に書かれたことが優先されることを意識しておきましょう。

かっこ()で単語を囲むと1.1倍に強調される ※コロン:で倍率を指定して強調することもできる

かっこ()で囲むことでその言葉を強調することができます。

※囲まれた言葉は1.1倍に強調されます。

dog, run, (smile)

のように強調したいキーワードをかっこで囲みます。

強調することでその内容が生成画像に反映されやすくなります。

((smile))

のようにかっこを重ねてさらに強調することもできます。※かっこを増やすことでより強調することができます。

逆に

[smile]

のように[ ](角かっこ)で囲うと影響を弱めることができます。 ※角かっこを重ねるとさらに弱めることができます。

●「:(コロン)」と数字で強調する方法

強調は「:(コロン)」のあとに数字を記載することでも強調することができます。

dog, run, blue sky:1.5

のように記入すると影響を1.5倍にすることができます。

弱める場合は

dog, run, blue sky:0.7

のように記入します。

プロンプト作成のコツ

プロンプト作成のコツとしては

具体的な内容を記載(指示)する

ということです。

生成したい画像の内容を明確にわかりやすく指示することで、より希望する画像を生成することができます。

例えば、「可愛い女の子」とだけ指示(記載)するよりも「ショートカットで風船を持った笑顔の10歳くらいの女の子」とより具体的に記載することが大事です。

指示されていないことは、AIが独自に画像を補おうとするので希望する画像からかけ離れた画像になってしまう可能性が大きくなってしまいます。

なるべく具体的に、明確に、わかりやすく、を意識してプロンプトを作成することが一つのコツになります

高品質な画像を生成するには

高品質な画像を生成する方法として、高品質な画像の生成を指示するプロンプトを記載しておく、ということがあります。

例えば、冒頭に以下のようなプロンプトを記載しておくことで、高品質な画像の生成を指示することができます。

高品質な画像を指示するプロンプトの例

  • 4k quality(4Kクオリティ)
  • 8k quality(8Kクオリティ)
  • beautiful(美しい)
  • best quality(最高品質)
  • high quality(高品質)

など。

※コロンやかっこを使って強調しておくと高品質が反映されやすくなります。

ネガティブプロンプトとは

ネガティブプロンプトは、生成画像に含みたくない要素のことです。

Stable Diffusion WebUIにはネガティブプロンプトの入力欄があるので、

画像に含みたくない要素をネガティブプロンプトとして入力しておくと、画像に反映させることができます。

品質に関するネガティブプロンプトの例

  • low quality(品質が低い)
  • worst quality(最悪の品質)
  • out of focus (ピントが合っていない)

など。

以下のように、コロン(:)と数字でネガティブプロンプトを強調しておくこともできます。

worst quality:1.5

試行錯誤してみることが大事

画像生成のコツやテクニックとされていることは色々ありますが、結局、実際に画像生成しながら試行錯誤してみることが大事になります。

生成画像のプロンプトもたくさん公開されているので、そういった情報を参考にしてみるのもいいと思います。

ただ、全く同じプロンプトでも同じ画像を生成するとは限らないので、そういったところもAI画像生成の面白いところですよね。

Stable Diffusionが使えるおすすめ画像生成AIサービス

ConoHa AI Canvas公式サイトより画像引用。

Stable Diffusionが利用できる、AI画像生成でおすすめのサービスはレンタルサーバーサービス「ConoHa WING」や「ConoHa VPS」などでも有名なGMOインターネット株式会社が運営する

ConoHa AI Canvas

になります。※安心の国産サービスです。

WebUIには「AUTOMATIC1111」を採用しています。

ConoHa AI Canvasは、Webブラウザ上で「Stable Diffusion XL」が利用できるサービスです。

ConoHa AI Canvasのメリット

  • ハイスペックなパソコンを用意する必要がない
  • NVIDIAの最新GPUがクラウド上で使える
  • 枚数や機能の制限がない
  • 日本語表示に標準対応している
  • 月額990円から利用できる ※2025年2月22日時点。

ConoHa AI Canvas

ConoHa AI Canvasの料金プラン

ConoHa AI Canvasの料金プランは以下のようになっています。

ConoHa AI Canvasより画像引用。※2025年3月5日時点。

プランはストレージ容量によって

  • エントリー
  • スタンダード
  • アドバンス

の3つがあります。

※ストレージ容量によって画像の保存容量が変わってきます。

利用料金は

基本料金(定額)+ WebUI利用料金6.6円/分

となっており、基本料金(定額)とWebUIを使った分が課金される従量課金になっています。

各プランには

  • エントリー:毎月10時間
  • スタンダード:毎月50時間
  • アドバンス:毎月100時間

のWebUIの利用が無料の時間が割り当てられています。

尚、プランの変更が可能になっています。

関連記事

今回の記事の関連記事になります。

画像生成AIならPICSOROBAN

Stable DiffusionでAI画像生成するときのプロンプトの書き方 まとめ

というわけで今回は「Stable DiffusionでAI画像生成するときのプロンプトの書き方」についてお伝えしました。

プロンプトは書き方の基本を押さえたら色々と試行錯誤してみることが大事です。

AI画像生成は有料プランが多いですが、無料で利用できるところもあるので興味がある方はチェックしてみてくださいね。

「Stable Diffusion」で簡単にAI画像生成ができるおすすめ無料・有料サービス

無料でお手軽、簡単にAI画像生成ができるサイトを紹介

というわけで今回は以上になります。

最後までお読みいただきありがとうございました。

ブラウザだけでできる 本格的なAI画像生成 【ConoHa AI Canvas】