シンプル・スマートな画面録画ソフト EaseUS RecExperts
ChatGPTの活用方法を学ぶならUdemy【初回ユーザ限定・最大91%割引】

ChatGPTについて詳しく解説します

【速報】ChatGPTの機能で直接画像生成が可能になりました

 

  • 画像生成AIのプロンプトをChatGPTで自動で作れるようにしたいです!
  • そのためのルールや条件付けを教えて下さい
  • そのプロンプトから生成されたイラストも実際に見せてくれ!

この記事では、以上の疑問にお答えします。

 

文章生成系AIであるChatGPTと、画像生成系AIのStable Diffusion

この2つを組み合わせて、AIに全自動でイラストを生成させることが出来るのかどうかを考えてみました。

 

ChatGPTは文章生成に強みのあるAIですので、Stable Diffusionに指示を出すプロンプト(文章)を作ることも、もちろん可能です。

この記事では、ChatGPTにStable Diffusionのプロンプトを生成する方法についてまとめています。

それではいきましょう。

 

Stable Diffusionのインストール方法はこちらにまとめています

 

 
【新機能】わからないことはAIに聞いてみよう
質問内容を入力すると、皆さんの疑問にAIがお答えします。

※当機能は現在ベータ版です。 予告なく公開終了する場合があります。

この記事のポイント!

  • 画像生成AIは英単語の羅列で指示をする
  • 英単語の羅列を自動生成することがChatGPTから可能
  • ChatGPTにルールフォーマットを指示すれば、その通りに動いてくれる
 
ChatGPT書籍に当ブログの記事が掲載されました!
📘Chrome拡張×ChatGPTで作業効率化
著:I/O編集部

TipstourのChrome拡張記事を寄稿しました!

工学社さんより、ChatGPT×Chrome拡張機能を使ってより便利にChatGPTを活用する方法をまとめた書籍に、当ブログの記事が本書の1章に掲載されています。

【前提】Stable Diffusionのプロンプトを出力するようにChatGPTに指示すればOK

さて、Stable Diffusionなどの画像生成AIでイラストを生成するには、「プロンプト」と呼ばれる、英単語の羅列によって、生成される画像が変わってきます。

ChatGPTは日本語である程度適当に入れれば、そこから話を膨らませて文章を返してくれますよね。

しかし、Stable Diffusionなどの画像生成AIは現在は「日本語の文章」には対応しておらず「英単語の羅列」でのみ、指示をすることが出来ます。

 

そのうえで、どうやってChatGPTを活用するかですが、英単語の羅列でしか画像が生成できないのであれば、入力した日本語を英単語の羅列に変換してくれるようにChatGPTに指示すればいいのです。 

ChatGPTは文章生成については非常に優秀です。

事前にフォーマットを明確に決めてあげれば、基本的にその通りに動いてくれます。

入力するたびに生成内容やフォーマットが変わることもありますが、あらかじめ「ルール」「フォーマット」をしっかりと支持しておくと、その通りに文章を出力してくれるようになります。

 

  ちなみに、MidjourneyNovelAIなどのその他の画像生成サービスも、同じ形式の英単語の羅列によるプロンプトで指示を出すことになります。

そのため、今回ご紹介する方法を使えば、ChatGPTで同様にプロンプトの生成が可能です。

【手順】Stable Diffusionにイラストのプロンプトを作ってもらう方法

ということで、ChatGPTにStable Diffusion向けのプロンプトを作ってもらうための指示文章がこちら。

新しいチャットを開いて、以下の文章をそのままペーストしてみてください。

【ルール】
AIにイラスト生成の指示を出すプロンプトを作成します。
これから入力する文章を、形容詞・動詞・名詞のみを使用してキーワードリストを作成してください。
英語のキーワードにしてください。
キーワード数は10個以上、30個以内にしてください。
その他の情報は不要です。

【フォーマット】
keyword, keyword, keyword, (以下ループ)

 

上記のルールとフォーマットを事前に設定しておき、このあとに続けて具体的な文章を日本語で指示していく、という形です。

いくつかルールを設定していますが、キーワード数については、数の多い・少ないによってイラストのクオリティにも影響することがあるので、そこは随時、皆さんの使っているモデルなどによって調整していただければと思います。

また「その他の情報は不要です。」というのは、プロンプト以外に出力される余計なチャット部分を出力しないようにする手順です。

 

まずはチャットの冒頭で上記の文章をそのまま入力します。

すると、ChatGPTはその時点で英単語の羅列を返答として返してきます。

この時点ではまだ何も指示をしていないので、表示されているのは完全にランダムな内容ですが、下準備はOKです。

 

このチャットに続いて、皆さんが生成したい画像のテーマ、イメージを入力していきましょう。

これでプロンプトの形で、返事を返してくれるようになるはずです。

【実演】ChatGPTが生成したプロンプトで

ということで、上記のルールを設定した後に、入力した内容とプロンプト、そして実際に生成された画像を合わせて掲載しておきますね。

見出しの「」の部分が、実際にChatGPTに入力した内容、

そしてその下の「出力されたプロンプト」が、ChatGPTが生成してきたプロンプトという感じです。

実演①「東京、渋谷の夜景」

出力されたプロンプト

Tokyo, Shibuya, night, cityscape, illuminated, vibrant, bustling, neon lights, skyscrapers, Shibuya Crossing, energetic, modern, bustling streets, lively, captivating, mesmerizing, nightlife, urban, dynamic, vibrant colors

実演②「宇宙に浮かぶ、宇宙服を着た猫」

出力されたプロンプト

floating, cosmic, astronaut, cat, space, spacesuit, feline, universe, celestial, galactic, playful, adorable, curious, mesmerizing, interstellar, zero gravity, purring, exploring, otherworldly, cosmic dust

実演③「お菓子の山、パフェ、たくさんのお菓子」

出力されたプロンプト

mountain, dessert, parfait, sweets, confectionery, sugary, colorful, indulgent, delectable, tempting, delightful, abundance, variety, mouthwatering, decadent, creamy, sprinkles, chocolate, whipped cream, fruity, caramel, confection, dessert tower, sugary treats, luscious, treat-filled

実演④「森の中、ファンタジー世界の魔法使い」

出力されたプロンプト

forest, fantasy world, wizard, magic, enchanting, mystical, ancient trees, shimmering, ethereal, spellbinding, whimsical, magical creatures, bewitching, arcane, hidden pathways, swirling mist, spellbook, wand, mythical beings, secret realm, fantastical, eldritch, enchantment, whimsy, sorcery, mysterious

実演⑤「ニューヨークの街並み、ストリートアート」

出力されたプロンプト

New York, cityscape, urban, street art, vibrant, colorful, graffiti, murals, creativity, expressive, eclectic, urban culture, artistic, captivating, lively, bustling streets, spray paint, stencils, tags, visual storytelling, public art, vibrant colors, transformative, contemporary, edgy, cultural expression, artistic rebellion

実演⑥「屋久島」

出力されたプロンプト

Yakushima, island, nature, lush, pristine, ancient forest, UNESCO World Heritage Site, moss-covered, towering trees, diverse flora and fauna, hiking trails, natural beauty, serene, waterfalls, wildlife, unique ecosystem, cedar trees, rejuvenating, mystical, spiritual, ecological significance, conservation, nature reserve, biodiversity, enchanting, remote, tranquil

実演⑦「ビットコインで投資する投資家、大儲けするイメージ、価格のチャート、最先端の技術、IT」

出力されたプロンプト

Bitcoin, investment, investor, lucrative, profit, cryptocurrency, financial gains, price chart, volatility, high returns, digital asset, cutting-edge technology, blockchain, decentralized, secure, innovation, digital currency, disruptive, financial revolution, digital transactions, peer-to-peer, decentralized finance, fintech, IT advancements, cryptocurrency market, digital economy, wealth accumulation

 

Stable Diffusionでもっと良い画像を生成したいなら
created by Rinker
¥2,200 (2024/06/26 00:49:06時点 Amazon調べ-詳細)
 
この記事で解決しなかった疑問は疑問はAIに聞いてみよう
質問内容を入力すると、皆さんの疑問にAIがお答えします。

※当機能は現在ベータ版です。 予告なく公開終了する場合があります。

まとめ

以上、画像生成AI・Stable Diffusionのプロンプトを作ってもらう方法でした。

 

この記事のポイント!

  • 画像生成AIは英単語の羅列で指示をする
  • 英単語の羅列を自動生成することがChatGPTから可能
  • ChatGPTにルールフォーマットを指示すれば、その通りに動いてくれる

 

最終的には、この方法で生成されたプロンプトを叩き台に、更に細かく指定していくという進め方が良いのだと思います。

より詳しい条件を入れることで、生成できるAIのクオリティも上がりますので、上でご紹介したルールとフォーマットを元に、更にカスタマイズして使ってみてください。

 

当ブログでは、他にもChatGPTの利用方法や活用方法、自動化のアイデア・テクニックなどをご紹介していますので、あわせてぜひご覧ください!

 

以上、参考までに。

それでは!