【ChatGPT】画像生成機能(DALLE-E3)を解説・どのような画像が生成出来るか徹底検証

#PR

2023年10月20日

北中　晴喜

ChatGPTについて詳しく解説します

ChatGPTで画像が生成出来るようになったと聞いたのですが、使い方を教えてください
どのような画像が生成できるのか、色々なサンプルや生成例を見てみたい
画像サイズや形式、色や数の指定など、どこまでカスタマイズ出来るのか知りたい

この記事では、以上の疑問にお答えします。

2023年10月に、ChatGPTは画像生成機能のDALL-E3が実装されました。

DALL・E3の利用条件は、「ChatGPT Plus」および「ChatGPT Enterprise」の購読者に限られており、ChatGPTの無料版では利用できません。

この素晴らしい新機能は、多くの人々にとって仕事の時短や効率向上に役立つものとなるでしょう。

DALL-E3の使い方や、具体的にどんな画像が生成できるのか、どこまでカスタマイズできるのか、興味が湧きますね。

この記事では、DALL-E3の操作方法、生成可能な画像のサンプル、そしてカスタマイズの程度に関して、詳しく調査し、その詳細を解説します。

この記事の３つのポイント。

ChatGPTのDALL-E3機能の使い方がわかる
どこまで画像がカスタマイズできるか把握できる
どのような画像が生成できるのか確認できる

ChatGPTの画像生成機能について、詳しく知りたい方は最後まで読んでみて下さい。

1 DALLE3とは
2 どんな画像が生成できるのか？
3 DALL-E3で思い通りに画像生成できるのか？
4 画像生成と画像保存の手順
5 生成回数の制限
6 生成速度
7 生成できないもの
8 記事のまとめ

ChatGPT書籍に当ブログの記事が掲載されました！

📘Chrome拡張×ChatGPTで作業効率化
著：I/O編集部

TipstourのChrome拡張記事を寄稿しました！

工学社さんより、ChatGPT×Chrome拡張機能を使ってより便利にChatGPTを活用する方法をまとめた書籍に、当ブログの記事が本書の１章に掲載されています。

DALLE3とは

DALL・E3(ダリ３)とは、OpenAI社が開発した画像生成AIです。

入力した文章(プロンプト)に基づいて、その内容に基づいて自動的に画像を生成してくれます。

有料プランのユーザであれば、ChatGPTのチャット欄に入力した文章をもとに、気軽に画像生成が可能です。

画像生成AIというと、Stable DiffusionやMidjourneyなどがありますが、このDALL・E3はその画像生成AIのうちの１つです。

画像生成AI・それぞれの特徴

Stable Diffusion：様々なモデルや拡張機能が利用可能で、幅広い画像が生成可能
Midjourney：写実的・芸術的な画像生成に強みがある
DALL・E3：プロンプト内容を的確に認識し、精度の高い画像を生成することが可能

2023年10月の今回のアップデートで、ChatGPT上からもDALL・E3の画像生成機能が使えるようになりました。

他の画像生成AIと違って特徴的なのが、ChatGPTの画面上で直接画像を生成出来るという点です。

Stable DiffusionやMidjourneyの場合、専用の操作画面からプロンプトを入力して画像生成する必要がありますが、ChatGPT×DALL・E3の場合、これまでのチャットと同じ感覚で、自由に画像を生成していくことができます。

画像生成AIを利用したことがないユーザにとっては、かなり気軽に画像生成が出来るようになったのではないでしょうか。

ChatGPTでStable Diffusionのプロンプトを自動作成する方法 | Tipstour - チップスツアー

どんな画像が生成できるのか？

まずは、実際に生成した画像を、いくつかご紹介しますね。

かなりクオリティが高い画像が生成されました。

ChatGPTの有料ユーザーにとっては、今までと同じ料金で、この画像生成機能を使えるのはとても嬉しいですね！

DALL-E3で思い通りに画像生成できるのか？

結論、指示した通りに画像を出力できないことが多いです。

ロゴの作成や、資料などで使えるような簡単なイラストなどの作成には向いていません。

どちらかと言えば、アート作品作成や、人物を描写する目的で使うとよいでしょう。

また、思い通り画像が出力されなかった場合は、ChatGPT に再度、調整依頼ができます。

納得がいくまで何度も試してみましょう。

以下に検証結果をまとめてみました。

検証内容	結果	備考
ロゴが作成できるか	×	ロゴの作成はできません
英語のテキスト	○	大文字・小文字の指定は不可
日本語のテキスト	×	日本語の出力不可
人物の表情指定	○	感情を表現できます
特定の画風で描けるか	△	実写・コミック風など可
画像サイズの指定	△	指示に近いサイズで出力
拡張子の指定	×	すべて”png”で出力
色の指定	○	概ね指示通りに出力可能
数の指定	×	指定した数での出力は難しい

それでは、検証結果をひとつずつ詳しく解説していきますね。

ロゴ作成はできるのか？

さて、ChatGPTを使ってロゴが作成できるのか試してみたいと思います。

当ブログ「Tipstour」のロゴを作成してみます。

ブログのコンセプトを背景としてプロンプトに入力してみました。

結果は、ロゴとはかけ離れたものが生成されました。

何度かプロンプトを変更して指示しましたが、ロゴのようなものは作成できませんでした。

英語と日本語のテキストを出力できるのか？

文字の出力はできるのでしょうか。

英語とカタカナ、ひらがなの文字が画像に反映されるのか確認してみます。

試したテキスト

英語：Tipstour
カタカナ：チップスツアー
ひらがな：ちっぷすつあー

まずは英語の文字から試してみます。

結果は、英語の出力はできましたが、アルファベットの大文字と小文字の区別はできませんでした。

大文字・小文字の指定をしても、指示通りには出力できませんでした。

つづいて、カタカナも試してみましょう。

カタカナは文字化けして出力できませんでした。

ひらがなも同様に文字化けして出力できませんね。

感情表現は可能？

人の感情を表現できるのかを試してみました。

感情表現はできるのか？

笑顔
泣顔
怒った顔
困った顔

さて、結果はどうなるのでしょうか。

それぞれ、人の感情を表していると言えます。

人物の描写はクオリティが高いですね。

特定の画風が描けるか

特定の画風が描けるのか試してみたいと思います。

油絵などの一般的なものから、浮世絵などの変わり種まで試してみます。

結果を表にまとめました。

画風	出力可否
実写	○
コミック風	○
油絵	△
抽象画	×
浮世絵	×

まずは実写から。

これはすごい！

実在しそうですね。

コミック風はこちらです。

しっかりとコミック風になりました。

色もコミックのようにモノクロで出力されました。

油絵はどうでしょうか。

油絵というよりも実写に近い仕上がりになっています。

さらに抽象画も試してみます。

ピカソのような画風を期待していましたが、抽象画は難しいですね。

変わり種の浮世絵風も試してみましょう。

和服を着ているものの、人物は現代的に描かれています。

浮世絵は江戸時代特有のスタイルなので、完全な再現とは言えませんね。

画像サイズが指定できるのか？

画像サイズを指定できるのか確認してみました。

あらかじめ画像サイズを指定できれば、後で編集する手間もかからないですよね。

以下のように指示を出してみたところ、指示通りではありませんが、指示に近いサイズで出力されました。

指示	実際の出力
縦1000ピクセル	1024ピクセル
横2000ピクセル	1792ピクセル

画像形式は指定できる？

画像形式が指定できるか試してみました。

拡張子を指定して指示を出してみましたが、結果は指定できませんでした。

すべての画像は、”png”の形式で出力されます。

色の指定

色の指定はできるのでしょうか。

以下のように、場所と色の指定をしてみます。

場所の指定	色の指定
毛の色	青色
目の色	ピンク
肌の色	白

結果はこちらです。

見事に再現されていますね。

自分の好みの色でカスタマイズできるのは面白いですね。

数の指定

Chat GPTは数を数えるのが苦手な傾向がありますが、画像生成ではどうでしょうか。

数の指定はできるのか？

円を5個
四角を3個
三角を2個

結果は、指定した数を生成する精度は低い結果となりました。

画像生成と画像保存の手順

画像生成の手順はとても簡単です。

①GPT-4にマウスのカーソルを合わせます。

②DALL-E3を選択します。

③プロンプトを入力します。

④出力された画像の中で気に入ったものにカーソルを合わせます。

共有マークが表示されるのでクリックします。

すると、ダウンロードフォルダに保存されます。

とてもシンプルな操作で使い勝手がいいですね。

生成回数の制限

画像生成に回数制限はあるのでしょうか？

OpenAIの公式HPには、明確な制限の記載はありませんが、現時点では一定時間内に生成可能な枚数が決まっているようです。

およそ3.5時間の間に、40回程度の使用したところ、制限がかかり、15分間の待機が発生しました。

生成速度

生成速度については、どのくらいかかるのでしょうか？

1～3行程度のプロンプトでは30秒程度で出力されました。

時間
28秒
31秒
30秒
33秒
33秒
30秒
31秒

15行くらいの長いプロンプトを試してみたところ、長いもので88秒かかりました。

時間
40秒
88秒
84秒

生成できないもの

ChatGPTの画像生成機能では、生成できないものがあります。

OpenAIは有害の生成を防止し、安全に使えるように配慮されています。

具体的には、以下の生成はOpenAIによって制限されています。

感情表現はできるのか？

暴力的
成人向け
憎悪に満ちたコンテンツ
著名人の名前を尋ねるリクエスト

記事のまとめ

この記事では、ChatGPTの新機能DALL・E3を使って、思い通りの画像生成ができるのかを徹底検証してきました。

結論、すべてが思い通りにはいかず、簡易的なロゴなどの生成や、数の指定、日本語の出力など対応が不十分な面も多々ありました。

ですが、アイディア次第では様々な楽しみ方が見つかるでしょう。

なぜなら、自分のイメージを文章にして、それを形にすることができるのできるからです。

例えば、小説の細かい描写を指示すると、指示した通りまでにはいきませんが、ある程度の情景は描くことができます。

なので色々なアイディアを試してみて、あなただけのオリジナルの画像を生成してみてはいかがでしょうか。

また、別の画像生成AI「Stable Diffusion」のプロンプトを、ChatGPTで自動作成する方法も紹介しているので、参考にしてみてください。