ChatGPTについて詳しく解説します
- 長文を入力したら「The message you submitted was too long」と言われてしまいます…
- ChatGPTで一度に入力できる最大の文字数を教えてください!
- ChatGPTの文字数計算の仕組みについても教えて欲しい
この記事では、以上の疑問にお答えします。
ChatGPTのチャット画面にはかなりの長文を入力することが可能ですが、それでも無限に入力できるわけではなく、一度の入力文字数に制限があります。
あまりに長い文字数を入力すると、以下のようなエラーメッセージが表示される…ということは、皆さんも経験があるかと思います。
この文字数上限ですが、実は結構こまめに変わります。
以前は800〜1000文字程度でしたが、実は現在は、もっと長い文字数が一度に入力可能となっています。
この記事では、2023年5月現在の文字数上限についてまとめています。
また、日本語・英語など、言語によって文字数上限も変わってきますので、その文字数の仕組みについてもご紹介します。
合わせて読みたい
目次
この記事のポイント!
- GPT-3.5の場合は日本語で6400文字まで
- GPT-4の場合は3300文字まで
- 英語だともっと長い文章が入力可能
著:I/O編集部
TipstourのChrome拡張記事を寄稿しました! 工学社さんより、ChatGPT×Chrome拡張機能を使ってより便利にChatGPTを活用する方法をまとめた書籍に、当ブログの記事が本書の1章に掲載されています。 |
【最新情報①】日本語での文字数制限
ChatGPTのWebチャット画面での文字数の制限については、公式に具体的な文字数は発表されていません。
しかし、実際に入力して確かめてみれば確認可能ですので、筆者の方でGPT-3.5とGPT-4の両方で、文字数の上限を確認してみました。
ということで、日本語で入力した場合の文字数制限は以下の通りです。
言語モデルのGPT-3.5とGTP-4のどちらを使うかによって、入力できる文字数制限に違いがあります。
無料ユーザでも利用可能なGPT-3.5の場合は6200〜6400文字程度、
有料版ユーザにのみ開放されているGPT-4の場合は3100〜3300文字程度となっています。
この文字数制限に達すると「The message you submitted was too long」というエラーメッセージが表示されるようになります。
この文字数に幅があるのは、日本語文章に英語や数字を含む場合などで最大文字数が変動するため、入力する文章によって、この上限に達するかどうかが異なるためです。
のちほど詳しく説明しますが、日本語と英語では文字数のカウント方式が異なるため、英語が多くなれば、上限も大きくなりますし、全部日本語の文章の場合は、より上限が小さくなります。
いずれにせよ、この文字数がだいたいの目安ということで、覚えておけば良いと思います。
今後も、ChatGPTのアップデートによって、入力できる文字数上限が大きくなる可能性はあります。
文字数上限が変更された際は、こちらの記事でもまた改めて最新情報を更新する予定です。
【最新情報②】英語での文字数制限
さて、英語の場合、チャット画面での文字数制限は以下のようになっています。
日本語と比べて、入力できる文字数がかなり大きいことがわかるかと思います。
基本的にChatGPTはもともと英語圏サービスということもあり、英語での文章理解&生成に長けています。
文字数上限も大きくなっているため、かなり長い文章であっても一度に入力できるので、例えばブログ記事やリファレンス、文献などをコピペで貼り付けて理解させることも可能です。
羨ましい限りですね!
【解説】ChatGPTの文字数はどうカウントしている?
さて、ChatGPTではトークンという概念で、文字数を計算しています。
トークンとは
1単語ごとのトークン数は言語によって異なる。
ChatGPTが一度に処理できるトークン数には上限があり、この上限に到達するとエラーになるという仕組み。
ChatGPT内部では単純な文字数ではなく、このトークンという単位で文章の長さを計算し、どこまで処理できるかを判断しています。
このトークンは、英語などのアルファベットなら1単語あたりの必要なトークン数は小さくなり、日本語などの複雑な言語の場合、必要トークン数は大きくなっていきます。
そのため、日本語の文章は最大文字数がかなり少なくなってしまっている、ということですね。
チャット画面で一度に入力できるトークン数は、以下の通りです。
1単語にかかるトークン数
例として、リンゴという1単語にかかるトークン数をまとめてみました。
文字列 | 文字数 | トークン数 |
---|---|---|
apple | 5 | 1 |
APPLE | 5 | 2 |
りんご | 3 | 4 |
リンゴ | 3 | 3 |
林檎 | 6 | 2 |
🍎 | 2 | 3 |
アルファベットの「apple」は5文字で1トークンなのに対して、
日本語の「りんご」は3文字で4トークンもかかっていますね。
このような単語が組み合わさっているのが文章ですので、トークン数が多い日本語の文章は、すぐに上限に達してしまう、というわけです。
文字数とトークン数を計測するツール「Tokenizer」
このあたりのトークン数の関係については、日常的に利用する上ではあまり気にしなくてもいいと思います。
冒頭でお伝えしただいたいの日本語文字数の上限さえ把握しておけば、通常の利用でトークン数まで意識することはほとんどありません。
ちなみにChatGPTでは、文章を入力すると文字数とトークン数を計算・表示してくれる「Tokenizer」というツールを公開しています。
上記ページにアクセスするとこのように文章の入力欄があります。
その入力欄に文章を入れてみると、このように「Tokens(トークン数)」と「Characters(文字数)」が表示され、トークン数と文字数を一緒に確認することが出来ます。
またその下には、日本語はなぜか文字化けしてしまいますが、色分けされてトークンの単位がわかるように表示されます。
通常のユーザはトークン数を気にする場面はほとんどないかと思います。
ただ、APIを経由してプログラミングなどでChatGPTを使う場合は、トークン数を考慮に入れる必要がありますので、その場合はこのツールも活用してみてくださいね。
まとめ
以上、ChatGPTの文字数制限について、でした。
この記事のポイント!
- GPT-3.5の場合は日本語で6400文字まで
- GPT-4の場合は3300文字まで
- 英語だともっと長い文章が入力可能
ChatGPTは頻繁に新機能やアップデートが行われていますので、文字数上限についても今後また更に上限が大きくなる可能性があります。
当ブログもChatGPTを毎日利用して最新情報をチェックしていますので、この文字数上限について変更されたら、最新情報を掲載したいと思いますので、ぜひ今後も当ブログをチェックいただければと思います!
当ブログでは、他にもChatGPTの利用方法や活用方法、自動化のアイデア・テクニックなどをご紹介していますので、あわせてぜひご覧ください!
以上、参考までに。
それでは!