AI
生成AIの
「Strawberry問題」に
ついて
:AIは「r」の
数を数えられるのか?
            カフェラテ@プログラマー
2025.4.11
        こんにちは!エンジニアのカフェラテと申します。
「How many r in strawberry?」
            この問いかけが、いま一部の生成AIユーザーの間で密かに話題になっているのをご存知でしょうか?
            
一見するとただのクイズのようなこの質問。しかし、ChatGPTをはじめとするさまざまな生成AIにこの質問をしてみると、意外なことが起こります。
            
AIは、正確な答えを出せないことがあるのです。
            
「strawberry」という単語に含まれる「r」の数は明確に3つ。人間であれば、目で見てすぐに数えられます。しかし、AIたちの回答はバラバラ。時には2と答え、またあるときは4と返すこともあります。
            
この記事では、この「Strawberry問題」と呼ばれる現象について、実際のAIの回答を見ながら、その背景にある仕組みや理由を解説していきます。
        
目次
どうぞよろしくお願いいたします!
実際に聞いてみた:各種生成AIの回答比較
まずは実際に、複数の代表的な生成AIに「How many r in strawberry?」と聞いてみました。以下はその回答の一部です。
ChatGPT(GPT-4o)の場合
                
                    「The word "strawberry" has 3 letter r's. 🍓」と正しく答えてくれました。
                    
イチゴの絵文字まで加えてくれて、非常にお茶目です。
                
ChatGPT Pro(GPT-4.5)の場合
                
                    「The word “strawberry” contains 2 “r”s.」
                    
まさかのProモデルが誤答しました。
                    
上位モデルが誤答すると、一瞬こちらが間違っているのかと思ってしまいます。
                
ChatGPT Pro(GPT o1)の場合
                
                    「There are three rs in the word “strawberry”.」
                    
上位モデルでもo1は正確に回答してくれました。
                    
また日本語で出力までのプロセスも表示してくれます。
                
Google Geminiの場合
                
                    「There are two "r"s in the word "strawberry"」
                    
丁寧に数えてくれたのにも関わらず、カウント結果が間違っています...
                
Claudeの場合
                
                    「There are 3 “r” letters in the word "strawberry".」
                    
正しく回答してくれています
                
このように、AIによって答えが異なり、しかも半数以上が間違った回答をするという興味深い結果になりました。なぜ、単純な「文字数え」すらAIはミスしてしまうのでしょうか?
なぜAIは間違えるのか:
「文字の扱い」と
「文脈優先」の
特性
            AIの間違いには、実はちゃんとした“理由”があります。
AIは「文字」より「意味」を重視する
                    生成AI(とくにGPT系)は、単語や文を「トークン」と呼ばれる単位で分解して処理します。このときのトークンは必ずしも1文字単位ではなく、サブワードや単語単位になることがほとんどです。
                    
そのため、「strawberry」という単語の中に何回「r」があるかを数える、という“視覚的”で“記号的”なタスクは苦手です。
                
「How many r in strawberry?」という質問の文脈を誤解する
                    AIは、質問の背後にある“文脈”や“意図”を推測するように設計されています。
                    
そのため、「how many r in strawberry?」という短く曖昧な質問を、「音としてのr?」「文法上のr?」「別の意味があるのか?」と、かえって深読みしてしまうことがあります。
                    
要するに、AIにとってこの質問は「単なる文字数え問題」ではなく、「意味ありげな文脈を含む質問」に見えてしまうのです。
                
「Strawberry問題」は何を教えてくれるのか?
                この「Strawberry問題」は、ただの面白ネタに見えるかもしれません。
                
でも、実はAIの本質を理解するための重要なヒントを含んでいます。
            
得意・不得意を見分けるリテラシー
                    AIは「意味のある文章をそれっぽく生成する」のが得意な一方で、
                    
「正確に数える」「厳密なルールに従う」ことは苦手です。
                    
そのため、表や数値、プログラムコードなど、厳密な正解が求められる場面では、
                    
人間の確認や補助が必要だということを、この問題は教えてくれます。
                
AIを活用する側の「問いの立て方」も大切
また、AIに質問をする際には、できるだけ明確に、曖昧さを排除した聞き方が必要です。
たとえば:
"Please count the number of the letter 'r' in the word 'strawberry'."
このように聞くと、正しい回答が返ってくる確率が高まります。
Google Geminiに聞いてみた
                質問の仕方を変えると、同じモデルでも今度は正しい回答をしてくれました!
まとめ
                「Strawberry問題」は、一見するとただのトリビアクイズのようなものです。
                
しかし、その背景にはAIの設計思想や限界、そして我々がAIをどう理解し、どう使っていくべきかという重要なテーマが隠れています。
                
生成AIは万能ではありません。だからこそ、得意なことと苦手なことをきちんと見極め、正しい問い方を工夫しながら付き合っていく必要があります。
            
「AIにrの数も数えられないのか」と笑う前に、私たち自身がAIをどう扱うかを考えてみる。
それこそが、このStrawberry問題が私たちに問いかけている本当の意味かもしれません。