大きくする 標準 小さくする

人工知能はなぜ幼児に及ばないのか?

2017/07/22

ビッグデータアナリストからみた人工知能

第2回 人工知能はなぜ幼児に及ばないのか?

株式会社エフ・エム・アイ代表取締役:緒方維文

 
 「人工知能(AI:Artificial Intelligence)が3歳目前の幼児に劣ることを実感した」と前回述べました。

 

 同様なことを国立情報学研究所教授の新井紀子氏が述べています。6年間に及ぶ壮大なプロジェクトの結論でもありますから、その経緯をたどりながら、AIが幼児に及ばない背景に触れてみましょう。
 

 2011年、人工知能プロジェクトがスタートしました〔副題:ロボットは東大に入れるか(略称:東ロボくん)〕。新井紀子氏をプロジェクト・リーダーとして、大学の研究者、民間大手研究機関のAI研究者やコンピュータ技術者、教育・出版企業など、多くの専門家を結集して進められました。(注1)
 

プロジェクトの目的は、細分化したAI研究を一つの目標の下に再結集することでした。目標として、①2016年までに大学入試センター試験で高得点をあげる、②2021年には東大入試を突破できる性能まで高める、という2点が定められました。(注2)
 

 センター模試(8科目)と東大模試(3科目)を対象とし、科目ごとにチームを作ってAI開発が進められました。AI開発には何ギガとか何テラにも及ぶ過去の試験問題がデータとして使われました。例えば、英語では短文問題を解けることを目指して500億語が使われました。「( ) front of」のように文章の1カ所が空欄で、該当する語を4択で答える問題と、文の順番を正しく並び替える整序問題で、その二つができるようになるために、文の数でいえば19億文に及びました。それでようやく正答率9割を超えたと言います。(注3)
 

 このようにして開発されたAI「東ロボくん」は、代々木ゼミナールが作成した模擬試験に対して、2013年から2015年まで順調に偏差値を伸ばし、MARCH(明治、青山学院、立教、中央、法政の5大学)や関関同立(関西、関西学院、同志社、立命館の4大学)のいくつかの学部・学科で合格率80%以上のA判定を得て、プロジェクトの研究目標①をほぼ達成しました。しかし、2016年の偏差値は伸びていません。(図1参照)(注4)
 

 「東ロボくん」は、例えば英語の場合、短文で与えられる文法・語彙・語法問題では正解を得ても、複数文で与えられる会話文完成問題では正解を得ることができませんでした。(図2参照)




 

 図2の会話文を読むと、スニールがネイトに対して「靴ひもがほどけているよ」と指摘する様子を、私たちはすぐにピンときますよね。しかし「東ロボくん」は私たちのようにピンとくることはなかったのです。
 

 私たち人間は、会話の文章全体から文章間の関係性や意味を考えたり想像して、すなわち読解力で解答を導きます。しかし「東ロボくん」には読解力がないから人間のように察知できないのです。「東ロボくん」は統計的に確率の高いものを解答するのです。
 

 「東ロボくん」のAI開発にはビッグデータを用いた統計的な方法が使われました。
 

 短文問題は定型的に解ける問題であり、過去の出題数が豊富で似通った内容もあって、大量データによる安定した確率を使うことができたことから正答率が高くなりました。
 

 しかし複数文問題は、一度出たものは二度出ることがほとんどないことからデータ数に限界があります。それにもまして、文章数に応じた組合せ掛け算の大量データによる安定した統計的確率を求めることは不可能です。
 

 ちなみに新井紀子氏は次のように述べています。「会話文を完成させるような複文問題で9割程度の正答率を達成するには、少なくとも500億の会話のパターンが必要だろう。しかし、そのようなデータは存在しないし、自動的に収集できる見込みもない。人手に頼って作成するにはざっと500兆円かかる計算になる。」(注5)
 

 「東ロボくん」が複数文問題を正答できないのは、AI開発に必要なビッグデータ入手が不可能なことに起因していたのです。
 

 加えて現在の理論的・技術的限界が指摘されており、新井紀子氏が次のように述べています。「ニューラルネットワーク一連の技術と近未来のデータ環境下では、人間のように少ない事例から一般化することはできない。意味とか技術のような抽象概念を扱うことができない。それを扱うための数学の枠組みがそもそも存在しない。仮に意味を理解するAIが生まれるなら、それらを支える理論となる数学の世界で革命が起きたときである。理論の準備なしにAIが完成するというのはSFの世界でのみ起こる奇跡だ。」(注6)
 

 「複数文問題の壁」によって、「東ロボくん」の第2目標「2021年には東大入試を突破できる性能まで高める」は達成できないと結論付けられ、6年間に及ぶプロジェクトの終焉が決定されました。
 

 以上のことから、両親の会話の文脈を読み取って「ママに聞こえていなんじゃないの」と発言した3歳目前の幼児に、AI「東ロボくん」が及ばないことをご理解いただけるのではないでしょうか。
 

 私たちの日常生活においても、様々な状況の無尽蔵な組み合わせで複数文会話が行われていることを頭に浮かべてみましょう。
 

 その複数文会話に適切に対応することは、現在のAIでは理論的・技術的限界から人間に及ばないのです。
 

 門外漢の岡目八目に過ぎませんが、無尽蔵の会話文・複数文を取り扱う翻訳作業では、AIにできない、人間の優れた読解力をフル活用することが望まれるのではないでしょうか。幸いにも人間は少ない事例から読解力を得ることができます。翻訳家の皆さんがより優れた読解力を追求されることを祈念して、私からのエールとさせていただきます。
 

(注1)ウィキペディア「東ロボくん」

(注2)日本経済新聞電子版 2012.1.9

(注3)新井紀子「なぜ人工知能派東大に合格できないのか?」デイリー新潮2017.2.2

(注4)日本経済新聞電子版 2017.2.24

(注5)新井紀子『「東ロボくん」がぶつかったロングテールの壁』日本経済新聞電子版 2016.12.13

(注6)日経産業新聞 2017.3.2