大きくする 標準 小さくする

人工知能の進展は分野によって異なる

2017/08/07

ビッグデータアナリストからみた人工知能

第3回 人工知能の進展は分野によって異なる
 

株式会社エフ・エム・アイ代表取締役:緒方維文

   
 人工知能は様々な分野で研究され実用化されています。多種多様な人工知能を人知との対比という観点でとらえると、おおまかに3分類できそうです。①既に人知を超える域まで進展したもの、②まだ人間には及ばないが相応に実用されているもの、③限定実用で進展が遅いもの、の3様です。

 

 ①既に人知を超えたものとして、将棋や囲碁など「盤上ゲーム」、一人ひとりの顔を識別する「顔認識」の2種があります。これに、人間と同等あるいは一部人知を超えたものとして写真の「画像認識」を加えた3種を紹介します。
 

 驚異的に進展した事例として全世界の注目を集めたのが、米グーグルの人工知能「アルファ碁」です。本年5月27日、世界最強のプロ棋士・柯潔(か・けつ)九段(中国)に3連勝と完勝しました。(注1)
 

 対戦後の柯九段は「アルファ碁が完璧すぎた。負けてばかりで苦しくてたまらなかった」と心情を吐露しており、その実力がうかがい知れます。(注2)
 

 同時期にアルファ碁は、中国のトップ級棋士5人がチームを組んで対局する「相談碁」にも勝利しました。(注3)
 

 昨年3月にもアルファ碁は世界トップ級棋士の李世ドル氏(韓国)に4勝1敗と圧勝しました。その後さらに実力を上げて、もはや人を寄せ付けない域に達したのです。「知的な盤上ゲームで最難関とされる囲碁で人工知能が人間に勝つのは将棋の10年先」と言われてきましたが、長足で進展しました。(注4)(図1参照)


 

 一人ひとりの顔を識別する「顔認識」でも人工知能が人知を凌駕するようになっています。
 

 中国の北京曠視科技(メグビー・テクノロジーズ)では、ロビーに設置されたカメラを顔認識ソフト「Face++」と連動させて、人間をほぼ瞬時に識別できることから、社員がゲートで身分証を示す必要がなく、顔パスで構内に入れるようになりました。(注5)
 

 また、中国ネット検索最大手の百度(バイドゥ)の人工知能は、6歳で行方不明になった人を27年ぶりに特定することができました。6歳と33歳では容貌も異なって当然です。200万人分2億枚の写真から、顔の経年変化を人工知能に学ばせて、27年間の容貌変化を考慮した顔認識を実現させたのです。(注6)
 

 写真を識別する「画像認識」に注目が集まったのは2012年でした。GoogleYouTubeから集めた大量の画像を人工知能に学ばせて、猫の識別に成功したというディープラーニング(深層学習)によるものでした。従来の方法による画像識別誤差が26%台と伸び悩んでいたのに対して、ディープラーニングによる誤差は15%~16%と大きく引き離したのです。(注7)
 

 その後進化させたディープラーニングでは、画像識別誤差率がさらに縮小して、20152月に4.9%となり、人間による誤差率5.1%の識別能力を超えました。また、201512月には、Microsoft Research CVPR paper によって誤差率3.6%が実現されています。
 

 人工知能による画像認識を、がん検査画像診断に利用することも始まっています。国立研究開発法人産業技術総合研究所では、乳がんの超音波画像を人工知能によって、医師ががんを疑う病変の85%以上を判定しています。(注8)
 

 画像診断の専門医が不足していることもあって、診断支援の用途を期待されています。
 

 ②まだ人間には及ばないが相応に実用されているものとして、音声認識とテキスト翻訳を紹介します。
 

 音声認識の身近な例として、AppleiPhoneに搭載された「Siri」があります。ご利用の方はお分かりと思いますが、「Siri」を起動して「山田太郎さんに電話」と問いかけると、連絡先に登録された山田太郎さんに発信します。「今日の天気は?」と問いかけると、現在地の天気予報を画面に表示します。
 

 このように音声認識の多くは、簡単な命令文の音声を認識するものであり、人間のように自由で複雑な対話の認識までは至りません。
 

 簡単な命令文とはいえ、認識した内容に応じて、他の技術を組み合わせて、電話をかけたり、画面表示したり、などの行為につなげます。コンピュータに指示する内容をキーボードで伝えるのに代わって音声で伝える、いわゆるインターフェースとして音声認識機能が使用されることが多く、他の機能と組み合わせた幅広い用途への応用が期待されています。
 

 音声認識をインターフェースとした事例として、スマートスピーカー(または音声チャットボット)をあげることができます。米国では「Amazon Echo」や「Google Home」が発売され、日本でもLINEが本年714日から「WAVE(ウエーブ)」の先行体験版の注文受け付けを始めました。これらによって、私たちの問いかけに対して人工知能が、音声で応答したり、要求された楽曲を流したり、など様々な生活シーンへの用途開発が進展中です。(注9)(注10
 

 その一例として、世界中の人と会話できることを目指した無料のスマホアプリ「VoiceTra」があります。比較的簡単な会話を31言語に翻訳できるアプリで、音声認識、翻訳、音声合成の3機能で構成されたクラウド型の人工知能です。国立研究開発法人情報通信研究機構で開発提供されています。(注11
 

 テキスト翻訳で著名なのが「Google翻訳」です。PCのウェブサイトやスマホプリをご利用の方も多いようです。Google翻訳は以前より精度が上がったとは言え、まだ翻訳家の域には及ばないようです。
 

 NTT東日本でもAI翻訳サービス「ひかりクラウドcototoba」が本年73日開始されました。主に、デジタルコンテンツ制作(Webサイト、アプリ、デジタルサイネージ等)のサービスを有している企業(パートナー企業)に対して、翻訳機能をAPI提供しています。(注12)(注13
 

 ③限定実用で進展が遅いものとして、予測分析、自由で複雑な対話、があげられますが、いずれも手軽に人工知能が自動処理できるという段階はまだ遠く、人の介在と判断に頼るところが大きい状況です。
 

 予測分析の事例として、来店客の行動分析と、漁場漁獲予測を紹介します。
 

 名古屋市のショッピングモール内の寝具「トルースリーパー」店舗では、店内設置カメラで得た来店者データを人工知能利用によって性別と年代を判定し、入店率や買い上げ率などの顧客動向分析を行っています。その結果から、商品の自宅直送サービスを導入したり、寝装具や関連グッズの品ぞろえ改善を行っています。(注14
 

 公立はこだて未来大学では、全国の水揚げデータと定置網用魚群探知機から得られるデータを人工知能で分析して、適切な漁場と漁獲量を予想するシステム開発が始まりました。これによって、漁業者の効率的出漁、流通業者の計画的仕入れ販売、漁業資源保護などにつながることを目指しています。(注15
 

 東ロボくんに読解力がなく、幼児でも文脈を読んで会話する能力が人工知能にないことを前回までに述べました。同様に、自由で複雑な対話を人工知能が認識することが難しい状況です。
 

 そんななかで、人と自然な対話を実現する人工知能対話エンジン「Ladadie(ラダディ)」を提供開始することを、沖電気工業が本年725日に発表しました。対話内容の真のニーズを引き出す「ラダリング技法」を用いるなどいくつかの工夫がなされているようです。SNSの自動応答や、チケット発券機などへの利用が想定されていますが、それも顧客への一次対応の位置づけであり、より複雑な対話はオペレーターに引き継ぐことを想定しています。(注16
 

 以上の3様を振り返ると、人工知能が人知を凌駕するほど進展しているのは、近年のブレークスルーであるディープラーニング技術の恩恵であることが分かります。
 

 まだ人間には及ばないが相応に実用されているものと、限定実用で進展が遅いもの、については、一部にディープラーニングの導入研究がみられるものの、多くは利用可能なデータや技術的制約などによって、進展にブレーキがかかっているようです。
 

 そこで次回は技術面にフォーカスしつつ、人工知能の歴史に触れたいと考えています。
 

(注1)日本経済新聞電子版 2017.5.27 「囲碁AIが3戦全勝、世界最強プロを圧倒」

(注2)日本経済新聞電子版 2017.6.16 「AIの衝撃 揺れる棋界(上)アルファ碁 人知超えた」

(注3)日本経済新聞電子版 2017.5.26 「囲碁AI、トッププロ5人でもかなわず」

(注4)日本経済新聞電子版 2016.3.25 「アルファ碁が人間に勝った理由とその意味とは」

(注5)日本経済新聞電子版 2017.7.28 「中国AI、米に肉薄 データ数で圧倒的に優位」

(注6)日本経済新聞電子版 2017.7.25 「頭脳鍛える「1億本ノック」 デキル人工知能とは」

(注7)松尾豊「ディープラーニングとは?」2016.1.15 10MTV

(注8)日本経済新聞電子版 2017.6.5 「産総研、がんの検査画像AIで判定 医師の診断支援」

(注9)日本経済新聞電子版 2017.6.21 「対話型AI、音声対応で普及拡大にスイッチ」

(注10)日本経済新聞電子版 2017.7.14 「LINE、AIスピーカーの予約開始 体験版」

(注11)国立研究開発法人情報通信研究機構 http://voicetra.nict.go.jp/

(注12NTT東日本News Release https://www.ntt-east.co.jp/release/detail/20170703_01.html

(注13APIApplication Programming Interfaceの略称で、プログラム開発者が、プログラム機能を利 用したい機関や人に対して、該当プログラムの共有を認めて提供することです。この場合は、NTT東日本がパートナー企業に対して、翻訳プログラムの機能を提供し共有することになります。パートナー企業では独自のサービスに翻訳プログラム機能を組み込んで顧客にサービス提供できるようにもなります。

(注14)日本経済新聞電子版 2017.5.10 「似合うメガネAIが目利き」

(注15)日本経済新聞電子版 2017.6.13 「AIで漁場・漁獲予測」

(注16)日本経済新聞電子版 2017.7.26 「自然な対話が可能なAIエンジン」