Paragrase “パラグレーズ” ロゴ

『人工知能は人間を超えるか ディープラーニングの先に…』からの引用(抜き書き)読書ノート

引用(抜き書き)人工知能は人間を超えるか ディープラーニングの先にあるもの (角川EPUB選書)』の読書ノート作成者:masudakotaro さん

2,043 Views
作成
【第4章 「機械学習」の静かな広がり】
こうした閉塞感の中,着々と力を伸ばしてきたのが「機械学習」という技術であり,その背景にあるのが,文字認識などのパターン認識の分野で長年蓄積されてきた基盤技術と,増加するデータの存在だった。

特にウェブ上にあるウェブページの存在は強烈で,ウェブページのテキストを扱うことのできる自然言語処理と機械学習の研究が大きく発展した。

その結果,統計的自然言語処理と呼ばれる領域が急速に進展した。これは,たとえば,翻訳を考えるときに,文法構造や意味構造を考えず,単に機械的に,訳される確率の高いものを当てはめていけばいいという考え方である。

機械学習とは,人工知能のプログラム自身が学習する仕組みである。

そもそも学習とは何か。どうなれば学習したといえるのか。学習の根幹をなすのは「分ける」という処理である。ある事象について判断する。それが何かを認識する。うまく「分ける」ことができれば,ものごとを理解することもできるし,判断して行動することもできる。「分ける」作業は,すなわち「イエスかノーで答える問題」である。

機械学習は,コンピュータが大量のデータを処理しながらこの「分け方」を自動的に習得する。いったん「分け方」を習得すれば,それを使って未知のデータを「分ける」ことができる。

機械学習では,どんなデータを用意するか,どのように正しい出力(正解データ)を用意するか,この2つの組み合わせによって,いくらでもあたらしい仕事をさせることができる。

機械学習によって「分け方」や「線の引き方」をコンピュータが自ら見つけることで,未知のものに対して判断・識別・そして予測をすることができる。

機械学習にも弱点がある。それがフィーチャーエンジニアリングである。つまり,特徴量(あるいは素性という)の設計であり,ここでは「特徴量設計」と呼ぼう。

特徴量というのは,機械学習の入力に使う変数のことで,その値が対象の特徴を定量的に表す。この特徴量に何を選ぶかで,予測精度が大きく変化する。

機械学習の精度を上げるのは,「どんな特徴量を入れるか」にかかっているのに,それは人間が頭を使って考えるしかなかった。これが「特徴量設計」で,機械学習の最大の関門だった。

人間は特徴量をつかむことに長けている。なにか同じ対象を見ていると,自然にそこに内在する特徴に気づき,よりかんたんに理解することができる。

「知識」を入れれば人工知能は賢くなるが,どこまで「知識」を書いても書ききれないという問題にぶつかった。また,「フレーム問題」では,タスクによってロボットが使うべき知識をどう定めておけばよいのかが決められなかった。「シンボルグラウンディング問題」では,コンピュータにとって,シマウマが「シマシマのあるウマ」だと理解できないことが問題であった。

機械学習では,何を特徴量とするかは人間が決めないといけなかったということである。人間がうまく特徴量を設計すれば機械学習はうまく動き,そうでなければうまく動かない。

今まで人工知能が実現しなかったのは,「世界からどの特徴に注目して情報を取り出すべきか」に関して,人間の手を借りなければならなかったからだ。

つまり,コンピュータが与えられたデータから注目すべき特徴を見つけ,その特徴の程度を表す「特徴量」を得ることができれば,機械学習における「特徴量設計」の問題はクリアできる。
この読書ノートをお気に入りに追加する
  • このエントリーをはてなブックマークに追加

この読書ノートを読んだ人によく読まれている読書ノート

キーワードで引用ノートを探す
Copyright © 2024 Culturelife Inc. All Rights Reserved.