しんさんのブログ

科学や技術のこと読書のことなど

「教養としての機械学習」 杉山将著を読みました

雨の3連休なので出かけることもなくカフェで読書しています。
1冊目は機械学習の理論的研究で有名な杉山先生の著作です。
一流の研究者である著者が一般向けに講演した内容を文字に起こし編集した内容です。
研究者が書いた本だけあってDeep learningが抱えている問題点、まだ解けていない問題、そしてこれまでの研究で明らかになってきたことが明確に記述されています。
とはいえ、一般向けの書籍なので数式はあまり使わずわかりやすく解説されています。
カーネル法と深層学習の関係も理解しやすく書いてあり、さすが一流の研究者の著作だと思いました。

統計的機械学習

著者のメインの研究分野は統計的機械学習です。
教師データが無かったり、確実な教師データではないがわずかな手掛かりのみがあるようなデータに対して従来は不可能と思われていた学習が可能であることを理論的に証明するような基礎的な研究をしています。
本書の4章では「高度化する教師付き学習」という章で杉山先生が取り組まれている統計的機械学習の新しい知見がわかりやすく紹介されていて、すごいと思うと同時にこんなわずかな情報からでもある程度正確なことが統計的にわかってしまうのかと怖くもなりました。

まるで講演を聴いているように機械学習、AIの基礎知識と未来を知ることができる

単なる技術や研究の過去や未来の話だけでなく、機械学習やAIには何ができて何ができないか、そしてそれが社会の中でどのように生かされており、将来はどのような分野でつかわれることになるのかが解説されています。
医療や防災、高齢者のヘルスケア、教育などの社会の中で解決しなければならない非常に重要な分野でAIがどのように使われ始め、今後活用が進んでいくかが述べられています。

4章「高度化する教師付き学習」は必読

この章が最も面白く勉強になりました。 教師あり学習教師なし学習の特徴、ノイズや間違ったデータで学習する際にそこからどうやって正確に学習するか理論はそれに対してどのようなアプローチが正しいと方向づけているのかなどなど普段機械学習やAIを業務で使っている人にとってもこれほど整理されてまとまった説明は貴重だと思います。
教師あり学習について知らなかったので勉強になりました。
忙しい方はこの章だけでも必読です。

こういう基礎研究がしたい

普段AIや機械学習の応用的な面ばかりに触れていますが、本書にあるような数式を駆使した基礎研究をやってみたいと思いましたし、自分の興味は社会の中での応用ではなく純粋になぜ深層学習でこれほど学習できるのかという理論的な解明であったり深層学習に代わるもっと性能の良い学習方法がないかを探る基礎研究なんだと改めて思いました。
新しい問題に対応していくためには機械学習技術そのもの、数学的になぜそれでうまくいくのかという基礎的な原理を解明することが重要だという意見に全面的に合意できますし自分もそういうところを長期的なスパンで勉強したいと思いました。

最後に

深層学習やもっと幅広く機械学習全般について正確なことが知りたいという方にお勧めします。
こんな面白い本に出合えるとは連休初日からラッキーでした。