人工知能プロジェクトマネージャー試験の合格に向けて、各領域で参考となる書籍(発展編)をご紹介します。基本編の書籍は、をある程度経験を積んだ方にとってはベーシカルすぎると感じられると思います。特に、分野B~Dのより技術的な理解が求められる分野に関して、文系バックグラウンドから合格を目指す方には基本編の書籍だけでは深い理解が難しい点も多くあります。

試験シラバスにあるように、本試験の配点は特に分野A~Dまでが重要視されています。この4つの分野の学びを進めるために、すでにある程度の素地をお持ちの方向けに、参考書籍(発展編)として、より専門的な書籍のご紹介をいたします。
※配点に関しての詳細は試験シラバスもご参照ください。

基本編同様、受験にあたって下記の参考書籍をすべて読破する必要があるわけではありません。各人のご経験に応じ、不足する部分を補うためのものとしてご活用ください。

分野A:目標設定能力

基本編の書籍を通して、「意義ある問題を定義し、目的を考える」ことの理解は進めることができます。しかし一般論だけで議論していても、なかなか人工知能のプロジェクトに応用した時にどうなるか理解しがたいものです。
ここではビジネス問題とデータサイエンス、意思決定について実例も交えながら解説している書籍を紹介します。

戦略的データサイエンス入門―ビジネスに活かすコンセプトとテクニック

本書は"データをビジネスに活かすために身に付けておくべき基本的な考え方と、データマイニングやモデリングの根底に存在するコンセプトについて、体系的に解説"した一冊になっています。
また、ビジネス応用を具体例を用いて解説するだけでなく、基本的なモデルの内容の解説にまで踏み込んでおり、エンジニアとビジネスマンをブリッジしてくれるのに最適な一冊となっています。専門的な内容の書籍が多いオライリーの中でも、入門書としてデータサイエンスの全体像を掴む意味でも有名な良書であると考えます。


分野B:統計的理解

アルゴリズムの仕組みについて基本的なことを理解することは重要ですが、現実にはもう1歩、数学的・統計的に厳密な理解をしなければならないでしょう。
少なくとも、前処理を正しく行い、分類・回帰・クラスタリング・Deep Learningといった現代よく用いられるアルゴリズムに関しては正しく理解しておくことが求められます。

データサイエンス設計マニュアル

本書は、AIのためにデータを集め、分析し、解釈するまでのシステムを作り上げることを目的として解説を行った書籍です。数式を用いながらも、直感的に統計処理が理解できるよう説明が多く記載されており、統計処理の意味合いの理解に役立ちます。
Python等のソースコードは登場しませんが、ある意味、それに惑わされずに分析の統計的意味合いの理解に集中することができる良書であると思います。


分野C:統計理解の実装力

基本的なPythonの文法やライブラリの使用方法を理解したら、実際に様々なデータに対して分析を行うこと、自分の中で利用できる分析のパターンを増やしていくことが肝要です。

scikit-learn データ分析 実装ハンドブック

本書はscikit-learnを用いてよく利用するモデルについて、豊富なサンプルプログラムを用いて紹介・解説しています。多くの入門書では、例えば線形回帰というとシンプルな多項式回帰を紹介して終わり、ということがあるのですが、本書は線形回帰にしてもLasso、Ridge、確率的勾配回帰などの違いがきちんと記載されており、手で触りながら理解するのに役立つことと思います。

毛利拓也、 北川廣野、 澤田千代子、 谷一徳

分野D:モデルの評価/向上能力

現代のAIエンジニア・データサイエンティストにとって、最も重要な業務の1つにパラメータや前処理などをフィッティングし、精度を上げていく過程があげられます。
具体的な課題別のフィッティングノウハウは、書籍としてもインターネット上にも情報が少なく、良質な業務経験がものをいう世界ではあります。その中で基本編・発展編で紹介する各書は、Kaggleコンペティションをターゲットとした汎化性能向上のフィッティングノウハウを記しており、学習者にとって貴重な書籍であると思います。
※さらに知識を深めたい方はKaggleで公開されている先人たちのコードを参照し、アイデアを吸収するのも貴方の学習を助けると思います。

Kaggleコンペティション チャレンジブック

2021年現在、汎化性能を求めるならば、まず勾配ブースティング木を試し、フィッティングを行っていくのは定石の一つです。しかしこうした定石の存在を示し、そしてxgboostやLightGBMといった勾配ブースティング木系のライブラリで具体的にフィッティングノウハウを解説した書籍はとても貴重です。
また、コンペティションのタイプ別に解説を行い、TensorFlowを用いた解説もあり、基本編で紹介した「Kaggleで勝つデータ分析の技術」よりもやや発展した内容となっています。


PAGE TOP