hatunina’s blog

メモと日記です

「データサイエンスのための統計学入門」を読んだ

読みました。

www.oreilly.co.jp
だいたい前半が統計学で後半が機械学習の話です。 数式はほぼ出てこずで各手法の特徴や使い所を中心に書いてあります。 「統計学者はこう使うがデータサイエンティストはこう使う」という話がちょいちょい出てきて面白いです。 また、アルゴリズムの説明を箇条書き風にまとめているので他の本で数式を追う際の副読本としてもいいかも。

EDAから始まり最後はブースティングで終わるなど2018年2月初版なだけあって最近の情勢に合わせている気がします。 サンプルコードはRですがモデルを動かすだけなのでほぼ気にならず。

kaggleを通して雰囲気で使っていた手法に関して確認ができたり、「あー、あれってこういうことなんだー」となる部分が所々あり、コンペが終わったタイミングだったのでちょうど良い本でした。