hatunina’s blog

メモと日記です

apache sparkの本を読んだ

2つ読みました。

これと

www.oreilly.co.jp

これ

www.shuwasystem.co.jp

周りに詳しい人がいないので、得意なこと苦手なこと、使い方の全体像、PythonJavaでの書き方が知りたくてざっとまとめて読みました。

「アプリケーションエンジニアの〜」の方は全体像の把握ができて、まあ普通によかったです。

オライリーの方は2015年出版ということもあって、DatasetAPIではなくRDD中心のコードなんだけどそれが逆にめちゃくちゃ役に立ってる。 特に諸事情で古めのJavaを使う必要があるので、ネット上で見つからない情報が載っていたりして助かる。 あとラムダ式すら使っていないので、最初の理解として読みやすかったりもする。 JavaDocを見る前にこっちを参照したりもしてる。