hatunina’s blog

メモと日記です

2018年の振り返りと2019年の目標とか

ポエムです。 僕は2016年10月からWebエンジニア(特定派遣)に転生したマンです。 会社では建前上MLエンジニアかデータサイエンティストということになっています。 Webエンジニア転生前は営業マンでした。

2018年

主にkaggleのプライベートリポジトリですが、家に帰ってコードを書くという習慣がついた1年でした。虫食いで汚いですが僕にとってはこれぐらいがストレスなく続けられる水準かなと思います。
f:id:hatunina:20190105044447p:plain

ブログ

あんまり書いていません。
f:id:hatunina:20190105044702p:plain:w150
書いても読書記録だったりStack Oveflowを和訳しただけだったりと有益なことは書いていません。 文章をたくさん書くのは大変なので、今年もウェブから検索できる自分のメモというノリで続けていこうと思います。

振り返り

以下、時系列でざっくり振り返りです。

1 ~ 2月

色々あり社内待機しつつ機械学習の勉強をしていました。 はじぱたに載っているアルゴリズムをnumpyで実装する等していました。 SMOアルゴリズムを実装するのにヒーヒー言っていた気がします。

2 ~ 5月

業務

ECサイトアサインが決まり自然言語処理をやっていました。 システムではCRFを使っていましたが、僕はモデリングはほぼ行わず前処理・後処理、その他ルールベースの便利ツールとかを作っていました。 メンバーとのコミュニケーションが英語だったり初めて業務でPythonを使ったりでヒーヒー言っていた気がします。 ビジネス側とミーティングを行い直接要望を聞く等の経験ができたのは良かったなと思います。

業務外

Pythonの練習でビットコインの約定履歴を取ってくるスクリプトを書いて公開したりしていました。 ビットコインの売買Bot界隈が盛り上がっていたこともあり、ちょっとStarをもらえて嬉しかったり。 github.com

6 ~ 12月

業務

某物流系企業で機械学習チームの立ち上げに関わっています。 まだ機械学習を使えるほど解決すべき課題やデータがなかったりで、アソシエーション分析をやったりBIツールの選定・インフラ構築をやったりしています。 一時期、SparkやDockerを使う機運が高まりAWS EMRやAWS Fargateを使ったりもしました。 だいたいオーバースペックなので本番には乗せられずちょっと残念です。 MLエンジニアというよりデータ基盤エンジニア?っぽい業務が多く面白いけど若干不満だったり不安だったり。

業務外

この辺りから本格的にkaggleをやり始めました。
f:id:hatunina:20190105051519p:plain:w250
7 ~ 9月にHome Creditコンペに参加しましたが、Kernelsをコピペするのに精一杯で7198中1667のTOP24%という結果でした。 色々なモデルや特徴を作ってもスコアが微動だにしなかったりPrivate LBでめちゃくちゃ順位が下がるなど、自分で理解していない処理を加えてもうまくいかないことを痛感しました。
10月はコピペを反省しつつコンペの復習と気分転換にビットコインMACDを通知するBotを作ったりしていました。
11 ~ 12月にPLAsTiCCコンペに参加し1094中43のTOP4%に入りシルバーメダルを獲得できました。 自分なりに特徴を加えたりモデリングしたりしていましたが、「Discussionの内容をひたすら試す」ということが主に効いていたので、あまり自分の実力でメダルが取れたという実感はないのですが、ひとつひとつの処理を理解できるようにはなってきているので、Kernelsコピペマンからは脱却できたのかなと思います。

2018年所感

シェアハウス住まいから同棲して半年で解消したり身内がアレしたりでドタバタした中でよくがんばったと思う。えらい。

2019年の目標とか

・転職する
・kaggle expertになる
OSSにプルリクだす

の3本です。公表する目標は曖昧でちょっと頑張れば届きそうなものにしておくとだいたい実現するというライフハックがある(僕の中で)のでこんな感じです。今年もがんばるぞい!