hatunina’s blog

メモと日記です

機械学習

NLTKでIOBタグ付けと頻出単語描画とストップワード除去とシノニムを探す

色々試しました。 Tokenize ~ Pos tagging ~ chunking ~ IOB tagging いじくる文章はiPhoneのwikiを使います。 import nltk sent = """iPhone is a line of smartphones designed and marketed by Apple Inc. The iPhone line of products use Apple's iOS m…

crfsuiteとpycrfsuiteについて

CRFについて勉強中です。 色々調べつつサンプルを動かして見ました。 こちらはコマンドラインで実行できるcrfsuiteのチュートリアル記事です。 CRFsuite - Tutorial on Chunking Task - 英語ですが、難しい単語は出てこないですしざっくり大まかな概要は把握…

numpyでkmeans

numpyでkmeansしました。 github.com 安心と安定のirisデータを使ってkmeansしてます。 元データには正解ラベルがあるので、それとkmeansでクラスタリングした結果を描画して比較してます。 ラベルの色が違うのはご愛嬌。。。 右の図の右上にある赤の点とか…

主成分分析いろいろ

主成分分析について色々調べて試したのでざっくりまとめます。 雰囲気で理解しているので間違った解釈をしている可能性あり データセットに対する固有値問題を解けばいいよ!ってノリだけどそもそも、 ① データセットの共分散行列を求める ② 共分散行列の分…