2018-02-28

TF-IDF法を実装してみました

いつものレトリバ読書会(=> 放送大学テキスト「自然言語処理(著:黒橋教授)」読書会 Vol.6 - connpass)。 本日は12章「情報検索」、13章「対話システム」です。

輪講形式なので誰かが発表することになるのですが、社外の人が誰も名乗り出なかった場合にそなえて、社内のメンバーが発表枠に割り当てられています。
今日の12章「情報検索」は私の担当になっていました。途中まで準備をしていたのですが当日になって社外の方から発表するという名乗りがあったので私の出番はなくなりました。
とんだ肩透かしに会ったので、ついかっとなってテキストにあったTF-IDF法の超雑な実装をしました。
いつものように自分の勉強用の実装ですが放流しておきます。

https://gist.github.com/youchan/500cf7ac6820441f09e2fc36d8a78d98