子育て情報アプリを作れるように vol12 ~タグを自動生成する その2~

前回の続きになります。

前回の記事投稿後、
@dkfjさんよりご指導頂きました。ありがとうございます。

Rubyによるクローラー開発技法 巡回・解析機能の実装と21の運用例

Rubyによるクローラー開発技法 巡回・解析機能の実装と21の運用例

また、テキストマイニングについて色々と調べたところ、
 
 
奥が深い
 
 
どころか
 
 
奥が深すぎて底が見えない
 
 
ことが分かりました・・・。

これらを理解すれば理想のタグが作れるかもしれません。
とても興味深い分野ではあるので、
一度書籍を購入して読んでみようと思います。
その際は、記事を書きたいと思います。
※気になった書籍は最後に書き残しておきます。
 
で、子育て情報アプリのタグについては
とりあえず名詞に形容詞を付けるようにだけ修正します笑

アルゴリズムは単純です。

「名詞」の一つ前の品詞が「形容詞」の場合は  
 文字列を連結させて一つの単語とする  

です。

あとは、余計なタグはブラックリストに登録して
ひたすら取り除くことにします。

f:id:tumiki_jp:20151026123410p:plainf:id:tumiki_jp:20151026123416p:plain

悔しいですが、とりあえずこれで様子見します。
 
<後で頑張って読む書籍>

今回はこの辺で。