Rubyによるクローラー開発技法 vol7 ~一気に読んじゃった~

前回でchapter2まで終わりました。

今回からchapter3
と言いたいところなんですが、
実は
クロ本が面白すぎて
最後まで一気に読んでしまいました。
(ちょっとだけ飛ばしたところもあります)

一気に読んだ時の私の脳内を解説すると

chapter3
チャプター3は「収集したデータを分析する」というテーマか。    
えーっと、内容は、
正規表現、RSS、Nokogiri、形態素解析か。
どの内容も今後役に立ちそうだけど、
実際に何か作るタイミングでもう一度読めばいいかなぁ。
ここはサラッと読んで次に行こう。  
chapter4
チャプター4は「高度な利用方法」というテーマか。   
難しそうだけど、ちょっとだけ読んでみよう・・・。
あ、データベースの利用方法か。
これは、絶対に必要な知識!
あとは、
デバッグ方法、
プロキシの使い方、
クローリングとスクレイピングの分離、
クローラの並列処理、
タイムアウトの設定、
エラー処理、
APIの利用、
どれも実運用では欠かせない、地味だけどあとから活きてくる内容!
これはちゃんと理解しとかないと。

ちなみにchapter5はどんな内容だろう?
「目的別クローラーの作成」?
気になるからちょっとだけ読んでみよう。
chapter5
うわー、何これ、chapter5面白っ。

TwitterにYoutube、株価情報、ニュースサイト
なんでもクローリングしてる。

あ、作りたいもの思いついた。

もう最後まで読んでしまおう。
chapter6
chapter6は「クローラーの運用」か。
作ったはいいけど自分のPCだけじゃなくて、
一般公開するどうしたらいいんだろう。
と思ってたから
chapter6も役立つし面白いなぁ。

よしよし、やるぞ〜。

みたいな感じで、最後まで読んじゃいました。

そして今、

本を読んでやった気分になっています笑
これが一番危うい。
なのでこれから手を動かして覚えていきます。

 
というわけで次回から

作りたいアプリを
クロ本を見ながら作っていくという風にしたいと思います。
 
 
妄想がついに現実になるか!?

Rubyによるクローラー開発技法 巡回・解析機能の実装と21の運用例

Rubyによるクローラー開発技法 巡回・解析機能の実装と21の運用例