DISTRICT 37

なにか

2017-01-01から1ヶ月間の記事一覧

Scrapyのコツ

Scrapyを作ってていくつかコツをつかんだ気がする。といっても処理側の話なので、xpathをマスターしないことにはScrapyが作れないことには変わりない。 Spiderのコツ itemをitemクラスに格納する際にはyieldをうまく使うといい。 前回やったRSSのようにデー…

ScrapyでRSSをスクレイピング

RSSリーダがすでにあるのに、スクレイピングをするなんて、、、いや、余計なことは考えない!! スパイダーを作ってアイテムに入れるまで 今回のお題としては、はてぶの人気エントリのRSSを取ってきてアイテムに入れるまで。パイプラインに関しては今回は扱…