BeautifulSoupで自分の記事をスクレイプ

https://blogmining.herokuapp.com/

収集にやたらと時間がかかる。100記事収集に5分前後。

本当は、ブログ記事をテキストマイニングしようと思った。
ただ、ConoHaWingはDB接続をサポートしていないため、ひとまず自力で収集するに至った。

日本語のテキストマイニングはどの程度イケるか定かではなく、別記事にしよう。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA