文學ラボ@東京

(文学をなにかと履き違えている)社会人サークルです。第22回文学フリマ東京では、ケ-21で参加します。一緒に本を作りたい方はsoycurd1あっとgmail.comかtwitter:@boonlab999まで(絶賛人員募集中)。

content

Pythonでカクヨムから小説のデータを拾ってきてMongoDBに入れるやつ作った

Pythonでカクヨムから小説のデータを拾ってきてMongoDBに入れるやつ作った。

 

github.com

 

といっても、BeautifulSoupでhtmlをパースしただけなので、まあ、それだけの内容。一応タグ検索もできるようにしておいた。あと、念の為分かち書きもしておいた。どう使うかはまだ未定。

 

青空文庫と違ってエピソード毎に別ページになっているので、データ取るのにurlを追っていく必要があったのが若干面倒だった。また、MongoDBは初めて使ったので、まだあまりどういうクエリ投げたら良いのかよくわかっていない。とりあえず、IntelliJのMongo pluginが便利っぽいということがわかった。GUI便利。

 

f:id:soy-curd:20160317234901p:plain

 (Mongo pluginの見た目はこんなかんじ。葉っぱが可愛い。)

 

MongoDBイン・アクション

MongoDBイン・アクション