超出遅れ感があるけど,ニンジャスレイヤーなる小説を読んでみている.
うーん内容はなかなか面白いのに,どうもTogetterとかいうのでポチポチ読むのがめんどうくさい.テキストに変換してタブレットとかで読むとちょうどよさそうなんだけど.とりあえずブラウザからコピーペーストしてみて,それからアカウントや日時が書かれてる行をイヤーッと消すために適当なプログラムを書いてみた.Haskellだと実質二行だ.
まあでもやっぱりいちいちコピーするのもめんどいなあ,ということで,htmlから直接スクレイピング(と言うのか?)的にテキスト化することを検討してみる.Haskellでも当然ながらhtml処理用のライブラリはいろいろあるようで,とりあえずxml-conduit/html-conduitというのを使ってみたら,それなりに動いてるような感じだ.さらにdom-selectorとかいうのを合わせて使うと,cssセレクタもどきの記法で内容を選択できていい感じである.wasshoi!
しかしながら,中身が長い場合,TogetterのURLにアクセスすると最初はどうやっても「残りを読む(XX)」というボタンが出てしまい,最初から全部表示させる方法がないらしいことが判明.何だよこの不便な仕様.結局コピペするしかないのだろうか?
https://ankidroid.org/docs/manual-ja.html
githubにも入ったので,改善できそうな人がいたらよろしくお願いしたいところ.(2015-01-13 08:52:21)