2008年5月25日日曜日

Python

近くの図書館で借りている本の貸し出し期限が過ぎてしまった(^^; 何度かあるので、貸し出し期限をWebで読み出して警告してくれるソフトでも作ろうかと思い、はじめてみた。が、まだ出来ない(^^;

Pythonを使って挑戦中だが、認証とかで認証成立後の別ページに移ったときのページをどう取ればいいかとか何も分かっていない。ちょぼちょぼやるしかないか。

HTMLのパースにはBeautifulSoupというものを見つけた。これはURLからHTMLを読み取って、それをBeautifulSoupに掛けたら、要素取出しとか自在に出来るようだ。encodingがいまいち把握できないが、要素として取り出すとちゃんと出来てるようなのでひとまずOK。この辺はRubyなら苦労しないんでしょうかねえ(^^; おいおい見てみたいと思います。

0 件のコメント: