Webをキャプチャしたい

2006年05月30日(火) 14:11 この記事をクリップ!

はいはい。ちょびっとだけ調べてみました。Webのページをキャプチャ。
GUIベースならいくらでもあるんだけど、サーバサイド(CUI)でやりたい。
ImageMagick+html2psで一応出来ます。

  • 一度wgetでhttp使ってhtmlを保存します。
  • $ convert test.html test.png
なんだかtest.png.0〜test.png.3までできました。実行したときに、htmlにフルパスで書いてある画像を取得に行っていました。期待大です。

orz...
フルパスで書いてあるにもかかわらず、CSSを処理していないようです。日本語も化けています(ImageMagic6.1.8.8、html2psは今日直にDLしたもの)。
日本語はまだしも(OSの設定いじらないじらないといけないとかありそうだし)、CSSは致命的。

どうもCUIでやるっていうネタを探しても殆ど探しきれないと思ったら、こんなことか。。
結局PyKDE+KHTMLが一番素敵なレンダリング結果が得られそうな感じだ。でもC++で記述しなきゃいけないっぽい+レンタルVPSにKDEのインストールはないでしょ。。いや、もちろん仮想Displayを使うにしてもさ。

業務用なら、OSX使うとApple ScriptでもJavaでも簡単にSafariのレンダラが使えるはずだから一番楽&間違いなく現状では出力も一番美しいんだけど。業務じゃないし、お金無いなぁ。

はてなはどうやってるんだろう。HTML+CSSのレンダラが書ける人がいるとは思えないし。


 
ponybadge

Powered by

Feedbacks

Tweets

Tags

Calendar