Webをキャプチャしたい
2006年05月30日(火) 14:11
はいはい。ちょびっとだけ調べてみました。Webのページをキャプチャ。
GUIベースならいくらでもあるんだけど、サーバサイド(CUI)でやりたい。
ImageMagick+html2psで一応出来ます。
orz...
フルパスで書いてあるにもかかわらず、CSSを処理していないようです。日本語も化けています(ImageMagic6.1.8.8、html2psは今日直にDLしたもの)。
日本語はまだしも(OSの設定いじらないじらないといけないとかありそうだし)、CSSは致命的。
どうもCUIでやるっていうネタを探しても殆ど探しきれないと思ったら、こんなことか。。
結局PyKDE+KHTMLが一番素敵なレンダリング結果が得られそうな感じだ。でもC++で記述しなきゃいけないっぽい+レンタルVPSにKDEのインストールはないでしょ。。いや、もちろん仮想Displayを使うにしてもさ。
業務用なら、OSX使うとApple ScriptでもJavaでも簡単にSafariのレンダラが使えるはずだから一番楽&間違いなく現状では出力も一番美しいんだけど。業務じゃないし、お金無いなぁ。
はてなはどうやってるんだろう。HTML+CSSのレンダラが書ける人がいるとは思えないし。
GUIベースならいくらでもあるんだけど、サーバサイド(CUI)でやりたい。
ImageMagick+html2psで一応出来ます。
- 一度wgetでhttp使ってhtmlを保存します。
- $ convert test.html test.png
orz...
フルパスで書いてあるにもかかわらず、CSSを処理していないようです。日本語も化けています(ImageMagic6.1.8.8、html2psは今日直にDLしたもの)。
日本語はまだしも(OSの設定いじらないじらないといけないとかありそうだし)、CSSは致命的。
どうもCUIでやるっていうネタを探しても殆ど探しきれないと思ったら、こんなことか。。
結局PyKDE+KHTMLが一番素敵なレンダリング結果が得られそうな感じだ。でもC++で記述しなきゃいけないっぽい+レンタルVPSにKDEのインストールはないでしょ。。いや、もちろん仮想Displayを使うにしてもさ。
業務用なら、OSX使うとApple ScriptでもJavaでも簡単にSafariのレンダラが使えるはずだから一番楽&間違いなく現状では出力も一番美しいんだけど。業務じゃないし、お金無いなぁ。
はてなはどうやってるんだろう。HTML+CSSのレンダラが書ける人がいるとは思えないし。
Comments
[2006年06月24日(土) 09:10]
makoto
はてな式Webスクリーンショットのエンジンとして使われているツールはやはり「はてなの自作レンダラではない」のですね。
当たり前か、コスト高すぎるもんな。
くらなずみBlogさん、情報ありがとうございます。
すっきりしました。
Trackbacks
[2006年06月04日(日) 10:19] Jamz Tech
[2006年06月23日(金) 06:47] くれなずみなBlog
