2009-01-25から1日間の記事一覧

WebBrowserコントロールのDocumentTextプロパティの罠

WebBrowserコントロールで表示しているHTMLをXHTMLに清書しようと webBrowser1.DocumentText を入力としてTidy.NETやtidy.dllやHTML2XHTMLを使うと不思議と文字化けします。エンコーディングにUTF-8を指定してもダメ。で、原因がわかりました。HTMLがShift-J…

ネイティブバイナリのtidy.dllでHTMLを清書する

が失敗しました。orzやはり、日本語が文字化けします。何か間違ってるんだろうか・・・ ↑ウソ:これが原因 using System; using System.Text; using System.Runtime.InteropServices; namespace TMGBCReserver { public class Tidy32 { [StructLayout(Layout…

Tidy.NETでHTMLを清書する

下記のページによれば、汚いHTMLをXHTMLに清書できる(はず)。 http://bytes.com/groups/net-c/576661-tidy-net http://www.developmentnow.com/g/36_2006_12_0_0_864791/Tidy-Net.htm http://refactormycode.com/codes/333-sanitize-html http://blog.levo…