2006年11月5日の日記の2番目の記事へのコメント

bogofilterチューニング

こちらのページを参考にちとフィルタや学習環境を見直してみました.とりあえず何でもかんでもいきなりnkfに通すのはやめて,HTMLはw3mでレンダリングしてから通すようにして,中身がバイナリのbase64は捨てるようにして・・・とperlでちょこちょこ書いてやってやったところ,100Mあったデータベースは25Mくらいになりました(^^;.

で,いくつか実験がてらメールを食べさせて出力を見てみたところ,なんか一部のメールでフィルタ通した際に文字化けが発生していることが判明.nkfの出力は正常なのに,その後のkakasiで分かち書きするところで化けているぞ.うーん,これっぽいなぁ.って,kakasiってEUC以外にも対応してたのか.知らんかったー.

お名前:  メールアドレス(省略可):
メールアドレスも表示されます
ここに名前その他を書いてはいけません: ここにメールアドレスその他を書いてはいけません:

2006年11月5日の日記の2番目の記事へのコメント

中の人情報

名前:
nosuke (のすけ)
メール:
sasugaanijaのgmail.com
「の」は「@」みたいな
関連リンク:

カレンダー

2006年11月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30    

<<先月分

翌月分>>

最新の10件のエントリ

最近の10件のコメント

過去ログ