2006年3月11日から2006年3月7日までの日記を表示中

2006年 3月 11日 (土)

Perlでrefererのデコード

apacheのログで気になるのはやっぱreferer.特にどんなキーワードで自分のコンテンツに訪れているのか結構気になったりします.そんなことから,これまでawkとかsedとかiconvとか使ったシェルスクリプト書いて適当にログを整形して表示させてみたりしていたんですが,何かやっぱ遅いのと,他でもちょっと使えるようにしたかったんで,Perlで書き直してみることにしてみました.

URL見てサーチエンジンごとに正規表現で検索ワード切り出して云々というのはPerlなんで普通に正規表現書くだけで済むのでとっても簡単.問題はURLをデコードした後の文字コードの変換なんですが,これもEncodeなるPerl同梱のモジュール使って文字コードの変換とかできちゃうんですね.楽だ.

ちまちま書いてみたところ,手元のログの大部分は問題なく処理できました.ただ,一部,refererのURLに文字コード情報が入ってない場合の文字コードの推測処理がどうにもうまくいきません.あちこちで紹介されてるサンプルコードをそのまま動かしてるつもりなんですが,なぜか本来euc-jpやsjisなものがutf8として認識されちゃいます(´・ω・).

仕方ないので場当たり的に検索エンジンのページの文字コードにあわせて決め打ちでデコードするようにして(exciteならsjis,infoseekならeuc-jpみたいな感じで),更に検索ボタンのvalue値のURL値を元に元の文字コード推測するようにしてみたりしてやったところ,手元のログに関してはひとまず正常にデコードできるようになりました.うーん,でもやっぱそれでもダメな場合は自動判別したいところです.シェルスクリプトではiconv使わずにnkfの自動推測に頼ってたんで楽だったんですけどねー.phpならこの辺問題ないのかなー・・・ってここまで書いて気づいたんですが,他に使いまわすことも考えるとphpで書いた方が良かったか(;´Д`)?

あ,あと,たまに混じってる「"\x93\x8c\x95\xfb\x89i\x96\xe9\x8f\xb4"」みたいなやつもうざいですね.ブラウザが悪いのか何なのかよくわかりませんけど,こっちは大概sjis?

[コメントを書く]

tkng 2006/03/16(木) 03:24:01
文字コードの認識だと、Gaucheの認識率が高いとどっかで読んだような気がします。Perlじゃなくなっちゃいますけど…。
nosuke 2006/03/16(木) 08:30:50
あ,僕もその話読んだ覚えがあります.
yazさんのところで見たのかな.
http://www.cc.rim.or.jp/~yaz/patch.html
にあるlibguessはGaucheのコードを使ってますね.

部屋掃除

どうしてこうなったのかよく覚えてないんですが,気がついたら部屋をものすごい勢いで掃除してました.これまでにも何度かテーマ別に『数年に一度』クラスの掃除をしてましたが,今回も今までと違うところを重点的に.無駄に取ってあった裏紙を捨て,ボロボロいなったファイルとかを分解・分別して廃棄.本棚やPC回りもちょっと配置を変えて相当すっきり・・・するはずなんですがまだ終わってないので今は机の上がぐちゃぐちゃです.

いや〜,しかし,窓際にずっと置いてあったプラスチック製のバインダー,手に取っただけでぼろぼろ崩れたのにはびびりました.こんなに風化するとは・・・.置きっぱなしにしてたの,5〜6年程度だと思うんだけどなぁ・・・.

CDとか

Tir-na-n-Og (5/4TAKEPOD)
オリジナルCD.最初の方に20分位の長い曲があります.いいですねー.セミロックとか全然季節感無いですが(^^;.最初の曲は何かクロノっぽい気がします.あ,でも,「CHRONO CORRIDOR」っぽいだけなのかも(^^;.うーんしかしプログレの定義ってよくわからんです.聴く分野が狭い故,Fragile Onlineさんのキツイ変拍子曲のイメージしか無かったんですが,こうすっきり聴ける曲もプログレなんすね.Wikipedia見てもうーんな感じ.
Eternity II (best of shape)
SaGaアレンジ.これもいいですねー.6曲目とか特に好みでした.わかりやすい好みですが(^^;.

2006年 3月 10日 (金)

K24P

まだそれほど使い込んでないんですが,今のところ結構好みの音がなってくれてます.ずっと着けてても疲れないし,値段考えるとほんといい買いものでした.もう1個買っちゃおうかな(笑).Z900は音は別としてとにかく着けてると疲れるのと頭がかゆくなるのが何とも・・・.装着感いいとか言ってたGKZ.

CDとか

G5 Project (G5 Project)
ギター中心のインストアルバム.・・・いいです.どこ取ってもすごくいいです.ほんと素晴らしいです.うー,何でこれちゃんと事前にチェックしてちゃんと冬コミで買わなかったんだorz.

妖々夢

GWA者の作業待ち中,強烈に眠かったんですが寝るには中途半端な時間だったのでひさびさに妖々夢を遊んでみました.まずExtra.霊夢Bで1プレーしてみたら,何と狐狗狸さんの契約でゲームオーバー.眠いとはいえこりゃひど過ぎです.2プレー目,気合いを入れて臨んだところどうにかクリアできました.一応飯綱権現降臨はゲットしたもののスコアはカスカス.目痛すぎ.式神 橙で2機失うとかいってありえません.その後,魔理沙Aでノーマルを.こちらもどうにかクリアしたものの,今までにない荒れっぷり.やっぱ寝て待ってた方が良かったか・・・.

2006年 3月 9日 (木)

T22のファン

こわれた液晶ひっぺがしてサーバとして24時間動かしっぱなしのT22ですが,最近ファンがひどく嫌な音を立てて回転します.というわけで,T22を狭いすき間から引っ張り出して,アルミ製のノートPC冷却台の上に置いて,更に冷却台のファン(こっちはあんまりうるさくない)を回すようにしてみました.・・・うーん,本体のファンが回転する頻度は減ったかな・・・?でもやっぱファン取り換えた方がよさそうだなぁ.T40の方もファンがおかしくてたまにブートしなかったりとかで,非常によろしくないんで,あわせて交換しちゃいたい所です.この辺のパーツ,まだ取り寄せできるんじゃろか・・・.

CDとか

anima II 東方 (孟世)
アコギ東方アレンジ.いやー,今回も他の東方アレンジとは一線を画していていいですね.というか,さっき気づいたんですが,今までアーティスト名の漢字間違えてました_|‾|○.しかも間違えたのがものすごい勢いでlastfmに登録されちゃってたりするわけでやばい(;´Д`).孟世さん,ごめんなさい.

b-mobile

やばいです.あと3日くらいでライセンス切れちゃいます.半年ライセンスはやっぱ早いなぁ.次も32kでいいとは思うんですが,ヨドバシカメラで売ってるかな・・・(前回は店員さんに聞いたら埃だらけのパッケージが出てきたわけで).

[コメントを書く]

Henrich 2006/03/11(土) 13:44:28
b-mobile はオンラインで更新できますよ
nosuke 2006/03/11(土) 14:28:40
うーん,オンライン更新って↓ですよね?
https://ec.bmobile.ne.jp/
値段的に割引いてなさそうなんで,やっぱヨドバシのポイントに
期待しちゃいます(^^;
Henrich 2006/03/12(日) 01:12:44
あーなるほど、割引はないですね。
ヨドバシまで出かけていく手間と運賃を秤にかけて、私はオンラインで更新してました(今はもうb-mobileも使ってないんですが)

2006年 3月 8日 (水)

latex-mode

雄二さんリスペクトですがYaTeXは使ってないのですよ.で,今日,Emacs22でlatex-modeでtexファイルいじってたらverbの中身のフォントが何か他と違うことに気づきました・・・.タイプライターっぽい感じのフォントが描画されてます.文字の幅も何か他と違う感じ.もしやと思って近くでuim.elで変換候補出したら見事に候補の表示がずれましたorz.

別にバッファの中身が壊れたりはしないんで害はないんですけど,何か気分悪いです.余計なことしやがってという感じです.というわけで(setq tex-verbatim-face nil)で潰してみました.Emacs22初萎え.

audacious-0.2.2

まず,xmms-crossfadeは0.2から同梱されていたのですね.知らずに後から入れていたなんて(しかもちゃんと入ってなかったorz).そして0.2.1から外されてしまったようで(´・ω・`).0.2.2入れてみたので手で入れた方使うようにしてみたら曲を再生しようとした瞬間に落ちるようになっちゃいました_|‾|○.というわけで,やっぱり0.2に戻し.

2006年 3月 7日 (火)

SL-C3200

発表されてますね.3100と何が変わったんですかという感じなんですけど・・・.あー,そんなことよりメール回り何とかしないと.一向にアイディアが浮かびません.

Emacs22

Emacs22を本格的に使ってみることにしました.うーむ,やっぱEmacs21と比べて軽いっす.正式リリースはいつになるのやら・・・.あ,Emacs22だと「C-[」をuim.elが拾えない問題,まだ解決していないんだった・・・と思ったけど,Escapeキーとまったく同じ振舞をするなら別にこのままでいいのかも.

2006年3月11日から2006年3月7日までの日記を表示中

中の人情報

名前:
nosuke (のすけ)
メール:
sasugaanijaのgmail.com
「の」は「@」みたいな
関連リンク:

カレンダー

2006年3月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  

<<先月分

翌月分>>

最新の10件のエントリ

最近の10件のコメント

過去ログ