2008年11月30日から2008年11月26日までの日記を表示中
2008年11月30日 (日)
■帰宅
午前中は気持ち悪くて寝倒し,だらだら過ごして夕方頃に出て帰ってきました.府中競馬場付近の道が超混んでてちっとも進まなかったので,途中で横道に逃げてナビ (の地図) を頼りに迂回.どうにか抜けられたけど,やっぱこの時間に帰るのは良くなかったな・・・.
[コメントを書く]
■Anthy
いい肉の日リリースのpatch13に上げ,さらに今日リリースのpatch13に上げてみました.とりあえず ~/.anthy/conf いじって n文節最長一致の方で使ってみています.conf の雛形に
# 変換アルゴリズムの選択 # ビタビアルゴリズムを使用する場合は、こちらをコメントアウトする。 VITERBI_MODE # n文節最長一致を使用する場合は、こちらをコメントアウトする。 #MAXLEN_MODE
とありますけど,ビタビがデフォってことは,s/コメントアウト/アンコメント/g が正解ですよね多分・・・.
あと,なんかまた「1こ」→「1個」のように全角優先になっちゃってソースいじっても変わってくれなくてやや涙目だったんですが,実はこれも conf でいじれました.これは素晴らしい.深追いする前に気づいてよかったぜー.
[コメントを書く]
2008年11月29日 (土)
■移動
昼過ぎに川崎に移動してみました.何か近所の買い物以外で車に乗るの,超久しぶりかも・・・.
[コメントを書く]
■同窓会
「同窓会なんて都市伝説だろw」とか言ってそうなキャラだと思われていそうですが,まあそういうものもあったりして行ったりするわけで・・・(厳密には企画しなきゃいけない立場だったりすんですが今回は本当に何もしていない・・・).十数年ぶりに会うとかすげえよなー.話に熱中する傍らで気がつけばかなりの量のワイン飲んでいたようで (フロアスタッフの人が何度も注いでくれたのは覚えているw),久々に飲み過ぎた感が.あと,二次会で怪しい店に連れていかれたりと,貴重な経験もw.で,帰りは終電ギリギリでした.あぶねー.
[コメントを書く]
2008年11月28日 (金)
■Anthy
続き.何と驚くべきことに昨日のであってたらしいですw.というわけでさっそく新しくなったpatch13を当ててsettings.cをちょっとだけいじって試用中.「わらい」→「(笑)」とかもちゃんと学習してくれるようになって,今のところなかなかいい感じかも.
[コメントを書く]
2008年11月27日 (木)
■地霊殿Extra
うーん,でもやっぱ萃香はパワーが弱いのが苦しい.というわけで今日は紫で.何度か頑張ったところ,弾幕のロールシャッハまでいけました.まだまだだなぁ.
[コメントを書く]
■Anthy
今日もG-HAL氏パッチ関連ネタ.patch12で安定かと思ったら,変換して確定しても覚えてくれなくて次にそれが1番上に出ないパターンが.自分で辞書に登録した単語を選んで確定した場合に発生する? いやでもそうでもないのもあるな・・・. 「わらい」→「(笑)」がNG.「まりさ」→「魔理沙」は覚えてくれたw.品詞は関係ないっぽいし,学習データは1回消した状態だし,うーん.
あと,@mojin が最新の patch13 を試して「さいばーすてぃっく」で落ちていたのでちょっと調べてみました.makeして test に移動して test.txt の 2行目あたりに「*さいばーすてぃっく」と書いて ./anthy 1 とかやると死にます.とはいえ,インストールしないで色々実験できるのでこれは楽ちん.前に田畑さんに教えてもらったんだっけ.思い出せてよかった・・・.
で,gdb を噛ましてバックトレースをとってみたところ↓な結果が.
Program received signal SIGSEGV, Segmentation fault. 0xb7f20332 in set_bestmw_by_metaword (wsic=0x8066570, mw=0xbfd40c3c) at lattice.c:1254 1254 wsic->best_mw[mw->mw1->from] = mw->mw1; (gdb) bt #0 0xb7f20332 in set_bestmw_by_metaword (wsic=0x8066570, mw=0xbfd40c3c) at lattice.c:1254 #1 0xb7f21a0b in anthy_mark_borders (sc=0x8065c44, from=4, to=9) at lattice.c:1325 #2 0xb7f1f218 in anthy_eval_border (sc=0x8065c44, from=0, from2=0, to=9) at evalborder.c:186 #3 0xb7f1ee1a in anthy_mark_border (sc=0x8065c44, from=0, from2=0, to=9) at splitter.c:169 #4 0xb7f1a2c0 in make_candidates (ac=0x8065c00, from=0, from2=<value optimized out>, nth=0, is_reverse=0) at context.c:345 #5 0xb7f1a675 in anthy_do_context_set_str (ac=0x8065c00, s=0x8065b50, is_reverse=0) at context.c:384 #6 0xb7f19906 in anthy_set_string (ac=0x8065c00, s=0x8065b38 "さいばーすてぃっく") at main.c:240 #7 0x080497f4 in main (argc=65808, argv=0xb7f26560) at main.c:250 (gdb) quit
うむむ,なんだろう.ソースを見てもさっぱり.mw->type->from には何か値が入ってましたが・・・
(gdb) p/x mw->mw1->from $2 = 0x10110
よくわからんのでとりあえず configure 時に CFLAGS="-O0 -g" としてみることにしたら普通に動くし(;´Д`)
Starting program: /tmp/anthy-9100e/test/.libs/lt-anthy 1 ./test_anthy --help to print usage. ANTHY_ENABLE_DEBUG_PRINT=() ANTHY_SPLITTER_PRINT=() SRCDIR=(.) anthy-9100e Fri Nov 28 02:52:01 2008 1:(さいばーすてぃっく) |さいばー|すてぃっく さいばー(サイバー:(1N,1000,N,6553,303,0)7,782 ,さいばー:(N,0,-)2 ,): すてぃっく(スティック:(1N,1000,N,6553,303,0)7,782 ,すてぃっく:(N,0,-)2 ,): 2 items conversion result ok : 0 miss : 0 unknown : 1 split result ok : 0 miss : 0 unknown : 1 Program exited normally.
再び CFLAGS なしで configure して make したらまたセグるようになった・・・.やはりどっかに際どいコードが混じってるんですかねー.ソース見てもわかるわけがありませんが,試しに勘で ↓ とかやってみたら落ちなくなりましたw.でも多分これは違うw
--- src-splitter/lattice.c.org +++ src-splitter/lattice.c @@ -1322,7 +1322,7 @@ } } if (mw) { - set_bestmw_by_metaword( sc->word_split_info, &mw ); + set_bestmw_by_metaword( sc->word_split_info, mw ); from += mw->len; if (to < from) { from = to; /* It is a bug, may be. */
・・・続くかもしれない.
[コメントを書く]
2008年11月26日 (水)
■地霊殿Extra
この人ほんと毎日地霊殿しかやってないんじゃないかと思った人,正しいw.今日はExtraやってました.萃香と紫でやったんですが,萃香の方が若干進みがよく,妖怪ポリグラフまで到達.今回も絶望的なところから始まって徐々に生き残る術が見えてくるところが面白いけど先は長そうですな.
[コメントを書く]
2008年11月30日から2008年11月26日までの日記を表示中
&mw → mw は、ご指摘の通りです。
お陰様で、当方では全く気づいてなかったバグを治す事ができました。有り難うございます。
「(笑)」が学習されないのは、試験時に私好みの設定に変えた後、
公開時に一般向け設定に戻すのを忘れた物です。
conf ファイルの DONOT_LEARN_EXCEPTION_WORD_AT_* の辺りになります。
また、2007/11/24の「アン氏んです」の件と、2007/9/17のekato氏の「生血ゃ」の件も、
参考にさせて頂きました。重ねてお礼申し上げます。