2009年1月1日の日記の5番目の記事へのコメント

G-HAL氏パッチ

12月30日版のパッチ13が出ていましたよ! そして例の干し芋問題に言及が・・・.

心当たりとしては、多分PCの時計がずれたのではないかと思う (単なるカン。根拠無し)。

うーん,時計関係あるのかなぁ.12月30日版でも.anthy空にした状態から余裕で再現するので,別の理由な気がしますが・・・.以下再現手順.

  • ~/.anthyの中を空にする
  • sample/conf を ~/.anthyにコピーする
  • 新しくEmacsなどを起動するなどする
  • 新しく起動したEmacsなどで「ほしいものが」を変換して「干し芋のが」で1文節にして確定する
  • 「ほしいものが」を変換して「干し芋のが」になったら「欲しい + ものが」に直して確定する

この状態で,「ほしいものが」で変換すると「干し芋のが」が最初に出てきちゃいます.何度「欲しい + ものが」で切って確定しても変わらず(´・ω・`).最初にいきなり「欲しい + ものが」にすると次回は「欲しい + ものが」で切れてくれるんですが,その後一度でも「干し芋のが」にしてしまうと芋しか出なくなってしまいます.

上記再現手順実施後の last-record2_default.utf8 の中身はこんな感じでした.

ADD "CAND_HISTORY" S"ほしいものが" O1230807894 N0 S"干し芋のが" T1230807894 F1
ADD "CAND_HISTORY" S"ほしいものが" O1230807894 N1 S"干し芋のが" T1230807894 F1
ADD "OCHAIRE" S"ほしいものが" N2 N3 S"欲しい" N3 S"ものが" T1230807906 F1
ADD "CAND_HISTORY" S"ほしい" O1230807906 N0 S"欲しい" T1230807906 F1
ADD "CAND_HISTORY" S"ものが" O1230807906 N0 S"ものが" T1230807906 F1
ADD "CAND_HISTORY" S"ほしい" O1230807906 N1 S"欲しい" T1230807906 F1
ADD "CAND_HISTORY" S"ものが" O1230807906 N1 S"ものが" T1230807906 F1

こいつの読み方が分かればもうちっと先に進めそうなんだがなぁ・・・.

[コメントを書く]

vagus 2009/01/02(金) 17:17:50
一旦「|干し芋のが|」以外の候補(たとえば「ホシイモノガ」)で確定してみるとどうなりますか?

nosuke 2009/01/03(土) 19:18:31
やってみました.
次から「ホシイモノガ」が最初に出るようにはなるのですが,
その後「欲しい+ものが」で切って確定してもやはり切れ目を覚えてくれず
「ホシイモノガ」が常に出つづけちゃいます.
vagus 2009/01/03(土) 23:11:57
ああ、そうか、えーと、その状態で DONOT_LEARN_KATAKANA を「HI」にしてみるとどうでしょう?

手元では「欲しい|ものが」になって、それ以後 DONOT_LEARN_KATAKANA を「_」に戻して「干し芋のが」や「ホシイモノガ」で何度確定しても「欲しい|ものが」が出続けるようになったんですが。

ただ、自分の環境はかなりいじってるのでならないかも分かりませんが…。
nosuke 2009/01/05(月) 23:34:32
遅くなりましたが試してみました.
結果,特にこちらの環境では変わりなく,「ホシイモノガ」or
「干し芋のが」の最後に確定した方が常に出てきます(´・ω・`)

というか,いつの間にか
http://garakuta.homelinux.org/~nosuke/diary/diary.html?y=2008&m=12&d=22&n=1#22-2
のときと同じように「そのでばいすに」をわざと「園で + 倍すに」しようと
してもうまく行かなくなってしまいました.文節をいじって確定しても
常に「その + デバイスに」となってくれます.あれれ・・・?
G-HAL 2009/01/06(火) 23:05:03
たびたびどうもすみません。
ビタビだと、うしろから文節を区切っていく場合がある(むしろその方が多い?)事を忘れて、
後方一致する学習結果の優先度計算をしていなかったバグです。治しました。

学習データの読み方は、パッチ中の
doc/fileformat_of_learningrecord.txt
に書き殴ってみました。
nosuke 2009/01/07(水) 02:12:18
いつもありがとうございます.今のところとてもいい具合です.
学習データの読み方,後で参考にさせていただきます.
#昼間配布ページが打ち消し線だらけになっていてビビりましたw

お名前:  メールアドレス(省略可):
メールアドレスも表示されます
ここに名前その他を書いてはいけません: ここにメールアドレスその他を書いてはいけません:

2009年1月1日の日記の5番目の記事へのコメント

中の人情報

名前:
nosuke (のすけ)
メール:
sasugaanijaのgmail.com
「の」は「@」みたいな
関連リンク:

カレンダー

2009年1月
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

<<先月分

翌月分>>

最新の10件のエントリ

最近の10件のコメント

過去ログ