2007年3月2日の日記の2番目の記事へのコメント
■Anthy-8700 + alt-cannadic-070228
辞書消してみたんですが,やっぱ最初に出てくる候補が違和感あり・・・.長々と打たないのが悪いんですかね(うはっ,「うたないのが」→「歌内のが」しか出てこなくなっている・・・orz).「よわい」→「歯」(第一候補はひらがなで「よわい」),「こてい」→「湖底」,「はんてん」→「斑点」,「しるし」→「首」,「かんけい」→「奸計」・・・.うーん,最初の候補は辞書の頻度の問題な気がしますが,「〜ない」はきっとAnthy側の問題ですよねぇ・・・.謎だ.8300の方がよかった気も.慣らしが足りないだけなのかなぁ・・・.
[コメントを書く]
2007年3月2日の日記の2番目の記事へのコメント
> 長々と打たないのが悪いんですかね
長々とまで行かなくても、「固定の」「反転が」「印が」「関係を」と助詞一つ付けるだけで並び順は変わってきますね(「よわいの」は「齢の」になっちゃいますが。「歯」は単漢字ですし)。
基本的には anthy の変換単位は『文節』なので、少しでも助詞助動詞をつけてあげた方がいいとは思います。
ただ、ユーザとしてはいつも文節文章を入力するわけではないので、単語の読みしか入力しない場合でもよく使われる語が上に来てほしいとは思いますが。
一応 anthy の挙動を色々見てはみたんですが、どういうルールで並べているのか私にはよく分かりませんです。「単語の読みと思われるものしか与えられなかった場合には、ユーザは名詞や単漢字を探しているものとみなし、T35や固有名詞や単漢字を優先させる」というあたりかと思ったんですが、そうでないようなパターンもあるような気もしますし。
今月anthy側も頻度まわりを変更されるようですし、alt-cannadicも頻度まわりをいじるつもりなので、ある程度はよくなると思います(というか思いたい)。
品詞コードで並び順を決められちゃうと苦しいですが。
> 助詞一つ付けるだけで並び順は変わってきますね
なるほど,確かに.ただ,ソースのコメントとかだと「ここでフラグを反転」とか「0固定」とか体言止め使うことが多いのでなかなか(^^; (ソースに日本語のコメントをいれるなとかそういう議論は無しの方向で・・・).上の例は,その辺で気になったやつだったりします.お前みたいなやつはSKK使えとか言われそうですね(笑)
ありがとございます。でも、まだどう取り込まれるのか分からないので結構不安だったりします (^^;)
> お前みたいなやつはSKK使えとか言われそうですね(笑)
いやいや、私も上のコメントを書いた後「医療ミス」と入力しようとして「医療|御簾」になり、しかも「御簾」を「ミス」に変えようと思ったら「ミス」が12個中12番目(つまり一番最後)の候補だったのでかなりイラつきました :-p
いつも助詞つけるわけじゃないですもんね。
タイミングを見て田畑さんに聞いてみます。