2009年11月10日の日記を表示中

2009年11月10日 (火)

今日も

Twitterの方で頭の悪いことぶつくさポストしている以外,原稿しかやってなくて特別ここに書くようなことがないです.・・・あ,そういや「ぜんぱたーん」とかで「千パターン」が出てくるパターンが復活してしましました.いつから (;´Д`)

[コメントを書く]

vagus 2009/11/13(金) 01:32:08
>「千パターン」
これは現状、「全パターン」を一語で、かつ、「千パターン」より前に来るような大きな頻度値で、辞書登録するしか回避方法はないです。
こちらでは登録しましたが、当面は、お手数ですが個人辞書に登録して凌いで頂きたく。

(以前の「|ほぼ千部|」は、

・「|ほぼ|ぜんぶ|」と 2文節になるようにした
・「千部」より前に来るように「全部」が辞書に登録されている

ことで、「|ほぼ|全部|」が出るようになってます。
なので、「ぜんぶ」の変換候補の中にまだ「千部」はいます)
nosuke 2009/11/13(金) 20:12:17
あ,戻ってしまったかとばかり思っていたんですが,以前のとは別の
ものでしたね.すっかり勘違いしてました・・・.すいません.
おとなしく辞書に登録することにします.情報ありがとうございました.

ちなみに「ぜんクラス」や「ぜんライン」と違い「ぜんユーザ」とか
「ぜんモード」とかだと「千」とくっついて出てこないのは,この辺の
言葉が数字の後ろにつくことが想定されているかいないかの違いって
ことなんでしょうか.
vagus 2009/11/13(金) 23:34:01
「パターン」「クラス」「ライン」は助数詞(JS)でも登録されているので、数詞(NN,N0[0-3])とくっついて一文節にされます。
「モード」や「ユーザ」は現在、助数詞(JS)として登録されてないのでくっつかないわけですが、それは「想定されているかいないかの違い」かと言うと…

そう言えればいいんですが、実は

「初めの頃はよく分からずに、数詞につながるものをバンバン助数詞として登録してた。でも、かなり誤変換を引き起こすことに気づいてからは、極力登録しないようにしてる。なので、現在登録されているものは、初めの頃に登録したものが残ってるだけ」

というのが実情に近いです…。

直せるものなら直したいのですが、数詞がらみの表現というのは、多分かな漢字変換の中でも最難関なんじゃないかと思うので、私なんぞにはいい考えが浮かびません…。

# 以前 2ch で「こんな当たり前の表現も出せねえのか」とか言われてましたが。

内部では「NNPRE+NN+JS」という繋がりを持ちつつも、ユーザには「|ほぼ|千|部|」「|千|パターン|」みたいに区切って表示するようにすれば、区切り直す手間が減る分だけ多少マシになるのかな、とは思いますが…。
nosuke 2009/11/15(日) 22:16:22
なるほど,そういう歴史的経緯があるったのですね.
しかし「ぜん」とかの「さん」相手にしか出てこないような読み仮名に
苦しめられるのが何とも面白い話ですね

2009年11月10日の日記を表示中

中の人情報

名前:
nosuke (のすけ)
メール:
sasugaanijaのgmail.com
「の」は「@」みたいな
関連リンク:

カレンダー

2009年11月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          

<<先月分

翌月分>>

最新の10件のエントリ

最近の10件のコメント

過去ログ