2008年12月22日の日記を表示中

2008年12月22日 (月)

SPUの右シフト

コメントに書くと長そうなのでこっちにー.団子厨さんから以下のようなコメントを頂きました.

> 128ビットアラインメントされてないアドレスをロードすると
> 下位4ビットが無視される。

> 128ビット境界を跨ぐデータをロードする場合、2回ロードを発行して、
> それぞれ右シフト+左シフトして重ね合わせることになる。
> この際、シフト命令が補数をとる形式だと下位4ビットがそのまま使うことが
> できる。

おお!なるほど! それは考えたことがなかった! というわけで早速試してみたんですが,ちょっとうまくいかないっぽいです (´・ω・`)

アドレスをシフト値に使うということなので,ビットで指定する spu_rlmaskqwbytebc ではなくバイトで指定する spu_rlmaskqwbyte の話になるかと思うんですが,たとえば以下のコードでbuf の中の「CDEFGHIJKLMNOPQR」を1個のレジスタに読み出したいようなシチュエーションでの利用ということでいいんですよね?

char buf[] __attribute__((aligned(16))) = "ABCDEFGHIJKLMNOP"
                                          "QRSTUVWXYZabcdef"
                                          "ghijklmnopqrstuv"
                                          "wxyz";
vec_char16 v, vp, v1, v2;
vp = (vec_char16 *)(buf + 2);
v1 = vp[0];
v2 = vp[1];

// ビッグエンディアンなので1個目を左シフト,2個目を右シフトする
v = spu_or(spu_slqwbyte(v1, (int)vp),
           spu_rlmaskqwbyte(v2, (int)vp));

残念ながら,これはうまくいかないっぽいです.動かすと,vの中身は「\0\0\0\0\0\0\0\0\0\0\0\0\0\0QR」か「CDEFGHIJKLMNOP\0\0」になってしまいます.

シフトの大きさは (bufのアドレス + 2) としていますが,これは (16の倍数 + 2) になっているので,左シフトでも右シフトでも下位4bitしか見ないのであれば「2」を指定したのと同じになるはずです.

が,実際は,spu_rlmaskqwbyte は指定されたシフト値の符号を反転した後,下位5bitを取り出して,その数分右シフトします.また,バイト単位で左シフトする命令の spu_slqwbyte も同じように下位5bitを使います.なので,上記コードでは,シフト値として「2」が渡されるとは限らず,bufのアドレス次第では「18」になってしまう可能性があります.

で,18 になってしまうと,18 バイト左シフトされた1個目の値は全部 0 で埋まってしまいます.右シフトの方は「-14」を指定したのと同じことになるので14bit右シフトしてくれて丁度いいのですが・・・.

また,vpの下位5bitが 18 でなく 2 だった場合,左シフトは 2バイトでいい具合なんですが,今度は右シフトが「-30」を指定したのと同じ扱いになってしまい,結果が全部 0 で埋まってしまいます (´・ω・`)

というわけで,アドレスをそのまま使って2回に分けてロードしたベクタの合成には使えないかなーという感じなのですが,どうでしょう・・・.わざわざ5bit分使うのは16バイトの右シフトにも対応させたかったからなんですかね・・・.うーん.

あと,ここまで書いて気がついたんですが,SPEではそういう必要が生じたらシャッフル命令を使ってこんな風にやるのが普通なのかもしれません.

char buf[] __attribute__((aligned(16))) = "ABCDEFGHIJKLMNOP"
                                          "QRSTUVWXYZabcdef"
                                          "ghijklmnopqrstuv"
                                          "wxyz";
vec_char16 v, vp, v1, v2;
const vec_uchar16 vshuf2 = (vec_uchar16){ 2,  3,  4,  5,  6,  7,  8,  9,
                                         10, 11, 12, 13, 14, 15, 16, 17};
vp = (vec_char16 *)buf;
v1 = vp[0];
v2 = vp[1];

v = spu_shuffle(v1, v2, vshuf2);

Anthy

12月9日版のG-HAL氏パッチを当てたAnthyを使っているわけですが,恐ろしいパターンを発見してしまいました.

「そのでばいすに」を変換すると,普通は「その + デバイスに」になってくれると思います.が,うっかり間違えて文節を伸ばしてしまって「園で + 倍すに」とした上で1回確定してしまうと,その後何度文節を直して確定しても「そのでばいすに」→「園で + 倍すに」で固定されてしまいます・・・.

今んとこ復帰するには last-record2_default.utf8 をエディタで開いて「園で」とかを探して手で消すしかないような.うーむ,うまいこと設定で回避できないものか・・・.他の人どうっすかねー.まあ,覚えてくれないよりは遥かにいいのかも知れませんがw

[コメントを書く]

G-HAL 2008/12/24(水) 22:19:36
重ね重ね申し訳ありません。
学習量をケチろうとしてカタカナ語やひらがな語?を覚えない設定にしたまま、一般公開時に戻していませんでした。
confファイルで
DONOT_LEARN_GUESS _
DONOT_LEARN_HIRAGANA _
DONOT_LEARN_KATAKANA _
DONOT_LEARN_KIGOU _
DONOT_LEARN_MUHENKAN _
DONOT_LEARN_ZENHAN _
DONOT_LEARN_NUM_ANK _
DONOT_LEARN_NUM_JIS _
DONOT_LEARN_NUM_KANSUUZI _
DONOT_LEARN_NUM_SEPARATED_ANK _
DONOT_LEARN_NUM_SEPARATED_JIS _
DONOT_LEARN_NUM_ZIPCODE _
すると、ありとあらゆる変換を覚える様になります。
nosuke 2008/12/25(木) 00:42:25
うおお,こんにちは.いつもお世話になっております.
そしてコメントありがとうございます.
早速追加してみたところ,ばっちり復活できるようになりました!
わーい.

2008年12月22日の日記を表示中

中の人情報

名前:
nosuke (のすけ)
メール:
sasugaanijaのgmail.com
「の」は「@」みたいな
関連リンク:

カレンダー

2008年12月
  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31      

<<先月分

翌月分>>

最新の10件のエントリ

最近の10件のコメント

過去ログ