2007年10月28日の日記の4番目の記事へのコメント
■PS3のアレ
未だ例のアレの全貌を理解していないんですが,とりあえず現状のをベースに,S-boxの参照部分だけ置き換えてSIMD命令使うようにしてみたら10倍くらい遅くなりました(;´Д`).あー,この方式は演算で扱うデータ幅分を一気に計算できるところがミソなのかもしや.だとすると,ここだけでたとえ10倍時間がかかったとしても,ベクトル丸ごと使えば128倍並列度が上がるから・・・(*´Д`)'`ァ'`ァ
ていうか何でそんな時間かかってんだろ.レジスタ使いすぎてロードとストアが頻発しちゃってんのか?先にそっち調べろって感じですね.
2007年10月28日の日記の4番目の記事へのコメント
[コメントを書く]