タイムアタック

昨日の夜からysn氏と謎の行列積のタイムアタックで遊んでいた。最初、ふつうにやると44secくらい。いわゆるブロック化をごちゃごちゃやると13秒くらいかな? そういえばブロック化に関してろくに調べてなかったが、これがブロック化でいいのか? まぁいいや。レポート書きながら、添え字が非対称性であることに言及しつつ、よくよく考えるとブロック化とか関係なくてループの内外を入れ替えて8秒。さらに、ブロック化で5秒。ブロック化しなくちゃいけないくらい非対称なのがいけないという、ysnの指摘で、転置行列をつくると5秒。かわらず。その状態でもブロック化が有効であると言う指摘。3.4秒。なーんか、久しぶりにこういうのやりましたね。CPU実験もこんくらい順調にタイムが縮むといいな。む、しかし後半のアイディアはほとんどysnだ。。。
ところでこのテスト、浮動小数点演算とメモリアクセス。PenMPen4で有意に差が出た。FFO#40のときは両方とも同性能だったのを考えると、やはり浮動小数点でのPen4の優位さがでたのか、な? むしろメモリか? 確かにOxelonはメモリと言うよりビット演算だしな。