x86-64 最適化勉強会2

http://atnd.org/events/19140

前回同様楽しかった。「x86/x64最適化」とかいう極めて限定的なタイトルで第2回とかになったことにびっくりですが、驚くべきことに第3回をやるつもりらしいですね…奥が深い。 86 か最適化のどっちか落としてもキツそうなのに…

どうでもいい話をしたので発表資料。この時の話。 http://d.hatena.ne.jp/shinichiro_h/20090509#1241854156

http://shinh.skr.jp/slide/ed/000.html

前日ってか当日にスライド作っていて、 edit distance の部分には SSE 全く使ってなかったことにびっくりしました。 x86 全く関係なくて申し訳なかったです…

  • このコンテストのここ以外の部分では SSE 使った
  • 厳密な edit distance を求める SSE コードは書いた(たぶん)
  • ただ厳密じゃないやつの方が良くて、厳密にやったり bit 幅広くしたりするのはイマイチ結果に影響を及ぼさなかったので捨てた

って感じだったんじゃないかと…

内容自体は oxy さんが書かれた

http://mono.kmc.gr.jp/~oxy/d/?date=20090323#p01

と同じ話です。多少見にくい図とか増やしたので、後で私が見る時には思い出しやすいはず…

会自体は、 maropu さんの最初の話が面白かったなぁと思いました。 Gamma 符号ってやっぱムダだよなぁとか、 bitonic sort って GPU とかじゃなくて SIMD 程度の並列性でも速くなるんだな…とか。

今回はツールの話が多くて、このへん普通に使わんと損だなーという感じでした。特に perf 。あと JIT code の profile する API は、それをデバッガによこせと。

wo さんに聞いた http://parabix.costar.sfu.ca/ は面白そう。文字集合探す時に転置して並列に探すっていうアイデアは面白いな…と。

あと agrep は grep より速いって論文を読んだはずなのに全く記憶に残ってないので、また読んでおこう…

なにかあれば下記メールアドレスへ。
shinichiro.hamaji _at_ gmail.com
shinichiro.h