ICS Lab4 常用优化方法

Aiur · Zellux at 
几个基本的优化:用 iaddl 代替 irmovl, opl,效果显著删去不必要的 andl,效果显著改变判断分支(大多数是正数),效果显著实现 Load Forwarding,效果显著函数结束时使用自己的 epilogue,效果一般 Unrolling 相关:通过合并相邻两个循环,把 mrmovl 和 rmmovl 拆开,效果显著 32, 16, 8, 4, 1 分段处理,效果显著,我用这个方法做到过 7.2 左右 Jump Table 由 Duff’s Device 引申出来的想法,代替了我原来那个 32-16-8-4-1 程序。很好用的一个技巧,配合 unrolling 就不需要不断比较……