文章目录
- 程序级性能分析
-
- 程序性能的要素
- 测量驱动的性能分析
- 软件性能优化
-
- 循环优化
-
- 代码移出(code motion)
- 归纳变量消除(induction variable elimination)
- 强度消弱
- cache 优化
-
- 数据重排和数组填充
- 性能优化的策略
- 程序级功耗分析与优化
- 程序验证与测试
-
- 白盒测试
-
- 执行路径与测试
- 黑盒测试
程序级性能分析
- 程序性能 ≠ neq /span>= CPU性能
- CPU时钟频率不是衡量程序性能的可靠度量
- CPU流水线和高速缓存在程序扮演窗口的作用
- 流水线和高速缓存影响执行时间,但是执行时间是程序的
- 用指令数目乘以指令的执行时间得到程序的总体执行时间:过于简单
- 并非所有的指令都花费相同的时间
- 多周期指令
- 指令的执行时间不是独立的
- 指令的互锁
- cache的影响
- 依赖于操作数的值
- 浮点数计算
- 多周期整数操作
- 并非所有的指令都花费相同的时间
测量驱动的性能分析
- 确定程序执行时间最直接的因素是测量
- 为了使程序在最坏/好执行路径上执行,需提供适当的输入
- 需要访问CPU或者CPU仿真器
- 程序执行的路径记录时程序轨迹(program trace),有时简写为轨迹(trace)。
- 为确定输入值真实有效,可以通过使用基准数据集或者从正在运行的系统中捕获的数据来生成典型输入值。对于简单的程序,可以通过分析算法来确定导致最坏情况执行时间的输入集。
- 方法
- 反馈程序
- 轨迹驱动测量
- 物理测量
- CPU仿真
- 反馈程序
- 输入数据
- 写软件脚手架(software scaffolding),将数据输入程序并得到输出结果
- 软件脚手架(software scaffolding)是将数据传入程序并获取数据输出的辅助代码。
- 它可以在设计大型系统时,很难提取出软件的某一部分,并将其独立于系统的其他部分进行测试。因此可能需要向系统软件中添加新的测试模块,来引入测试数据并观察测试的输出。
- 系统添加新的测试模块,以引入测试值并观察测试输出
- 轨迹驱动的测量
- 将确定程序的执行路径与路径计时融合
- 程序执行,选择一条路径,观测执行时间。
- 轨迹文件较大
- 主要用于对cache的分析
- 物理测量
- 观测程序计时器的值
- 程序开始,启动一个计时器
- 程序结束,停止计时器
- 需要修改程序
- 逻辑分析仪测量引脚的行为
- 通过地址总线查找事件
- 修改代码以使得事件可见
- 由于逻辑分析仪的内存有限,只能对短执行时间的程序有效
- 观测程序计时器的值
- CPU仿真
- 可利用周期精确仿真器
- 可确定执行所需的时钟周期数
- 比实际的CPU慢
- 指令级模拟器
- 只提供功能模拟指令
- 不提供时序信息
- 可利用周期精确仿真器
软件性能优化
- 嵌入式系统需要满足时限要求
- 分析执行时间
- 最坏执行时间
- 提高其执行时间
- 代码级优化
- 指令级优化
循环优化
代码移出(code motion)
- 如果计算结果不依赖于在循环体中执行的操作,可以安全地将它从循环体中移出
- 例如
归纳变量消除(induction variable elimination)
- 是从循环迭代变量导出的值(循环的索引)
- 考虑以下循环
- 可以用i*M+j表示数组的下标
强度消弱
- 变为
cache 优化
- 优化循环嵌套
- 改变数组元素的访问顺序
- 为编译器后一阶段带来新的并行时机
- 改进cache性能
数据重排和数组填充
- 考虑以下代码的cache行为
- 假定:
- 数组a,b大小为M=256,N=4,a=1024,b=4099
- a和b数组起始元素在cache同一行。
- 每四次迭代出现冲突。
- 移动一个数组;让b数组的起始地址开始于4100
- 填充数组;把填充字符放在数组行的开始位置,让b数组的起始地址开始于4100
性能优化的策略
- 尽量有效使用寄存器
- 在存储系统中使用页访问模式。
- 分析cache的行为
- 指令冲突通过重写代码、重新调度来处理
- 对标量数据冲突,移动数据
- 数组数据冲突,考虑移动数据或填充
程序级功耗分析与优化
- 指令
- 指令的选择;
- 指令的顺序;
- 操作码和操作数位置;
- 内存系统的设计–能换来最大的节能效益
- cache的设计
- cache太小,内存开销大,程序运行慢,系统功耗大
- e = # edges
- n = # nodes
- p = 组件的个数,
- 结构化程序:1
- M为2元判决的数目(>=3)加1,和高元分支减1.
-
分支测试(branch testing)
- 分支测试的策略:
- 每个条件做假和真的测试
- 每个简单的条件至少测试一次
- 分支测试的策略:
-
数据流测试——域测试
- 用于对不等式测试
- 例如:对j<=i+1测试
- 三个测试点
- 2个有效区域的边界上;
- 三个测试点
-
循环测试应当测试的几种重要情况:
- 整体跳过循环;
- 一次循环迭代;
- 两次循环迭代;
- 若循环迭代有一个上限,大大低于最大迭代次数的一个值;
- 接近循环迭代上限的一个值。
- 若完全白盒测试,需要大量的测试,
- 需要其它的测试方法-黑盒测试
- 随机测试
- 可以基于软件规范的权重分布的随机测试;
- 回归测试
- 基于以前版本的测试;
- 可能以前版本是白盒测试;
- 随机测试
- 测试多少是足够的
- 耗尽测试是不实际的;
- bug在一定的范围内;
- 好的组织测试,可以使bug 告率在一个非常低的范围内;
- 错误注入:
- 添加已知的错误;
- 运行测试;
- 判断有多少百分率的bug被发现。
黑盒测试
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!