初探调优1:系统压测,瓶颈定位及调优方案

木桶理论应用在系统优化中

  木桶理论又称短板理论,其核心思想是一只木桶盛水多少,并不取决于最高的木板,而取决于最短的那块木板。 木桶原理应用在系统分析中,即系统的最终性能取决于系统中性能表现最差的组件,为了提升系统整体性能,对系统中表现最差的组件进行优化可以得到最好的效果。   

压力测试如何实施

性能测试在大型 站系统的设计和开发中非常重要,通常会和容量预估等工作结合在一起,穿插在系统开发的不同方案。 性能测试可以帮助我们及时发现系统的性能短板,评估系统的能力,在这个基础在上再进行针对性的性能优化。 同时,压力测试还可以帮助我们验证系统的稳定性和可靠性。   一个完整的性能测试方案通常包括以下几个方面: 

1.压力测试及生成性能 告

压力测试一个重点是如何产生压力,通常可以通过自己编写脚本模拟请求,或者使用成熟的压测工具进行。 压力测试很重要的一点是如何使得模拟压测的数据尽量真实,越接近真实用户越好。

2.根据性能 告定位系统瓶颈,进行针对性优化,测试和优化的工作可以和日常开发并行

压力测试完成以后,我们会拿到一个压测 告,这个 告通常会告诉我们系统的QPS、TPS、响应时延等数据, 这些数据可以让我们对服务器的性能有个整体的了解,发现存在的问题,但是不能帮助我们定位问题。   这个时候我们可以从系统的各个组件入手,关注系统的CPU、内存、IO、 络,对比这些环节对整体性能的影响,确定性能问题是系统哪一部分造成的,然后针对性的在系统中逐个优化。

3.估算容量承载能力,合理规划系统资源

进行压力测试的一个重要目的是让现有的服务器资源发挥最大的价值, 经过前期的测试和分析,这时候我们对系统整体的性能有了一个认识,对服务器的承载能力有了预估, 这个时候我们就可以结合业务规模配置服务器数量,CDN资源等,让最少的资源产生最大的价值。

 

常用压力测试工具选型

压力测试很关键的一点是如何产生压力,选择哪款测试工具很重要,大的互联 公司如百度/腾讯等,都有专门的测试开发团队,开发公司内部应用的测试工具,以便更好的适应公司的业务,作为SAAS服务的重要部分,几个云服务提供商也纷纷开放了压测及性能监控服务。 大多数公司还是会选择自己完成测试工作,这里关注一下常用的压力测试工具。 

1.几款流行的压力测试工具 

(1)JMeter Apache JMeter是Apache组织开发的基于Java的压力测试工具,用于对软件做压力测试,它最初被设计用于Web应用测试但后来扩展到其他测试领域。 它可以用于测试静态和动态资源例如静态文件、Java小服务程序、CGI脚本、Java 对象、数据库, FTP服务器, 等等。   JMeter 可以用于对服务器、 络或对象模拟巨大的负载,来在不同压力类别下测试它们的强度和分析整体性能。 另外,JMeter能够对应用程序做功能回归测试,通过创建带有断言的脚本来验证你的程序是否返回了期望的结果。 为了最大限度的灵活性,JMeter允许使用正则表达式创建断言。   (2)LoadRunner LoadRunner是惠普旗下一款自动负载测试工具,它能预测系统行为,优化性能。LoadRunner强调的是整个企业的系统,它通过模拟实际用户的操作行为和实行实时性能监测,来帮助更快的确认和查找问题。此外,LoadRunner 能支持最宽范的协议和技术,量身定做地提供解决方案。   (3)其他测试工具

  • Siege是一款开源的压力测试工具,可以根据配置对一个WEB站点进行多用户的并发访问,

记录每个用户所有请求过程的相应时间,并在一定数量的并发访问下重复进行。

  • TCPCopy是一种请求复制(所有基于tcp的packets)工具,可以把在线请求导入到测试系统中去。

TCPCopy的特点是可以拷贝线上真实流量,模拟用户数据。  

2.性能测试工具的横向对比

这里对比主流的 JMeter和LoadRunner,一般来说,除了自研测试工具的公司,互联 公司使用JMeter作为测试工具的较多。 

  JMeter LoadRunner
开发语言 纯Java开发 使用C语言开发
支持应用 对Java为主的系统支持较好 支持比较全面
是否收费 开源免费 商业软件
学习成本 应用简单,上手快,Java自定义测试计划 功能复杂,学习成本高
协议支持 支持常见的HTTP/FTP/SMP等 支持较全面
自定义测试 支持使用Java编写Sample 使用完善的组件进行定制化测试
组件功能 Thread Group, Samplers, Listeners, Pre & Post processors 一套完整的测试组件,比如VU Generator, Controller, Analyzer, Load generator, Load calculator 和protocol advisor.

   

如何监控系统资源,定位性能瓶颈

压力测试可以暴露系统性能问题,如高并发下访问缓慢,服务宕机等,但是通过压测不能具体到哪里存在瓶颈,必须要在压测同时配合适当的资源监控,帮助我们定位问题。

1.配置合理的资源监控方案

针对测试 告进行针对性优化

在压力测试发现问题以后,就要进行有针对性的优化。对于不同的系统,这个过程的策略并不是确定的,但是大概可以划分为以下几个步骤: 

1.定位性能瓶颈,找出系统存在的问题 

不同系统的特点不同,在性能瓶颈上也有不同的表现,一般来说,下面的几个方面通常存在比较大的优化空间:   (1)磁盘I/O及文件操作 由于磁盘I/O读写的速度要比内存慢很多,程序在运行过程中,如果需要等待磁盘I/O完成,那么低效的I/O操作会拖累整个系统。   (2) 络操作 对 络数据进行读写的情况与磁盘I/O类似。由于 络环境的不确定性,尤其是对互联 上数据的读写, 络操作的速度可能比本地磁盘I/O更慢。   (3)CPU 对计算资源要求较高的应用,由于其长时间、不间断地大量占用CPU资源,那么对CPU的争夺将导致性能问题。如科学计算、3D渲染等对CPU需求旺盛的应用。   (4)高并发下的上下文切换及锁竞争等 高并发程序如果没有做好优化,存在大量的锁竞争,激烈得锁竞争将会明显增加线程上下文切换的开销,对性能造成极大的影响   (5)数据库 大部分应用程序都离不开数据库,而海量数据的读写操作可能是相当费时的。而应用程序可能需要等待数据库操作完成或者返回请求的结果集,那么缓慢的同步操作将成为系统瓶颈。

2.确定调整目标,提出解决方案

找到系统的性能问题以后,需要作出对应的解决方案。   典型的影响性能的问题,比如: (1)系统对高并发的场景响应不足,如数据库连接池过低,服务器连接数超过上限,数据库锁控制考虑不足等 (2)内存泄露,如在长时间运行下,内存没有正常释放,发生宕机等 (3)数据库优化不足,业务日益增长,关联表众多,SQL不够优化等   定位到上述问题,接下来就是提出合理的调整目标, 比如服务器资源有限,可以通过配置更多的机器,服务上云等进行优化; 如果对高并发支持不好,就可以在代码层面优化,提高并发支持; 数据库性能问题,如慢查询等问题,就可以进行 SQL语句优化等。

3.实施解决方案,进行迭代开发

上一步的分析给出了一个初步的性能优化方案,接下来就是针对方案中提到的内容进行针对性的改进。 这个过程可以应用敏捷的思想进行迭代,在开发完成后,为了对比优化结果,可以对调优后的系统进行小范围测试。

4.进行基准测试并分析调优结果

数据说明一切,性能优化的结果不能简单的通过 “感觉系统变快了”来衡量,最好是通过对比优化前后的测试结果,用图表的方式直观的把优化结果展示出来。基准测试是指通过设计科学的测试工具和方式方法,实现对一类测试对象的某项性能指标进行定量的和可对比的测试。对比测试结果,结合容量评估等工作,可以让系统发挥最大的效用。   一个阶段的优化工作完成以后,最好是总结反思一下,比如本次优化是否达到了目标统的整体性能是否得到了改善户体验是否得到了提升及如何在接下来的开发工作中做的更好。

 

使用JMeter进行压力测试实践

JMeter是目前流行的测试工具,这里简单的介绍一下相关的应用。

1.JMeter安装与使用

Linux下可直接下载安装,MAC系统进入jmeter.apache.org/download_jm…,下载apache-jmeter-3.1.tgz。 下载完毕后解压,得到安装包,进入到进入解压目录/bin/,单击jmeter图案,即可启动JMeter。 

2.基本组件简介

3.进行第一个测试

(1)设置线程组参数 首先在TestPlan下面添加一个ThreadGroup组件,设置线程组组件各项参数。    

4.Jmeter中的几个重要测试指标释义

可以看到,上面的聚合 告中有很多维度的信息,简单介绍几个比较重要的指标。   

Label 每个 JMeter 的 element(例如 HTTP Request)都有一个 Name 属性,这里显示的就是 Name 属性的值
#Samples 表示你这次测试中一共发出了多少个请求,如果模拟10个用户,每个用户迭代10次,那么这里显示100
Average 平均响应时间——默认情况下是单个 Request 的平均响应时间,当使用了 Transaction Controller 时,也可以以Transaction 为单位显示平均响应时间
Median 中位数,也就是 50% 用户的响应时间
90% Line 90% 用户的响应时间,其他的几个可以类推
Min 最小响应时间
Max 最大响应时间
Error% 本次测试中出现错误的请求的数量/请求的总数
Throughput 吞吐量——默认情况下表示每秒完成的请求数(Request per Second)
Received / Sent KB/Sec 每秒从服务器端接收到/发送的数据量

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2018年6月17日
下一篇 2018年6月18日

相关推荐