linux丢包分析

本来是想收藏的。实在没找到收藏在哪里。就记录下。

在开始之前，我们先用一张图解释 linux 系统接收络文的过程。

首先络文通过物理线发送到卡
络驱动程序会把络中的文读出来放到 ring buffer 中，这个过程使用 DMA（Direct Memory Access），不需要 CPU 参与
内核从 ring buffer 中读取文进行处理，执行 IP 和 TCP/UDP 层的逻辑，最后把文放到应用程序的 socket buffer 中
应用程序从 socket buffer 中读取文进行处理

在接收 UDP 文的过程中，图中任何一个过程都可能会主动或者被动地把文丢弃，因此丢包可能发生在卡和驱动，也可能发生在系统和应用。

之所以没有分析发送数据流程，一是因为发送流程和接收类似，只是方向相反；另外发送流程文丢失的概率比接收小，只有在应用程序发送的文速率大于内核和卡处理速率时才会发生。

本篇文章假定机器只有一个名字为的 interface，如果有多个 interface 或者 interface 的名字不是 eth0，请按照实际情况进行分析。

NOTE：文中出现的（receive）表示接收文，（transmit）表示发送文。

确认有 UDP 丢包发生

要查看卡是否有丢包，可以使用查看，在输出中查找或者对应的字段是否有数据，在正常情况下，这些字段对应的数字应该都是 0。如果看到对应的数字在不断增长，就说明卡有丢包。

另外一个查看卡丢包数据的命令是，它的输出中会有 (receive 接收文)和（transmit 发送文）的统计数据：

此外，linux 系统也提供了各个络协议的丢包信息，可以使用命令查看，加上可以只看 UDP 相关的文数据：

对于上面的输出，关注下面的信息来查看 UDP 丢包的情况：

不为空，并且在一直增长说明系统有 UDP 丢包
表示系统接收到的 UDP 文所在的目标端口没有应用在监听，一般是服务没有启动导致的，并不会造成严重的问题
表示因为 UDP 的接收缓存太小导致丢包的数量

NOTE：并不是丢包数量不为零就有问题，对于 UDP 来说，如果有少量的丢包很可能是预期的行为，比如丢包率（丢包数量/接收文数量）在万分之一甚至更低。

卡或者驱动丢包

之前讲过，如果中有那么很可能是卡有问题，导致系统丢包，需要联系服务器或者卡供应商进行处理。

也会提供每个卡的接发文以及丢包的情况，正常情况下输出中 error 或者 drop 应该为 0。

如果硬件或者驱动没有问题，一般卡丢包是因为设置的缓存区（ring buffer）太小，可以使用命令查看和设置卡的 ring buffer。

可以查看某个卡的 ring buffer，比如下面的例子

Pre-set 表示卡最大的 ring buffer 值，可以使用设置它的值。

Linux 系统丢包

linux 系统丢包的原因很多，常见的有：UDP 文错误、防火墙、UDP buffer size 不足、系统负载过高等，这里对这些丢包原因进行分析。

UDP 文错误

如果在传输过程中UDP 文被修改，会导致 checksum 错误，或者长度错误，linux 在接收到 UDP 文时会对此进行校验，一旦发明错误会把文丢弃。

防火墙

如果系统防火墙丢包，表现的行为一般是所有的 UDP 文都无法正常接收，当然不排除防火墙只 drop 一部分文的可能性。

如果遇到丢包比率非常大的情况，请先检查防火墙规则，保证防火墙没有主动 drop UDP 文。

UDP buffer size 不足

linux 系统在接收文之后，会把文保存到缓存区中。因为缓存区的大小是有限的，如果出现 UDP 文过大（超过缓存区大小或者 MTU 大小）、接收到文的速率太快，都可能导致 linux 因为缓存满而直接丢包的情况。

在系统层面，linux 设置了 receive buffer 可以配置的最大值，可以在下面的文件中查看，一般是 linux 在启动的时候会根据内存大小设置一个初始值。

/proc/sys/net/core/rmem_max：允许设置的 receive buffer 最大值
/proc/sys/net/core/rmem_default：默认使用的 receive buffer 值
/proc/sys/net/core/wmem_max：允许设置的 send buffer 最大值
/proc/sys/net/core/wmem_dafault：默认使用的 send buffer 最大值

但是这些初始值并不是为了应对大流量的 UDP 文，如果应用程序接收和发送 UDP 文非常多，需要讲这个值调大。可以使用命令让它立即生效：

也可以修改中对应的参数在下次启动时让参数保持生效。

另外一个可以配置的参数是，它表示 linux 内核从卡驱动中读取文后可以缓存的文数量，默认是 1000，可以调大这个值，比如设置成 2000：

系统负载过高

系统 CPU、memory、IO 负载过高都有可能导致络丢包，比如 CPU 如果负载过高，系统没有时间进行文的 checksum 计算、复制内存等操作，从而导致卡或者 socket buffer 出丢包；memory 负载过高，会应用程序处理过慢，无法及时处理文；IO 负载过高，CPU 都用来响应 IO wait，没有时间处理缓存中的 UDP 文。

linux 系统本身就是相互关联的系统，任何一个组件出现问题都有可能影响到其他组件的正常运行。对于系统负载过高，要么是应用程序有问题，要么是系统不足。对于前者需要及时发现，debug 和修复；对于后者，也要及时发现并扩容。

应用丢包

上面提到系统的 UDP buffer size，调节的 sysctl 参数只是系统允许的最大值，每个应用程序在创建 socket 时需要设置自己 socket buffer size 的值。

linux 系统会把接受到的文放到 socket 的 buffer 中，应用程序从 buffer 中不断地读取文。所以这里有两个和应用有关的因素会影响是否会丢包：socket buffer size 大小以及应用程序读取文的速度。

对于第一个问题，可以在应用程序初始化 socket 的时候设置 socket receive buffer 的大小，比如下面的代码把 socket buffer 设置为 20MB：

如果不是自己编写和维护的程序，修改应用代码是件不好甚至不太可能的事情。很多应用程序会提供配置参数来调节这个值，请参考对应的官方文档；如果没有可用的配置参数，只能给程序的开发者提 issue 了。

很明显，增加应用的 receive buffer 会减少丢包的可能性，但同时会导致应用使用更多的内存，所以需要谨慎使用。

另外一个因素是应用读取 buffer 中文的速度，对于应用程序来说，处理文应该采取异步的方式

包丢在什么地方

想要详细了解 linux 系统在执行哪个函数时丢包的话，可以使用工具，它监听系统丢包信息，并打印出丢包发生的函数地址：

通过这些信息，找到对应的内核代码处，就能知道内核在哪个步骤中把文丢弃，以及大致的丢包原因。

此外，还可以使用 linux perf 工具监听（把络文丢弃时会调用该函数）事件的发生：

关于 perf 命令的使用和解读，上有很多文章可以参考。

总结

UDP 本身就是无连接不可靠的协议，适用于文偶尔丢失也不影响程序状态的场景，比如视频、音频、游戏、监控等。对文可靠性要求比较高的应用不要使用 UDP，推荐直接使用 TCP。当然，也可以在应用层做重试、去重保证可靠性
如果发现服务器丢包，首先通过监控查看系统负载是否过高，先想办法把负载降低再看丢包问题是否消失
如果系统负载过高，UDP 丢包是没有有效解决方案的。如果是应用异常导致 CPU、memory、IO 过高，请及时定位异常应用并修复；如果是资源不够，监控应该能及时发现并快速扩容
对于系统大量接收或者发送 UDP 文的，可以通过调节系统和程序的 socket buffer size 来降低丢包的概率
应用程序在处理 UDP 文时，要采用异步方式，在两次接收文之间不要有太多的处理逻辑

参考资料

Pivotal: Network troubleshooting guide
What are udp “packet receive errors” and “packets to unknown port received”
Lost multicast packets troubleshooting guide
splunk Answers: UDP Drops on Linux

文章知识点与官方知识档案匹配，可进一步学习相关知识CS入门技能树Linux入门初识Linux24736 人正在系统学习中

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！