论文翻译:基于深度卷积神经 络的肉鸡粪便识别与分类

Recognition and Classification of Broiler Droppings Based on Deep Convolutional Neural Network

基于深度卷积神经 络的肉鸡粪便识别与分类

2.材料和方法

2.1实验装置

2.1.1动物住房和数据收集。

  • 实验于2019年3月至4月在河南省许昌市嘉南区王关村进行。试验选用25 ~35日龄罗斯肉鸡1万只。这些鸟被饲养在一个多层鸟笼模式下,有自动粪便传送带。肉鸡饲喂蛋白质19%、油脂6%、热量3300kcal/kg的颗粒饲粮。在实验期间,饮水是随意的。温度和湿度分别在22 – 24℃和60 -70%之间自动调节。照明系统由固定在天花板和墙壁上的LED灯组成,照明时间为5点至23点,照明时间约为40 lx。
  • 一台佳能5D单反相机(5760 * 3240像素)安装在传送带正上方0.3 m处,如图1所示。在图像采集过程中,一个101 lx的LED灯提供了额外的照明。图像采集时间为0900小时至1600小时,取决于肉鸡的排泄习惯。

2.2数据标签

由专业兽医根据表1的描述对采集到的图像进行标记。图2描述了排泄物标签之间的差异。

2.3图像数据增强

由于深度卷积神经 络所组成的 络结构复杂,在训练阶段[9]需要评估大量的参数,包括权重和偏差。 与其他结构简单的神经 络相比,深度卷积神经 络需要更多的训练数据才能获得合适的收敛性。为了获得更好的识别精度,防止数据过拟合,需要使用表2中给出的10种增强方法对图像进行预处理。图像增强将图像扩展到10000张。

2.5粪便检测系统的架构

在本研究中,我们探索了两种深度卷积神经 络架构进行对比分析:首先是Faster R-CNN架构,其次是YOLO-V3架构。Faster R-CNN与YOLO-V3的主要区别在于,Faster R-CNN首先提取感兴趣区域(region of interest, ROI),然后将图像区域识别为目标或背景,并对这些区域的边界进行细化[12,17]。而YOLO-V3则将整个图像作为ROI进行识别。模型的参数对整个 络的性能影响很大;在深度学习 络中,参数的个数取决于 络规模[17]。根据Yue等人[18]的研究,增加上层参数的数量可以提高深度神经模型的性能,而增加下层参数的数量可能会对模型的性能造成损害。

2.6Fater R-CNN架构

  • 本研究将Region Proposal Network (RPN)与Fast R-CNN[12]相结合,应用Faster RCNN对肉鸡粪便进行检测和分类。与R-CNN、Fast R-CNN等其他目标检测方法相比,Faster R-CNN提高了检测精度和速度,实现了端到端目标检测,并能快速生成候选盒。

  • 本研究采用RPN+ResNet模型。ResNet于2015年推出,因其“简单和实用”共存而赢得了ImageNet分类任务竞赛。ResNet是一种深度残差 络,可以解决随着 络[19]的加深而导致训练集精度下降的问题。需要注意的是,Faster R-CNN中使用的CNN 络(ZF、VGG、GoogLeNet、ResNet)随着卷积层数的增加,检测速度越慢。然而,更深的 络可能会提高 络精度[11]。本研究中,conv层数为13,relu层数为13,pooling层数为4。

  • Faster R-CNN的 络结构如图3所示。Faster R-CNN支持任何大小的图像输入,但在卷积运算之前,输入图像被标准化或调整为标准大小[12]。输入输出大小的转换如下所示

  • RPN用于提取ROI。RPN的工作过程是两步操作,即RPN分类和RPN边界盒回归。RPN的分类过程分为两类。首先,K H××W区域(称为锚,K = 9, H是高, W是宽度)应均匀划分的功能映射[12]。通过比较这些锚和ground truth之间的重叠,我们可以决定哪些锚是prospect,哪些是background,也就是用prospect或background来标记每个锚。有了标签,RPN可以被训练为识别任何输入[12]的前景和背景。

  • 一个特征地图有9个×H ×W锚;也就是说,每个点对应9个锚。这9个锚的长径比分别为1:1、1:2和2:1。每个高宽比都有三个维度[12]。RPN包围盒回归用于确定前景的近似位置。在得到建议的近似位置后,下一步是做精确位置的回归。RPN训练收敛后,我们可以得到锚相对于提议的偏移量。通过偏移量,可以计算出提案的近似位置。通过非最大抑制(NMS)等操作可实现精确定位。在RPN训练过程中,定义在union (IOU)上与ground truth box (GT box)相交最大的锚点为正样本,定义负样本为IOU, GT box小于0.3个样本[12]。定义训练过程中RPN的损失函数为

  • 其中Overlap为预测框与真实框(标签框)的交点,Union为预测框与真实框的并集。yalo – v3使用逻辑输出代替软件Max来预测对象类别,从而实现多重标记。
  • 3.结果和讨论

    所有 络均采用异步随机梯度下降(SGD)训练。采用批处理方式[21]进行神经 络的分布式学习。批 设置为32作为最优水平,例如16的值越低,训练时间越长,而批 越高,计算复杂度越高。同样,学习率设置为0.001;当学习率为0.01时, 络无法收敛;当学习率为0.0001时, 络训练需要更多的迭代才能收敛(训练时间更长)。

    3.1更快的R-CNN和YOLO-V3性能评估。

    基于Tensorflow框架和Darknet框架设计并构建了两种检测模型。他们在一台使用NVIDIA GTX1080Ti GPU、50gb有效内存和使用Ubuntu 16.04操作系统的i7 7700k CPU的PC上进行训练和测试。为评价肉鸡粪便识别模型的性能,根据式(4)、式(5)、式(6)分别应用召回率、平均精度(AP)和平均精度(mAP)的平均值。

    • 从表4可以看出,与Faster R-CNN相比,YOLO-V3的训练时间更长,但检测速度更高。Faster R-CNN的单类APs和召回率均高于YOLO-V3,平均为考虑到本研究是对以0.09 ms-1速度移动粪料输送机的笼养肉鸡进行试验,整个试验集的粪料运量分别为0.9332 ~ 0.8425和0.991 ~ 0.887。因此,Faster R-CNN和YOLO-V3系统的图像采集频率都需要高于2 fps。
    • 两种模型的precision-recall曲线如图6所示。相比之下,Faster R-CNN在查全率和准确率方面都优于YOLO-V3。在低回忆阶段,我们观察到随着回忆的增加,YOLO-V3的准确率是恒定的。然后在急剧下降之后上升;这说明在反向传播过程中,在达到饱和点后,在测试集上的收敛性迅速下降,梯度消失或出现过拟合

    3.2不同迭代的模型比较。

    • 络的深度对神经 络模型的性能至关重要,但随着 络层数的增加,出现了过拟合问题。因此,数据集的容量、卷积层的深度以及迭代次数都会影响最终模型的性能。在本研究中,训练数据集的数量为7637,除了输入层之外,YOLO-V3的深度为106层,Faster R-CNN采用了ResNet101。

    4.结论

    消化道疾病是肉鸡养殖的主要疾病之一。肉鸡消化道疾病监测技术的发展可以促进肉鸡养殖业的自动化。肉鸡粪便可作为评价肉鸡消化道疾病的指标。将肉鸡粪便分为正常和异常,将异常粪便分为异常形状、异常颜色、异常含水量和异常形水。比较了Faster R-CNN和YOLO-V3对肉鸡粪便数据集的性能。更快的R-CNN在大约30,000次迭代时达到了最佳性能。在检测装置上,mAP为93.32%,召回率为99.1%。约31,000次迭代时,YOLO-V3获得了最佳性能。在检测数据集上,mAP为84.25%,召回率为88.7%。通过对YOLO-V3锚箱对肉鸡粪数据集的优化,优化后锚箱的IOU比初始锚箱提高23.7%,IOU的均方差为0.085。最后,Recall增加了1.4%,mAP增加了5%。本研究为肉鸡异常粪便的自动非接触识别和分类提供了模型,为肉鸡消化道疾病的早期预警提供了技术支持。

    声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年4月25日
下一篇 2021年4月25日

相关推荐