计算机视觉:你必须了解的图像数据底层技术

引言

计算机视觉(Computer Vision)自兴起以来就非常迅速且广泛应用于各个领域,比如我们熟悉的且每天都会使用的基于手机摄像头的人脸识别,除此之外,它还可以在自动驾驶领域辅助汽车识别交通信 、标志和行人;在制造业辅助工业机器人监督和指导人工操作。

对于人类来说,你很难向从没穿过衣服的原始人解释什么是连衣裙或者什么是鞋。计算机视觉也是如此,如果它并没有相关输入,就不会理解上图的东西都是什么。

所以,我们需要收集并标记大量关于衣服、鞋、包包的图片,输入进计算机“告诉”它这些图片里的东西是什么,在经过不断的学习和训练后,计算机将会识别出哪个是连衣裙,哪个是鞋、哪个是包包。

计算机视觉的主要应用

计算机视觉目前应用的领域不胜枚举,小编就挑出5个具有代表性的应用吧:

  • 物体与行为识别

  • 自动驾驶汽车

  • 医疗影像分析与诊断

  • 图片标记

  • 人脸识别

 

计算机视觉工作流程

计算机视觉工作流程其实是大多数计算机视觉应用程序将经历的一系列步骤。许多视觉应用程序都是从获取图像和数据开始,然后处理数据,执行一些分析和识别步骤,最后执行一个动作的:

人脸识别工作流程

我们可以看到,大部分计算机视觉技术应用其实都是从数据预处理开始的,其实这也是机器学习的关键。

数据标准化

所谓预处理图像就是将输入的图像数据标准化,以便后续工作流程的顺利进行。例如,假设我们创建了一个简单的聚类算法来区分红玫瑰和其他花朵:

将图像视为数字 格是许多图像处理技术的基础。一般来说,色彩与形状改变都是通过数学运算对图像进行逐像素变换完成的。

训练神经 络

为了训练神经 络,我们要提供一组标记过的图像数据,然后比较这些输入图像与计算机预测的输出标签或识别的测量值的差异以检测算法模型的准确率。基于神经 络的深度学习会监督它所犯的错误(误差),并通过修正它发现的图像数据间的模式与差异来实现迭代与拟合。

其中,梯度下降法是一种减少神经 络误差的数学方法,其中卷积神经 络是一种特殊类型的神经 络,通常用于计算机视觉应用。

END

Imagination Technologies是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作场所中使用。获取更多物联 、智能穿戴、通信、汽车电子、图形图像开发等前沿技术信息, Imagination Tech !

长按识别二维码


关注我们

文章知识点与官方知识档案匹配,可进一步学习相关知识算法技能树首页概览34263 人正在系统学习中

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年1月3日
下一篇 2021年1月3日

相关推荐