人工智能训练师究竟做些啥 挣得多不多?

谁能训练人工智能

最近,人 部公布了一批新职业,其中有个新职业叫作“人工智能训练师”。听起来高大上的人工智能还要人来训练?谁能训练这些看不见、摸不着的人工智能?“人工智能训练师”究竟做些啥?关键是,挣得多不多?

李宇龙学历不高,原本与人工智能没什么关系。2018年,山西麟诺 络科技有限公司成立,李宇龙经朋友介绍来到这家公司。

“当时我也不知道数据标注员是做啥的,更没听说过人工智能。老板就交给我一套规则,让我按照规则在电脑上认车道线。”那时20岁出头的李宇龙正是肯学的时候,短时间内就熟悉了规则,还总结出标注车道的新规律。

看似简单的工作,背后是庞大数据基础做支持。算法、算力与数据是人工智能发展的三大要素,其中数据是人工智能发展的燃料。每天,人类 会产生的海量数据必须经过清洗与标注,换成人工智能熟悉的语言才有价值。因此,人工智能训练师主要任务就是数据采集和标注,特别是数据标注。如果说人工智能是个孩子,数据标注师就是带领这个孩子认识世界的启蒙老师。有了足够多、足够好的数据,AI才能学会像人一样去感知、思考和决策,更好地为人类服务。

人工智能产业发展之初,数据采集与标注需要人力完成的部分比较多,现在数据平台已有了持续学习能力,大部分采集与标注工作人工智能自己就可完成,实现预标注与自动标注。因此,目前数据标注工作以机器辅助与人工标注结合为主。除了眼底检查片、肺部X光片等技术含量较高有专业要求,大多数员工均能按照规则,在平台上完成语音、人脸、道路的标注操作,只要能熟练操作电脑即可。

郭梅是新职业的受益者。34岁的她原本在山西一家煤矿做监控员,为照顾到太原上学的孩子,她到学校附近的数据标注基地求职。经过公司岗前培训与团队帮助,她从起初每天标注两三百张图,提升到每天能完成1300多张。

数据标注员的工作随着人工智能发展需求不断调整。前几年人工智能发展伊始,语音识别、人脸、图像等识别需求大;近几年无人驾驶进入发展快车道,郭梅与李宇龙的主要工作就改成无人车、地图、3D点云等数据标注,天天看的是车道线、行人、障碍物。

“还有一些语音识别项目,比如我们接了一些方言语音数据标注项目,这就需要招聘当地人来完成了。”李应维说。

有了足够技术基础,数据标注员还能教会人工智能新任务。疫情期间,戴口罩的人脸识别需求激增。“根据客户需求,山西数据标注基地采集了大量戴口罩人脸照片,由数据标注师对眉毛、眼镜、颧骨等人脸关键点精准标注,训练人工智能完成了戴口罩人脸图像识别。”百度(山西)人工智能基础数据产业基地负责人尉赤说,“人们能在不摘口罩情况下实现精确体温测量,或是通过人脸闸机,背后就是这些数据标注员在训练人工智能。”

艾瑞咨询发布的《中国人工智能基础数据服务行业白皮书》预测,随着全球人工智能产业、物联 、5G的爆发式增长,到2025年,全球每年产生的数据量将从2016年的16.1ZB猛增至2025年的163ZB,其中80%至90%是非结构化数据,需要经过清洗与标注才能被唤醒价值。在我国,每年需要标注的语音数据超过200万小时,图片则有数亿张。因此,人工智能数据标注师的岗位需求将持续增长。尉赤透露,今年基地新招了500多人,未来5年计划培养5万名AI数据训练师,并引入更多AI合作伙伴。李应维也预计,到明年自家企业用工将翻一番,从160多人扩展到300人左右。未来,数据标注将成为创造大量就业需求的新兴职业领域。

佘 颖

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年7月12日
下一篇 2020年7月12日

相关推荐