但做着做着我们发现出现了一个新的声音:说数据行业就是一个骗局,作为一家一直以来从事数据标注相关行业的公司,我们在发展的过程中也经历了许多初创团队,标注企业经历过的事情,项目单价低,耗时间,不结算,项目断档这些都是大家的关键词,针对这些问题,今天我们也浅显地聊一聊
第一点·数据标注是骗局的问题—

—这个基本没有争议,不是骗局
一个行业的兴起总会迎来不少喷子,甚至被不少无良之人搅得一团糟,就拿前几年非常火的直播行业来说,它不也是在一片质疑声中兴起的吗?刚开始被许多人认为是一群不务正业的人在瞎搞,但是在2020年李佳琦被作为特殊人才引进落户上海,大家纷纷开始重新认识这个行业,“直播带货”成为国家认可的新职业,像成都、济南、湖南等地也是争先发布了相关的人才引进培养计划
所以时代的进步总是从不被理解开始的,数据标注行业也是一样,从2020年2月起,数据标注师就被纳入国家职业分类目录,2021年,人社部相继发布了《人工智能训练师》国家职业技能标准,数据标注这份职业发展会越来越有价值,数据服务这个行业肩负着维系智能社会稳定的使命
第二点·数据标注企业不赚钱-
-利润低是因为用工成本高,利润低,项目不稳定.......
为什么会有很多从事过数标行业的朋友说一天的工资只有几十块甚至更低,也有很多标注企业经常存在有人没项目的现状,可以从几个考虑
是不是一手项目资源。要知道,数据资源方从项目发布到数据服务团队承接项目到最后的项目派发,中间可能存在各种因素而转包的情况,一个项目一旦经过转手最后的单价可能就是几分,这就是标注团队辛辛苦苦赶进度,最后发现项目利润还不够发员工工资的原因
团队成员的专业度以及效率。标注工作的完成从领取项目到标注阶段再到最后的验收交付,中间如果你存在超过两次的返修,那么就白干了,这也是现在普遍标注企业用工成本居高不下,项目青黄不接的原因
除了项目资源,数据质量外,团队的规模,管理成本,项目经验等因素,都关乎着标注公司是否能够赚钱
第三点·受欢迎的数据标注企业是怎么样的
随着互联网全球化时代的到来,大数据成为很多企业极其重视的一项资源。通过对数据的采集与提炼,可以赋予企业更强的感知力与创造力,除了百度,京东,龙猫等大型企业外,市场上也有许多高品质的标注团队,他们一般都有这几个特征
# 01
数据质量:人工智能一共有三要素,算力、算法、数据。前两者是基础设施和能力,后者是让AI学习的知识素材。只有高质量的标注数据,才能高效训练算法,赋能各种类型的终端。因此数据方对于数据质量都有一定的要求,同时对于数据交付时间的时效性给予高度重视,会有专门的部门或者人员负责数据质量和时间节点的把控
# 02
数据安全性:安全合规性可以说是整个数据标注行业都重视的一个问题,很多时候要关注数据来源,数据保密都是需要有一定的协议的。例如车厂的自动驾驶道路数据、智能音箱类产品的个人语音对话数据等,出于用户隐私安全和合规的要求,要防止这些数据泄露出去
# 03
标注成本可控:很多实用的大数据对于很多研究机构而言都有不可估量的价值,因此这类研究机构往往会对特定的数据给予较高的价格。而受欢迎的数据标注企业也会按照数据方的要求来完成标注工作,同时在完成项目的同时,会严格控制各项成本,减少返修等
“AI是改变,更是未来,它将赋能每一个人点亮生活”,生活点亮之时,并不是数据标注暗淡之日,AI由感知向认知,由“麻木不仁”向“喜怒哀乐”,由“唯唯诺诺”向“杀伐决断”的路还很长,它还不是他/她,还需要我们AI背后的数据服务企业更加努力,为AI的成长贡献自己的一份力量