和AI一起工作,贫困县也可以月薪70000。

商界观察
2023-08-15

今年五月,24岁的张娟开始做大型数据标记。95后毕业于甘肃省积石山县,大学毕业。

 

位于甘肃西南部和青海交汇处的积石山县,经济欠发达。到2022年,该县城镇居民人均可支配收入为26258.5元/年,平均每月只有2188.2元,而农村则更低。但是做数据标注的张娟,平均月薪已经达到了7000元,有时还超过了1万元。

 

大型数据标签是今年中国的一个热门职业。它的任务是每个人都给一切都贴上标签,AI通过标签深入学习,从而训练自己的智力。数据标记员做的是标记工作。

 

一些简单的标记技术含量不会那么高。比如张娟做的就是标注照片中是否包含鸟类还是汽车,音频中有哪些单词发音,医学影像中是否有肿瘤等。她毕业后完全有能力。

 

毕业后,张娟最初加入了兰州的一家测绘公司。然而,由于她对母亲和年迈的爷爷奶奶的关心,以及她经常需要在野外工作的测绘,她认为这不适合她,她想回到家乡工作。

 

但是家乡的工作机会,除了公考,就是服务业,工资不高,张娟犹豫不决。直到遇到数据标注工作,它才是AI行业的一个新岗位,既解决了年轻人赚钱存钱的心态,又照顾了家庭。

 

图|作为AI从业者,张娟参加了2023年世界人工智能大会。

 

对于像积石山县这样经济不发达的城市,分包AI表明远在杭州的蚂蚁集团。今年,随着大模型的热潮,包括阿里、百度、腾讯、字节在内的中国互联网公司纷纷投资这个被称为“移动互联网时代的最终机遇”的行业。

 

蚂蚁相关负责人告诉《真实故事研究室》,做这样的分包,本质上是一项名为“数字木兰|AI豆计划”的公益活动,与地方政府合作。蚂蚁在集团内部统一了一些工作需求,与不发达地区合作,希望将新技术普遍惠及更广泛的群体。

 

如果追溯到数据标签的出现,并不是今年才开始的,而是可以赶上2011年。当初,随着大数据、云计算、互联网、物联网等信息技术的发展,随着AI数据标签外包市场的开放,2017年数据标签市场进入爆发阶段。

 

而且今年大型对话模式的爆红,促使数据标注员的需求不断上升,人才供需缺口迅速放大,这个职业也逐渐为大众所熟知。

 

一些担心AI抢自己工作的人逐渐意识到AI也在创造新的工作。当然,不同立场的每个人都有不同的利益计算,无论他们是受益者还是受伤者。

 

与蚂蚁集团公益运营不同,在模型领域发展迅速的百度,不仅专注于技术研发,还通过产学研共建的方式培养大模型领域、更专业的人才,致力于为大学生增加职业选择路径。

 

6月28日,广西科技大学计算机学院(软件学院)正式启动百度联合广西科技大学举办的“500万AI人才培养计划”系列活动——大数据标注第一训练营。

 

 

图|百度与广西科技大学合作培养AI人才

 

双方的具体合作是,百度通过在学校开设的“计算思维导论”学科中设置大模型训练标注实践阶段,培养大一新生的数据标注能力,让大学生有机会将理论与实践相结合。

 

广西科技大学副校秦小云告诉《真实研究室》,希望通过设置数据标注的实践课程,培养学生在模型上更先进的思维,打好专业基础,增加能够贯穿职业发展和晋升之路的能力模式,提高就业竞争力。

 

有同学在采访中透露,自己喜欢的岗位是算法工程师、建模工程师等传统岗位。但是随着AI的不断发展,数据标注的能力在就业市场上会越来越受到重视,未来也可以依靠专业文凭和实践技能不断提升。“我希望我能利用学校和百度建立的这门实践课程,为我的职业生涯增加砝码。”

 

人工智能给普通人带来了机会,不仅发生在中国,而且在国际上也在进行一些国际分工。

 

Open AI的外包数据标注企业Sama,员工来自乌干达、肯尼亚、印度等工资待遇相对较低的国家。

 

Sama最初的数据标记员在肯尼亚的月薪是21,000肯尼亚先令(约1057元),虽然低于国内数据标记员的工资待遇,但对于人均GDP只有2000美元的地方来说,这份工作无疑还不错。

 

与此同时,数据标注也给聪明人带来了新的创业机会。

 

如Open 另一家AI外包数据公司Scale AI(创始人为中国Alexandrr提供数据标注服务的公司。 Wang ),位于旧金山,通过承包数据标注这项工作的发家和得势,估值已经达到73亿美元。

 

图|Scale AI Alexandrr创始人 Wang

 

值得注意的是,该公司实施了AI对AI数据的标记,即自动标记。这给人们带来了另一个隐患,那就是未来是否所有的数据标记都将由模型完成,不再需要人工标记。

 

当前行业的判断是不会的,感觉企业没有任何数据标注,可以完全摆脱人工参与,毕竟AI无法识别其从未见过的物品。

 

综合各种各样,从数据标注的市场现状来看,这个行业也可以有外包企业的创业机会。

 

广西科技大学计算机学院院长李春贵判断,国内数据标签行业将涌现出一大批创业公司,其中对于科技、医学等行业的数据标准,这样一个小而精的企业更有希望在行业内有所作为。

 

本文来自微信微信官方账号“真实研究室”(ID:zhengulab),作家:林秋艺,编辑:龚正,36氪经授权发布。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com