实地探访河南AI村:给人工智能贴标的新“富士康工人”_工作_人工智能
在中国小城市、州里,无数年轻人正成为“数据贴标人”,他们每天坐在电脑前八小时,点击几十张照片,概述背景、前景和特定物品。他们的事情为AI公司的算法供应和处理大量数据。随着技能的进步,那些“低技能”的事情者将会失落业,但也创造了很多“低技能”的事情。
周俊凯(Junkai Zhou,音译)的办公室坐落在东沙河的边缘,这是一条安谧的河,它把将位于中国中部河南省的31.8万人的小县城民权县新旧两个部分区分开来。在这里,19岁的周俊凯和他26岁的堂兄今年夏天一起创办了他们的小型数据贴标工厂。
他们创办的“俊鹏科技公司”办公室在一个租用的传统庭院住宅里面,是范例的河南屯子。这栋屋子很大,有两三层高,不像中国大城市普遍存在的公寓楼。在屋子后面,一名男子在一片地皮上耙叶子,周俊凯说,这些地皮是一片庄稼地。
周俊凯(右)和他的表哥
在屋子里面,唯一温暖的房间是办公室,十几个年轻人坐在宽大的发光屏幕前。在11月的某一天,屏幕和荧光灯险些不能照亮房间,当地污染程度已经阻挡了太阳,四处弥漫着浓雾。
“俊鹏科技公司”的员工
这些年轻人是“数据贴标人”,他们每天坐在电脑前八小时,点击几十张照片,概述背景、前景和特定物品,所有这些都是根据正在进行人工智能的客户规格而定。有些人可能会标记医疗扫描图片,有些人标注风景和树木的照片,还有些人标注无人驾驶车辆的道路图片。这些都是人工智能算法学习“看”的数据。
人工智能行业依赖于这种廉价的人工,由于算法和“机器学习”在很多情形下都是由真人演习。
人工智能须要大量数据来学习和辨别模式,无论是图片、音频还是文本,由于它们不同于人类阐明媒体。要教授算法如何准确识别苹果是一个苹果,它须要成千上万的苹果图片。此外,算法很随意马虎上当受骗。在一项实验中,安全研究职员创造,通过扭曲校车图片,只管人眼看不到这种变革,但人工智能系统再也无法识别它是一辆校车。
资金流入中国的人工智能家当,很少有地方比河南更好。在几年前河南富士康工厂(生产苹果产品)和电子工厂而有名,现在,河南的城镇现在拥有办公室事情职员,他们正在进行艰巨乏味的输入事情,让打算机变得聪明。
咨询公司AIB的研究显示,去年,风险成本家向中国的人工智能创业公司投入了50亿美元,这使得该行业的资金首次超过美国。中国政府已将AI领域作为优先事变,并在去年夏天宣告一项年夜志勃勃的政策:到2030年培植代价1500亿美元的AI家当。
在推动中国经济发展的制造工厂中,河南公民也创造自己拥有不断增长的劳动密集型数据标签公司这种边缘家当,这些公司为算法供应和处理大量数据。除了中国最大城市有几家大型企业外,这些数据标注公司紧张分布在较小的城市、城镇和屯子地区。
周俊凯是在平顶山西部的镇上看到一些类似数据工厂后,想到了自己开店。他的表兄弟们一起拿出家里多年的积蓄(45000美元),购买了几十台电脑并租用办公室。据他们所知,他们是民权县中唯一的做这个家当的人。
“你不能指望拥有这么高人为的人来完成这项劳动密集型事情”
从贸易学院毕业后,周俊凯开始进入这一行,之前他一贯在找事情,但却处处受限。
19岁的周俊凯来自河南民权县的一个村落落里。 他说,从贸易学院毕业后,他的事情选择并不多。
“如果你不知道将来做什么,你可以去一个大城市,成为一名白领事情者,然后每天都要挤地铁挤公交,”他说,“至于其他(领域),如果你想出人头地,就须要大量的知识、履历和教诲。而这些是我们没有的东西。“
他很难才找到了一份汽车修理工的事情。他说,在一家工厂干了很短韶光就辞职了——那份事情太苦了,要一天事情14个小时。
“我以为我再也受不了(这些),”他说,但“现在从事的这个行业觉得它有潜力。”
韩金浩(Jinhao Han,音译)说,许多人现在正涌向数据标注行业。一年多前,他在河南省省会郑州开办了他的数据标注公司Dianwokeji(点我科技),目前拥有了100多名数据贴标机。
“虽然标注是相称低级别的事情,但进入门槛相对较低,而且仍属于人工智能行业。”他说,“以是我们认为,如果我们可以从这里开始,然后逐步地、一步一步地走向更高代价的东西。”
韩拥有超过6000种数据标注装备,这些装备已经在他建立的类似Craigslist的平台上注册,个中较小的装备可以找到外包或雇用新员工。
18岁的赵梦瑶(Zhao Mengyao,音译)是个新手。她于今年10月开始在周所在的公司事情。当我访问办公室时,她正在追踪停车场停车位的白线:画面扭曲,线条波折,彷佛相机的一个鱼眼镜头,但她轻松地将鼠标放置在它们上面。20分钟后,赵梦瑶连续处理她下一张照片。这是停车场的另一个角度的照片。
年轻姑娘正在学习如何给汽车标注
在她阁下,一个年轻人则在描出一位歌手穿着的橙色连衣裙的蓬松边缘。接下来,他开始描一个打高尔夫球的人的轮廓。
赵梦瑶曾经是一个婚礼拍照事情室的扮装师,但由于事情怠倦而辞职。有几天她必须在凌晨4点起来准备客户拍摄,而晚上7点才能回家。
而现在的事情节奏她很满意:朝八晚六,中间安歇一个半小时。在午休韶光,她和她的同事还能聊谈天,聊聊共同玩的游戏。
她说:“我以为这很不错,这里很自由。”
赵说人为还可以:每处理一套照片(大概20张)就能得到大概20元的报酬。她每天可以完成4到8套,即80到160张照片。当我问她认为照片会去哪里、有何用场时,她回答不知道。
我交谈过的七位数据贴标者的月人为从2000元公民币到4000元公民币不等。这与中国工人的均匀可支配收入或税后收入相称——2017年为2164元公民币。“郑州有这么多可以得到这种水平人为的事情。”25岁的点我科技员工王玉双(Yushuang Wang,音译)说。
点我科技大多数员工都只有20岁出头。
AI照片识别传授教化的标准是利用ImageNet的图像,这是一个由斯坦福大学教授李飞飞和她的团队创建的超过1400万张图像的数据库。该数据库依赖于亚马逊的Mechanical Turk,后者将劳动密集型事情外包,例如照片标记的事情以几美分/一张的报酬交给互联网用户去做。
但是,随着天下各地的企业越来越多地转向从无人驾驶汽车到医疗诊断等行业的人工智能运用,ImageNet和Mechanical Turk被证明是不足用的。
你认为我们会让没有生命的东西掌握人类吗?
数据标注公司Awakening Vector的创始人Peter Yang说:“医疗业务须要非常细致的数据来让人工智能学会如何做出差异,例如在CT扫描中差异肿瘤和眼球。”它须要在大量不同的照片中,通过数据来指出照片中的肿瘤是什么样子,这就须要人工的来点击并标注图片。
“但大多数人工智能初创企业只有少数全职员工,常日都是数据科学家。”
“这须要大量的体力劳动。你不能指望收入这么高的人做这种劳动密集型的事情,以是你必须把这项事情外包出去。”
此外,还有隐私和质量掌握问题。
例如,医学图像须要保密。亚马逊土耳其机器人(Amazon Mechanical Turk)的任务是由任何想赚外快的注册用户来完成的,而不是那些周一到周五都有固定人为的员工。
外包意味着这些业务现在在海内各处着花。
Peter Yang的业务集中于新疆,客户包括百度和跨国制药公司诺华(Novartis)。韩金浩的公司为海内一些无人驾驶汽车初创公司做事,在河南和临近的山东省的一些小城市也设有分支机构。
传统不雅观点认为,随着技能的进步,那些“低技能”的事情者将会失落业。学术研究大多也支持这一不雅观点。
但这并不虞味着科技一定会取代所有的事情岗位。
波士顿大学科技与政策研究项目的实行主任James Bessen说:“历史研究表明,自动化带来了就业热潮。”
“以纺织业为例,在19世纪早期,由于布料太昂贵,大多数人只有一套衣服。但随着科技的发展,一些任务变得自动化,降落了制作衣服的本钱,人们对布料的需求也在增长。服装需求的增长带来了更多的就业机会。只管纺织业被认为是“低技能”的行业,但随着规模的急剧扩展,它也带来了新一代的工人,他们不得不学习操作繁芜的机器。只有当需求得到知足时,就业人数才开始低落。”
就目前而言,我国的劳动力还算是廉价的。
这项事情也超越了图片标注的范畴。许多公司还为语音识别、***标签乃至原始数据付费。
对付一些工人来说,成为一个新行业的一份子有一种明显的自满感。
“我们正在做一些非常根本的事情,虽然只是帮助机器人学习和查看大量数据,但我们也是个中非常主要的一部分。”
那么如果有一天算法学会了自己识别事物,那么恒河沙数的“低技能”人工智能人才会失落业吗?
韩金浩彷佛对此漠不关心:“如果真的到了那个阶段,那么人类可能就不会活着了。你认为人类会让乃至没有生命的东西掌握人类吗?我们只会教它如何为人类做事。我们不会把他教得那么好以至于有一天我们要为机器做事。”
本文系作者个人观点,不代表本站立场,转载请注明出处!