zh
姓名格式错误
公司名称格式错误
数据堂严格遵守用户隐私条款,您所填写的信息我们会严格保密,请放心填写~
来源: 数据堂
在印度加尔各答(Kolkata)市郊尘土飞扬和拥挤的Metiabruz区,460名年轻女性正在人工智能的第一线工作。
这些女性大多来自当地穆斯林社区,她们正在帮助亚马逊(Amazon)、微软(Microsoft)、eBay和猫途鹰(TripAdvisor)等公司训练用于自动驾驶汽车和增强现实系统的计算机视觉算法。
这个全女性中心是iMerit在印度的8个办公地点之一。iMerit是一家总部位于印度和美国的数据标注公司,拥有2200名当地员工,为各行各业(制造业、医疗成像、自动驾驶、零售业、保险业和农业)产生的海量数据贴标签。
这项业务是日益壮大的数据标注行业的一部分,该行业在肯尼亚、印度和菲律宾等低收入国家雇用了数十万名工人。
Figure Eight和Mighty AI等公司,以及埃森哲(Accenture)和威普罗(Wipro)等更为传统的IT公司,正在形成所谓“人工智能供应链”的一部分,其创建的算法能够解读各种素材,包括驾驶画面、搜索结果和照片,客户是美欧大型跨国公司,如Facebook、大众汽车(Volkswagen)和谷歌(Google)。
如今,企业纷纷拥抱人工智能,视其为自动化决策过程和帮助驱动新商业机会的一种方式。挑战在于,支撑这项技术的算法就像新生儿一样稚嫩,需要数以百万计有标签的例子来教它们“分辨”。
要想让自动驾驶汽车算法学会识别路标,或者区分孩子和狐狸,人们必须一帧一帧地观看长达数小时的视频画面,并对其中的物体进行标注。一小时的视频需要8小时才能完成标注。事实上,麦肯锡(McKinsey) 2018年的一份报告将数据标注列为人工智能应用于工业的最大障碍。
根据分析公司Cognilytica 2019年1月的一份报告,第三方数据标注的市场规模在2018年达到1.5亿美元,到2023年将增长至逾10亿美元。“大型科技公司不想涉足训练数据的业务,他们想拥有客户关系,同时明智地利用合作伙伴和采购,”Samasource创始人和首席执行官莱拉?焦纳赫(Leila Janah)说。这是一家总部位于旧金山的数据标注供应商,在肯尼亚、乌干达和美国设有办公地点。
“但这就是为什么围绕合乎道德标准的人工智能供应链的讨论现在变得如此重要。在它开始扩大规模之前,我们必须确保我们设定了行业标准,确保这个市场不会重蹈服装厂的覆辙。目前存在一个巨大的机遇,确保标注行业成为一股积极的力量。”
新一代员工队伍
当大型跨国公司刚开始为消费产品开发机器学习算法时,数据标注要么通过亚马逊旗下的“土耳其机器人”(Mechanical Turk)等众包平台外包给零工,要么在公司内部由低薪国家的员工团队进行。研究者莎拉?T?罗伯茨(Sarah T Roberts)在撰写《屏幕背后》(Behind the Screen)时,曾采访了菲律宾等国家的几十名技术工人。她表示,与公司内的其他员工相比,这些人往往薪酬非常低,并且得不到相同的福利,而他们的工作被视为卑微。
随着需要标注的数据量呈指数级增长,大公司越来越多地求助于第三方公司,后者的员工专长于特定类型的数据(如驾驶或医疗信息),而这些员工的薪酬和待遇也符合道德标准。
Samasource的员工为沃尔玛(Walmart)、谷歌、微软(Microsoft)、Glassdoor、德国马牌轮胎(Continental Tires)和通用汽车(General Motors)等公司标注数据。总部位于内罗毕的该公司拥有逾2000名员工。“我们的用人模式是雇用全职员工,他们享受福利,拿基本生活工资。平均而言,我们(雇用他们时)几乎把员工的收入提高到以前的四倍。”焦纳赫表示,“我们的员工通常来自非正式定居点和农村,所以有机会获得一份待遇不错,能掌握电脑技能,并接触人工智能的工作,意味着人们会认真对待这份工作。”
iMerit位于加尔各答附近的全女性训练设施,已成为计算机视觉标注的专业中心。总体而言,该公司50%的员工为女性,多数来自印度低收入家庭。iMerit首席执行官拉达?巴苏(Radha Basu)表示,“这个社区不让女性去其他地方工作。所以我们开始把项目带给她们。”
人的因素
人工智能供应链公司坚称,他们的工作不再涉及对猫、狗和房子等基本物体进行机械的、死记硬背的标注,而是发展成了一套更加专业化的任务。
例如,巴苏表示,iMerit的员工可能会分析驾驶员的车内画面,包括面部表情和眨眼,以确定驾驶员是否疲劳;为了让亚马逊的智能音箱Echo听懂语言,他们训练了语音片段;为了训练保险公司的风险评估算法,他们分析了建筑物和建筑工地的卫星图像。
Samasource曾为拜耳(Bayer)做过一个项目,该项目要求对植物茎的横截面进行标注,以检测病变细胞,目的是保护作物,训练一种航拍田间图像算法。焦纳赫解释称:“我们希望专注于机器无法轻易掌握的复杂边缘案例,这些案例需要人类做出细微分辨和判断。这是我们增添价值的地方。”
随着人工智能训练市场开始呈现出爆炸式增长,使用人工智能的西方集团正寻求与更具道德规范的、有社会影响模型的外包公司合作。焦纳赫表示:“人们首次质疑那些不能保证人工智能供应链工人基本生活工资的标注公司。作为一家公司,如果你的数据是由这些工人训练的,那么你就有责任公平对待他们。”
巴苏说:“从长远看,这些来自农村和部落的年轻工人,将给她们所在社区的经济赋权带来真正的改变。”
本文转载自网络