July 1, 2019 / 1:38 AM / 3 months ago

热点聚焦:人工智能产业蓬勃发展 人脸数据采集业在中国悄然兴起

路透平顶山6月28日 - 在中国河南省的一个小村庄里,狗在吠叫,鸡在悠闲地踱步,村民们沿一条土路聚拢在一起,用他们的脸部影像换取水壶、锅子和茶杯等用具。

2019年3月20日,河南郏县,千机数据公司的雇员为当地村民拍照,进行脸部数据收集,供开发人工智能和机器学习技术使用。REUTERS/Cate Cadell

在队列的最前头,一名女子站在一架固定在三脚架上的照相机前,把自己一张剪掉眼睛和鼻子的头像举在脸前,缓慢的从一侧转向另一侧。

排队等候的村民人手一张号牌。一些村民说,这是他们第三次或第四次做这种工作。

项目组设在一个令人昏昏欲睡的村屋院落里,屋里的墙上挂着前中国领导人毛泽东的画像。这个项目正在收集可训练人工智能(AI)软件识别真实面部特征和静止图像的素材。

“最大的项目有成千上万人参加,他们全部是当地人。”千机数据公司执行长刘阳峰说道。位于平顶山市的这家公司为中国几家最大的科技公司采集和标记数据。

“我们正在创建更多的数据组来为更多的人工智能算法公司服务,它们可以服务于中国的人工智能开发,”刘阳峰说道,并拒绝透露他的客户。

对用于训练人工智能算法的数据需求激增,正在推动一个全新的全球行业,该行业收集照片和视频等信息,然后进行标记并最终让计算机知晓所看到的内容。

像给数据做标签或做数据注释的公司也被称之为众包平台,如亚马逊(AMZN.O)的土耳其机器人(Mechanical Turk),其为完成简单任务的用户支付小额报酬,这样的外包公司还有印度威普罗有限公司(Wipro)(WIPR.NS)以及像千机数据这样专门做数据标注的公司。

Cognilytica是一家专注于人工智能的美国研究公司,其估计机器学习相关数据注释的全球市场在2018年增长了66%达到5亿美元,到2023年将增长一倍以上。然而一些业内人士表示,由于大部分完成的工作未被披露,所以很难准确估算。

**薄弱的隐私法,廉价的劳动力**

得益于蓬勃发展的AI行业带来的无尽需求,中国已成为重要的数据采集和标注中心。

很多公司已在一个名为机器学习的AI领域投入巨资。机器学习是面部识别技术和基于在数据中寻找模型的其他系统的核心。

这些公司包括科技巨头阿里巴巴(BABA.N)、腾讯控股(0700.HK)、百度(BIDU.O)以及像AI专业公司商汤科技以及语音识别公司科大讯飞(002230.SZ)这样的年轻企业。

大量投资带来中国AI产品和服务的迅猛增长,从基于面部识别的支付系统到自动检测,甚至是AI动画官媒新闻主播,不一而足。中国消费者大多认为这些技术很新奇和前卫,尽管一些人对这些技术更具侵入性的应用提出担忧。

在中国力争成为AI领域的全球领导者之际,薄弱的数据隐私法和廉价劳动力也是中国的一个竞争优势。河南的农民很愿意在摄像头前站上一会,来换取一个茶杯,或是花上几个小时来换一个砂锅。

**海外客户**

总部位于北京的倍赛数据(BasicFinder)是人工智能数据标注服务领先企业,营业据点覆盖河北、山东及山西等地,拥有众多海内外客户。

在最近一次访问其北京办公室时,部分员工正在就人类困倦影像进行标记,这些影像将用于自动驾车项目,协助辨认那些可能在开车时快睡着的驾驶人。

其他员工则是在为一家西方线上族谱服务标注1800年代的英国文件,在上面标注日期、姓名、出生性别以及死亡证明等栏位。

倍赛数据创始人暨CEO杜霖表示,在中国聘用经过训练的标注人员,成本要比使用西方众包市场要来的便宜。

杜霖指出,普林斯顿大学一项与自动驾车相关的项目起初是委托给亚马逊旗下Mechanical Turk,但随着工作的难度提高,人们开始出错,他们因此引进倍赛数据来帮忙纠正错误。

他补充称,在这个项目中,一名受过训练的倍赛数据标注员的工作能力胜过三个众包标注员。

“他们逐渐发现让我们来标注的成本要低一些,所以他们从一开始就雇我们来做所有标注工作,”杜说。

普林斯顿大学未予置评。

对于从事标注的员工而言,加入中国数据行业的理由很明确。这个工作虽然有时很枯燥,但对于希望回到小城市和农村的年轻人来说,比其他可选的工作要强一些。

千机的标注工人在人物照片、监控影像及街道图景上标记数据点,每天的工资大约为100元人民币(14.50美元)。

据工人们说,这个工作通常很简单,不过一些海外内容带来一些挑战。

“有一次我们认为我们标记的是欧式的带清洗器的烹饪机,”千机的标注工人贾亚慧说,“后来他们告诉我们这实际上是两样东西,一个炉灶和一个洗碗机。”

标注工作将科技行业的一些就业机会带到了农村地区,但如果AI发展到足以完成标注员做的很多工作,那么这种机会或许是暂时的。

“我们认为这个行业仍将存在三到五年。这或许不是一个长期职业--我们现在考虑的只是五年计划,”千机的执行长刘阳峰说。(完)

编译 李春喜/孙茉莉/汪红英/张明钧;审校 郑茵/张荻/戴素萍/刘秀红/白云

0 : 0
  • narrow-browser-and-phone
  • medium-browser-and-portrait-tablet
  • landscape-tablet
  • medium-wide-browser
  • wide-browser-and-larger
  • medium-browser-and-landscape-tablet
  • medium-wide-browser-and-larger
  • above-phone
  • portrait-tablet-and-above
  • above-portrait-tablet
  • landscape-tablet-and-above
  • landscape-tablet-and-medium-wide-browser
  • portrait-tablet-and-below
  • landscape-tablet-and-below