人脸识别的“生意经”

2019-04-16 11:07:56 来源:AI科技大本营
人脸识别软件是一种非常强大的技术,对用户隐私构成了严重威胁。同样,这个行业目前发展十分迅猛。如今,十数家初创公司和科技巨头正在向酒店、零售店,乃至学校提供人脸识别服务。由于新算法较五年前能更为精确地识别人脸,行业发展非常迅速。这些科技公司将数十亿的人脸素材用以训练,并改进这些算法,而这通常无需任何许可。事实上,包括你在内,很有可能所有人的数据都被人脸识别公司用于 “训练集” 中,或存在于某个公司的客户数据集里。
 
 
面对这样的情况,消费者可能会感到惊讶。例如,在至少三起案件中,科技公司通过用户手机上的拍照应用,获得了数百万张人脸图像。目前,针对人脸识别软件的法律限制尚无,这意味着人们几乎无法阻止这种情况发生。
 
 
2018 年,华盛顿特区附近机场的 “登机道” 上,有一台摄像机采集着匆匆走过的 “路人” 脸孔数据。不过实际上,这只是美国国家标准与技术研究所(NIST)的模拟系统用于展示该装置 “在野外” 是如何收集人脸数据的。NIST 会定期举办人脸识别软件竞赛,邀请全球公司参与,这些由志愿者自愿贡献的人脸数据将用于竞赛。
 
 
 
 
 
早期人脸识别技术便是通过这样的方式来运作的,学术科研人员会请求用户许可。而如今,科技公司站在了人脸识别技术的前沿,他们不太可能在使用人脸数据时请求明确的许可。
 
 
据研究机构 Market Research Future 报道,人脸识别行业竞争激烈,人脸识别软件的市场正在以每年 20% 的速度扩张,预计到 2022 年,市值将达每年 90 亿美元。其商业模式之一则是:向客户发放软件许可,允许他们使用自己的人脸识别程序,这些客户包括执法部门、零售商、中学等。
 
 
在公司参与的此类软件开发竞赛中,如果算法能够精确识别人脸,并不会导致偏差,该公司就能获胜。与人工智能的其他领域一样,开发出人脸识别的最佳算法,意味着需要积累大量的人脸数据。虽然科技公司能够使用政府和大学取得许可的数据集,如耶鲁人脸数据库(Yale Face Database),但这些训练集的数据相对较少,人脸数据仅有数千个。此外,这些官方数据集还有其他局限性,许多缺乏多样性,或者未能包含诸如阴影、戴帽或化妆等条件,因而不够真实。为了建立起能在真实场景下探测人脸的识别技术,科技公司需要更多的图像。
 
 
FaceFirst 公司 CEO Peter Trepp 表示,“数百、数千根本不够,需要数以百万计的图像。如果缺乏戴眼镜或不同肤色人种的数据训练库,则无法得到准确结果。” 这是一家位于加州的人脸识别公司,帮助零售商筛选出犯罪分子,将其挡在门外。
 
 
从应用服务提供商转为 AI 公司
 
 
公司从何处寻觅数百万张图像训练软件?来源之一是警局的人脸数据库,也可以找私人公司购买。加州的 Vigilant Solutions 公司就提供人脸数据“服务”,其中包含一个 1500 万张面孔的人脸数据集。
 
 
然而,一些初创公司已经找到了更好的面孔来源——用户的 “个人相册” 应用。这些应用可编辑用户手机相册中的照片,通常包含同一个人在多个姿势和情境下的多张图像——这可是训练集的海量数据源。
 
 
Ever AI 的 CEO Doug Aley 表示:“我们有客户在数千种不同的场景中被标记同一人,站在阴影中的,戴着帽子的,凡你能想到的。”Ever AI 是一家旧金山的人脸识别初创公司,于 2012 年推出 EverRoll,这是一款帮助消费者管理一大堆照片合集的应用。
 
 
Ever AI 已获投 2900 万美元,投资者包括 Khosla Ventures 和其他硅谷风险投资公司。在美国国家标准与技术研究所最近的竞赛中,取得 “面部照片” 分类中第二名,“自然环境面孔”分类第三名。Aley 将成绩归功于公司庞大的照片数据库,据 Ever AI 统计,该数据库中约有 130 亿张图片。
 
 
初期,Ever AI 还仅是个照片应用时,其激进的营销策略曾引发争议,并暂时导致 App Store2016 年将 EverRoll 下架——这款应用诱使用户向其手机联系人发送推广链接,还被用户指责攫取私人数据,。根据 Greg Miller 2015 年在 FB 上的评论,“该程序在安装后立即收集你的通讯录,即刻给所有人发消息…… 然后开始拉取你的照片,上传至云端。”四年后,Miller 惊讶地发现,曾叫作 EverRoll 的应用程序仍存有他的照片,而且现在它已成为人脸识别公司了。
 
 
Miller 对我们表示,“不,我当时没有意识到,也完全不能同意。所有这些都是真实存在的问题,不再有隐私,这只会让我害怕。”
 
 
Ever AI 的 CEO Aley 则表示,该公司不会将其数据库的个人信息泄漏出去,仅用于训练软件。他还表示,该公司类似社交媒体,用户可以选择退出。 Aley 还否认 Ever AI 从一开始就打算向人脸识别方向发展,并表示关闭照片应用是商业方面的决策。目前,Ever AI 的用户分布在各行各业,包括公司 ID 管理、零售业、电信通讯业以及法律执行部门。
 
 
EverRoll 也并不是唯一转向人脸识别的相册应用提供商。旧金山的初创公司 Orbeus 于 2016 年被亚马逊悄然收购,它也曾提供过一个名为 PhotoTime 的热门图片管理应用。据内部人士透露,Orbeus 的 AI 技术以及海量人像数据库促成了这次收购。由于签有保密协议,这位员工不肯透露身份,但他表示“亚马逊寻求的就是这些功能,他们在收购后关闭了这款应用。”
 
 
如今 PhotoTime 已不复存在,不过亚马逊还在继续销售另一款 Orbeus 的产品,名为 Rekognition。这款产品供执法机关及其他组织用于人脸识别。亚马逊公司拒绝透露 Orbeus 的相册应用在多大程度上用于训练 Rekognition 软件,只是说这款软件将各种来源的数据用于其人工智能项目——包含人脸识别,并表示他们并没有使用用户的 Prime 照片训练算法。
 
 
总部位于西雅图的 Real Networks 则是另一家使用其用户照片软件来训练其人脸识别算法的公司,这家公司的在线视频播放器一度非常著名,而如今则专注于针对学校孩童的人脸识别软件。同时它还提供了一款针对家庭用户的智能手机应用,名为 RealTimes,有评论称这款应用背地里窃取人脸数据。
 
 
美国乔治城大学的教授 Clare Garvie 在人脸识别领域曾发表过很有影响力的报告,他表示“该应用允许用户制作自己照片的视频幻灯片。想象一下,一位母亲将照片放在幻灯片里,再发给孩子的祖母。而这些图像将用于识别孩子们面孔的数据集训练,真是可怕。”Real Networks 证实,这款照片应用确有助于改善其人脸识别工具,但他补充还使用了其他数据源。
 
 
从所有这些案例中可以看出,科技公司使用照片应用收集人脸数据时,并没有征求用户的明确许可。相反,这些公司只需要通过服务条款获得法律认可即可。
 
 
然而,相比某些人脸识别公司,这已经算好的了。据美国国家标准与技术研究所人脸识别竞赛的负责人 Patrick Grother 表示,人脸识别公司编写程序从 SmugMug 或 Tumblr 等网站上 “抓取” 图片十分常见。这些情况下,他们捕获用户数据并用于训练集时,甚至连遮掩都没有。
 
 
美国全国广播公司 (NBC) 最近一篇报道强调了这种 “自助” 做法,并详细描述了 IBM 如何从照片共享网站 Flickr 上窃取了 100 多万张人脸用于 AI 研究的。IBM 研究部门人工智能技术主管 John Smith 告诉 NBC 新闻,该公司致力于“保护个人隐私”,如果用户希望从数据集中删除个人数据,他们也愿意配合。
 
 
所有这些都引发了人们的疑问:这些公司在保护他们所收集的人脸数据时,究竟做了哪些工作?政府又是否该给予更多监督?随着人脸识别技术发展到社会更多领域,并成为各大小公司的业务支持时,这些问题只会更为显著。
 
 
从商店到学校
 
 
人脸识别软件并不新鲜。该技术的雏形初现于 20 世纪 80 年代,当时美国的数学家正开始用一系列数值来定义人脸,并用概率模型来匹配。佛罗里达州坦帕市的安保人员在 2001 Super Bowl 上使用了它,赌场也使用这一技术多年。但过去几年里,情况发生了变化。
 
 
美国国家标准与技术研究所的 Grother 说:“人脸识别正历经革命。”他补充道,在高模糊或低质量图片中,这种变化最为明显。“底层技术已发生变化,新一代算法取代了旧技术,它们非常有效。”
 
 
人脸识别的这场革命正更广泛地改变人工智能领域,而这得益于两大因素:首先是新兴的深度学习科学,这是一种类似人脑的模式识别系统:二是前所未有的海量数据,这些数据可以在云计算的帮助下以低成本存储和解析。
 
 
毫无疑问,最先充分利用这些新发展的公司是谷歌和 Facebook。2014 年,社交网络首推 DeepFace 程序,该程序可以识别两张脸是否同属一人,准确率高达 97.25%,几乎相当于人类在同一测试中的得分。据安全公司 Gemalto 称,一年后谷歌凭借 FaceNet 程序获得头名,达到百分之百的准确率。
 
 
如今,这些公司以及微软等科技巨头在人脸识别领域均处于领先地位,这在很大程度上是因为它们可以访问大量的人脸数据库。尽管如此,在不断增长的人脸识别市场上,越来越多的初创公司也在寻找自己的位置,它们也取得了极高准确率。
 
 
  1. EETOP 官方微信

  2. 创芯大讲堂 在线教育

  3. 创芯老字号 半导体快讯

相关文章

全部评论

  • 最新资讯
  • 最热资讯
@2003-2024 EETOP