BAT、科大讯飞、商汤等5大AI国家队的一次“集体工作汇报”

2019-05-11 09:11:53 来源:雷锋网


2017年11月,科技部成立了阵容强大的新一代人工智能战略咨询委员会,包括潘云鹤、陈纯、高文、李伯虎等一大批院士入选,当时最重磅的是宣布了一个重要的名单:国家新一代人工智能开放创新平台名单,百度、阿里、腾讯、科大讯飞这4家企业成为某种意义上“AI国家队”。

此后,不到一年时间(2018年9月20日),AI独角兽商汤科技也顺利入选,成为第5家。

至此,5大AI开放创新平台涉及AI的应用领域,分别为:

依托百度公司建设自动驾驶国家新一代人工智能开放创新平台;依托阿里云公司建设城市大脑国家新一代人工智能开放创新平台;依托腾讯公司建设医疗影像国家新一代人工智能开放创新平台;依托科大讯飞公司建设智能语音国家新一代人工智能开放创新平台;依托商汤集团建设智能视觉国家新一代人工智能开放创新平台。

而在5月10日于苏州举办的全球人工智能产品应用博览会上,这5家企业首度集体亮相,并分别就各自的开放创新成果做了一次总结(从技术设计到商用落地,再到未来前景),相当于一次集体的“工作汇报”。雷锋网在现场予以报道。

在企业汇报之前,有一个环节是科技部高新技术司梅建平副司长的讲话。

他谈到,2017年是我国AI真正被重视起来的起步之年,各方都要求汇聚力量强化对AI的研究和技术支撑。由于AI在众多新兴技术里面有头雁的作用,对社会各领域的渗透性很强,加快发展新一代AI至关重要。于是才有了2017年11月的4大家、2018年加入了商汤。这些企业在引领行业、资源共享、带动中小企业发展上起到积极作用。

科大讯飞汇报智能语音平台进展

汇报人是科大讯飞高级副总裁、研究院院长胡国平。

 

他首先从科大讯飞智能语音平台的演进讲起。科大讯飞早在2010年就发布了“语音云”,2012年发布首款中文语音交互技术“讯飞语点”,2015年发布“语音转写”新技术,此后每年都保持极强的技术更新。他指出,科大讯飞在语音技术上的技术沉淀非常之久。

随后,胡国平展示了一张智能语音平台的总览图,对API平台及能力星云、iFLYOS平台及其之上的生态运行做了阐述。如图:

 

胡国平指出,目前智能语音平台已共享了170+AI能力。

 

语音合成上,有几个亮眼的数字:300个语音合成音库、35万+个接入应用数、10万+个人音库、日服务次数10亿+、企业定制音库90+。

语音识别上,错误率连续6年相对下降30%以上。

方言识别上,持续突破,覆盖23种方言,相比2017年提升23%。

此外,在语音识别、语义理解、机器翻译上既做到了定制化也获得了诸多国际大奖。

iFLYOS平台上,已具有180+技能,85+内容,包括海量音乐、语音播报等,把开发者的开发效率从此前一周提升到1小时。

 

用户数和使用量的增长,如图。基本上增长都来自智能硬件、购物、通讯社交、运动健康、游戏、理财和教育。除此之外,科大讯飞的AI开发者大赛、AI大学、1024开发者节都为平台增分不少。

商汤科技汇报智能视觉平台进展

汇报人是商汤科技集团副总裁、商业与数据洞察事业群总裁沈徽。

 

沈徽表示,智能视觉开放创新平台自2018年开始投入建设,基础是中国原创核心技术。而商汤科技的目标很明确,就是在技术研发上通过超算系统、训练系统智能视觉工具链等与国际水平保持同步,在应用上促进智能视觉技术与商业结合(不是仅仅待在实验室里),在行业带动上,结合教育事业进行AI的国际化人才体系建立。

商汤最核心的技术平台是SenseParrots深度学习平台(商汤自建),支持超深学习、超大数据学习、复杂关联应用(模型串在一起完成端到端的场景)。

 

GPU超算集群上,2015年以来实现暴增,最新数据是2018年的14000+片。

AR发展方面,已进入从底层引擎到手机厂商最后到用户的生态上下游,不仅提供垂直行业AR增强开发包,还有AR内容创作平台。

此外,以计算机视觉为主,商汤还研发了多传感器融合的自动驾驶解决方案。如图。

为进入到当前火热的智慧城市建设,商汤还有一个城市级智能视觉产品与技术生态,分为基础设施(深度学习GPU超算中心)、终端(AI芯片、SenceDLC)、引擎(方舟智能视觉开放平台)和应用(人脸大数据、视频结构化、人群分析)四大部分。此外,在AI教育方面,商汤尤为关注,从教材出版、教师培训、学生在线培训、AI竞赛、AI认证等都有相应方案。

百度汇报Apollo自动驾驶平台进展

汇报人是百度自动驾驶事业群的张硕。张硕重点谈到百度自动驾驶四大生态:硬件、教育、城市、开发者。她表示,自2017年4月百度宣布Apollo全球开放计划以来,已总计发布过7个版本。如图:

技术支持上,其开源平台是Apollo 3.5框架。据悉,百度内部有个技术布道师团队,专门给开发者答疑;数据集上,除了百度本身的数据,还有一条“1比3”的交换原则,即合作伙伴对百度开放一部分数据,百度会开放其3倍的数据予以回馈;测试支持上,百度的车辆数据规模非常庞大;社区教育上,百度会联合高校力量;资本投入上,百度有双百计划,即用100亿投资100家自动驾驶相关企业。

Apollo的教育生态同样也日益成为重点。从高校合作,到提供具体的教材可见等产品,智能驾驶产学研的氛围极为浓厚。如图:

此外,出行乘用车的合作上,目前百度与新石器、酷哇扫地车、一汽红旗都有深度合作。2019年与一汽红旗L4乘用车用于出行服务。如图:

 

自动驾驶车路协同(车端、路端、通信链路),主要进行城市/高速公路V2X智能化改造,目前能结解决54%单车智能在路测中遇到的问题,减少62%单车智能的接管数。

张硕表示,车路协同既是升级自动驾驶的落地方式,也是今后5G的一种绝佳落地方式。

阿里巴巴达摩院汇报城市大脑视觉智能进展

汇报人是阿里巴巴达摩院城市大脑实验室技术总监金仲明。他首先回顾城市大脑的产生,即AI+算力对城市数据进行感知、分析、决策后产生的价值,是城市治理模式、城市服务模式和城市产业模式的新突破。

 

据了解,在城市大脑背后的技术架构上,分布着4大平台:应用支撑平台、智能平台、数据资源平台、一体化计算平台。涉及与城市交通、医疗、城管、环境、旅游、城规、平安、民生八大领域有关的计算能力、数据算法、管理模型等。

在城市大脑AI开放创新平台构成上,最底层是数据源,往上就是飞天等平台,再往上就是AI视觉计算平台(城市大脑最核心的一部分),AI视觉平台包括数据接入、批量计算、流计算、模型调动、模型量化、视觉搜索、综合搜索图谱及测算等,再往上就是数字平行世界等数字孪生的生态,最上面的才是行业应用,包括交通、安全、市政等等。

 

对于城市大脑,阿里云和达摩院都对其做了更多新技术的加持。比如5月9日达摩院发布的“数字平行世界”视觉智能引擎,就是很好的证明。数字平行世界的核心技术是3个:视觉理解从2D到3D,视觉推理从3D到4D,加入智能搜索,和BIM系统深度对接。

以车流人流预测技术为例,城市大脑对交通流进行建模,并将多路视频联合分析,将传统的城市大脑视觉技术做了一次全新升级。

腾讯汇报医疗(影像)平台进展

 

腾讯觅影是腾讯公司首款将人工智能技术运用在医学领域的AI产品。“腾讯觅影”由腾讯互联网+合作事业部牵头,聚合了腾讯公司内部包括AI Lab、优图实验室、架构平台部等多个顶尖人工智能团队的能力,把图像识别、大数据处理、深度学习等领先的技术与医学跨界融合研发而成。

杨昊臻表示,觅影团队目前有众多AI科学家的助阵,保障医学成果最优转化。比如现任腾讯优图 实验室杰出科学家、香港中文大学计算机科学工程系终身教授贾佳亚、腾讯AI Lab AI+医疗专家研究员姚建华、腾讯优图AI医疗总监郑冶枫等。

在分类上,觅影主要是分成AI影像平台和辅助诊疗两块。其中,AI影像平台主要关注5大病种(结直肠癌、肺癌、乳腺癌、宫颈癌和眼底多病种)。

 

以乳腺癌为例,该病种特点是良性和恶性图片差别不明显,既要看乳房整体文理又要局部看是否有肿瘤。根据测算,其对早期乳腺癌的敏感度(识别正确率)达到87%,对良性肿瘤的特异性(识别正确率)高达94.5%。此外,觅影眼底疾病筛查AI系统凝聚多中心数据资源,支持7大常见眼底疾病与20余种罕见眼底疾病的监测,实现眼底病种全覆盖。

而在辅助诊疗上,觅影的技术思路是“让AI像医生一样懂医学、会看病”。懂医学就要做到构建医学知识图谱(专业数据、医学文献),会看病就要做到理解病情(学习诊疗技能、经历大量案例),最终在成为“普通医生”后向“专家”迈进。

 

为此,觅影有着强大的诊疗知识库储备。如图。

免责声明:本文由作者原创。文章内容系作者个人观点,转载目的在于传递更多信息,并不代表EETOP赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请及时联系我们,我们将在第一时间删除!

 
  1. EETOP 官方微信

  2. 创芯大讲堂 在线教育

  3. 创芯老字号 半导体快讯

相关文章

全部评论

  • 最新资讯
  • 最热资讯
@2003-2024 EETOP
×