首页
论坛
博客
大讲堂
人才网
直播
资讯
技术文章
频道
登录
注册
x
英特尔助力人工智能语言识别
2021-12-10 09:16:43
英特尔
点击关注->
创芯网公众号
,后台告知EETOP论坛用户名,奖励200信元
在近日举行的NeurIPS大会上,发布了两册
英特尔
提供支持的关于口语数据集的白皮书,其中,《人的语言》主要涉及到“自动语音识别”任务,另一册——《多语种口语语料库》则涵盖“关键词识别”。这两个项目的数据集都贡献了大量丰富的音频数据,且每个数据集在同类中都拥有最大的可用体量。
《多语种口语语料库》由
英特尔
软件与先进技术事业部(SATG)的机器学习工程师Keith Achorn参与撰写。Keith在
英特尔
社区网站的博客中讲述了自己参与该项目的经历。
在ML Commons 的支持下,“人的语言”和“多语种口语语料库”于2018年开始启动,该项目旨在识别世界上最常用的 50 种语言并统一到单一的数据集中,从而使这些数据得到有效利用。该项目小组成员来自
英特尔
、哈佛大学、阿里巴巴、甲骨文、Landing
AI
、密歇根大学、谷歌、百度等。
在当今多元化、国际化、多语言的工作环境中,准确转录和翻译的能力愈发重要。通过使用以上数据集,计算机可以“听到”口语单词,并自动生成文本或译文。
这两个项目都运用了“多样化语音”,这意味着它们可以更好地展现自然环境音,如背景噪音、非正式语言模式、录音设备混音以及其他声学环境等。这与诸如有声读物之类的高度受控的内容不同,后者产生的声音更加“纯净”。然而,在实际应用中,多样化语音训练有助于提高识别的准确性。
“人的语言”项目内含数万小时的对话音频。如今,它是世界上最大的、可免费下载的、用于学术和商用的英语语音识别数据集之一。
“多语种口语语料库”是一个音频语音数据集,不仅拥有超过30万个关键字的数十种语言,能够通过智能设备访问,还涵盖了50多亿用户的日常对话,有助于推动全球范围内受众语音应用的研发。
这两个数据集都将提供给广泛的用户进行应用,它们包括商用在内的授权许可条款都相对较为宽松。
关键词:
EETOP 官方微信
创芯大讲堂 在线教育
半导体创芯网 快讯
相关文章
上一篇:
LeapMind发布超低功耗AI推理加速器IP“
下一篇:
初露锋芒!银牛微电子荣登雷峰网「2021
全部评论
最新资讯
开盘暴涨 468%!国产GPU第一股燃爆科创板!
韩国半导体巨头经历战略转型
Tenstorrent与AutoCore宣布战略合作,以Aut
Tenstorrent宣布旗下TT-Ascalon™高性能RIS
寒武纪严正申明!
贸泽电子授权代理知名制造商TE Connectivi
AMD发布 Spartan UltraScale+ FPGA
富士通公布2nm、1.4nm Arm 超算处理器发展计划
英伟达GPU不妙!
沐曦股份发行价确定!
最热资讯
突发!英特尔首席技术官跳槽
关于召开“2026中国具身智能与人形机器人创
亚马逊上海AI研究院解散!
SDAIA、谷歌云培训计划赋能AI领域女性
马斯克:特斯拉不再需要用激光雷达采集FSD
马斯克预言:未来将不再有手机 仅有Neuralink
贵到离谱!英伟达下一代中国特供GPU价格曝光
英伟达发布B200测试结果:FP4 比 H100 快 4 倍
全球首个超声多模态大模型!百度百舸支撑海
忆阻器或赋予AI芯片时间感知能力