小程序
传感搜
传感圈

什么样的数据才能让语音交互更智慧?

2020-08-20
关注
摘要 由于混响、噪音等技术难题,远场识别的准确率要低于近场。因此,远场语音识别技术的提高需要有针对性的远场语音数据。

  “小爱,来段相声”,一段岳云鹏的相声就开始播放了。这就是小米推出的智能音箱——小爱音箱mini,用户只需要与小爱进行“对话”便可实现对家中所有物联网设备的控制.

  同样,海尔智家推出了依赖语音交互进行控制的全屋智能。回到家后,你只需要呼唤“小优小优”,智能音箱就能联动客厅的一切,实现开灯、开空调、打开电视、拉开窗帘等功能。

  海尔智家推出的依赖语音交互进行控制的全屋智能在家庭物联网大力发展的时代,智能音箱、智能家电、陪伴机器人等各种智能家居产品进入爆发期。

  根据市场调研公司Markets And Markets近日发布报告,全球智能家居市场规模将在2022年达到1220亿美元,2016-2022年间的年均增长率预测为14%。

  智能家居产品种类丰富,涵盖照明、安防、供暖、空调、娱乐、医疗看护、厨房用品等类别。

  这些智能化家居产品能够有效提升家居的便利性、舒适性和艺术性,并实现环保节能的居住环境。

  由于语音控制方式不需要复杂的操作,直接对话就可以指导相应的动作,使用声音控制设备的运行已经成为智能家居设计的一种重要手段。具备语音控制功能且体验准确流畅,逐渐成为消费者挑选智能家居产品的重要标准。

  在这种背景下,语音识别成为智能家居不断创新升级的基础技术支撑。

  数据堂自有版权的行业内高标准语音识别训练数据深受重视和好评。在深刻理解智能家居场景的基础上,数据堂研制了儿童语音识别、多语种混合识别以及远场语音识别数据,为智能家居领域的技术创新和升级提供助力。

  儿童语音识别

  根据2018年百度世界大会公布的数据,儿童用户群占到智能音箱用户的20%。2018年起,众多语音技术研发企业纷纷致力于提升儿童语音识别的准确率。

  例如,阿里推出的天猫精灵儿童智能音箱一直以来备受家长的追捧。这款专门为儿童设计的智能音箱拥有多项为儿童设计的功能,小朋友只需要简单说出语音指令,就可以实现听歌、听故事、玩游戏的功能。

  阿里推出的专为儿童设计的天猫精灵儿童智能音箱而诸如天猫精灵儿童智能音箱等产品问世的背后,都离不开儿童语音数据的支持。

  儿童和成人的发音特征有明显差异。丰富、优质的儿童语音数据够为儿童语音识别提供模型,提高儿童语音的适应性,提升儿童用户的语音识别率。

  多语种混合识别

  中英混合已经成为大多数现代人的说话习惯之一,相当比例的国内用户会使用中英混合的方式给出语音指令,如“播放一首Uptown Funk”(英文歌)、“播放The Big Bang Theory”(美剧)。

  针对这一家居场景,不少AI企业开始注重能够支持中英混读语音识别产品的开发。

  基于大量的中英混读数据、不断训练新的识别模型,百度输入法AI探索版支持用户使用自己熟悉的“中英混合”表达方式,成为目前唯一实现了高精准中英文混合语音输入法产品。

  用户通过点击语音按钮,或者呼唤“小度小度”语音助手,说出相应指令,即可实现“中英文混合识别”。

  为了克服中英混合句子识别率较低的短板,自2017年下半年起,众多语音技术研发企业纷纷利用中英混读语音数据来提升中英混读的识别率。

  远场语音识别

  在家居场景中,用户离智能设备的距离大都是一米以外的远场。国内智能电视厂商TCL、康佳等敏锐洞察到智能家居这一发展空间,纷纷布局远场语音领域,推出了人工智能小T、康佳电视等A1产品。

  在智能远场语音交互上,如何在复杂的家居环节中轻松唤醒设备成为极为重要的用户体验。

  由于混响、噪音等技术难题,远场识别的准确率要低于近场。因此,远场语音识别技术的提高需要有针对性的远场语音数据。

您觉得本篇内容如何
评分

评论

您需要登录才可以回复|注册

提交评论

中国家电网

这家伙很懒,什么描述也没留下

关注

点击进入下一篇

智能制造如何为信息产业发展赋能?

提取码
复制提取码
点击跳转至百度网盘