CN204390737U - 一种家庭语音处理系统 - Google Patents

一种家庭语音处理系统 Download PDF

Info

Publication number
CN204390737U
CN204390737U CN201420423442.2U CN201420423442U CN204390737U CN 204390737 U CN204390737 U CN 204390737U CN 201420423442 U CN201420423442 U CN 201420423442U CN 204390737 U CN204390737 U CN 204390737U
Authority
CN
China
Prior art keywords
module
microprocessor
voice
microphone
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN201420423442.2U
Other languages
English (en)
Inventor
钱勇
康怀茂
武兵
邢猛
王海坤
谢信珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201420423442.2U priority Critical patent/CN204390737U/zh
Application granted granted Critical
Publication of CN204390737U publication Critical patent/CN204390737U/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

一种家庭语音处理系统包含:多麦克风装置、录音装置、微处理器、语音唤醒模块、声源定位模块、语音增强模块、语音识别模块、通讯装置、控制装置。多麦克风装置与录音装置连接,录音装置与微处理器连接,多麦克风装置采集声音信息,通过录音装置进行音频录入并传送给微处理器,完成声音采集操作;语音唤醒模块、声源定位模块、语音增强模块、语音识别模块运行在微处理器中,微处理器将语音信息经过各模块处理后转换为控制信息;微处理器与通讯装置连接,通讯装置与控制装置连接,微处理器将控制信息传送给控制装置,由控制装置完成相应的控制操作。本实用新型实现了在家庭环境下通过语音交互对家庭电器设备的控制,同时提升了语音识别的准确度。

Description

一种家庭语音处理系统
技术领域
本实用新型涉及一种在家庭环境下使用语音交互控制家用设备,特别是一种家庭语音处理系统。
背景技术
随着科技的发展,语音交互技术已经广泛应用于各行各业,极大的提升了人机交互的体验效果。在家庭应用场景下,各种电器设备的控制及操作对语音控制的需求十分迫切。当前已经有一些在家庭环境使用语音交互控制电器设备的案例,但是由于家庭环境下充斥着各类噪声,而且说话人位置不固定,类似这些不确定因素导致语音交互准确性大大降低,用户体验较差,语音交互在家庭环境下使用存在巨大的挑战。
实用新型内容
本实用新型技术解决问题:当前的语音交互设备在安静环境下使用准确率较高,在不同家庭应用场景下使用鲁棒性较差,用户体验效果不好,为了克服现有技术的不足,本实用新型提供一种家庭语音处理系统,在家庭应用环境下时,提高了语音交互准确性,提升了用户体验效果。
本实用新型采用如下技术解决方案来实现上述目的:一种家庭语音处理系统,如图1所示,包含:多麦克风装置、录音装置、微处理器、语音唤醒模块、声源定位模块、语音增强模块、语音识别模块、通讯装置、控制装置。
所述多麦克风装置与录音装置连接,录音装置与微处理器连接,多麦克风装置采集声音信息,通过录音装置进行音频录入并传送给微处理器,完成声音采集操作;
所述微处理器与通讯装置连接,通讯装置与控制装置连接,微处理器通过通讯装置将控制信息传送给控制装置,由控制装置实现对相关设备的控制;
所述语音唤醒模块、声源定位模块、语音增强模块、语音识别模块在微处理器中运行;录音装置的输出接至声源定位模块的输出,声源定位模块的输出连接语音增强模块,语音增强模块的输出分别接至语音唤醒模块和语音识别模块;所述声源定位模块根据多麦克风装置采集的语音信息确定声源至系统的相对位置;所述语音增强模块基于声源定位模块确定的声源位置信息形成有效波束,对波束内有效语音信号进行增强,对波束外噪声进行抑制;所述语音唤醒词模型引擎预置在处理器中,多麦克风装置采集的语音信息与内置的模型引擎进行对比语音识别,并输出结果;所述语音识别模块为有限词集语音识别系统。
所述多麦克风装置为多麦克风阵列,多麦克风“一”字排开,各麦克风之间间距不限。
所述通讯装置包含有线和无线两种形式,有线方式包含IIC、UART、SPI形式,无线方式包含2.4G、蓝牙、Wi Fi形式。
与现有技术方案相比,本实用新型的有益效果是:本实用新型使用多麦克风阵列系统,相对于传统的单麦克风采音系统,能够采集更多空间内的语音信息,为声源定位、语音增强提供数据保障。声源定位技术能够准确判定人员的位置信息,结合语音增强技术能够有效提升语音信号信噪比,提升在家庭环境下语音交互的准确性,提升用户体验效果,进而实现语音交互在家庭应用环境下的普及。
附图说明
图1是本实用新型系统框图;
图2是本实用新型涉及语音唤醒模块示意图;
图3是本实用新型涉及声源定位模块示意图;
图4是本实用新型涉及语音增强模块示意图。
具体实施方式
如图1所示,本实用新型一种家庭语音处理系统包含:多麦克风装置、录音装置、微处理器、语音唤醒模块、声源定位模块、语音增强模块、语音识别模块、通讯装置、控制装置。多麦克风装置麦克风数量大于等于2个,麦克风类型以硅麦克风为主,同时能够兼顾普通驻极体麦克风;录音装置采用高精度、多通道录音芯片,提供高质量录音;语音唤醒模块、声源定位模块、语音增强模块、语音识别模块运行在微处理器中,微处理器使用高性能DSP芯片。
如图2所示,语音唤醒模块实现过程如下:
(1)声学特征提取:通过语音增强模块获取处理后的语音信号,提取具有区分性的、基于人耳听觉特性的特征;
(2)唤醒词检测:将提取的声学特征在唤醒词检测网络上计算声学得分,如果声学得分最优路径包含检测唤醒词,则确认检出唤醒词,否则重新回到第一步重新进行声学特征提取;
(3)唤醒词确认:将步骤二计算的声学得分与预先设定的门限进行对比,如果声学得分大于门限值,则确认为真实唤醒词,输出给执行模块,如果声学得分小于门限值,则确认为虚假唤醒词,重新回到第一步重新进行声学特征提取。
如图3所示,声源定位模块实现过程如下:
(1)延时时间计算:根据麦克风阵列装置中各个麦克风录音音频计算延时时间T;
(2)位置估计:将第一步计算的延时时间进行位置估算计算,确定目标声源的空间位置信息;
(3)位置确认及输出:将第二步确定的空间位置信息值进行确认评估,如果评估通过则输出空间信息,如果评估不通过则重新回到第一步执行。
如图4所示,语音增强模块实现过程如下:
(1)束波形成:根据声源定位模块提供的声源空间位置信息形成针对声源的束波;
(2)语音降噪:对步骤一所述束波内语音信号进行语音降噪处理,提升语音信号信噪比;
(3)结果输出:将语音增强信号输出给后级语音处理模块。
通讯装置包含有线和无线两种形式,有线方式包含IIC、UART、SPI形式,无线方式包含2.4G、蓝牙、Wi Fi形式。
本实用新型工作过程如下:
以电视语音交互应用为例。当多个用户在家庭客厅里使用语音交互控制电视时,此应用场景的特点是(1)应用场景中有多个用户需要使用语音交互控制电视;(2)应用场景中有电视背景噪声、家庭内各种嘈杂声等噪声存在。基于本实用新型的实现方式为:
第一步:通过语音唤醒模块启动语音交互,在电视正常运行条件下,用户通过语音唤醒词,如“你好语音助理”,将设备从正常运行状态打断,调整到语音交互状态,相当于我们通过遥控器控制设备需要先拿到遥控器一样。
第二步:通过声源定位模块获取控制权,在多个用户控制一个设备的条件下,某用户想要控制设备,必须先获取对设备的控制权,相当于通过遥控器控制设备遥控器必须先抢到遥控器一样。通过唤醒词唤醒设备的同时,声源定位模块将获取发音人的位置,并将控制权交给发音人。
第三步:通过语音识别进行语音交互,当用户获取控制权后,通过语音识别模块即可实现对设备的控制,应用环境中的各种噪声将会影响语音识别交互的准确性,语音增强模块能够实现在嘈杂环境下提高目标说话人语音信噪比的效果,进而提升产品的语音交互体验效果。
以上所述的仅是本实用新型优选实施方式,用户在各类家庭环境下,例如空调语音控制、灯具语音控制同样可以通过家庭语音处理系统提高语音交互的准确性,提升语音交互效果。
应当指出,对于本领域工作人员而言,在不脱离本实用新型构思的前提下,还可以做出若干变形和改进,这都属于本实用新型的保护范畴。

Claims (5)

1.一种家庭语音处理系统,其特征在于包含:多麦克风装置、录音装置、微处理器、语音唤醒模块、声源定位模块、语音增强模块、语音识别模块、通讯装置、控制装置;
所述多麦克风装置与录音装置连接,录音装置与微处理器连接,多麦克风装置采集声音信息,通过录音装置进行音频录入并传送给微处理器,完成声音采集操作;
所述微处理器与通讯装置连接,通讯装置与控制装置连接,微处理器通过通讯装置将控制信息传送给控制装置,由控制装置实现对相关设备的控制;
所述语音唤醒模块、声源定位模块、语音增强模块、语音识别模块在微处理器中运行;录音装置的输出接至声源定位模块,声源定位模块的输出连接至语音增强模块,语音增强模块的输出分别连接至语音唤醒模块和语音识别模块。
2.根据权利要求1所述的一种家庭语音处理系统,其特征在于:所述多麦克风装置为多麦克风阵列,多麦克风“一”字排开,各麦克风之间间距不限。
3.根据权利要求1所述的一种家庭语音处理系统,其特征在于:所述通讯装置包含有线或无线形。
4.根据权利要求3所述的一种家庭语音处理系统,其特征在于:所述有线方式包含IIC、UART或SPI形式。
5.根据权利要求3所述的一种家庭语音处理系统,其特征在于:所述无线方式包含2.4G、蓝牙或Wi Fi形式。
CN201420423442.2U 2014-07-29 2014-07-29 一种家庭语音处理系统 Expired - Lifetime CN204390737U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201420423442.2U CN204390737U (zh) 2014-07-29 2014-07-29 一种家庭语音处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201420423442.2U CN204390737U (zh) 2014-07-29 2014-07-29 一种家庭语音处理系统

Publications (1)

Publication Number Publication Date
CN204390737U true CN204390737U (zh) 2015-06-10

Family

ID=53363436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201420423442.2U Expired - Lifetime CN204390737U (zh) 2014-07-29 2014-07-29 一种家庭语音处理系统

Country Status (1)

Country Link
CN (1) CN204390737U (zh)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105448294A (zh) * 2015-12-09 2016-03-30 江苏天安智联科技股份有限公司 一种应用于车载设备的智能语音识别系统
CN106128459A (zh) * 2016-06-30 2016-11-16 广东美的制冷设备有限公司 语音控制装置及基于多麦克风的语音控制方法
CN106205615A (zh) * 2016-08-26 2016-12-07 王峥嵘 一种基于语音交互的控制方法及系统
CN106440192A (zh) * 2016-09-19 2017-02-22 珠海格力电器股份有限公司 一种家电控制方法、装置、系统及智能空调
CN106507244A (zh) * 2016-12-23 2017-03-15 深圳先进技术研究院 一种中控系统
CN106531179A (zh) * 2015-09-10 2017-03-22 中国科学院声学研究所 一种基于语义先验的选择性注意的多通道语音增强方法
CN106604181A (zh) * 2016-12-15 2017-04-26 北京塞宾科技有限公司 一种分布式麦克风智能家居系统
WO2017071070A1 (zh) * 2015-10-28 2017-05-04 小米科技有限责任公司 智能设备的语音控制方法、装置、控制设备及智能设备
CN106789484A (zh) * 2017-02-17 2017-05-31 张德明 一种基于网络的分布式麦克风智能家居系统
CN106782519A (zh) * 2016-12-23 2017-05-31 深圳先进技术研究院 一种机器人
CN106863320A (zh) * 2017-01-18 2017-06-20 北京光年无限科技有限公司 一种用于智能机器人的语音交互数据获取方法及装置
CN106910500A (zh) * 2016-12-23 2017-06-30 北京第九实验室科技有限公司 对带麦克风阵列的设备进行语音控制的方法及设备
CN106997763A (zh) * 2017-03-17 2017-08-01 浙江大学 一种基于语音信号频域处理的空调控制装置
CN107346661A (zh) * 2017-06-01 2017-11-14 李昕 一种基于麦克风阵列的远距离虹膜跟踪与采集方法
CN107437420A (zh) * 2016-05-27 2017-12-05 富泰华工业(深圳)有限公司 语音信息的接收方法、系统及装置
CN108091327A (zh) * 2018-02-22 2018-05-29 成都启英泰伦科技有限公司 一种智能语音设备控制方法
CN108133704A (zh) * 2018-02-22 2018-06-08 成都启英泰伦科技有限公司 一种声源锁定系统
CN108172220A (zh) * 2018-02-22 2018-06-15 成都启英泰伦科技有限公司 一种新型语音除噪方法
CN108364642A (zh) * 2018-02-22 2018-08-03 成都启英泰伦科技有限公司 一种声源锁定方法
CN108538297A (zh) * 2018-03-12 2018-09-14 恒玄科技(上海)有限公司 一种基于无线麦克风阵列的智能语音交互方法及交互系统
CN109788382A (zh) * 2019-01-25 2019-05-21 深圳大学 一种分布式麦克风阵列拾音系统及方法
CN109920433A (zh) * 2019-03-19 2019-06-21 上海华镇电子科技有限公司 嘈杂环境下电子设备的语音唤醒方法
TWI665656B (zh) * 2017-03-31 2019-07-11 香港商阿里巴巴集團服務有限公司 語音的功能控制方法和裝置
TWI672690B (zh) * 2018-03-21 2019-09-21 塞席爾商元鼎音訊股份有限公司 人工智慧語音互動之方法、電腦程式產品及其近端電子裝置
CN110534109A (zh) * 2019-09-25 2019-12-03 深圳追一科技有限公司 语音识别方法、装置、电子设备及存储介质
CN110537101A (zh) * 2017-04-14 2019-12-03 昕诺飞控股有限公司 用于确定物体位置的定位系统
CN108447479B (zh) * 2018-02-02 2020-11-24 上海大学 嘈杂工况环境的机器人语音控制系统
CN113208381A (zh) * 2021-01-21 2021-08-06 深圳市芯中芯科技有限公司 一种基于语音控制的ai智能保温杯

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106531179A (zh) * 2015-09-10 2017-03-22 中国科学院声学研究所 一种基于语义先验的选择性注意的多通道语音增强方法
RU2647093C2 (ru) * 2015-10-28 2018-03-13 Сяоми Инк. Способ и устройство для управления интеллектуальным устройством посредством речи, устройство управления и интеллектуальное устройство
WO2017071070A1 (zh) * 2015-10-28 2017-05-04 小米科技有限责任公司 智能设备的语音控制方法、装置、控制设备及智能设备
CN105448294A (zh) * 2015-12-09 2016-03-30 江苏天安智联科技股份有限公司 一种应用于车载设备的智能语音识别系统
CN107437420A (zh) * 2016-05-27 2017-12-05 富泰华工业(深圳)有限公司 语音信息的接收方法、系统及装置
CN106128459A (zh) * 2016-06-30 2016-11-16 广东美的制冷设备有限公司 语音控制装置及基于多麦克风的语音控制方法
CN106128459B (zh) * 2016-06-30 2019-11-26 广东美的制冷设备有限公司 语音控制装置及基于多麦克风的语音控制方法
CN106205615A (zh) * 2016-08-26 2016-12-07 王峥嵘 一种基于语音交互的控制方法及系统
US11373646B2 (en) 2016-09-19 2022-06-28 Gree Electric Appliances, Inc. Of Zhuhai Household appliance control method, device and system, and intelligent air conditioner by determining user sound source location based on analysis of mouth shape
CN106440192B (zh) * 2016-09-19 2019-04-09 珠海格力电器股份有限公司 一种家电控制方法、装置、系统及智能空调
CN106440192A (zh) * 2016-09-19 2017-02-22 珠海格力电器股份有限公司 一种家电控制方法、装置、系统及智能空调
CN106604181A (zh) * 2016-12-15 2017-04-26 北京塞宾科技有限公司 一种分布式麦克风智能家居系统
CN106782519A (zh) * 2016-12-23 2017-05-31 深圳先进技术研究院 一种机器人
CN106910500B (zh) * 2016-12-23 2020-04-17 北京小鸟听听科技有限公司 对带麦克风阵列的设备进行语音控制的方法及设备
CN106910500A (zh) * 2016-12-23 2017-06-30 北京第九实验室科技有限公司 对带麦克风阵列的设备进行语音控制的方法及设备
CN106507244A (zh) * 2016-12-23 2017-03-15 深圳先进技术研究院 一种中控系统
US10453457B2 (en) 2016-12-23 2019-10-22 Beijing Xiaoniao Tingting Technology, Co., Ltd. Method for performing voice control on device with microphone array, and device thereof
CN106863320B (zh) * 2017-01-18 2019-12-24 北京光年无限科技有限公司 一种用于智能机器人的语音交互数据获取方法及装置
CN106863320A (zh) * 2017-01-18 2017-06-20 北京光年无限科技有限公司 一种用于智能机器人的语音交互数据获取方法及装置
CN106789484A (zh) * 2017-02-17 2017-05-31 张德明 一种基于网络的分布式麦克风智能家居系统
CN106997763A (zh) * 2017-03-17 2017-08-01 浙江大学 一种基于语音信号频域处理的空调控制装置
TWI665656B (zh) * 2017-03-31 2019-07-11 香港商阿里巴巴集團服務有限公司 語音的功能控制方法和裝置
US10991371B2 (en) 2017-03-31 2021-04-27 Advanced New Technologies Co., Ltd. Voice function control method and apparatus
US10643615B2 (en) 2017-03-31 2020-05-05 Alibaba Group Holding Limited Voice function control method and apparatus
CN110537101B (zh) * 2017-04-14 2023-12-05 昕诺飞控股有限公司 用于确定物体位置的定位系统
CN110537101A (zh) * 2017-04-14 2019-12-03 昕诺飞控股有限公司 用于确定物体位置的定位系统
CN107346661B (zh) * 2017-06-01 2020-06-12 伊沃人工智能技术(江苏)有限公司 一种基于麦克风阵列的远距离虹膜跟踪与采集方法
CN107346661A (zh) * 2017-06-01 2017-11-14 李昕 一种基于麦克风阵列的远距离虹膜跟踪与采集方法
CN108447479B (zh) * 2018-02-02 2020-11-24 上海大学 嘈杂工况环境的机器人语音控制系统
CN108091327A (zh) * 2018-02-22 2018-05-29 成都启英泰伦科技有限公司 一种智能语音设备控制方法
CN108133704A (zh) * 2018-02-22 2018-06-08 成都启英泰伦科技有限公司 一种声源锁定系统
CN108172220A (zh) * 2018-02-22 2018-06-15 成都启英泰伦科技有限公司 一种新型语音除噪方法
CN108364642A (zh) * 2018-02-22 2018-08-03 成都启英泰伦科技有限公司 一种声源锁定方法
CN108538297A (zh) * 2018-03-12 2018-09-14 恒玄科技(上海)有限公司 一种基于无线麦克风阵列的智能语音交互方法及交互系统
CN108538297B (zh) * 2018-03-12 2020-12-04 恒玄科技(上海)股份有限公司 一种基于无线麦克风阵列的智能语音交互方法及交互系统
TWI672690B (zh) * 2018-03-21 2019-09-21 塞席爾商元鼎音訊股份有限公司 人工智慧語音互動之方法、電腦程式產品及其近端電子裝置
WO2020151133A1 (zh) * 2019-01-25 2020-07-30 深圳大学 一种分布式麦克风阵列拾音系统及方法
CN109788382A (zh) * 2019-01-25 2019-05-21 深圳大学 一种分布式麦克风阵列拾音系统及方法
CN109920433A (zh) * 2019-03-19 2019-06-21 上海华镇电子科技有限公司 嘈杂环境下电子设备的语音唤醒方法
CN109920433B (zh) * 2019-03-19 2021-08-20 上海华镇电子科技有限公司 嘈杂环境下电子设备的语音唤醒方法
CN110534109A (zh) * 2019-09-25 2019-12-03 深圳追一科技有限公司 语音识别方法、装置、电子设备及存储介质
CN113208381A (zh) * 2021-01-21 2021-08-06 深圳市芯中芯科技有限公司 一种基于语音控制的ai智能保温杯

Similar Documents

Publication Publication Date Title
CN204390737U (zh) 一种家庭语音处理系统
US11830479B2 (en) Voice recognition method and apparatus, and air conditioner
CN108681440A (zh) 一种智能设备音量控制方法及系统
CN109308908B (zh) 一种语音交互方法及装置
CN108597507A (zh) 远场语音功能实现方法、设备、系统及存储介质
CN105182763A (zh) 一种基于语音识别的智能遥控器及实现方法
WO2020048431A1 (zh) 一种语音处理方法、电子设备和显示设备
US20190297415A1 (en) Method and device for switching play modes of wireless speaker, and wireless speaker
WO2020244257A1 (zh) 语音唤醒方法、系统、电子设备及计算机可读存储介质
CN104064185B (zh) 信息处理方法及系统、电子设备
CN107464565A (zh) 一种远场语音唤醒方法及设备
CN106782591A (zh) 一种在背景噪音下提高语音识别率的装置及其方法
CN106782519A (zh) 一种机器人
CN105096946A (zh) 基于语音激活检测的唤醒装置及方法
CN205943457U (zh) 一种声控扫地机
CN103956164A (zh) 一种声音唤醒方法及系统
CN106507244A (zh) 一种中控系统
CN109493877A (zh) 一种助听装置的语音增强方法和装置
CN103529726A (zh) 一种具有语音识别功能的智能开关
CN108447483A (zh) 语音识别系统
WO2022233308A1 (zh) 佩戴检测方法、可穿戴设备及存储介质
CN209606794U (zh) 一种可穿戴设备、音箱设备和智能家居控制系统
CN203465925U (zh) 一种可智能调整音量的信息发布物联网终端
CN206181355U (zh) 一种语音降噪系统
CN111128164B (zh) 一种语音采集和识别的控制系统及其实现方法

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant