CN109448708A - 远场语音唤醒系统 - Google Patents

远场语音唤醒系统 Download PDF

Info

Publication number
CN109448708A
CN109448708A CN201811198363.5A CN201811198363A CN109448708A CN 109448708 A CN109448708 A CN 109448708A CN 201811198363 A CN201811198363 A CN 201811198363A CN 109448708 A CN109448708 A CN 109448708A
Authority
CN
China
Prior art keywords
module
wake
identification
processing
modules
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811198363.5A
Other languages
English (en)
Inventor
李超凡
黄为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN201811198363.5A priority Critical patent/CN109448708A/zh
Publication of CN109448708A publication Critical patent/CN109448708A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • G10L21/0202
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本发明提出一种远场语音唤醒系统,属于智能设备的语音唤醒领域。本发明解决了目前在不同的噪声环境下,智能设备的唤醒识别易受干扰、识别不准的问题,其技术方案要点为:包括麦克风模块、语音处理模块及唤醒引擎模块,语音处理模块包括多个并行的处理模块,多个并行的处理模块分别通过使用不同的算法对语音识别信息进行处理,并将处理结果均传输至唤醒引擎模块;唤醒语音模块包括与多个并行的处理模块相对应多个唤醒识别模块,多个唤醒识别模块用于接收到所述处理结果后,分别通过每个唤醒识别模块对相应的处理结果进行语音唤醒命令的识别处理,若存在至少一个处理结果被识别成功,则表示能够通过识别的语音识别信息唤醒该系统所在的智能装置。

Description

远场语音唤醒系统
技术领域
本发明涉及语音处理技术,特别涉及远场语音唤醒系统的技术。
背景技术
随着科技的发展,智能设备的应用越来越广泛,在智能设备上使用语音唤醒技术的应用也越来越普遍。随着用户对语音唤醒体验的要求越来越高,用户不再只满足与近场语音的唤醒体验,也开始追求远场语音的唤醒体验。
相对于近场语音的唤醒,远场语音的唤醒碰到的困难更多,比如环境噪声,混响,其他人的话语干扰等等都会影响智能设备对用户唤醒命令的识别,导致智能设备唤醒率的降低。现在有很多算法能够对远场语音数据进行处理,比如波束形成算法,去混响算法,降噪算法,回声消除算法等等,但这些算法在对这些干扰进行去除的同时,对用户的语音也带来了损伤。在不同的噪声环境下,这些算法的输出,对智能设备的唤醒识别带来的影响是不确定的。
发明内容
本发明的目的是提供一种远场语音唤醒系统,解决目前在不同的噪声环境下,智能设备的唤醒识别易受干扰、识别不准的问题。
本发明解决其技术问题,采用的技术方案是:远场语音唤醒系统,包括麦克风模块,还包括语音处理模块及唤醒引擎模块,所述麦克风模块通过语音处理模块与唤醒引擎模块连接;
所述麦克风模块用于识别语音数据信息,并将识别的语音识别信息传输至语音处理模块;
所述语音处理模块包括多个并行的处理模块,所述多个并行的处理模块分别通过使用不同的算法对麦克风模块传输来的语音识别信息进行处理,并将处理结果均传输至唤醒引擎模块;
所述唤醒引擎模块包括与多个并行的处理模块相对应多个唤醒识别模块,所述多个唤醒识别模块用于接收到所述处理结果后,分别通过每个唤醒识别模块对相应的处理结果进行语音唤醒命令的识别处理,若存在至少一个处理结果被识别成功,则表示能够通过识别的语音识别信息唤醒该系统所在的智能装置。
具体地,所述麦克风模块包括多个麦克风芯片,多个麦克风芯片呈线性阵列设置。
进一步地,所述麦克风芯片的个数为4个,相邻麦克风芯片之间的间距为3.5厘米。
具体地,所述多个处理模块包括不作处理模块、进行回声消除算法模块、进行波束形成算法模块、进行去混响算法模块及进行降噪算法模块。
再进一步地,该远场语音唤醒系统还包括LED提示模块,所述LED提示模块与唤醒引擎模块连接,当处理结果识别成功后,通过LED提示模块对用户进行提醒。
本发明的有益效果是,通过上述远场语音唤醒系统,首先,通过麦克风模块用于识别语音数据信息,并将识别的语音识别信息传输至语音处理模块;其次,语音处理模块包括多个并行的处理模块,多个并行的处理模块分别通过使用不同的算法对麦克风模块传输来的语音识别信息进行处理,并将处理结果均传输至唤醒引擎模块;然后,唤醒语音模块包括与多个并行的处理模块相对应多个唤醒识别模块,所述多个唤醒识别模块用于接收到所述处理结果后,分别通过每个唤醒识别模块对相应的处理结果进行语音唤醒命令的识别处理,若存在至少一个处理结果被识别成功,则表示能够通过识别的语音识别信息唤醒该系统所在的智能装置。每个唤醒识别流程,使用多线程的技术,每个流程使用一个线程,互不影响。每个处理流程,获取不同的语音数据,即不同的算法处理流程输出的语音数据。
针对现实生活中的多种噪声环境,使用多个不同算法处理后的多路数据,进行综合的唤醒识别,能够得到最高的唤醒率。如此,提高了智能设备的唤醒率,提高了智能设备唤醒系统的稳定性,进而提升了用户体验。
附图说明
图1为本发明远场语音唤醒系统的结构框图。
具体实施方式
下面结合实施例及附图,详细描述本发明的技术方案。
本发明所述远场语音唤醒系统,包括麦克风模块,还包括语音处理模块及唤醒引擎模块,麦克风模块通过语音处理模块与唤醒引擎模块连接,其结构框图参见图1,其中:
麦克风模块用于识别语音数据信息,并将识别的语音识别信息传输至语音处理模块;
语音处理模块包括多个并行的处理模块,多个并行的处理模块分别通过使用不同的算法对麦克风模块传输来的语音识别信息进行处理,并将处理结果均传输至唤醒引擎模块;
唤醒引擎模块包括与多个并行的处理模块相对应多个唤醒识别模块,多个唤醒识别模块用于接收到处理结果后,分别通过每个唤醒识别模块对相应的处理结果进行语音唤醒命令的识别处理,若存在至少一个处理结果被识别成功,则表示能够通过识别的语音识别信息唤醒该系统所在的智能装置。
这里,在智能设备上,麦克风录取到的数据,输入给语音处理模块,得到多路的输出。这多路的输出,作为唤醒引擎模块的输入,唤醒引擎模块识别为唤醒成功,就对智能设备进行唤醒操作。
上述系统中,为了能识别到更精准的语音数据信息,麦克风模块包括多个麦克风芯片,多个麦克风芯片呈线性阵列设置,并且,麦克风芯片的个数为4个,相邻麦克风芯片之间的间距为3.5厘米。
多个处理模块包括不作处理模块、进行回声消除算法模块、进行波束形成算法模块、进行去混响算法模块及进行降噪算法模块。
为了避免在不能唤醒智能装置时,影响用户体验,该远场语音唤醒系统还包括LED提示模块,其中,LED提示模块与唤醒引擎模块连接,当处理结果识别成功后,通过LED提示模块对用户进行提醒。
实施例
本发明实施例所提出的远场语音唤醒系统,应用的操作系统为:Android 8.0,麦克风模块为:麦克风芯片的个数优选为4个,相邻麦克风芯片之间的间距为3.5厘米,芯片平台为:MST848。
处理模块分别进行按以下算法进行处理:不作处理、进行回声消除算法处理、进行波束形成算法处理、进行去混响算法处理及进行降噪算法处理。
本实施例采用4个呈线性阵列设置的麦克风芯片作为声音采集模块,采集到的4路语音数据送入语音处理模块,语音处理模块包含并行的四路处理流程,分别是:不作处理、进行回声消除算法处理、进行波束形成算法处理、进行去混响算法处理。四路处理后的语音数据送入唤醒引擎模块,唤醒引擎模块包含并行的四路唤醒识别流程,任何一路唤醒识别成功,就对智能设备进行唤醒操作。
为了避免在不能唤醒智能装置时,影响用户体验,该远场语音唤醒系统还包括LED提示模块,其中,LED提示模块与唤醒引擎模块连接,当处理结果识别成功后,通过LED提示模块对用户进行提醒。

Claims (5)

1.远场语音唤醒系统,包括麦克风模块,其特征在于,还包括语音处理模块及唤醒引擎模块,所述麦克风模块通过语音处理模块与唤醒引擎模块连接;
所述麦克风模块用于识别语音数据信息,并将识别的语音识别信息传输至语音处理模块;
所述语音处理模块包括多个并行的处理模块,所述多个并行的处理模块分别通过使用不同的算法对麦克风模块传输来的语音识别信息进行处理,并将处理结果均传输至唤醒引擎模块;
所述唤醒引擎模块包括与多个并行的处理模块相对应多个唤醒识别模块,所述多个唤醒识别模块用于接收到所述处理结果后,分别通过每个唤醒识别模块对相应的处理结果进行语音唤醒命令的识别处理,若存在至少一个处理结果被识别成功,则表示能够通过识别的语音识别信息唤醒该系统所在的智能装置。
2.根据权利要求1所述的远场语音唤醒系统,其特征在于,所述麦克风模块包括多个麦克风芯片,多个麦克风芯片呈线性阵列设置。
3.根据权利要求1所述的远场语音唤醒系统,其特征在于,所述麦克风芯片的个数为4个,相邻麦克风芯片之间的间距为3.5厘米。
4.根据权利要求1所述的远场语音唤醒系统,其特征在于,所述多个处理模块包括不作处理模块、进行回声消除算法模块、进行波束形成算法模块、进行去混响算法模块及进行降噪算法模块。
5.根据权利要求1-4任意一项所述的远场语音唤醒系统,其特征在于,还包括LED提示模块,所述LED提示模块与唤醒引擎模块连接,当处理结果识别成功后,通过LED提示模块对用户进行提醒。
CN201811198363.5A 2018-10-15 2018-10-15 远场语音唤醒系统 Pending CN109448708A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811198363.5A CN109448708A (zh) 2018-10-15 2018-10-15 远场语音唤醒系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811198363.5A CN109448708A (zh) 2018-10-15 2018-10-15 远场语音唤醒系统

Publications (1)

Publication Number Publication Date
CN109448708A true CN109448708A (zh) 2019-03-08

Family

ID=65545184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811198363.5A Pending CN109448708A (zh) 2018-10-15 2018-10-15 远场语音唤醒系统

Country Status (1)

Country Link
CN (1) CN109448708A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110021297A (zh) * 2019-04-13 2019-07-16 上海影隆光电有限公司 一种基于音视频识别的智能显示方法及其装置
CN111145751A (zh) * 2019-12-31 2020-05-12 百度在线网络技术(北京)有限公司 音频信号处理方法、装置以及电子设备
CN111179931A (zh) * 2020-01-03 2020-05-19 青岛海尔科技有限公司 用于语音交互的方法、装置及家用电器
WO2020192721A1 (zh) * 2019-03-28 2020-10-01 华为技术有限公司 一种语音唤醒方法、装置、设备及介质
CN111883162A (zh) * 2020-07-24 2020-11-03 杨汉丹 唤醒方法、装置和计算机设备
CN112071323A (zh) * 2020-09-18 2020-12-11 北京百度网讯科技有限公司 误唤醒样本数据的获取方法、装置和电子设备
CN112233681A (zh) * 2020-10-10 2021-01-15 北京百度网讯科技有限公司 一种误唤醒语料确定方法、装置、电子设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170323642A1 (en) * 2013-10-11 2017-11-09 Apple Inc. Speech Recognition Wake-Up of a Handheld Portable Electronic Device
CN107591151A (zh) * 2017-08-22 2018-01-16 百度在线网络技术(北京)有限公司 远场语音唤醒方法、装置和终端设备
CN107731231A (zh) * 2017-09-15 2018-02-23 福州瑞芯微电子股份有限公司 一种支持多云端语音服务的方法及一种存储设备
CN108447494A (zh) * 2018-01-31 2018-08-24 广东聚晨知识产权代理有限公司 一种语音通信智能处理方法
CN108538293A (zh) * 2018-04-27 2018-09-14 青岛海信电器股份有限公司 语音唤醒方法、装置及智能设备
CN108597507A (zh) * 2018-03-14 2018-09-28 百度在线网络技术(北京)有限公司 远场语音功能实现方法、设备、系统及存储介质
CN109949810A (zh) * 2019-03-28 2019-06-28 华为技术有限公司 一种语音唤醒方法、装置、设备及介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170323642A1 (en) * 2013-10-11 2017-11-09 Apple Inc. Speech Recognition Wake-Up of a Handheld Portable Electronic Device
CN107591151A (zh) * 2017-08-22 2018-01-16 百度在线网络技术(北京)有限公司 远场语音唤醒方法、装置和终端设备
CN107731231A (zh) * 2017-09-15 2018-02-23 福州瑞芯微电子股份有限公司 一种支持多云端语音服务的方法及一种存储设备
CN108447494A (zh) * 2018-01-31 2018-08-24 广东聚晨知识产权代理有限公司 一种语音通信智能处理方法
CN108597507A (zh) * 2018-03-14 2018-09-28 百度在线网络技术(北京)有限公司 远场语音功能实现方法、设备、系统及存储介质
CN108538293A (zh) * 2018-04-27 2018-09-14 青岛海信电器股份有限公司 语音唤醒方法、装置及智能设备
CN109949810A (zh) * 2019-03-28 2019-06-28 华为技术有限公司 一种语音唤醒方法、装置、设备及介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020192721A1 (zh) * 2019-03-28 2020-10-01 华为技术有限公司 一种语音唤醒方法、装置、设备及介质
CN110021297A (zh) * 2019-04-13 2019-07-16 上海影隆光电有限公司 一种基于音视频识别的智能显示方法及其装置
CN111145751A (zh) * 2019-12-31 2020-05-12 百度在线网络技术(北京)有限公司 音频信号处理方法、装置以及电子设备
CN111179931A (zh) * 2020-01-03 2020-05-19 青岛海尔科技有限公司 用于语音交互的方法、装置及家用电器
CN111179931B (zh) * 2020-01-03 2023-07-21 青岛海尔科技有限公司 用于语音交互的方法、装置及家用电器
CN111883162A (zh) * 2020-07-24 2020-11-03 杨汉丹 唤醒方法、装置和计算机设备
CN112071323A (zh) * 2020-09-18 2020-12-11 北京百度网讯科技有限公司 误唤醒样本数据的获取方法、装置和电子设备
CN112071323B (zh) * 2020-09-18 2023-03-21 阿波罗智联(北京)科技有限公司 误唤醒样本数据的获取方法、装置和电子设备
CN112233681A (zh) * 2020-10-10 2021-01-15 北京百度网讯科技有限公司 一种误唤醒语料确定方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN109448708A (zh) 远场语音唤醒系统
CN106782585B (zh) 一种基于麦克风阵列的拾音方法及系统
CN106910500B (zh) 对带麦克风阵列的设备进行语音控制的方法及设备
CN105009204B (zh) 语音识别功率管理
JP2019191554A (ja) 音声認識方法、装置、デバイス及びコンピュータ可読記憶媒体
EP3185521B1 (en) Voice wake-up method and device
CN108665895B (zh) 用于处理信息的方法、装置和系统
CN107564518A (zh) 智能设备控制方法、装置及计算机设备
EP4191579A1 (en) Electronic device and speech recognition method therefor, and medium
CN109272991B (zh) 语音交互的方法、装置、设备和计算机可读存储介质
US10477294B1 (en) Multi-device audio capture
CN107388487A (zh) 控制空调的方法和装置
CN109036393A (zh) 家电设备的唤醒词训练方法、装置及家电设备
CN106548783A (zh) 语音增强方法、装置及智能音箱、智能电视
CN109192219B (zh) 基于关键词改进麦克风阵列远场拾音的方法
CN204929164U (zh) 具有方向性的声音传感器
US20180158462A1 (en) Speaker identification
CN106155621A (zh) 可识别声源位置的关键词语音唤醒系统及方法及移动终端
CN108665907A (zh) 声音识别装置、声音识别方法、记录介质以及机器人
CN113096677B (zh) 一种智能降噪的方法及相关设备
CN113259793A (zh) 智能麦克风及其信号处理方法
CN110517682A (zh) 语音识别方法、装置、设备及存储介质
CN109920433A (zh) 嘈杂环境下电子设备的语音唤醒方法
CN101299333A (zh) 嵌入式语音识别系统及其内核技术
US10827258B2 (en) Robot and audio data processing method thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190308