CN107845388B - 语音识别方法及装置 - Google Patents

语音识别方法及装置 Download PDF

Info

Publication number
CN107845388B
CN107845388B CN201711419212.3A CN201711419212A CN107845388B CN 107845388 B CN107845388 B CN 107845388B CN 201711419212 A CN201711419212 A CN 201711419212A CN 107845388 B CN107845388 B CN 107845388B
Authority
CN
China
Prior art keywords
voice signal
mic
voice
acquired
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711419212.3A
Other languages
English (en)
Other versions
CN107845388A (zh
Inventor
仇迁
王海盈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Mobile Communications Technology Co Ltd
Original Assignee
Hisense Mobile Communications Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Mobile Communications Technology Co Ltd filed Critical Hisense Mobile Communications Technology Co Ltd
Priority to CN201711419212.3A priority Critical patent/CN107845388B/zh
Publication of CN107845388A publication Critical patent/CN107845388A/zh
Application granted granted Critical
Publication of CN107845388B publication Critical patent/CN107845388B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本发明实施例提供一种语音识别方法及装置,应用于包括控制设备和被控设备的控制系统,控制设备上设置有第一麦克风MIC,被控设备上设置有至少一个第二MIC,该方法包括:接收控制设备发送的、第一MIC采集得到的第一语音信号;接收第二MIC采集得到的第二语音信号;确定第一语音信号和第二语音信号之间的时延;根据时延,对第一语音信号和第二语音信号进行语音处理得到控制指令,控制指令用于对被控设备进行控制。用于提高语音识别效果。

Description

语音识别方法及装置
技术领域
本发明实施例涉及语音识别技术领域,尤其涉及一种语音识别方法及装置。
背景技术
目前,随着智能语音技术的发展,越来越多的智能家居设备可以通过语音控制,例如,智能家居设备可以为电视、空调等。
在现有技术中,通常采用控制设备(例如遥控器)在对智能家居设备进行语音控制。具体的,在遥控器上设置两个麦克风(Microphone,简称MIC),通过两个MIC采集用户的语音信号,并通过信号相关度相减的降噪算法对两个MIC采集得到的语音信号进行降噪处理,得到降噪处理后的语音信号,并对降噪处理后的语音信号进行语音识别,得到对应的控制指令,并根据控制指令对智能家居设备进行控制。其中,当两个MIC采集得到的语音信号的幅值差异大于预设阈值时,通过信号相关度相减的降噪算法可以对语音信号进行良好的降噪处理。
然而,在现有技术中,由于控制设备的尺寸通常较小,使得设置在控制设备设备上的两个MIC之间的距离有限,使得两个MIC采集得到语音信号的幅值差异较小,导致根据信号相关度相减的降噪算法无法对两个MIC采集得到语音信号进行良好的降噪,导致语音识别效果差。
发明内容
本发明实施例提供一种语音识别方法及装置,提高了语音识别效果。
第一方面,本发明实施例提供一种语音识别方法,应用于包括控制设备和被控设备的控制系统,所述控制设备上设置有第一麦克风MIC,所述被控设备上设置有至少一个第二MIC,所述方法包括:
接收所述控制设备发送的、所述第一MIC采集得到的第一语音信号;
接收所述第二MIC采集得到的第二语音信号;
确定所述第一语音信号和所述第二语音信号之间的时延;
根据所述时延,对所述第一语音信号和所述第二语音信号进行语音处理得到控制指令,所述控制指令用于对所述被控设备进行控制。
在一种可能的实施方式中,接收所述控制设备发送的、所述第一MIC采集得到的第一语音信号,包括:
接收所述控制设备通过蓝牙发送的、所述第一MIC采集得到的第一语音信号;或者,
接收所述控制设备通过无线网络发送的、所述第一MIC采集得到的第一语音信号。
在另一种可能的实施方式中,确定所述第一语音信号和所述第二语音信号之间的时延,包括:
获取接收到所述第一MIC采集的同步语音信号的第一时刻,所述同步语音信号为所述被控设备发送的;
获取接收到所述第二MIC采集的所述同步语音信号的第二时刻;
根据所述第一时刻和所述第二时刻,确定所述第一语音信号和所述第二语音信号之间的时延。
在另一种可能的实施方式中,所述同步语音信号的频率大于人耳可识别的最高频率,所述同步语音信号的频率在所述第一MIC和所述第二MIC的采集频率范围内。
在另一种可能的实施方式中,根据所述时延,对所述第一语音信号和所述第二语音信号进行语音处理得到控制指令,包括:
根据所述时延,对所述第二语音信号进行延时处理,得到第三语音信号;
对所述第一语音信号和所述第三语音信号进行降噪处理,得到第四语音信号;
对所述第四语音信号进行语音识别,得到所述控制指令。
第二方面,本发明实施例提供一种语音识别装置,应用于包括控制设备和被控设备的控制系统,所述控制设备上设置有第一麦克风MIC,所述被控设备上设置有至少一个第二MIC,所述装置包括接收模块、确定模块和语音处理模块,其中,
所述接收模块用于,接收所述控制设备发送的、所述第一MIC采集得到的第一语音信号;
所述接收模块还用于,接收所述第二MIC采集得到的第二语音信号;
所述确定模块用于,确定所述第一语音信号和所述第二语音信号之间的时延;
所述语音处理模块用于,根据所述时延,对所述第一语音信号和所述第二语音信号进行语音处理得到控制指令,所述控制指令用于对所述被控设备进行控制。
在一种可能的实施方式中,所述接收模块具体用于:
接收所述控制设备通过蓝牙发送的、所述第一MIC采集得到的第一语音信号;或者,
接收所述控制设备通过无线网络发送的、所述第一MIC采集得到的第一语音信号。
在另一种可能的实施方式中,所述确定模块具体用于:
获取接收到所述第一MIC采集的同步语音信号的第一时刻,所述同步语音信号为所述被控设备发送的;
获取接收到所述第二MIC采集的所述同步语音信号的第二时刻;
根据所述第一时刻和所述第二时刻,确定所述第一语音信号和所述第二语音信号之间的时延。
在另一种可能的实施方式中,所述同步语音信号的频率大于人耳可识别的最高频率,所述同步语音信号的频率在所述第一MIC和所述第二MIC的采集频率范围内。
在另一种可能的实施方式中,所述语音处理模块具体用于:
根据所述时延,对所述第二语音信号进行延时处理,得到第三语音信号;
对所述第一语音信号和所述第三语音信号进行降噪处理,得到第四语音信号;
对所述第四语音信号进行语音识别,得到所述控制指令。
本发明实施例提供的语音识别方法及装置,第一MIC设置在控制设备上,至少一个第二MIC设置在被控设备上,在语音识别装置获取得到第一MIC采集得到的第一语音信号和第二MIC采集得到的第二语音信号之后,先获取第一语音信号和第二语音信号之后的时延,根据时延,对第一语音信号和第二语音信号进行语音处理得到控制指令。在上述过程中,在根据时延对第一语音信号和第二语音信号进行处理之后,可以使得处理后的语音信号同步,进一步,由于控制设备和被控设备的距离通常较远,使得第一MIC和第二MIC之间的距离也较远,这样,第一MIC和第二MIC采集得到语音信号的幅值差异较大,使得根据信号相关度相减的降噪算法可以对第一MIC和第二MIC采集得到语音信号进行良好的降噪处理,进而提高语音识别效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的语音识别方法的系统架构图;
图2为本发明实施例提供的语音识别方法的流程示意图;
图3为本发明实施例提供的获取时延方法的流程示意图;
图4为本发明实施例提供的同步语音信号的波形图;
图5为本发明实施例提供的语音识别装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的语音识别方法的系统架构图。请参见图1,包括控制设备101和被控设备102。可选的,控制设备101可以为遥控器等设备,被控设备102可以为电视、空调、冰箱等设备。其中,控制设备101中设置有第一MIC 101-1和传输模块101-2,第一MIC 101-1可以采集语音信号,以使控制设备101可以通过传输模块将第一MIC 101-1采集得到语音信号传输至被控设备102中的语音处理装置102-2。被控设备102中设置有至少一个第二MIC 102-1和语音处理装置102-2,第二MIC 102-1可以采集语音信号,并将采集得到的语音信号发送给语音处理装置102-2,语音处理装置102-2可以对接收到的、第一MIC101-1和第二MIC102-1采集的语音信号进行处理,以得到语音信号对应的控制指令,控制指令用于对被控设备进行控制。
第一MIC设置在控制设备上,至少一个第二MIC设置在被控设备上,在语音识别装置获取得到第一MIC采集得到的第一语音信号和第二MIC采集得到的第二语音信号之后,先获取第一语音信号和第二语音信号之间的时延,并根据时延,对第一语音信号和第二语音信号进行语音处理得到控制指令。在上述过程中,在根据时延对第一语音信号和第二语音信号进行处理之后,可以使得处理后的语音信号同步,进一步,由于控制设备和被控设备的距离通常较远,使得第一MIC和第二MIC之间的距离也较远,这样,第一MIC和第二MIC采集得到语音信号的幅值差异较大,使得根据信号相关度相减的降噪算法可以对第一MIC和第二MIC采集得到语音信号进行良好的降噪处理,进而提高语音识别效果。
下面,通过具体实施例,对本申请所示的技术方案进行详细说明。需要说明的是,下面几个具体实施例可以相互结合,对于相同或相似的内容,在不同的实施例不再进行重复说明。
图2为本发明实施例提供的语音识别方法的流程示意图。请参见图2,该方法可以包括:
S201、接收控制设备发送的、第一MIC采集得到的第一语音信号。
本发明实施例的执行主体为语音识别装置,该语音识别装置可以设置在被控设备中。可选的,语音识别装置可以通过软件实现,或者,语音识别装置可以通过软件和硬件的结合实现。
本发明实施例所示的第一MIC设置在控制设备中。第一MIC可以实时进行语音信号采集,并将采集得到的第一语音信号传输给控制设备,以使控制设备将第一MIC采集得到的第一语音信号发送给语音识别装置。
在本发明实施例中,通过将语音识别装置设置在被控设备上,这样,可以节省控制设备的成本及耗电量。
可选的,控制设备可以周期性的向语音识别装置发送第一MIC采集得到的第一语音信号,例如,第一MIC每采集30秒的语音信号之后,控制设备将该30秒的语音信号发送给语音识别装置。
可选的,第一MIC和控制设备之间可以设置有传输接口,以使第一MIC可以通过传输接口将采集得到的第一语音信号传输给控制设备。
可选的,第一语音信号可以为对第一MIC采集得到的原始语音信号进行处理后的语音信号,例如,在第一MIC采集得到原始语音信号之后,可以由第一MIC或者控制设备对原始语音信号进行模数转换处理、编码处理等处理,以得到第一语音信号。
可选的,在控制设备和被控设备上设置有无线通信模块,这样,在控制设备接收到第一MIC采集的第一语音信号之后,可以通过控制设备上的通信模块将第一语音信号发送给被控设备,以使被控设备可以通过被控设备上的通信模块接收第一语音信号。例如,无线通信模块可以为蓝牙、WiFi等。
可选的,可以接收控制设备通过蓝牙发送的、第一MIC采集得到的第一语音信号;或者,接收控制设备通过无线网络发送的、第一MIC采集得到的第一语音信号。
S202、接收第二MIC采集得到的第二语音信号。
本发明实施例所示的第二MIC设置在被控设备中。第二MIC可以实时进行语音信号采集,并将第二语音信号发送给被控设备中的语音识别装置。
可选的,第二MIC可以周期性的向语音识别装置发送采集得到的第二语音信号,例如,第二MIC每采集30秒的语音信号之后,将该30秒的语音信号发送给语音识别装置。
可选的,第二MIC和被控设备中的语音识别模块之间可以设置有传输接口,以使第二MIC可以通过传输接口将采集得到的第二语音信号传输给语音识别模块。
可选的,第二语音信号可以为对第二MIC采集得到的原始语音信号进行处理后的语音信号,例如,在第二MIC采集得到原始语音信号之后,对原始语音信号进行模数转换处理、编码处理等处理,以得到第二语音信号。
S203、获取第一语音信号和第二语音信号之间的时延。
其中,本发明实施例所示的第一语音信号和第二语音信号为语音识别装置在相同时刻接收到第一MIC和第二MIC采集得到的信号。
可选的,在第一MIC采集得到第一语音信号之后,需要通过无线通信模块将第一语音信号传输给语音识别装置,而第二MIC采集得到第二语音信号之后,可以直接通过传输接口将第二语音信号传输给语音识别装置。通过无线通信模块传输语音信号所需的时长大于通过传输接口传输语音信号所需的时长,因此,第一语音信号和第二语音信号之间具有时延。即,第一语音信号和第二语音信号可能为不同的语音段对应的语音信号。
可选的,被控设备可以周期性的发射同步语音信号,在第一MIC接收到同步语音信号之后,将同步语音信号传输给控制设备,由控制设备通过无线通信模块将同步语音信号发送给语音识别装置。在第二MIC接收到同步语音信号之后,将同步语音信号传输给语音识别装置。由于存在时延,因此,语音识别装置会在不同的时刻接收到第一MIC和第二MIC发送的同步语音信号,语音识别装置可以根据接收到同步语音信号之间的时间差,确定时延。
需要说明的是,在图3所示的实施例中,对获取第一语音信号和第二语音信号之间的时延的方法进行详细说明,此处不再进行说明。
S204、根据时延,对第一语音信号和第二语音信号进行语音处理得到控制指令。
其中,控制指令用于对被控设备进行控制。
可选的,根据时延,对第二语音信号进行延时处理,得到第三语音信号,对第一语音信号和第三语音信号进行降噪处理,得到第四语音信号,对第四语音信号进行语音识别,得到控制指令。
在对第二语音信号进行延时处理之后,得到的第三语音信号和第一语音信号为同步的,即,第一语音信号和第三语音信号为相同语音段对应的语音信号。
可选的,可以通过信号相关度相减的降噪算法,对第一语音信号和第三语音信号进行降噪处理,得到第四语音信号。
需要说明的是,可以参见现有技术中的信号相关度相减的降噪算法,对第一语音信号和第三语音信号进行降噪处理,本发明实施例对此不作具体限定。
本发明实施例提供的语音识别方法,第一MIC设置在控制设备上,至少一个第二MIC设置在被控设备上,在语音识别装置获取得到第一MIC采集得到的第一语音信号和第二MIC采集得到的第二语音信号之后,先获取第一语音信号和第二语音信号之后的时延,根据时延,对第一语音信号和第二语音信号进行语音处理得到控制指令。在上述过程中,在根据时延对第一语音信号和第二语音信号进行处理之后,可以使得处理后的语音信号同步,进一步,由于控制设备和被控设备的距离通常较远,使得第一MIC和第二MIC之间的距离也较远,这样,第一MIC和第二MIC采集得到语音信号的幅值差异较大,使得根据信号相关度相减的降噪算法可以对第一MIC和第二MIC采集得到语音信号进行良好的降噪处理,进而提高语音识别效果。
在上述任意实施例的基础上,可选的,可以通过如下可行的实现方式获取第一语音信号和第二语音信号之间的时延(图2所示实施例中的S203),具体的,请参见图3所示的实施例。
图3为本发明实施例提供的获取时延方法的流程示意图。请参见图3,该方法可以包括:
S301、获取接收到第一MIC采集的同步语音信号的第一时刻。
需要说明的是,在S301之前,被控设备发送同步语音信号。在第一MIC采集得到同步语音信号之后,第一MIC将同步语音信号发送给控制设备,由控制设备将第一MIC采集得到的同步语音信号发送给语音识别装置。
其中,同步语音信号为被控设备发送的。可选的,被控设备可以周期性的发送同步语音信号,例如,该周期可以为20毫秒、1秒等,在实际应用过程中,可以根据实际需要设置该周期。
由于控制设备周期性的发送同步语音信号,本发明实施例中所示的同步语音信号的发送时刻与语音识别装置接收到第一语音信号的时刻之间的时间差小于预设阈值。即,本发明实施例所示的同步语音信号为被控设备最近一次发送的。
可选的,同步语音信号的频率大于人耳可识别的最高频率,且同步语音信号的频率在第一MIC和第二MIC的采集频率范围内,这样,第一MIC和第二MIC可以采集得到同步语音信号,而用户无法听到同步语音信号对应的声音。
可选的,同步语音信号的频率大于20Khz。例如,同步语音信号可以为24Khz的正弦信号。
S302、获取接收到第二MIC采集的同步语音信号的第二时刻。
在第二MIC采集得到同步语音信号之后,第二MIC将同步语音信号发送语音识别装置。
S303、根据第一时刻和第二时刻,确定第一语音信号和第二语音信号之间的时延。
可选的,可以将第一时刻和第二时刻之间的时间差确定为第一语音信号和第二语音信号之间的时延。
在图3所示的实施例中,在第一MIC和第二MIC接收到同步语音信号的同时,还接收到其它语音信号,因此,第一MIC和第二MIC向语音识别装置发送采集得到的同步语音信号的同时,还向语音识别装置发送采集得到的其他语音信号。即,语音识别装置接收到的语音信号为同步语音信号和其它语音信号的叠加,因此,语音识别装置需要从接收到的语音信号中提取同步语音信号。
可选的,语音识别装置可以通过高通滤波器对接收到的语音信号进行滤波,由于同步语音信号的频率大于人耳可识别的最高频率,因此,通过高通滤波器可以筛选得到同步语音信号。进一步的,可以获取筛选得到的同步语音信号的有效值,并根据有效值确定第一语音信号和第二语音信号之间的时延。
下面,结合图4,通过具体示例对获取第一语音信号和第二语音信号之间的时延的方法进行详细说明。
图4为本发明实施例提供的同步语音信号的波形图。请参见图4,包括框图401-403。
请参见框图401,语音识别装置接收到的第一MIC和第二MIC采集得到的语音信号,在每一个语音信号中包括语音同步信号和其它语音信号。
请参见框图402,语音识别装置通过高通滤波器对框图401中的语音信号进行滤波,得到框图402中的语音信号,框图402中的语音信号即为同步语音信号。
请参见框图403,语音识别装置提取框图402中的同步语音信号的有效值,并确定第一MIC采集得到的同步语音信号对应的有效值的时刻为t1,第二MIC采集得到的同步语音信号对应的有效值的时刻为t2,则可以确定时延为t2-t1。
在实际应用过程中,可选的,被控设备还可以按照不同的周期发送两个或多个同步语音信号,分别根据不同的同步语音信号确定得到多个时延。可以将根据不同的同步语音信号确定得到的时延的均值确定为最终的时延。其中,根据每一个同步语音信号确定时延的过程与图3实施例所示的过程相同,此处不再进行赘述。
图5为本发明实施例提供的语音识别装置的结构示意图。应用于包括控制设备和被控设备的控制系统,所述控制设备上设置有第一麦克风MIC,所述被控设备上设置有至少一个第二MIC。请参见图5,所述装置包括接收模块11、确定模块12和语音处理模块13,其中,
所述接收模块11用于,接收所述控制设备发送的、所述第一MIC采集得到的第一语音信号;
所述接收模块11还用于,接收所述第二MIC采集得到的第二语音信号;
所述确定模块12用于,确定所述第一语音信号和所述第二语音信号之间的时延;
所述语音处理模块13用于,根据所述时延,对所述第一语音信号和所述第二语音信号进行语音处理得到控制指令,所述控制指令用于对所述被控设备进行控制。
本发明实施例提供的语音识别装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
在一种可能的实施方式中,所述接收模块11具体用于:
接收所述控制设备通过蓝牙发送的、所述第一MIC采集得到的第一语音信号;或者,
接收所述控制设备通过无线网络发送的、所述第一MIC采集得到的第一语音信号。
在另一种可能的实施方式中,所述确定模块12具体用于:
获取接收到所述第一MIC采集的同步语音信号的第一时刻,所述同步语音信号为所述被控设备发送的;
获取接收到所述第二MIC采集的所述同步语音信号的第二时刻;
根据所述第一时刻和所述第二时刻,确定所述第一语音信号和所述第二语音信号之间的时延。
在另一种可能的实施方式中,所述同步语音信号的频率大于人耳可识别的最高频率,所述同步语音信号的频率在所述第一MIC和所述第二MIC的采集频率范围内。
在另一种可能的实施方式中,所述语音处理模块13具体用于:
根据所述时延,对所述第二语音信号进行延时处理,得到第三语音信号;
对所述第一语音信号和所述第三语音信号进行降噪处理,得到第四语音信号;
对所述第四语音信号进行语音识别,得到所述控制指令。
本发明实施例提供的语音识别装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明实施例的技术方案,而非对其限制;尽管参照前述各实施例对本发明实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例方案的范围。

Claims (8)

1.一种语音识别方法,其特征在于,应用于包括控制设备和被控设备的控制系统,所述控制设备上设置有第一麦克风MIC,所述被控设备上设置有至少一个第二MIC,所述方法包括:
接收所述控制设备发送的、所述第一MIC采集得到的第一语音信号,所述第一语音信号为对所述第一MIC采集得到的原始语音信号进行处理后的语音信号;
接收所述第二MIC采集得到的第二语音信号,所述第二语音信号为对所述第二MIC采集得到的原始语音信号进行处理后的语音信号;
获取接收到所述第一MIC采集的同步语音信号的第一时刻,所述同步语音信号为所述被控设备发送的;
获取接收到所述第二MIC采集的所述同步语音信号的第二时刻;
根据所述第一时刻和所述第二时刻,确定所述第一语音信号和所述第二语音信号之间的时延;
根据所述时延,对所述第一语音信号和所述第二语音信号进行语音处理得到控制指令,所述控制指令用于对所述被控设备进行控制。
2.根据权利要求1所述的方法,其特征在于,接收所述控制设备发送的、所述第一MIC采集得到的第一语音信号,包括:
接收所述控制设备通过蓝牙发送的、所述第一MIC采集得到的第一语音信号;或者,
接收所述控制设备通过无线网络发送的、所述第一MIC采集得到的第一语音信号。
3.根据权利要求2所述的方法,其特征在于,所述同步语音信号的频率大于人耳可识别的最高频率,所述同步语音信号的频率在所述第一MIC和所述第二MIC的采集频率范围内。
4.根据权利要求1或2所述的方法,其特征在于,根据所述时延,对所述第一语音信号和所述第二语音信号进行语音处理得到控制指令,包括:
根据所述时延,对所述第二语音信号进行延时处理,得到第三语音信号;
对所述第一语音信号和所述第三语音信号进行降噪处理,得到第四语音信号;
对所述第四语音信号进行语音识别,得到所述控制指令。
5.一种语音识别装置,其特征在于,应用于包括控制设备和被控设备的控制系统,所述控制设备上设置有第一麦克风MIC,所述被控设备上设置有至少一个第二MIC,所述装置包括接收模块、确定模块和语音处理模块,其中,
所述接收模块用于,接收所述控制设备发送的、所述第一MIC采集得到的第一语音信号,所述第一语音信号为对所述第一MIC采集得到的原始语音信号进行处理后的语音信号;
所述接收模块还用于,接收所述第二MIC采集得到的第二语音信号,所述第二语音信号为对所述第二MIC采集得到的原始语音信号进行处理后的语音信号;
所述确定模块用于,获取接收到所述第一MIC采集的同步语音信号的第一时刻,所述同步语音信号为所述被控设备发送的;获取接收到所述第二MIC采集的所述同步语音信号的第二时刻;根据所述第一时刻和所述第二时刻,确定所述第一语音信号和所述第二语音信号之间的时延;所述语音处理模块用于,根据所述时延,对所述第一语音信号和所述第二语音信号进行语音处理得到控制指令,所述控制指令用于对所述被控设备进行控制。
6.根据权利要求5所述的装置,其特征在于,所述接收模块具体用于:
接收所述控制设备通过蓝牙发送的、所述第一MIC采集得到的第一语音信号;或者,
接收所述控制设备通过无线网络发送的、所述第一MIC采集得到的第一语音信号。
7.根据权利要求6所述的装置,其特征在于,所述同步语音信号的频率大于人耳可识别的最高频率,所述同步语音信号的频率在所述第一MIC和所述第二MIC的采集频率范围内。
8.根据权利要求5或6所述的装置,其特征在于,所述语音处理模块具体用于:
根据所述时延,对所述第二语音信号进行延时处理,得到第三语音信号;
对所述第一语音信号和所述第三语音信号进行降噪处理,得到第四语音信号;
对所述第四语音信号进行语音识别,得到所述控制指令。
CN201711419212.3A 2017-12-25 2017-12-25 语音识别方法及装置 Active CN107845388B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711419212.3A CN107845388B (zh) 2017-12-25 2017-12-25 语音识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711419212.3A CN107845388B (zh) 2017-12-25 2017-12-25 语音识别方法及装置

Publications (2)

Publication Number Publication Date
CN107845388A CN107845388A (zh) 2018-03-27
CN107845388B true CN107845388B (zh) 2021-06-01

Family

ID=61684160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711419212.3A Active CN107845388B (zh) 2017-12-25 2017-12-25 语音识别方法及装置

Country Status (1)

Country Link
CN (1) CN107845388B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108600810A (zh) * 2018-05-03 2018-09-28 四川长虹电器股份有限公司 利用语音遥控器提高语音识别精度的电视系统及方法
CN109817209B (zh) * 2019-01-16 2020-09-25 深圳市友杰智新科技有限公司 一种基于双麦克风阵列的智能语音交互系统
CN109767766A (zh) * 2019-01-23 2019-05-17 海信集团有限公司 一种语音识别方法及装置
CN109920443A (zh) * 2019-03-22 2019-06-21 网易有道信息技术(北京)有限公司 一种语音处理机器

Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101740028A (zh) * 2009-11-20 2010-06-16 四川长虹电器股份有限公司 家电产品语音控制系统
CN102103200A (zh) * 2010-11-29 2011-06-22 清华大学 一种分布式非同步声传感器的声源空间定位方法
CN102347028A (zh) * 2011-07-14 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及方法
CN102543097A (zh) * 2012-01-16 2012-07-04 华为终端有限公司 降噪方法及设备
CN203457266U (zh) * 2013-08-15 2014-02-26 安徽科大讯飞信息科技股份有限公司 一种语音采集装置及带语音采集的电视系统
CN104469621A (zh) * 2014-12-09 2015-03-25 青岛歌尔声学科技有限公司 一种语音遥控器抗干扰电路及方法
CN104535965A (zh) * 2014-12-29 2015-04-22 江苏科技大学 基于嵌入式gpu系统的并行化声源定位系统及方法
CN105277921A (zh) * 2015-09-23 2016-01-27 浙江大学 一种基于智能手机的被动声源定位方法
CN105554303A (zh) * 2012-06-19 2016-05-04 青岛海信移动通信技术股份有限公司 一种双mic降噪方法及移动终端
CN205488852U (zh) * 2016-01-26 2016-08-17 深圳市领耀东方科技股份有限公司 插座以及智能家电控制系统
CN106373586A (zh) * 2015-07-24 2017-02-01 南宁富桂精密工业有限公司 噪声滤除电路
CN205983188U (zh) * 2016-08-29 2017-02-22 兰州工业学院 一种智能家居交互式语音控制系统
CN106547212A (zh) * 2015-09-16 2017-03-29 新唐科技股份有限公司 家电控制系统及其控制方法
CN106604181A (zh) * 2016-12-15 2017-04-26 北京塞宾科技有限公司 一种分布式麦克风智能家居系统
CN106710601A (zh) * 2016-11-23 2017-05-24 合肥华凌股份有限公司 一种语音信号降噪拾音处理方法和装置及冰箱
CN106782589A (zh) * 2016-12-12 2017-05-31 奇酷互联网络科技(深圳)有限公司 移动终端及其语音输入方法和装置
CN206210386U (zh) * 2016-12-02 2017-05-31 上海木爷机器人技术有限公司 音频信号处理系统
CN106847298A (zh) * 2017-02-24 2017-06-13 海信集团有限公司 一种基于弥漫式语音交互的拾音方法和装置
CN106908765A (zh) * 2017-02-27 2017-06-30 广东小天才科技有限公司 一种基于超声波信号的空间定位方法、系统及vr设备
CN106973470A (zh) * 2016-01-13 2017-07-21 深圳市轻生活科技有限公司 可语音延迟或定时开关的智能灯及其智能灯控系统
CN206490770U (zh) * 2016-11-30 2017-09-12 深圳市岚正科技有限公司 同时具有远场和近场语音识别的机顶盒及机顶盒系统
CN206515597U (zh) * 2017-01-03 2017-09-22 成都极联科技有限公司 智能投影仪及智能交互系统
CN107202385A (zh) * 2017-06-22 2017-09-26 广东美的制冷设备有限公司 声波驱蚊方法、装置及空调器
CN107290969A (zh) * 2016-03-30 2017-10-24 芋头科技(杭州)有限公司 一种分布式语音控制系统
CN107450390A (zh) * 2017-07-31 2017-12-08 绵阳美菱软件技术有限公司 一种智能家电控制装置、控制方法及控制系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6526325B1 (en) * 1999-10-15 2003-02-25 Creative Technology Ltd. Pitch-Preserved digital audio playback synchronized to asynchronous clock
JP4361347B2 (ja) * 2003-11-11 2009-11-11 株式会社リコー データ同期装置、データ同期方法、およびその方法をコンピュータに実行させるプログラム
CN101494817B (zh) * 2008-01-22 2013-03-20 华硕电脑股份有限公司 一种检测与调整音场效果的方法及其音响系统
US8938312B2 (en) * 2011-04-18 2015-01-20 Sonos, Inc. Smart line-in processing
CN204305260U (zh) * 2014-12-28 2015-04-29 冠捷显示科技(厦门)有限公司 一种视频与无线音箱音频匹配的电视机
US9613628B2 (en) * 2015-07-01 2017-04-04 Gopro, Inc. Audio decoder for wind and microphone noise reduction in a microphone array system
US9820039B2 (en) * 2016-02-22 2017-11-14 Sonos, Inc. Default playback devices
US10394518B2 (en) * 2016-03-10 2019-08-27 Mediatek Inc. Audio synchronization method and associated electronic device
CN106569774B (zh) * 2016-11-11 2020-07-10 青岛海信移动通信技术股份有限公司 一种去除噪声的方法及终端

Patent Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101740028A (zh) * 2009-11-20 2010-06-16 四川长虹电器股份有限公司 家电产品语音控制系统
CN102103200A (zh) * 2010-11-29 2011-06-22 清华大学 一种分布式非同步声传感器的声源空间定位方法
CN102347028A (zh) * 2011-07-14 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及方法
CN102543097A (zh) * 2012-01-16 2012-07-04 华为终端有限公司 降噪方法及设备
CN105554303A (zh) * 2012-06-19 2016-05-04 青岛海信移动通信技术股份有限公司 一种双mic降噪方法及移动终端
CN203457266U (zh) * 2013-08-15 2014-02-26 安徽科大讯飞信息科技股份有限公司 一种语音采集装置及带语音采集的电视系统
CN104469621A (zh) * 2014-12-09 2015-03-25 青岛歌尔声学科技有限公司 一种语音遥控器抗干扰电路及方法
CN104535965A (zh) * 2014-12-29 2015-04-22 江苏科技大学 基于嵌入式gpu系统的并行化声源定位系统及方法
CN106373586A (zh) * 2015-07-24 2017-02-01 南宁富桂精密工业有限公司 噪声滤除电路
CN106547212A (zh) * 2015-09-16 2017-03-29 新唐科技股份有限公司 家电控制系统及其控制方法
CN105277921A (zh) * 2015-09-23 2016-01-27 浙江大学 一种基于智能手机的被动声源定位方法
CN106973470A (zh) * 2016-01-13 2017-07-21 深圳市轻生活科技有限公司 可语音延迟或定时开关的智能灯及其智能灯控系统
CN205488852U (zh) * 2016-01-26 2016-08-17 深圳市领耀东方科技股份有限公司 插座以及智能家电控制系统
CN107290969A (zh) * 2016-03-30 2017-10-24 芋头科技(杭州)有限公司 一种分布式语音控制系统
CN205983188U (zh) * 2016-08-29 2017-02-22 兰州工业学院 一种智能家居交互式语音控制系统
CN106710601A (zh) * 2016-11-23 2017-05-24 合肥华凌股份有限公司 一种语音信号降噪拾音处理方法和装置及冰箱
CN206490770U (zh) * 2016-11-30 2017-09-12 深圳市岚正科技有限公司 同时具有远场和近场语音识别的机顶盒及机顶盒系统
CN206210386U (zh) * 2016-12-02 2017-05-31 上海木爷机器人技术有限公司 音频信号处理系统
CN106782589A (zh) * 2016-12-12 2017-05-31 奇酷互联网络科技(深圳)有限公司 移动终端及其语音输入方法和装置
CN106604181A (zh) * 2016-12-15 2017-04-26 北京塞宾科技有限公司 一种分布式麦克风智能家居系统
CN206515597U (zh) * 2017-01-03 2017-09-22 成都极联科技有限公司 智能投影仪及智能交互系统
CN106847298A (zh) * 2017-02-24 2017-06-13 海信集团有限公司 一种基于弥漫式语音交互的拾音方法和装置
CN106908765A (zh) * 2017-02-27 2017-06-30 广东小天才科技有限公司 一种基于超声波信号的空间定位方法、系统及vr设备
CN107202385A (zh) * 2017-06-22 2017-09-26 广东美的制冷设备有限公司 声波驱蚊方法、装置及空调器
CN107450390A (zh) * 2017-07-31 2017-12-08 绵阳美菱软件技术有限公司 一种智能家电控制装置、控制方法及控制系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于麦克风阵列的语音信号实时时延估计";王大中;《吉林大学学报》;20091231;第133-138页 *

Also Published As

Publication number Publication date
CN107845388A (zh) 2018-03-27

Similar Documents

Publication Publication Date Title
CN107845388B (zh) 语音识别方法及装置
CN106910500B (zh) 对带麦克风阵列的设备进行语音控制的方法及设备
EP2685700B1 (en) Synchronizing audio signal sampling in a wireless, digital audio conferencing system
CN107465970B (zh) 用于语音通信的设备
CN104216351A (zh) 家用电器语音控制方法及系统
WO2015176372A1 (zh) 智能终端通话降噪方法及智能终端
US9584907B2 (en) Transmission of a wind-reduced signal with reduced latency time
EP3163942A1 (en) Method, system, and related device for data transmission
CN204305260U (zh) 一种视频与无线音箱音频匹配的电视机
US11653156B2 (en) Source separation in hearing devices and related methods
CN104978955A (zh) 语音控制方法和系统
CN104581539A (zh) 移动终端音频播放的控制方法及其移动终端
JP2016144214A (ja) 両耳の補聴のための聴取装置およびその作動方法
CN107172527B (zh) 协同播放的音量调节方法、装置及协同播放装置
CN110992967A (zh) 一种语音信号处理方法、装置、助听器及存储介质
CN104205877B (zh) 用于操作听力设备的方法以及听力设备
CN106708461B (zh) 信息处理方法及电子设备
WO2016045233A1 (zh) 一种可采集声场信息的通信装置及通信方法
CN105244037A (zh) 语音信号处理方法及装置
CN105472190A (zh) 一种音频信号延时测试方法
CN109473096A (zh) 一种智能语音设备及其控制方法
CN104219402A (zh) 一种改善VoIP通信质量的系统
CN109872719A (zh) 一种分级式智能语音系统及其语音处理方法
KR20140006367A (ko) 분리 공간의 소음을 제거하는 스마트 tv, 소음 제거 장치 및 스마트 tv 시스템
CN110351690B (zh) 一种智能语音系统及其语音处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 266071 Shandong city of Qingdao province Jiangxi City Road No. 11

Patentee after: Qingdao Hisense Mobile Communication Technology Co.,Ltd.

Address before: 266071 Shandong city of Qingdao province Jiangxi City Road No. 11

Patentee before: HISENSE MOBILE COMMUNICATIONS TECHNOLOGY Co.,Ltd.

CP01 Change in the name or title of a patent holder