CN109671444A - 一种语音处理方法及装置 - Google Patents
一种语音处理方法及装置 Download PDFInfo
- Publication number
- CN109671444A CN109671444A CN201710958997.5A CN201710958997A CN109671444A CN 109671444 A CN109671444 A CN 109671444A CN 201710958997 A CN201710958997 A CN 201710958997A CN 109671444 A CN109671444 A CN 109671444A
- Authority
- CN
- China
- Prior art keywords
- voice signal
- mike
- earphone
- signal
- amplitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 119
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000013475 authorization Methods 0.000 claims description 21
- 230000005540 biological transmission Effects 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 claims description 7
- 230000009514 concussion Effects 0.000 claims 1
- 230000005611 electricity Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
- Headphones And Earphones (AREA)
Abstract
本发明实施例公开了一种语音处理方法,包括:所述方法应用于语音识别系统,所述语音识别系统包括耳机,所述耳机包括多个麦克,所述多个麦克包括位于语音接收位置的第一麦克以及位于其他位置的至少一个第二麦克,其中:通过所述第一麦克和所述第二麦克获取声音信号;根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型;根据所述声音信号的类型,对所述声音信号进行处理。采用本发明实施例,可以提供语音识别的准确度。
Description
技术领域
本发明涉及电子技术领域,尤其涉及一种语音处理方法及装置。
背景技术
语音识别技术,也被称为自动语音识别(Automatic Speech Recognition,ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。
语音识别也可以应用于耳机,通过耳机获取用户的语音信号,然后将语音信号发出给后台服务器,后台服务器识别用户的语音信号后发出控制指令,对耳机进行控制操作(如,切换歌曲、控制音量)。但是,通常耳机获取到声音信号也存在噪声,如果将噪声发送给后台服务器进行语音识别,会降低语音识别的准确度。
发明内容
本发明实施例提供一种语音处理方法及装置。可以解决语音识别准确度低的问题。
一方面,本发明实施例提供了一种语音处理方法,所述方法应用于语音识别系统,所述语音识别系统包括耳机,所述耳机包括多个麦克,所述多个麦克包括位于语音接收位置的第一麦克以及位于其他位置的至少一个第二麦克,其中:
通过所述第一麦克和所述第二麦克获取声音信号;
根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型;
根据所述声音信号的类型,对所述声音信号进行处理。
其中,所述根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型包括:
若通过所述第一麦克获取到的所述声音信号的幅值大于通过所述第二麦克获取到的所述声音信号的幅值,则确定所述声音信号的类型为语音信号;若通过所述第一麦克获取到的所述声音信号的幅值不大于通过所述第二麦克获取到的所述声音信号的幅值,则确定所述声音信号的类型为噪声信号。
其中,所述根据所述声音信号的类型,对所述声音信号进行处理包括:
若所述声音信号的类型为所述语音信号,则确定对所述声音信号进行语音识别处理;或
若所述声音信号的类型为所述噪声信号,则确定过滤掉所述声音信号。
其中,所述语音识别系统还包括移动设备和处理服务器,所述耳机可连接到所述移动设备上。
其中,所述根据所述声音信号的类型,对所述声音信号进行处理包括:
若所述声音信号的类型为所述语音信号,通过所述移动设备向所述处理服务器发送声音信号,所述声音信号用于通知所述处理服务器进行语音识别并返回控制信息;
通过所述移动设备接收所述处理服务器返回的控制信息;
根据所述控制信息,对所述耳机进行控制操作。
其中,所述耳机还包括震荡电路;所述方法还包括:
当检测到所述耳机连接到所述移动设备上时,获取所述震荡电路产生的正弦波信号;
通过所述移动设备向所述处理服务器发送所述正弦波信号,所述正弦波信号用于所述处理服务器确定所述耳机是否为授权耳机,所述授权耳机为所述处理服务器能提供语音识别服务的耳机。
其中,所述通过所述移动设备向所述处理服务器发送所述正弦波信号之后,还包括:
通过所述移动设备接收所述处理服务器发送的指示信息,所述指示信息用于通知用户所述耳机为授权耳机或非授权耳机。
其中,所述多个麦克为指向性麦克,所述指向性麦克用于接收预设角度范围内的声音信号。
其中,所述耳机为头戴式耳机。
另一方面,本发明实施例提供了一种耳机,所述耳机应用于语音识别系统,所述耳机包括多个麦克,所述多个麦克包括位于语音接收位置的第一麦克以及位于其他位置的至少一个第二麦克,其中:
获取模块,用于通过所述第一麦克和所述第二麦克获取声音信号;
确定模块,用于根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型;
处理模块,用于根据所述声音信号的类型,对所述声音信号进行处理。
其中,所述确定模块用于:
若通过所述第一麦克获取到的所述声音信号的幅值大于通过所述第二麦克获取到的所述声音信号的幅值,则确定所述声音信号的类型为语音信号;若通过所述第一麦克获取到的所述声音信号的幅值不大于通过所述第二麦克获取到的所述声音信号的幅值,则确定所述声音信号的类型为噪声信号。
其中,所述处理模块用于:
若所述声音信号的类型为所述语音信号,则确定对所述声音信号进行语音识别处理;或
若所述声音信号的类型为所述噪声信号,则确定过滤掉所述声音信号。
其中,所述语音识别系统还包括移动设备和处理服务器,所述耳机可连接到所述移动设备上;
所述耳机还包括:
发送模块,用于若所述声音信号的类型为所述语音信号,通过所述移动设备向所述处理服务器发送声音信号,所述声音信号用于所述处理服务器进行语音识别并返回控制信息;
接收模块,用于通过所述移动设备接收所述处理服务器返回的控制信息;
所述处理模块,还用于根据所述控制信息,对所述耳机进行控制操作。
其中,所述耳机还包括震荡电路;
所述获取模块,还用于当检测到所述耳机插入到所述移动设备上时,获取所述震荡电路产生的正弦波信号;
所述发送模块,还用于通过所述移动设备向所述处理服务器发送所述正弦波信号,所述正弦波信号用于所述处理服务器确定所述耳机是否为授权耳机,所述授权耳机为所述处理服务器能提供语音识别服务的耳机。
再一方面,本发明实施例提供了一种耳机,包括:通信接口、存储器以及处理器,其中,存储器中存储一组程序代码,且处理器用于调用存储器中存储的程序代码,用于执行以下操作:
通过所述第一麦克和所述第二麦克获取声音信号;
根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型;
根据所述声音信号的类型,对所述声音信号进行处理。
又一方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有多条指令,所述指令适于由处理器加载并执行上述各方面所述的方法。
其他方面,本发明实施例提供了一种语音识别系统,所述系统包括耳机、移动设备和处理服务器,所述耳机包括多个麦克,所述多个麦克包括位于语音接收位置的第一麦克以及位于其他位置的至少一个第二麦克,其中:
所述耳机,用于通过所述第一麦克和所述第二麦克获取声音信号;根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型;根据所述声音信号的类型,对所述声音信号进行处理;
所述移动设备,用于将经过处理的所述声音信号发送至所述处理服务器;
所述处理服务器,用于对经过处理的所述声音信号进行语音识别。
实施本发明实施例,增加耳机上的麦克的数量,首先通过所述第一麦克和所述第二麦克获取声音信号;然后根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型;最后根据所述声音信号的类型,对所述声音信号进行处理。实现过滤掉噪声信号,保留有效的语音信号进行语音识别,从而提高了语音识别的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提出的一种语音识别系统的架构实体示意图;
图2是本发明实施例提供的一种耳机的结构示意图;
图3是本发明实施例提供的一种语音处理方法的流程示意图;
图4是本发明实施例提供的一种耳机接收信号的示意图;
图5是本本发明实施例提供的一种语音信号处理的流程示意图;
图6是本发明又一实施例提供的一种语音处理方法的流程示意图;
图7是本发明实施例提供的一种耳机检测的流程示意图;
图8是本发明实施例提供的另一种耳机的结构示意图;
图9是本发明实施例提供的一种耳机的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1是本发明实施例提供的一种语音识别系统的架构示意图。如图所示,本发明实施例中的语音识别系统包括耳机101、移动设备102以及处理服务器103。其中,耳机101可以为头戴式耳机,如蓝牙耳机、运动耳机等,也可以称为人工智能(ArtificialIntelligence,AI)耳机。耳机101可以包括多个麦克、处理器(Digital SignalProcessing,DSP)和震荡电路,多个麦克包括位于语音接收位置的第一麦克以及位于其他位置的至少一个第二麦克。如图2所示,图2是本发明实施例提供的一种耳机的结构示意图。耳机101包括麦克A、麦克B、麦克C、麦克D等。其中,为了获取不同位置的语音信号,提高语音信号的识别率,本发明实施例将麦克A、麦克B、麦克C、麦克D布置在耳机的不同位置处。例如,麦克A位于耳机的语音接收位置处,即靠近用户嘴巴的位置,麦克B、麦克C、麦克D分别位于耳机的左右两侧和顶部。上述多个麦克为指向性麦克,该指向性麦克用于接收预设角度范围内的声音信号。例如,麦克A指向用户发出声音的方向,而麦克B、麦克C、麦克D分别指向耳机左右两侧和上方的方向。或者,所述第一麦克为指向性麦克,所述至少一个第二麦克为普通麦克。例如,麦克A指向用户发出声音的方向,而麦克B、麦克C、麦克D可以接收任意角度范围内的声音信号。处理器用于对耳机的麦克A接收到的声音信号进行去噪处理。震荡电路为耳机101额外增加的电路,用于产生正弦波信号,该正弦波信号随同去噪处理后的语音信号一起传输。
移动设备102与耳机101通讯连接,该通讯连接包括物理连接、蓝牙连接或wifi连接。该移动设备102可以向用户提供语音信号或语音指令。本发明实施例中,移动设备102可以为膝上型计算机或台式计算机等的计算设备,也可以是诸如个人数字助理(PersonalDigital Assistant,PDA)等的独立设备。移动设备102还可以称为系统、用户单元、用户站、移动站、移动台、远程站、接入点、远程终端、接入终端、用户终端、用户代理或用户装置等等。
本申请实施例中,移动设备102还通过云端连接处理服务器103,处理服务器103用于处理从移动设备102传输来的语音信号,对语音信号进行语音识别,并向移动设备102返回语音识别后对应的控制信息,该控制信息用于对与移动设备102连接的耳机101进行控制操作。
请参见图3,图3是本发明实施例提供的一种语音处理方法的流程示意图。如图所示,本发明实施例的中方法包括:
S301,通过所述第一麦克和所述第二麦克获取声音信号。
例如,如图4所示,当用户戴上耳机之后,麦克A位于耳机的语音接收位置处,即靠近用户嘴巴的位置,麦克B、麦克C、麦克D分别位于耳机的左右两侧和顶部。噪声源N1、噪声源N2、噪声源N3、或噪声源N4分别位于用户的不同方向,每个噪声源发出的噪声信号朝向用户传播,麦克A、麦克B、麦克C以及麦克D都可以不同程度的接收到每个噪声源发出的噪声信号。其中,麦克A指向用户发出声音的方向,并且背对噪声源N4的噪声信号的传播方向,噪声源N1、噪声源N2、噪声源N3的噪声信号也会被头部所遮挡,因此麦克A用于接收用户发出的语音信号,但是也能接收到一定强度的噪声信号。而麦克B、麦克C以及麦克D用于接收外界的噪声信号,但也能接收一定强度的语音信号。
S302,根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型。
具体实现中,可以判断通过所述第一麦克获取到的所述声音信号的幅值是否大于所述通过所述第二麦克获取到的所述声音信号的幅值;若通过所述第一麦克获取到的所述声音信号的幅值大于通过所述第二麦克获取到的所述声音信号的幅值,则确定所述声音信号的类型为语音信号;若通过所述第一麦克获取到的所述声音信号的幅值不大于通过所述第二麦克获取到的所述声音信号的幅值,则确定所述声音信号的类型为噪声信号。
例如,如图4所示,当声音源发出的声音信号到达麦克A、麦克B、麦克C以及麦克D时,麦克A、麦克B、麦克C以及麦克D接收到的声音信号的幅值分别为Va、Vb、Vc和Vd。在噪声源N1发出噪声信号时,噪声源N1朝向麦克D,而其他麦克位于距离噪声源N1更远位置、或者噪声信号被头部所遮挡,因此在麦克A、麦克B、麦克C以及麦克D接收到的噪声信号的幅值存在Vd>Va、Vd>Vb且Vd>Vc。Va、Vb、Vc的大小关系与噪声源的垂直位置和水平位置相关,此处不做判断。同理,如果噪声源N2、噪声源N3或者噪声源N4发出噪声信号时,麦克A接收到噪声信号的幅值小于某个或某些其他麦克(麦克B、麦克C或麦克D)接收到的噪声信号的幅值。又如,当用户发出语音信号时,由于麦克A靠近人嘴、并指向用户发出语音信号的方向,因此麦克A接收到的语音信号的幅值大于麦克B、麦克C以及麦克D接收到的语音信号的幅值,如Va>Vb、Va>Vc且Va>Vd。因此,幅值Vb、Vc、Vd中如有一个幅值大于Va,此时的声音源可以判定为噪声源,该声音源发出的声音信号为噪声信号。当Va>Vb、Va>Vc且Va>Vd时,此时的声音源可以判定为有效声音源,该声音源发出的声音信号为语音信号。
在本发明实施例中,当声音信号同时包括语音信号和噪声信号时,耳机可以获取声音信号的不同频率,根据不同频率区分不同声音源发出的声音信号,然后针对不同声音源发出的声音信号,确定声音信号的类型。
S303,根据所述声音信号的类型,对所述声音信号进行处理。
具体实现中,若所述声音信号的类型为所述语音信号,则确定对所述声音信号进行语音识别处理。若所述声音信号的类型为所述噪声信号,则确定过滤掉所述声音信号。
如图5所示,图5是本发明实施例提供的一种声音信号的处理流程图。通过麦克A、麦克B、麦克C以及麦克D分别接收耳机周围的声音信号,判断麦克A接收到的声音信号的幅值是否大于麦克B、麦克C以及麦克D接收到的声音信号的幅值。如果麦克A接收到的声音信号的幅值不大于麦克B、麦克C以及麦克D接收到的声音信号的幅值,则确定麦克A接收到的声音信号为噪声信号,对该噪声信号进行去噪处理,根据噪声信号的频率过滤掉该噪声信号。如果麦克A接收到的声音信号的幅值减去麦克B、麦克C或麦克D接收到的声音信号的幅值大于限定值,则确定麦克A接收到的声音信号为语音信号,并通过MIC信号线将该语音信号传输到移动设备。
在本发明实施例中,增加耳机上的麦克的数量,首先通过所述第一麦克和所述第二麦克获取声音信号;然后根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型;最后根据所述声音信号的类型,对所述声音信号进行处理。实现过滤掉噪声信号,保留有效的语音信号进行语音识别,从而提高了语音识别的准确性。
请参见图6,图6是本发明另一实施例提供的一种语音处理方法的流程示意图。如图所示,本发明实施例的中方法包括:
S601,耳机通过所述第一麦克和所述第二麦克获取声音信号。本步骤与前一实施例中的S301相同,本步骤不再赘述。
S602,耳机根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型。本步骤与前一实施例中的S302相同,本步骤不再赘述。
S603,若所述声音信号的类型为所述语音信号,耳机将所述声音信号传输到移动设备。
具体实现中,若所述声音信号的类型为所述语音信号,则确定对所述声音信号进行语音识别处理;若所述声音信号的类型为所述噪声信号,则确定过滤掉所述声音信号,并保留声音信号中的语音信号。在检测到耳机连接到移动设备时,将声音信号中的语音信号传输到移动设备。
如图5所示,图5是本发明实施例提供的一种声音信号的处理流程图。通过麦克A、麦克B、麦克C以及麦克D分别接收耳机周围的声音信号,判断麦克A接收到的声音信号的幅值是否大于麦克B、麦克C以及麦克D接收到的声音信号的幅值。如果麦克A接收到的声音信号的幅值不大于麦克B、麦克C以及麦克D接收到的声音信号的幅值,则确定麦克A接收到的声音信号为噪声信号,对该噪声信号进行去噪处理,根据噪声信号的频率过滤掉该噪声信号。如果麦克A接收到的声音信号的幅值减去麦克B、麦克C或麦克D接收到的声音信号的幅值大于限定值,则确定麦克A接收到的声音信号为语音信号,并通过MIC信号线将该语音信号传输到移动设备。
可选的,耳机还包括震荡电路。当检测到所述耳机连接到所述移动设备上时,耳机可以获取所述震荡电路产生的正弦波信号;通过所述移动设备向所述处理服务器发送所述正弦波信号,处理服务器接收到正弦波信号之后,根据正弦波信号的频率确定耳机是否为授权耳机,如果确定耳机为授权耳机,则向移动设备发送第一指示信息,所述第一指示信息用于通知用户所述耳机为授权耳机,处理服务器可以为该耳机提供语音识别服务。如果确定耳机为非授权耳机,则向移动设备发送第二指示信息,所述第二指示信息用于通知用户所述耳机为非授权耳机,处理服务器不能为该耳机提供语音识别服务。耳机通过所述移动设备接收所述处理服务器发送的指示信息,并通过语音播报的方式通知用户处理服务器发出的指示信息。其中,所述授权耳机为所述处理服务器能提供语音识别服务的耳机。
例如,如图7所示,首先按下开关震荡电路通电,震荡电路产生正弦波信号,然后耳机通过MIC信号线将正弦波信号输入到移动设备,移动设备上的APP将接收到的正弦波信号上传到处理服务器,最后处理服务器解析该正弦波信号并确定该正弦波信号的频率。如果正弦波信号的频率为20KHz,则确定插入到移动设备上的耳机为AI耳机(授权耳机),如果正弦波信号的频率不为20KHz,则确定插入到移动设备上的耳机为普通耳机,处理服务器不能为普通耳机提供语音识别服务。
S604,移动设备向所述处理服务器发送语音信号。
S605,处理服务器对所述语音信号进行语音识别并返回控制信息。
具体实现中,处理服务器在接收到语音信号之后,可以从语音库中查找与语音信号对应的控制信息,并将控制信息返回给移动设备。由于耳机接收到声音信号之后对声音信号进行过滤处理,所以处理服务器接收到的声音信号只包含了用户的语音信号,从而提高了处理服务器语音识别的准确度。
S606,移动设备向耳机传输控制信息。
S607,耳机根据所述控制信息,对所述耳机进行控制操作。
例如,当用户在麦克A处输入“增加音量”的语音信号之后,通过移动设备将“增加音量”的语音信号发送到处理服务器,处理服务器对“增加音量”进行语音识别,向移动设备发送控制信息,移动设备接收到控制信息之后,传输到耳机进而调高耳机的音量,从而实现通过语音识别自动调节。
在本发明实施例中,增加耳机上的麦克的数量,首先通过所述第一麦克和所述第二麦克获取声音信号;然后根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型;如果语音信号的类型为语音信号,则将语音信号发送给处理服务器进行语音识别。由于耳机对过滤掉噪声信号,保留有效的语音信号进行语音识别,从而提高了语音识别的准确性。
如图8所示,图8是本发明实施例提供的一种耳机结构示意图。该耳机应用于语音识别系统,该耳机包括多个麦克,该多个麦克包括位于语音接收位置的第一麦克以及位于其他位置的至少一个第二麦克。如图所示,本发明实施例中的耳机包括:
获取模块801,用于通过所述第一麦克和所述第二麦克获取声音信号。
例如,如图4所示,当用户戴上耳机之后,麦克A位于耳机的语音接收位置处,即靠近用户嘴巴的位置,麦克B、麦克C、麦克D分别位于耳机的左右两侧和顶部。噪声源N1、噪声源N2、噪声源N3、或噪声源N4分别位于用户的不同方向,每个噪声源发出的噪声信号朝向用户传播,麦克A、麦克B、麦克C以及麦克D都可以不同程度的接收到每个噪声源发出的噪声信号。其中,麦克A指向用户发出声音的方向,并且背对噪声源N4的噪声信号的传播方向,噪声源N1、噪声源N2、噪声源N3的噪声信号也会被头部所遮挡,因此麦克A用于接收用户发出的语音信号,但是也能接收到一定强度的噪声信号。而麦克B、麦克C以及麦克D用于接收外界的噪声信号,但也能接收一定强度的语音信号。
确定模块802,用于根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型。
具体实现中,可以判断通过所述第一麦克获取到的所述声音信号的幅值是否大于所述通过所述第二麦克获取到的所述声音信号的幅值;若通过所述第一麦克获取到的所述声音信号的幅值大于通过所述第二麦克获取到的所述声音信号的幅值,则确定所述声音信号的类型为语音信号;若通过所述第一麦克获取到的所述声音信号的幅值不大于通过所述第二麦克获取到的所述声音信号的幅值,则确定所述声音信号的类型为噪声信号。
例如,如图4所示,当声音源发出的声音信号到达麦克A、麦克B、麦克C以及麦克D时,麦克A、麦克B、麦克C以及麦克D接收到的声音信号的幅值分别为Va、Vb、Vc和Vd。在噪声源N1发出噪声信号时,噪声源N1朝向麦克D,而其他麦克位于距离噪声源N1更远位置、或者噪声信号被头部所遮挡,因此在麦克A、麦克B、麦克C以及麦克D接收到的噪声信号的幅值存在Vd>Va、Vd>Vb且Vd>Vc。Va、Vb、Vc的大小关系与噪声源的垂直位置和水平位置相关,此处不做判断。同理,如果噪声源N2、噪声源N3或者噪声源N4发出噪声信号时,麦克A接收到噪声信号的幅值不大于某个或某些其他麦克(麦克B、麦克C或麦克D)接收到的噪声信号的幅值。又如,当用户发出语音信号时,由于麦克A靠近人嘴、并指向用户发出语音信号的方向,因此麦克A接收到的语音信号的幅值大于麦克B、麦克C以及麦克D接收到的语音信号的幅值,如Va>Vb、Va>Vc且Va>Vd。因此,幅值Vb、Vc、Vd中如有一个幅值大于Va,此时的声音源可以判定为噪声源,该声音源发出的声音信号为噪声信号。当Va>Vb、Va>Vc且Va>Vd时,此时的声音源可以判定为有效声音源,该声音源发出的声音信号为语音信号。
在本发明实施例中,当声音信号同时包括语音信号和噪声信号时,耳机可以获取声音信号的不同频率,根据不同频率区分不同声音源发出的声音信号,然后针对不同声音源发出的声音信号,确定声音信号的类型。
处理模块803,用于根据所述声音信号的类型,对所述声音信号进行处理。
具体实现中,若所述声音信号的类型为所述语音信号,则确定对所述声音信号进行语音识别处理。若所述声音信号的类型为所述噪声信号,则确定过滤掉所述声音信号。
如图5所示,图5是本发明实施例提供的一种声音信号的处理流程图。通过麦克A、麦克B、麦克C以及麦克D分别接收耳机周围的声音信号,判断麦克A接收到的声音信号的幅值是否大于麦克B、麦克C以及麦克D接收到的声音信号的幅值,如果麦克A接收到的声音信号的幅值不大于麦克B、麦克C以及麦克D接收到的声音信号的幅值,则确定麦克A接收到的声音信号为噪声信号,对该噪声信号进行去噪处理,根据噪声信号的频率过滤掉该噪声信号。如果麦克A接收到的声音信号的幅值减去麦克B、麦克C或麦克D接收到的声音信号的幅值大于限定值,则确定麦克A接收到的声音信号为语音信号,并通过MIC信号线将该语音信号传输到移动设备。
可选的,如图8所示,本发明实施例中的耳机还可以包括:
发送模块804,用于若所述声音信号的类型为所述语音信号,通过所述移动设备向所述处理服务器发送声音信号,以使所述处理服务器对所述声音信号进行语音识别并返回控制信息。
具体实现中,耳机过滤声音信号中的噪声信号并保留声音信号中的语音信号,在检测到耳机连接到移动设备时,首先将声音信号中的语音信号传输到移动设备。然后移动设备向所述处理服务器发送语音信号。处理服务器在接收到语音信号之后,可以从语音库中查找与语音信号对应的控制信息,并将控制信息返回给移动设备。由于耳机接收到声音信号之后对声音信号进行过滤处理,所以处理服务器接收到的声音信号只包含了用户的语音信号,从而提高了处理服务器语音识别的准确度。
可选的,耳机还包括震荡电路。当检测到所述耳机连接到所述移动设备上时,耳机可以获取所述震荡电路产生的正弦波信号;通过所述移动设备向所述处理服务器发送所述正弦波信号,处理服务器接收到正弦波信号之后,根据正弦波信号的频率确定耳机是否为授权耳机,如果确定耳机为授权耳机,则向移动设备发送第一指示信息,所述第一指示信息用于通知用户所述耳机为授权耳机,处理服务器可以为该耳机提供语音识别服务。如果确定耳机为非授权耳机,则向移动设备发送第二指示信息,所述第二指示信息用于通知用户所述耳机为非授权耳机,处理服务器不能为该耳机提供语音识别服务。耳机通过所述移动设备接收所述处理服务器发送的指示信息,并通过语音播报的方式通知用户处理服务器发出的指示信息。其中,所述授权耳机为所述处理服务器能提供语音识别服务的耳机。
例如,如图7所示,首先按下开关震荡电路通电,震荡电路产生正弦波信号,然后耳机通过MIC信号线将正弦波信号输入到移动设备,移动设备上的APP将接收到的正弦波信号上传到处理服务器,最后处理服务器解析该正弦波信号并确定该正弦波信号的频率。如果正弦波信号的频率为20KHz,则确定插入到移动设备上的耳机为AI耳机(授权耳机),如果正弦波信号的频率不为20KHz,则确定插入到移动设备上的耳机为普通耳机,处理服务器不能为普通耳机提供语音识别服务。
接收模块805,用于通过所述移动设备接收所述处理服务器返回的控制信息;
处理模块803,还用于根据所述控制信息,对所述耳机进行控制操作。
例如,当用户在麦克A处输入“增加音量”的语音信号之后,通过移动设备将“增加音量”的语音信号发送到处理服务器,处理服务器对“增加音量”进行语音识别,向移动设备发送控制信息,移动设备接收到控制信息之后,传输到耳机进而调高耳机的音量,从而实现通过语音识别自动调节。
在本发明实施例中,增加耳机上的麦克的数量,首先通过所述第一麦克和所述第二麦克获取声音信号;然后根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型;如果语音信号的类型为语音信号,则将语音信号发送给处理服务器进行语音识别。由于耳机对过滤掉噪声信号,保留有效的语音信号进行语音识别,从而提高了语音识别的准确性。
请继续参考图9,图9是本发明实施例提出的一种耳机的结构示意图。如图所示,该耳机可以包括:至少一个处理器901,例如CPU,至少一个通信接口902,至少一个存储器903和至少一个通信总线904。其中,通信总线904用于实现这些组件之间的连接通信。其中,本申请实施例中设备的通信接口902用于与其他节点设备进行信令或数据的通信。存储器903可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器903可选的还可以是至少一个位于远离前述处理器901的存储装置。存储器903中存储一组程序代码,且处理器901执行存储器903中上述耳机所执行的程序。
通过所述第一麦克和所述第二麦克获取声音信号;
根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型;
根据所述声音信号的类型,对所述声音信号进行处理。
可选的,处理器901还用于执行如下操作步骤:
若通过所述第一麦克获取到的所述声音信号的幅值大于通过所述第二麦克获取到的所述声音信号的幅值,则确定所述声音信号的类型为语音信号;若通过所述第一麦克获取到的所述声音信号的幅值不大于通过所述第二麦克获取到的所述声音信号的幅值,则确定所述声音信号的类型为噪声信号。
可选的,处理器901还用于执行如下操作步骤:
若所述声音信号的类型为所述语音信号,则确定对所述声音信号进行语音识别处理;或
若所述声音信号的类型为所述噪声信号,则确定过滤掉所述声音信号。
可选的,处理器901还用于执行如下操作步骤:
若所述声音信号的类型为所述语音信号,通过所述移动设备向所述处理服务器发送声音信号,所述声音信号用于通知所述处理服务器进行语音识别并返回控制信息;
通过所述移动设备接收所述处理服务器返回的控制信息;
根据所述控制信息,对所述耳机进行控制操作。
可选的,处理器901还用于执行如下操作步骤:
当检测到所述耳机插入到所述移动设备上时,获取所述震荡电路产生的正弦波信号;
通过所述移动设备向所述处理服务器发送所述正弦波信号,所述正弦波信号用于所述处理服务器确定所述耳机是否为授权耳机,所述授权耳机为所述处理服务器能提供语音识别服务的耳机。
可选的,处理器901还用于执行如下操作步骤:
通过所述移动设备接收所述处理服务器发送的指示信息,所述指示信息用于通知用户所述耳机为授权耳机或非授权耳机。
进一步的,处理器还可以与存储器和通信接口相配合,执行上述发明实施例中管理服务器的操作。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本发明实施例所提供的内容下载方法及相关设备、系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (15)
1.一种语音处理方法,其特征在于,所述方法应用于语音识别系统,所述语音识别系统包括耳机,所述耳机包括多个麦克,所述多个麦克包括位于语音接收位置的第一麦克以及位于其他位置的至少一个第二麦克,其中:
通过所述第一麦克和所述第二麦克获取声音信号;
根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型;
根据所述声音信号的类型,对所述声音信号进行处理。
2.如权利要求1所述的方法,其特征在于,所述根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型包括:
若通过所述第一麦克获取到的所述声音信号的幅值大于通过所述第二麦克获取到的所述声音信号的幅值,则确定所述声音信号的类型为语音信号;
若通过所述第一麦克获取到的所述声音信号的幅值不大于通过所述第二麦克获取到的所述声音信号的幅值,则确定所述声音信号的类型为噪声信号。
3.如权利要求2所述的方法,其特征在于,所述根据所述声音信号的类型,对所述声音信号进行处理包括:
若所述声音信号的类型为所述语音信号,则确定对所述声音信号进行语音识别处理;或
若所述声音信号的类型为所述噪声信号,则确定过滤掉所述声音信号。
4.如权利要求1-3任一项所述的方法,其特征在于,所述语音识别系统还包括移动设备和处理服务器,所述耳机可连接到所述移动设备上。
5.如权利要求4所述的方法,其特征在于,所述根据所述声音信号的类型,对所述声音信号进行处理包括:
若所述声音信号的类型为所述语音信号,通过所述移动设备向所述处理服务器发送声音信号,所述声音信号用于通知所述处理服务器进行语音识别并返回控制信息;
通过所述移动设备接收所述处理服务器返回的控制信息;
根据所述控制信息,对所述耳机进行控制操作。
6.如权利要求5所述的方法,其特征在于,所述耳机还包括震荡电路;所述方法还包括:
当检测到所述耳机连接到所述移动设备上时,获取所述震荡电路产生的正弦波信号;
通过所述移动设备向所述处理服务器发送所述正弦波信号,所述正弦波信号用于所述处理服务器确定所述耳机是否为授权耳机,所述授权耳机为所述处理服务器能提供语音识别服务的耳机。
7.如权利要求6所述的方法,其特征在于,所述通过所述移动设备向所述处理服务器发送所述正弦波信号之后,还包括:
通过所述移动设备接收所述处理服务器发送的指示信息,所述指示信息用于通知用户所述耳机为授权耳机或非授权耳机。
8.如权利要求1-7任一项所述的方法,其特征在于,所述多个麦克为指向性麦克,所述指向性麦克用于接收预设角度范围内的声音信号。
9.一种耳机,其特征在于,所述耳机应用于语音识别系统,所述耳机包括多个麦克,所述多个麦克包括位于语音接收位置的第一麦克以及位于其他位置的至少一个第二麦克,其中:
获取模块,用于通过所述第一麦克和所述第二麦克获取声音信号;
确定模块,用于根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型;
处理模块,用于根据所述声音信号的类型,对所述声音信号进行处理。
10.如权利要求9所述的耳机,其特征在于,所述确定模块用于:
若通过所述第一麦克获取到的所述声音信号的幅值大于通过所述第二麦克获取到的所述声音信号的幅值,则确定所述声音信号的类型为语音信号;若通过所述第一麦克获取到的所述声音信号的幅值不大于通过所述第二麦克获取到的所述声音信号的幅值,则确定所述声音信号的类型为噪声信号。
11.如权利要求10所述的耳机,其特征在于,所述处理模块用于:
若所述声音信号的类型为所述语音信号,则确定对所述声音信号进行语音识别处理;或
若所述声音信号的类型为所述噪声信号,则确定过滤掉所述声音信号。
12.如权利要求9-11任一项所述的耳机,其特征在于,所述语音识别系统还包括移动设备和处理服务器,所述耳机可连接到所述移动设备上;
所述耳机还包括:
发送模块,用于若所述声音信号的类型为所述语音信号,通过所述移动设备向所述处理服务器发送声音信号,所述声音信号用于所述处理服务器进行语音识别并返回控制信息;
接收模块,用于通过所述移动设备接收所述处理服务器返回的控制信息;
所述处理模块,还用于根据所述控制信息,对所述耳机进行控制操作。
13.如权利要求12所述的耳机,其特征在于,所述耳机还包括震荡电路;
所述获取模块,还用于当检测到所述耳机插入到所述移动设备上时,获取所述震荡电路产生的正弦波信号;
所述发送模块,还用于通过所述移动设备向所述处理服务器发送所述正弦波信号,所述正弦波信号用于所述处理服务器确定所述耳机是否为授权耳机,所述授权耳机为所述处理服务器能提供语音识别服务的耳机。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1-8任一项所述的方法。
15.一种语音识别系统,其特征在于,所述系统包括耳机、移动设备和处理服务器,所述耳机包括多个麦克,所述多个麦克包括位于语音接收位置的第一麦克以及位于其他位置的至少一个第二麦克,其中:
所述耳机,用于通过所述第一麦克和所述第二麦克获取声音信号;根据通过所述第一麦克获取到的所述声音信号的幅值和通过所述第二麦克获取到的所述声音信号的幅值,确定所述声音信号的类型;根据所述声音信号的类型,对所述声音信号进行处理;
所述移动设备,用于将经过处理的所述声音信号发送至所述处理服务器;
所述处理服务器,用于对经过处理的所述声音信号进行语音识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710958997.5A CN109671444B (zh) | 2017-10-16 | 2017-10-16 | 一种语音处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710958997.5A CN109671444B (zh) | 2017-10-16 | 2017-10-16 | 一种语音处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109671444A true CN109671444A (zh) | 2019-04-23 |
CN109671444B CN109671444B (zh) | 2020-08-14 |
Family
ID=66139075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710958997.5A Active CN109671444B (zh) | 2017-10-16 | 2017-10-16 | 一种语音处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109671444B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5687241A (en) * | 1993-12-01 | 1997-11-11 | Topholm & Westermann Aps | Circuit arrangement for automatic gain control of hearing aids |
US20040175008A1 (en) * | 2003-03-07 | 2004-09-09 | Hans-Ueli Roeck | Method for producing control signals, method of controlling signal and a hearing device |
CN101595452A (zh) * | 2006-12-22 | 2009-12-02 | Step实验室公司 | 近场矢量信号增强 |
CN101840700A (zh) * | 2010-04-28 | 2010-09-22 | 宇龙计算机通信科技(深圳)有限公司 | 基于移动终端的声音识别方法及移动终端 |
CN102077607A (zh) * | 2008-05-02 | 2011-05-25 | Gn奈康有限公司 | 组合至少两个音频信号的方法和包括至少两个麦克风的麦克风系统 |
CN104376848A (zh) * | 2013-08-12 | 2015-02-25 | 展讯通信(上海)有限公司 | 语音信号处理方法和装置 |
CN106601272A (zh) * | 2016-11-24 | 2017-04-26 | 歌尔股份有限公司 | 耳机及其语音识别方法 |
CN107211206A (zh) * | 2015-01-20 | 2017-09-26 | 3M创新有限公司 | 用于测定声学信号起源的可安装的声音捕捉和重现装置 |
-
2017
- 2017-10-16 CN CN201710958997.5A patent/CN109671444B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5687241A (en) * | 1993-12-01 | 1997-11-11 | Topholm & Westermann Aps | Circuit arrangement for automatic gain control of hearing aids |
US20040175008A1 (en) * | 2003-03-07 | 2004-09-09 | Hans-Ueli Roeck | Method for producing control signals, method of controlling signal and a hearing device |
CN101595452A (zh) * | 2006-12-22 | 2009-12-02 | Step实验室公司 | 近场矢量信号增强 |
CN102077607A (zh) * | 2008-05-02 | 2011-05-25 | Gn奈康有限公司 | 组合至少两个音频信号的方法和包括至少两个麦克风的麦克风系统 |
CN101840700A (zh) * | 2010-04-28 | 2010-09-22 | 宇龙计算机通信科技(深圳)有限公司 | 基于移动终端的声音识别方法及移动终端 |
CN104376848A (zh) * | 2013-08-12 | 2015-02-25 | 展讯通信(上海)有限公司 | 语音信号处理方法和装置 |
CN107211206A (zh) * | 2015-01-20 | 2017-09-26 | 3M创新有限公司 | 用于测定声学信号起源的可安装的声音捕捉和重现装置 |
CN106601272A (zh) * | 2016-11-24 | 2017-04-26 | 歌尔股份有限公司 | 耳机及其语音识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109671444B (zh) | 2020-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11393472B2 (en) | Method and apparatus for executing voice command in electronic device | |
EP3090495B1 (en) | Device pairing via a cloud server | |
CN107004411B (zh) | 话音应用架构 | |
KR101880378B1 (ko) | 음성 합성 방법 및 장치 | |
US9620116B2 (en) | Performing automated voice operations based on sensor data reflecting sound vibration conditions and motion conditions | |
US11355108B2 (en) | Distinguishing voice commands | |
JP2019159307A (ja) | 端末ブラケット及びファーフィールド音声対話システム | |
US20160012820A1 (en) | Multilevel speech recognition method and apparatus | |
WO2014081429A2 (en) | Speech recognition | |
CN102884569A (zh) | 嵌入式网络语音识别器集成 | |
CN105611014A (zh) | 移动终端通话语音降噪方法及装置 | |
US11030994B2 (en) | Selective activation of smaller resource footprint automatic speech recognition engines by predicting a domain topic based on a time since a previous communication | |
CN109543198A (zh) | 翻译方法、装置、系统及存储介质 | |
JP2018521557A (ja) | 通話音質改善のためのシステムおよび方法 | |
CN109121042B (zh) | 语音数据处理方法及相关产品 | |
JP6670014B2 (ja) | モバイルデバイスにおける非線形エコーキャンセルのための二方式振幅処理フレームワーク | |
CN109671444A (zh) | 一种语音处理方法及装置 | |
US9853691B2 (en) | Near field communication technology-based terminal application control method, apparatus, and system | |
CN109791476B (zh) | 通信装置 | |
CN104796565B (zh) | 控制移动终端音量的方法、终端以及移动终端 | |
CN108965600A (zh) | 语音拾取方法及相关产品 | |
WO2024098279A1 (en) | Automated echo control | |
US20230080895A1 (en) | Dynamic operation of a voice controlled device | |
CN105704295B (zh) | 一种语音呼叫的方法及终端 | |
CN117809628A (zh) | 远场语音数据扩充方法、服务器和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |