CN110428828A - 一种语音识别方法、装置和用于语音识别的装置 - Google Patents

一种语音识别方法、装置和用于语音识别的装置 Download PDF

Info

Publication number
CN110428828A
CN110428828A CN201910590064.4A CN201910590064A CN110428828A CN 110428828 A CN110428828 A CN 110428828A CN 201910590064 A CN201910590064 A CN 201910590064A CN 110428828 A CN110428828 A CN 110428828A
Authority
CN
China
Prior art keywords
microphone
smart machine
target
sounding
voice signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910590064.4A
Other languages
English (en)
Other versions
CN110428828B (zh
Inventor
马海雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201910590064.4A priority Critical patent/CN110428828B/zh
Publication of CN110428828A publication Critical patent/CN110428828A/zh
Application granted granted Critical
Publication of CN110428828B publication Critical patent/CN110428828B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例提供了一种语音识别方法、装置和用于语音识别的装置,应用于智能设备,所述智能设备预置有发声器件。其中的方法具体包括:通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风;关闭所述目标麦克风;通过所述麦克风阵列中未关闭的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。本发明实施例可以避免将墙体返回的回声误识别为语音指令的情况,可以提高语音指令识别的准确率。

Description

一种语音识别方法、装置和用于语音识别的装置
技术领域
本发明涉及智能控制技术领域,尤其涉及一种语音识别方法、装置和用于语音识别的装置。
背景技术
随着语音识别技术的日益成熟,市场中正出现越来越多的智能设备,例如智能音箱、智能电视等,这些智能设备基于语音识别技术,为消费者提供更便捷的交互方式。
例如,智能音箱通过识别语音指令的音源方向,对来自该音源方向的声音进行语音识别,以得到用户发出的语音指令。
然而,由于智能音箱需要供电并且长时间待机,而用户家中可供电的插座通常置于墙体,因此,智能音箱的工作位置通常靠近墙体,这样会造成墙体返回的回声被智能音箱误识别为语音指令的音源方向,进而导致语音指令识别不准的情况发生。
发明内容
本发明实施例提供一种语音识别方法、装置和用于语音识别的装置,可以提高智能设备识别语音指令的准确性。
为了解决上述问题,本发明实施例公开了一种语音识别方法,应用于智能设备,所述智能设备预置有发声器件,所述方法包括:
通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风;
关闭所述目标麦克风;
通过所述麦克风阵列中未关闭的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。
另一方面,本发明实施例公开了一种智能设备,所述智能设备预置有发声器件,所述智能设备包括:
发声确定模块,用于通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风;
第一关闭模块,用于关闭所述目标麦克风;
接收识别模块,用于通过所述麦克风阵列中未关闭的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。
再一方面,本发明实施例公开了一种用于语音识别的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风;
关闭所述目标麦克风;
通过所述麦克风阵列中未关闭的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。
又一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的语音识别方法。
本发明实施例包括以下优点:
本发明实施例可以在智能设备中预置有发声器件,并通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风,所述目标麦克风为靠近墙体一侧的麦克风,进而可以关闭所述目标麦克风,以通过所述麦克风阵列中未关闭的麦克风接收语音信号,对所述语音信号进行语音识别,可以得到语音识别结果。
通过本发明实施例,在智能设备接收语音信号进行语音识别的过程中,由于靠近墙体一侧的目标麦克风被关闭,因此,可以减少麦克风阵列接收到的墙体传播的所述语音信号的回声信号,仅通过所述麦克风阵列中未关闭的麦克风接收来自用户说话方向的语音信号,进而可以避免将墙体返回的回声误识别为语音指令的情况,可以提高语音指令识别的准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一种语音识别方法实施例的步骤流程图;
图2是本发明的一种智能音箱的结构示意图;
图3是本发明的一种智能设备实施例的结构框图;
图4是本发明的一种用于语音识别的装置800的框图;及
图5是本发明的一些实施例中服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
方法实施例
参照图1,示出了本发明的一种语音识别方法实施例的步骤流程图,所述方法应用于智能设备,所述智能设备预置有发声器件,所述方法具体可以包括如下步骤:
步骤101、通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风;
步骤102、关闭所述目标麦克风;
步骤103、通过所述麦克风阵列中未关闭的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。
本发明实施例的语音识别方法可用于智能设备,所述智能设备是指任何一种具有计算处理能力的设备、器械或者机器,所述智能设备可以识别语音信号中的语音指令,并自动执行所述语音指令。例如,所述智能设备可以包括智能家居设备和/或智能穿戴设备等。其中,所述智能家居设备可以包括但不限于智能音箱、智能电视、智能冰箱;所述智能穿戴设备可以包括但不限于智能手表、智能手环。
为便于描述,本发明实施例中均以智能音箱为例进行说明,其它智能设备的应用场景相互参照即可。
在本发明实施例中,所述智能设备可以预置有发声器件,可选地,所述发声器件可以为蜂鸣器,所述蜂鸣器可以位于所述智能设备的顶部或者底部。本发明实施例可以通过所述发声器件进行发声,如可以通过所述蜂鸣器进行高音长鸣,并根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,在所述麦克风阵列中确定目标麦克风。
其中,所述麦克风阵列指的是由一定数目的麦克风组成,用来对声场的空间特性进行采样并处理的系统。在具体应用中,智能音箱的麦克风阵列通常可以为8个方向的矩阵麦克风,参照图2,示出了本发明的一种智能音箱的结构示意图。如图2所示,该实施例所述智能音箱中包括8个方向的矩阵麦克风201、在该智能音箱的底部设置的蜂鸣器202、以及音箱主体203,其中,矩阵麦克风201包括如下8个麦克风:麦克风2011至麦克风2018。当然,图2所示的麦克风阵列仅作为本发明的一种应用示例,本发明实施例对麦克风阵列的具体形式以及麦克风阵列中包含的麦克风数量不加以限制。
在实际应用中,由于智能音箱需要供电并且长时间待机,而用户家中可供电的插座通常置于墙体,因此,智能音箱的工作位置通常靠近墙体,也即智能音箱中的麦克风阵列与墙体之间的距离较近,而声音沿墙体传播的速度比在空气中更快,因此,本发明实施例可以根据智能音箱的麦克风阵列中各麦克风接收到回声的时间不同,确定所述麦克风阵列中靠近墙体的目标麦克风。
在本发明的一种可选实施例中,所述通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风,具体可以包括:
步骤S11、在所述发声器件发声后,获取所述智能设备的麦克风阵列中各麦克风接收到回声的时间;
步骤S12、确定接收到回声时间符合预设要求的麦克风为目标麦克风。
根据声音沿墙体传播的速度比在空气中更快的原理,位于墙体一侧的麦克风接收到回声的时间应该比位于非墙体一侧的麦克风接收到回声的时间更短,因此,所述符合预设要求可以指接收到回声时间最短,或者接收到回声时间小于预设时长等。
如图2所示,假设蜂鸣器到墙体的距离为L1,麦克风2011到墙体的距离为L2,蜂鸣器到麦克风2011的距离为L3,麦克风2014蜂鸣器的距离为L。回声在空气中的传播速度为340米/秒(记为v1),假设墙体为水泥墙,回声在水泥墙中的传播速度为3800米/秒(记为v2),由此可以得到麦克风2011接收到蜂鸣器发声的回声的时间t1为:t1=((L1+L2)/v1)+L3/v2,麦克风2014接收到蜂鸣器发声的回声的时间t2为:L/v1,由于v2远远大于v1,因此,t2>t1。同理,可以计算得到所有麦克风接收到蜂鸣器发声的回声的时间。假设计算得到麦克风2011接收到回声的时间最短,可以确定麦克风2011位于墙体一侧,则可以将麦克风2011作为目标麦克风。
本发明实施例根据声音沿墙体传播的速度比在空气中更快的原理,可以确定接收到回声时间最短的麦克风为靠近墙体的目标麦克风,则可以关闭目标麦克风,以通过所述麦克风阵列中未关闭的麦克风接收语音信号,也即通过所述麦克风阵列中远离墙体的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。这样,在智能音箱接收语音信号进行语音识别的过程中,可以减少麦克风阵列接收到的墙体传播的所述语音信号的回声信号,进而可以避免将墙体返回的回声误识别为语音指令的情况,可以提高语音指令识别的准确率。
可以理解,本发明实施例对所述发声器件的具体类型、数量、以及在智能设备中的位置均不加以限制,可选地,本发明实施例将蜂鸣器作为发声器件置于智能音箱的底部或顶部,可以利用蜂鸣器的高音特征区别普通噪声,进而可以避免噪声干扰,提高确定目标麦克风的准确性。在实际应用中,本领域技术人员可以根据实际需求灵活选择发声器件,例如也可以选择发声喇叭作为发音器件。
在本发明的一种可选实施例中,所述通过所述发声器件进行发声,具体可以包括:在所述智能设备首次接通电源的情况下,通过所述发声器件进行发声。
例如,在智能音箱首次接通电源的情况下,可以通过智能音箱底部的蜂鸣器进行高音长鸣,接下来智能音箱的麦克风阵列可以通过8个方向的麦克风接收蜂鸣器声音的回声,进而可以确定接收到回声的时间最短的麦克风的方向为墙体方向,并且将该麦克风作为目标麦克风进行关闭。由此,在后续使用智能音箱进行语音识别的过程中,可以保持靠近墙体的目标麦克风为关闭状态,不用每次在使用智能音箱之前都通过蜂鸣器发声来关闭目标麦克风,可以简化用户操作,为用户操作带来便利。
可选地,还可以在所述智能设备满足预设条件的情况下,通过所述发声器件进行发声。
所述预设条件可以包括:智能设备的位置发生改变。在具体应用中,用户可能会挪动智能设备,导致智能设备的位置改变,进而改变位于墙体的麦克风,因此,本发明实施例在智能设备满足预设条件的情况下,通过所述发声器件进行发声,以重新确定位于墙体一侧的目标麦克风。
此外,在用户挪动智能设备导致位于墙体一侧的麦克风发生变化后,由于已经关闭的目标麦克风可能不再位于墙体一侧,而未关闭的麦克风经过智能设备的位置改变后移至墙体一侧,将导致接收语音信号的方位不够准确,进而影响智能设备语音识别结果的准确性,因此,所述预设条件还可以包括:所述智能设备的语音识别结果的准确率小于预设值。也即,在智能设备的语音识别结果的准确率突然下降的情况下,可以通过所述发声器件进行发声,以重新确定位于墙体一侧的目标麦克风。
在本发明的一种可选实施例中,在所述确定目标麦克风之后,所述方法还可以包括:关闭所述麦克风阵列中与所述目标麦克风相邻且与所述目标麦克风位于所述智能设备同一侧面的麦克风。
如图2所示的智能音箱,假设确定目标麦克风为麦克风2011,可以看出,麦克风2012和麦克风2013为与麦克风2011相邻且与麦克风2011位于智能音箱同一侧面,因此,可以确定麦克风2012和麦克风2013也位于墙体一侧,本发明实施例在关闭目标麦克风麦克风2011的情况下,可以将麦克风麦克风2012和麦克风2013也同时关闭,由此,可以避免与目标麦克风相邻的其它麦克风接收到墙体传来的回声,并且将回声误识别为语音指令的情况,可以进一步提高语音识别的准确率。
在本发明的一种可选实施例中,所述通过所述麦克风阵列中未关闭的麦克风接收语音信号,具体可以包括:
步骤S21、对所述未关闭的麦克风对应方向的语音信号进行信号增益;
步骤S22、通过所述未关闭的麦克风接收信号增益后的语音信号。
在本发明实施例中,可以对所述麦克风阵列中不同方向的麦克风设置不同的权重,使得麦克风根据权重对接收到的语音信号进行信号增益,以增加信号强度。本发明实施例在关闭目标麦克风之后,可以增加未关闭的麦克风的权重,进而可以在忽略墙体方向的语音信号的同时,对所述未关闭的麦克风对应方向的语音信号进行信号增益,以增加未关闭的麦克风对应方向(用户说话方向)的语音信号的信号强度,进一步提高语音识别的准确率。
在本发明的一种可选实施例中,所述智能设备在不同方向还可以预置有方向传感器,所述方法还可以包括:
步骤S31、通过所述方向传感器确定目标方向;
步骤S32、关闭所述麦克风阵列中位于所述目标方向的麦克风。
本发明实施例利用回声在墙体中传播速度更快的原理,确定智能设备的麦克风阵列中的目标麦克风,因此,智能设备与墙体的距离越近,确定的目标麦克风越准确。
可选地,为了进一步保证在使用智能设备进行语音识别的过程中,可以准确关闭智能设备中靠近墙体的目标麦克风,本发明实施例还可以在智能设备中的不同方向上预置方向传感器,例如,可以在如图2所示的麦克风的8个方向分别设置方向传感器,如设置距离感应开关,所述距离感应开关可以识别其自身与墙体之间的距离,当所述距离感应开关识别到距离墙体比较近的时候(例如距离小于预设值),则可以确定所述距离感应开关的方向为目标方向,也即墙体方向,因此可以关闭所述麦克风阵列中位于所述目标方向的麦克风。
综上,本发明实施例可以在智能设备中预置有发声器件,并通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风,所述目标麦克风为靠近墙体一侧的麦克风,进而可以关闭所述目标麦克风,以通过所述麦克风阵列中未关闭的麦克风接收语音信号,对所述语音信号进行语音识别,可以得到语音识别结果。
通过本发明实施例,在智能设备接收语音信号进行语音识别的过程中,由于靠近墙体一侧的目标麦克风被关闭,因此,可以减少麦克风阵列接收到的墙体传播的所述语音信号的回声信号,仅通过所述麦克风阵列中未关闭的麦克风接收来自用户说话方向的语音信号,进而可以避免将墙体返回的回声误识别为语音指令的情况,可以提高语音指令识别的准确率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
装置实施例
参照图3,示出了本发明的一种智能设备实施例的结构框图,所述智能设备预置有发声器件,所述智能设备包括:
发声确定模块301,用于通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风;
第一关闭模块302,用于关闭所述目标麦克风;
接收识别模块303,用于通过所述麦克风阵列中未关闭的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。
可选地,所述发声确定模块301,具体可以包括:
时间获取子模块,用于在所述发声器件发声后,获取所述智能设备的麦克风阵列中各麦克风接收到回声的时间;
目标确定子模块,用于确定接收到回声时间符合预设要求的麦克风为目标麦克风。
可选地,所述智能设备还可以包括:
第二关闭模块,用于关闭所述麦克风阵列中与所述目标麦克风相邻且与所述目标麦克风位于所述智能设备同一侧面的麦克风。
可选地,所述接收识别模块303,具体可以包括:
增益子模块,用于对所述未关闭的麦克风对应方向的语音信号进行信号增益;
接收子模块,用于通过所述未关闭的麦克风接收信号增益后的语音信号。
可选地,所述智能设备在不同方向还预置有方向传感器,所述智能设备还可以包括:
方向确定模块,用于通过所述方向传感器确定目标方向;
第三关闭模块,用于关闭所述麦克风阵列中位于所述目标方向的麦克风。
可选地,所述发声确定模块301,具体用于在所述智能设备首次接通电源的情况下,通过所述发声器件进行发声;或者,在所述智能设备满足预设条件的情况下,通过所述发声器件进行发声。
可选地,所述发声器件为蜂鸣器,所述蜂鸣器位于所述智能设备的顶部或者底部。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种用于语音识别的装置,应用于智能设备,所述智能设备预置有发声器件,所述装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风;关闭所述目标麦克风;通过所述麦克风阵列中未关闭的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。
图4是根据一示例性实施例示出的一种用于语音识别的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音信息处理模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方向或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频信息处理(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图5是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行图1所示的语音识别方法。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行一种语音识别方法,所述方法包括:通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风;关闭所述目标麦克风;通过所述麦克风阵列中未关闭的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。
本发明实施例公开了A1、一种语音识别方法,应用于智能设备,所述智能设备预置有发声器件,包括:
通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风;
关闭所述目标麦克风;
通过所述麦克风阵列中未关闭的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。
A2、根据A1所述的方法,所述通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风,包括:
在所述发声器件发声后,获取所述智能设备的麦克风阵列中各麦克风接收到回声的时间;
确定接收到回声时间符合预设要求的麦克风为目标麦克风。
A3、根据A1所述的方法,在所述确定目标麦克风之后,所述方法还包括:
关闭所述麦克风阵列中与所述目标麦克风相邻且与所述目标麦克风位于所述智能设备同一侧面的麦克风。
A4、根据A1所述的方法,所述通过所述麦克风阵列中未关闭的麦克风接收语音信号,包括:
对所述未关闭的麦克风对应方向的语音信号进行信号增益;
通过所述未关闭的麦克风接收信号增益后的语音信号。
A5、根据A1所述的方法,所述智能设备在不同方向还预置有方向传感器,所述方法还包括:
通过所述方向传感器确定目标方向;
关闭所述麦克风阵列中位于所述目标方向的麦克风。
A6、根据A1所述的方法,所述通过所述发声器件进行发声,包括:
在所述智能设备首次接通电源的情况下,通过所述发声器件进行发声;或者,
在所述智能设备满足预设条件的情况下,通过所述发声器件进行发声。
A7、根据A1至A6中任一所述的方法,所述发声器件为蜂鸣器,所述蜂鸣器位于所述智能设备的顶部或者底部。
本发明实施例公开了B8、一种智能设备,所述智能设备预置有发声器件,所述智能设备包括:
发声确定模块,用于通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风;
第一关闭模块,用于关闭所述目标麦克风;
接收识别模块,用于通过所述麦克风阵列中未关闭的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。
B9、根据B8所述的智能设备,所述发声确定模块,包括:
时间获取子模块,用于在所述发声器件发声后,获取所述智能设备的麦克风阵列中各麦克风接收到回声的时间;
目标确定子模块,用于确定接收到回声时间符合预设要求的麦克风为目标麦克风。
B10、根据B8所述的智能设备,所述智能设备还包括:
第二关闭模块,用于关闭所述麦克风阵列中与所述目标麦克风相邻且与所述目标麦克风位于所述智能设备同一侧面的麦克风。
B11、根据B8所述的智能设备,所述接收识别模块,包括:
增益子模块,用于对所述未关闭的麦克风对应方向的语音信号进行信号增益;
接收子模块,用于通过所述未关闭的麦克风接收信号增益后的语音信号。
B12、根据B8所述的智能设备,所述智能设备在不同方向还预置有方向传感器,所述智能设备还包括:
方向确定模块,用于通过所述方向传感器确定目标方向;
第三关闭模块,用于关闭所述麦克风阵列中位于所述目标方向的麦克风。
B13、根据B8所述的智能设备,所述发声确定模块,具体用于在所述智能设备首次接通电源的情况下,通过所述发声器件进行发声;或者在所述智能设备满足预设条件的情况下,通过所述发声器件进行发声。
B14、根据B8至B13中任一所述的智能设备,所述发声器件为蜂鸣器,所述蜂鸣器位于所述智能设备的顶部或者底部。
本发明实施例公开了C15、一种用于语音识别的装置,应用于智能设备,所述智能设备预置有发声器件,所述装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风;
关闭所述目标麦克风;
通过所述麦克风阵列中未关闭的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。
C16、根据C15所述的装置,所述通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风,包括:
在所述发声器件发声后,获取所述智能设备的麦克风阵列中各麦克风接收到回声的时间;
确定接收到回声时间符合预设要求的麦克风为目标麦克风。
C17、根据C15所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
关闭所述麦克风阵列中与所述目标麦克风相邻且与所述目标麦克风位于所述智能设备同一侧面的麦克风。
C18、根据C15所述的装置,所述通过所述麦克风阵列中未关闭的麦克风接收语音信号,包括:
对所述未关闭的麦克风对应方向的语音信号进行信号增益;
通过所述未关闭的麦克风接收信号增益后的语音信号。
C19、根据C15所述的装置,所述智能设备在不同方向还预置有方向传感器,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
通过所述方向传感器确定目标方向;
关闭所述麦克风阵列中位于所述目标方向的麦克风。
C20、根据C15所述的装置,所述通过所述发声器件进行发声,包括:
在所述智能设备首次接通电源的情况下,通过所述发声器件进行发声;或者
在所述智能设备满足预设条件的情况下,通过所述发声器件进行发声。
C21、根据C15至C20中任一所述的装置,所述发声器件为蜂鸣器,所述蜂鸣器位于所述智能设备的顶部或者底部。
本发明实施例公开了D22、一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如A1至A7中一个或多个所述的语音识别方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种语音识别方法、一种语音识别装置和一种用于语音识别的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种语音识别方法,其特征在于,所述方法应用于智能设备,所述智能设备预置有发声器件,所述方法包括:
通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风;
关闭所述目标麦克风;
通过所述麦克风阵列中未关闭的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。
2.根据权利要求1所述的方法,其特征在于,所述通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风,包括:
在所述发声器件发声后,获取所述智能设备的麦克风阵列中各麦克风接收到回声的时间;
确定接收到回声时间符合预设要求的麦克风为目标麦克风。
3.根据权利要求1所述的方法,其特征在于,在所述确定目标麦克风之后,所述方法还包括:
关闭所述麦克风阵列中与所述目标麦克风相邻且与所述目标麦克风位于所述智能设备同一侧面的麦克风。
4.根据权利要求1所述的方法,其特征在于,所述通过所述麦克风阵列中未关闭的麦克风接收语音信号,包括:
对所述未关闭的麦克风对应方向的语音信号进行信号增益;
通过所述未关闭的麦克风接收信号增益后的语音信号。
5.根据权利要求1所述的方法,其特征在于,所述智能设备在不同方向还预置有方向传感器,所述方法还包括:
通过所述方向传感器确定目标方向;
关闭所述麦克风阵列中位于所述目标方向的麦克风。
6.根据权利要求1所述的方法,其特征在于,所述通过所述发声器件进行发声,包括:
在所述智能设备首次接通电源的情况下,通过所述发声器件进行发声;或者,
在所述智能设备满足预设条件的情况下,通过所述发声器件进行发声。
7.根据权利要求1至6中任一所述的方法,其特征在于,所述发声器件为蜂鸣器,所述蜂鸣器位于所述智能设备的顶部或者底部。
8.一种智能设备,其特征在于,所述智能设备预置有发声器件,所述智能设备包括:
发声确定模块,用于通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风;
第一关闭模块,用于关闭所述目标麦克风;
接收识别模块,用于通过所述麦克风阵列中未关闭的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。
9.一种用于语音识别的装置,其特征在于,应用于智能设备,所述智能设备预置有发声器件,所述装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
通过所述发声器件进行发声,根据所述智能设备的麦克风阵列中各麦克风接收到回声的时间,确定目标麦克风;
关闭所述目标麦克风;
通过所述麦克风阵列中未关闭的麦克风接收语音信号,并对所述语音信号进行语音识别,以得到语音识别结果。
10.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至7中一个或多个所述的语音识别方法。
CN201910590064.4A 2019-07-02 2019-07-02 一种语音识别方法、装置和用于语音识别的装置 Active CN110428828B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910590064.4A CN110428828B (zh) 2019-07-02 2019-07-02 一种语音识别方法、装置和用于语音识别的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910590064.4A CN110428828B (zh) 2019-07-02 2019-07-02 一种语音识别方法、装置和用于语音识别的装置

Publications (2)

Publication Number Publication Date
CN110428828A true CN110428828A (zh) 2019-11-08
CN110428828B CN110428828B (zh) 2022-03-22

Family

ID=68410024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910590064.4A Active CN110428828B (zh) 2019-07-02 2019-07-02 一种语音识别方法、装置和用于语音识别的装置

Country Status (1)

Country Link
CN (1) CN110428828B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113497995A (zh) * 2020-04-08 2021-10-12 华为技术有限公司 麦克风阵列控制方法、装置、电子设备及计算机存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090125311A1 (en) * 2006-10-02 2009-05-14 Tim Haulick Vehicular voice control system
JP2012075072A (ja) * 2009-12-25 2012-04-12 Ricoh Co Ltd 伝送端末、伝送端末用プログラム、プログラム提供システム、及びメンテナンスシステム
CN109672966A (zh) * 2018-12-21 2019-04-23 歌尔股份有限公司 一种语音拾取方法、装置和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090125311A1 (en) * 2006-10-02 2009-05-14 Tim Haulick Vehicular voice control system
JP2012075072A (ja) * 2009-12-25 2012-04-12 Ricoh Co Ltd 伝送端末、伝送端末用プログラム、プログラム提供システム、及びメンテナンスシステム
CN109672966A (zh) * 2018-12-21 2019-04-23 歌尔股份有限公司 一种语音拾取方法、装置和系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113497995A (zh) * 2020-04-08 2021-10-12 华为技术有限公司 麦克风阵列控制方法、装置、电子设备及计算机存储介质
WO2021204027A1 (zh) * 2020-04-08 2021-10-14 华为技术有限公司 麦克风阵列控制方法、装置、电子设备及计算机存储介质
CN113497995B (zh) * 2020-04-08 2023-04-04 华为技术有限公司 麦克风阵列控制方法、装置、电子设备及计算机存储介质

Also Published As

Publication number Publication date
CN110428828B (zh) 2022-03-22

Similar Documents

Publication Publication Date Title
CN108615526B (zh) 语音信号中关键词的检测方法、装置、终端及存储介质
JP2019117623A (ja) 音声対話方法、装置、デバイス及び記憶媒体
CN110808063A (zh) 一种语音处理方法、装置和用于处理语音的装置
CN104615359B (zh) 对应用软件进行语音操作的方法及装置
CN110556127B (zh) 语音识别结果的检测方法、装置、设备及介质
EP3779968A1 (en) Audio processing
US11004452B2 (en) Method and system for multimodal interaction with sound device connected to network
CN106791921A (zh) 视频直播的处理方法及装置
EP3933570A1 (en) Method and apparatus for controlling a voice assistant, and computer-readable storage medium
CN105532634A (zh) 超声波驱蚊方法、装置及系统
CN104991754A (zh) 录音方法及装置
CN108803444A (zh) 智能设备的控制方法、装置及存储介质
CN105607738B (zh) 确定单手模式的方法及装置
CN108073572A (zh) 信息处理方法及其装置、同声翻译系统
CN109360549A (zh) 一种数据处理方法、装置和用于数据处理的装置
CN108665889A (zh) 语音信号端点检测方法、装置、设备及存储介质
CN109256145A (zh) 基于终端的音频处理方法、装置、终端和可读存储介质
WO2021244058A1 (zh) 一种处理执行方法、装置和可读介质
CN110798327A (zh) 消息处理方法、设备及存储介质
CN109670025A (zh) 对话管理方法及装置
CN110290576A (zh) 电子设备控制方法及装置
CN113220590A (zh) 语音交互应用的自动化测试方法、装置、设备及介质
CN110428828A (zh) 一种语音识别方法、装置和用于语音识别的装置
KR20190002069A (ko) 이어셋을 이용한 통역기능 제공 방법 및 장치
KR20210042520A (ko) 전자 장치 및 이의 제어 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant