CN112750439A - 语音识别方法,电子设备及存储介质 - Google Patents
语音识别方法,电子设备及存储介质 Download PDFInfo
- Publication number
- CN112750439A CN112750439A CN202011596082.2A CN202011596082A CN112750439A CN 112750439 A CN112750439 A CN 112750439A CN 202011596082 A CN202011596082 A CN 202011596082A CN 112750439 A CN112750439 A CN 112750439A
- Authority
- CN
- China
- Prior art keywords
- user
- audio data
- wireless
- wireless devices
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000001514 detection method Methods 0.000 claims abstract description 23
- 238000004891 communication Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000002411 adverse Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请提供一种语音识别方法,电子设备及存储介质,该方法应用于一电子设备,电子设备用于无线连接多个无线设备,方法包括:获取多个无线设备各自所采集的用户音频数据;基于用户音频数据确定多个无线设备中距离用户最近的目标设备;发送指令至目标设备,以对目标设备所采集的用户音频数据进行关键字检测和/或语音识别。本申请中,由于并非每个无线设备均需要对用户音频数据进行关键字检测和/或语音识别,因此,可以降低智能家居的整体功耗;由于是采用距离用户最近的设备所采集的用户音频数据进行关键字检测和/或语音识别,因此,能够提高关键字检测和/或语音识别的准确度,避免控制出错的问题。
Description
技术领域
本申请涉及物联网技术领域,具体而言,涉及一种语音识别方法,电子设备及存储介质。
背景技术
随着科学技术的进步及人民生活水平的提高,智能家居越来越普遍。智能家居的核心技术之一在于通过物联网将家中的各种电子设备连接到一起,提供家电控制。智能家居相较于传统的家电产品,不仅能够实现家电产品的传统功能,还兼备信息交互功能。随着集成技术、通信技术、互操作能力和布线标准的不断发展,智能家居网络也在不断地发展。
现有技术中,接入到智能家居网络中的家电产品通常均具备语音识别的功能,以便于用户进行语音控制。然而,在用户发出语音指令后,智能家居网络中的各家电产品均会采集语音并进行语音识别,一方面,导致智能家居整体功耗较高,另一方面,容易导致控制出错。
发明内容
本申请实施例的目的在于提供一种语音识别方法,用以改善现有技术中智能家居整体功耗较高,且容易导致控制出错的问题。
本申请提供一种语音识别方法,应用于一电子设备,所述电子设备用于无线连接多个无线设备,所述方法包括:获取所述多个无线设备各自所采集的用户音频数据;基于所述用户音频数据确定所述多个无线设备中距离用户最近的目标设备;发送指令至所述目标设备,以对所述目标设备所采集的用户音频数据进行关键字检测和/或语音识别。
本申请通过获取多个无线设备各自所采集的用户音频数据,确定处多个无线设备中距离用户最近的目标设备,然后发送指令至目标设备,以对目标设备所采集的用户音频数据进行关键字检测和/或语音识别,由于并非每个无线设备均需要对用户音频数据进行关键字检测和/或语音识别,因此,可以降低智能家居的整体功耗;由于是采用距离用户最近的设备所采集的用户音频数据进行关键字检测和/或语音识别,因此,能够提高关键字检测和/或语音识别的准确度,避免控制出错的问题。
一实施例中,在获取所述多个无线设备所采集的用户语音信号之前,所述方法还包括:与所述多个无线设备进行时钟同步。
本申请实施例中,通过在获取多个无线设备所采集的用户语音信号之前,与多个无线设备进行时钟同步,有助于减少因为时钟不同步对后续确定目标设备所造成的不良影响,因此,一定程度上提升语音识别方法的准确性。
一实施例中,所述获取所述多个无线设备各自所采集的用户音频数据,包括:获取所述多个无线设备各自所采集的用户音频数据以及所记录的音频采集时刻;相应地,所述基于所述用户音频数据确定所述多个无线设备中距离用户最近的目标设备,包括:基于所述用户音频数据确定各无线设备所采集的用户音频数据的时延;根据所述时延及所述音频采集时刻确定各无线设备与用户之间的间距差;获取各无线设备的位置信息,并基于各无线设备的位置信息及所述间距差对所述用户进行定位,确定用户位置信息;基于各无线设备的位置信息及所述用户位置信息从所述多个无线设备确定出所述目标设备。
本申请实施例中,通过确定各无线设备与用户之间的间距差,并基于各无线设备与用户之间的间距差对用户进行定位,确定用户位置信息,然后根据各无线设备的位置信息与用户位置信息确定目标设备,能够较为准确地确定出目标设备。
一实施例中,所述基于所述用户音频数据确定所述多个无线设备中距离用户最近的目标设备,包括:基于所述用户音频数据确定各无线设备所采集的用户音频数据的语音信号强度;确定最强的语音信号强度所对应的无线设备为目标设备。
本申请实施例中,通过基于用户音频数据确定各无线设备所采集的用户音频数据的语音信号强度,并将最强的语音信号强度所对应的无线设备确定为目标设备,由此,能够较为简便地确定处目标设备。
一实施例中,所述方法还包括:在确定所述目标设备所采集的用户音频数据的语音信号强度小于预设值时,从所述多个无线设备中重新确定目标设备。
本申请实施例中,在确定目标设备所采集的用户音频数据的语音信号强度小于预设值时,表明由于用户位置发生变化,导致先前确定的目标设备已并非距离用户最近的设备,此时,从多个无线设备中重新确定目标设备,有助于持续保证对关键字检测和/或语音识别的准确度。
一实施例中,所述目标设备为多个,所述方法还包括:在确定所述多个目标设备所采集的用户音频数据的时延增大至第二预设值时,从所述多个无线设备中重新确定目标设备。
本申请实施例中,在确定多个目标设备所采集的用户音频数据的时延增大至第二预设值时,表明由于用户的位置发生变化,导致先前确定的目标设备已经并非距离用户最近的设备,此时,从多个无线设备中重新确定目标设备,有助于持续保证对关键字检测和/或语音识别的准确度。
一实施例中,在所述基于所述用户音频数据确定所述多个无线设备中距离用户最近的目标设备之后,所述方法还包括:发送停止传送用户音频数据的指令给除所述目标设备的其他无线设备。
本申请实施例中,通过在基于用户音频数据确定多个无线设备中距离用户最近的目标设备之后,发送停止传送用户音频数据的指令给除目标设备的其他无线设备,能够减少不必要的数据传输,减少其他无线设备的数据采集,一定程度上降低其他无线设备的功耗。
一实施例中,各无线设备均具有VAD模块,所述获取所述多个无线设备各自所采集的用户音频数据,包括:获取所述多个无线设备在各自的VAD模块检测到语音信号时所采集的用户音频数据。
本申请实施例中,各无线设备均具有VAD模块,通过获取多个无线设备在各自的VAD模块检测到语音信号时所采集的用户音频数据,有助于减少数据传输,减少不必要的数据处理,以及降低功耗。
本申请还提供一种电子设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述语音识别方法。
本申请还提供一种存储有计算机可读指令的非易失性可读存储介质,所述计算机可读指令被处理器执行时,使得所述处理器执行上述语音识别方法。
本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征、目的和优点将从说明书、附图以及权利要求书变得明显。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请一实施例提供的语音识别方法的应用场景图。
图2为本申请一实施例提供的无线设备的结构示意图。
图3为本申请一实施例提供的语音识别方法的流程图。
图4为本申请一实施例提供的语音识别装置的结构框图。
图5为本申请一实施例提供的电子设备的结构示意图。
图标:无线设备10;处理器11;存储器12;无线通信模块13;数据总线14;无线通信模块15;语音识别装置20;获取模块21;确定模块22;发送模块23;同步模块24。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
请参阅图1,为本申请一实施例所提供的语音识别方法的应用场景。本实施例中,该应用场景为智能家居场景。该场景中,涉及到多个无线设备10。多个无线设备10可以离散地分布在室内各处或多个房间内,以便在后续对用户定位时,能够提升定位的准确度。多个无线设备10相互之间通信连接。无线设备可以是电视,冰箱,电饭煲,空调,饮水机,手机,电脑,音箱或耳机,或者无线麦克风等。可以理解,本申请所提供的语音识别方法也可以应用于其他涉及多个设备无线连接的场景,本申请并不以此为限。
可以理解,根据设备类型的不同,不同的设备可以具有不同的结构和外观。本申请实施例仅针对多个无线设备为实现该语音识别方法所具有的共同结构进行介绍,而对多个无线设备由于设备类型的不同所呈现的不同不作限定。
请参阅图2,本实施例中,每一无线设备10均具有处理器11,存储器12及无线通信模块13。每一无线设备10内的处理器11,存储器12及无线通信模块13相互之间通信连接,例如,通过数据总线14通信连接。根据实际需要,每一无线设备10还可以具有麦克风15。每一无线设备10的麦克风15均与该无线设备10内的处理器11,存储器12及无线通信模块13通信连接,例如,通过数据总线14通信连接。在一些实施例,每一无线设备10的麦克风15先经过相应音频处理模块再通过数据总线14与该无线设备10内的处理器11,存储器12及无线通信模块13通信连接。
针对每一无线设备10而言,存储器12内存储有计算机可读指令;处理器11可以从存储器12中调用并执行该计算机可读指令;麦克风15用于采集音频信号,并将音频信号传输至处理器11进行处理;无线通信模块13用于在处理器11的控制下向外发送无线信号,或者,接收无线信号并传输至处理器11进行处理。
本实施例中,每一无线设备10均可以通过各自的无线通信模块13与该多个无线设备中除自身之外的其他设备无线连接。需要说明的是,无线连接可以是BT(Bluetooth,蓝牙连接)、BLE(Bluetooth Low Energy,蓝牙低功耗连接)、BLE mesh(蓝牙低功耗网络拓扑连接)、LE音频,或WIFI等。
请参阅图3,本申请一实施例提供一种语音识别方法,应用于一电子设备。可以理解,该电子设备可以是图1所示的智能家居场景中的任一无线设备,或者,一与图1所示的智能家居场景中的多个无线设备无线连接的电子设备,例如,手机,电脑等,该电子设备的结构与图2所示的无线设备的结构类似。
本实施例中,该语音识别方法可以包括如下步骤。
步骤S101,获取多个无线设备各自所采集的用户音频数据。
本实施例中,电子设备可以通过无线通信模块获取多个无线设备10通过各自的麦克风15所采集的用户音频数据。
需要说明的是,所获取的多个无线设备各自所采集的用户音频数据可以是多个无线设备各自所采集的部分用户音频数据或多个无线设备各自所采集的完整用户音频数据。本实施例中,所获取的多个无线设备各自所采集的用户音频数据为多个无线设备各自所采集的部分用户音频数据,由此,可以避免过多的数据传输。
一实施例中,各无线设备10还可以具有VAD(Voice Activity Detecting,语音活动检测)模块。此时,步骤S101可以包括获取多个无线设备在各自的VAD模块检测到语音信号后所采集的用户音频数据。由于各无线设备均具有VAD模块,通过获取多个无线设备在各自的VAD模块检测到语音信号后所采集的用户音频数据,有助于减少数据传输,减少不必要的数据处理,以及降低功耗。
一实施例中,各无线设备10还可以包括通信连接的音频处理模块,时钟模块及时钟计数电路(硬件电路)。各无线设备10的音频处理模块采样到麦克风15采到的用户音频数据时,时钟计数电路被触发,锁定并记录时钟模块在该时刻的时钟计数值,作为音频采集时刻。此时,步骤S101可以包括:获取多个无线设备各自所采集的用户音频数据以及所记录的音频采集时刻。音频处理模块可以是通过模数转换器与麦克风15(模拟麦克风)相连,在某些情况下音频数据经过模数转换器再经过滤波与下采样。音频处理模块也可以是通过管脚与麦克风15(数字麦克风)相连,在某些情况下音频数据再经过滤波与下采样。
步骤S102,基于用户音频数据确定多个无线设备中距离用户最近的目标设备。
在步骤S101包括获取多个无线设备各自所采集的用户音频数据以及所记录的音频采集时刻时,步骤S102可以包括以下步骤。
步骤S201,基于用户音频数据确定各无线设备所采集的用户音频数据的时延。
其中,基于用户音频数据确定各无线设备所采集的用户音频数据的时延可以通过将多个无线设备中的任意两者所采集的用户音频数据进行互相关,由此来确定两者所采集的用户音频数据的时延。其他无线设备所采集的用户音频数据的时延,以此类推。可以理解,互相关技术为本领域现有技术,在此不做展开介绍。
步骤S202,根据时延及音频采集时刻确定各无线设备与用户之间的间距差。
本实施例中,步骤S202可以包括如下步骤。
首先,根据时延及音频采集时刻确定各无线设备10与用户之间的时延差。
下面以确定多个无线设备10中的无线设备A与无线设备B的时延差为例进行说明。无线设备A与无线设备B各自所采集的用户音频数据的时延为x,无线设备A所记录的音频采集时刻为t1,无线设备B所记录的音频采集时刻为t2,则无线设备A与无线设备B之间的时延差=x+|t2-t1|,其中,|t2-t1|表示t2与t1的差的绝对值。
接着,基于时延差,通过公式:间距差=时延差*声速,求得间距差。
可以理解,对于多个无线设备10中的任意两个无线设备10均可以采用前述方式求得两者与用户之间的间距差。
步骤S203,获取各无线设备的位置信息,并基于各无线设备的位置信息及间距差对用户进行定位。
需要说明的是,各无线设备的位置信息可以是基于同一坐标系下的各无线设备的坐标。各无线设备的位置信息可以预先确定,并保存在各无线设备的存储器中。在获取到各无线设备的位置信息以及确定各无线设备与用户之间的间距差之后,可以基于数学及几何理论(例如,三角形理论等)对用户的位置进行定位,例如,可以以无线设备A与无线设备B的连线为三角形的一条边,以无线设备A与假定用户位置的连线为三角形的第二条边,以无线设备B与假定用户位置的连线为三角形的第三条边,构建三角形,其中,第二条边与第三条边需使得无线设备A及无线设备B与用户之间的间距差满足前面所确定出无线设备A和无线设备B与用户之间的间距差;接着,以无线设备A与无线设备C的连线为三角形的一条边,以无线设备A与假定用户位置的连线为三角形的第二条边,以无线设备C与假定用户位置的连线为三角形的第三条边,其中,第二条边与第三条边需使得无线设备A及无线设备C与用户之间的间距差满足前面所确定出无线设备A和无线设备C与用户之间的间距差,以此类推,直到确定处重合的假定用户位置,该重合的假定用户位置即为用户的实际位置,由此,实现对用户进行定位。
步骤S204,基于各无线设备的位置信息及用户的位置信息从多个无线设备中确定出距离用户最近的目标设备。
通过上述方式,能够较为准确地确定出距离用户最近的目标设备。
步骤S103,发送指令至目标设备,以对目标设备所采集的用户音频数据进行关键字检测和/或语音识别。
可以理解,对目标设备所采集的用户音频数据进行关键字检测和/或语音识别可以由目标设备来完成;或者,由预先在多个无线设备10确定出的中心设备(通常为具有较高运算能力的设备)来完成;或者,由目标设备的后台服务器或云端服务器(例如,目标设备的厂商对应的云端服务器等)来完成。因此,在确定出目标设备后,可以发送指令至目标设备,以使目标设备对自身所采集的用户音频数据进行关键字检测和/或语音识别;或者,以使目标设备将自身所采集的用户音频数据发送至预先确定的中心设备进行关键字检测和/或语音识别;或者,以使目标设备将自身所采集的用户音频数据发送至后台服务器或云端服务器进行关键字检测和/或语音识别。
本申请实施例所提供的语音识别方法,通过获取多个无线设备各自所采集的用户音频数据,确定处多个无线设备中距离用户最近的目标设备,然后发送指令至目标设备,以对目标设备所采集的用户音频数据进行关键字检测和/或语音识别,由于并非每个无线设备均需要对用户音频数据进行关键字检测和/或语音识别,因此,可以降低智能家居的整体功耗;由于是采用距离用户最近的设备所采集的用户音频数据进行关键字检测和/或语音识别,因此,能够提高关键字检测和/或语音识别的准确度,避免控制出错的问题。
可以理解,步骤S101之前,该语音识别方法还可以包括与多个无线设备进行时钟同步的步骤。通过在获取多个无线设备所采集的用户语音信号之前,与多个无线设备进行时钟同步,有助于减少因为时钟不同步对后续确定目标设备所造成的不良影响,因此,一定程度上提升语音识别方法的准确性。可选地,通过发送无线帧至各无线设备10,以使各无线设备基于无线帧实现与自身时钟同步。其中,无线帧携带有同步码。具体地,各无线设备10的处理器11内可以包括通信连接的处理模块,时钟模块及时钟计数电路(硬件电路)。各无线设备10在接收到同步码时,通过处理器11的处理模块完成基于同步码的同步处理。具体地,各无线设备10通过硬件电路成功接收到同步码,时钟计数电路被触发,锁定并记录时钟模块在该时刻的时钟计数值。电子设备在前后两个同步码的发送时间间隔是固定的,比如,对于蓝牙而言,前后两个同步码的发送时间间隔可以是1.25ms,这个时间间隔是按电子设备的时钟计数得到。各无线设备10利用接收到不同帧之间同步码时锁定并记录的时钟计数值可以获得与电子设备之间时钟周期的差异,从而自身的时钟,使之与电子设备之间时钟同步,从而实现时钟同步。
可以理解,步骤S102还可以通过如下方式确定目标设备。首先,基于用户音频数据确定各无线设备所采集的用户音频数据的语音信号强度;然后,确定最强的语音信号强度所对应的无线设备为目标设备。通过基于用户音频数据确定各无线设备所采集的用户音频数据的语音信号强度,并将最强的语音信号强度所对应的无线设备确定为目标设备,由此,能够较为简便地确定处目标设备。
一实施例中,各无线设备10在采集到用户音频数据时,可以自身确定各自所采集到的用户音频数据的语音信号强度,步骤S101中在获取多个无线设备各自所采集的用户音频数据还可以一并获取各无线设备所确定的语音信号强度。
另一实施例中,电子设备在获取到多个无线设备各自所采集的用户音频数据之后,可以基于所获取的用户音频数据确定多个无线设备各自所采集的用户音频数据对应的语音信号强度。
可以理解,基于音频数据确定语音信号强度的具体过程为本领域现有技术,在此不做展开说明。
可以理解,在步骤S102之后,该语音识别方法还可以包括在确定目标设备所采集的用户音频数据的语音信号强度小于预设值时,从多个无线设备中重新确定目标设备的步骤。在确定目标设备所采集的用户音频数据的语音信号强度小于预设值时,表明由于用户位置发生变化,导致先前确定的目标设备已并非距离用户最近的设备,此时,从多个无线设备中重新确定目标设备,有助于持续保证对关键字检测和/或语音识别的准确度。该语音识别方法还可以包括在确定目标设备所采集的用户音频数据的语音信号强度大于预设值时,不再从其它多个无线设备中获取用户音频数据。其它多个无线设备也不用采集并发送用户音频数据。这样,有利于降低各个无线设备的功耗。
可以理解,步骤S102所确定出目标设备的数量可以是多个,此时,该音频识别方法还包括:在确定多个目标设备所采集的用户音频数据的时延增大至第二预设值时,从多个无线设备中重新确定目标设备。通过在确定多个目标设备所采集的用户音频数据的时延增大至第二预设值时,表明由于用户的位置发生变化,导致先前确定的目标设备已经并非距离用户最近的设备,此时,从多个无线设备中重新确定目标设备,有助于持续保证对关键字检测和/或语音识别的准确度。
可以理解,在步骤S102之后,该语音识别方法还可以包括:发送继续传送用户音频数据的指令给目标设备,以及发送停止传送用户音频数据的指令给除目标设备的其他无线设备的步骤。通过在基于用户音频数据确定多个无线设备中距离用户最近的目标设备之后,发送停止传送用户音频数据的指令给除目标设备的其他无线设备,能够减少不必要的数据传输,减少不同无线设备的无线传输之间的相互干扰,减少其他无线设备的数据采集,一定程度上降低其他无线设备的功耗。
请参阅图4,基于同一发明构思,本申请实施例中还提供一种语音识别装置20,应用于一电子设备,所述电子设备用于无线连接多个无线设备。可以理解,该电子设备可以是图1所示的智能家居场景中的任一无线设备,或者,一与图1所示的智能家居场景中的多个无线设备无线连接的电子设备,例如,手机,电脑等,该电子设备的结构与图2所示的无线设备的结构类似。本实施例中,语音识别装置20包括:获取模块21,确定模块22及发送模块23。
获取模块21,用于获取所述多个无线设备各自所采集的用户音频数据。
确定模块22,用于基于所述用户音频数据确定所述多个无线设备中距离用户最近的目标设备。
发送模块23,用于发送指令至所述目标设备,以对所述目标设备所采集的用户音频数据进行关键字检测和/或语音识别。
一实施例中,该语音识别装置还包括同步模块24,用于与所述多个无线设备进行时钟同步。
一实施例中,获取模块21,还用于获取所述多个无线设备各自所采集的用户音频数据以及所记录的音频采集时刻。相应地,确定模块22还用于基于所述用户音频数据确定各无线设备所采集的用户音频数据的时延;根据所述时延及所述音频采集时刻确定各无线设备与用户之间的间距差;获取各无线设备的位置信息,并基于各无线设备的位置信息及所述间距差对所述用户进行定位,确定用户位置信息;基于各无线设备的位置信息及所述用户位置信息从所述多个无线设备确定出所述目标设备。
一实施例中,所述目标设备为多个,确定模块22还用于在确定所述多个目标设备所采集的用户音频数据的时延增大至第二预设值时,从所述多个无线设备中重新确定目标设备。
一实施例中,确定模块22还用于基于所述用户音频数据确定各无线设备所采集的用户音频数据的语音信号强度;确定最强的语音信号强度所对应的无线设备为目标设备。
一实施例中,确定模块22还用于在确定所述目标设备所采集的用户音频数据的语音信号强度小于预设值时,从所述多个无线设备中重新确定目标设备。
一实施例中,发送模块23还用于发送停止传送用户音频数据的指令给除所述目标设备的其他无线设备。
一实施例中,各无线设备均具有VAD模块,获取模块21还用于获取所述多个无线设备在各自的VAD模块检测到语音信号时所采集的用户音频数据。
可以理解,本申请提供的语音识别装置20与本申请提供的语音识别方法对应,为使说明书简洁,相同或相似部分可以参照语音识别方法部分的内容,在此不再赘述。
上述语音识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于服务器中的处理器中,也可以以软件形式存储于服务器中的存储器中,以便于处理器调用执行以上各个模块对应的操作。该处理器可以为中央处理单元(CPU)、微处理器、单片机等。
上述语音识别方法和/或语音识别装置可以实现为一种计算机可读指令的形式,计算机可读指令可以在如图5所示的电子设备上运行。
本申请实施例还提供的一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令,该处理器执行该程序时实现上述的语音识别方法。
图5为根据本申请的一个实施例的电子设备的内部结构示意图,电子设备可以为服务器。请参阅图5,该电子设备包括通过系统总线连接的处理器、非易失性存储介质、内存储器、输入装置、显示屏和网络接口。其中,该电子设备的非易失性存储介质可存储操作系统和计算机可读指令,该计算机可读指令被执行时,可使得处理器执行本申请各实施例的一种语音识别方法,该方法的具体实现过程可参考图3的具体内容,在此不再赘述。该电子设备的处理器用于提供计算和控制能力,支撑整个电子设备的运行。该内存储器中可储存有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种语音识别方法。电子设备的输入装置用于各个参数的输入,电子设备的显示屏用于进行显示,电子设备的网络接口用于进行网络通信。本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
基于同一发明构思,本申请实施例提供的一种计算机可读存储介质,其上存储有计算机可读指令,该程序被处理器执行时实现上述的语音识别方法中的步骤。
如此处所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性。合适的非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种语音识别方法,其特征在于,应用于一电子设备,所述电子设备用于无线连接多个无线设备,所述方法包括:
获取所述多个无线设备各自所采集的用户音频数据;
基于所述用户音频数据确定所述多个无线设备中距离用户最近的目标设备;
发送指令至所述目标设备,以对所述目标设备所采集的用户音频数据进行关键字检测和/或语音识别。
2.如权利要求1所述的语音识别方法,其特征在于,在获取所述多个无线设备所采集的用户语音信号之前,所述方法还包括:
与所述多个无线设备进行时钟同步。
3.如权利要求2所述的语音识别方法,其特征在于,所述获取所述多个无线设备各自所采集的用户音频数据,包括:
获取所述多个无线设备各自所采集的用户音频数据以及所记录的音频采集时刻;
相应地,所述基于所述用户音频数据确定所述多个无线设备中距离用户最近的目标设备,包括:
基于所述用户音频数据确定各无线设备所采集的用户音频数据的时延;
根据所述时延及所述音频采集时刻确定各无线设备与用户之间的间距差;
获取各无线设备的位置信息,并基于各无线设备的位置信息及所述间距差对所述用户进行定位,确定用户位置信息;
基于各无线设备的位置信息及所述用户位置信息从所述多个无线设备确定出所述目标设备。
4.如权利要求3所述的语音识别方法,其特征在于,所述目标设备为多个,所述方法还包括:
在确定所述多个目标设备所采集的用户音频数据的时延增大至第二预设值时,从所述多个无线设备中重新确定目标设备。
5.如权利要求1所述的语音识别方法,其特征在于,所述基于所述用户音频数据确定所述多个无线设备中距离用户最近的目标设备,包括:
基于所述用户音频数据确定各无线设备所采集的用户音频数据的语音信号强度;
确定最强的语音信号强度所对应的无线设备为目标设备。
6.如权利要求5所述的语音识别方法,其特征在于,所述方法还包括:
在确定所述目标设备所采集的用户音频数据的语音信号强度小于预设值时,从所述多个无线设备中重新确定目标设备。
7.如权利要求1所述的语音识别方法,其特征在于,在所述基于所述用户音频数据确定所述多个无线设备中距离用户最近的目标设备之后,所述方法还包括:
发送停止传送用户音频数据的指令给除所述目标设备的其他无线设备。
8.如权利要求1所述的语音识别方法,其特征在于,各无线设备均具有VAD模块,所述获取所述多个无线设备各自所采集的用户音频数据,包括:
获取所述多个无线设备在各自的VAD模块检测到语音信号时所采集的用户音频数据。
9.一种电子设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1-8任一项所述的语音识别方法。
10.一种存储有计算机可读指令的非易失性可读存储介质,所述计算机可读指令被处理器执行时,使得所述处理器执行如权利要求1-8任一项所述的语音识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011596082.2A CN112750439B (zh) | 2020-12-29 | 2020-12-29 | 语音识别方法,电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011596082.2A CN112750439B (zh) | 2020-12-29 | 2020-12-29 | 语音识别方法,电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112750439A true CN112750439A (zh) | 2021-05-04 |
CN112750439B CN112750439B (zh) | 2023-10-03 |
Family
ID=75646858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011596082.2A Active CN112750439B (zh) | 2020-12-29 | 2020-12-29 | 语音识别方法,电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112750439B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107452386A (zh) * | 2017-08-16 | 2017-12-08 | 联想(北京)有限公司 | 一种语音数据处理方法和系统 |
CN108461084A (zh) * | 2018-03-01 | 2018-08-28 | 广东美的制冷设备有限公司 | 语音识别系统控制方法、控制装置及计算机可读存储介质 |
US20180349086A1 (en) * | 2017-05-31 | 2018-12-06 | International Business Machines Corporation | Auto-mute redundant devices in a conference room |
CN108962263A (zh) * | 2018-06-04 | 2018-12-07 | 百度在线网络技术(北京)有限公司 | 一种智能设备控制方法及系统 |
CN109917663A (zh) * | 2019-03-25 | 2019-06-21 | 北京小米移动软件有限公司 | 设备控制的方法和装置 |
CN110400566A (zh) * | 2019-06-27 | 2019-11-01 | 联想(北京)有限公司 | 识别方法和电子设备 |
CN110675887A (zh) * | 2019-09-12 | 2020-01-10 | 厦门亿联网络技术股份有限公司 | 一种用于会议系统的多麦克风切换方法和系统 |
CN110910880A (zh) * | 2019-11-29 | 2020-03-24 | 广东美的厨房电器制造有限公司 | 语音控制方法、系统、设备及存储介质 |
CN111192591A (zh) * | 2020-02-10 | 2020-05-22 | 百度在线网络技术(北京)有限公司 | 智能设备的唤醒方法、装置、智能音箱及存储介质 |
CN111640433A (zh) * | 2020-06-01 | 2020-09-08 | 珠海格力电器股份有限公司 | 语音交互方法、存储介质、电子设备及智能家居系统 |
-
2020
- 2020-12-29 CN CN202011596082.2A patent/CN112750439B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180349086A1 (en) * | 2017-05-31 | 2018-12-06 | International Business Machines Corporation | Auto-mute redundant devices in a conference room |
CN107452386A (zh) * | 2017-08-16 | 2017-12-08 | 联想(北京)有限公司 | 一种语音数据处理方法和系统 |
CN108461084A (zh) * | 2018-03-01 | 2018-08-28 | 广东美的制冷设备有限公司 | 语音识别系统控制方法、控制装置及计算机可读存储介质 |
CN108962263A (zh) * | 2018-06-04 | 2018-12-07 | 百度在线网络技术(北京)有限公司 | 一种智能设备控制方法及系统 |
CN109917663A (zh) * | 2019-03-25 | 2019-06-21 | 北京小米移动软件有限公司 | 设备控制的方法和装置 |
CN110400566A (zh) * | 2019-06-27 | 2019-11-01 | 联想(北京)有限公司 | 识别方法和电子设备 |
CN110675887A (zh) * | 2019-09-12 | 2020-01-10 | 厦门亿联网络技术股份有限公司 | 一种用于会议系统的多麦克风切换方法和系统 |
CN110910880A (zh) * | 2019-11-29 | 2020-03-24 | 广东美的厨房电器制造有限公司 | 语音控制方法、系统、设备及存储介质 |
CN111192591A (zh) * | 2020-02-10 | 2020-05-22 | 百度在线网络技术(北京)有限公司 | 智能设备的唤醒方法、装置、智能音箱及存储介质 |
CN111640433A (zh) * | 2020-06-01 | 2020-09-08 | 珠海格力电器股份有限公司 | 语音交互方法、存储介质、电子设备及智能家居系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112750439B (zh) | 2023-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107852437B (zh) | 用于在电子设备中输出音频的方法和装置 | |
CN112736599B (zh) | 用于提供接口的方法和装置 | |
US11019427B2 (en) | Electronic device including a microphone array | |
CN106060378B (zh) | 用于设置拍摄模块的装置和方法 | |
JP2019186932A (ja) | ブルートゥース接続方法、装置、及びインテリジェントターミナル | |
AU2015219766B2 (en) | Electronic device and method for processing image | |
US10852719B2 (en) | Server, electronic device, and electronic device information providing method | |
CN108766457B (zh) | 音频信号处理方法、装置、电子设备及存储介质 | |
KR102547104B1 (ko) | 전자 장치 및 복수의 영상을 처리하는 방법 | |
CN106101979A (zh) | 用于短距离无线通信的方法和使用该方法的电子设备 | |
CN111063343B (zh) | 语音交互方法、装置、电子设备及介质 | |
EP3147730A1 (en) | Sound box parameter configuration method, mobile terminal, server, and system | |
EP2844007B1 (en) | Method for transmitting contents and electronic device thereof | |
CN109525881A (zh) | 音画同步方法、装置及设备 | |
EP2942930A2 (en) | Sensor module and device including the same | |
US20150103222A1 (en) | Method for adjusting preview area and electronic device thereof | |
KR102262218B1 (ko) | 이어잭 인식 방법 및 이를 지원하는 전자 장치 | |
US9955068B2 (en) | Apparatus and method for operating a composition of a picture in a portable terminal | |
KR20150056690A (ko) | 번역 상황을 인지하고 번역 기능을 수행하는 방법 및 이를 구현하는 전자장치 | |
CN105830421B (zh) | 电子装置及其操作方法 | |
KR20170120707A (ko) | 터치 스크린의 포인트 보고를 처리하는 방법, 장치, 프로그램 및 기록매체 | |
CN115390014A (zh) | 距离确定方法及装置、终端、计算机可读存储介质 | |
CN114915511B (zh) | 一种分体设备的控制方法及装置 | |
CN112905035A (zh) | 触摸屏控制方法及装置、计算机存储介质 | |
US10108391B2 (en) | Audio data operating method and electronic device supporting the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |