CN108320739A - 根据位置信息辅助语音指令识别方法和装置 - Google Patents
根据位置信息辅助语音指令识别方法和装置 Download PDFInfo
- Publication number
- CN108320739A CN108320739A CN201711401062.3A CN201711401062A CN108320739A CN 108320739 A CN108320739 A CN 108320739A CN 201711401062 A CN201711401062 A CN 201711401062A CN 108320739 A CN108320739 A CN 108320739A
- Authority
- CN
- China
- Prior art keywords
- personnel
- location information
- voice
- information
- role
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000002452 interceptive effect Effects 0.000 claims abstract description 21
- 238000004458 analytical method Methods 0.000 claims description 7
- 230000027455 binding Effects 0.000 claims description 4
- 238000009739 binding Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S11/00—Systems for determining distance or velocity not using reflection or reradiation
- G01S11/14—Systems for determining distance or velocity not using reflection or reradiation using ultrasonic, sonic, or infrasonic waves
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种根据位置信息辅助语音指令识别方法,包括:根据语音信息进行语义识别,得到语义信息;确定发出语音的人员的位置信息,根据得到的人员的位置信息判断存在于被限定空间中的子区域,不同子区域设置有不同的操作范围和权限,结合语义信息得到交互意图,生成操作指令。可以对缺乏精确指向的语音交互信息进行加工,辅助判断人员的语音交互意图,可以快速有效的进行语音交互。
Description
技术领域
本发明属于语音识别处理技术领域,具体地涉及一种根据位置信息辅助 语音指令识别方法和装置,使用模糊的语句与交通工具内的设备进行精确交 互。
背景技术
随着汽车工业的发展以及电子市场的成熟,车载智能终端逐渐成为汽车 重要的配套设备。近年来,经济的繁荣也促使国内的汽车数量急剧增加,人 们的出行习惯也随之发生变化,人车共处的时间越来越长。因此,车载智能 终端的功能也从简单的行车导航向多功能的方向改变。
在新近发展出的众多功能中,语音指令的识别和执行十分引人注目。比 如汽车等现代交通工具通常利用语音识别处理来接受来自驾驶员或其它乘 员的可听见输入和指令。例如,人可以使用可听见指令来选择娱乐选项或参 与移动电话对话。
然而,现有的车载语音识别处理技术中,使用模糊的语句(缺乏精确指 向的语音),一般无法得到乘员的语音交互意图。
中国专利文献CN 104244143公开了一种确定正在进行说话的乘员在被 限定空间内的乘员位置的方法,通过分析座椅传感器的座椅传感器数据确定 乘员的位置,通过搜索与被反射的波相对应的信号的时空和/或速率特征中 的区别特征,来辨识正在进行说话的乘员的嘴部的运动,确定乘员正在进行 说话,从而确定正在说话的乘员的位置。该方法确定的正在说话的乘员的位 置的计算复杂度较高,存在一定的时延问题,无法快速的确定目标位置。
发明内容
针对现有技术中存在的上述技术问题,本发明提出了一种根据位置信息 辅助语音指令识别方法和装置,对缺乏精确指向的语音交互信息进行加工, 辅助判断人员的语音交互意图,可以快速有效的进行语音交互。
本发明的技术方案是:
一种根据位置信息辅助语音指令识别方法,包括以下步骤:
S01:根据语音信息进行语义识别,得到语义信息;
S02:确定发出语音的人员的位置信息,根据得到的人员的位置信息判 断存在于被限定空间中的子区域,不同子区域设置有不同的操作范围,结合 语义信息得到交互意图,生成操作指令。
优选的,所述步骤S02中生成操作指令之前,还包括,鉴定人员的角色 及其对应的设备操作范围和权限,鉴定成功后生成操作指令。
优选的,所述操作范围和权限为预先定义的,预先定义操作范围和权限 的方法包括,
S11:分析被限定空间中人员可能存在的区域,将区域信息划分为区域 坐标;
S12:根据不同的区域坐标定义角色,为不同的角色定义不同的设备操 作范围和权限。
优选的,所述步骤S02中,若语音信息包含位置指向信息,则根据判断 得到的子区域,得到语音信息中位置指向信息的准确位置。
优选的,人员的角色通过人员的位置信息或者与角色绑定的人员的生物 特征识别。
优选的,所述人员的位置信息的确定,包括:
S21:麦克风阵列根据接收到的语音确定信号向量;
S22:将所述信号向量与各语音来波方向角度对应的来波矢量进行匹配, 得到相对应的匹配系数,所述语音来波方向角度根据麦克风阵列和被限定空 间内的确定位置的相对位置的几何角度进行确定;
S23:根据匹配系数的值估计语音来波方向,确定人员的位置。
本发明又公开了一种根据位置信息辅助语音指令识别装置,包括,
一语音分析模块,根据语音信息进行语义识别,得到语义信息;
一位置确定模块,确定发出语音的人员的位置信息,根据得到的人员的 位置信息判断存在于被限定空间中的子区域,不同子区域设置有不同的操作 范围;
一指令生成模块,根据得到的人员的位置信息,结合语义信息得到交互 意图,生成操作指令。
优选的,所述指令生成模块在生成操作指令之前,鉴定人员的角色及其 对应的设备操作范围和权限,鉴定成功后生成操作指令。
优选的,所述操作范围和权限为预先定义的,预先定义操作范围和权限 的方法包括,
S11:分析被限定空间中人员可能存在的区域,将区域信息划分为区域 坐标;
S12:根据不同的区域坐标定义角色,为不同的角色定义不同的设备操 作范围和权限。
优选的,人员的角色通过人员的位置信息或者与角色绑定的人员的生物 特征识别。
优选的,所述人员的位置信息的确定,包括:
S21:麦克风阵列根据接收到的语音确定信号向量;
S22:将所述信号向量与各语音来波方向角度对应的来波矢量进行匹配, 得到相对应的匹配系数,所述语音来波方向角度根据麦克风阵列和被限定空 间内的确定位置的相对位置的几何角度进行确定;
S23:根据匹配系数的值估计语音来波方向,确定人员的位置。
与现有技术相比,本发明的优点是:
1、对缺乏精确指向的语音交互信息进行加工,辅助判断人员的语音交 互意图,本发明的语音来波方向估计方法计算复杂度低,语音来波方向估计 精度高,延时小等,可以快速有效的进行语音交互。能很好的满足车载语音 系统的要求,实用性强,具有很高的应用前景。
2、根据人员的不同位置识别出人员的角色,并与人员的生物特征绑定, 辅助进行角色识别,当人员即使在后续过程中移动到其他位置的时候,也会 继续被赋予相关的权限。
附图说明
下面结合附图及实施例对本发明作进一步描述:
图1为本发明根据位置信息辅助语音指令识别方法的流程图;
图2为本发明一区域操作范围的示意图;
图3为本发明另一区域操作范围的示意图;
图4为本发明一实施例的场景应用示意图;
图5为本发明另一实施例的场景应用示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施 方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例 性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结 构和技术的描述,以避免不必要地混淆本发明的概念。
实施例:
下面结合附图,对本发明的较佳实施例作进一步说明。
本发明以交通工具为例进行说明,当然也可以为其他的被限定空间内的 有确定位置的场景,例如会议室等。
实施例1:
如图1所示,一种根据位置信息辅助语音指令识别方法,包括以下步骤:
人员的语音交互内容预处理结果3.1.1,主要是根据语音信息进行语义 识别,得到语义信息;
例如,人员发出“关闭车窗”的语音指令信息,该语音信息不排除已经 预先处理过,例如去噪、放大等等。根据该语音信息进行语义识别,得到语 义信息。语义识别的方法可以利用现有的语义识别方法得到,这里不再赘述。
判断出人员的位置信息3.1.2,通过外部系统会给出人员的位置信息。
如图2所示,设置好交通工具内人员的可能存在的空间区域并进行标识 3.2.1。
通过分析将交通工具中(如果是开放式的搭乘方式,将也会包含交通工 具之上的位置)人员可能存在的区,将这些区域都抽象成具体的区域坐标, 比如可以把五座家用轿车用最简单的一个数字或者字母等符号作为坐标,例 如驾驶座为A号位置,副驾驶B号位置,后排C,D,E号位置,同时可能 这个车的车顶被改装后可以站一个人,我把车顶就定义为交通工具座舱外的 一个位置,但是还是属于交通工具上的位置,定义为F号位置,当我们说F 号位置就是指的是车顶位置。
对各个区域的可通过语音控制的设备操作范围和权限进行定义3.2.2。
根据区域坐标预先定义该区域内的人员语音交互可操控的操作范围和 权限,如图2的E号位置可操控的操作范围为设备1-4,不同区域的操作范 围可以是重合的比如图3,坐标C的交互区域包括了装置2,4,5,6,和之 前E的交互区域交叉了装置2和4。
操作权限包括可操作的设备的范围以及对某一设备可执行的具体操作 如开启、关闭、运行到某一程度等。当然,会根据一些特殊的位置定义该位 置的人员的操作权限,比如驾驶座位的人员将会被赋予更加高的操作权限。 例如,当人员处于左前驾驶位时,当人员发出的语音指令为“关闭右侧车窗”, 会关闭右侧所有的窗户,当处于副驾驶位或者后排座位时,只会关闭靠近座 位的窗户。
识别出以人员所在位置为坐标的相对位置信息3.2.4。
当输入的人员位置信息和系统内预设的区域坐标进行比对后判断出人 员所在交通工具中/上的位置,也就是得到人员所在的区域坐标,以该人员 位置作为一个参考坐标,判断人员语言中位置指向信息的准确位置。确定以 该人员为相对位置的右侧位置,结合语义信息“关闭”,“车窗”,得到交互 意图,生成操作指令。
上面介绍了语音信息中包含了位置指向信息(例如,左侧、右侧等), 然而更多的场景是语音信息中不保护位置指向信息,例如“开窗”,如果语 义中未曾包含位置指向信息,系统直接根据人员的所在的区域坐标对应的操 作范围和权限找到准确的操作设备,结合语义信息“开”,“窗”,得到交互 意图,生成操作指令。
在生成操作指令之前,还需要鉴定人员的角色及其对应的设备操作范围 和权限3.2.3,鉴定成功后生成操作指令。
根据不同的区域坐标定义角色,为不同的角色定义不同的设备操作范围 和权限3.4。如某些飞机上前排两个位置,左侧驾驶位置是机长,右侧驾驶 位置是大副,从而辅助交通工具对该人员进行正确的权限赋权。
在初始时,或者特定的设置模式时,当人员在一定位置完成和交通工具 或者相关软件完成交互之后,人员在交通工具或者软件中被确认的身份以及 权限将会被系统记录下来,当人员即使在后续过程中移动到其他位置的时候, 也会继续被赋予相关的权限。并且在人员身份和权限的记录过程中,其相关 的生物特征将会同时被记录下来,比如指纹,声纹,虹膜,面部特征等,其 身份和权限也会和其生物特征绑定起来,当人员在过一段时间后再进入同一 个交通工具或者其他交通工具时可以同时被识别出来并被赋予之前系统赋予的权限和身份。比如初始机长位置的驾驶员有机长权限,飞机将会记下这 个位置的人员的生物特征或其他特征,即使其离开位置到休息区域后其仍然 会通过特征识别被赋予机长权限。
根据得到的人员的位置信息分析语音信息中位置指向信息的准确位置, 结合语义信息得到交互意图,生成操作指令3.3。例如,当人员处于左前驾 驶位时,当人员发出的语音指令为“关闭右侧车窗”,只需要说出右侧一类 语义的交互语音再加上本身带有关窗语义的交互信息,本发明将会识别出所 关窗户是处于该人员右侧从而判断出其操作意图是关闭右侧的窗户。
通过外部系统会给出人员的位置信息的方法有很多种,该实施例主要描 述通过语音确定发出语音的人员的位置信息的方法,具体如下:
如图4所示,以五座轿车为例,车内配置一个麦克风阵列,麦克风阵列 一般设置在车头位置处。根据麦克风阵列的位置,以及五个座位的位置,在 物理几何上计算相应的角度θ1,θ2,…,θ5。
根据记录的角度,计算相应的来波矢量。对于第i个角度θi,对应的来 波矢量为:
其中,K为麦克风数,d表示相邻麦克风之间的间距,λ表示声波的波 长。
在第n个时刻,第j个座位上的乘客发出语音信号,麦克风阵列接收到 的信号向量可以表示为:
y(n)=ηjα(θj)+w(n)
其中,ηj表示从第j个座位到麦克风阵列的路径损耗,w(n)为噪声向量。
将接收信号与可能的角度矢量进行匹配操作,得到的匹配系数如下:
那么j的估计可以表示:
得到了j的估计,也就确定了乘客的语音来波方向,换句话说就确定为 发出语音的乘客的位置。
实施例2:
因为精度问题,当一个麦克风阵列无法精确识别位置时,可增加一个或 者多个麦克风整列进行辅助识别位置,根据不同麦克风阵列的匹配系数最终 确定位置。比如图5所示是一个经典的2+2+3的商务车布局并且除了麦克风 阵列1还另外增加了麦克风阵列2,可能处于系统性能的限制,麦克风阵列 1识别出的向量和图中θ1和θ2的相关性可能无法精确对比,则可以辅助于麦 克风阵列2中识别出向量以及进行判断,从而精确定位语音声源是来自 右中位置还是右后位置。
具体执行步骤如下:
根据麦克风阵列和被限定空间内的确定位置的相对位置,几何上确定相 对于第p(P>=1)个麦克风阵列可能的语音来波方向角度θp,1,…,θp,N,N为位置 数,此处p=2,N=7;
计算第i个角度θi,对应的来波矢量为:
其中,K为麦克风数,d表示相邻麦克风之间的间距,λ表示声波的波长;
计算第p个麦克风阵列接收到的信号向量,为:
yp(n)=ηp,jα(φp,j)+wp(n);
其中,ηp,j表示语音从第j个位置到第p个麦克风阵列的路径损耗,φp,j表 示从第j个位置到第p个麦克风阵列可能的入射角(语音来波方向角度), wp(n)为噪声向量;
将接收信号与来波矢量进行匹配操作,得到匹配系数为:
第p个麦克风阵列估计的语音来波方向的计算公式为:
根据多个确定待定位目标的位置。具体准则如下:
其中表示四舍五入操作。
此外,麦克风阵列的布局将会是一个比较灵活的布局形式,将可能是同 一个阵列的麦克风分散在交通工具的相对较远的地方,例如一个麦克风阵列 包括4个麦克风,其分布在车内四个非一个相对声源一个方向的位置上。也 可以是多个阵列的子麦克风相互穿插分散分布。都可以适用于本发明的方法 进行位置识别。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释 本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和 范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保 护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和 边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (10)
1.一种根据位置信息辅助语音指令识别方法,其特征在于,包括以下步骤:
S01:根据语音信息进行语义识别,得到语义信息;
S02:确定发出语音的人员的位置信息,根据得到的人员的位置信息判断存在于被限定空间中的子区域,不同子区域设置有不同的操作范围,结合语义信息得到交互意图,生成操作指令。
2.根据权利要求1所述的根据位置信息辅助语音指令识别方法,其特征在于,所述步骤S02中生成操作指令之前,还包括,鉴定人员的角色及其对应的操作范围和权限,鉴定成功后生成操作指令。
3.根据权利要求2所述的根据位置信息辅助语音指令识别方法,其特征在于,所述操作范围和权限为预先定义的,预先定义操作范围和权限的方法包括:
S11:分析被限定空间中人员可能存在的子区域,将将子区域的区域信息划分为区域坐标;
S12:根据不同的区域坐标定义角色,为不同的角色定义不同的设备操作范围和权限;
将得到的人员的位置信息与所在子区域的区域坐标相对应,将角色与所述人员的位置信息相关联。
4.根据权利要求1所述的根据位置信息辅助语音指令识别方法,其特征在于,所述步骤S02中,若语音信息包含位置指向信息,则根据判断得到的子区域,得到语音信息中位置指向信息的准确位置。
5.根据权利要求2所述的根据位置信息辅助语音指令识别方法,其特征在于,人员的角色通过人员的位置信息或者与角色绑定的人员的生物特征识别。
6.根据权利要求1所述的根据位置信息辅助语音指令识别方法,其特征在于,所述人员的位置信息的确定,包括:
S21:麦克风阵列根据接收到的语音确定信号向量;
S22:将所述信号向量与各语音来波方向角度对应的来波矢量进行匹配,得到相对应的匹配系数,所述语音来波方向角度根据麦克风阵列和被限定空间内的确定位置的相对位置的几何角度进行确定;
S23:根据匹配系数的值估计语音来波方向,确定人员的位置。
7.一种根据位置信息辅助语音指令识别装置,其特征在于,包括,
一语音分析模块,根据语音信息进行语义识别,得到语义信息;
一位置确定模块,确定发出语音的人员的位置信息,根据得到的人员的位置信息判断存在于被限定空间中的子区域,不同子区域设置有不同的操作范围;
一指令生成模块,根据得到的人员的位置信息,结合语义信息得到交互意图,生成操作指令。
8.根据权利要求7所述的根据位置信息辅助语音指令识别装置,其特征在于,所述指令生成模块在生成操作指令之前,鉴定人员的角色及其对应的设备操作范围和权限,鉴定成功后生成操作指令。
9.根据权利要求8所述的根据位置信息辅助语音指令识别装置,其特征在于,所述操作范围和权限为预先定义的,预先定义操作范围和权限的方法包括,
S11:分析被限定空间中人员可能存在的区域,将区域信息划分为区域坐标;
S12:根据不同的区域坐标定义角色,为不同的角色定义不同的设备操作范围和权限;
将得到的人员的位置信息与所在子区域的区域坐标相对应,将角色与所述人员的位置信息相关联。
10.根据权利要求8所述的根据位置信息辅助语音指令识别装置,其特征在于,人员的角色通过人员的位置信息或者与角色绑定的人员的生物特征识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711401062.3A CN108320739B (zh) | 2017-12-22 | 2017-12-22 | 根据位置信息辅助语音指令识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711401062.3A CN108320739B (zh) | 2017-12-22 | 2017-12-22 | 根据位置信息辅助语音指令识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108320739A true CN108320739A (zh) | 2018-07-24 |
CN108320739B CN108320739B (zh) | 2022-03-01 |
Family
ID=62893159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711401062.3A Active CN108320739B (zh) | 2017-12-22 | 2017-12-22 | 根据位置信息辅助语音指令识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108320739B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109025636A (zh) * | 2018-07-26 | 2018-12-18 | 广东工业大学 | 一种语音车窗控制方法及系统 |
CN109584871A (zh) * | 2018-12-04 | 2019-04-05 | 北京蓦然认知科技有限公司 | 一种车辆中语音指令的用户身份识别方法、装置 |
CN110001549A (zh) * | 2019-04-17 | 2019-07-12 | 百度在线网络技术(北京)有限公司 | 用于控制车辆的方法和装置 |
CN110322893A (zh) * | 2019-05-29 | 2019-10-11 | 深圳市捷视飞通科技股份有限公司 | 语音数据处理方法、装置、计算机设备和存储介质 |
CN110648663A (zh) * | 2019-09-26 | 2020-01-03 | 科大讯飞(苏州)科技有限公司 | 车载音频管理方法、装置、设备、汽车及可读存储介质 |
CN113012700A (zh) * | 2021-01-29 | 2021-06-22 | 深圳壹秘科技有限公司 | 语音信号处理方法、装置、系统及计算机可读存储介质 |
CN113380246A (zh) * | 2021-06-08 | 2021-09-10 | 阿波罗智联(北京)科技有限公司 | 指令执行方法、相关装置及计算机程序产品 |
CN113486760A (zh) * | 2021-06-30 | 2021-10-08 | 上海商汤临港智能科技有限公司 | 对象说话检测方法及装置、电子设备和存储介质 |
CN113823289A (zh) * | 2020-06-18 | 2021-12-21 | 中兴通讯股份有限公司 | 一种定位方法、定位装置和计算机可读存储介质 |
CN115019810A (zh) * | 2022-05-30 | 2022-09-06 | 中国第一汽车股份有限公司 | 一种车载多音区智能语音安全交互系统及运行方法 |
CN117219071A (zh) * | 2023-09-20 | 2023-12-12 | 北京惠朗时代科技有限公司 | 一种基于人工智能的语音交互服务系统 |
CN118042355A (zh) * | 2024-04-11 | 2024-05-14 | 江西天创智能科技有限公司 | 一种舞台智能声控音响的自动化控制系统及方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1506700A (en) * | 1970-10-30 | 1978-04-12 | Krupp Gmbh | Apparatus for passive sonar target location |
CN102749612A (zh) * | 2012-07-25 | 2012-10-24 | 中国人民解放军信息工程大学 | 一种相关干涉仪的快速测向方法 |
CN102801455A (zh) * | 2012-07-31 | 2012-11-28 | 华为技术有限公司 | 波束码本生成方法、波束搜索方法及相关装置 |
CN103308889A (zh) * | 2013-05-13 | 2013-09-18 | 辽宁工业大学 | 复杂环境下被动声源二维doa估计方法 |
CN104200813A (zh) * | 2014-07-01 | 2014-12-10 | 东北大学 | 基于声源方向实时预测跟踪的动态盲信号分离方法 |
CN104244143A (zh) * | 2013-06-14 | 2014-12-24 | 通用汽车环球科技运作有限责任公司 | 位置引导声学阵列和波束形成方法 |
CN104360305A (zh) * | 2014-10-24 | 2015-02-18 | 中国航天科技集团公司第五研究院第五一三研究所 | 联合压缩感知和信号循环平稳特性的辐射源测向定位方法 |
CN105957523A (zh) * | 2016-04-22 | 2016-09-21 | 乐视控股(北京)有限公司 | 车载系统控制方法及装置 |
CN106526531A (zh) * | 2016-10-10 | 2017-03-22 | 天津大学 | 基于三维天线阵列的改进传播算子二维doa估计算法 |
CN106599866A (zh) * | 2016-12-22 | 2017-04-26 | 上海百芝龙网络科技有限公司 | 一种多维度用户身份识别方法 |
CN106683673A (zh) * | 2016-12-30 | 2017-05-17 | 智车优行科技(北京)有限公司 | 驾驶模式的调整方法、装置和系统、车辆 |
CN106878281A (zh) * | 2017-01-11 | 2017-06-20 | 上海蔚来汽车有限公司 | 基于混合音频的车内定位装置、方法和车内设备控制系统 |
-
2017
- 2017-12-22 CN CN201711401062.3A patent/CN108320739B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1506700A (en) * | 1970-10-30 | 1978-04-12 | Krupp Gmbh | Apparatus for passive sonar target location |
CN102749612A (zh) * | 2012-07-25 | 2012-10-24 | 中国人民解放军信息工程大学 | 一种相关干涉仪的快速测向方法 |
CN102801455A (zh) * | 2012-07-31 | 2012-11-28 | 华为技术有限公司 | 波束码本生成方法、波束搜索方法及相关装置 |
CN103308889A (zh) * | 2013-05-13 | 2013-09-18 | 辽宁工业大学 | 复杂环境下被动声源二维doa估计方法 |
CN104244143A (zh) * | 2013-06-14 | 2014-12-24 | 通用汽车环球科技运作有限责任公司 | 位置引导声学阵列和波束形成方法 |
CN104200813A (zh) * | 2014-07-01 | 2014-12-10 | 东北大学 | 基于声源方向实时预测跟踪的动态盲信号分离方法 |
CN104360305A (zh) * | 2014-10-24 | 2015-02-18 | 中国航天科技集团公司第五研究院第五一三研究所 | 联合压缩感知和信号循环平稳特性的辐射源测向定位方法 |
CN105957523A (zh) * | 2016-04-22 | 2016-09-21 | 乐视控股(北京)有限公司 | 车载系统控制方法及装置 |
CN106526531A (zh) * | 2016-10-10 | 2017-03-22 | 天津大学 | 基于三维天线阵列的改进传播算子二维doa估计算法 |
CN106599866A (zh) * | 2016-12-22 | 2017-04-26 | 上海百芝龙网络科技有限公司 | 一种多维度用户身份识别方法 |
CN106683673A (zh) * | 2016-12-30 | 2017-05-17 | 智车优行科技(北京)有限公司 | 驾驶模式的调整方法、装置和系统、车辆 |
CN106878281A (zh) * | 2017-01-11 | 2017-06-20 | 上海蔚来汽车有限公司 | 基于混合音频的车内定位装置、方法和车内设备控制系统 |
Non-Patent Citations (3)
Title |
---|
WENTAO SHI ET AL.: "《Joint Direction-Of-Departure and Direction-Of-Arrival estimation in MIMO array》", 《2013 IEEE INTERNATIONAL CONFERENCE OF IEEE REGION 10 (TENCON 2013)》 * |
景小荣等: "《L型阵列的二维DOA估计方法》", 《重庆邮电大学学报(自然科学版)》 * |
王硕朋等: "《基于声音位置指纹的室内声源定位方法》", 《北京工业大学学报》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109025636A (zh) * | 2018-07-26 | 2018-12-18 | 广东工业大学 | 一种语音车窗控制方法及系统 |
CN109584871B (zh) * | 2018-12-04 | 2021-09-03 | 北京蓦然认知科技有限公司 | 一种车辆中语音指令的用户身份识别方法、装置 |
CN109584871A (zh) * | 2018-12-04 | 2019-04-05 | 北京蓦然认知科技有限公司 | 一种车辆中语音指令的用户身份识别方法、装置 |
CN110001549A (zh) * | 2019-04-17 | 2019-07-12 | 百度在线网络技术(北京)有限公司 | 用于控制车辆的方法和装置 |
CN110322893A (zh) * | 2019-05-29 | 2019-10-11 | 深圳市捷视飞通科技股份有限公司 | 语音数据处理方法、装置、计算机设备和存储介质 |
CN110322893B (zh) * | 2019-05-29 | 2021-09-24 | 深圳市捷视飞通科技股份有限公司 | 语音数据处理方法、装置、计算机设备和存储介质 |
CN110648663A (zh) * | 2019-09-26 | 2020-01-03 | 科大讯飞(苏州)科技有限公司 | 车载音频管理方法、装置、设备、汽车及可读存储介质 |
CN113823289A (zh) * | 2020-06-18 | 2021-12-21 | 中兴通讯股份有限公司 | 一种定位方法、定位装置和计算机可读存储介质 |
CN113012700A (zh) * | 2021-01-29 | 2021-06-22 | 深圳壹秘科技有限公司 | 语音信号处理方法、装置、系统及计算机可读存储介质 |
CN113012700B (zh) * | 2021-01-29 | 2023-12-26 | 深圳壹秘科技有限公司 | 语音信号处理方法、装置、系统及计算机可读存储介质 |
CN113380246A (zh) * | 2021-06-08 | 2021-09-10 | 阿波罗智联(北京)科技有限公司 | 指令执行方法、相关装置及计算机程序产品 |
CN113486760A (zh) * | 2021-06-30 | 2021-10-08 | 上海商汤临港智能科技有限公司 | 对象说话检测方法及装置、电子设备和存储介质 |
CN115019810A (zh) * | 2022-05-30 | 2022-09-06 | 中国第一汽车股份有限公司 | 一种车载多音区智能语音安全交互系统及运行方法 |
CN117219071A (zh) * | 2023-09-20 | 2023-12-12 | 北京惠朗时代科技有限公司 | 一种基于人工智能的语音交互服务系统 |
CN117219071B (zh) * | 2023-09-20 | 2024-03-15 | 北京惠朗时代科技有限公司 | 一种基于人工智能的语音交互服务系统 |
CN118042355A (zh) * | 2024-04-11 | 2024-05-14 | 江西天创智能科技有限公司 | 一种舞台智能声控音响的自动化控制系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108320739B (zh) | 2022-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108320739A (zh) | 根据位置信息辅助语音指令识别方法和装置 | |
CN109545219A (zh) | 车载语音交互方法、系统、设备及计算机可读存储介质 | |
CN111370014B (zh) | 多流目标-语音检测和信道融合的系统和方法 | |
CN104040620B (zh) | 用于进行直接语法存取的装置和方法 | |
CN108961802A (zh) | 自动驾驶车辆的调度方法和用户终端 | |
CN110166896B (zh) | 语音提供方法、语音提供系统和服务器 | |
CN104581460B (zh) | 考虑驾驶席位置的波束形成麦克风控制装置及方法 | |
WO2017081960A1 (ja) | 音声認識制御システム | |
GB2530385A (en) | Vehicle driver identification | |
EP3163573A1 (en) | Speech collector in car cabin | |
CN102903360A (zh) | 以麦克风阵列为基础的语音辨识系统与方法 | |
US20200160861A1 (en) | Apparatus and method for processing voice commands of multiple talkers | |
CN110770693A (zh) | 手势操作装置及手势操作方法 | |
CN110021298A (zh) | 一种汽车语音控制系统 | |
US11724667B2 (en) | Motor vehicle and method for processing sound from outside the motor vehicle | |
JP2017090612A (ja) | 音声認識制御システム | |
CN109584871B (zh) | 一种车辆中语音指令的用户身份识别方法、装置 | |
CN112309395A (zh) | 人机对话方法、装置、机器人、计算机设备和存储介质 | |
CN110402584A (zh) | 车内通话控制装置、车内通话系统以及车内通话控制方法 | |
JP2019182244A (ja) | 音声認識装置及び音声認識方法 | |
KR20210034843A (ko) | 차량의 제어 장치 및 방법 | |
US20140168058A1 (en) | Apparatus and method for recognizing instruction using voice and gesture | |
Nakadai et al. | Robot-audition-based human-machine interface for a car | |
JP7392827B2 (ja) | 音声認識装置及び音声認識方法 | |
US20200216088A1 (en) | Vehicle and control method thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |