CN107346661A - 一种基于麦克风阵列的远距离虹膜跟踪与采集方法 - Google Patents
一种基于麦克风阵列的远距离虹膜跟踪与采集方法 Download PDFInfo
- Publication number
- CN107346661A CN107346661A CN201710404985.8A CN201710404985A CN107346661A CN 107346661 A CN107346661 A CN 107346661A CN 201710404985 A CN201710404985 A CN 201710404985A CN 107346661 A CN107346661 A CN 107346661A
- Authority
- CN
- China
- Prior art keywords
- mrow
- microphone array
- msub
- microphone
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 230000004807 localization Effects 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 12
- 210000003128 head Anatomy 0.000 claims description 25
- 238000003491 array Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 210000000887 face Anatomy 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims description 2
- 230000004913 activation Effects 0.000 claims 1
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 244000000231 Sesamum indicum Species 0.000 description 1
- 235000003434 Sesamum indicum Nutrition 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000686 essence Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
- G10L15/25—Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/086—Recognition of spelled words
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Ophthalmology & Optometry (AREA)
- General Health & Medical Sciences (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Image Input (AREA)
Abstract
本发明公开一种基于麦克风阵列的远距离虹膜跟踪与采集方法,包括:步骤1:麦克风阵列的声源定位模块根据分布在分布式麦克风阵列声音采集范围内用户语音启动,并实时跟踪及计算用户嘴巴在三维空间中的位置信息;步骤2:将所述位置信息传送至中央处理控制模块,如果位置信息在红外摄像机及云台的工作范围内,则所述中央处理控制模块控制红外摄像机的高速云台及变焦模块,对准用户的头部进行放大对焦拍摄,获取多幅用户头部的红外图像;步骤3:语音唤醒模块根据语音识别当前用户语音是否为约定的唤醒词,如不是,则为无效语音,忽略红外图像;如是,则为有效语音,将采集的所述红外图像用于虹膜识别。本发明准确性高,实用性强及验证速度快。
Description
技术领域
本发明涉及一种远距离虹膜图像采集方法,更具体地,涉及一种基于分布式麦克风阵列的远距离虹膜跟踪与采集方法。
背景技术
虹膜识别是一种高准确性的无接触的生物特征识别技术,具有非常广阔的应用场景。微距离和近距离虹膜采集设备需要用户双眼凑近摄像机拍摄虹膜图片,限制了实际使用场景。随着摄像头技术的快速发展,大于1000万像素的摄像头已经被广泛使用,配合高速云台和变焦模块以及红外窄带滤光片,我们可以在1-10米范围内得到高质量的虹膜图片。与传统的微距离虹膜采集专用设备相比,这种远距离的基于红外摄像头模组的采集方法具有成本低,无需人凑近设备配合等特点。对于用户来说,只需要正面看一眼摄像头就可以使得虹膜图像被采集,大大的增强了准确性,实用性及验证速度。
但远距离虹膜图片采集的前提是知道用户的三维位置信息,用于控制云台和变焦模块拍摄图片。已有的方法有使用基于双目或多目摄像头算法的三维定位,也有使用深度摄像头的定位,也有使用红外检测模块来大致判定用户位置的方法,但这些方法都需要额外的增加硬件设备和相应的计算资源,且无法与现有的远场语音交互技术互通互联。
随着麦克风阵列技术及远场语音识别技术的成熟,越来越多的智能家居产品开始使用声纹识别来进行身份验证。用户可以在几米范围说出命令(如“芝麻开门”),系统会自动被唤醒,通过语音识别模块理解用户的命令,同时利用文本相关的声纹识别方法来校验身份。由于语音信号既可以传递说话人声纹信息,也包含文本语义信息,因此基于唤醒词或动态口令(如随机数字串)的文本相关声纹识别是一个很好的活体检测手段。但是声纹识别的准确率相比指纹和虹膜来说还是要差一些,在一些环境下无法胜任高准确性的任务,如支付。
发明内容
本发明提出一种准确性高,实用性强及验证速度快的基于麦克风阵列的远距离虹膜跟踪与采集方法。
本发明的技术方案是这样实现的:
一种基于麦克风阵列的远距离虹膜跟踪与采集方法,包括中央处理控制模块,及与之相连的基于分布式麦克风阵列的语音唤醒模块及声源定位模块以及用于采集远距离虹膜图像的红外摄像头模块,云台及变焦模块,其特征在于,包括:
步骤1:麦克风阵列的声源定位模块根据分布在分布式麦克风阵列声音采集范围内用户语音启动,并实时跟踪及计算用户嘴巴在三维空间中的位置信息;
步骤2:将所述位置信息传送至中央处理控制模块,如果位置信息在红外摄像机及云台的工作范围内,则所述中央处理控制模块控制红外摄像机的高速云台及变焦模块,对准用户的头部进行放大对焦拍摄,获取多幅用户头部的红外图像;
步骤3:语音唤醒模块根据麦克风阵列输出的增强后的语音识别当前用户语音是否为约定的唤醒词,如不是,则为无效语音,忽略所述红外图像;如是,则为有效语音,将采集的所述红外图像用于虹膜识别。
本发明把基于麦克风阵列的声源定位技术和远场语音识别及声纹识别技术与虹膜图像的采集有机的结合在一起,创新性的提出利用现有语音交互设备中的麦克风阵列来捕捉说话人的位置信息,并联动控制红外摄像机的云台和变焦模块来动态的采集说话人的头部清晰图像,使得在远距离场景同时进行虹膜识别和声纹识别成为可能,并使用唤醒词识别模块来判断用户说的语音是否为约定好的虹膜采集关键词,减少了不必要的虚警,提高了鲁棒性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一种基于麦克风阵列的远距离虹膜跟踪与采集方法的模块框图;
图2是单个麦克风阵列输出的平面和高度角度的示例;
图3是本发明中远距离虹膜采集方法的流程图;
图4是唤醒词判断流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1至图4,一种基于麦克风阵列的远距离虹膜跟踪与采集方法,包括中央处理控制模块5,及与之相连的基于分布式麦克风阵列的语音唤醒模块1及声源定位模块2以及用于采集远距离虹膜图像的红外摄像头模块3,云台及变焦模块4,包括:
步骤1:麦克风阵列的声源定位模块根据分布在分布式麦克风阵列声音采集范围内用户语音启动,并实时跟踪及计算用户嘴巴在三维空间中的位置信息;
步骤2:将所述位置信息传送至中央处理控制模块,如果位置信息在红外摄像机及云台的工作范围内,则所述中央处理控制模块控制红外摄像机的高速云台及变焦模块,对准用户的头部进行放大对焦拍摄,获取多幅用户头部的红外图像;
步骤3:语音唤醒模块根据麦克风阵列输出的增强后的语音识别当前用户语音是否为约定的唤醒词,如不是,则为无效语音,忽略所述红外图像;如是,则为有效语音,将采集的所述红外图像用于虹膜识别。
优选的,在执行步骤1时,所述分布式麦克风阵列为由M个(M>=1)安装在不同位置的麦克风阵列组成,假设第i个麦克风阵列包含Ni个麦克风,则整个分布式麦克风阵列包含个麦克风,其实时跟踪及计算用户嘴巴在三维空间中的位置信息具体过程为:
步骤101:对于第i个由Ni个麦克风组成的麦克风阵列,Ni≥4,且不能全部分布在同一个平面上;麦克风两两配对,组成ni=Ni×(Ni-1)/2对麦克风配对;针对每一个配对,计算每对麦克风通道语音的时间差τij,j=1,…,ni;
步骤102:根据每对麦克风通道语音的时间差,利用推算出α,其中dij为这两个麦克风之间的间距,而c为空气中的声速,一般为340米/秒;
步骤103:假设第j个麦克风配对中的两个麦克风的实际空间位置分别为Mj1(xj1,yj1,zj1)和Mj2(xj2,yj2,zj2),则其夹角α与三维空间中声音源相对阵列坐标系的夹角θ和的关系如下:
根据多个麦克风之间的两两配对,求平均或求最大值的方式获得相应的声音源的位置信息θ和当系统中有多个分布式的麦克风阵列,则把每一个麦克风阵列获得的θ和信息组合起来得到用户嘴巴在三维空间中的位置信息。
优选的,在执行步骤2时,所述云台和变焦模块根据麦克风阵列输出的位置信息的拍摄多幅人脸的图片,其中人眼部分的图片大小满足虹膜识别的要求,具体步骤为:
步骤201:根据分布式麦克风阵列声源定位模块传到中央控制单元的位置信息,判断声源坐标是否在预设的虹膜采集区域内,如是,进行步骤202;如不是,则为干扰信号,忽略该位置信息。
步骤202:中央控制单元控制红外摄像机的高速云台和变焦模块对准空间中的声源位置进行拍照;
步骤203:将采集的头部图片进行人脸检测及人眼检测,并提取出双眼的虹膜图像用以进行虹膜识别;如果照片清晰度低于预设值,由于无法准确提取人眼的图像,因此忽略该图像,继续处理下一张。
优选的,在执行步骤3时,其具体步骤为,步骤301:麦克风阵列采集得到的多通道语音经过回声抵消,去混响,波束集成,后滤波操作后,得到增强后的单通道语音,使用语音识别技术识别当前用户语音是否为约定的唤醒词,如不是,则为无效语音,忽略所述红外图像;如是,则为有效语音,将采集的所述红外图像用于后续的虹膜识别。
唤醒模块中的语音识别算法流程为,语音音频首先经过语音前端处理,再经过特征提取提取到有效信息,然后再将音频解码,解码处理包括声学模型、发音模型及语言模型,从而将语音转换成识别文本,再进行唤醒词的比对。
本发明把基于麦克风阵列的声源定位技术和远场语音识别及声纹识别技术与虹膜图像的采集有机的结合在一起,创新性的提出利用现有语音交互设备中的麦克风阵列来捕捉说话人的位置信息,并联动控制红外摄像机的云台和变焦模块来动态的采集说话人的头部清晰图像,使得在远距离场景同时进行虹膜识别和声纹识别成为可能,并使用唤醒词识别模块来判断用户说的语音是否为约定好的虹膜采集关键词,减少了不必要的虚警,提高了鲁棒性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种基于麦克风阵列的远距离虹膜跟踪与采集方法,包括中央处理控制模块,及与之相连的基于分布式麦克风阵列的语音唤醒模块及声源定位模块以及用于采集远距离虹膜图像的红外摄像头模块,云台及变焦模块,其特征在于,包括:
步骤1:麦克风阵列的声源定位模块根据分布在分布式麦克风阵列声音采集范围内用户语音启动,并实时跟踪及计算用户嘴巴在三维空间中的位置信息;
步骤2:将所述位置信息传送至中央处理控制模块,如果位置信息在红外摄像机及云台的工作范围内,则所述中央处理控制模块控制红外摄像机的高速云台及变焦模块,对准用户的头部进行放大对焦拍摄,获取多幅用户头部的红外图像;
步骤3:语音唤醒模块根据麦克风阵列输出的增强后的语音识别当前用户语音是否为约定的唤醒词,如不是,则为无效语音,忽略所述红外图像;如是,则为有效语音,将采集的所述红外图像用于后续的虹膜识别。
2.如权利要求1所述的一种基于麦克风阵列的远距离虹膜跟踪与采集方法,在执行步骤1时,所述分布式麦克风阵列为由M个(M>=1)安装在不同位置的麦克风阵列组成,假设第i个麦克风阵列包含Ni个麦克风,则整个分布式麦克风阵列包含个麦克风,其实时跟踪及计算用户嘴巴在三维空间中的位置信息具体过程为:
步骤101:对于第i个由Ni个麦克风组成的麦克风阵列,Ni≥4,且不能全部分布在同一个平面上;麦克风两两配对,组成ni=Ni×(Ni-1)/2对麦克风配对;针对每一个配对,计算每对麦克风通道语音的时间差τij,j=1,…,ni;
步骤102:根据每对麦克风通道语音的时间差,利用推算出α,其中dij为这两个麦克风之间的间距,而c为空气中的声速;
步骤103:假设第j个麦克风配对中的两个麦克风的实际空间位置分别为Mj1(xj1,yj1,zj1)和Mj2(xj2,yj2,zj2),则其夹角α与三维空间中声音源相对阵列坐标系的夹角θ和的关系如下:
<mrow>
<msub>
<mi>M</mi>
<mrow>
<mi>j</mi>
<mn>1</mn>
<mi>j</mi>
<mn>2</mn>
</mrow>
</msub>
<mo>=</mo>
<mfenced open = "(" close = ")">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>x</mi>
<mrow>
<mi>j</mi>
<mn>2</mn>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>j</mi>
<mn>1</mn>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>y</mi>
<mrow>
<mi>j</mi>
<mn>2</mn>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>y</mi>
<mrow>
<mi>j</mi>
<mn>1</mn>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<msub>
<mi>z</mi>
<mrow>
<mi>j</mi>
<mn>2</mn>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>z</mi>
<mrow>
<mi>j</mi>
<mn>1</mn>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
根据多个麦克风之间的两两配对,求平均或求最大值的方式获得相应的声音源的位置信息θ和当系统中有多个分布式的麦克风阵列,则把每一个麦克风阵列获得的θ和信息组合起来得到用户嘴巴在三维空间中的位置信息。
3.如权利要求2所述的一种基于麦克风阵列的远距离虹膜跟踪与采集方法,在执行步骤2时,所述云台和变焦模块根据麦克风阵列输出的位置信息的拍摄多幅人脸的图片,其中人眼部分的图片大小满足虹膜识别的要求,具体步骤为:
步骤201:根据分布式麦克风阵列声源定位模块传到中央控制单元的位置信息,判断声源坐标是否在预设的虹膜采集区域内,如是,进行步骤202;如不是,则为干扰信号,忽略该位置信息。
步骤202:中央控制单元控制红外摄像机的高速云台和变焦模块对准空间中的声源位置进行拍照;
步骤203:将采集的头部图片进行人脸检测及人眼检测,并提取出双眼的虹膜图像用以进行虹膜识别;如果照片清晰度低于预设值,则忽略该图像,继续处理下一张。
4.如权利要求1所述的一种基于麦克风阵列的远距离虹膜跟踪与采集方法,在执行步骤3时,其具体步骤为:
步骤301:麦克风阵列采集得到的多通道语音经过回声抵消,去混响,波束集成,后滤波操作后,得到增强后的单通道语音,使用语音识别技术识别当前用户语音是否为约定的唤醒词,如不是,则为无效语音,忽略所述红外图像;如是,则为有效语音,将采集的所述红外图像用于后续的虹膜识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710404985.8A CN107346661B (zh) | 2017-06-01 | 2017-06-01 | 一种基于麦克风阵列的远距离虹膜跟踪与采集方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710404985.8A CN107346661B (zh) | 2017-06-01 | 2017-06-01 | 一种基于麦克风阵列的远距离虹膜跟踪与采集方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107346661A true CN107346661A (zh) | 2017-11-14 |
CN107346661B CN107346661B (zh) | 2020-06-12 |
Family
ID=60253326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710404985.8A Active CN107346661B (zh) | 2017-06-01 | 2017-06-01 | 一种基于麦克风阵列的远距离虹膜跟踪与采集方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107346661B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107809596A (zh) * | 2017-11-15 | 2018-03-16 | 重庆科技学院 | 基于麦克风阵列的视频会议跟踪系统及方法 |
CN108510987A (zh) * | 2018-03-26 | 2018-09-07 | 北京小米移动软件有限公司 | 语音处理方法及装置 |
CN108766438A (zh) * | 2018-06-21 | 2018-11-06 | Oppo广东移动通信有限公司 | 人机交互方法、装置、存储介质及智能终端 |
CN108828525A (zh) * | 2018-06-25 | 2018-11-16 | 大连大学 | 混响房间内分布式麦克风阵列多声源定位系统 |
CN109817211A (zh) * | 2019-02-14 | 2019-05-28 | 珠海格力电器股份有限公司 | 一种电器控制方法、装置、存储介质及电器 |
CN110085258A (zh) * | 2019-04-02 | 2019-08-02 | 深圳Tcl新技术有限公司 | 一种提高远场语音识别率的方法、系统及可读存储介质 |
CN110490160A (zh) * | 2019-08-23 | 2019-11-22 | 成都费恩格尔微电子技术有限公司 | 一种多镜头模组的指纹信息采集系统及电子设备 |
CN110634498A (zh) * | 2018-06-06 | 2019-12-31 | 阿里巴巴集团控股有限公司 | 一种语音处理方法及设备 |
CN110765823A (zh) * | 2018-07-27 | 2020-02-07 | 杭州海康威视系统技术有限公司 | 一种目标识别方法及装置 |
CN111243583A (zh) * | 2019-12-31 | 2020-06-05 | 深圳市瑞讯云技术有限公司 | 一种系统唤醒方法及装置 |
CN112102546A (zh) * | 2020-08-07 | 2020-12-18 | 浙江大华技术股份有限公司 | 一种人机交互控制方法、对讲呼叫方法及相关装置 |
CN115333890A (zh) * | 2022-10-09 | 2022-11-11 | 珠海进田电子科技有限公司 | 一种基于人工智能的家电控制型智能线控器 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100631643B1 (ko) * | 2005-06-03 | 2006-10-09 | 엘지전자 주식회사 | 홍채 인식을 이용한 촬영 위치 표시 장치 및 방법 |
CN1967657A (zh) * | 2005-11-18 | 2007-05-23 | 成都索贝数码科技股份有限公司 | 节目制作中的说话人声音自动跟踪变调系统和方法 |
CN101567969A (zh) * | 2009-05-21 | 2009-10-28 | 上海交通大学 | 基于麦克风阵列声音制导的智能视频导播方法 |
CN101763858A (zh) * | 2009-10-19 | 2010-06-30 | 瑞声声学科技(深圳)有限公司 | 双麦克风信号处理方法 |
CN101770139A (zh) * | 2008-12-29 | 2010-07-07 | 鸿富锦精密工业(深圳)有限公司 | 对焦控制系统及方法 |
CN102831392A (zh) * | 2012-07-09 | 2012-12-19 | 哈尔滨工业大学 | 一种远距离虹膜跟踪与采集装置及其方法 |
CN104519212A (zh) * | 2013-09-27 | 2015-04-15 | 华为技术有限公司 | 一种消除回声的方法及装置 |
CN204390737U (zh) * | 2014-07-29 | 2015-06-10 | 科大讯飞股份有限公司 | 一种家庭语音处理系统 |
CN105355210A (zh) * | 2015-10-30 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 用于远场语音识别的预处理方法和装置 |
CN106531179A (zh) * | 2015-09-10 | 2017-03-22 | 中国科学院声学研究所 | 一种基于语义先验的选择性注意的多通道语音增强方法 |
CN106778713A (zh) * | 2017-03-01 | 2017-05-31 | 武汉虹识技术有限公司 | 一种动态人眼跟踪的虹膜识别装置及方法 |
-
2017
- 2017-06-01 CN CN201710404985.8A patent/CN107346661B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100631643B1 (ko) * | 2005-06-03 | 2006-10-09 | 엘지전자 주식회사 | 홍채 인식을 이용한 촬영 위치 표시 장치 및 방법 |
CN1967657A (zh) * | 2005-11-18 | 2007-05-23 | 成都索贝数码科技股份有限公司 | 节目制作中的说话人声音自动跟踪变调系统和方法 |
CN101770139A (zh) * | 2008-12-29 | 2010-07-07 | 鸿富锦精密工业(深圳)有限公司 | 对焦控制系统及方法 |
CN101567969A (zh) * | 2009-05-21 | 2009-10-28 | 上海交通大学 | 基于麦克风阵列声音制导的智能视频导播方法 |
CN101763858A (zh) * | 2009-10-19 | 2010-06-30 | 瑞声声学科技(深圳)有限公司 | 双麦克风信号处理方法 |
CN102831392A (zh) * | 2012-07-09 | 2012-12-19 | 哈尔滨工业大学 | 一种远距离虹膜跟踪与采集装置及其方法 |
CN104519212A (zh) * | 2013-09-27 | 2015-04-15 | 华为技术有限公司 | 一种消除回声的方法及装置 |
CN204390737U (zh) * | 2014-07-29 | 2015-06-10 | 科大讯飞股份有限公司 | 一种家庭语音处理系统 |
CN106531179A (zh) * | 2015-09-10 | 2017-03-22 | 中国科学院声学研究所 | 一种基于语义先验的选择性注意的多通道语音增强方法 |
CN105355210A (zh) * | 2015-10-30 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 用于远场语音识别的预处理方法和装置 |
CN106778713A (zh) * | 2017-03-01 | 2017-05-31 | 武汉虹识技术有限公司 | 一种动态人眼跟踪的虹膜识别装置及方法 |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107809596A (zh) * | 2017-11-15 | 2018-03-16 | 重庆科技学院 | 基于麦克风阵列的视频会议跟踪系统及方法 |
CN108510987B (zh) * | 2018-03-26 | 2020-10-23 | 北京小米移动软件有限公司 | 语音处理方法及装置 |
CN108510987A (zh) * | 2018-03-26 | 2018-09-07 | 北京小米移动软件有限公司 | 语音处理方法及装置 |
US10930304B2 (en) | 2018-03-26 | 2021-02-23 | Beijing Xiaomi Mobile Software Co., Ltd. | Processing voice |
CN110634498A (zh) * | 2018-06-06 | 2019-12-31 | 阿里巴巴集团控股有限公司 | 一种语音处理方法及设备 |
CN108766438A (zh) * | 2018-06-21 | 2018-11-06 | Oppo广东移动通信有限公司 | 人机交互方法、装置、存储介质及智能终端 |
CN108766438B (zh) * | 2018-06-21 | 2020-12-01 | Oppo广东移动通信有限公司 | 人机交互方法、装置、存储介质及智能终端 |
CN108828525A (zh) * | 2018-06-25 | 2018-11-16 | 大连大学 | 混响房间内分布式麦克风阵列多声源定位系统 |
CN110765823A (zh) * | 2018-07-27 | 2020-02-07 | 杭州海康威视系统技术有限公司 | 一种目标识别方法及装置 |
CN109817211A (zh) * | 2019-02-14 | 2019-05-28 | 珠海格力电器股份有限公司 | 一种电器控制方法、装置、存储介质及电器 |
CN109817211B (zh) * | 2019-02-14 | 2021-04-02 | 珠海格力电器股份有限公司 | 一种电器控制方法、装置、存储介质及电器 |
CN110085258A (zh) * | 2019-04-02 | 2019-08-02 | 深圳Tcl新技术有限公司 | 一种提高远场语音识别率的方法、系统及可读存储介质 |
WO2020199971A1 (zh) * | 2019-04-02 | 2020-10-08 | 深圳Tcl新技术有限公司 | 一种提高远场语音识别率的方法、系统及可读存储介质 |
CN110085258B (zh) * | 2019-04-02 | 2023-11-14 | 深圳Tcl新技术有限公司 | 一种提高远场语音识别率的方法、系统及可读存储介质 |
CN110490160A (zh) * | 2019-08-23 | 2019-11-22 | 成都费恩格尔微电子技术有限公司 | 一种多镜头模组的指纹信息采集系统及电子设备 |
CN110490160B (zh) * | 2019-08-23 | 2024-02-13 | 上海菲戈恩微电子科技有限公司 | 一种多镜头模组的指纹信息采集系统及电子设备 |
CN111243583A (zh) * | 2019-12-31 | 2020-06-05 | 深圳市瑞讯云技术有限公司 | 一种系统唤醒方法及装置 |
CN111243583B (zh) * | 2019-12-31 | 2023-03-10 | 深圳市瑞讯云技术有限公司 | 一种系统唤醒方法及装置 |
CN112102546A (zh) * | 2020-08-07 | 2020-12-18 | 浙江大华技术股份有限公司 | 一种人机交互控制方法、对讲呼叫方法及相关装置 |
CN115333890A (zh) * | 2022-10-09 | 2022-11-11 | 珠海进田电子科技有限公司 | 一种基于人工智能的家电控制型智能线控器 |
CN115333890B (zh) * | 2022-10-09 | 2023-08-04 | 珠海进田电子科技有限公司 | 一种基于人工智能的家电控制型智能线控器 |
Also Published As
Publication number | Publication date |
---|---|
CN107346661B (zh) | 2020-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107346661A (zh) | 一种基于麦克风阵列的远距离虹膜跟踪与采集方法 | |
US11023690B2 (en) | Customized output to optimize for user preference in a distributed system | |
US10743107B1 (en) | Synchronization of audio signals from distributed devices | |
EP3963576B1 (en) | Speaker attributed transcript generation | |
CN106710603B (zh) | 利用线性麦克风阵列的语音识别方法及系统 | |
US12051422B2 (en) | Processing overlapping speech from distributed devices | |
US20200349953A1 (en) | Audio-visual diarization to identify meeting attendees | |
CN109474797B (zh) | 基于全景摄像头和麦克风阵列的会议转录系统 | |
CN109147787A (zh) | 一种智能电视声控识别系统及其识别方法 | |
CN103607550B (zh) | 一种根据观看者位置调整电视虚拟声道的方法及电视 | |
US9531948B2 (en) | Voice tracking apparatus and control method therefor | |
WO2021017096A1 (zh) | 一种将人脸信息录入数据库的方法和装置 | |
CN106161985B (zh) | 一种浸入式视频会议的实现方法 | |
CN112347450B (zh) | 一种基于眨眼声音信号的身份验证方法 | |
CN108389586A (zh) | 一种远程集音装置、监控装置及远程集音方法 | |
CN111767785A (zh) | 人机交互控制方法及装置、智能机器人及存储介质 | |
Yargıç et al. | A lip reading application on MS Kinect camera | |
CN110706717A (zh) | 一种基于麦克风阵列板的人声检测定向方法 | |
CN111551921A (zh) | 一种声像联动的声源定向系统及方法 | |
Plinge et al. | Multi-speaker tracking using multiple distributed microphone arrays | |
US11468895B2 (en) | Distributed device meeting initiation | |
CN109376694A (zh) | 一种基于图像处理的实时人脸活体检测方法 | |
Bernardin et al. | Multimodal identity tracking in a smartroom | |
CN216352432U (zh) | 一种基于人脸信息与声纹信息的交互式活体检测与识别装置 | |
CN113920560B (zh) | 多模态说话人身份识别方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20180709 Address after: 215300 Jiangsu, Suzhou, Kunshan, Kunshan, Chong Chong South Road 1699 good room 1602-1605 Applicant after: Iwo artificial intelligence technology (Jiangsu) Co., Ltd. Address before: A block, Tian Xing apartment, Yishan street, Wuxing District, Huzhou, Zhejiang Applicant before: Li Cuan |
|
GR01 | Patent grant | ||
GR01 | Patent grant |