CN107346661B - 一种基于麦克风阵列的远距离虹膜跟踪与采集方法 - Google Patents

一种基于麦克风阵列的远距离虹膜跟踪与采集方法 Download PDF

Info

Publication number
CN107346661B
CN107346661B CN201710404985.8A CN201710404985A CN107346661B CN 107346661 B CN107346661 B CN 107346661B CN 201710404985 A CN201710404985 A CN 201710404985A CN 107346661 B CN107346661 B CN 107346661B
Authority
CN
China
Prior art keywords
microphone array
voice
module
position information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710404985.8A
Other languages
English (en)
Other versions
CN107346661A (zh
Inventor
李昕
李明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iwo artificial intelligence technology (Jiangsu) Co., Ltd.
Original Assignee
Yiwo Artificial Intelligence Technology Jiangsu Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yiwo Artificial Intelligence Technology Jiangsu Co ltd filed Critical Yiwo Artificial Intelligence Technology Jiangsu Co ltd
Priority to CN201710404985.8A priority Critical patent/CN107346661B/zh
Publication of CN107346661A publication Critical patent/CN107346661A/zh
Application granted granted Critical
Publication of CN107346661B publication Critical patent/CN107346661B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/24Speech recognition using non-acoustical features
    • G10L15/25Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/086Recognition of spelled words

Abstract

本发明公开一种基于麦克风阵列的远距离虹膜跟踪与采集方法,包括:步骤1:麦克风阵列的声源定位模块根据分布在分布式麦克风阵列声音采集范围内用户语音启动,并实时跟踪及计算用户嘴巴在三维空间中的位置信息;步骤2:将所述位置信息传送至中央处理控制模块,如果位置信息在红外摄像机及云台的工作范围内,则所述中央处理控制模块控制红外摄像机的高速云台及变焦模块,对准用户的头部进行放大对焦拍摄,获取多幅用户头部的红外图像;步骤3:语音唤醒模块根据语音识别当前用户语音是否为约定的唤醒词,如不是,则为无效语音,忽略红外图像;如是,则为有效语音,将采集的所述红外图像用于虹膜识别。本发明准确性高,实用性强及验证速度快。

Description

一种基于麦克风阵列的远距离虹膜跟踪与采集方法
技术领域
本发明涉及一种远距离虹膜图像采集方法,更具体地,涉及一种基于分布式麦克风阵列的远距离虹膜跟踪与采集方法。
背景技术
虹膜识别是一种高准确性的无接触的生物特征识别技术,具有非常广阔的应用场景。微距离和近距离虹膜采集设备需要用户双眼凑近摄像机拍摄虹膜图片,限制了实际使用场景。随着摄像头技术的快速发展,大于1000万像素的摄像头已经被广泛使用,配合高速云台和变焦模块以及红外窄带滤光片,我们可以在1-10米范围内得到高质量的虹膜图片。与传统的微距离虹膜采集专用设备相比,这种远距离的基于红外摄像头模组的采集方法具有成本低,无需人凑近设备配合等特点。对于用户来说,只需要正面看一眼摄像头就可以使得虹膜图像被采集,大大的增强了准确性,实用性及验证速度。
但远距离虹膜图片采集的前提是知道用户的三维位置信息,用于控制云台和变焦模块拍摄图片。已有的方法有使用基于双目或多目摄像头算法的三维定位,也有使用深度摄像头的定位,也有使用红外检测模块来大致判定用户位置的方法,但这些方法都需要额外的增加硬件设备和相应的计算资源,且无法与现有的远场语音交互技术互通互联。
随着麦克风阵列技术及远场语音识别技术的成熟,越来越多的智能家居产品开始使用声纹识别来进行身份验证。用户可以在几米范围说出命令(如“芝麻开门”),系统会自动被唤醒,通过语音识别模块理解用户的命令,同时利用文本相关的声纹识别方法来校验身份。由于语音信号既可以传递说话人声纹信息,也包含文本语义信息,因此基于唤醒词或动态口令(如随机数字串)的文本相关声纹识别是一个很好的活体检测手段。但是声纹识别的准确率相比指纹和虹膜来说还是要差一些,在一些环境下无法胜任高准确性的任务,如支付。
发明内容
本发明提出一种准确性高,实用性强及验证速度快的基于麦克风阵列的远距离虹膜跟踪与采集方法。
本发明的技术方案是这样实现的:
一种基于麦克风阵列的远距离虹膜跟踪与采集方法,包括中央处理控制模块,及与之相连的基于分布式麦克风阵列的语音唤醒模块及声源定位模块以及用于采集远距离虹膜图像的红外摄像头模块,云台及变焦模块,其特征在于,包括:
步骤1:麦克风阵列的声源定位模块根据分布在分布式麦克风阵列声音采集范围内用户语音启动,并实时跟踪及计算用户嘴巴在三维空间中的位置信息;
步骤2:将所述位置信息传送至中央处理控制模块,如果位置信息在红外摄像机及云台的工作范围内,则所述中央处理控制模块控制红外摄像机的高速云台及变焦模块,对准用户的头部进行放大对焦拍摄,获取多幅用户头部的红外图像;
步骤3:语音唤醒模块根据麦克风阵列输出的增强后的语音识别当前用户语音是否为约定的唤醒词,如不是,则为无效语音,忽略所述红外图像;如是,则为有效语音,将采集的所述红外图像用于虹膜识别。
本发明把基于麦克风阵列的声源定位技术和远场语音识别及声纹识别技术与虹膜图像的采集有机的结合在一起,创新性的提出利用现有语音交互设备中的麦克风阵列来捕捉说话人的位置信息,并联动控制红外摄像机的云台和变焦模块来动态的采集说话人的头部清晰图像,使得在远距离场景同时进行虹膜识别和声纹识别成为可能,并使用唤醒词识别模块来判断用户说的语音是否为约定好的虹膜采集关键词,减少了不必要的虚警,提高了鲁棒性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一种基于麦克风阵列的远距离虹膜跟踪与采集方法的模块框图;
图2是单个麦克风阵列输出的平面和高度角度的示例;
图3是本发明中远距离虹膜采集方法的流程图;
图4是唤醒词判断流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1至图4,一种基于麦克风阵列的远距离虹膜跟踪与采集方法,包括中央处理控制模块5,及与之相连的基于分布式麦克风阵列的语音唤醒模块1及声源定位模块2以及用于采集远距离虹膜图像的红外摄像头模块3,云台及变焦模块4,包括:
步骤1:麦克风阵列的声源定位模块根据分布在分布式麦克风阵列声音采集范围内用户语音启动,并实时跟踪及计算用户嘴巴在三维空间中的位置信息;
步骤2:将所述位置信息传送至中央处理控制模块,如果位置信息在红外摄像机及云台的工作范围内,则所述中央处理控制模块控制红外摄像机的高速云台及变焦模块,对准用户的头部进行放大对焦拍摄,获取多幅用户头部的红外图像;
步骤3:语音唤醒模块根据麦克风阵列输出的增强后的语音识别当前用户语音是否为约定的唤醒词,如不是,则为无效语音,忽略所述红外图像;如是,则为有效语音,将采集的所述红外图像用于虹膜识别。
优选的,在执行步骤1时,所述分布式麦克风阵列为由M个(M>=1)安装在不同位置的麦克风阵列组成,假设第i个麦克风阵列包含Ni个麦克风,则整个分布式麦克风阵列包含
Figure BDA0001310776050000041
个麦克风,其实时跟踪及计算用户嘴巴在三维空间中的位置信息具体过程为:
步骤101:对于第i个由Ni个麦克风组成的麦克风阵列,Ni≥4,且不能全部分布在同一个平面上;麦克风两两配对,组成ni=Ni×(Ni-1)/2对麦克风配对;针对每一个配对,计算每对麦克风通道语音的时间差τij,j=1,…,ni
步骤102:根据每对麦克风通道语音的时间差,利用
Figure BDA0001310776050000042
推算出α,其中dij为这两个麦克风之间的间距,而c为空气中的声速,一般为340米/秒;
步骤103:假设第j个麦克风配对中的两个麦克风的实际空间位置分别为Mj1(xj1,yj1,zj1)和Mj2(xj2,yj2,zj2),则其夹角α与三维空间中声音源相对阵列坐标系的夹角θ和
Figure BDA0001310776050000043
的关系如下:
Figure BDA0001310776050000044
Figure BDA0001310776050000045
Figure BDA0001310776050000051
根据多个麦克风之间的两两配对,求平均或求最大值的方式获得相应的声音源的位置信息θ和
Figure BDA0001310776050000052
当系统中有多个分布式的麦克风阵列,则把每一个麦克风阵列获得的θ和
Figure BDA0001310776050000053
信息组合起来得到用户嘴巴在三维空间中的位置信息。
优选的,在执行步骤2时,所述云台和变焦模块根据麦克风阵列输出的位置信息的拍摄多幅人脸的图片,其中人眼部分的图片大小满足虹膜识别的要求,具体步骤为:
步骤201:根据分布式麦克风阵列声源定位模块传到中央控制单元的位置信息,判断声源坐标是否在预设的虹膜采集区域内,如是,进行步骤202;如不是,则为干扰信号,忽略该位置信息。
步骤202:中央控制单元控制红外摄像机的高速云台和变焦模块对准空间中的声源位置进行拍照;
步骤203:将采集的头部图片进行人脸检测及人眼检测,并提取出双眼的虹膜图像用以进行虹膜识别;如果照片清晰度低于预设值,由于无法准确提取人眼的图像,因此忽略该图像,继续处理下一张。
优选的,在执行步骤3时,其具体步骤为,步骤301:麦克风阵列采集得到的多通道语音经过回声抵消,去混响,波束集成,后滤波操作后,得到增强后的单通道语音,使用语音识别技术识别当前用户语音是否为约定的唤醒词,如不是,则为无效语音,忽略所述红外图像;如是,则为有效语音,将采集的所述红外图像用于后续的虹膜识别。
唤醒模块中的语音识别算法流程为,语音音频首先经过语音前端处理,再经过特征提取提取到有效信息,然后再将音频解码,解码处理包括声学模型、发音模型及语言模型,从而将语音转换成识别文本,再进行唤醒词的比对。
本发明把基于麦克风阵列的声源定位技术和远场语音识别及声纹识别技术与虹膜图像的采集有机的结合在一起,创新性的提出利用现有语音交互设备中的麦克风阵列来捕捉说话人的位置信息,并联动控制红外摄像机的云台和变焦模块来动态的采集说话人的头部清晰图像,使得在远距离场景同时进行虹膜识别和声纹识别成为可能,并使用唤醒词识别模块来判断用户说的语音是否为约定好的虹膜采集关键词,减少了不必要的虚警,提高了鲁棒性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于麦克风阵列的远距离虹膜跟踪与采集方法,包括中央处理控制模块,及与之相连的基于分布式麦克风阵列的语音唤醒模块及声源定位模块以及用于采集远距离虹膜图像的红外摄像头模块,云台及变焦模块,其特征在于,包括:
步骤1:麦克风阵列的声源定位模块根据分布在分布式麦克风阵列声音采集范围内用户语音启动,并实时跟踪及计算用户嘴巴在三维空间中的位置信息;
在执行步骤1时,所述分布式麦克风阵列为由M个(M>=1)安装在不同位置的麦克风阵列组成,假设第i个麦克风阵列包含Ni个麦克风,则整个分布式麦克风阵列包含
Figure FDA0002459847500000011
个麦克风,其实时跟踪及计算用户嘴巴在三维空间中的位置信息具体过程为:
步骤101:对于第i个由Ni个麦克风组成的麦克风阵列,Ni≥4,且不能全部分布在同一个平面上;麦克风两两配对,组成ni=Ni×(Ni-1)/2对麦克风配对;针对每一个配对,计算每对麦克风通道语音的时间差τij,j=1,…,ni
步骤102:根据每对麦克风通道语音的时间差,利用
Figure FDA0002459847500000012
推算出α,其中dij为这两个麦克风之间的间距,而c为空气中的声速;
步骤103:假设第j个麦克风配对中的两个麦克风的实际空间位置分别为
Mj1(xj1,yj1,zj1)和Mj2(xj2,yj2,zj2),则其夹角α与三维空间中声音源相对阵列坐标系的夹角θ和
Figure FDA0002459847500000013
的关系如下:
Figure FDA0002459847500000014
Figure FDA0002459847500000015
Figure FDA0002459847500000016
根据多个麦克风之间的两两配对,求平均或求最大值的方式获得相应的声音源的位置信息θ和
Figure FDA0002459847500000021
当系统中有多个分布式的麦克风阵列,则把每一个麦克风阵列获得的θ和
Figure FDA0002459847500000022
信息组合起来得到用户嘴巴在三维空间中的位置信息;
步骤2:将所述位置信息传送至中央处理控制模块,如果位置信息在红外摄像机及云台的工作范围内,则所述中央处理控制模块控制红外摄像机的高速云台及变焦模块,对准用户的头部进行放大对焦拍摄,获取多幅用户头部的红外图像;
步骤3:语音唤醒模块根据麦克风阵列输出的增强后的语音识别当前用户语音是否为约定的唤醒词,如不是,则为无效语音,忽略所述红外图像;如是,则为有效语音,将采集的所述红外图像用于后续的虹膜识别。
2.如权利要求1所述的一种基于麦克风阵列的远距离虹膜跟踪与采集方法,在执行步骤2时,所述云台和变焦模块根据麦克风阵列输出的位置信息的拍摄多幅人脸的图片,其中人眼部分的图片大小满足虹膜识别的要求,具体步骤为:
步骤201:根据分布式麦克风阵列声源定位模块传到中央控制单元的位置信息,判断声源坐标是否在预设的虹膜采集区域内,如是,进行步骤202;如不是,则为干扰信号,忽略该位置信息;
步骤202:中央控制单元控制红外摄像机的高速云台和变焦模块对准空间中的声源位置进行拍照;
步骤203:将采集的头部图片进行人脸检测及人眼检测,并提取出双眼的虹膜图像用以进行虹膜识别;如果照片清晰度低于预设值,则忽略该图像,继续处理下一张。
3.如权利要求1所述的一种基于麦克风阵列的远距离虹膜跟踪与采集方法,在执行步骤3时,其具体步骤为:
步骤301:麦克风阵列采集得到的多通道语音经过回声抵消,去混响,波束集成,后滤波操作后,得到增强后的单通道语音,使用语音识别技术识别当前用户语音是否为约定的唤醒词,如不是,则为无效语音,忽略所述红外图像;
如是,则为有效语音,将采集的所述红外图像用于后续的虹膜识别。
CN201710404985.8A 2017-06-01 2017-06-01 一种基于麦克风阵列的远距离虹膜跟踪与采集方法 Active CN107346661B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710404985.8A CN107346661B (zh) 2017-06-01 2017-06-01 一种基于麦克风阵列的远距离虹膜跟踪与采集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710404985.8A CN107346661B (zh) 2017-06-01 2017-06-01 一种基于麦克风阵列的远距离虹膜跟踪与采集方法

Publications (2)

Publication Number Publication Date
CN107346661A CN107346661A (zh) 2017-11-14
CN107346661B true CN107346661B (zh) 2020-06-12

Family

ID=60253326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710404985.8A Active CN107346661B (zh) 2017-06-01 2017-06-01 一种基于麦克风阵列的远距离虹膜跟踪与采集方法

Country Status (1)

Country Link
CN (1) CN107346661B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107809596A (zh) * 2017-11-15 2018-03-16 重庆科技学院 基于麦克风阵列的视频会议跟踪系统及方法
CN108510987B (zh) * 2018-03-26 2020-10-23 北京小米移动软件有限公司 语音处理方法及装置
CN110634498A (zh) * 2018-06-06 2019-12-31 阿里巴巴集团控股有限公司 一种语音处理方法及设备
CN108766438B (zh) * 2018-06-21 2020-12-01 Oppo广东移动通信有限公司 人机交互方法、装置、存储介质及智能终端
CN108828525A (zh) * 2018-06-25 2018-11-16 大连大学 混响房间内分布式麦克风阵列多声源定位系统
CN110765823A (zh) * 2018-07-27 2020-02-07 杭州海康威视系统技术有限公司 一种目标识别方法及装置
CN109817211B (zh) * 2019-02-14 2021-04-02 珠海格力电器股份有限公司 一种电器控制方法、装置、存储介质及电器
CN110085258B (zh) * 2019-04-02 2023-11-14 深圳Tcl新技术有限公司 一种提高远场语音识别率的方法、系统及可读存储介质
CN110490160B (zh) * 2019-08-23 2024-02-13 上海菲戈恩微电子科技有限公司 一种多镜头模组的指纹信息采集系统及电子设备
CN111243583B (zh) * 2019-12-31 2023-03-10 深圳市瑞讯云技术有限公司 一种系统唤醒方法及装置
CN112102546A (zh) * 2020-08-07 2020-12-18 浙江大华技术股份有限公司 一种人机交互控制方法、对讲呼叫方法及相关装置
CN115333890B (zh) * 2022-10-09 2023-08-04 珠海进田电子科技有限公司 一种基于人工智能的家电控制型智能线控器

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100631643B1 (ko) * 2005-06-03 2006-10-09 엘지전자 주식회사 홍채 인식을 이용한 촬영 위치 표시 장치 및 방법
CN1967657A (zh) * 2005-11-18 2007-05-23 成都索贝数码科技股份有限公司 节目制作中的说话人声音自动跟踪变调系统和方法
CN101567969A (zh) * 2009-05-21 2009-10-28 上海交通大学 基于麦克风阵列声音制导的智能视频导播方法
CN101763858A (zh) * 2009-10-19 2010-06-30 瑞声声学科技(深圳)有限公司 双麦克风信号处理方法
CN101770139A (zh) * 2008-12-29 2010-07-07 鸿富锦精密工业(深圳)有限公司 对焦控制系统及方法
CN102831392A (zh) * 2012-07-09 2012-12-19 哈尔滨工业大学 一种远距离虹膜跟踪与采集装置及其方法
CN104519212A (zh) * 2013-09-27 2015-04-15 华为技术有限公司 一种消除回声的方法及装置
CN204390737U (zh) * 2014-07-29 2015-06-10 科大讯飞股份有限公司 一种家庭语音处理系统
CN105355210A (zh) * 2015-10-30 2016-02-24 百度在线网络技术(北京)有限公司 用于远场语音识别的预处理方法和装置
CN106531179A (zh) * 2015-09-10 2017-03-22 中国科学院声学研究所 一种基于语义先验的选择性注意的多通道语音增强方法
CN106778713A (zh) * 2017-03-01 2017-05-31 武汉虹识技术有限公司 一种动态人眼跟踪的虹膜识别装置及方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100631643B1 (ko) * 2005-06-03 2006-10-09 엘지전자 주식회사 홍채 인식을 이용한 촬영 위치 표시 장치 및 방법
CN1967657A (zh) * 2005-11-18 2007-05-23 成都索贝数码科技股份有限公司 节目制作中的说话人声音自动跟踪变调系统和方法
CN101770139A (zh) * 2008-12-29 2010-07-07 鸿富锦精密工业(深圳)有限公司 对焦控制系统及方法
CN101567969A (zh) * 2009-05-21 2009-10-28 上海交通大学 基于麦克风阵列声音制导的智能视频导播方法
CN101763858A (zh) * 2009-10-19 2010-06-30 瑞声声学科技(深圳)有限公司 双麦克风信号处理方法
CN102831392A (zh) * 2012-07-09 2012-12-19 哈尔滨工业大学 一种远距离虹膜跟踪与采集装置及其方法
CN104519212A (zh) * 2013-09-27 2015-04-15 华为技术有限公司 一种消除回声的方法及装置
CN204390737U (zh) * 2014-07-29 2015-06-10 科大讯飞股份有限公司 一种家庭语音处理系统
CN106531179A (zh) * 2015-09-10 2017-03-22 中国科学院声学研究所 一种基于语义先验的选择性注意的多通道语音增强方法
CN105355210A (zh) * 2015-10-30 2016-02-24 百度在线网络技术(北京)有限公司 用于远场语音识别的预处理方法和装置
CN106778713A (zh) * 2017-03-01 2017-05-31 武汉虹识技术有限公司 一种动态人眼跟踪的虹膜识别装置及方法

Also Published As

Publication number Publication date
CN107346661A (zh) 2017-11-14

Similar Documents

Publication Publication Date Title
CN107346661B (zh) 一种基于麦克风阵列的远距离虹膜跟踪与采集方法
KR102196686B1 (ko) 신원 인증 방법 및 장치
CN106710603B (zh) 利用线性麦克风阵列的语音识别方法及系统
US20200075012A1 (en) Methods, apparatuses, systems, devices, and computer-readable storage media for processing speech signals
JP5456832B2 (ja) 入力された発話の関連性を判定するための装置および方法
CN108470169A (zh) 人脸识别系统及方法
CN111833899B (zh) 一种基于多音区的语音检测方法、相关装置及存储介质
US20240087587A1 (en) Wearable system speech processing
CN105427421A (zh) 基于人脸识别的门禁控制方法
US20190028817A1 (en) System and method for a directional speaker selection
US20230343071A1 (en) Liveness detection
CN111723679A (zh) 基于深度迁移学习的人脸和声纹认证系统及方法
CN109410957A (zh) 基于计算机视觉辅助的正面人机交互语音识别方法及系统
CN109147787A (zh) 一种智能电视声控识别系统及其识别方法
CN111767785A (zh) 人机交互控制方法及装置、智能机器人及存储介质
CN108877787A (zh) 语音识别方法、装置、服务器及存储介质
WO2021017096A1 (zh) 一种将人脸信息录入数据库的方法和装置
CN208351494U (zh) 人脸识别系统
WO2022268183A1 (zh) 一种基于视频的随机手势认证方法及系统
CN111179927A (zh) 一种金融设备语音交互方法以及系统
CN111341350A (zh) 人机交互控制方法、系统、智能机器人及存储介质
CN111551921A (zh) 一种声像联动的声源定向系统及方法
CN110188179A (zh) 语音定向识别交互方法、装置、设备及介质
WO2023193803A1 (zh) 音量控制方法、装置、存储介质和电子设备
US20230136553A1 (en) Context-aided identification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20180709

Address after: 215300 Jiangsu, Suzhou, Kunshan, Kunshan, Chong Chong South Road 1699 good room 1602-1605

Applicant after: Iwo artificial intelligence technology (Jiangsu) Co., Ltd.

Address before: A block, Tian Xing apartment, Yishan street, Wuxing District, Huzhou, Zhejiang

Applicant before: Li Cuan

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant