CN106599866B - 一种多维度用户身份识别方法 - Google Patents
一种多维度用户身份识别方法 Download PDFInfo
- Publication number
- CN106599866B CN106599866B CN201611195804.7A CN201611195804A CN106599866B CN 106599866 B CN106599866 B CN 106599866B CN 201611195804 A CN201611195804 A CN 201611195804A CN 106599866 B CN106599866 B CN 106599866B
- Authority
- CN
- China
- Prior art keywords
- user
- sound
- sample
- authority
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 230000001815 facial effect Effects 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 9
- 230000005236 sound signal Effects 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 8
- 230000033001 locomotion Effects 0.000 claims description 5
- 230000006399 behavior Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 3
- 238000013139 quantization Methods 0.000 claims description 3
- 230000003068 static effect Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/446—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering using Haar-like filters, e.g. using integral image techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Collating Specific Patterns (AREA)
- Image Processing (AREA)
Abstract
一种多维度用户身份识别方法,通过摄像头检测到拍摄范围内的人体,抓取人体面部特征,与样本库中预存的用户照片进行对比,计算出人脸匹配系数,初步判定拥有权限的用户是否存在拍摄范围内;使用麦克风接收用户语音,将音频模拟信号转换为数字序列,再将数字序列与样本库中预存的用户声纹进行对比,计算出声纹匹配系数,对人脸匹配系数与声纹识别匹配系数再次进行计算,计算出匹配程度,从而判断该用户是否拥有权限,当判断该用户拥有权限时,系统为用户进行建模,并对用户进行人体动态跟踪,与对用户进行人体跟踪计算出的位置进行匹配,当声音位置与图像位置相匹配时,判断该指令为拥有权限的用户发出,指令有效,从而执行指令。
Description
技术领域
本发明属于智能家居技术领域,特别涉及一种多维度用户身份识别方法。
背景技术
随着社会的不断发展及科技的进步,人们对智能生活的憧憬使得智能家居产品越来越多地出现在日常生活中。智能家电、智能安防产品确实能够为人们带来生活上的便利,然而目前的技术手段仍然无法有效解决用户的权限控制问题。传统的文字密码、指纹等,虽然安全性较高,但需要用户进行主动验证,受其输入形式的制约,仍然无法很好地应用在一些日常场景中。而人脸识别、声音识别等生物密码的形式,虽然能够被动辨识,但其辨识维度单一,无法满足复杂场景的需求。
多维度用户身份辨识系统的出现,能够解决当前智能家居系统对于用户身份辨识的难题。通过使用声音与图像多重维度交叉辨识,能够实现被动辨识、辨识成功率高、持续识别等特点,提升智能家居系统的安全性,真正保障使用者的个人隐私与人身安全。
发明内容
本发明的目的,是为智能家居的用户身份识别提供一种方法,通过对用户相貌识别和声纹识别判断用户身份,通过音源方位判定与人体移动追踪实现持续的用户身份识别。
一种多维度用户身份识别方法,用于识别判定对家居设备拥有控制权限的用户身份,该识别方法包括步骤:
对用户的相貌和声音进行采样入库,作为权限辨识的样本;
通过摄像头检测到拍摄范围内的人体,抓取人体面部特征,与样本库中预存的用户照片进行对比,计算出人脸匹配系数,初步判定拥有权限的用户是否存在拍摄范围内;
使用麦克风接收用户语音,通过对用户声音的采集、转换,将音频模拟信号转换为数字序列,再将数字序列与样本库中预存的用户声纹进行对比,计算出声纹匹配系数,对人脸匹配系数与声纹识别匹配系数再次进行计算,计算出匹配程度,从而判断该用户是否拥有权限,
当判断该用户拥有权限时,系统为用户进行建模,并对用户进行人体动态跟踪,同时使用麦克风阵列对用户发出的语音指令进行判断,计算出音源位置,与对用户进行人体跟踪计算出的位置进行匹配,当声音位置与图像位置相匹配时,判断该指令为拥有权限的用户发出,指令有效,从而执行指令。
与样本库中预存的用户照片进行对比,是人脸识别过程,具体步骤是:
需要获取权限的用户先通过摄像头拍摄自己的面部照片,照片存入样本库,作为对比样本;
在抓取了需要判定权限的用户图片后,首先将其与多个不同尺度和方向的Gabor滤波器卷积获得多分辨率的变换图像,然后将每个Gabor特征图谱划分成若干互不相交的局部空间区域,对每个区域提取局部邻域像素的亮度变化模式,并在每个局部空间区域内提取这些变化模式的空间区域直方图;
所有Gabor特征图谱的、所有区域的直方图串接为一高维特征直方图来编码人脸图像,并通过直方图之间的相似度匹配技术计算出匹配值。
与样本库中预存的用户声纹进行对比,计算出声纹匹配系数,是声纹识别过程,具体步骤包括:
将被识别的目标声音对象和声音样本进行比对,判断目标声音和样本的一致性,对样本音频和被识别声音信号进行量化,然后提取声音特征,通过对比特征的匹配比对得出计算结果,其中声音样本的获取的过程是,
需要获得权限的用户通过麦克风录入样本声音,即样本采样,将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的样值归为一类,并赋于相同的量化值,采取二进制的方式,以8位或16位的方式来划分纵轴,在一个以8位为记录模式的音效中,其纵轴将会被划分为个量化等级,用以记录其幅度大小,随后对样本提取MFCC特征和LPC特征,
以同样方式对需要判断的声音进行采样并进行量化,并提取目标声音的MFCC特征和LPC特征,将目标声音特征与样本声音特征进行比对,根据其匹配程度计算出匹配值。
在获得人脸识别与声纹识别的匹配值之后,将两个匹配值分别加入参数进行计算,当计算结果大于预设的阈值时,判断目标用户与样本用户相匹配,该目标用户获得权限。
人体动态追踪的过程包括:
在确认了获得权限的用户之后,对用户进行建模,当用户进行移动时,会对用户进行持续的影像追踪,获取用户的实时位置;当识别出用户身份后,使用单个静止数字摄像机得到德尔灰度图像序列作为输入,对单用户或多用户的运动行为进行视频检测与跟踪,使用背景减除法(BackgroundSubtract ion)来计算当前人体运动行为和轨迹。
当完成用户人体检测与跟踪时,该用户在拍摄区域内的位置作为判定用户身份的条件之一。
进一步的,当检测环境中有人说话时,使用麦克风阵列拾取声音信号,通过对多路声音信号进行分析与处理,在空间域中定曲一个或多个声源的平面或空间坐标,即得到声源的位置,该位置作为判定用户身份的条件之一。
进一步的,用多维条件判定用户方位:
结合视频追踪用户方位和麦克风阵列判断音源方位两个条件,能够判断出发出指令的声音来源与拥有权限的用户所在位置是否一致,当两者所处方位一致时,则可判断该指令为拥有权限的用户所发出的。
本发明采用声纹识别、人脸识别、音源判断、人体追踪等技术手段,通过声音、图像等多种维度实现对用户身份进行识别,并通过声音和图像对识别获得权限的用户进行方位判断及动态追踪的技术方案,特别适用于智能家居中对于权限用户的身份识别
附图说明
图1是本发明中声纹识别的方法示意图。
图2是本发明中人体动态追踪方法示意图。
具体实施方式
以下结合附图,分别说明本发明中涉及的技术实现过程。
人脸识别:需要获取权限的用户先通过摄像头拍摄自己的面部照片,照片会存入样本库,作为对比样本。在抓取了需要判定权限的用户图像后,首先将其与多个不同尺度和方向的Gabor滤波器卷积(卷积结果称为Gabor特征图谱)获得多分辨率的变换图像。然后将每个Gabor特征图谱划分成若干互不相交的局部空间区域,对每个区域提取局部邻域像素的亮度变化模式,并在每个局部空间区域内提取这些变化模式的空间区域直方图,所有Gabor特征图谱的、所有区域的直方图串接为一高维特征直方图来编码人脸图像,并通过直方图之间的相似度匹配技术(如直方图交运算)计算出匹配值;
声纹识别:声纹识别是将被识别的目标声音对象和声音样本进行比对,判断目标声音和样本的一致性。需要现对样本音频和被识别声音信号进行量化,然后提取声音特征,最后通过对比特征的匹配比对得出计算结果。
需要获得权限的用户通过麦克风录入样本声音,即样本采样,将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的样值归为一类,并赋于相同的量化值。采取二进制的方式,以8位(b i t)或16位(b i t)的方式来划分纵轴,在一个以8位为记录模式的音效中,其纵轴将会被划分为个量化等级,用以记录其幅度大小。随后对样本提取MFCC特征和LPC特征,程序算法如图1所示。
以同样方式对需要判断的声音进行采样并进行量化,并提取目标声音的MFCC特征和LPC特征,将目标声音特征与样本声音特征进行比对,根据其匹配程度计算出匹配值。
人脸识别与声纹识别的多维度计算:在获得人脸识别与声纹识别的匹配值之后,将两个匹配值分别加入参数进行计算,当计算结果大于预设的阈值时,判断目标用户与样本用户相匹配,该目标用户获得权限。
人体动态追踪:人体动态追踪是在确认了获得权限的用户之后,对用户进行建模,当用户进行移动时,会对用户进行持续的影像追踪,获取用户的实时位置;当识别出用户身份后,使用单个静止数字摄像机得到德尔灰度图像序列作为输入,对单用户或多用户的运动行为进行视频检测与跟踪。检测与跟踪算法如图2所示。
当完成用户人体检测与跟踪时,该用户在拍摄区域内的位置作为判定用户身份的条件之一。
声音追踪:麦克风声源定位技术是利用麦克风拾取语音信号,并用数字信号处理技术对其进行分析和处理,继而确定和跟踪声源的空间位置。传统的单个麦克风的拾音范围很有限,拾取信号的质量不高,而麦克风阵列具有去噪、声源定位和跟踪等功能,从而大大提高了语音信号处理质量。
当场景中有人说话时,使用麦克风阵列拾取声音信号,通过对多路声音信号进行分析与处理,在空间域中定曲一个或多个声源的平面或空间坐标,即得到声源的位置,该位置作为判定用户身份的另一个条件。
多维条件判定用户方位:结合视频追踪用户方位和麦克风阵列判断音源方位两个条件,能够判断出发出指令的声音来源与拥有权限的用户所在位置是否一致。当两者所处方位一致时,则可判断该指令为拥有权限的用户所发出的。
Claims (1)
1.一种多维度用户身份识别方法,用于识别判定对家居设备拥有控制权限的用户身份,其特征在于,该识别方法包括步骤:
对用户的相貌和声音进行采样入库,作为权限辨识的样本;
通过摄像头检测到拍摄范围内的人体,抓取人体面部特征,与样本库中预存的用户照片进行对比,计算出人脸匹配系数,初步判定拥有权限的用户是否存在拍摄范围内;
使用麦克风接收用户语音,通过对用户声音的采集、转换,将音频模拟信号转换为数字序列,再将数字序列与样本库中预存的用户声纹进行对比,计算出声纹匹配系数,对人脸匹配系数与声纹识别匹配系数再次进行计算,计算出匹配程度,从而判断该用户是否拥有权限,
当判断该用户拥有权限时,系统为用户进行建模,并对用户进行人体动态跟踪,同时使用麦克风阵列对用户发出的语音指令进行判断,计算出音源位置,与对用户进行人体跟踪计算出的位置进行匹配,当声音位置与图像位置相匹配时,判断该指令为拥有权限的用户发出,指令有效,从而执行指令,
其中,抓取人体面部特征,与样本库中预存的用户照片进行对比,是人脸识别过程,具体步骤是:
需要获取权限的用户先通过摄像头拍摄自己的面部照片,照片存入样本库,作为对比样本;
在抓取了需要判定权限的用户图片后,首先将其与多个不同尺度和方向的Gabor滤波器卷积获得多分辨率的变换图像,然后将每个Gabor特征图谱划分成若干互不相交的局部空间区域,对每个区域提取局部邻域像素的亮度变化模式,并在每个局部空间区域内提取这些变化模式的空间区域直方图;
所有Gabor特征图谱的、所有区域的直方图串接为一高维特征直方图来编码人脸图像,并通过直方图之间的相似度匹配技术计算出匹配值,
其中,与样本库中预存的用户声纹进行对比,计算出声纹匹配系数,是声纹识别过程,具体步骤包括:
将被识别的目标声音对象和声音样本进行比对,判断目标声音和样本的一致性,对样本音频和被识别声音信号进行量化,然后提取声音特征,通过对比特征的匹配比对得出计算结果,其中声音样本的获取的过程是,
需要获得权限的用户通过麦克风录入样本声音,即样本采样,将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的样值归为一类,并赋于相同的量化值,采取二进制的方式,以8位或16位的方式来划分纵轴,在一个以8位为记录模式的音效中,其纵轴将会被划分为个量化等级,用以记录其幅度大小,随后对样本提取MFCC特征和LPC特征,
以同样方式对需要判断的声音进行采样并进行量化,并提取目标声音的MFCC特征和LPC特征,将目标声音特征与样本声音特征进行比对,根据其匹配程度计算出匹配值,
其中,在获得人脸识别与声纹识别的匹配值之后,将两个匹配值分别加入参数进行计算,当计算结果大于预设的阈值时,判断目标用户与样本用户相匹配,该目标用户获得权限,
其中,人体动态追踪的过程包括:
在确认了获得权限的用户之后,对用户进行建模,当用户进行移动时,会对用户进行持续的影像追踪,获取用户的实时位置;当识别出用户身份后,使用单个静止数字摄像机得到德尔灰度图像序列作为输入,对单用户或多用户的运动行为使用背景减除法(BackgroundSubtraction)进行视频检测与跟踪,
当完成用户人体检测与跟踪时,该用户在拍摄区域内的位置作为判定用户身份的条件之一,
当检测环境中有人说话时,使用麦克风阵列拾取声音信号,通过对多路声音信号进行分析与处理,在空间域中定曲一个或多个声源的平面或空间坐标,即得到声源的位置,该位置作为判定用户身份的条件之一,
其中,用多维条件判定用户方位:结合视频追踪用户方位和麦克风阵列判断音源方位两个条件,能够判断出发出指令的声音来源与拥有权限的用户所在位置是否一致,当两者所处方位一致时,则可判断该指令为拥有权限的用户所发出的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611195804.7A CN106599866B (zh) | 2016-12-22 | 2016-12-22 | 一种多维度用户身份识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611195804.7A CN106599866B (zh) | 2016-12-22 | 2016-12-22 | 一种多维度用户身份识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106599866A CN106599866A (zh) | 2017-04-26 |
CN106599866B true CN106599866B (zh) | 2020-06-02 |
Family
ID=58602360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611195804.7A Active CN106599866B (zh) | 2016-12-22 | 2016-12-22 | 一种多维度用户身份识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106599866B (zh) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107171872B (zh) * | 2017-07-19 | 2020-06-02 | 上海百芝龙网络科技有限公司 | 一种智能家居中用户行为预测方法 |
CN109300475A (zh) * | 2017-07-25 | 2019-02-01 | 中国电信股份有限公司 | 麦克风阵列拾音方法和装置 |
CN107392177A (zh) * | 2017-08-05 | 2017-11-24 | 江西中医药大学 | 一种人体身份识别验证方法及其装置 |
CN109426787A (zh) | 2017-08-31 | 2019-03-05 | 杭州海康威视数字技术股份有限公司 | 一种人体目标轨迹确定方法及装置 |
CN109754653B (zh) * | 2017-11-06 | 2021-11-09 | 北京小红果文化科技有限公司 | 一种个性化教学的方法及系统 |
CN108320739B (zh) * | 2017-12-22 | 2022-03-01 | 景晖 | 根据位置信息辅助语音指令识别方法和装置 |
CN108168204A (zh) * | 2017-12-27 | 2018-06-15 | 广西南宁英凡达科技有限公司 | 冰箱控制方法及系统 |
CN110300086A (zh) * | 2018-03-22 | 2019-10-01 | 北京语智科技有限公司 | 身份识别方法、装置、系统及设备 |
CN108549848B (zh) * | 2018-03-27 | 2022-02-25 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
CN108600627A (zh) * | 2018-04-25 | 2018-09-28 | 东莞职业技术学院 | 一种智慧校园视频处理系统 |
CN108766435A (zh) * | 2018-05-17 | 2018-11-06 | 东莞市华睿电子科技有限公司 | 一种基于非触控式的空间机器人控制方法 |
CN108765653A (zh) * | 2018-05-17 | 2018-11-06 | 东莞市华睿电子科技有限公司 | 一种电气设备接入的倒闸柜的柜门控制方法 |
CN108876984A (zh) * | 2018-05-17 | 2018-11-23 | 东莞市华睿电子科技有限公司 | 一种红外热成像与人像的属性信息结合的自动控制方法 |
CN108765654A (zh) * | 2018-05-17 | 2018-11-06 | 东莞市华睿电子科技有限公司 | 一种基于超声波测距触发的柜门控制方法 |
CN108921982A (zh) * | 2018-05-17 | 2018-11-30 | 东莞市华睿电子科技有限公司 | 一种云平台与人体红外热成像相结合的智能控制方法 |
CN108908377B (zh) * | 2018-07-06 | 2020-06-23 | 达闼科技(北京)有限公司 | 说话人识别方法、装置和机器人 |
CN109150538B (zh) * | 2018-07-16 | 2021-06-25 | 广州大学 | 一种指纹与声纹融合身份认证方法 |
CN109062064A (zh) * | 2018-08-07 | 2018-12-21 | 武汉工程大学 | 一种基于电子门牌的智能家居控制装置及控制方法 |
CN109241721A (zh) * | 2018-09-30 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN111273232B (zh) * | 2018-12-05 | 2023-05-19 | 杭州海康威视系统技术有限公司 | 一种室内异常情况判断方法及系统 |
CN109754811B (zh) * | 2018-12-10 | 2023-06-02 | 平安科技(深圳)有限公司 | 基于生物特征的声源追踪方法、装置、设备及存储介质 |
CN109839614B (zh) * | 2018-12-29 | 2020-11-06 | 深圳市天彦通信股份有限公司 | 固定式采集设备的定位系统及方法 |
CN109886279B (zh) * | 2019-01-24 | 2023-09-29 | 平安科技(深圳)有限公司 | 图像处理方法、装置、计算机设备及存储介质 |
CN111901721B (zh) * | 2019-05-05 | 2022-06-14 | 阿里巴巴集团控股有限公司 | 检测目标对象的方法、装置和智能音箱 |
TWI691211B (zh) * | 2019-05-21 | 2020-04-11 | 國立雲林科技大學 | 一種聽音辨位拍照及後製智能剪裁之系統 |
CN111823241A (zh) * | 2019-05-27 | 2020-10-27 | 广东小天才科技有限公司 | 一种智能安防机器人、方法、装置、存储介质 |
CN110444212A (zh) * | 2019-09-10 | 2019-11-12 | 安徽大德中电智能科技有限公司 | 一种智能家居机器人语音识别装置及识别方法 |
CN111145739A (zh) * | 2019-12-12 | 2020-05-12 | 珠海格力电器股份有限公司 | 一种基于视觉的免唤醒语音识别方法、计算机可读存储介质及空调 |
CN111767793B (zh) * | 2020-05-25 | 2024-07-26 | 联想(北京)有限公司 | 一种数据处理方法及装置 |
CN111814763B (zh) * | 2020-08-26 | 2021-01-08 | 长沙鹏阳信息技术有限公司 | 一种基于跟踪序列的无感考勤和制服识别方法 |
CN112365895B (zh) * | 2020-10-09 | 2024-04-19 | 深圳前海微众银行股份有限公司 | 音频处理方法、装置及计算设备、存储介质 |
CN112329750B (zh) * | 2021-01-05 | 2021-04-20 | 北京远鉴信息技术有限公司 | 基于数字序列的身份识别方法、装置、电子设备及介质 |
CN113284490B (zh) * | 2021-04-23 | 2022-09-09 | 歌尔股份有限公司 | 电子设备的控制方法、装置、设备及可读存储介质 |
CN113407758A (zh) * | 2021-07-13 | 2021-09-17 | 中国第一汽车股份有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN115083407B (zh) * | 2022-06-08 | 2024-03-22 | 博泰车联网(南京)有限公司 | 车辆控制方法、车辆、电子设备及计算机可读存储介质 |
CN115484508A (zh) * | 2022-09-09 | 2022-12-16 | 上海东普信息科技有限公司 | 水印生成方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102136269A (zh) * | 2010-01-22 | 2011-07-27 | 微软公司 | 经由标识信息的语音识别分析 |
CN103440686A (zh) * | 2013-07-29 | 2013-12-11 | 上海交通大学 | 基于声纹识别、头像识别及位置服务的移动身份验证系统和方法 |
CN103475490A (zh) * | 2013-09-29 | 2013-12-25 | 广州网易计算机系统有限公司 | 一种身份验证方法及装置 |
CN103902963A (zh) * | 2012-12-28 | 2014-07-02 | 联想(北京)有限公司 | 一种识别方位及身份的方法和电子设备 |
CN105957521A (zh) * | 2016-02-29 | 2016-09-21 | 青岛克路德机器人有限公司 | 一种用于机器人的语音和图像复合交互执行方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9094211B2 (en) * | 2011-08-26 | 2015-07-28 | Life Technologies Corporation | Systems and methods for identifying an individual |
-
2016
- 2016-12-22 CN CN201611195804.7A patent/CN106599866B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102136269A (zh) * | 2010-01-22 | 2011-07-27 | 微软公司 | 经由标识信息的语音识别分析 |
CN103902963A (zh) * | 2012-12-28 | 2014-07-02 | 联想(北京)有限公司 | 一种识别方位及身份的方法和电子设备 |
CN103440686A (zh) * | 2013-07-29 | 2013-12-11 | 上海交通大学 | 基于声纹识别、头像识别及位置服务的移动身份验证系统和方法 |
CN103475490A (zh) * | 2013-09-29 | 2013-12-25 | 广州网易计算机系统有限公司 | 一种身份验证方法及装置 |
CN105957521A (zh) * | 2016-02-29 | 2016-09-21 | 青岛克路德机器人有限公司 | 一种用于机器人的语音和图像复合交互执行方法及系统 |
Non-Patent Citations (2)
Title |
---|
A comprehensive study of various biometric identification techniques;Anshul Khairwa 等;《Proceedings 2001 International Conference on Image Processing》;20121231;第246-249页 * |
基于数字水印的人脸与声纹融合识别算法;王骕 等;《浙江大学学报(工学版)》;20150131;第49卷(第1期);第6-14页 * |
Also Published As
Publication number | Publication date |
---|---|
CN106599866A (zh) | 2017-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106599866B (zh) | 一种多维度用户身份识别方法 | |
JP7109634B2 (ja) | アイデンティティ認証方法及び装置 | |
CN107799126B (zh) | 基于有监督机器学习的语音端点检测方法及装置 | |
US11082460B2 (en) | Audio source enhancement facilitated using video data | |
CN104361276A (zh) | 一种多模态生物特征身份认证方法及系统 | |
CN110287918B (zh) | 活体识别方法及相关产品 | |
CN111341350A (zh) | 人机交互控制方法、系统、智能机器人及存储介质 | |
CN113591747A (zh) | 一种基于深度学习的多场景虹膜识别方法 | |
Chowdhury et al. | Msu-avis dataset: Fusing face and voice modalities for biometric recognition in indoor surveillance videos | |
CN112906544A (zh) | 一种适用于多目标的基于声纹和人脸的匹配方法 | |
Itkarkar et al. | Hand gesture to speech conversion using Matlab | |
CN116612542A (zh) | 基于多模态生物特征一致性的音视频人物识别方法及系统 | |
CN116883900A (zh) | 一种基于多维生物特征的视频真伪鉴别方法和系统 | |
US11830272B2 (en) | Method and apparatus for identifying animal species | |
Weerachai et al. | Human behavior recognition via top-view vision for intelligent space | |
KR101171047B1 (ko) | 음성 및 영상 인식 기능을 갖는 로봇 시스템 및 그의 인식 방법 | |
US10863146B1 (en) | Setup and configuration of audio/video recording and communication devices | |
Shenai et al. | Fast biometric authentication system based on audio-visual fusion | |
CN114241575B (zh) | 一种基于ai的深度学习的大数据人脸识别系统 | |
Ramya et al. | Enhanced Speaker Verification Incorporated with Face Recognition | |
CN115223278B (zh) | 一种基于人脸识别的智能门锁及开锁方法 | |
Kale et al. | Active Multi-Modal Approach for Enhanced User Recognition in Social Robots | |
KR20220080950A (ko) | 사용자 위치추적 및 얼굴인식을 이용한 스마트 스피커 보안 강화 방법 | |
CN118447837A (zh) | 唇动的语言识别方法、装置、介质及设备 | |
He et al. | New student reporting robot design based on Baidu AI face recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210323 Address after: 213000 No.2 Hongyang Road, Tianning District, Changzhou City, Jiangsu Province Patentee after: Changzhou bailongzhi Technology Co.,Ltd. Address before: 200050 West Yan'an Road, Changning District, Changning District, Shanghai, 4 Patentee before: SHANGHAI PERSPICACE INTELLIGENCE TECHNOLOGY Co.,Ltd. |