CN115100701A - 一种基于人工智能技术的会议发言人身份识别方法 - Google Patents
一种基于人工智能技术的会议发言人身份识别方法 Download PDFInfo
- Publication number
- CN115100701A CN115100701A CN202110248888.0A CN202110248888A CN115100701A CN 115100701 A CN115100701 A CN 115100701A CN 202110248888 A CN202110248888 A CN 202110248888A CN 115100701 A CN115100701 A CN 115100701A
- Authority
- CN
- China
- Prior art keywords
- voiceprint
- speaker
- identification
- audio channel
- identity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 28
- 238000005516 engineering process Methods 0.000 title claims abstract description 22
- 230000001815 facial effect Effects 0.000 claims abstract description 8
- 230000005236 sound signal Effects 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000013135 deep learning Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 230000001360 synchronised effect Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 230000008030 elimination Effects 0.000 claims description 2
- 238000003379 elimination reaction Methods 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 abstract description 6
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Collating Specific Patterns (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明涉及智能监测技术领域,尤其涉及一种基于人工智能技术的会议发言人身份识别方法。所述方法为:扫描参会人员的人脸信息,得到人脸图像特征数据;将人脸图像特征数据在人脸样本数据库中进行检索及对比分析,将相似度最高的人员信息作为识别结果输出,识别所有参会人员身份信息;将参会人员信息与音频通道按照编号进行绑定;会议过程中,若有人发言,则通过音频通道识别初步判断当前发言人的身份;同时,会议过程中,若有人发言,采集发言人的声纹信息,则通过声纹识别初步判断当前发言人的身份;结合音频通道识别和声纹识别的结果,进行综合性分析,给出最终的发言人身份识别结果。本发明提高会了议智能监测系统识别发言人身份信息的准确度。
Description
技术领域
本发明涉及智能监测技术领域,尤其涉及一种基于人工智能技术的会议发言人身份识别方法。
背景技术
工前会是核电厂常用的人因工具之一,工前会质量对后续工作开展尤其是作业风险控制起到关键作用。
目前,核电厂高风险作业工前会逐步采用智能会议监测系统来对会议的各种信息,如参会人员签到、会议迟到早退等异常情况、发言人身份、发言内容、发言次序等,进行采集、分析、记录,最终以智能数据的形式进行展示,以辅助工作会议更高效地召开。因此,智能会议监测系统需要采取一定的技术手段,在有人发言时,能够快速、准确地识别当前发言人的身份信息。
发明内容
本发明要解决的技术问题是:提供一种基于人工智能技术的会议发言人身份识别方法,以提高会议智能监测系统识别发言人身份信息的准确度。
本发明提供了一种基于人工智能技术的会议发言人身份识别方法,包括以下步骤:
步骤S1:扫描所有参会人员的人脸信息,得到人脸图像特征数据;将所述人脸图像特征数据在人脸样本数据库中进行检索及对比分析,将相似度最高的人员信息作为识别结果输出,依次识别所有参会人员身份信息;
步骤S2:根据现场情况,将参会人员信息与音频通道按照编号进行绑定,形成发言人与音频通道的一一对应关系;会议过程中,若有人打开音频通道发言,则通过音频通道识别初步判断当前发言人的身份;
同时,会议过程中,若有人发言,采集发言人的声纹信息,则通过声纹识别初步判断当前发言人的身份;
步骤S3:结合音频通道识别和声纹识别的结果,进行综合性分析判断,
若音频通道识别结果与声纹识别结果一致,则按此结果输出;
若音频通道识别结果与声纹识别结果不一致,分为以下情况:
当音频通道识别和声纹识别任意一个存在无识别结果的情况,则:
若声纹识别结果为陌生人,音频通道有识别结果,则按音频通道识别结果输出;
若音频通道识别无识别结果,则按声纹识别结果输出;
当音频通道识别或声纹识别均存在识别结果,则:
若音频通道识别结果与声纹识别结果不一致,则根据音频信号强度是否高于设定阈值的判断结果分析,若高于设定阈值,则按音频通道识别结果输出;反之,若低于设定阈值,则按声纹识别结果输出;
步骤S4:根据输出结果,给出最终的发言人身份识别结果。
优选地,所述步骤S2中:
会议过程中,若有人打开音频通道发言,则同步分析判断所有音频通道传输的信号强度,识别出音频信号最强的音频通道编号,判断音频信号强度是否高于设定阈值,同时根据音频通道的同时根据音频通道与参会人员身份绑定对照信息,初步识别出当前发言人身份;
优选地,所述步骤S2中:
会议过程中,若有人打开音频通道发言,块根据采集到的音频信息进行同步分析,将发言人声纹特征数据在声纹样本数据集中进行比对分析,得出相似度概率前2~5个人员身份识别结果,再根据步骤S1中得到的所有参会人员身份信息,进行综合判断,初步确定发言人身份识别结果。
优选地,所述步骤S2中,会议过程中,若有人打开麦克风发言,利用声纹识别模块根据采集到的音频信息进行同步分析,将发言人声纹特征数据在声纹样本数据集中进行比对分析,得出相似度概率前三的3个人员身份识别结果,再根据步骤S1中得到的所有参会人员身份信息,进行综合判断,初步确定发言人身份识别结果。
优选地,所述步骤S3中,若音频通道识别结果与声纹识别结果一致,分为以下两种情况:
若音频通道识别无识别结果,声纹识别结果为陌生人,则判断识别结果为陌生人;
若音频通道识别与声纹识别均有识别结果,则按此识别结果输出。
优选地,所述人脸样本数据库的建立方法为:
采集人脸样本数据,通过人工智能算法模型进行处理和训练,
进行人脸检测;
采用基于神经网络的深度学习算法进行人脸特征提取;
将提取到的特征向量分类构建样本数据集,形成算法模型数据库;
采集后续待识别人员的人脸信息,进行注册。
优选地,所述人脸检测包括判断人脸图像区域,剔除无用数据。
优选地,所述步骤S2中,进行声纹识别时,利用收集的声音信息与声纹数据库进行比对,所述声纹数据库的建立方法具体为:
采集声纹样本数据,通过人工智能算法模型进行处理和训练,
进行声纹信号预处理;
采用基于神经网络的深度学习算法进行声纹特征提取;
将提取到的特征向量分类构建样本数据集,形成算法模型数据库;
采集后续待识别人员的声纹信息,进行注册。
优选地,所述声纹信号预处理包括切除静音,消除造影,并且增强信道。
优选地,所述步骤S2中,音频通道识别或者声纹识别时,利用线性判别式分析,或者PLDA算法进行分类识别。
与现有技术相比,本发明的基于人工智能技术的会议发言人身份识别方法,具有如下有益效果:
(1)通过各种人工智能算法技术的合理运用,可以显著提高发言人身份识别的准确性;
(2)在会议进程中,自动、快速、动态地给出识别结果。
附图说明
图1表示本发明所述的一种基于人工智能技术的工前会发言人身份识别方法流程图。
具体实施方式
为了进一步理解本发明,下面结合实施例对本发明的实施方案进行描述,但是应当理解,这些描述只是为进一步说明本发明的特征和优点,而不是对本发明的限制。
本发明的实施例公开了一种基于人工智能技术的会议发言人身份识别方法,如图1所示,包括以下步骤:
步骤S1:扫描所有参会人员的人脸信息,得到人脸图像特征数据;将所述人脸图像特征数据在人脸样本数据库中进行检索及对比分析,将相似度最高的人员信息作为识别结果输出,依次识别所有参会人员身份信息;
步骤S2:根据现场情况,将参会人员信息与音频通道按照编号进行绑定,形成发言人与音频通道的一一对应关系;会议过程中,若有人打开音频通道发言,则通过音频通道识别初步判断当前发言人的身份;
同时,会议过程中,若有人发言,采集发言人的声纹信息,则通过声纹识别初步判断当前发言人的身份;
步骤S3:结合音频通道识别和声纹识别的结果,进行综合性分析判断,
若音频通道识别结果与声纹识别结果一致,则按此结果输出;
若音频通道识别结果与声纹识别结果不一致,分为以下情况:
当音频通道识别和声纹识别任意一个存在无识别结果的情况,则:
若声纹识别结果为陌生人,音频通道有识别结果,则按音频通道识别结果输出;
若音频通道识别无识别结果,则按声纹识别结果输出;
当音频通道识别或声纹识别均存在识别结果,则:
若音频通道识别结果与声纹识别结果不一致,则根据音频信号强度是否高于设定阈值的判断结果分析,若高于设定阈值,则按音频通道识别结果输出;反之,若低于设定阈值,则按声纹识别结果输出;
步骤S4:根据输出结果,给出最终的发言人身份识别结果。
本发明的整个方法中,均由计算机自动化执行,在会议有人发言时快速、动态地反馈识别结果。
以下按照步骤,具体说明所述基于人工智能技术的会议发言人身份识别方法。
步骤S1:扫描所有参会人员的人脸信息,得到人脸图像特征数据;将所述人脸图像特征数据在人脸样本数据库中进行检索及对比分析,将相似度最高的人员信息作为识别结果输出,依次识别所有参会人员身份信息;
所述人脸样本数据库的建立方法为:
采集人脸样本数据,通过人工智能算法模型进行处理和训练,
进行人脸检测;所述人脸检测包括判断人脸图像区域,剔除无用数据;
采用基于神经网络的深度学习算法进行人脸特征提取;
将提取到的特征向量分类构建样本数据集,形成算法模型数据库;
采集后续待识别人员的人脸信息,进行注册。
步骤S2:根据现场情况,将参会人员信息与音频通道按照编号进行随机绑定,形成发言人与音频通道的一一对应关系;会议过程中,若有人打开音频通道发言,则通过音频通道识别,初步判断当前发言人的身份;
具体地:
会议过程中,若有人打开音频通道发言,则同步分析判断所有音频通道传输的信号强度,识别出音频信号最强的音频通道编号,判断音频信号强度是否高于设定阈值,同时根据音频通道的同时根据音频通道与参会人员身份绑定对照信息,初步识别出当前发言人身份;
同时,会议过程中,若有人发言,采集发言人的声纹信息,则通过声纹识别初步判断当前发言人的身份;
会议过程中,若有人打开音频通道发言,根据采集到的音频信息进行同步分析,将发言人声纹特征数据在声纹样本数据集中进行比对分析,得出相似度概率前2~5个人员身份识别结果,再根据步骤S1中得到的所有参会人员身份信息,进行综合判断,初步确定发言人身份识别结果。
优选地,会议过程中,若有人打开音频通道发言,利用声纹识别模块根据采集到的音频信息进行同步分析,将发言人声纹特征数据在声纹样本数据集中进行比对分析,得出相似度概率前三的3个人员身份识别结果,再根据步骤S1中得到的所有参会人员身份信息,进行综合判断,初步确定发言人身份识别结果。
进行声纹识别时,利用收集的声音信息与声纹数据库进行比对,所述声纹数据库的建立方法具体为:
采集声纹样本数据,通过人工智能算法模型进行处理和训练,
进行声纹信号预处理;所述声纹信号预处理包括切除静音,消除造影,并且增强信道;
采用基于神经网络的深度学习算法进行声纹特征提取;
将提取到的特征向量分类构建样本数据集,形成算法模型数据库;
采集后续待识别人员的声纹信息,进行注册。
音频通道识别或者声纹识别时,利用线性判别式分析(LDA),或者PLDA算法进行分类识别。
所述神经网络的深度学习算法可以选用MFCC、Filterbank、或者TDNN算法。
步骤S3:结合音频通道识别和声纹识别的结果,进行综合性分析判断,
若音频通道识别结果与声纹识别结果一致,分为以下两种情况:
若音频通道识别无识别结果,声纹识别结果为陌生人,则判断识别结果为陌生人;
若音频通道识别与声纹识别均有识别结果,则按此识别结果输出。
若音频通道识别结果与声纹识别结果不一致,分为以下情况:
当音频通道识别或声纹识别任意一个存在无识别结果的情况,则:
若声纹识别结果为陌生人,音频通道有识别结果,则按音频通道识别结果输出;
若音频通道识别无识别结果,则按声纹识别结果输出;
当音频通道识别或声纹识别均存在识别结果,则:
若音频通道识别结果与声纹识别结果不一致,则根据音频信号强度是否高于设定阈值的判断结果分析,若高于设定阈值,则按音频通道识别结果输出;反之,若低于设定阈值,则按声纹识别结果输出。
步骤S4:根据输出结果,给出最终的发言人身份识别结果。
基于人工智能技术的工前会发言人身份识别方法主要利用三个模块:人脸识别模块、音频通道识别模块和声纹识别模块。通过人脸识别模块确认所有与会人员身份信息,可大致锁定发言人身份范围;通过音频通道识别模块,可在会议过程中动态识别打开的麦克风是否有音频信号传输,同时结合参会人员与麦克风对应关系表信息(会议开始时根据签到信息,将参会人员与其对应的麦克风编号进行绑定),使用音频通道识别的方法实时判断当前发言人员身份;通过声纹识别模块,可对采集到的音频信息进行声纹识别,以实时判断当前发言人身份;最后,结合音频通道识别、声纹识别两种方法的识别结果,综合性判断发言人身份,作为最终识别结果输出。
以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于人工智能技术的会议发言人身份识别方法,其特征在于,包括以下步骤:
步骤S1:扫描所有参会人员的人脸信息,得到人脸图像特征数据;将所述人脸图像特征数据在人脸样本数据库中进行检索及对比分析,将相似度最高的人员信息作为识别结果输出,依次识别所有参会人员身份信息;
步骤S2:根据现场情况,将参会人员信息与音频通道按照编号进行绑定,形成发言人与音频通道的一一对应关系;会议过程中,若有人打开音频通道发言,则通过音频通道识别初步判断当前发言人的身份;
同时,会议过程中,若有人发言,采集发言人的声纹信息,则通过声纹识别初步判断当前发言人的身份;
步骤S3:结合音频通道识别和声纹识别的结果,进行综合性分析判断,
若音频通道识别结果与声纹识别结果一致,则按此结果输出;
若音频通道识别结果与声纹识别结果不一致,分为以下情况:
当音频通道识别和声纹识别任意一个存在无识别结果的情况,则:
若声纹识别结果为陌生人,音频通道有识别结果,则按音频通道识别结果输出;
若音频通道识别无识别结果,则按声纹识别结果输出;
当音频通道识别或声纹识别均存在识别结果,则:
若音频通道识别结果与声纹识别结果不一致,则根据音频信号强度是否高于设定阈值的判断结果分析,若高于设定阈值,则按音频通道识别结果输出;反之,若低于设定阈值,则按声纹识别结果输出;
步骤S4:根据输出结果,给出最终的发言人身份识别结果。
2.根据权利要求1所述的基于人工智能技术的会议发言人身份识别方法,其特征在于,所述步骤S2中:
会议过程中,若有人打开音频通道发言,则同步分析判断所有音频通道传输的信号强度,识别出音频信号最强的音频通道编号,判断音频信号强度是否高于设定阈值,同时根据音频通道的同时根据音频通道与参会人员身份绑定对照信息,初步识别出当前发言人身份。
3.根据权利要求2所述的基于人工智能技术的会议发言人身份识别方法,其特征在于,所述步骤S2中,会议过程中,若有人打开音频通道发言,根据采集到的音频信息进行同步分析,将发言人声纹特征数据在声纹样本数据集中进行比对分析,得出相似度概率前2~5个人员身份识别结果,再根据步骤S1中得到的所有参会人员身份信息,进行综合判断,初步确定发言人身份识别结果。
4.根据权利要求3所述的基于人工智能技术的会议发言人身份识别方法,其特征在于,所述步骤S2中,会议过程中,若有人打开音频通道发言,利用声纹识别模块根据采集到的音频信息进行同步分析,将发言人声纹特征数据在声纹样本数据集中进行比对分析,得出相似度概率前三的3个人员身份识别结果,再根据步骤S1中得到的所有参会人员身份信息,进行综合判断,初步确定发言人身份识别结果。
5.根据权利要求1所述的基于人工智能技术的会议发言人身份识别方法,其特征在于,所述步骤S3中,若音频通道识别结果与声纹识别结果一致,分为以下两种情况:
若音频通道识别无识别结果,声纹识别结果为陌生人,则判断识别结果为陌生人;
若音频通道识别与声纹识别均有识别结果,则按此识别结果输出。
6.根据权利要求1所述的基于人工智能技术的会议发言人身份识别方法,其特征在于,所述人脸样本数据库的建立方法为:
采集人脸样本数据,通过人工智能算法模型进行处理和训练,
进行人脸检测;
采用基于神经网络的深度学习算法进行人脸特征提取;
将提取到的特征向量分类构建样本数据集,形成算法模型数据库;
采集后续待识别人员的人脸信息,进行注册。
7.根据权利要求6所述的基于人工智能技术的会议发言人身份识别方法,其特征在于,所述人脸检测包括判断人脸图像区域,剔除无用数据。
8.根据权利要求1所述的基于人工智能技术的会议发言人身份识别方法,其特征在于,所述步骤S2中,进行声纹识别时,利用收集的声音信息与声纹数据库进行比对,所述声纹数据库的建立方法具体为:
采集声纹样本数据,通过人工智能算法模型进行处理和训练,
进行声纹信号预处理;
采用基于神经网络的深度学习算法进行声纹特征提取;
将提取到的特征向量分类构建样本数据集,形成算法模型数据库;
采集后续待识别人员的声纹信息,进行注册。
9.根据权利要求8所述的基于人工智能技术的会议发言人身份识别方法,其特征在于,所述声纹信号预处理包括切除静音,消除造影,并且增强信道。
10.根据权利要求1所述的基于人工智能技术的会议发言人身份识别方法,其特征在于,所述步骤S2中,音频通道识别或者声纹识别时,利用线性判别式分析,或者PLDA算法进行分类识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110248888.0A CN115100701B (zh) | 2021-03-08 | 2021-03-08 | 一种基于人工智能技术的会议发言人身份识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110248888.0A CN115100701B (zh) | 2021-03-08 | 2021-03-08 | 一种基于人工智能技术的会议发言人身份识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115100701A true CN115100701A (zh) | 2022-09-23 |
CN115100701B CN115100701B (zh) | 2024-08-09 |
Family
ID=83287001
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110248888.0A Active CN115100701B (zh) | 2021-03-08 | 2021-03-08 | 一种基于人工智能技术的会议发言人身份识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115100701B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116384879A (zh) * | 2023-04-07 | 2023-07-04 | 豪越科技有限公司 | 一种用于消防装备快速出入库的智能化管理系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107749313A (zh) * | 2017-11-23 | 2018-03-02 | 郑州大学第附属医院 | 一种自动转写与生成远程医疗会诊记录的方法 |
WO2019227579A1 (zh) * | 2018-05-29 | 2019-12-05 | 平安科技(深圳)有限公司 | 会议信息记录方法、装置、计算机设备及存储介质 |
CN110853646A (zh) * | 2019-11-20 | 2020-02-28 | 深圳前海微众银行股份有限公司 | 会议发言角色的区分方法、装置、设备及可读存储介质 |
CN111833876A (zh) * | 2020-07-14 | 2020-10-27 | 科大讯飞股份有限公司 | 会议发言控制方法、系统、电子设备及存储介质 |
CN112040119A (zh) * | 2020-08-12 | 2020-12-04 | 广东电力信息科技有限公司 | 会议发言人追踪方法、装置、计算机设备和存储介质 |
CN112165599A (zh) * | 2020-10-10 | 2021-01-01 | 广州科天视畅信息科技有限公司 | 一种用于视频会议的会议纪要自动生成方法 |
-
2021
- 2021-03-08 CN CN202110248888.0A patent/CN115100701B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107749313A (zh) * | 2017-11-23 | 2018-03-02 | 郑州大学第附属医院 | 一种自动转写与生成远程医疗会诊记录的方法 |
WO2019227579A1 (zh) * | 2018-05-29 | 2019-12-05 | 平安科技(深圳)有限公司 | 会议信息记录方法、装置、计算机设备及存储介质 |
CN110853646A (zh) * | 2019-11-20 | 2020-02-28 | 深圳前海微众银行股份有限公司 | 会议发言角色的区分方法、装置、设备及可读存储介质 |
CN111833876A (zh) * | 2020-07-14 | 2020-10-27 | 科大讯飞股份有限公司 | 会议发言控制方法、系统、电子设备及存储介质 |
CN112040119A (zh) * | 2020-08-12 | 2020-12-04 | 广东电力信息科技有限公司 | 会议发言人追踪方法、装置、计算机设备和存储介质 |
CN112165599A (zh) * | 2020-10-10 | 2021-01-01 | 广州科天视畅信息科技有限公司 | 一种用于视频会议的会议纪要自动生成方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116384879A (zh) * | 2023-04-07 | 2023-07-04 | 豪越科技有限公司 | 一种用于消防装备快速出入库的智能化管理系统 |
CN116384879B (zh) * | 2023-04-07 | 2023-11-21 | 豪越科技有限公司 | 一种用于消防装备快速出入库的智能化管理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115100701B (zh) | 2024-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9336780B2 (en) | Identification of a local speaker | |
CN111429935B (zh) | 一种语音话者分离方法和装置 | |
CN103258535A (zh) | 基于声纹识别的身份识别方法及系统 | |
CN109243492A (zh) | 一种语音情感识别系统及识别方法 | |
CN110797032B (zh) | 一种声纹数据库建立方法及声纹识别方法 | |
CN113744742B (zh) | 对话场景下的角色识别方法、装置和系统 | |
CN111816185A (zh) | 一种对混合语音中说话人的识别方法及装置 | |
CN113076770A (zh) | 基于方言识别的人物画像智能终端 | |
CN115100701B (zh) | 一种基于人工智能技术的会议发言人身份识别方法 | |
CN103778917A (zh) | 一种在电话满意度调查中检测身份冒充的系统与方法 | |
CN111627448A (zh) | 实现基于语音大数据的审讯与谈话控制系统及其方法 | |
CN109817223A (zh) | 基于音频指纹的音素标记方法及装置 | |
Al-Shayea et al. | Speaker identification: A novel fusion samples approach | |
CN110415707B (zh) | 一种基于语音特征融合和gmm的说话人识别方法 | |
CN111613249A (zh) | 一种语音分析方法和设备 | |
CN111009262A (zh) | 语音性别识别的方法及系统 | |
CN111951809A (zh) | 多人声纹辨别方法及系统 | |
EP3613040B1 (en) | Speaker recognition method and system | |
CN111091836A (zh) | 一种基于大数据的智能声纹识别方法 | |
CN113178196B (zh) | 音频数据提取方法、装置、计算机设备和存储介质 | |
CN111475634A (zh) | 基于座席语音切分的代表性话术片段抽取装置及方法 | |
Astuti et al. | Feature extraction using gaussian-mfcc for speaker recognition system | |
CN106971725B (zh) | 一种具有优先级的声纹识方法和系统 | |
CN111914777B (zh) | 一种跨模态识别机器人指令的方法及系统 | |
CN114613058B (zh) | 一种具有考勤功能的门禁系统、考勤方法和相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |