CN110022454A - 一种在视频会议中识别身份的方法及相关设备 - Google Patents

一种在视频会议中识别身份的方法及相关设备 Download PDF

Info

Publication number
CN110022454A
CN110022454A CN201810024620.7A CN201810024620A CN110022454A CN 110022454 A CN110022454 A CN 110022454A CN 201810024620 A CN201810024620 A CN 201810024620A CN 110022454 A CN110022454 A CN 110022454A
Authority
CN
China
Prior art keywords
information
shortlist
identity
meeting
probability value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810024620.7A
Other languages
English (en)
Other versions
CN110022454B (zh
Inventor
赵光耀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201810024620.7A priority Critical patent/CN110022454B/zh
Priority to EP18899251.5A priority patent/EP3731519B1/en
Priority to PCT/CN2018/120835 priority patent/WO2019137147A1/zh
Publication of CN110022454A publication Critical patent/CN110022454A/zh
Priority to US16/923,259 priority patent/US11914691B2/en
Application granted granted Critical
Publication of CN110022454B publication Critical patent/CN110022454B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1822Conducting the conference, e.g. admission, detection, selection or grouping of participants, correlating users to one or more conference sessions, prioritising transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1831Tracking arrangements for later retrieval, e.g. recording contents, participants activities or behavior, network status
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0876Network architectures or network communication protocols for network security for authentication of entities based on the identity of the terminal or configuration, e.g. MAC address, hardware or software configuration or device fingerprint
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/40Network security protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Power Engineering (AREA)
  • Biomedical Technology (AREA)
  • Telephonic Communication Services (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本申请公开了一种在视频会议中识别身份的方法及相关设备,用于提升身份识别的准确率。该方法包括:身份识别装置获取视频会议中的第一生物特征信息,其中,所述第一生物特征信息包括人脸特征信息和声纹特征信息中的至少一个;获取数据库中的身份名单对应的第二生物特征信息和所述身份名单对应的会议概率值,其中,所述身份名单中包括至少一个个人身份识别号,所述第二生物特征信息包括人脸特征信息和声纹特征信息中的至少一个,所述会议概率值是根据参会概率值和同会概率值中的至少一个所确定;根据所述身份名单对应的第二生物特征信息和所述身份名单对应的会议概率值从所述身份名单中确定所述第一生物特征信息对应的个人身份识别号。

Description

一种在视频会议中识别身份的方法及相关设备
技术领域
本申请涉及通信技术领域,具体涉及一种在视频会议中识别身份的方法及相关设备。
背景技术
随着互联网的发展,人与人之间的交流更加便利。视频会议使得处于两地或多个不同地点的参会人就像在同一处参加会议。其中,在有些会议场景中需要自动采集和筛选参会人的生物特征,进行身份识别。
现有技术公开了一种人脸识别与声纹识别相结合的身份识别方法。当二者识别结果不一致时,将置信度(Confidence Level,CL)较高的身份识别结果确定为最终的身份识别结果。但是,这种人脸识别与声纹识别相结合的双特征身份识别方法,不能很好地满足会议场景对身份识别准确率的需求,准确率低。
发明内容
本申请提供了一种在视频会议中识别身份的方法及相关设备,用于提升身份识别的准确率。
第一方面,本申请提供一种在视频会议中识别身份的方法,该方法应用于身份识别装置,该身份识别装置可以是用户设备,也可以是服务器。该身份识别装置获取视频会议中的第一生物特征信息,其中,该第一生物特征信息包括人脸特征信息和声纹特征信息中的至少一个。该身份识别装置还获取数据库中的身份名单对应的第二生物特征信息和身份名单对应的会议概率值,其中,该身份名单中包括至少一个个人身份识别号,该第二生物特征信息包括人脸特征信息和声纹特征信息中的至少一个,该会议概率值是根据参会概率值和同会概率值中的至少一个所确定。身份识别装置根据该身份名单对应的第二生物特征信息和该身份名单对应的会议概率值从该身份名单中确定该第一生物特征信息对应的个人身份识别号。可见,通过会议概率值,再结合人脸特征信息和声纹特征信息中的至少一个来识别身份,有效提升了身份识别的准确率,从而很好地满足了会议场景对身份识别准确率的需求。
在具体实现过程中,身份识别装置根据身份名单对应的第二生物特征信息和身份名单对应的会议概率值从身份名单中确定第一生物特征信息对应的个人身份识别号有很多种方式,下面介绍几种可能实现的方式:
若第一生物特征信息包括人脸特征信息,第二生物特征信息包括人脸特征信息,身份识别装置根据身份名单对应的第二生物特征信息和身份名单对应的会议概率值从身份名单中确定第一生物特征信息对应的个人身份识别号包括:身份识别装置根据身份名单对应的第二生物特征信息中的人脸特征信息从身份名单中确定第一短名单,其中,第一短名单对应的第二生物特征信息中的人脸特征信息与第一生物特征信息中的人脸特征信息的相似度不小于预设阈值,其中,该预设阈值是终端或者服务器根据实际需求提前设置的。身份识别装置根据所述第一短名单对应的会议概率值从所述第一短名单中确定第二短名单,其中,所述第二短名单包括所述第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。身份识别装置根据所述第二短名单对应的第二生物特征信息中的人脸特征信息从所述第二短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度最高。可见,无需采集声纹特征信息,由于采集声纹特征信息需要一定的时间,例如几十秒,从而影响了身份识别的整体响应速度,本申请直接通过人脸特征信息和会议概率值相结合的方式进行身份识别,有效提升了身份识别的准确率,也提高了身份识别的整体响应速度。
若第一生物特征信息包括声纹特征信息,第二生物特征信息包括声纹特征信息,身份识别装置根据身份名单对应的第二生物特征信息和身份名单对应的会议概率值从身份名单中确定第一生物特征信息对应的个人身份识别号包括:身份识别装置根据所述身份名单对应的第二生物特征信息中的声纹特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于预设阈值,其中,该预设阈值是终端或者服务器根据实际需求提前设置的。身份识别装置根据所述第一短名单对应的会议概率值从所述第一短名单中确定第二短名单,其中,所述第二短名单包括所述第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。身份识别装置根据所述第二短名单对应的第二生物特征信息中的声纹特征信息从所述第二短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度最高。由于声纹不仅具有特定性,而且具有相对稳定的特点,通过声纹特征信息和会议概率值相结合的方式进行身份识别,进一步提升了身份识别的准确率。
若第一生物特征信息包括人脸特征信息和声纹特征信息,第二生物特征信息包括人脸特征信息和声纹特征信息,身份识别装置根据身份名单对应的第二生物特征信息和身份名单对应的会议概率值从身份名单中确定第一生物特征信息对应的个人身份识别号包括:身份识别装置根据所述身份名单对应的第二生物特征信息中的人脸特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于第一预设阈值,其中,该第一预设阈值是终端或者服务器根据实际需求提前设置的。身份识别装置根据所述第一短名单对应的第二生物特征信息中的声纹特征信息从所述第一短名单中确定第二短名单,其中,所述第二短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于第二预设阈值,其中,该第二预设阈值是终端或者服务器根据实际需求提前设置的。身份识别装置根据所述第二短名单对应的会议概率值从所述第二短名单中确定第三短名单,其中,所述第三短名单包括所述第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。身份识别装置根据所述第三短名单对应的第二生物特征信息中的人脸特征信息从所述第三短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度最高。可见,通过人脸特征信息,声纹特征信息和会议概率值来进行身份识别,有效提高了身份识别的准确率,从而很好地满足了会议场景对身份识别准确率的需求。
若第一生物特征信息包括人脸特征信息和声纹特征信息,第二生物特征信息包括人脸特征信息和声纹特征信息,身份识别装置根据身份名单对应的第二生物特征信息和身份名单对应的会议概率值从身份名单中确定第一生物特征信息对应的个人身份识别号包括:身份识别装置根据所述身份名单对应的第二生物特征信息中的声纹特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于第一预设阈值,其中,该第一预设阈值是终端或者服务器根据实际需求提前设置的。身份识别装置根据所述第一短名单对应的第二生物特征信息中的人脸特征信息从所述第一短名单中确定第二短名单,其中,所述第二短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于第二预设阈值,其中,该第二预设阈值是终端或者服务器根据实际需求提前设置的。身份识别装置根据所述第二短名单对应的会议概率值从所述第二短名单中确定第三短名单,其中,所述第三短名单包括所述第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。身份识别装置根据所述第三短名单对应的第二生物特征信息中的声纹特征信息从所述第三短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度最高。可见,通过人脸特征信息,声纹特征信息和会议概率值来进行身份识别,有效提高了身份识别的准确率,从而很好地满足了会议场景对身份识别准确率的需求。
若第一生物特征信息包括人脸特征信息和声纹特征信息,第二生物特征信息包括人脸特征信息和声纹特征信息,身份识别装置根据身份名单对应的第二生物特征信息和身份名单对应的会议概率值从身份名单中确定第一生物特征信息对应的个人身份识别号包括:身份识别装置根据身份名单对应的第二生物特征信息中的人脸特征信息从身份名单中确定第一短名单,其中,第一短名单对应的第二生物特征信息中的人脸特征信息与第一生物特征信息中的人脸特征信息的相似度不小于预设阈值,其中,该预设阈值是终端或者服务器根据实际需求提前设置的。身份识别装置根据所述第一短名单对应的会议概率值从所述第一短名单中确定第二短名单,其中,所述第二短名单包括所述第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。身份识别装置根据所述第二短名单对应的第二生物特征信息中的声纹特征信息从所述第二短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度最高。可见,通过人脸特征信息,声纹特征信息和会议概率值来进行身份识别,有效提高了身份识别的准确率,从而很好地满足了会议场景对身份识别准确率的需求。
若第一生物特征信息包括声纹特征信息和人脸特征信息,第二生物特征信息包括声纹特征信息和人脸特征信息,身份识别装置根据身份名单对应的第二生物特征信息和身份名单对应的会议概率值从身份名单中确定第一生物特征信息对应的个人身份识别号包括:身份识别装置根据所述身份名单对应的第二生物特征信息中的声纹特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于预设阈值,其中,该预设阈值是终端或者服务器根据实际需求提前设置的。身份识别装置根据所述第一短名单对应的会议概率值从所述第一短名单中确定第二短名单,其中,所述第二短名单包括所述第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。身份识别装置根据所述第二短名单对应的第二生物特征信息中的人脸特征信息从所述第二短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度最高。可见,通过人脸特征信息,声纹特征信息和会议概率值来进行身份识别,有效提高了身份识别的准确率,从而很好地满足了会议场景对身份识别准确率的需求。
若第一生物特征信息包括人脸特征信息和声纹特征信息,第二生物特征信息包括人脸特征信息和声纹特征信息,身份识别装置根据身份名单对应的第二生物特征信息和身份名单对应的会议概率值从身份名单中确定第一生物特征信息对应的个人身份识别号包括:身份识别装置根据所述身份名单对应的第二生物特征信息中的人脸特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于第一预设阈值,其中,该第一预设阈值是终端或者服务器根据实际需求提前设置的。身份识别装置根据所述第一短名单对应的第二生物特征信息中的声纹特征信息从所述第一短名单中确定第二短名单,其中,所述第二短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于第二预设阈值,其中,该第二预设阈值是终端或者服务器根据实际需求提前设置的。身份识别装置根据所述第二短名单对应的会议概率值从所述第二短名单中确定第三短名单,其中,所述第三短名单包括所述第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。身份识别装置根据所述第三短名单对应的第二生物特征信息中的声纹特征信息从所述第三短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度最高。可见,通过人脸特征信息,声纹特征信息和会议概率值来进行身份识别,有效提高了身份识别的准确率,从而很好地满足了会议场景对身份识别准确率的需求。
若第一生物特征信息包括人脸特征信息和声纹特征信息,第二生物特征信息包括人脸特征信息和声纹特征信息,身份识别装置根据身份名单对应的第二生物特征信息和身份名单对应的会议概率值从身份名单中确定第一生物特征信息对应的个人身份识别号包括:身份识别装置根据所述身份名单对应的第二生物特征信息中的声纹特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于第一预设阈值,其中,该第一预设阈值是终端或者服务器根据实际需求提前设置的。身份识别装置根据所述第一短名单对应的第二生物特征信息中的人脸特征信息从所述第一短名单中确定第二短名单,其中,所述第二短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于第二预设阈值,其中,该第二预设阈值是终端或者服务器根据实际需求提前设置的。身份识别装置根据所述第二短名单对应的会议概率值从所述第二短名单中确定第三短名单,其中,所述第三短名单包括所述第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。身份识别装置根据所述第三短名单对应的第二生物特征信息中的人脸特征信息从所述第三短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度最高。可见,通过人脸特征信息,声纹特征信息和会议概率值来进行身份识别,有效提高了身份识别的准确率,从而很好地满足了会议场景对身份识别准确率的需求。
在实现过程中,该会议概率值是根据参会概率值和同会概率值中的至少一个所确定,其中,该会议概率值为参会概率值,或者该会议概率值为同会概率值,或者该会议概率值为参会概率值和同会概率值以预设方式确定的结果,其中,该预设方式包括但不限于算数平均值,加权平均值,最大值中的其中一种。
参会概率值是根据参会信息所确定的,其中,参会信息包括历史参会信息和当前参会信息中的至少一个,即参会概率值可以是通过历史参会信息所确定的,或者参会概率值是通过当前参会信息所确定的,或者,该参会概率值是通过历史参会信息和当前参会信息以预设的方式所确定的。其中,所述当前参会信息包括会议室的位置信息、会议通知信息、人员位置信息和会议录音信息中的至少一个,所述会议录音信息包括个人身份识别号对应的身份信息,所述个人身份识别号对应的身份信息包括姓名、昵称、职位和工号中的至少一个。该历史参会信息包括会议室的位置信息、会议通知信息、人员位置信息和会议录音信息中的至少一个,所述会议录音信息包括个人身份识别号对应的身份信息,所述个人身份识别号对应的身份信息包括姓名、昵称、职位和工号中的至少一个。
在另一种实现方式中,该参会概率值是根据参会统计概率值和参会推算概率值中的至少一个所确定,即该参会概率值是通过参会统计概率值所确定的,或者该参会概率值是通过参会推算概率值所确定的,或者该参会概率值是通过该参会统计概率值和该参会推算概率值以预设的方式所确定的,该预设的方式包括但不限于算数平均值,加权平均值,最大值中的其中一种。其中,参会推算概率值是根据位置关系推算概率值和会议通知推算概率值中的至少一个所确定,即该参会推算概率值是根据位置关系推算概率值所确定的,或者该参会推算概率值是根据会议通知推算概率值所确定的,或者该参会推算概率值是根据位置关系推算概率值和该会议通知推算概率值以预设的方式所确定的,该预设的方式包括但不限于算数平均值,加权平均值,最大值中的其中一种。该参会统计概率值是根据历史参会信息所确定的,该位置关系推算概率值和会议通知推算概率值是根据当前参会信息所确定的。
同会概率值是根据参会信息所确定的,即根据历史同会信息和当前同会信息中的至少一个所确定,即该同会概率值是根据历史同会信息所确定的,或者该同会概率值是根据当前同会信息所确定的,或者该同会概率值是根据历史同会信息和当前同会信息以预设的方式所确定的。其中,该当前同会信息包括会议通知信息、人际关系信息和人员位置信息中的至少一个。该历史同会信息包括会议通知信息、人际关系信息和人员位置信息中的至少一个。
在另一种实现方式中,该同会概率值是根据同会统计概率值和同会推算概率值中的至少一个所确定,即该同会概率值是根据同会统计概率值所确定的,或者该同会概率值是根据同会推算概率值所确定的,或者该同会概率值是根据同会统计概率值和同会推算概率值以预设的方式所确定的,该预设的方式包括但不限于算数平均值,加权平均值,最大值中的其中一种。该同会推算概率值是根据组织关系推算概率值和好友关系推算概率值中的至少一个所确定,即该同会推算概率值是根据组织关系推算概率值所确定的,或者该同会推算概率值是根据好友关系推算概率值所确定的,或者该同会推算概率值是根据组织关系推算概率值和好友关系推算概率值以预设的方式所确定的,该预设的方式包括但不限于算数平均值,加权平均值,最大值中的其中一种。该同会概率统计值是根据历史参会信息所确定,该组织关系推算概率值和好友关系推算概率值是根据当前参会信息所确定的。
在实现过程中,为了提升个人身份识别号对应的会议概率值,存在以下几种可能的实现方式:
若第一短名单还包含个人身份识别号对应的身份信息,在从第一短名单中确定第二短名单之前,该身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自所述语音识别服务器的所述会议录音信息的谈话文本,根据所述谈话文本确定本次会议期间提到的身份信息,身份识别装置比较所述提到的身份信息与所述第一短名单对应的身份信息,提升所述第一短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
若第二短名单还包含个人身份识别号对应的身份信息,在从第二短名单中确定第三短名单之前,该身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自所述语音识别服务器的所述会议录音信息的谈话文本,根据所述谈话文本确定本次会议期间提到的身份信息,身份识别装置比较所述提到的身份信息与所述第二短名单对应的身份信息,提升所述第二短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
若第一短名单还包含个人身份识别号对应的身份信息,在从第一短名单中确定第二短名单之前,该身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自所述语音识别服务器的根据所述会议录音信息确定的身份信息,该身份识别装置比较所述确定的身份信息与所述第一短名单对应的身份信息,提升所述第一短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
若第二短名单还包含个人身份识别号对应的身份信息,在从第二短名单中确定第三短名单之前,该身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自所述语音识别服务器的根据所述会议录音信息确定的身份信息,身份识别装置比较所述确定的身份信息与所述第二短名单对应的身份信息,提升所述第二短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
第二方面,本申请提供一种身份识别装置,具有实现上述第一方面或者第一方面的任意一种实现方式中身份识别装置所执行的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。
第三方面,本申请提供一种身份识别装置,该身份识别装置包括存储器,网络接口和处理器。其中,存储器用于存储计算机可执行程序代码,并与网络接口耦合。该程序代码包括指令,当该处理器执行该指令时,该指令使该身份识别装置执行上述第一方面或者第一方面的任意一种实现方式中所涉及的信息或者指令。
第四方面,本申请提供一种计算机存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行上述第一方面或者第一方面的任意一种实现方式提供的方法。
第五方面,本申请提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面或者第一方面的任意一种实现方式提供的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
身份识别装置获取视频会议中的第一生物特征信息,其中,该第一生物特征信息包括人脸特征信息和声纹特征信息中的至少一个。该身份识别装置还获取数据库中的身份名单对应的第二生物特征信息和身份名单对应的会议概率值,其中,该身份名单中包括至少一个个人身份识别号,该第二生物特征信息包括人脸特征信息和声纹特征信息中的至少一个,该会议概率值是根据参会概率值和同会概率值中的至少一个所确定。该身份识别装置根据该身份名单对应的第二生物特征信息和该身份名单对应的会议概率值从该身份名单中确定该第一生物特征信息对应的个人身份识别号。可见,通过会议概率值,再结合人脸特征信息和声纹特征信息中的至少一个来识别身份,有效提升了身份识别的准确率,从而很好地满足了会议场景对身份识别准确率的需求。
附图说明
图1为本申请实施例中视频会议通信系统的一个结构示意图;
图2为本申请实施例中在视频会议中识别身份的方法的一个实施例示意图;
图3为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图;
图4为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图;
图5为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图;
图6为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图;
图7为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图;
图8为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图;
图9为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图;
图10为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图;
图11a为本申请实施例中的一个应用场景结构示意图;
图11b为本申请实施例中的一个应用场景交互流程图;
图11c为本申请实施例中的一个应用场景流程示意图;
图12为本申请实施例中身份识别装置的一个结构示意图;
图13为本申请实施例中身份识别装置的另一个结构示意图;
图14为本申请实施例中身份识别装置的另一个结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
视频会议是通过通信网络召开会议的一种多媒体通信方式。在会议室里,通常有多个参会人,为了清晰地呈现讲话人的音容笑貌,通常会采用摄像机给予讲话人特写画面。其中,人工智能在会议室里有广阔的应用前景,例如:刷脸入会、刷脸签到、欢迎词、电子铭牌、声控导播、会议统计等。刷脸入会是在合法参会人现身时,身份识别装置自动触发会议室设备的启动和准备,并接通预订的会议。刷脸签到是在合法参会人现身时,身份识别装置自动签到。欢迎词是在合法参会人现身时,身份识别装置自动触发屏幕出现“欢迎某某某!”的字样。电子铭牌是在特写画面上自动显示合法参会人的姓名或者尊称等。声控导播是在合法参会人说出“你好!请特写某某某!”时,身份识别装置自动找到某某某,并给予其特写画面。会议统计是在统计每个参会人参加会议的时段和时长。但是在这种会议场景下,会议系统无法通过参会人登录、主动配合实时识别参会人的身份,需要自动采集和筛选参会人的生物特征,并进行身份识别。在这种会议场景下,由于识别结果会被参会人实时感知,一旦身份识别结果错误,就会给参会人的会议体验造成比较大的负面影响,因此,不断地提升身份识别的准确率,就显得非常重要。由于现有的身份识别方法不能很好地满足会议场景对身份识别准确率的需求,为了提升身份识别的准确率,本申请提出如下方法及相关设备。
本申请提供一种在视频会议中识别身份的方法,该方法应用于视频会议通信系统,如图1所示,该视频会议通信系统包括至少一个用户设备和至少一个服务器,其中,该用户设备包括但不限于终端和摄像机。即,该用户设备可以是终端,也可以是摄像机,也可以是终端和摄像机,也可以是集合了终端和摄像机的全部功能的一种设备。该终端包括但不限于计算机,手机、平板电脑、个人数字助理(英文全称:personal digital assistant,缩写:PDA)和车载电脑。该服务器包括但不限于人脸识别服务器、声纹识别服务器、语音识别服务器、定位服务器、概率服务器和会议服务器。即该服务器可以是人脸识别服务器、声纹识别服务器、语音识别服务器、定位服务器、概率服务器和会议服务器中的至少一种,也可以是集合了人脸识别服务器、声纹识别服务器、语音识别服务器、定位服务器、概率服务器和会议服务器中的全部功能的一种服务器,此处不做具体限定。
在实现过程中,该用户设备和服务器通信连接,其中,通信连接可以是无线通信连接,也可以是有线通信连接。其中,无线通信可以包括以下至少一种:无线保真(wirelessfidelity,Wi-Fi),蓝牙(bluetooth,BT),无线个域网(zigbee),近场通信(near fieldcommunication,NFC),全球定位系统(global positioning system,GPS)和蜂窝通信(cellular communication),例如,长期演进(long term evolution,LTE),码分多址(codedivision multiple access,CDMA),宽带码分多址(wideband CDMA,WCDMA),通用移动通信系统(universal mobile telecommunication system,UMTS),无线宽带(wirelessbroadband,WiBro),全球移动通信系统(global system for mobile communication,GSM),全球互联微波接入(worldwide interoperability for microwave access,WiMAX)。有线通信可以包括以下至少一种:通用串行总线(universal serial Bus,USB),高清多媒体接口(high definition multimedia interface,HDMI),推荐标准232(recommendedstandard 232,RS-232),和电话语音(plain old telephone service,POTS)。
下面对用户设备和服务器的主要功能进行介绍:
终端的主要功能是:建立与对端的呼叫连接,其中,可通过运行在终端上的应用(application,App)或公众号建立呼叫连接,并将本地的视频信息、音频信息和控制信息进行编码打包并发送给对端。还可以将从对端接收到的数据包解码还原为视频信息、音频信息和控制信息。终端还具有会议控制、画面显示的功能,可以执行各种人工智能应用,例如:刷脸入会、刷脸签到、欢迎词、电子铭牌、声控导播和会议统计等。
摄像机,作为终端的外部设备,可以是人工智能(artificial intelligence,AI)摄像机,AI摄像机通常具有云台镜头(pan/tilt/zoom,PTZ)功能,可以通过红外线遥控器控制摄像机的拍摄动作,也可以通过智能导播的方法控制摄像机的拍摄动作,从而呈现讲话人的特写画面。AI摄像机还可以具有声源定位功能,可以自动定位讲话人,并给予讲话人特写画面。
人脸识别服务器用于根据人脸特征信息识别身份,声纹识别服务器用于根据声纹特征信息识别身份,其中,声纹特征信息与说话的内容无关,语音识别服务器用于根据语音信息识别身份,其中,语音信息与说话的内容有关。定位服务器用于确定会议室,人员的具体位置信息,其中,定位过程中使用的技术可以是Wi-Fi定位,红外线定位,超声波定位,GPS定位,zigbee定位等室内定位技术或者室外定位技术,具体可根据实际情况而定,此处不做具体限定。概率服务器用于确定每个个人身份识别号对应的会议概率值,会议服务器用于根据人脸特征信息,声纹特征信息,会议概率值以及个人身份识别号,个人身份识别号对应的身份信息建立对应的数据库,并进行实时更新,并提供相应的查询服务。
请参阅图2,为本申请实施例中在视频会议中识别身份的方法的一个实施例示意图,该实施例的具体流程如下:
步骤201、身份识别装置获取视频会议中的第一生物特征信息,其中,该第一生物特征信息包括人脸特征信息和声纹特征信息中的至少一个。
该第一生物特征信息为目标参会人的生物特征信息,即该目标参会人为待进行身份识别的参会人,例如,身份识别装置在对A参会人进行身份识别之前,需要获取A参会人的生物特征信息,可以通过AI摄像机实时获取A参会人的人脸特征信息和声纹特征信息。其中,人脸特征信息是基于人的脸部的特征信息,包括但不限于眼睛、鼻子、嘴巴、眉毛、脸部轮廓、牙齿、耳朵、头发等特征,还可以包括面部表情信息,例如微笑的表情、悲伤的表情、愤怒的表情等,还可以包括附属在人脸上的装饰物的信息,例如眼镜,发夹,帽子,耳环等信息。声纹特征信息是携带语音信息的声波频谱信息,其中,在本申请中涉及的声纹特征信息与说话内容无关。
步骤202、身份识别装置获取数据库中的身份名单对应的第二生物特征信息和身份名单对应的会议概率值,其中,该身份名单中包括至少一个个人身份识别号,该第二生物特征信息包括人脸特征信息和声纹特征信息中的至少一个,该会议概率值是根据参会概率值和同会概率值中的至少一个所确定。
个人身份识别号与第二生物特征信息存在一一对应的关系,个人身份识别号与会议概率值存在一一对应的关系,即,每个个人身份识别号都有对应的人脸特征信息,每个个人身份识别号都有对应的声纹特征信息,每个个人身份识别号都有对应的会议概率值,但是,保存在数据库中的个人身份识别号对应的第二生物特征信息有可能是人脸特征信息,有可能是声纹特征信息,有可能是人脸特征信息和声纹特征信息,此处不做具体限定。
该会议概率值是终端或者服务器根据参会概率值和同会概率值中的至少一个所确定,其中,该参会概率值表示用户参加会议的概率,该同会概率值表示用户与其他用户参加同一个会议的概率。即该会议概率值可以为参会概率值,或者该会议概率值为同会概率值,或者,该会议概率值为参会概率值和同会概率值以预设方式确定的结果,其中,该预设方式包括算数平均值,加权平均值,最大值中的一种,例如,将参会概率值和同会概率值的算数平均值作为会议概率值,又如,将参会概率值和同会概率值的加权平均值作为会议概率值,又如,比较参会概率值和同会概率值的大小,如果参会概率值大,则将参会概率值作为会议概率值,如果同会概率值大,则将同会概率值作为会议概率值。
该参会概率值是根据历史参会信息和当前参会信息中的至少一个所确定,即参会概率值可以根据历史参会信息所确定,或者参会概率值可以根据当前参会信息所确定,或者参会概率值可以是根据历史参会信息和当前参会信息分别确定的概率值以预设方式确定的结果,其中,该预设方式包括算数平均值,加权平均值,最大值中的一种。其中,该当前参会信息包括会议室的位置信息、会议通知信息、人员位置信息和会议录音信息中的至少一个,该会议录音信息包括个人身份识别号对应的身份信息,该个人身份识别号对应的身份信息包括姓名、昵称、职位和工号中的至少一个。该历史参会信息包括会议室的位置信息、会议通知信息、人员位置信息和会议录音信息中的至少一个,该会议录音信息包括个人身份识别号对应的身份信息,该个人身份识别号对应的身份信息包括姓名、昵称、职位和工号中的至少一个。
以该参会概率值是根据当前参会信息确定的为例,其中,假设该当前参会信息包括会议室的位置信息、会议通知信息、人员位置信息和会议录音信息,其中,可以按照对参会概率值的影响程度提前预设会议室的位置信息、会议通知信息、人员位置信息和会议录音信息分别所占的比例,假设会议通知信息对参会概率值的影响程度比较大,则可以对会议通知信息预设的比例较大,假设会议室的位置信息对参会概率值的影响程度比较小,则可以对会议室的位置信息所预设的比例较小,具体可根据实际情况而定,此处不做具体限定。以会议室的位置信息所占的比例为1/4,会议通知信息所占的比例为1/4,人员位置信息所占的比例为1/4,会议录音信息所占的比例为1/4为例,假设数据库中个人身份识别号A对应的身份信息出现在会议通知信息中,则保留会议通知信息所占的比例1/4,假设数据库中并没有存在个人身份识别号A对应的该当前参会信息中包括的会议室的位置信息和人员位置信息,则会议室的位置信息和人员位置信息所占的比例均为0,假设数据库中个人身份识别号A对应的身份信息出现在会议录音信息中,则保留会议录音信息所占的比例1/4,则该参会概率值=会议通知信息所占的比例1/4+会议录音信息所占的比例1/4=1/2。当然,也可以根据参会概率值的影响因素的改变,随时动态地调整参会概率值的大小,在具体实现过程中,根据历史参会信息和当前参会信息中的至少一个确定参会概率值的方式有很多种,上述只是其中的一种实现方式,其他实现方式此处不做具体限定。同样,该参会概率值是根据历史参会信息确定的方式可以参考上述示例,此处不再赘述。
该同会概率值是根据历史同会信息和当前同会信息中的至少一个所确定,即该同会概率值可以根据历史同会信息所确定,或者该同会概率值可以根据当前同会信息所确定,或者该同会概率值是根据历史同会信息和当前同会信息分别确定的概率值以预设方式确定的结果,其中,该预设方式包括算数平均值,加权平均值,最大值中的一种。其中,该当前同会信息包括会议通知信息、人际关系信息和人员位置信息中的至少一个。该历史同会信息包括会议通知信息、人际关系信息和人员位置信息中的至少一个。
以该同会概率值是根据当前同会信息确定的为例,假设当前同会信息包括会议通知信息、人际关系信息和人员位置信息,其中,可以按照对同会概率值的影响程度提前预设会议通知信息、人际关系信息和人员位置信息分别所占的比例,假设会议通知信息对同会概率值的影响程度比较大,则可以对会议通知信息预设的比例较大,假设人员位置信息对同会概率值的影响程度比较小,则可以对人员位置信息预设的比例较小,具体可根据实际情况而定,此处不做具体限定。以会议通知信息所占的比例为1/3,人际关系信息所占的比例为1/3,人员位置信息所占的比例为1/3为例,若要确定数据库中个人身份识别号B对应的同会概率值,假设会议通知信息中出现个人身份识别号C的信息,其中,个人身份识别号C对应的用户曾与个人身份识别号B对应的用户参加过同一个会议,则保留会议通知信息所占的比例为1/3,假设个人身份识别号B与当前会议中的任何一个个人身份识别号没有关联关系,则人际关系信息所占的比例为0,假设与个人身份识别号B参加过同一个会议的任何一个个人身份识别号在会议室中的位置信息均没有出现在当前会议中,则人员位置信息所占的比例为0,则同会概率值=会议通知信息所占的比例1/3。当然,也可以根据同会概率值的影响因素的改变,随时动态地调整同会概率值的大小,在具体实现过程中,根据历史同会信息和当前同会信息中的至少一个确定同会概率值的方式有很多种,上述只是其中的一种实现方式,其他实现方式此处不做具体限定。同样,该同会概率值是根据历史同会信息确定的方式可以参考上述示例,此处不再赘述。
在另一种实现过程中,该参会概率值是根据参会统计概率值和参会推算概率值中的至少一个所确定,即该参会概率值可以是参会统计概率值,或者该参会概率值是参会推算概率值,或者该参会概率值是根据参会统计概率值和参会推算概率值以预设方式确定的结果,其中,该预设方式包括算数平均值,加权平均值,最大值中的一种。其中,参会推算概率值是根据位置关系推算概率值和会议通知推算概率值中的至少一个所确定,即该参会推算概率值可以是位置关系推算概率值,或者该参会推算概率值是会议通知推算概率值,或者该参会概率值是根据位置关系推算概率值和会议通知推算概率值以预设方式确定的结果,其中,该预设方式包括算数平均值,加权平均值,最大值中的一种。该参会统计概率值是根据历史参会信息所确定的,该位置关系推算概率值和会议通知推算概率值是根据当前参会信息所确定的。
以参会概率值是根据参会统计概率值和参会推算概率值以预设方式确定的为例,假设该预设的方式为加权平均值,在具体实现过程中,终端或者服务器根据对参会概率值的影响程度提前预设该参会统计概率值的权重和该参会推算概率值的权重,假设参会统计概率值的权重为0.8,该参会推算概率值的权重为0.2,则该参会概率值=参会统计概率值*0.8+参会推算概率值*0.2。
在另一种实现过程中,该同会概率值是根据同会统计概率值和同会推算概率值中的至少一个所确定,即该同会概率值可以为同会统计概率值,或者该同会概率值可以为同会推算概率值,或者,该同会概率值是根据同会统计概率值和同会推算概率值以预设方式确定的结果,其中,该预设方式包括算数平均值,加权平均值,最大值中的一种。其中,该同会推算概率值是根据组织关系推算概率值和好友关系推算概率值中的至少一个所确定,即该同会推算概率值可以为组织关系推算概率值,或者该同会推算概率值可以为好友关系推算概率值,或者该同会推算概率值是根据组织关系推算概率值和好友关系推算概率值以预设方式确定的结果,其中,该预设方式包括算数平均值,加权平均值,最大值中的一种。该同会概率统计值是根据历史参会信息所确定,该组织关系推算概率值和好友关系推算概率值是根据当前参会信息所确定的。
以同会概率值是根据同会统计概率值和同会推算概率值以预设方式确定的为例,假设该预设的方式为算数平均值,则该同会概率值=(同会统计概率值+同会推算概率值)/2。
步骤203、身份识别装置根据身份名单对应的第二生物特征信息和身份名单对应的会议概率值从身份名单中确定第一生物特征信息对应的个人身份识别号。
在具体实现过程中,身份识别装置从身份名单中确定第一生物特征信息对应的个人身份识别号的方式有很多种,由于第二生物特征信息包括人脸特征信息和声纹特征信息中的至少一个,则身份识别装置可以根据人脸特征信息和会议概率值确定第一生物特征信息对应的个人身份识别号,或者,身份识别装置可以根据声纹特征信息和会议概率值确定第一生物特征信息对应的个人身份识别号,或者,身份识别装置可以根据人脸特征信息,声纹特征信息和会议概率值确定第一生物特征信息对应的个人身份识别号,此处不做具体限定。
在图2所示实施例的基础上,下面更具体地介绍在视频会议中识别身份的方法流程:
请参阅图3,为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图,该实施例的具体流程如下:
步骤301、身份识别装置获取视频会议中的第一生物特征信息,其中,该第一生物特征信息包括人脸特征信息。
步骤302、身份识别装置获取数据库中的身份名单对应的第二生物特征信息和身份名单对应的会议概率值,其中,该身份名单中包括至少一个个人身份识别号,该第二生物特征信息包括人脸特征信息。
步骤303、身份识别装置根据身份名单对应的第二生物特征信息中的人脸特征信息从身份名单中确定第一短名单,其中,该第一短名单对应的第二生物特征信息中的人脸特征信息与该第一生物特征信息中的人脸特征信息的相似度不小于预设阈值。
步骤304、身份识别装置根据第一短名单对应的会议概率值从第一短名单中确定第二短名单,其中,该第二短名单包括该第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。
在具体实现过程中,身份识别装置根据第一短名单对应的会议概率值从第一短名单中确定第二短名单的方式有很多种,例如,聚类分析,M个最大值,其中M为大于0的整数,大于预设阈值等方式,此处不做具体限定。
以通过聚类分析为例,假设第一短名单中有A,B,C,D,E,F这6个个人身份识别号,其中,A对应的会议概率值为0.8,B对应的会议概率值为0.3,C对应的会议概率值为0.4,D对应的会议概率值为0.85,E对应的会议概率值为0.9,F对应的会议概率值为0.2。通过聚类分析,将A,D,E归为一类,将B,C,F归为一类,由于A,D,E这类中对应的会议概率值最大,则将A,D,E确定为第二短名单。
以选取M个最大值为例,假设第一短名单中有A,B,C,D,E,F、G这7个个人身份识别号,其中,A对应的会议概率值为0.8,B对应的会议概率值为0.3,C对应的会议概率值为0.4,D对应的会议概率值为0.85,E对应的会议概率值为0.9,F对应的会议概率值为0.2,G对应会议概率值为0.85。假设M为3,则最大的三个会议概率值分别是D对应的会议概率值0.85,E对应的会议概率值0.9和G对应会议概率值0.85,则将D,E,G确定为第二短名单。
以选取大于预设阈值为例,假设第一短名单中有A,B,C,D,E,F、G、H这8个个人身份识别号,其中,A对应的会议概率值为0.8,B对应的会议概率值为0.3,C对应的会议概率值为0.4,D对应的会议概率值为0.85,E对应的会议概率值为0.9,F对应的会议概率值为0.2,G对应会议概率值为0.85,H对应的概率值为0.6。假设预设阈值为0.7,则会议概率值大于预设阈值的只有A,D,E,G,则将A,D,E,G确定为第二短名单。
在具体实现过程中,由于会议概率值越大,则被识别的可能性越大,因此,为了提升个人身份识别号对应的会议概率值,存在下面可能的实现方式:
在一个可能的实现方式中,该第一短名单还包含个人身份识别号对应的身份信息,在从第一短名单中确定第二短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自所述语音识别服务器的所述会议录音信息的谈话文本,根据所述谈话文本确定本次会议期间提到的身份信息,比较所述提到的身份信息与所述第一短名单对应的身份信息,提升所述第一短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
例如,第一短名单中还包含每个备选用户的人名,终端向语音识别服务器发送本次会议期间的会议录音信息,接收来自所述语音识别服务器的所述会议录音信息的谈话文本,根据所述谈话文本确定本次会议期间提到的人名,并统计每个人名被提及的次数,终端比较谈话提及的人名与第一短名单中的人名,终端临时提升第一短名单中与谈话提及人名相同的备选用户的会议概率值。被提及的次数越多,会议概率值提升的越多,终端在会议结束后清除会议概率值的提升部分。
在一个可能的实现方式中,该第一短名单还包含个人身份识别号对应的身份信息,在从第一短名单中确定第二短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自语音识别服务器的根据会议录音信息确定的身份信息,比较所述确定的身份信息与所述第一短名单对应的身份信息,提升所述第一短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
例如,第一短名单中还包含每个备选用户的人名,终端向语音识别服务器发送本次会议期间的会议录音信息,以便语音识别服务器根据所述会议录音信息确定谈话文本,根据谈话文本确定本次会议期间提到的人名,并统计每个人名被提及的次数,终端接收来自语音识别服务器的本次会议期间提到的人名,比较谈话提及的人名与第一短名单中的人名,终端向概率服务器发送所述第一短名单中与所述谈话提及的人名相同的人名对应的个人身份识别号,以便所述概率服务器临时提升第一短名单中与谈话提及人名相同的备选用户的会议概率值,并在会议结束后清除会议概率值的提升部分,被提及的次数越多,会议概率值提升的越多。
步骤305、身份识别装置根据第二短名单对应的第二生物特征信息中的人脸特征信息从第二短名单中确定第一生物特征信息对应的个人身份识别号,其中,该第一生物特征信息对应的个人身份识别号对应的人脸特征信息与第一生物特征信息中的人脸特征信息的相似度最高。
请参阅图4,为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图,该实施例的具体流程如下:
步骤401、身份识别装置获取视频会议中的第一生物特征信息,其中,该第一生物特征信息包括声纹特征信息。
步骤402、身份识别装置获取数据库中的身份名单对应的第二生物特征信息和身份名单对应的会议概率值,其中,该身份名单中包括至少一个个人身份识别号,该第二生物特征信息包括声纹特征信息。
步骤403、身份识别装置根据身份名单对应的第二生物特征信息中的声纹特征信息从身份名单中确定第一短名单,其中,该第一短名单对应的第二生物特征信息中的声纹特征信息与该第一生物特征信息中的声纹特征信息的相似度不小于预设阈值。
步骤404、身份识别装置根据第一短名单对应的会议概率值从第一短名单中确定第二短名单,其中,该第二短名单包括第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。
在具体实现过程中,由于会议概率值越大,则被识别的可能性越大,因此,为了提升个人身份识别号对应的会议概率值,存在下面可能的实现方式:
在一个可能的实现方式中,该第一短名单还包含个人身份识别号对应的身份信息,在从第一短名单中确定第二短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自所述语音识别服务器的所述会议录音信息的谈话文本,根据所述谈话文本确定本次会议期间提到的身份信息,比较所述提到的身份信息与所述第一短名单对应的身份信息,提升所述第一短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
在一个可能的实现方式中,该第一短名单还包含个人身份识别号对应的身份信息,在从第一短名单中确定第二短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自语音识别服务器的根据会议录音信息确定的身份信息,比较所述确定的身份信息与所述第一短名单对应的身份信息,提升所述第一短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
步骤405、身份识别装置根据第二短名单对应的第二生物特征信息中的声纹特征信息从所述第二短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,该第一生物特征信息对应的个人身份识别号对应的声纹特征信息与第一生物特征信息中的声纹特征信息的相似度最高。
请参阅图5,为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图,该实施例的具体流程如下:
步骤501、身份识别装置获取视频会议中的第一生物特征信息,其中,该第一生物特征信息包括人脸特征信息和声纹特征信息。
步骤502、身份识别装置获取数据库中的身份名单对应的第二生物特征信息和身份名单对应的会议概率值,其中,该身份名单中包括至少一个个人身份识别号,该第二生物特征信息包括人脸特征信息和声纹特征信息。
步骤503、身份识别装置根据身份名单对应的第二生物特征信息中的人脸特征信息从身份名单中确定第一短名单,其中,该第一短名单对应的第二生物特征信息中的人脸特征信息与该第一生物特征信息中的人脸特征信息的相似度不小于预设阈值。
步骤504、身份识别装置根据第一短名单对应的会议概率值从第一短名单中确定第二短名单,其中,该第二短名单包括该第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。
在具体实现过程中,由于会议概率值越大,则被识别的可能性越大,因此,为了提升个人身份识别号对应的会议概率值,存在下面可能的实现方式:
在一个可能的实现方式中,该第一短名单还包含个人身份识别号对应的身份信息,在从第一短名单中确定第二短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自所述语音识别服务器的所述会议录音信息的谈话文本,根据所述谈话文本确定本次会议期间提到的身份信息,比较所述提到的身份信息与所述第一短名单对应的身份信息,提升所述第一短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
在一个可能的实现方式中,该第一短名单还包含个人身份识别号对应的身份信息,在从第一短名单中确定第二短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自语音识别服务器的根据会议录音信息确定的身份信息,比较所述确定的身份信息与所述第一短名单对应的身份信息,提升所述第一短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
步骤505、身份识别装置根据第二短名单对应的第二生物特征信息中的声纹特征信息从第二短名单中确定第一生物特征信息对应的个人身份识别号,其中,该第一生物特征信息对应的个人身份识别号对应的声纹特征信息与第一生物特征信息中的声纹特征信息的相似度最高。
请参阅图6,为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图,该实施例的具体流程如下:
步骤601、身份识别装置获取视频会议中的第一生物特征信息,其中,该第一生物特征信息包括声纹特征信息和人脸特征信息。
步骤602、身份识别装置获取数据库中的身份名单对应的第二生物特征信息和身份名单对应的会议概率值,其中,该身份名单中包括至少一个个人身份识别号,该第二生物特征信息包括声纹特征信息和人脸特征信息。
步骤603、身份识别装置根据身份名单对应的第二生物特征信息中的声纹特征信息从身份名单中确定第一短名单,其中,该第一短名单对应的第二生物特征信息中的声纹特征信息与该第一生物特征信息中的声纹特征信息的相似度不小于预设阈值。
步骤604、身份识别装置根据第一短名单对应的会议概率值从第一短名单中确定第二短名单,其中,该第二短名单包括第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。
在具体实现过程中,由于会议概率值越大,则被识别的可能性越大,因此,为了提升个人身份识别号对应的会议概率值,存在下面可能的实现方式:
在一个可能的实现方式中,该第一短名单还包含个人身份识别号对应的身份信息,在从第一短名单中确定第二短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自所述语音识别服务器的所述会议录音信息的谈话文本,根据所述谈话文本确定本次会议期间提到的身份信息,比较所述提到的身份信息与所述第一短名单对应的身份信息,提升所述第一短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
在一个可能的实现方式中,该第一短名单还包含个人身份识别号对应的身份信息,在从第一短名单中确定第二短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自语音识别服务器的根据会议录音信息确定的身份信息,比较所述确定的身份信息与所述第一短名单对应的身份信息,提升所述第一短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
步骤605、身份识别装置根据第二短名单对应的第二生物特征信息中的人脸特征信息从所述第二短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,该第一生物特征信息对应的个人身份识别号对应的人脸特征信息与第一生物特征信息中的人脸特征信息的相似度最高。
请参阅图7,为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图,该实施例的具体流程如下:
步骤701、身份识别装置获取视频会议中的第一生物特征信息,其中,该第一标生物特征信息包括人脸特征信息和声纹特征信息。
步骤702、身份识别装置获取数据库中的身份名单对应的第二生物特征信息和身份名单对应的会议概率值,其中,该身份名单中包括至少一个个人身份识别号,该第二生物特征信息包括人脸特征信息和生物特征信息。
步骤703、身份识别装置根据身份名单对应的第二生物特征信息中的人脸特征信息从身份名单中确定第一短名单,其中,该第一短名单对应的第二生物特征信息中的人脸特征信息与该第一生物特征信息中的人脸特征信息的相似度不小于第一预设阈值。
步骤704、身份识别装置根据第一短名单对应的第二生物特征信息中的声纹特征信息从第一短名单中确定第二短名单,其中该第二短名单对应的第二生物特征信息中的声纹特征信息与第一生物特征信息中的声纹特征信息的相似度不小于第二预设阈值。
步骤705、身份识别装置根据第二短名单对应的会议概率值从第二短名单中确定第三短名单,其中,该第三短名单包括第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。
在具体实现过程中,由于会议概率值越大,则被识别的可能性越大,因此,为了提升个人身份识别号对应的会议概率值,存在下面可能的实现方式:
在一个可能的实现方式中,该第二短名单还包含个人身份识别号对应的身份信息,在从第二短名单中确定第三短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自所述语音识别服务器的所述会议录音信息的谈话文本,根据所述谈话文本确定本次会议期间提到的身份信息,比较所述提到的身份信息与所述第二短名单对应的身份信息,提升所述第二短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
在一个可能的实现方式中,该第二短名单还包含个人身份识别号对应的身份信息,在从第二短名单中确定第三短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自语音识别服务器的根据会议录音信息确定的身份信息,比较所述确定的身份信息与所述第二短名单对应的身份信息,提升所述第二短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
步骤706、身份识别装置根据第三短名单对应的第二生物特征信息中的人脸特征信息从第三短名单中确定第一生物特征信息对应的个人身份识别号,其中该第一生物特征信息对应的个人身份识别号对应的人脸特征信息与第一生物特征信息中的人脸特征信息的相似度最高。
请参阅图8,为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图,该实施例的具体流程如下:
步骤801、身份识别装置获取视频会议中的第一生物特征信息,其中,该第一标生物特征信息包括人脸特征信息和声纹特征信息。
步骤802、身份识别装置获取数据库中的身份名单对应的第二生物特征信息和身份名单对应的会议概率值,其中,该身份名单中包括至少一个个人身份识别号,该第二生物特征信息包括人脸特征信息和生物特征信息。
步骤803、身份识别装置根据身份名单对应的第二生物特征信息中的声纹特征信息从身份名单中确定第一短名单,其中,第一短名单对应的第二生物特征信息中的声纹特征信息与该第一生物特征信息中的声纹特征信息的相似度不小于第一预设阈值。
步骤804、身份识别装置根据第一短名单对应的第二生物特征信息中的人脸特征信息从第一短名单中确定第二短名单,其中,该第二短名单对应的第二生物特征信息中的人脸特征信息与第一生物特征信息中的人脸特征信息的相似度不小于第二预设阈值。
步骤805、身份识别装置根据第二短名单对应的会议概率值从第二短名单中确定第三短名单,其中,该第三短名单包括所述第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。
在具体实现过程中,由于会议概率值越大,则被识别的可能性越大,因此,为了提升个人身份识别号对应的会议概率值,存在下面可能的实现方式:
在一个可能的实现方式中,该第二短名单还包含个人身份识别号对应的身份信息,在从第二短名单中确定第三短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自所述语音识别服务器的所述会议录音信息的谈话文本,根据所述谈话文本确定本次会议期间提到的身份信息,比较所述提到的身份信息与所述第二短名单对应的身份信息,提升所述第二短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
在一个可能的实现方式中,该第二短名单还包含个人身份识别号对应的身份信息,在从第二短名单中确定第三短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自语音识别服务器的根据会议录音信息确定的身份信息,比较所述确定的身份信息与所述第二短名单对应的身份信息,提升所述第二短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
步骤806、身份识别装置根据第三短名单对应的第二生物特征信息中的声纹特征信息从第三短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,该第一生物特征信息对应的个人身份识别号对应的声纹特征信息与第一生物特征信息中的声纹特征信息的相似度最高。
请参阅图9,为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图,该实施例的具体流程如下:
步骤901、身份识别装置获取视频会议中的第一生物特征信息,其中,该第一标生物特征信息包括人脸特征信息和声纹特征信息。
步骤902、身份识别装置获取数据库中的身份名单对应的第二生物特征信息和身份名单对应的会议概率值,其中,该身份名单中包括至少一个个人身份识别号,该第二生物特征信息包括人脸特征信息和生物特征信息。
步骤903、身份识别装置根据身份名单对应的第二生物特征信息中的人脸特征信息从身份名单中确定第一短名单,其中,该第一短名单对应的第二生物特征信息中的人脸特征信息与该第一生物特征信息中的人脸特征信息的相似度不小于第一预设阈值。
步骤904、身份识别装置根据第一短名单对应的第二生物特征信息中的声纹特征信息从第一短名单中确定第二短名单,其中该第二短名单对应的第二生物特征信息中的声纹特征信息与第一生物特征信息中的声纹特征信息的相似度不小于第二预设阈值。
步骤905、身份识别装置根据第二短名单对应的会议概率值从第二短名单中确定第三短名单,其中,该第三短名单包括第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。
在具体实现过程中,由于会议概率值越大,则被识别的可能性越大,因此,为了提升个人身份识别号对应的会议概率值,存在下面可能的实现方式:
在一个可能的实现方式中,该第二短名单还包含个人身份识别号对应的身份信息,在从第二短名单中确定第三短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自所述语音识别服务器的所述会议录音信息的谈话文本,根据所述谈话文本确定本次会议期间提到的身份信息,比较所述提到的身份信息与所述第二短名单对应的身份信息,提升所述第二短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
在一个可能的实现方式中,该第二短名单还包含个人身份识别号对应的身份信息,在从第二短名单中确定第三短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自语音识别服务器的根据会议录音信息确定的身份信息,比较所述确定的身份信息与所述第二短名单对应的身份信息,提升所述第二短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
步骤906、身份识别装置根据第三短名单对应的第二生物特征信息中的声纹特征信息从第三短名单中确定第一生物特征信息对应的个人身份识别号,其中该第一生物特征信息对应的个人身份识别号对应的声纹特征信息与第一生物特征信息中的声纹特征信息的相似度最高。
请参阅图10,为本申请实施例中在视频会议中识别身份的方法的另一个实施例示意图,该实施例的具体流程如下:
步骤1001、身份识别装置获取视频会议中的第一生物特征信息,其中,该第一标生物特征信息包括人脸特征信息和声纹特征信息。
步骤1002、身份识别装置获取数据库中的身份名单对应的第二生物特征信息和身份名单对应的会议概率值,其中,该身份名单中包括至少一个个人身份识别号,该第二生物特征信息包括人脸特征信息和生物特征信息。
步骤1003、身份识别装置根据身份名单对应的第二生物特征信息中的声纹特征信息从身份名单中确定第一短名单,其中,该第一短名单对应的第二生物特征信息中的声纹特征信息与该第一生物特征信息中的声纹特征信息的相似度不小于第一预设阈值。
步骤1004、身份识别装置根据第一短名单对应的第二生物特征信息中的人脸特征信息从第一短名单中确定第二短名单,其中,该第二短名单对应的第二生物特征信息中的人脸特征信息与第一生物特征信息中的人脸特征信息的相似度不小于第二预设阈值。
步骤1005、身份识别装置根据第二短名单对应的会议概率值从第二短名单中确定第三短名单,其中,该第三短名单包括所述第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。
在具体实现过程中,由于会议概率值越大,则被识别的可能性越大,因此,为了提升个人身份识别号对应的会议概率值,存在下面可能的实现方式:
在一个可能的实现方式中,该第二短名单还包含个人身份识别号对应的身份信息,在从第二短名单中确定第三短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自所述语音识别服务器的所述会议录音信息的谈话文本,根据所述谈话文本确定本次会议期间提到的身份信息,比较所述提到的身份信息与所述第二短名单对应的身份信息,提升所述第二短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
在一个可能的实现方式中,该第二短名单还包含个人身份识别号对应的身份信息,在从第二短名单中确定第三短名单之前,身份识别装置向语音识别服务器发送本次会议期间的会议录音信息,接收来自语音识别服务器的根据会议录音信息确定的身份信息,比较所述确定的身份信息与所述第二短名单对应的身份信息,提升所述第二短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
步骤1006、身份识别装置根据所述第三短名单对应的第二生物特征信息中的声纹特征信息从第三短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,该第一生物特征信息对应的个人身份识别号对应的声纹特征信息与第一生物特征信息中的声纹特征信息的相似度最高。
图4至图10所示实施例中涉及与图2和图3所示实施例相同或者相似的内容,具体可参阅图2和图3所示实施例,此处不再赘述。
下面,以具体应用场景介绍在视频会议中识别身份的方法流程:
如图11a所示,为本申请实施例中的一个应用场景结构示意图,其中,海量的人脸数据库预存在人脸识别服务器里,人脸识别的算法也是由人脸识别服务器提供的云服务。海量的声纹数据库预存在声纹识别服务器里,声纹识别的算法也是由声纹识别服务器提供的云服务。用于人脸识别的实时人脸样本、用于声纹识别的实时声纹样本是由用户设备中的AI摄像机实时抓拍并经过声脸匹配。会议概率值的算法是由概率服务器提供的云服务。会议服务器负责维护个人身份识别号(personal unique identifier,PUID)、声纹识别号(voiceprint unique identifier,VUID)、人脸识别号(face unique identifier,FUID)之间的对应关系,并为用户设备中的终端提供云查询服务,会议服务器还负责人脸识别服务、声纹识别服务、概率服务的中转和并发管理。
如图11b所示和图11c所示,其中,图11b为本申请实施例中的一个应用场景交互流程图,该交互流程分为四个阶段:第一阶段、第二阶段、第三阶段和第四阶段,其中,该交互流程图中涉及的用户设备包括终端和AI摄像机。图11c为本申请实施例中的一个应用场景流程示意图。
在第一阶段,用户设备中的AI摄像机向会议服务器提交实时人脸样本,会议服务器把接收到的实时人脸样本放在人脸识别队列的队尾,并把位于人脸识别队列的队首的实时人脸样本发送给人脸识别服务器申请人脸识别。人脸识别服务器返回FUID清单和人脸相似度给会议服务器,会议服务器把FUID清单转换成PUID清单后连同对应的人脸相似度转发给用户设备中的终端,其中,该PUID清单即为第一短名单。
在第二阶段,用户设备中的终端向会议服务器提交实时声纹样本和第一短名单,会议服务器把接收到的实时声纹样本和第一短名单放在声纹识别队列的队尾,并把第一短名单的PUID清单转换为VUID清单。会议服务器把位于声纹识别队列的队首的实时声纹样本和VUID清单发送给声纹识别服务器申请声纹识别。声纹识别服务器返回VUID清单和对应的声纹相似度给会议服务器,会议服务器把VUID清单转换成PUID清单连同对应的声纹相似度转发给用户设备中的终端。终端从第一短名单里剔除声纹相似度小于预设阈值的PUID清单,其中,剔除后的PUID清单即为第二短名单。
在第三阶段,终端向会议服务器提交会议室的位置信息和第二短名单,会议服务器把接收到的会议室的位置信息和第二短名单放在概率查询队列的队尾。会议服务器把位于概率查询队列的队首的会议室的位置信息和第二短名单,发送给概率服务器申请概率查询。概率服务器返回第二短名单及其对应的会议概率值给会议服务器,会议服务器把第二短名单及其对应的会议概率值,转发给终端。终端采用概率优先的方法,对第二短名单进行聚类分析,包含会议概率最大值的类进入第三短名单。
在第四阶段,终端找出第三短名单中人脸相似度最高的PUID,作为身份识别的最终结果。终端把此PUID发送给会议服务器申请个人信息查询,会议服务器返回该PUID对应的个人信息,例如姓名、工号、昵称、年龄、性别、职位、服务的单位名称等。
上面对一种在视频会议中识别身份的方法进行了说明,下面对在视频会议中识别身份的方法所应用的身份识别装置进行说明,请参阅图12所示,本申请中提供了一种身份识别装置1200的一个实施例,该身份识别装置1200包括:获取模块1201和确定模块1202。
获取模块1201,用于获取视频会议中的第一生物特征信息,其中,所述第一生物特征信息包括人脸特征信息和声纹特征信息中的至少一个。
所述获取模块1201,还用于获取数据库中的身份名单对应的第二生物特征信息和所述身份名单对应的会议概率值,其中,所述身份名单中包括至少一个个人身份识别号,所述第二生物特征信息包括人脸特征信息和声纹特征信息中的至少一个,所述会议概率值是根据参会概率值和同会概率值中的至少一个所确定,即该参会概率值为参会概率值,或者该会议概率值为同会概率值,或者该会议概率值是根据参会概率值和同会概率值以预设方式确定的结果,该预设的方式包括算数平均值,加权平均值,最大值中的一种。
其中,所述参会概率值是根据历史参会信息和当前参会信息中的至少一个所确定,即所述参会概率值是根据历史参会信息所确定的,或者所述参会概率值是根据当前参会信息所确定的,或者所述参会概率值根据历史参会信息和当前参会信息分别对应的概率值以预设的方式确定的结果,该预设的方式包括但不限于算数平均值,加权平均值,最大值中的其中一种。其中,所述当前参会信息包括会议室的位置信息、会议通知信息、人员位置信息和会议录音信息中的至少一个,所述会议录音信息包括个人身份识别号对应的身份信息,所述个人身份识别号对应的身份信息包括姓名、昵称、职位和工号中的至少一个。所述历史参会信息包括会议室的位置信息、会议通知信息、人员位置信息和会议录音信息中的至少一个,所述会议录音信息包括个人身份识别号对应的身份信息,所述个人身份识别号对应的身份信息包括姓名、昵称、职位和工号中的至少一个。
其中,所述同会概率值是根据历史同会信息和当前同会信息中的至少一个所确定,其中,所述当前同会信息包括会议通知信息、人际关系信息和人员位置信息中的至少一个。所述历史同会信息包括会议通知信息、人际关系信息和人员位置信息中的至少一个。
确定模块1202,用于根据所述身份名单对应的第二生物特征信息和所述身份名单对应的会议概率值从所述身份名单中确定所述第一生物特征信息对应的个人身份识别号。
在实现过程中,确定模块1202根据所述身份名单对应的第二生物特征信息和所述身份名单对应的会议概率值从所述身份名单中确定所述第一生物特征信息对应的个人身份识别号的方式有很多种,下面介绍几种可能实现的方式:
在一个可能的实现方式中,若所述第一生物特征信息包括人脸特征信息,所述第二生物特征信息包括人脸特征信息,所述确定模块1202具体用于:
根据所述身份名单对应的第二生物特征信息中的人脸特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于预设阈值;根据所述第一短名单对应的会议概率值从所述第一短名单中确定第二短名单,其中,所述第二短名单包括所述第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数;根据所述第二短名单对应的第二生物特征信息中的人脸特征信息从所述第二短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度最高。
在一个可能的实现方式中,若所述第一生物特征信息包括声纹特征信息,所述第二生物特征信息包括声纹特征信息,所述确定模块1202具体用于:
根据所述身份名单对应的第二生物特征信息中的声纹特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于预设阈值;根据所述第一短名单对应的会议概率值从所述第一短名单中确定第二短名单,其中,所述第二短名单包括所述第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数;根据所述第二短名单对应的第二生物特征信息中的声纹特征信息从所述第二短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度最高。
在一个可能的实现方式中,若所述第一标生物特征信息包括人脸特征信息和声纹特征信息,所述第二生物特征信息包括人脸特征信息和生物特征信息,所述确定模块1202具体用于:
根据所述身份名单对应的第二生物特征信息中的人脸特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于第一预设阈值;根据所述第一短名单对应的第二生物特征信息中的声纹特征信息从所述第一短名单中确定第二短名单,其中,所述第二短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于第二预设阈值;根据所述第二短名单对应的会议概率值从所述第二短名单中确定第三短名单,其中,所述第三短名单包括所述第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数;根据所述第三短名单对应的第二生物特征信息中的人脸特征信息从所述第三短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度最高。
在一个可能的实现方式中,所述第一标生物特征信息包括人脸特征信息和声纹特征信息,所述第二生物特征信息包括人脸特征信息和生物特征信息,所述确定模块1202具体用于:
根据所述身份名单对应的第二生物特征信息中的声纹特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于第一预设阈值;根据所述第一短名单对应的第二生物特征信息中的人脸特征信息从所述第一短名单中确定第二短名单,其中,所述第二短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于第二预设阈值;根据所述第二短名单对应的会议概率值从所述第二短名单中确定第三短名单,其中,所述第三短名单包括所述第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数;根据所述第三短名单对应的第二生物特征信息中的声纹特征信息从所述第三短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度最高。
在一个可能的实现方式中,所述第一生物特征信息包括人脸特征信息和声纹特征信息,第二生物特征信息包括人脸特征信息和声纹特征信息,所述确定模块1202具体用于:
根据身份名单对应的第二生物特征信息中的人脸特征信息从身份名单中确定第一短名单,其中,第一短名单对应的第二生物特征信息中的人脸特征信息与第一生物特征信息中的人脸特征信息的相似度不小于预设阈值,其中,该预设阈值是终端或者服务器根据实际需求提前设置的。根据所述第一短名单对应的会议概率值从所述第一短名单中确定第二短名单,其中,所述第二短名单包括所述第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。根据所述第二短名单对应的第二生物特征信息中的声纹特征信息从所述第二短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度最高。
在一个可能的实现方式中,所述第一生物特征信息包括声纹特征信息和人脸特征信息,第二生物特征信息包括声纹特征信息和人脸特征信息,所述确定模块1202具体用于:
根据所述身份名单对应的第二生物特征信息中的声纹特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于预设阈值,其中,该预设阈值是终端或者服务器根据实际需求提前设置的。根据所述第一短名单对应的会议概率值从所述第一短名单中确定第二短名单,其中,所述第二短名单包括所述第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。根据所述第二短名单对应的第二生物特征信息中的人脸特征信息从所述第二短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度最高。
在一个可能的实现方式中,所述第一标生物特征信息包括人脸特征信息和声纹特征信息,第二生物特征信息包括人脸特征信息和生物特征信息,所述确定模块1202具体用于:
根据所述身份名单对应的第二生物特征信息中的人脸特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于第一预设阈值,其中,该第一预设阈值是终端或者服务器根据实际需求提前设置的。根据所述第一短名单对应的第二生物特征信息中的声纹特征信息从所述第一短名单中确定第二短名单,其中,所述第二短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于第二预设阈值,其中,该第二预设阈值是终端或者服务器根据实际需求提前设置的。根据所述第二短名单对应的会议概率值从所述第二短名单中确定第三短名单,其中,所述第三短名单包括所述第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。根据所述第三短名单对应的第二生物特征信息中的声纹特征信息从所述第三短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度最高。
在一个可能的实现方式中,所述第一标生物特征信息包括人脸特征信息和声纹特征信息,第二生物特征信息包括人脸特征信息和生物特征信息,所述确定模块1202具体用于:
根据所述身份名单对应的第二生物特征信息中的声纹特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于第一预设阈值,其中,该第一预设阈值是终端或者服务器根据实际需求提前设置的。根据所述第一短名单对应的第二生物特征信息中的人脸特征信息从所述第一短名单中确定第二短名单,其中,所述第二短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于第二预设阈值,其中,该第二预设阈值是终端或者服务器根据实际需求提前设置的。根据所述第二短名单对应的会议概率值从所述第二短名单中确定第三短名单,其中,所述第三短名单包括所述第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数。根据所述第三短名单对应的第二生物特征信息中的人脸特征信息从所述第三短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度最高。
在图12对应的实施例的基础上,请参阅图13所示,本申请中提供了一种身份识别装置1300的另一个实施例,该身份识别装置1300包括:获取模块1201和确定模块1202,发送模块1203,接收模块1204,比较模块1205和提升模块1206。
在一个可能的实现方式中,发送模块1203,用于所述第一短名单还包含个人身份识别号对应的身份信息,在所述确定模块1202从所述第一短名单中确定所述第二短名单之前,向语音识别服务器发送本次会议期间的会议录音信息;
接收模块1204,用于接收来自所述语音识别服务器的所述会议录音信息的谈话文本;
所述确定模块1202,还用于根据所述谈话文本确定本次会议期间提到的身份信息;
比较模块1205,用于比较所述提到的身份信息与所述第一短名单对应的身份信息;
提升模块1206,用于提升所述第一短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
在一个可能的实现方式中,发送模块1203,用于所述第二短名单还包含个人身份识别号对应的身份信息,在所述确定模块1202从所述第二短名单中确定所述第三短名单之前,向语音识别服务器发送本次会议期间的会议录音信息;
接收模块1204,用于接收来自所述语音识别服务器的所述会议录音信息的谈话文本;
所述确定模块1202,还用于根据所述谈话文本确定本次会议期间提到的身份信息;
比较模块1205,用于比较所述提到的身份信息与所述第二短名单对应的身份信息;
提升模块1206,用于提升所述第二短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
在一个可能的实现方式中,发送模块1203,用于所述第一短名单还包含个人身份识别号对应的身份信息,在所述确定模块1202从所述第一短名单中确定所述第二短名单之前,向语音识别服务器发送本次会议期间的会议录音信息;
接收模块1204,用于接收来自所述语音识别服务器的根据所述会议录音信息确定的身份信息;
比较模块1205,用于比较所述确定的身份信息与所述第一短名单对应的身份信息;
提升模块1206,用于提升所述第一短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
在一个可能的实现方式中,发送模块1203,用于所述第二短名单还包含个人身份识别号对应的身份信息,在所述确定模块1202从所述第二短名单中确定所述第三短名单之前,向语音识别服务器发送本次会议期间的会议录音信息;
接收模块1204,用于接收来自所述语音识别服务器的根据所述会议录音信息确定的身份信息;
比较模块1205,用于比较所述确定的身份信息与所述第二短名单对应的身份信息;
提升模块1206,用于提升所述第二短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
进一步的,图12-图13中的身份识别装置是以功能模块的形式来呈现。这里的“模块”可以指特定应用集成电路(application-specific integrated circuit,ASIC),电路,执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。在一个简单的实施例中,图12-图13中的身份识别装置可以采用图14所示的形式。
图14是本申请实施例提供的一种身份识别装置1400结构示意图,该身份识别装置1400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器1422和存储器1432,一个或一个以上存储应用程序1442或数据1444的存储介质1430(例如一个或一个以上海量存储设备)。其中,存储器1432和存储介质1430可以是短暂存储或持久存储。存储在存储介质1430的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对身份识别装置中的一系列指令操作。更进一步地,处理器1422可以设置为与存储介质1430通信,在身份识别装置1400上执行存储介质1430中的一系列指令操作。
身份识别装置1400还可以包括一个或一个以上电源1426,一个或一个以上有线或无线网络接口1450,一个或一个以上输入输出接口1458,和/或,一个或一个以上操作系统1441。
处理器1422使身份识别装置执行图2至图10对应的方法实施例中身份识别装置所实际执行的步骤。
本申请实施例提供了一种计算机存储介质,用于储存上述优化处理设备所用的计算机软件指令,其包含用于图2至图10对应的方法实施例中身份识别装置所实际执行的方法所设计的程序。
本领域技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络设备上。
本申请的技术方案的全部或部分可以以计算机软件产品的形式体现出来。该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请的实施例所述方法的全部或部分步骤。而前述的存储介质包括:通用串行总线闪存盘(USB flash disk)、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,但是本领域技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征以功能相同的特征进行替换;而这些修改或者替换,并不使相应技术方案脱离本申请权利要求的范围。

Claims (30)

1.一种在视频会议中识别身份的方法,其特征在于,包括:
身份识别装置获取视频会议中的第一生物特征信息,其中,所述第一生物特征信息包括人脸特征信息和声纹特征信息中的至少一个;
所述身份识别装置获取数据库中的身份名单对应的第二生物特征信息和所述身份名单对应的会议概率值,其中,所述身份名单中包括至少一个个人身份识别号,所述第二生物特征信息包括人脸特征信息和声纹特征信息中的至少一个,所述会议概率值是根据参会概率值和同会概率值中的至少一个所确定;
所述身份识别装置根据所述身份名单对应的第二生物特征信息和所述身份名单对应的会议概率值从所述身份名单中确定所述第一生物特征信息对应的个人身份识别号。
2.根据权利要求1所述的方法,其特征在于,若所述第一生物特征信息包括人脸特征信息,所述第二生物特征信息包括人脸特征信息,所述身份识别装置根据所述身份名单对应的第二生物特征信息和所述身份名单对应的会议概率值从所述身份名单中确定所述第一生物特征信息对应的个人身份识别号包括:
所述身份识别装置根据所述身份名单对应的第二生物特征信息中的人脸特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于预设阈值;
所述身份识别装置根据所述第一短名单对应的会议概率值从所述第一短名单中确定第二短名单,其中,所述第二短名单包括所述第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数;
所述身份识别装置根据所述第二短名单对应的第二生物特征信息中的人脸特征信息从所述第二短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度最高。
3.根据权利要求1所述的方法,其特征在于,若所述第一生物特征信息包括声纹特征信息,所述第二生物特征信息包括声纹特征信息,所述身份识别装置根据所述身份名单对应的第二生物特征信息和所述身份名单对应的会议概率值从所述身份名单中确定所述第一生物特征信息对应的个人身份识别号包括:
所述身份识别装置根据所述身份名单对应的第二生物特征信息中的声纹特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于预设阈值;
所述身份识别装置根据所述第一短名单对应的会议概率值从所述第一短名单中确定第二短名单,其中,所述第二短名单包括所述第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数;
所述身份识别装置根据所述第二短名单对应的第二生物特征信息中的声纹特征信息从所述第二短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度最高。
4.根据权利要求1所述的方法,其特征在于,若所述第一标生物特征信息包括人脸特征信息和声纹特征信息,所述第二生物特征信息包括人脸特征信息和生物特征信息,所述身份识别装置根据所述身份名单对应的第二生物特征信息和所述身份名单对应的会议概率值从所述身份名单中确定所述第一生物特征信息对应的个人身份识别号包括:
所述身份识别装置根据所述身份名单对应的第二生物特征信息中的人脸特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于第一预设阈值;
所述身份识别装置根据所述第一短名单对应的第二生物特征信息中的声纹特征信息从所述第一短名单中确定第二短名单,其中,所述第二短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于第二预设阈值;
所述身份识别装置根据所述第二短名单对应的会议概率值从所述第二短名单中确定第三短名单,其中,所述第三短名单包括所述第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数;
所述身份识别装置根据所述第三短名单对应的第二生物特征信息中的人脸特征信息从所述第三短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度最高。
5.根据权利要求1所述的方法,其特征在于,所述第一标生物特征信息包括人脸特征信息和声纹特征信息,所述第二生物特征信息包括人脸特征信息和生物特征信息,所述身份识别装置根据所述身份名单对应的第二生物特征信息和所述身份名单对应的会议概率值从所述身份名单中确定所述第一生物特征信息对应的个人身份识别号包括:
所述身份识别装置根据所述身份名单对应的第二生物特征信息中的声纹特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于第一预设阈值;
所述身份识别装置根据所述第一短名单对应的第二生物特征信息中的人脸特征信息从所述第一短名单中确定第二短名单,其中,所述第二短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于第二预设阈值;
所述身份识别装置根据所述第二短名单对应的会议概率值从所述第二短名单中确定第三短名单,其中,所述第三短名单包括所述第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数;
所述身份识别装置根据所述第三短名单对应的第二生物特征信息中的声纹特征信息从所述第三短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度最高。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述会议概率值为参会概率值。
7.根据权利要求1至5任一项所述的方法,其特征在于,所述会议概率值为同会概率值。
8.根据权利要求1至5任一项所述的方法,其特征在于,所述会议概率值为参会概率值和同会概率值以预设方式确定的结果,其中,所述预设方式包括算数平均值,加权平均值,最大值中的一种。
9.根据权利要求1至8任一项所述的方法,其特征在于,所述参会概率值是根据历史参会信息和当前参会信息中的至少一个所确定,其中,所述当前参会信息包括会议室的位置信息、会议通知信息、人员位置信息和会议录音信息中的至少一个,所述会议录音信息包括个人身份识别号对应的身份信息,所述个人身份识别号对应的身份信息包括姓名、昵称、职位和工号中的至少一个。
10.根据权利要求1至8任一项所述的方法,其特征在于,所述同会概率值是根据历史同会信息和当前同会信息中的至少一个所确定,其中,所述当前同会信息包括会议通知信息、人际关系信息和人员位置信息中的至少一个。
11.根据权利要求2或3所述的方法,其特征在于,所述第一短名单还包含个人身份识别号对应的身份信息,在从所述第一短名单中确定所述第二短名单之前,所述方法还包括:
所述身份识别装置向语音识别服务器发送本次会议期间的会议录音信息;
所述身份识别装置接收来自所述语音识别服务器的所述会议录音信息的谈话文本;
所述身份识别装置根据所述谈话文本确定本次会议期间提到的身份信息;
所述身份识别装置比较所述提到的身份信息与所述第一短名单对应的身份信息;
所述身份识别装置提升所述第一短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
12.根据权利要求4或5所述的方法,其特征在于,所述第二短名单还包含个人身份识别号对应的身份信息,在从所述第二短名单中确定所述第三短名单之前,所述方法还包括:
所述身份识别装置向语音识别服务器发送本次会议期间的会议录音信息;
所述身份识别装置接收来自所述语音识别服务器的所述会议录音信息的谈话文本;
所述身份识别装置根据所述谈话文本确定本次会议期间提到的身份信息;
所述身份识别装置比较所述提到的身份信息与所述第二短名单对应的身份信息;
所述身份识别装置提升所述第二短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
13.根据权利要求2或3所述的方法,其特征在于,所述第一短名单还包含个人身份识别号对应的身份信息,在从所述第一短名单中确定所述第二短名单之前,所述方法还包括:
所述身份识别装置向语音识别服务器发送本次会议期间的会议录音信息;
所述身份识别装置接收来自所述语音识别服务器的根据所述会议录音信息确定的身份信息;
所述身份识别装置比较所述确定的身份信息与所述第一短名单对应的身份信息;
所述身份识别装置提升所述第一短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
14.根据权利要求4或5所述的方法,其特征在于,所述第二短名单还包含个人身份识别号对应的身份信息,在从所述第二短名单中确定所述第三短名单之前,所述方法还包括:
所述身份识别装置向语音识别服务器发送本次会议期间的会议录音信息;
所述身份识别装置接收来自所述语音识别服务器的根据所述会议录音信息确定的身份信息;
所述身份识别装置比较所述确定的身份信息与所述第二短名单对应的身份信息;
所述身份识别装置提升所述第二短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
15.一种身份识别装置,其特征在于,包括:
获取模块,用于获取视频会议中的第一生物特征信息,其中,所述第一生物特征信息包括人脸特征信息和声纹特征信息中的至少一个;
所述获取模块,还用于获取数据库中的身份名单对应的第二生物特征信息和所述身份名单对应的会议概率值,其中,所述身份名单中包括至少一个个人身份识别号,所述第二生物特征信息包括人脸特征信息和声纹特征信息中的至少一个,所述会议概率值是根据参会概率值和同会概率值中的至少一个所确定;
确定模块,用于根据所述身份名单对应的第二生物特征信息和所述身份名单对应的会议概率值从所述身份名单中确定所述第一生物特征信息对应的个人身份识别号。
16.根据权利要求15所述的身份识别装置,其特征在于,若所述第一生物特征信息包括人脸特征信息,所述第二生物特征信息包括人脸特征信息,所述确定模块具体用于:
根据所述身份名单对应的第二生物特征信息中的人脸特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于预设阈值;
根据所述第一短名单对应的会议概率值从所述第一短名单中确定第二短名单,其中,所述第二短名单包括所述第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数;
根据所述第二短名单对应的第二生物特征信息中的人脸特征信息从所述第二短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度最高。
17.根据权利要求15所述的身份识别装置,其特征在于,若所述第一生物特征信息包括声纹特征信息,所述第二生物特征信息包括声纹特征信息,所述确定模块具体用于:
根据所述身份名单对应的第二生物特征信息中的声纹特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于预设阈值;
根据所述第一短名单对应的会议概率值从所述第一短名单中确定第二短名单,其中,所述第二短名单包括所述第一短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数;
根据所述第二短名单对应的第二生物特征信息中的声纹特征信息从所述第二短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度最高。
18.根据权利要求15所述的身份识别装置,其特征在于,若所述第一标生物特征信息包括人脸特征信息和声纹特征信息,所述第二生物特征信息包括人脸特征信息和生物特征信息,所述确定模块具体用于:
根据所述身份名单对应的第二生物特征信息中的人脸特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于第一预设阈值;
根据所述第一短名单对应的第二生物特征信息中的声纹特征信息从所述第一短名单中确定第二短名单,其中,所述第二短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于第二预设阈值;
根据所述第二短名单对应的会议概率值从所述第二短名单中确定第三短名单,其中,所述第三短名单包括所述第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数;
根据所述第三短名单对应的第二生物特征信息中的人脸特征信息从所述第三短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度最高。
19.根据权利要求15所述的身份识别装置,其特征在于,所述第一标生物特征信息包括人脸特征信息和声纹特征信息,所述第二生物特征信息包括人脸特征信息和生物特征信息,所述确定模块具体用于:
根据所述身份名单对应的第二生物特征信息中的声纹特征信息从所述身份名单中确定第一短名单,其中,所述第一短名单对应的第二生物特征信息中的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度不小于第一预设阈值;
根据所述第一短名单对应的第二生物特征信息中的人脸特征信息从所述第一短名单中确定第二短名单,其中,所述第二短名单对应的第二生物特征信息中的人脸特征信息与所述第一生物特征信息中的人脸特征信息的相似度不小于第二预设阈值;
根据所述第二短名单对应的会议概率值从所述第二短名单中确定第三短名单,其中,所述第三短名单包括所述第二短名单中最大N个会议概率值对应的个人身份识别号,N为大于0的整数;
根据所述第三短名单对应的第二生物特征信息中的声纹特征信息从所述第三短名单中确定所述第一生物特征信息对应的个人身份识别号,其中,所述第一生物特征信息对应的个人身份识别号对应的声纹特征信息与所述第一生物特征信息中的声纹特征信息的相似度最高。
20.根据权利要求15至19任一项所述的身份识别装置,其特征在于,所述会议概率值为参会概率值。
21.根据权利要求15至19任一项所述的身份识别装置,其特征在于,所述会议概率值为同会概率值。
22.根据权利要求15至19任一项所述的身份识别装置,其特征在于,所述会议概率值为参会概率值和同会概率值以预设方式确定的结果,其中,所述预设方式包括算数平均值,加权平均值,最大值中的一种。
23.根据权利要求15至22任一项所述的身份识别装置,其特征在于,所述参会概率值是根据历史参会信息和当前参会信息中的至少一个所确定,其中,所述当前参会信息包括会议室的位置信息、会议通知信息、人员位置信息和会议录音信息中的至少一个,所述会议录音信息包括个人身份识别号对应的身份信息,所述个人身份识别号对应的身份信息包括姓名、昵称、职位和工号中的至少一个。
24.根据权利要求15至22任一项所述的身份识别装置,其特征在于,所述同会概率值是根据历史同会信息和当前同会信息中的至少一个所确定,其中,所述当前同会信息包括会议通知信息、人际关系信息和人员位置信息中的至少一个。
25.根据权利要求16或17所述的身份识别装置,其特征在于,所述第一短名单还包含个人身份识别号对应的身份信息,在所述确定模块从所述第一短名单中确定所述第二短名单之前,所述身份识别装置还包括:
发送模块,用于向语音识别服务器发送本次会议期间的会议录音信息;
接收模块,用于接收来自所述语音识别服务器的所述会议录音信息的谈话文本;
所述确定模块,还用于根据所述谈话文本确定本次会议期间提到的身份信息;
比较模块,用于比较所述提到的身份信息与所述第一短名单对应的身份信息;
提升模块,用于提升所述第一短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
26.根据权利要求18或19所述的身份识别装置,其特征在于,所述第二短名单还包含个人身份识别号对应的身份信息,在所述确定模块从所述第二短名单中确定所述第三短名单之前,所述身份识别装置还包括:
发送模块,用于向语音识别服务器发送本次会议期间的会议录音信息;
接收模块,用于接收来自所述语音识别服务器的所述会议录音信息的谈话文本;
所述确定模块,还用于根据所述谈话文本确定本次会议期间提到的身份信息;
比较模块,用于比较所述提到的身份信息与所述第二短名单对应的身份信息;
提升模块,用于提升所述第二短名单中具有所述提到的身份信息的个人身份识别号的会议概率值。
27.根据权利要求16或17所述的身份识别装置,其特征在于,所述第一短名单还包含个人身份识别号对应的身份信息,在所述确定模块从所述第一短名单中确定所述第二短名单之前,所述身份识别装置还包括:
发送模块,用于向语音识别服务器发送本次会议期间的会议录音信息;
接收模块,用于接收来自所述语音识别服务器的根据所述会议录音信息确定的身份信息;
比较模块,用于比较所述确定的身份信息与所述第一短名单对应的身份信息;
提升模块,用于提升所述第一短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
28.根据权利要求18或19所述的身份识别装置,其特征在于,所述第二短名单还包含个人身份识别号对应的身份信息,在所述确定模块从所述第二短名单中确定所述第三短名单之前,所述身份识别装置还包括:
发送模块,用于向语音识别服务器发送本次会议期间的会议录音信息;
接收模块,用于接收来自所述语音识别服务器的根据所述会议录音信息确定的身份信息;
比较模块,用于比较所述确定的身份信息与所述第二短名单对应的身份信息;
提升模块,用于提升所述第二短名单中具有所述确定的身份信息的个人身份识别号的会议概率值。
29.一种身份识别装置,其特征在于,包括:
存储器,用于存储计算机可执行程序代码;
网络接口,以及
处理器,与所述存储器和所述网络接口耦合;
其中所述程序代码包括指令,当所述处理器执行所述指令时,所述指令使所述优化处理设备执行如权利要求1-14中任意一项所述的方法。
30.一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1至14中任意一项所述的方法。
CN201810024620.7A 2018-01-10 2018-01-10 一种在视频会议中识别身份的方法及相关设备 Active CN110022454B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201810024620.7A CN110022454B (zh) 2018-01-10 2018-01-10 一种在视频会议中识别身份的方法及相关设备
EP18899251.5A EP3731519B1 (en) 2018-01-10 2018-12-13 Method for identifying identity in video conference and related apparatus
PCT/CN2018/120835 WO2019137147A1 (zh) 2018-01-10 2018-12-13 一种在视频会议中识别身份的方法及相关设备
US16/923,259 US11914691B2 (en) 2018-01-10 2020-07-08 Method for recognizing identity in video conference and related device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810024620.7A CN110022454B (zh) 2018-01-10 2018-01-10 一种在视频会议中识别身份的方法及相关设备

Publications (2)

Publication Number Publication Date
CN110022454A true CN110022454A (zh) 2019-07-16
CN110022454B CN110022454B (zh) 2021-02-23

Family

ID=67188210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810024620.7A Active CN110022454B (zh) 2018-01-10 2018-01-10 一种在视频会议中识别身份的方法及相关设备

Country Status (4)

Country Link
US (1) US11914691B2 (zh)
EP (1) EP3731519B1 (zh)
CN (1) CN110022454B (zh)
WO (1) WO2019137147A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111223487A (zh) * 2019-12-31 2020-06-02 联想(北京)有限公司 一种信息处理方法及电子设备
CN113707150A (zh) * 2021-11-01 2021-11-26 深圳云集智能信息有限公司 一种语音识别处理视频会议系统及方法
CN113780985A (zh) * 2021-08-26 2021-12-10 广州云徙科技有限公司 基于敏捷管理的会议纪要方法、系统、装置及存储介质
WO2022062471A1 (zh) * 2020-09-25 2022-03-31 华为技术有限公司 一种音频数据的处理方法、设备和系统

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11893985B2 (en) * 2021-01-15 2024-02-06 Harman International Industries, Incorporated Systems and methods for voice exchange beacon devices
TW202232960A (zh) * 2021-02-03 2022-08-16 圓剛科技股份有限公司 網路資訊傳輸方法及網路資訊傳輸系統
WO2022178150A1 (en) * 2021-02-22 2022-08-25 View, Inc. Behavior recognition in an enclosure
CN114339127A (zh) * 2021-12-29 2022-04-12 北京德为智慧科技有限公司 一种智能会议控制方法及其系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711145B2 (en) * 2006-01-27 2010-05-04 Eastman Kodak Company Finding images with multiple people or objects
CN102638359A (zh) * 2012-04-10 2012-08-15 苏州阔地网络科技有限公司 一种视频会议来宾邀请方法及系统
CN104767963A (zh) * 2015-03-27 2015-07-08 华为技术有限公司 视频会议中的与会人信息呈现方法和装置
CN105956552A (zh) * 2016-04-29 2016-09-21 中国人民解放军国防科学技术大学 一种人脸黑名单监测方法
CN106657865A (zh) * 2016-12-16 2017-05-10 联想(北京)有限公司 会议纪要的生成方法、装置及视频会议系统
CN107370981A (zh) * 2016-05-13 2017-11-21 中兴通讯股份有限公司 一种视频会议中参会人员的信息提示方法和装置

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1257073B (it) 1992-08-11 1996-01-05 Ist Trentino Di Cultura Sistema di riconoscimento, particolarmente per il riconoscimento di persone.
WO2006034135A2 (en) * 2004-09-17 2006-03-30 Proximex Adaptive multi-modal integrated biometric identification detection and surveillance system
US20090123035A1 (en) * 2007-11-13 2009-05-14 Cisco Technology, Inc. Automated Video Presence Detection
NO331287B1 (no) * 2008-12-15 2011-11-14 Cisco Systems Int Sarl Fremgangsmate og anordning for gjenkjenning av ansikter i en videostrom
US10122970B2 (en) * 2011-09-13 2018-11-06 Polycom, Inc. System and methods for automatic call initiation based on biometric data
US20130162752A1 (en) 2011-12-22 2013-06-27 Advanced Micro Devices, Inc. Audio and Video Teleconferencing Using Voiceprints and Face Prints
US9721086B2 (en) * 2013-03-15 2017-08-01 Advanced Elemental Technologies, Inc. Methods and systems for secure and reliable identity-based computing
US9282284B2 (en) * 2013-05-20 2016-03-08 Cisco Technology, Inc. Method and system for facial recognition for a videoconference
CN104639777A (zh) * 2013-11-14 2015-05-20 中兴通讯股份有限公司 一种会议控制方法、装置及会议系统
EP3140780B1 (en) * 2014-05-09 2020-11-04 Google LLC Systems and methods for discerning eye signals and continuous biometric identification
US20160104122A1 (en) * 2014-10-10 2016-04-14 Bank Of America Corporation Remote video conferencing system
CN104537351B (zh) * 2014-12-31 2017-11-03 深圳泰山体育科技股份有限公司 大数目人脸快速识别的方法和系统
CN106209725B (zh) * 2015-04-30 2019-11-15 中国电信股份有限公司 用于视频会议认证的方法、视频会议中心服务器和系统
CN105426723A (zh) 2015-11-20 2016-03-23 北京得意音通技术有限责任公司 基于声纹识别、人脸识别以及同步活体检测的身份认证方法及系统
US9633187B1 (en) * 2015-12-30 2017-04-25 Dmitry Kozko Self-photograph verification for communication and content access
US10200206B2 (en) * 2016-03-11 2019-02-05 Fuji Xerox Co., Ltd. Method and system for contextualizing and targeting inquiries in remote meetings
US9558523B1 (en) * 2016-03-23 2017-01-31 Global Tel* Link Corp. Secure nonscheduled video visitation system
CN106790054A (zh) 2016-12-20 2017-05-31 四川长虹电器股份有限公司 基于人脸识别和声纹识别的交互式认证系统及方法
US10671712B1 (en) * 2017-03-01 2020-06-02 United Services Automobile Association (Usaa) Virtual notarization using cryptographic techniques and biometric information
US20190190908A1 (en) * 2017-12-19 2019-06-20 Melo Inc. Systems and methods for automatic meeting management using identity database
US10423964B2 (en) * 2017-12-29 2019-09-24 Scott Kimmel User controlled event record system
US10979669B2 (en) * 2018-04-10 2021-04-13 Facebook, Inc. Automated cinematic decisions based on descriptive models

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711145B2 (en) * 2006-01-27 2010-05-04 Eastman Kodak Company Finding images with multiple people or objects
CN102638359A (zh) * 2012-04-10 2012-08-15 苏州阔地网络科技有限公司 一种视频会议来宾邀请方法及系统
CN104767963A (zh) * 2015-03-27 2015-07-08 华为技术有限公司 视频会议中的与会人信息呈现方法和装置
CN105956552A (zh) * 2016-04-29 2016-09-21 中国人民解放军国防科学技术大学 一种人脸黑名单监测方法
CN107370981A (zh) * 2016-05-13 2017-11-21 中兴通讯股份有限公司 一种视频会议中参会人员的信息提示方法和装置
CN106657865A (zh) * 2016-12-16 2017-05-10 联想(北京)有限公司 会议纪要的生成方法、装置及视频会议系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111223487A (zh) * 2019-12-31 2020-06-02 联想(北京)有限公司 一种信息处理方法及电子设备
WO2022062471A1 (zh) * 2020-09-25 2022-03-31 华为技术有限公司 一种音频数据的处理方法、设备和系统
CN113780985A (zh) * 2021-08-26 2021-12-10 广州云徙科技有限公司 基于敏捷管理的会议纪要方法、系统、装置及存储介质
CN113707150A (zh) * 2021-11-01 2021-11-26 深圳云集智能信息有限公司 一种语音识别处理视频会议系统及方法

Also Published As

Publication number Publication date
US11914691B2 (en) 2024-02-27
EP3731519A4 (en) 2020-10-28
EP3731519B1 (en) 2023-10-25
WO2019137147A1 (zh) 2019-07-18
US20200342084A1 (en) 2020-10-29
EP3731519A1 (en) 2020-10-28
CN110022454B (zh) 2021-02-23

Similar Documents

Publication Publication Date Title
CN110022454A (zh) 一种在视频会议中识别身份的方法及相关设备
US20200228358A1 (en) Coordinated intelligent multi-party conferencing
US11580501B2 (en) Automatic detection and analytics using sensors
JP7222965B2 (ja) コンピュータによって実現される会議予約方法、装置、機器及び媒体
KR101528086B1 (ko) 회의 정보를 제공하는 시스템 및 방법
CN111258528B (zh) 语音用户界面的显示方法和会议终端
CN110232925A (zh) 生成会议记录的方法、装置和会议终端
US20140118472A1 (en) Active Speaker Indicator for Conference Participants
US20120259924A1 (en) Method and apparatus for providing summary information in a live media session
CN109872177A (zh) 流程处理方法、装置、计算机设备及计算机可读存储介质
CN109658040A (zh) 会议管理的方法、装置、设备及计算机存储介质
US20150302363A1 (en) Meeting Scheduling Method, Device, and System
US20230092618A1 (en) Videoconferencing Using Hybrid Edge-Cloud Inference with Machine-Learned Systems
CN113259138B (zh) 一种会议事件触发与通知的方法、系统和可读存储介质
CN106384058B (zh) 发布图片的方法和装置
CN105893562A (zh) 会话消息处理方法、装置及终端
CN112003778B (zh) 消息处理方法、装置、设备和计算机存储介质
CN104540035B (zh) 一种无障碍视频手语呼叫系统及方法
CN114227702A (zh) 一种基于机器人的会议智能指引方法、装置和机器人
CN112926513A (zh) 会议签到的方法、装置、电子设备和存储介质
CN106843882B (zh) 一种信息处理方法、装置及信息处理系统
CN105376143B (zh) 一种识别发送者身份的方法及装置
CN111028837B (zh) 语音会话方法、语音识别系统及计算机存储介质
WO2021171451A1 (ja) サーバ装置、会議支援システム、会議支援方法及びプログラム
US20180240077A1 (en) System and method for predicting presence of people in meetings

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant