CN116072124A - 用户身份识别方法、存储介质及电子装置 - Google Patents
用户身份识别方法、存储介质及电子装置 Download PDFInfo
- Publication number
- CN116072124A CN116072124A CN202310087436.8A CN202310087436A CN116072124A CN 116072124 A CN116072124 A CN 116072124A CN 202310087436 A CN202310087436 A CN 202310087436A CN 116072124 A CN116072124 A CN 116072124A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- user identification
- identification information
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000004590 computer program Methods 0.000 claims description 11
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000036578 sleeping time Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/14—Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种用户身份识别方法、存储介质及电子装置,涉及智慧家庭技术领域,通过将用户语音数据输入语音声纹识别模型,得到语音识别信息,实现对用户语音数据进行语音方面的识别,为用户身份识别提供参考信息。在根据所述语音识别信息无法确定目标用户标识信息的情况下,将预存的用户画像信息、设备信息、近期对话信息、用户组信息以及语音识别信息中的一种或几种信息的组合,输入用户身份识别模型,实现基于多个维度的信息对用户身份进行识别,最终确定目标用户标识信息,提高了用户身份识别的准确性。
Description
技术领域
本申请涉及智慧家庭技术领域,尤其涉及一种用户身份识别方法、存储介质及电子装置。
背景技术
在智慧家庭领域,语音对话系统已成为必备。在用户进行跨设备多轮对话时,准确识别用户身份是所有交互的基础保障。现有技术中,仅依靠语音声纹特征进行身份识别的正确率较低,特别是当有背景声音干扰、用户说话不清等问题造成身份识别错误率高,导致跨设备的多轮对话失效,用户体验较差。
因此,提出一种身份识别方法,以实现准确的用户身份识别是当前重要研究方向。
发明内容
本申请提供一种用户身份识别方法、存储介质及电子装置,用以解决现有技术中身份识别错误率高的缺陷,实现准确的用户身份识别。
本申请提供一种用户身份识别方法,包括:
获取用户语音数据;
将所述用户语音数据输入语音声纹识别模型,得到语音识别信息;
在根据所述语音识别信息无法确定目标用户标识信息的情况下,将预存的用户画像信息、设备信息、近期对话信息、用户组信息以及所述语音识别信息中的一种或几种信息的组合,输入用户身份识别模型,确定目标用户标识信息。
根据本申请提供的一种用户身份识别方法,所述语音识别信息包括当前用户为待定用户的置信度、当前用户性别信息和当前用户年龄信息中的一种或几种信息的集合;
所述根据所述将所述用户语音数据输入语音声纹识别模型,得到语音识别信息,包括:
将所述用户语音数据输入语音声纹识别模型,输出当前用户为待定用户的置信度、当前用户性别信息和当前用户年龄信息中的一种或者几种信息的集合。
根据本申请提供的一种用户身份识别方法,所述方法还包括:
在所述置信度大于置信度阈值的情况下,确定所述待定用户对应的用户标识信息确定为目标用户标识信息。
根据本申请提供的一种用户身份识别方法,所述语音识别信息包括当前用户为待定用户的置信度、当前用户性别信息和当前用户年龄信息;
所述将预存的用户画像信息、设备信息、近期对话信息、用户组信息以及所述语音识别信息中的一种或几种信息的组合,输入用户身份识别模型,确定目标用户标识信息,包括:
通过所述用户身份识别模型根据所述用户画像信息、所述置信度、所述当前用户性别信息和所述当前用户年龄信息,在与所述用户画像信息对应的预设用户数据库中进行相似度匹配,确定初始用户标识信息,所述初始用户标识信息为相似度大于相似度阈值的用户标识信息;
根据所述初始用户标识信息确定目标用户标识信息。
根据本申请提供的一种用户身份识别方法,所述确定初始用户标识信息之后,方法还包括:
根据所述近期对话信息确定近期用户标识信息;
根据所述近期用户标识信息对所述初始用户标识信息进行纠正,确定目标用户标识信息。
根据本申请提供的一种用户身份识别方法,所述近期用户标识信息包括时间信息;
所述根据所述近期用户标识信息对所述初始用户标识信息进行纠正,确定目标用户标识信息,包括:
根据所述时间信息,在所述近期用户标识信息中,确定预设时段内的多个候选用户标识信息;
在所述多个候选用户标识信息一致的情况下,将所述候选用户标识信息确定为所述目标用户标识信息。
根据本申请提供的一种用户身份识别方法,所述方法还包括:
在无法确定所述初始用户标识信息的情况下,根据所述设备信息和所述用户组信息生成临时用户标识信息,将所述临时用户标识信息确定为目标用户标识信息。
本申请还提供一种用户身份识别装置,包括:
获取模块,用于获取用户语音数据;
语音识别模块,用于将所述用户语音数据输入语音声纹识别模型,得到语音识别信息;
用户身份识别模块,用于在根据所述语音识别信息无法确定目标用户标识信息的情况下,将预存的用户画像信息、设备信息、近期对话信息、用户组信息以及所述语音识别信息,输入用户身份识别模型,确定目标用户标识信息。
本申请还提供一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行实现如上述任一种所述用户身份识别方法。
本申请还提供一种计算机可读的存储介质,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行实现如上述任一种所述用户身份识别方法。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述用户身份识别方法。
本申请提供的用户身份识别方法、存储介质及电子装置,通过将用户语音数据输入语音声纹识别模型,得到语音识别信息,实现对用户语音数据进行语音方面的识别,为用户身份识别提供参考信息。在根据所述语音识别信息无法确定目标用户标识信息的情况下,将预存的用户画像信息、设备信息、近期对话信息、用户组信息以及语音识别信息,输入用户身份识别模型,实现基于多个维度的信息对用户身份进行识别,最终确定目标用户标识信息,提高了用户身份识别的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的一种用户身份识别方法的硬件环境示意图;
图2是本申请提供的用户身份识别方法的流程示意图;
图3是本申请提供的用户身份识别流程的示意图;
图4是本申请提供的用户身份识别装置的结构示意图;
图5是本申请提供的电子装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一个方面,提供了一种用户身份识别方法。该用户身份识别方法广泛应用于智慧家庭(Smart Home)、智能家居、智能家用设备生态、智慧住宅(Intelligence House)生态等全屋智能数字化控制应用场景。可选地,在本实施例中,上述用户身份识别方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端设备102进行连接,可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务,可在服务器上或独立于服务器配置云计算和/或边缘计算服务,用于为服务器104提供数据运算服务。
上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:WIFI(Wireless Fidelity,无线保真),蓝牙。终端设备102可以并不限定于为PC、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。
本申请提供一种用户身份识别方法,如图2所示,包括:
S21、获取用户语音数据;
S22、将所述用户语音数据输入语音声纹识别模型,得到语音识别信息;
S23、在根据所述语音识别信息无法确定目标用户标识信息的情况下,将预存的用户画像信息、设备信息、近期对话信息、用户组信息中的一种或几种信息的组合以及所述语音识别信息,输入用户身份识别模型,确定目标用户标识信息。
具体地,通过语音声纹识别模型,可以对用户语音数据中的声纹进行识别,得到语音识别信息,用于表示语音中用户的部分基础信息,包括但不限于用户语音中用户的身份对应用户数据库中目标用户的置信度、用户语音中用户的性别和年龄等信息。
可选的,可以根据所述语音识别信息尝试确定目标用户标识信息,在根据语音识别信息无法确定目标用户标识信息的情况下,可以调用已经提前录入保存的用户画像信息、设备信息、近期对话信息、用户组信息,以及之前确定的语音识别信息,输入用户身份识别模型,确定目标用户标识信息。
用户画像信息可以为根据用户的历史对话记录以及历史行为记录等给用户定义的标签类信息,比如兴趣爱好,饮食偏好,起床睡觉时间等行为习惯的标签信息,也可以为用户的性别和年龄等信息。
设备信息可以为当前获取用户语音数据的设备的相关参数,包括但不限于设备ID、设备名称和设备型号等信息。
近期对话信息,可以为预设轮次或者预设时间段内的对话记录信息,包括但不限于对话内容所属领域、对话的意图以及对话的时间等信息。
用户组信息可以为预设的多个用户的关联信息,如表示以家庭为单位注册的多个用户的信息。
本申请实施例中,通过将用户语音数据输入语音声纹识别模型,得到语音识别信息,实现对用户语音数据进行语音方面的识别,为用户身份识别提供参考信息;在根据所述语音识别信息无法确定目标用户标识信息的情况下,根据预存的用户画像信息、设备信息、近期对话信息、用户组信息以及语音识别信息中的一种或几种信息的组合,输入用户身份识别模型,实现基于多个维度的信息对用户身份进行识别,最终确定目标用户标识信息,提高了用户身份识别的准确性。
根据本申请提供的用户身份识别方法,语音识别信息包括当前用户为目标用户的置信度、所述用户性别信息和当前用户年龄信息中的一种或者几种信息的集合;步骤S22包括:
S221、将所述用户语音数据输入语音声纹识别模型,输出当前用户为目标用户的置信度、当前用户性别信息和当前用户年龄信息中的一种或者几种信息的集合。
具体地,可以通过语音声纹识别模型对用户语音数据进行解析,确定语音中的当前用户为预设的用户数据库中待定用户的置信度,以及当前用户的性别信息和年龄信息。通过置信度表示当前用户与待定用户的重合程度,置信度越高即表示当前用户的身份越接近目标用户的身份。
本申请实施例中,通过语音声纹识别模型对用户语音数据进行解析,得到置信度、当前用户性别信息和当前用户年龄信息中的一种或者几种信息的集合。通过置信度表示当前用户与待定用户的身份重合程度,通过置信度、当前用户性别信息和当前用户年龄信息,可以生动的描述当前用户的特点及画像,便于后续进行准确的用户身份识别。
根据本申请提供的用户身份识别方法,所述方法还包括:
S24、在所述置信度大于置信度阈值的情况下,确定所述待定用户对应的用户标识信息确定为目标用户标识信息。
具体地,通过置信度描述当前用户与用户数据库中各个待定用户的身份重合程度,置信度越高表示当前用户的身份与待定用户的身份越相近。可以根据实际需要设定置信度阈值,在置信度高于置信度阈值的情况下,可以判断当前用户的身份就是该置信度对应的待定用户的身份,将该待定用户对应的用户标识信息确定为目标用户标识信息。
一个示例中,设定置信度阈值为90%,将用户语音数据输入语音声纹识别模型后,输出语音中的当前用户为待定用户A的置信度为95%,为待定用户B的置信度为20%,表示语音中的当前用户有95%的概率为待定用户A,有20%的概率为待定用户B。由于当前用户为待定用户A的置信度为95%,大于设定的置信度阈值90%,可以将待定用户A对应的用户标识信息确定为目标用户标识信息,即表示将当前用户确定为待定用户A。
本申请实施例中,通过置信度阈值描述当前用户与待定用户的身份重合程度,设定置信度阈值,在置信度大于置信度阈值的情况下,可以直接确定当前用户的身份为该置信度对应的待定用户的身份,将该待定用户对应的标识信息确定为目标用户标识信息,实现快速地用户身份识别。
根据本申请提供的用户身份识别方法,所述语音识别信息包括当前用户为待定用户的置信度、当前用户性别信息和当前用户年龄信息;步骤S23包括:
S231、通过所述用户身份识别模型根据所述用户画像信息、所述置信度、所述当前用户性别信息和所述当前用户年龄信息,在与所述用户画像信息对应的预设用户数据库中进行相似度匹配,确定初始用户标识信息,所述初始用户标识信息为相似度大于相似度阈值的用户标识信息;
S232、将所述初始用户标识信息确定为目标用户标识信息。
具体地,可以通过置信度、当前用户性别信息和当前用户年龄信息表示当前用户的用户画像。预设用户数据库中的用户标识信息对应有预存的用户画像信息。通过预存的用户画像信息和通过置信度、当前用户性别信息和当前用户年龄信息表示当前用户的用户画像,在预设用户数据库中进行相似度匹配,计算与用户数据库中每个用户标识信息对应的相似度,将相似度大于相似度阈值的用户标识信息确定为初始用户标识信息,将初始用户标识信息确定为目标用户标识信息。
本申请实施例中,根据用户画像信息、置信度、当前用户性别信息、当前用户年龄信息,在预设用户数据库中进行相似度匹配,确定初始用户标识信息,实现对当前用户身份的初步识别。为提高识别的准确性,通过近期对话信息对初步识别结果进行验证,进而确定目标用户标识信息,提升用户身份识别的准确性。
根据本申请提供的一种用户身份识别方法,步骤S231之后,方法还包括:
S233、根据所述近期对话信息确定近期用户标识信息;
S234、根据所述近期用户标识信息对所述初始用户标识信息进行纠正,确定目标用户标识信息。
具体地,根据初始用户标识信息和近期对话信息,可以进一步从近期对话的角度对初始用户标识信息进行验证,确定目标用户标识信息。根据近期对话信息可以确定近期对话中对应的用户标识信息,通过近期用户标识信息对初始用户标识信息进行纠正,得到准确的目标用户标识。
进一步的,近期用户标识信息包括时间信息,步骤S234包括:
S235、根据所述时间信息,在所述近期用户标识信息中,确定预设时段内的多个候选用户标识信息;
S236、在所述多个候选用户标识信息一致的情况下,将所述候选用户标识信息确定为所述目标用户标识信息。
具体地,一个示例中,提前设定了预设时段为当前时刻的前10秒内这一时段,假设近期对话信息包括了在最近15秒内每3秒1轮的5轮对话涉及的信息,根据近期对话信息确定了最近15秒内5轮对话对应的近期用户标识信息由时间先后确定为A-B-B-B-B,则预设时段内的多个候选用户标识信息为靠后3个B-B-B,多个候选用户标识信息一致,可以理解为在最近一段时间(预设时段)均是B在对话,当前时刻的目标用户标识信息最有可能为B。若本次确定的初始用户标识信息为B,与候选用户标识信息一致无需纠正,则直接将B确定为目标用户标识信息。若本次确定的初始用户标识信息为A,则使用候选用户标识信息B替换掉初始用户标识信息A,将B确定为目标用户标识信息,实现基于近期对话信息对用户标识信息进行纠正,提升识别准确性。
本申请实施例中,为提高识别的准确性,通过近期对话信息中的时间信息,在近期用户标识信息中确定短期内的多个候选用户标识,在短期多个候选用户标识信息一致的情况下,可以判定本次识别存在偏差错误,对本次识别结果进行纠正,将最贴合实际场景的候选用户标识信息确定为目标用户标识信息,实现对初步识别结果进行纠正。
根据本申请提供的一种用户身份识别方法,所述方法还包括:
S237、在无法确定初始用户标识信息的情况下,根据所述设备信息和所述用户组信息生成临时用户标识信息,将所述临时用户标识信息确定为目标用户标识信息。
具体地,在计算与用户数据库中每个用户标识信息对应的相似度时,若没有相似度大于相似度阈值的用户标识信息,即无法确定初始用户标识信息的情况下,可以根据设备信息和用户组信息生成临时用户标识信息,将临时用户标识信息确定为目标用户标识信息。例如,将设备ID+用户组ID形成新的ID,作为目标用户标识信息。
本申请实施例中,在无法根据确定初始用户标识信息,对当前用户身份进行初步识别,可以通过设备信息和用户组信息生成临时用户标识信息作为目标用户标识信息,实现临时用户身份的建立,使得用户身份识别更加完备。
基于上述各实施例的一个示例中,如图3所示,根据用户语音数据进行语音声纹身份识别,在置信度大于置信度阈值时,可以直接识别目标用户标识信息;否则不能直接识别目标用户标识信息的情况下,基于语音识别信息、用户画像信息、设备信息、近期对话信息和用户组信息,进行用户身份识别,确定目标用户标识信息。
下面对本申请提供的用户身份识别装置进行描述,下文描述的用户身份识别装置与上文描述的用户身份识别方法可相互对应参照。
本申请还提供一种用户身份识别装置,如图4所示,包括:
获取模块41,用于获取用户语音数据;
语音识别模块42,用于将所述用户语音数据输入语音声纹识别模型,得到语音识别信息;
用户身份识别模块43,用于在根据所述语音识别信息无法确定目标用户标识信息的情况下,将预存的用户画像信息、设备信息、近期对话信息、用户组信息中的一种或几种信息的组合以及所述语音识别信息,输入用户身份识别模型,确定目标用户标识信息。
本申请实施例中,通过将用户语音数据输入语音声纹识别模型,得到语音识别信息,实现对用户语音数据进行语音方面的识别,为用户身份识别提供参考信息;在根据所述语音识别信息无法确定目标用户标识信息的情况下,根据预存的用户画像信息、设备信息、近期对话信息、用户组信息中的一种或几种信息的组合以及语音识别信息,输入用户身份识别模型,实现基于多个维度的信息对用户身份进行识别,最终确定目标用户标识信息,提高了用户身份识别的准确性。
根据本申请提供的用户身份识别装置,所述语音识别信息包括当前用户为待定用户的置信度、当前用户性别信息和当前用户年龄信息中的一种或者几种信息的集合;
所述语音识别模块42具体用于:将所述用户语音数据输入语音声纹识别模型,输出当前用户为待定用户的置信度、当前用户性别信息和当前用户年龄信息中的一种或者几种信息的集合。
根据本申请提供的用户身份识别装置,所述用户身份识别模块43还用于:在所述置信度大于置信度阈值的情况下,确定所述目标用户对应的用户标识信息确定为目标用户标识信息。
根据本申请提供的用户身份识别装置,所述语音识别信息包括当前用户为待定用户的置信度、当前用户性别信息和当前用户年龄信息;所述用户身份识别单元43,具体用于:
通过所述用户身份识别模型根据所述用户画像信息、所述置信度、所述当前用户性别信息和所述当前用户年龄信息,在与所述用户画像信息对应的预设用户数据库中进行相似度匹配,确定初始用户标识信息,所述初始用户标识信息为相似度大于相似度阈值的用户标识信息;
将所述初始用户标识信息确定为目标用户标识信息。
根据本申请提供的用户身份识别装置,所述用户身份识别单元43,还用于:
根据所述近期对话信息确定近期用户标识信息;
根据所述近期用户标识信息对所述初始用户标识信息进行纠正,确定目标用户标识信息。
根据本申请提供的用户身份识别装置,所述近期用户标识信息包括时间信息;
所述用户身份识别单元43,具体用于:
根据所述时间信息,在所述近期用户标识信息中,确定预设时段内的多个候选用户标识信息;
在所述多个候选用户标识信息一致的情况下,将所述候选用户标识信息确定为所述目标用户标识信息。
根据本申请提供的用户身份识别装置,所述用户身份识别单元43,还用于:
在无法确定所述初始用户标识信息的情况下,根据所述设备信息和所述用户组信息生成临时用户标识信息,将所述临时用户标识信息确定为目标用户标识信息。
图5示例了一种电子装置的实体结构示意图,如图5所示,该电子装置可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行用户身份识别方法,该方法包括:获取用户语音数据;将所述用户语音数据输入语音声纹识别模型,得到语音识别信息;在根据所述语音识别信息无法确定目标用户标识信息的情况下,将预存的用户画像信息、设备信息、近期对话信息、用户组信息中的一种或几种信息的组合以及所述语音识别信息,输入用户身份识别模型,确定目标用户标识信息。
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本申请还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在计算机可读的存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的用户身份识别方法,该方法包括:获取用户语音数据;将所述用户语音数据输入语音声纹识别模型,得到语音识别信息;在根据所述语音识别信息无法确定目标用户标识信息的情况下,将预存的用户画像信息、设备信息、近期对话信息、用户组信息中的一种或几种信息的组合以及所述语音识别信息,输入用户身份识别模型,确定目标用户标识信息。
又一方面,本申请还提供一种计算机可读的存储介质,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行上述各方法提供的用户身份识别方法,该方法包括:获取用户语音数据;将所述用户语音数据输入语音声纹识别模型,得到语音识别信息;在根据所述语音识别信息无法确定目标用户标识信息的情况下,将预存的用户画像信息、设备信息、近期对话信息、用户组信息中的一种或几种信息的组合以及所述语音识别信息,输入用户身份识别模型,确定目标用户标识信息。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种用户身份识别方法,其特征在于,包括:
获取用户语音数据;
将所述用户语音数据输入语音声纹识别模型,得到语音识别信息;
在根据所述语音识别信息无法确定目标用户标识信息的情况下,将预存的用户画像信息、设备信息、近期对话信息、用户组信息中的一种或几种信息的组合以及所述语音识别信息,输入用户身份识别模型,确定目标用户标识信息。
2.根据权利要求1所述的用户身份识别方法,其特征在于,所述语音识别信息包括当前用户为待定用户的置信度、当前用户性别信息和当前用户年龄信息中的一种或者几种信息的集合;
所述根据所述将所述用户语音数据输入语音声纹识别模型,得到语音识别信息,包括:
将所述用户语音数据输入语音声纹识别模型,输出当前用户为待定用户的置信度、当前用户性别信息和当前用户年龄信息中的一种或者几种信息的集合。
3.根据权利要求2所述的用户身份识别方法,其特征在于,所述方法还包括:
在所述置信度大于置信度阈值的情况下,确定所述待定用户对应的用户标识信息确定为目标用户标识信息。
4.根据权利要求1所述的用户身份识别方法,其特征在于,所述语音识别信息包括当前用户为待定用户的置信度、当前用户性别信息和当前用户年龄信息;
所述将预存的用户画像信息、设备信息、近期对话信息、用户组信息中的一种或几种信息的组合以及所述语音识别信息,输入用户身份识别模型,确定目标用户标识信息,包括:
通过所述用户身份识别模型根据所述用户画像信息、所述置信度、所述当前用户性别信息和所述当前用户年龄信息,在与所述用户画像信息对应的预设用户数据库中进行相似度匹配,确定初始用户标识信息,所述初始用户标识信息为相似度大于相似度阈值的用户标识信息;
将所述初始用户标识信息确定为目标用户标识信息。
5.根据权利要求4所述的用户身份识别方法,其特征在于,所述确定初始用户标识信息之后,所述方法还包括:
根据所述近期对话信息确定近期用户标识信息;
根据所述近期用户标识信息对所述初始用户标识信息进行纠正,确定目标用户标识信息。
6.根据权利要求5所述的用户身份识别方法,其特征在于,所述近期用户标识信息包括时间信息;
所述根据所述近期用户标识信息对所述初始用户标识信息进行纠正,确定目标用户标识信息,包括:
根据所述时间信息,在所述近期用户标识信息中,确定预设时段内的多个候选用户标识信息;
在所述多个候选用户标识信息一致的情况下,将所述候选用户标识信息确定为所述目标用户标识信息。
7.根据权利要求4所述的用户身份识别方法,其特征在于,所述方法还包括:
在无法确定所述初始用户标识信息的情况下,根据所述设备信息和所述用户组信息生成临时用户标识信息,将所述临时用户标识信息确定为目标用户标识信息。
8.一种用户身份识别装置,其特征在于,包括:
获取模块,用于获取用户语音数据;
语音识别模块,用于将所述用户语音数据输入语音声纹识别模型,得到语音识别信息;
用户身份识别模块,用于在根据所述语音识别信息无法确定目标用户标识信息的情况下,将预存的用户画像信息、设备信息、近期对话信息、用户组信息中的一种或几种信息的组合以及所述语音识别信息,输入用户身份识别模型,确定目标用户标识信息。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行权利要求1至4中任一项所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310087436.8A CN116072124A (zh) | 2023-01-30 | 2023-01-30 | 用户身份识别方法、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310087436.8A CN116072124A (zh) | 2023-01-30 | 2023-01-30 | 用户身份识别方法、存储介质及电子装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116072124A true CN116072124A (zh) | 2023-05-05 |
Family
ID=86174682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310087436.8A Pending CN116072124A (zh) | 2023-01-30 | 2023-01-30 | 用户身份识别方法、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116072124A (zh) |
-
2023
- 2023-01-30 CN CN202310087436.8A patent/CN116072124A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7041323B2 (ja) | スマートプラグの動作のシステムおよび方法 | |
CN113485144B (zh) | 基于物联网的智能家居控制方法及系统 | |
CN114253147A (zh) | 智能设备控制方法、装置、电子设备和存储介质 | |
CN116072124A (zh) | 用户身份识别方法、存储介质及电子装置 | |
CN114915514B (zh) | 意图的处理方法和装置、存储介质及电子装置 | |
CN115877726A (zh) | 智能家居设备的控制方法、计算机设备及存储介质 | |
CN113703337B (zh) | 一种基于物联网的家电设备控制方法、系统及存储介质 | |
CN115268282A (zh) | 家电设备的控制方法、装置、存储介质及电子装置 | |
CN114861678A (zh) | 时间信息的确定方法和装置、存储介质及电子装置 | |
CN115148204B (zh) | 语音唤醒的处理方法及装置、存储介质及电子装置 | |
CN117524200A (zh) | 唤醒模型迭代方法、装置、存储介质及电子装置 | |
CN117672189A (zh) | 语音增强模型的训练方法及装置、存储介质及电子装置 | |
CN117575619A (zh) | 售后服务时间的确定方法、装置及存储介质 | |
CN117524231A (zh) | 语音辨人方法、语音交互方法及装置 | |
CN117912492A (zh) | 一种设备拒识率的评估方法和装置 | |
CN116932926B (zh) | 应用于智能家居控制的数据分析方法及系统 | |
CN116386597A (zh) | 方言识别模型的构建方法和装置、存储介质及电子装置 | |
CN118112959A (zh) | 一种电器控制方法、装置、存储介质及电子装置 | |
CN118113887A (zh) | 基于多模态数据的烹饪辅助方法、存储介质及电子装置 | |
CN116612763A (zh) | 声纹注册方法、存储介质及电子装置 | |
CN116312624A (zh) | 基于声纹识别的测试方法、系统、存储介质及电子装置 | |
CN118259598A (zh) | 家电控制方法、存储介质及电子装置 | |
CN116600172A (zh) | 视频播放方法、装置、存储介质及电子装置 | |
CN116483961A (zh) | 对话模型的训练方法、装置和存储介质及电子设备 | |
CN116545791A (zh) | 参数调整方法及装置、存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |