CN108922547B - 身份的识别方法、装置及电子设备 - Google Patents
身份的识别方法、装置及电子设备 Download PDFInfo
- Publication number
- CN108922547B CN108922547B CN201810502697.0A CN201810502697A CN108922547B CN 108922547 B CN108922547 B CN 108922547B CN 201810502697 A CN201810502697 A CN 201810502697A CN 108922547 B CN108922547 B CN 108922547B
- Authority
- CN
- China
- Prior art keywords
- identity information
- voice
- user identity
- user
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000004891 communication Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 230000008569 process Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/32—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
- H04L9/3226—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using a predetermined code, e.g. password, passphrase or PIN
- H04L9/3231—Biological data, e.g. fingerprint, voice or retina
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Human Computer Interaction (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Health & Medical Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明实施例公开一种身份的识别方法、装置及电子设备,涉及终端应用技术领域,主要目的在于有效利用收集到的用户音频信息,提高用户身份识别的准确率。本发明实施例公开的实施例的技术方案包括:在接收到对智能设备的语音启动指令时,对所述语音启动指令进行声音识别,得到所述语音启动指令对应的第一用户身份信息;在接收到语音搜索指令时,对所述语音搜索指令进行声音识别,得到所述语音搜索指令对应的第二用户身份信息;对比所述第一用户身份信息及所述第二用户身份信息分别对应的加权结果,根据比对结果确定最终用户身份信息。
Description
技术领域
本发明实施例涉及终端应用技术领域,特别是涉及一种身份的识别方法、装置及电子设备。
背景技术
随着智能硬件及智能语音搜索技术的迅速发展,智能识别方式已成为现代智能设备的发展方向。例如,智能设备在使用过程中,通过利用声音信息特征控制智能识别,以增加智能设备使用者的用户体验。
目前,智能设备的正常使用过程中,是使用用户所说的固定唤醒词作为说话人识别的输入音频,进行说话人识别,识别成功后可执行智能设备的启动。发明人在实现上述发明过程中,发现现有技术中,大部分热词唤醒的唤醒词都比较短,智能设备所获取的音频信息不够长,对用户的身份识别的错误率较高。同时,智能设备只是针对固定唤醒词作为识别的输入音频进行识别,执行智能设备启动的,但无法对智能设备使用过程进行实时识别。如此一来,由于对说话人声音识别的准确率不够,有可能造成用户身份的验证失误,导致智能设备的信息泄露,对用户的信息及财产产生威胁。
因此,如何有效利用收集到的用户音频信息,提高说话人识别的准确率成为本领域技术人员亟需解决的技术问题。
发明内容
有鉴于此,本发明实施例提供的一种身份的识别方法、装置及电子设备主要目的在于有效利用收集到的用户音频信息,提高用户身份识别的准确率。
为了解决上述问题,本发明实施例主要提供如下技术方案:
第一方面,本发明实施例提供一种身份的识别方法,包括:
在接收到对智能设备的语音启动指令时,对所述语音启动指令进行声音识别,得到所述语音启动指令对应的第一用户身份信息;
在接收到语音搜索指令时,对所述语音搜索指令进行声音识别,得到所述语音搜索指令对应的第二用户身份信息;
对比所述第一用户身份信息及所述第二用户身份信息对应的加权结果,根据比对结果确定最终用户身份信息。
可选的,所述身份的识别方法还包括:
使用所述第一用户身份信息及所述第二用户身份信息进行注册,以获得对所述智能设备的使用权限。
可选的,所述方法还包括:
获取所述最终用户身份信息对应的历史搜索记录;
根据所述历史搜索记录向所述最终用户身份信息进行智能推送。
可选的,所述方法还包括:
设置所述第一用户身份信息及所述第二用户身份信息的权重。
第二方面,本发明实施例还提供一种身份的识别装置,该装置包括:
第一识别单元,用于在接收到对智能设备的语音启动指令时,对所述语音启动指令进行声音识别,得到所述语音启动指令对应的第一用户身份信息;
第二识别单元,用于在接收到语音搜索指令时,对所述语音搜索指令进行声音识别,得到所述语音搜索指令对应的第二用户身份信息;
对比单元,用于对比所述第一识别单元识别的第一用户身份信息及所述第二识别单元识别的第二用户身份信息对应的加权结果;
确定单元,用于对所述对比单元获得的比对结果确定最终用户身份信息。
可选的,所述装置还包括:
注册单元,用于对所述第一识别单元识别的第一用户身份信息及所述第二识别单元识别的第二用户身份信息进行注册,以获得对所述智能设备的使用权限。
可选的,所述装置还包括:
获取单元,用于获取所述确定单元确定的最终用户身份信息对应的历史搜索记录;
推送单元,用于根据所述获取单元获得的历史搜索记录向所述最终用户身份信息进行智能推送。
可选的,所述装置还包括:
设置单元,用于设置所述第一识别单元识别的第一用户身份信息及所述第二识别单元识别的第二用户身份信息的权重。
第三方面,本发明实施例还提供一种电子设备,包括:
至少一个处理器;
以及与所述处理器连接的至少一个存储器、总线;其中,
所述处理器、存储器通过所述总线完成相互间的通信;
所述处理器用于调用所述存储器中的程序指令,以执行第一方面中任一项所述的身份的识别方法。
第四方面,本发明实施例还提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面中任一项所述的身份的识别方法。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本发明实施例提供的身份的识别方法、装置及电子设备,对所述语音启动指令及语音搜索指令进行识别,确定最终的用户身份信息;与现有技术中仅对较短的语音启动指令进行识别相比,本发明实施例采用语音启动指令及语音搜索指令相结合的方式,利用收集到的语音启动指令与语音搜索指令进行用户身份的识别,提高了用户身份识别的准确率。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明实施例的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明公开的实施例提供的一种身份的识别方法的流程图;
图2示出了本发明公开的实施例提供的另一种身份的识别方法的流程图;
图3示出了本发明公开的实施例提供的一种身份的识别装置的组成框图;
图4示出了本发明公开的实施例提供的另一种身份的识别装置的组成框图;
图5示出了本发明公开的实施例提供的一种电子设备的架构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一:
现有技术中智能设备的正常使用过程中,对说话人声音识别的准确率不够,造成用户身份的验证失误,导致智能设备的信息泄露,对用户的信息及财产产生威胁问题。
为了解决上述问题,本发明公开的实施例,能够在智能设备的使用过程中,更准确的识别用户身份的身份信息,本发明公开的实施例提供一种身份的识别方法,如图1所示,所述方法包括:
101、在接收到对智能设备的语音启动指令时,对所述语音启动指令进行声音识别,得到所述语音启动指令对应的第一用户身份信息。
在实际应用中,本发明公开的实施例所述的智能设备可以包括但不局限于以下内容,例如:智能音箱、智能电视、智能手机、电脑、汽车中控设备、收银台设备等等,具体的,本发明公开的实施例对电子设备的具体类型、型号等不做限定。
智能设备通过语音启动的方式执行启动,相比于采用输入密码或者手势指令的方式,更加便捷。在接收到语音启动指令后,根据语音启动指令执行智能设备的启动;同时,智能设备还根据语音启动指令,识别第一用户身份信息。从用户层面讲,用户通过语音唤醒词对智能设备进行唤醒,从机器层面讲,智能设备在通过录音设备接收到语音唤醒词之后,将其转换成语音启动指令,执行智能设备的启动。为了更好的识别用户身份信息,可以采用声学模型、语言模型等对语音启动指令进行第一用户身份信息的识别,其中,有关如何通过声学模型、语言模型实现对第一用户身份信息的识别过程,请参考现有技术中的具体实现方式。
102、在接收到语音搜索指令时,对所述语音搜索指令进行声音识别,得到所述语音搜索指令对应的第二用户身份信息。
现有技术中,智能设备通过语音启动指令执行正常启动后,需采用用户手动操作的方式执行内容的查找或者搜索,例如,一般为在搜索框中手动输入待查询内容;或者,通过文件夹的层级关系逐层进行查找,过程较为复杂。为解决上述问题,本发明实施例采用语音搜索的方式,实现对内容搜索的快捷性。智能设备在接收到语音搜索指令后,根据语音启动搜索执行内容的查找或者搜索;同时,智能设备还根据语音搜索指令,识别第二用户身份信息。从用户层面讲,用户通过语音搜索词对内容进行查找或者搜索,从机器层面讲,智能设备在通过录音设备接收到语音搜索词之后,将其转换成语音搜索指令,执行内容的查找或者搜索。为了更好的识别用户身份信息,可以采用声学模型、语言模型等对语音启动指令进行第二用户身份信息的识别,其中,有关如何通过声学模型、语言模型实现对第二用户身份信息的识别过程,请参考现有技术中的具体实现方式。
本发明公开的实施例中所述的第一用户身份信息及第二用户身份信息,两者的本质均为用户身份信息,采用第一、第二的说明方式进行区分通过不同指令所识别到的用户身份。其中,第一用户身份信息可能只包含一个用户身份信息,而第二用户身份信息是一个泛指概念,并不代表一个用户身份信息,可以是除了第一用户身份信息之外的任何一个或者多个用户身份信息。
103、对比所述第一用户身份信息及所述第二用户身份信息对应的加权结果,根据比对结果确定最终用户身份信息。
现有技术中,智能设备只通过语音启动指令进行身份识别的,识别的信息较短,容易产生失误。为解决上述问题,本发明实施例增加了对语音搜索指令的识别,增加了声音识别信息的长度,以提高用户身份识别的准确率;在具体实现过程中,用户在使用智能设备时,可以执行一次语音搜索,也可以执行多次语音搜索,如此一来,进一步增加了声音识别信息的长度,相对应的,在执行语音识别时,可以根据多次所述的语音搜索指令进行识别。根据设置的权重,得到每个用户身份信息对应的加权结果,计算过程可以包括但不局限于以下方式:加权平均值,其中如何进行具体算法,请参照现有技术中对加权平均值的计算方法,对比所述第一用户身份信息及所述第二用户身份信息对应的加权结果,最后确定最终的用户身份信息。
在具体实现过程中,语音启动方式与语音搜索方式分别设置不同的权值,当由同一用户执行语音启动和语音搜索时,识别出该用户身份信息(最终用户身份信息),当由不同用户执行语音启动和语音搜索时,确定的最终用户身份信息为加权平均结果相对较大的用户,例如,语音启动和语音搜索的权重分别为0.8和0.2,用户A执行一次语音启动,用户B执行一次语音搜索,可见用户A对应的加权结果大于用户B对应的加权结果,因此,确定最终用户身份信息为用户A。同样的,语音启动和语音搜索的权重分别为0.8和0.2,用户A执行语音启动,用户B执行了多次(此处的多次应大于等于五次)语音搜索,经计算可见用户B对应的加权结果大于用户A对应的加权结果,因此,确定最终用户身份信息为用户B。以上仅为了说明给出的举例,但是应当明确的是,该种说明方式并非对智能设备的使用人数和权重大小进行限定。
本发明公开的实施例提供的身份的识别方法,对所述语音启动指令及语音搜索指令进行识别,确定最终的用户身份信息;与现有技术中仅对较短的语音启动指令进行识别相比,本发明实施例采用语音启动指令及语音搜索指令相结合的方式,利用收集到的语音启动指令与语音搜索指令进行用户身份的识别,提高了用户身份识别的准确率。
实施例二:
作为对上述实施例的细化及扩展,在本发明公开的实施例中,对用户身份信息进行识别,除了能够确保智能设备的安全性之外,还通过最终用户身份信息实现智能化推送,例如,若智能设备为智能音箱,该推送内容可为歌曲、电子书等等。为了实现上述功能,本发明公开的实施例还提供一种身份的识别方法,如图2所示,所述方法包括:
201、使用所述第一用户身份信息及所述第二用户身份信息进行注册,以获得对所述智能设备的使用权限。
本发明公开的实施例中所述的身份信息注册,从用户层面讲,用户向智能设备发送包含身份信息的注册请求即可获取智能设备的使用权限,所述第一用户身份信息或第二用户身份信息包括身份证、电话、邮箱、社交账号等,从机器层面讲,智能设备在通过录音设备接收到声音信息,完成对身份信息的识别过程。
在身份信息注册成功之后,为了便于对声音的正确识别,需要录入第一用户及第二用户的声音,以便后续进行声音识别。示例性的,智能设备在通过录音设备接收到用户A录入的语音之后,将用户A的声音进行初步识别、存储。若用户A为智能设备的持有者,可以将用户A的声音设置为启动智能设备,那么,其他用户的声音则不具备语音启动智能设备的权限。此外,还可以接收用户B、用户C的声音录入,并为用户B、用户C的声音设置是否有启动或者搜索的权限。
202、在接收到对智能设备的语音启动指令时,对所述语音启动指令进行声音识别,得到所述语音启动指令对应的第一用户身份信息(同步骤101)。
在进行第一用户身份信息的识别时,可以采用声学模型、语言模型等方式对步骤201中所述设置为启动智能设备的声音信息进行第一用户身份信息的识别。
203、在接收到语音搜索指令时,对所述语音搜索指令进行声音识别,得到所述语音搜索指令对应的第二用户身份信息(同步骤102)。
智能设备在通过录音设备接收到语音搜索词之后,将其转换成语音搜索指令,执行内容的查找或者搜索,并同时执行第二用户身份信息的识别。
204、设置所述第一用户身份信息及所述第二用户身份信息的权重。
本发明公开的实施例中所述的设置权重,目的是比对用户身份信息对应的加权结果,确定最终的用户身份信息,增加身份识别的可靠性。
权值设置时,可以采用但不局限于以下两种实现方式:
方式一:固定设置,智能设备的语音启动指令的权重可设置为0.5、0.6、0.7等,相应的进行的语音搜索指令权重的可设置为0.5、0.4、0.3等,最终的设置可根据最终进行语音搜索指令的次数分配权重,但是需要明确的是,最终的权重加和为1。
方式二:动态设置,可根据智能设备的上次身份识别结果进行设置,将上次智能设备使用的权重设置为0.3等,智能设备的语音启动指令的权重设置为0.4,相应的进行的语音搜索指令的权重设置为0.3,最终的设置可根据最终进行语音搜索指令的次数分配权重,但是需要明确的是,最终的权重加和为1。
205、对比所述第一用户身份信息及所述第二用户身份信息对应的加权结果,根据比对结果确定最终用户身份信息(同步骤103)。
根据设置的权重计算每个用户声音信息的加权平均值,对比所述第一用户身份信息及所述第二用户身份信息对应的加权结果,最后确定最终的用户身份信息。
206、获取所述最终用户身份信息对应的历史搜索记录。
比对所得的每个用户的加权平均值,确定最终用户身份信息,用户通过语音搜索执行内容的查找或者搜索,智能设备会自动保存用户查找或者搜索的内容,以获取最终用户身份信息对应的历史搜索记录。获取历史搜索记录的主要目的在于获取该用户对哪些内容比较喜爱,可根据用户的喜好执行智能推送,提高用户体验。
207、根据所述历史搜索记录向所述最终用户身份信息进行智能推送。
智能设备可以根据执行的语音搜索指令内容,进行智能推送,用户不必每次对相同内容或者相关内容进行重复搜索或者查找,实现了对内容获取的快捷性,例如,用户爱好听中国文学,那么智能推送的内容可以为相关的中国文学。作为本发明实施例的另一种实现方式,若在连续天数内(如一周)确定智能设备的使用者均为同一人,智能推送内容也可以是根据上一次智能设备确定的最终用户身份信息以及对应的推送内容进行推送。
综上,用户可以通过注册过程,获得智能设备的使用权限,对于智能设备,可以通过语音识别算法实现用户身份信息的识别,对比计算所得身份信息的加权平均值,确定最终用户身份信息,保存用户的历史搜索记录,执行智能推送的操作,使内容的查找或者搜索更为便捷,提高用户体验。
实施例三:
进一步的,作为对上述图1及图2所示方法的实现,本发明公开的另一实施例还提供了一种身份的识别装置。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。
本发明公开的实施例提供了一种身份的识别装置,如图3所示,包括:
第一识别单元31,用于在接收到对智能设备的语音启动指令时,对所述语音启动指令进行声音识别,得到所述语音启动指令对应的第一用户身份信息;
第二识别单元32,用于在接收到语音搜索指令时,对所述语音搜索指令进行声音识别,得到所述语音搜索指令对应的第二用户身份信息;
对比单元33,用于对比所述第一识别单元31识别的第一用户身份信息及所述第二识别单元32识别的第二用户身份信息对应的权值;
确定单元34,用于对所述对比单元33获得的比对结果确定最终用户身份信息。
本发明公开的实施例提供的一种身份的识别装置,对所述语音启动指令及语音搜索指令进行识别,确定最终的用户身份信息;与现有技术中仅对较短的语音启动指令进行识别相比,本发明实施例采用语音启动指令及语音搜索指令相结合的方式,利用收集到的语音启动指令与语音搜索指令进行用户身份的识别,提高了用户身份识别的准确率。
进一步的,如图4所示,所述装置还包括:
注册单元35,用于对所述第一识别单元31识别的第一用户身份信息及所述第二识别单元32识别的第二用户身份信息进行注册,以获得对所述智能设备的使用权限。
进一步的,如图4所示,所述装置还包括:
获取单元36,用于获取所述确定单元34确定的最终用户身份信息对应的历史搜索记录;
推送单元37,用于根据所述获取单元42获得的历史搜索记录向所述最终用户身份信息进行智能推送。
进一步的,如图4所示,所述装置还包括:
设置单元38,用于设置所述第一识别单元31识别的第一用户身份信息及所述第二识别单元32识别的第二用户身份信息的权重。
综上,用户可以通过注册过程,获得智能设备的使用权限,对于设备,可以通过语音识别算法实现用户身份信息的识别,对比计算所得身份信息的加权平均值,确定最终用户身份信息,保存用户的历史搜索记录,执行智能推送的操作,使内容的查找或者搜索更为便捷,提高用户体验。
由于本实施例所介绍的身份的识别装置为可以执行本发明实施例中的身份的识别方法的装置,故而基于本发明实施例中所介绍的身份的识别方法,本领域所属技术人员能够了解本实施例的身份的识别装置的具体实施方式以及其各种变化形式,所以在此对于该身份的识别装置如何实现本发明实施例中的身份的识别方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中身份的识别方法所采用的装置,都属于本申请所欲保护的范围。
所述身份的识别装置包括处理器和存储器,上述第一识别单元、第二识别单元、对比单元和确定单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来有效利用收集到的用户的音频信息,提高用户身份识别的准确率。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述的身份的识别方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述身份的识别方法。
本发明实施例还提供一种电子设备,如图5所示,包括:
至少一个处理器41;
以及与所述处理器41连接的至少一个存储器42、总线43;其中,
所述处理器41、存储器42通过所述总线43完成相互间的通信;
所述处理器41用于调用所述存储器42中的程序指令,以执行以下步骤:
在接收到对智能设备的语音启动指令时,对所述语音启动指令进行声音识别,得到所述语音启动指令对应的第一用户身份信息;
在接收到语音搜索指令时,对所述语音搜索指令进行声音识别,得到所述语音搜索指令对应的第二用户身份信息;
对比所述第一用户身份信息及所述第二用户身份信息分别对应的加权结果,根据比对结果确定最终用户身份信息。
可选的,所述方法还包括:
使用所述第一用户身份信息及所述第二用户身份信息进行注册,以获得对所述智能设备的使用权限。
可选的,所述方法还包括:
获取所述最终用户身份信息对应的历史搜索记录;
根据所述历史搜索记录向所述最终用户身份信息进行智能推送。
可选的,所述方法还包括:
设置所述第一用户身份信息及所述第二用户身份信息的权重。
本文中的设备可以是智能音箱、智能电视、智能手机、电脑、汽车中控设备、收银台设备等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:
在接收到对智能设备的语音启动指令时,对所述语音启动指令进行声音识别,得到所述语音启动指令对应的第一用户身份信息;
在接收到语音搜索指令时,对所述语音搜索指令进行声音识别,得到所述语音搜索指令对应的第二用户身份信息;
对比所述第一用户身份信息及所述第二用户身份信息分别对应的加权结果,根据比对结果确定最终用户身份信息。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (8)
1.一种身份的识别方法,其特征在于,包括:
在接收到对智能设备的语音启动指令时,对所述语音启动指令进行声音识别,得到所述语音启动指令对应的第一用户身份信息;
在接收到语音搜索指令时,对所述语音搜索指令进行声音识别,得到所述语音搜索指令对应的第二用户身份信息;
对比所述第一用户身份信息及所述第二用户身份信息分别对应的加权结果,根据比对结果确定最终用户身份信息;
设置所述第一用户身份信息及所述第二用户身份信息的权重。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
使用所述第一用户身份信息及所述第二用户身份信息进行注册,以获得对所述智能设备的使用权限。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
获取所述最终用户身份信息对应的历史搜索记录;
根据所述历史搜索记录向所述最终用户身份信息进行智能推送。
4.一种身份的识别装置,其特征在于,包括:
第一识别单元,用于在接收到对智能设备的语音启动指令时,对所述语音启动指令进行声音识别,得到所述语音启动指令对应的第一用户身份信息;
第二识别单元,用于在接收到语音搜索指令时,对所述语音搜索指令进行声音识别,得到所述语音搜索指令对应的第二用户身份信息;
对比单元,用于对比所述第一识别单元识别的第一用户身份信息及所述第二识别单元识别的第二用户身份信息对应的加权结果;
确定单元,用于对所述对比单元获得的比对结果确定最终用户身份信息;
设置单元,用于设置所述第一识别单元识别的第一用户身份信息及所述第二识别单元识别的第二用户身份信息的权重。
5.根据权利要求4所述的装置,其特征在于,所述装置还包括:
注册单元,用于对所述第一识别单元识别的第一用户身份信息及所述第二识别单元识别的第二用户身份信息进行注册,以获得对所述智能设备的使用权限。
6.根据权利要求4或5所述的装置,其特征在于,所述装置还包括:
获取单元,用于获取所述确定单元确定的最终用户身份信息对应的历史搜索记录;
推送单元,用于根据所述获取单元获得的历史搜索记录向所述最终用户身份信息进行智能推送。
7.一种电子设备,其特征在于,包括:
至少一个处理器;
以及与所述处理器连接的至少一个存储器、总线;其中,
所述处理器、存储器通过所述总线完成相互间的通信;
所述处理器用于调用所述存储器中的程序指令,以执行权利要求1至权利要求3中任一项所述的身份的识别方法。
8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行权利要求1至权利要求3中任一项所述的身份的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810502697.0A CN108922547B (zh) | 2018-05-23 | 2018-05-23 | 身份的识别方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810502697.0A CN108922547B (zh) | 2018-05-23 | 2018-05-23 | 身份的识别方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108922547A CN108922547A (zh) | 2018-11-30 |
CN108922547B true CN108922547B (zh) | 2021-04-23 |
Family
ID=64403271
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810502697.0A Active CN108922547B (zh) | 2018-05-23 | 2018-05-23 | 身份的识别方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108922547B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110543129B (zh) * | 2019-09-30 | 2021-03-30 | 深圳市酷开网络科技股份有限公司 | 一种智能电器控制方法、智能电器控制系统及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105429969A (zh) * | 2015-11-09 | 2016-03-23 | 普天智能照明研究院有限公司 | 一种用户身份验证方法与设备 |
CN105979376A (zh) * | 2015-12-02 | 2016-09-28 | 乐视致新电子科技(天津)有限公司 | 一种推荐方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9092415B2 (en) * | 2012-09-25 | 2015-07-28 | Rovi Guides, Inc. | Systems and methods for automatic program recommendations based on user interactions |
-
2018
- 2018-05-23 CN CN201810502697.0A patent/CN108922547B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105429969A (zh) * | 2015-11-09 | 2016-03-23 | 普天智能照明研究院有限公司 | 一种用户身份验证方法与设备 |
CN105979376A (zh) * | 2015-12-02 | 2016-09-28 | 乐视致新电子科技(天津)有限公司 | 一种推荐方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108922547A (zh) | 2018-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109428719B (zh) | 一种身份验证方法、装置及设备 | |
US11568876B2 (en) | Method and device for user registration, and electronic device | |
CN107610695B (zh) | 驾驶人语音唤醒指令词权重的动态调整方法 | |
CN109065044B (zh) | 唤醒词识别方法、装置、电子设备及计算机可读存储介质 | |
CN106663430B (zh) | 使用用户指定关键词的说话者不相依关键词模型的关键词检测 | |
CN107591155B (zh) | 语音识别方法及装置、终端及计算机可读存储介质 | |
CN102568478B (zh) | 一种基于语音识别的视频播放控制方法和系统 | |
US9734828B2 (en) | Method and apparatus for detecting user ID changes | |
US11430449B2 (en) | Voice-controlled management of user profiles | |
EP3468134A1 (en) | Method and device for identity authentication | |
JP2022546185A (ja) | 音声コマンドの識別 | |
CN109510806B (zh) | 鉴权方法及装置 | |
CN110875059B (zh) | 收音结束的判断方法、装置以及储存装置 | |
US20190341034A1 (en) | Distinguishing voice commands | |
KR101496876B1 (ko) | 휴대 단말기의 소리 인식 방법 및 장치 | |
CN109448732B (zh) | 一种数字串语音处理方法及装置 | |
US10950221B2 (en) | Keyword confirmation method and apparatus | |
CN111382241A (zh) | 会话场景切换方法及装置 | |
CN108616361B (zh) | 一种识别设备唯一性的方法及装置 | |
CN108922547B (zh) | 身份的识别方法、装置及电子设备 | |
CN113066485B (zh) | 一种语音数据处理方法、装置及设备 | |
CN110007747B (zh) | 一种控制方法及控制装置 | |
CN110287365B (zh) | 一种数据处理方法及电子设备 | |
CN117496954A (zh) | 语音检测处理方法及装置 | |
CN114495982A (zh) | 风险检测方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20211118 Address after: 210034 floor 8, building D11, Hongfeng Science Park, Nanjing Economic and Technological Development Zone, Jiangsu Province Patentee after: New Technology Co.,Ltd. Patentee after: Volkswagen (China) Investment Co., Ltd Address before: 100094 1001, 10th floor, office building a, 19 Zhongguancun Street, Haidian District, Beijing Patentee before: MOBVOI INFORMATION TECHNOLOGY Co.,Ltd. |