CN116881887A

CN116881887A - 应用程序登录方法、装置、设备、存储介质和程序产品

Info

Publication number: CN116881887A
Application number: CN202310681400.2A
Authority: CN
Inventors: 彭晓琪; 李振华
Original assignee: Bank of China Ltd
Current assignee: Bank of China Ltd
Priority date: 2023-06-09
Filing date: 2023-06-09
Publication date: 2023-10-13

Abstract

本申请涉及一种应用程序登录方法、装置、设备、存储介质和程序产品，涉及人工智能技术领域。该方法包括：响应于用户登录目标应用程序的请求，获取用户输入的登录语音，接着将登录语音输入至声纹识别模型中，通过声纹识别模型对登录语音进行声纹特征识别，得到登录语音的声纹特征，若登录语音的声纹特征与预先存储的标准声纹特征相匹配，则确定用户登录目标应用程序的成功。采用本方法能够在简化应用程序登录方式流程的同时，提升应用程序登录的安全性。

Description

应用程序登录方法、装置、设备、存储介质和程序产品

技术领域

本申请涉及人工智能技术领域，特别是涉及一种应用程序登录方法、装置、设备、存储介质和程序产品。

背景技术

随着信息技术的飞速发展，终端设备上的应用软件越来越多，各应用程序软件的登录方式也越来越多元化。

相关技术中，在登录应用程序时，通常是根据用户提供的账号和秘钥，对用户的身份进行验证，若身份验证通过，则确定用户的应用程序登录成功。

然而，相关技术中应用程序的登录方式操作较为繁琐，且安全性较低。

发明内容

基于此，有必要针对上述技术问题，提供一种应用程序登录方法、装置、设备、存储介质和程序产品，在简化应用程序登录方式流程的同时，提升应用程序登录的安全性。

第一方面，本申请实施例提供了一种应用程序登录方法，该方法包括：

响应于用户登录目标应用程序的请求，获取用户输入的登录语音；

将登录语音输入至声纹识别模型中，通过声纹识别模型对登录语音进行声纹特征识别，得到登录语音的声纹特征；

若登录语音的声纹特征与预先存储的标准声纹特征相匹配，则确定用户登录目标应用程序的成功。

在其中一个实施例中，请求中携带有用户信息，获取用户输入的登录语音，包括：

根据用户信息，展示登录文本信息；

采集用户读取登录文本信息的语音，获得用户输入的登录语音。

在其中一个实施例中，声纹识别模型包括音频辨认模型和声纹确认模型，通过声纹识别模型对登录语音进行声纹特征识别，得到登录语音的声纹特征，包括：

通过音频辨认模型对登录语音进行音频特征识别，获取登录语音的关键语音信息；

通过声纹确认模型对关键语音信息进行声纹识别，得到登录语音的声纹特征。

在其中一个实施例中，通过音频辨认模型对登录语音进行音频特征识别，获取登录语音的关键语音信息，包括：

通过音频辨认模型获取登录语音中的多组音频数据，提取各音频数据对应的文本内容，并将文本内容中与预设的登录文本信息相同内容对应的音频数据确定为登录语音的关键语音信息。

在其中一个实施例中，通过声纹确认模型对关键语音信息进行声纹识别，得到登录语音的声纹特征，包括：

通过声纹确认模型获取关键语音信息的文本内容、语种类型、语音时间、信道传输方式，并融合文本内容、语种类型、语音时间和信道方式，得到登录语音的声纹特征。

在其中一个实施例中，该方法还包括：

获取声纹特征与参考声纹库中各参考声纹特征之间的相似度；

将最大相似度对应的参考声纹特征确定为标准声纹特征；

若最大相似度大于预设相似度阈值，则确定声纹特征与标准声纹特征相匹配。

第二方面，本申请还提供了一种应用程序登录装置，该装置包括：

请求响应模块，用于响应于用户登录目标应用程序的请求，获取用户输入的登录语音；

语音识别模块，用于将登录语音输入至声纹识别模型中，通过声纹识别模型对登录语音进行声纹特征识别，得到登录语音的声纹特征；

用户登录模块，用于若登录语音的声纹特征与预先存储的标准声纹特征相匹配，则确定用户登录目标应用程序的成功。

第三方面，本申请还提供了一种计算机设备。该计算机设备包括存储器和处理器，该存储器存储有计算机程序，该处理器执行计算机程序时实现上述第一方面中任一项实施例中的方法的步骤。

第四方面，本申请还提供了一种计算机可读存储介质。该计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述第一方面中任一项实施例中的方法的步骤。

第五方面，本申请还提供了一种计算机程序产品。该计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述第一方面中任一项实施例中的方法的步骤。

上述应用程序登录方法、装置、设备、存储介质和程序产品，响应于用户登录目标应用程序的请求，获取用户输入的登录语音，接着将登录语音输入至声纹识别模型中，通过声纹识别模型对登录语音进行声纹特征识别，得到登录语音的声纹特征，若登录语音的声纹特征与预先存储的标准声纹特征相匹配，则确定用户登录目标应用程序的成功。该方法中，响应于用户登录目标应用程序的请求，将用户输入的登录语音作为依据，对用户的登录请求进行验证，登录语音的获取方式不受场景环境的限制，简化了应用程序的登录操作步骤。接着，通过声纹识别模型对登录语音进行识别，获取登录语音的声纹特征。由于不同用户的语音各不相同，用户的登录语音具有特殊性和差异性的特点，那么基于用户登录语音提取的声纹特征也是具备有效性的。然后将登录语音的声纹特征与标准声纹特征进行匹配，若匹配成功，则确定用户登录目标用于程序成功。由于声纹特征是有效的，那么将登录语音的声纹特征与标准声纹特征进行匹配的结果也是有效的。综上，采用该方法能够在简化目标应用程序登录方式流程的同时，提升目标应用程序登录的安全性。

附图说明

图1为一个实施例中计算机设备的内部结构图；

图2为一个实施例中应用程序登录方法的流程示意图；

图3为一个实施例中登录语音获取步骤的流程示意图；

图4为一个实施例中声纹特征获取步骤的流程示意图；

图5为一个实施例中声纹特征匹配步骤的流程示意图；

图6为另一个实施例中应用程序登录方法的流程示意图；

图7为一个实施例中应用程序登录装置的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请实施例提供的应用程序登录方法，可以应用于包括应用程序的计算机设备中。该计算机设备可以是终端，其内部结构图可以如图1所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中，处理器、存储器和输入/输出接口通过系统总线连接，通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种应用程序登录方法。该计算机设备的显示单元用于形成视觉可见的画面，可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图1中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

随着信息技术的飞速发展，终端设备上的应用软件越来越多，各应用程序软件的登录方式也越来越多元化。相关技术中，在登录应用程序时，至少有以下登录方式：

(1)根据用户提供的账号和秘钥，对用户的身份进行验证，若身份验证通过，则确定用户的应用程序登录成功。这种登录方式对应的身份验证操作较为繁琐，且随着时间的增长，会存在用户忘记账号密码的风险。

(2)通过面部识别对用户进行身份验证，若身份验证通过，则确定用户的应用程序登录成功。这种方法需要用户提供面部信息，涉及到用户隐私，对于用户而言，通常是不希望个人隐私被记录并存储在数据库中的。此外，对于双胞胎等特殊群体，面部识别的身份验证正确率低，导致应用程序登录方式的安全性较低。

综上，相关技术中应用程序的登录方式操作较为繁琐，且安全性较低。对比，本申请实施例提供一种应用程序登录方法，响应于用户登录目标应用程序的请求，获取用户输入的登录语音，简化用户登录目标应用程序的操作步骤。接着根据登录语音获取登录语音的声纹特征，并在声纹特征与预设的标准声纹特征相匹配的情况下，确定用户登录目标应用成功，以提升目标应用程序登录方式的安全性。

在一个实施例中，如图2所示，提供了一种应用程序登录方法，该方法包括以下步骤：

S201，响应于用户登录目标应用程序的请求，获取用户输入的登录语音。

其中，应用程序是指为完成某项或多项特定工作的计算机程序，它运行在用户模式下，可以和用户进行交互，且具有可视的用户界面。本申请实施例中，目标应用程序是指能够与用户进行交互的多个应用程序中的任一应用程序。

目标应用程序可以包括多种功能模块，用户可以在目标程序提供的用户界面中，通过语音指令触发、点击触发等多种方式，执行目标应用程序中的一个或多个功能模块的操作。

在实际应用中，为保障用户能够顺利执行目标应用程序的功能操作，通常在用户执行目标应用程序操作之前，用户会触发目标应用程序的登录请求，以指示对用户的身份信息进行验证，然后在身份验证通过后的情况下，确定用户登录目标应用程序成功，开启用户在目标应用程序中的操作权限。本申请实施例中，对目标应用程序的请求的触发方式不作限制，例如用户点击目标应用程序后自动触发登录目标应用程序的请求、用户点击目标应用程序中的登录框触发登录目标应用程序的请求等。

响应于用户在目标应用程序触发的请求，通过用户在目标应用程序中输入的登录语音，对该请求进行验证。

可选的，目标应用程序的用户界面上展示有语音采集标识，用户点击该标识，并随机生成一段实时的登录语音。

可选的，用户在初次注册目标应用程序时生成注册语音，用户在触发登录目标应用程序的请求后，用户可以再次复述注册语音，作为登录语音。

可选的，用户可以将提前录制好的语音作为登录语音。

S202，将登录语音输入至声纹识别模型中，通过声纹识别模型对登录语音进行声纹特征识别，得到登录语音的声纹特征。

其中，声纹特征是对语音中所蕴含的、能唯一表征和标识说话人身份的语音特征参数。声纹识别模型是指利用声纹识别技术，基于声纹特征参数所建立的语音识别模型。

声纹特征识别也称说话人识别，包括说话人辨认和说话人确认两个识别过程。前者用以判断某段语音是若干人中的哪一个所说的，属于“多选一”问题；后者用以确认某段语音是否是指定的某个人所说的，属于“一对一判别”问题。

示例性地，声纹识别模型可以把登录语音信号转换成电信号，通过对电信号进行识别，提取登录语音的声纹特征。

示例性地，声纹识别模型可以把登录语音信号转换为频谱图像，通过对频谱图像进行识别，获取登录语音的声纹特征。

S203，若登录语音的声纹特征与预先存储的标准声纹特征相匹配，则确定用户登录目标应用程序的成功。

其中，标准声纹特征是根据用户在注册目标应用程序时所提供的注册语音得到的。需要说明的是，目标应用程序的一个用户对应一组标准声纹特征参数，且目标应用程序对应的所有用户的标准声纹特征是预先存储在目标应用程序所对应的后台数据库中的。

在获取登录语音的声纹特征之后，可以将登录语音的声纹特征与预先存储的多个标准声纹特征一一进行匹配，并根据相似度算法计算声纹特征与多个标准声纹特征的相似度，若最大相似度超过预设相似度阈值，则确定登录语音的声纹特征与预先存储的标准声纹特征匹配成功，用户成功登录目标应用程序。本申请实施例中对相似度算法不作限制。

本申请实施例中，响应于用户登录目标应用程序的请求，获取用户输入的登录语音，接着将登录语音输入至声纹识别模型中，通过声纹识别模型对登录语音进行声纹特征识别，得到登录语音的声纹特征，若登录语音的声纹特征与预先存储的标准声纹特征相匹配，则确定用户登录目标应用程序的成功。该方法中，响应于用户登录目标应用程序的请求，将用户输入的登录语音作为依据，对用户的登录请求进行验证，登录语音的获取方式不受场景环境的限制，简化了应用程序的登录操作步骤。接着，通过声纹识别模型对登录语音进行识别，获取登录语音的声纹特征。由于不同用户的语音各不相同，用户的登录语音具有特殊性和差异性的特点，那么基于用户登录语音提取的声纹特征也是具备有效性的。然后将登录语音的声纹特征与标准声纹特征进行匹配，若匹配成功，则确定用户登录目标用于程序成功。由于声纹特征是有效的，那么将登录语音的声纹特征与标准声纹特征进行匹配的结果也是有效的。综上，采用本申请实施例提供的应用程序登录方法能够在简化应用程序登录方式流程的同时，提升应用程序登录的安全性。

响应于用户登录目标应用程序的请求，有多种方式获取登录语音，例如。基于此，下面通过一个实施例，对用户输入的登录语音的获取步骤进行说明。

在一个实施例中，如图3所示，请求中携带有用户信息，获取用户输入的登录语音，包括：

S301，根据用户信息，展示登录文本信息。

用户信息是指能够表征用户在触发目标应用程序的请求时的一系列信息，比如用户登录时间、用户触发请求的登录方式、目标应用程序的用户设备信息、用户指纹等。

根据用户信息获取登录文本信息，并在目标应用程序的用户界面上展示登录文本信息。

需要说明的是，本申请实施例中对登录文本信息的获取方式不作限制。

示例性地，可以将请求中携带的用户信息进行文本转换，并将文本转换后的用户信息进行汇总，生成用户的登录文本信息。

示例性地，还可以根据用户信息与用户注册语音的对应关系，确定与用户信息对应的注册信息，并对用户注册语音进行文本转换，得到用户注册文本，即登录文本信息。

在获取登录文本信息之后，在目标应用程序的用户界面上展示用户该登录文本信息。展示方式根据用户信息进行制定。比如根据用户信息确定用户所在登录环境嘈杂，那么可以以文字展示的形式，进行登录文本信息的展示；再比如根据用户信息确定用户的视觉存在障碍，那么可以利用人工智能技术，将登录文本信息转换为人工智能语音，以语音的形式，展示登录文本信息。

S302，采集用户读取登录文本信息的语音，获得用户输入的登录语音。

用户根据目标应用程序上展示的登录文本信息，生成登录文本信息的语音，并将采集到的登录文本信息的语音，作为用户输入的登录语音。

若登录文本信息是以文字展示的，则根据用户读取登录文本信息，生成登录文本信息的语音；若登录文本信息是以人工智能语音展示的，则根据用户复述人工智能语音，生成登录文本信息的语音。

本申请实施例中，根据用户信息展示登录文本信息，接着根据用户读取登录文本信息的语音，获得用户的登录语音，相当于在获取用户输入的登录语音的过程中，考虑到用户在登录过程中的一系列影响因素，例如登录环境影响、用户自身差异性影响等，从而为用户提供一个合适的文本信息，以获取准确的登录语音。

在获取用户输入的登录语音的基础上，需要进一步对登录语音进行处理，以筛选出用户的声纹特征，用于对用户身份进行验证，从而提升用户登录目标应用程序的安全性。基于此，下面通过一个实施例，在获取登录语音的情况下，对声纹特征的获取步骤进行说明。

在一个实施例中，如图4所示，声纹识别模型包括音频辨认模型和声纹确认模型，通过声纹识别模型对登录语音进行声纹特征识别，得到登录语音的声纹特征，包括：

S401，通过音频辨认模型对登录语音进行音频特征识别，获取登录语音的关键语音信息。

将登录语音输入至音频辨认模型，通过音频辨认模型对登录语音进行音频特征识别，获取音频辨认模型的输出结果，即登录语音的关键语音信息。

可选的，通过音频辨认模型首先对登录语音中的音轨进行区分，获取各音轨的说话人，接着根据各音轨的说话音量、说话语气等语音特征，确定登录语音中的关键语音信息。

S402，通过声纹确认模型对关键语音信息进行声纹识别，得到登录语音的声纹特征。

将关键语音信息输入至声纹确认模型，通过声纹确认模型对关键语音信息进行声纹识别，获取声纹确认模型的输出结果，即登录语音的声纹特征。

可选的，通过声纹确认对关键语音信息进行声纹特征提取，获取关键语音信息的音长、音强、音高等特征，并以向量形式表征各特征参数，将登录语音的向量确定为登录语音的声纹特征。

本申请实施例中，首先通过音频辨认模型获取登录语音的关键语音信息，然后通过声纹确认模型获取登录语音的声纹特征，相当于将声纹特征的获取过程中拆分为“说明人辨认”和“说话人确认”这两个阶段，这种层层递进的确认方式考虑了用户所在登录环境嘈杂、以及用户声音的唯一性和稳定性的特性，获取到的声纹特征也更可靠。

下面，通过一个实施例，对前述实施例中关键语音信息的获取步骤进行进一步说明。

在一个实施例中，通过音频辨认模型对登录语音进行音频特征识别，获取登录语音的关键语音信息，包括：

用户在输入登录语音的过程中，用户所处的登录环境内可能会存在多个说话人在同时说话，那么登录语音也会包括用户在内的多个说话人的音频数据，且一个说话人对应一组音频数据。显然，说话人的数量越多，登录语音中的音频数据的组就越多。

为了区分多组音频数据的说话人，分别对各组音频数据进行文字识别，获取每一组音频数据对应的文本内容。另外，将各组音频数据的文本内容与预设的登录文本信息进行比对，若文本内容与登录文本信息相同，则将该文本内容对应的音频数据确定为用户的音频数据，并将登录语音中用户的音频数据作为关键语音信息。

其中，预设的登录文本信息的内容与前述实施例中对登录文本信息的说明内容相同，在此不再赘述。

本申请实施例中，考虑了登录语音中存在多个说话人在同时说话的场景，以每个说话人的文本内容为依据，通过与预设的登录文本信息进行对比，将对比结果相同的文本内容对应的音频数据，确定为关键语音信息。这样的确定过程，确认依据可靠且易于实现。

下面，通过一个实施例，对前述实施例中根据关键语音信息获取声纹特征的获取步骤进行进一步说明。

在一个实施例中，通过声纹确认模型对关键语音信息进行声纹识别，得到登录语音的声纹特征，包括：

其中，文本内容是指关键语音信息进行文字识别后的内容；语种类型是指关键语音信息的说话人，也就是用户在输入登录语音时的语言类型，例如中文、英语、德语等；语音时间是指用户输入的登录语音所占用的时间段；信道传输方式是登录语音的信号传播方式，例如基带传输、频带传输、宽带传输等。

将关键语音信息输入到声纹确认模型中，声纹识别模型通过提取关键语音信息的文本内容、语种类型、语音时间、信道传输方式，并根据上述文本内容、语种类型、语音时间、信道传输方式的预设权重，将文本内容、语种类型、语音时间、信道传输方式与对应权重分别乘积，获取乘积结果，然后将乘积结果进行叠加获取登录语音的声纹特征。

本申请实施例中，将关键语音信息的文本内容、语种类型、语音时间、信道传输方式进行融合，得到登录语音的声纹特征，相当于声纹特征包括了用户的登录语音的多个维度的声纹信息，已提升声纹特征对用户信息的全面覆盖性，进一步提升声纹特征的唯一性和不可替代性。

在对登录语音进行验证的过程中，通常是将登录语音与目标应用程序中所有用户的标准声纹特征进行对比，以提升登录语音验证结果的准确性。基于此，下面通过一个实施例，在获取登录语音的声纹特征的情况下，对应用程序登录方法进行说明。

在一个实施例中，如图5所示，该方法还包括：

S501，获取声纹特征与参考声纹库中各参考声纹特征之间的相似度。

其中，参考声纹库包括目标应用程序对应的所有用户的声纹特征。本申请实施例中，参考声纹库中的声纹特征可以是根据用户注册目标应用程序时提供的注册语音得到的。

相似度表征声纹特征与参考声纹特征之间的差异性，即相似度越大，声纹特征与参考声纹特征之间的差别越小；相似度越小，声纹特征与参考声纹特征之间的差别越大。

可以通过选取一个相似度度量算法，计算声纹特征与参考声纹库中各参考声纹特征之间的相似度，也可以选取多个相似度度量算法，对于任一参考声纹特征，计算声纹特征与该参考声纹特征之间的多个参考相似度，并将多个参考相似度的均值作为声纹特征与该参考声纹特征之间的相似度，以此类推，获取声纹特征与各参考声纹特征之间的相似度，以提升相似度的可靠性。

S502，将最大相似度对应的参考声纹特征确定为标准声纹特征。

在获取声纹特征与各参考声纹特征之间的多个相似度的情况下，将最大相似度对应的参考声纹特征确定为标准声纹特征。显然，标准声纹特征是与用户声纹特征最接近的声纹特征。

S503，若最大相似度大于预设相似度阈值，则确定声纹特征与标准声纹特征相匹配。

本申请实施例中，以预设相似度阈值为依据，判断声纹特征与标准声纹特征是否匹配。若声纹特征与标准声纹特征的相似度(即最大相似度)大于预设相似度阈值，则确定声纹特征与标准声纹特征相匹配，那么确定用户登录目标应用程序成功。

对应地，若声纹特征与标准声纹特征的相似度(即最大相似度)大于预设相似度阈值，则确定声纹特征与标准声纹特征不匹配，那么则在目标应用程序的用户界面上显示用户登录目标应用程序未成功。

本申请实施例中，获取声纹特征与参考声纹库中各参考声纹特征之间的相似度，并在最大相似度大于预设预设相似度阈值的情况下，确定声纹特征与标准声纹特征相匹配，用户成功登录目标应用程序，充分发挥了声纹特征的独特性的特点，保证用户登录目标应用程序的安全性。

基于声纹特征的非接触性、易接受性以及独特性的特点，提供了一种应用程序登录方法。其中，声纹特征的非接触性是指可以通过远程获取的方式得到登录语音。声纹特征的易接受性是指声纹特征的语音获取方式方便、自然，且在采集过程中涉及到的用户隐私信息较少，因此更容易被使用者接受。此外，声纹特征的采集成本较低，语音采集装置成本低廉，使用简单，一个麦克风即可，在使用通讯设备(如电话、手机)时更无需额外的录音设备。声纹特征的独特性是指不同用户的声纹特征都是不一样的，并且用户的声纹特征不容易发生变化，可以避免用户声纹特征被恶意假冒。基于此，下面通过一个实施例，对应用程序登录方法进行说明。

在一个实施例中，如图6所示，提供了一种应用程序登录方法，该方法包括以下步骤：

S601，响应于用户登录目标应用程序的请求，根据请求中携带的用户信息展示登录文本信息。

S602，采集用户读取登录文本信息的语音，获得用户输入的登录语音。

S603，通过音频辨认模型获取登录语音中的多组音频数据，提取各音频数据对应的文本内容，并将文本内容中与预设的登录文本信息相同内容对应的音频数据确定为登录语音的关键语音信息。

S604，通过声纹确认模型获取关键语音信息的文本内容、语种类型、语音时间、信道传输方式，并融合文本内容、语种类型、语音时间和信道方式，得到登录语音的声纹特征。

S605，获取声纹特征与参考声纹库中各参考声纹特征之间的相似度。

S606，将最大相似度对应的参考声纹特征确定为标准声纹特征。

S607，若最大相似度大于预设相似度阈值，则确定声纹特征与标准声纹特征相匹配。

S608，若登录语音的声纹特征与预先存储的标准声纹特征相匹配，则确定用户登录目标应用程序的成功。

应该理解的是，虽然上述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，上述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的应用程序登录方法的应用程序登录装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个应用程序登录装置实施例中的具体限定可以参见上文中对于应用程序登录方法的限定，在此不再赘述。

在一个实施例中，如图7所示，提供了一种应用程序登录装置700，包括：请求响应模块701、语音识别模块702和用户登录模块703，其中：

请求响应模块701，用于响应于用户登录目标应用程序的请求，获取用户输入的登录语音；

语音识别模块702，用于将登录语音输入至声纹识别模型中，通过声纹识别模型对登录语音进行声纹特征识别，得到登录语音的声纹特征；

用户登录模块703，用于若登录语音的声纹特征与预先存储的标准声纹特征相匹配，则确定用户登录目标应用程序的成功。

在一个实施例中，请求响应模块701包括文本展示单元和语音获取单元，其中：

文本展示单元，用于根据用户信息，展示登录文本信息；

语音获取单元，用于采集用户读取登录文本信息的语音，获得用户输入的登录语音。

在一个实施例中，语音识别模块702包括音频辨认单元和声纹确认单元，其中：

音频辨认单元，用于通过音频辨认模型对登录语音进行音频特征识别，获取登录语音的关键语音信息；

声纹确认单元，用于通过声纹确认模型对关键语音信息进行声纹识别，得到登录语音的声纹特征。

在一个实施例中，音频辨认单元还用于通过音频辨认模型获取登录语音中的多组音频数据，提取各音频数据对应的文本内容，并将文本内容中与预设的登录文本信息相同内容对应的音频数据确定为登录语音的关键语音信息。

在一个实施例中，声纹确认单元还用于通过声纹确认模型获取关键语音信息的文本内容、语种类型、语音时间、信道传输方式，并融合文本内容、语种类型、语音时间和信道方式，得到登录语音的声纹特征。

在一个实施例中，应用程序登录装置700，还包括：相似度获取模块、特征确认模块和特征匹配模块，其中：

相似度获取模块，用于获取声纹特征与参考声纹库中各参考声纹特征之间的相似度；

特征确认模块，用于将最大相似度对应的参考声纹特征确定为标准声纹特征；

特征匹配模块，用于若最大相似度大于预设相似度阈值，则确定声纹特征与标准声纹特征相匹配。

上述应用程序登录装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

在一个实施例中，处理器执行计算机程序时还实现以下步骤：

根据用户信息，展示登录文本信息；

将最大相似度对应的参考声纹特征确定为标准声纹特征；

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：

根据用户信息，展示登录文本信息；

将最大相似度对应的参考声纹特征确定为标准声纹特征；

在一个实施例中，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：

根据用户信息，展示登录文本信息；

将最大相似度对应的参考声纹特征确定为标准声纹特征；

需要说明的是，本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权或者经过各方充分授权的信息和数据，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，上述计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory，ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory，MRAM)、铁电存储器(Ferroelectric Random Access Memory，FRAM)、相变存储器(Phase Change Memory，PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory，DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

上述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种应用程序登录方法，其特征在于，所述方法包括：

响应于用户登录目标应用程序的请求，获取所述用户输入的登录语音；

将所述登录语音输入至声纹识别模型中，通过所述声纹识别模型对所述登录语音进行声纹特征识别，得到所述登录语音的声纹特征；

若所述登录语音的声纹特征与预先存储的标准声纹特征相匹配，则确定所述用户登录所述目标应用程序的成功。

2.根据权利要求1所述的方法，其特征在于，所述请求中携带有用户信息，所述获取所述用户输入的登录语音，包括：

根据所述用户信息，展示登录文本信息；

采集所述用户读取所述登录文本信息的语音，获得所述用户输入的登录语音。

3.根据权利要求1或2所述的方法，其特征在于，所述声纹识别模型包括音频辨认模型和声纹确认模型，所述通过所述声纹识别模型对所述登录语音进行声纹特征识别，得到所述登录语音的声纹特征，包括：

通过所述音频辨认模型对所述登录语音进行音频特征识别，获取所述登录语音的关键语音信息；

通过所述声纹确认模型对所述关键语音信息进行声纹识别，得到所述登录语音的声纹特征。

4.根据权利要求3所述的方法，其特征在于，所述通过所述音频辨认模型对所述登录语音进行音频特征识别，获取所述登录语音的关键语音信息，包括：

通过所述音频辨认模型获取所述登录语音中的多组音频数据，提取各所述音频数据对应的文本内容，并将所述文本内容中与预设的登录文本信息相同内容对应的音频数据确定为所述登录语音的关键语音信息。

5.根据权利要求3所述的方法，其特征在于，所述通过所述声纹确认模型对所述关键语音信息进行声纹识别，得到所述登录语音的声纹特征，包括：

通过所述声纹确认模型获取所述关键语音信息的文本内容、语种类型、语音时间、信道传输方式，并融合所述文本内容、所述语种类型、所述语音时间和所述信道方式，得到所述登录语音的声纹特征。

6.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

获取所述声纹特征与参考声纹库中各参考声纹特征之间的相似度；

将最大相似度对应的参考声纹特征确定为所述标准声纹特征；

若所述最大相似度大于预设相似度阈值，则确定所述声纹特征与所述标准声纹特征相匹配。

7.一种应用程序登录装置，其特征在于，所述装置包括：

请求响应模块，用于响应于用户登录目标应用程序的请求，获取所述用户输入的登录语音；

语音识别模块，用于将所述登录语音输入至声纹识别模型中，通过所述声纹识别模型对所述登录语音进行声纹特征识别，得到所述登录语音的声纹特征；

用户登录模块，用于若所述登录语音的声纹特征与预先存储的标准声纹特征相匹配，则确定所述用户登录所述目标应用程序的成功。

8.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。