WO2020077895A1

WO2020077895A1 - 签约意向判断方法、装置、计算机设备和存储介质

Info

Publication number: WO2020077895A1
Application number: PCT/CN2019/070814
Authority: WO
Inventors: 臧磊; 傅婧; 郭鹏程
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2018-10-16
Filing date: 2019-01-08
Publication date: 2020-04-23
Also published as: CN109543516A

Abstract

一种签约意向判断方法，包括：从终端获取语音数据；对所述语音数据进行语音识别得到对应的语音文本，对所述语音文本提取关键词，将提取的关键词与预设文本对应的预设关键词进行匹配，得到文本匹配分数；从所述语音数据中提取语音特征向量，将提取到的所述语音特征向量输入到已训练的欺诈风险预测模型中，得到欺诈风险系数值；从所述终端获取图像数据，对获取到的所述图像数据进行人脸识别，得到人脸识别分数；获取当前业务场景对应的场景标识，根据所述场景标识获取对应的目标审核规则；及根据所述文本匹配分数、所述欺诈风险系数值、所述人脸识别分数及所述目标审核规则得到签约意向判断结果。

Description

签约意向判断方法、装置、计算机设备和存储介质

相关申请的交叉引用

本申请要求于2018年10月16日提交中国专利局，申请号为2018112027200，申请名称为“签约意向判断方法、装置、计算机设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及一种签约意向判断方法、装置、计算机设备和存储介质。

背景技术

现代社会中，需要进行签约的场景非常多，与办理保险业务、借贷业务、租赁业务时，都需要与保险公司、租赁公司等进行签约。

传统技术中，在签约前往往缺乏双录服务。应监管要求，现在大量签约场景需增加视频语音双录功能，然而，发明人意识到，目前的双录材料往往需要后续人工审核校验来判断签约人的签约意向，不仅效率低下而且准确性并不高。

发明内容

根据本申请公开的各种实施例，提供一种签约意向判断方法、装置、计算机设备和存储介质。

一种签约意向判断方法包括：

从终端获取语音数据；

对所述语音数据进行语音识别得到对应的语音文本，对所述语音文本提取关键词，将提取的关键词与预设文本对应的预设关键词进行匹配，得到文本匹配分数；

从所述语音数据中提取语音特征向量，将提取到的所述语音特征向量输入到已训练的欺诈风险预测模型中，得到欺诈风险系数值；

从所述终端获取图像数据，对获取到的所述图像数据进行人脸识别，得到人脸识别分数；

获取当前业务场景对应的场景标识，根据所述场景标识获取对应的目标审核规则；及

根据所述文本匹配分数、所述欺诈风险系数值、所述人脸识别分数及所述目标审核规则得到签约意向判断结果。

一种签约意向判断装置包括：

语音数据获取模块，用于从终端获取语音数据；

关键词匹配模块，用于对所述语音数据进行语音识别得到对应的语音文本，对所述语音文本提取关键词，将提取的关键词与预设文本对应的预设关键词进行匹配，得到文本匹配分数；

语音特征向量提取模块，用于从所述语音数据中提取语音特征向量，将提取到的所述语音特征向量输入到已训练的欺诈风险预测模型中，得到欺诈风险系数值；

图像数据获取模块，用于从所述终端获取图像数据，对获取到的所述图像数据进行人脸识别，得到人脸识别分数；

目标审核规则获取模块，用于获取当前业务场景对应的场景标识，根据所述场景标识获取对应的目标审核规则；及

签约意向判断模块，用于根据所述文本匹配分数、所述欺诈风险系数值、所述人脸识别分数及所述目标审核规则得到签约意向判断结果。

一种计算机设备，包括存储器和一个或多个处理器，存储器中存储有计算机可读指令，计算机可读指令被处理器执行时实现本申请任意一个实施例中提供的签约意向判断方法的步骤。

一个或多个存储有计算机可读指令的非易失性计算机可读存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器实现本申请任意一个实施例中提供的签约意向判断方法的步骤。

本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征和优点将从说明书、附图以及权利要求书变得明显。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为根据一个或多个实施例中签约意向判断方法的应用场景图。

图2为根据一个或多个实施例中签约意向判断方法的流程示意图。

图3为根据一个或多个实施例中步骤S210的流程示意图。

图4为根据一个或多个实施例中签约意向判断装置的框图。

图5为根据一个或多个实施例中计算机设备的框图。

具体实施方式

为了使本申请的技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的签约意向判断方法，可以应用于如图1所示的应用环境中。终端102通过网络与服务器104通过网络进行通信，终端102用于对客户进行语音和视频的录制。服务器104首先从终端获取语音数据，然后对语音数据进行语音识别得到对应的语音文本，对语音文本提取关键词，将提取的关键词与预设对应的预设关键词进行匹配，得到文本匹配分数；接着从语音数据中提取语音特征向量，将提取到的语音特征向量输入到已训练的欺诈风险预测模型中，得到欺诈风险系数值；从终端获取图像数据，对获取到的图像数据进行人脸识别，得到人脸识别分数；获取当前业务场景对应的场景标识，根据场景标识获取对应的目标审核规则；根据文本匹配分数、欺诈风险系数值、人脸识别分数及审核规则得到签约意向判断结果。

终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一些实施例中，如图2所示，提供了一种签约意向判断方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

步骤S202，从终端获取语音数据。

本实施例中，给定签约客户一段预设的文本，例如知情同意书等，客户朗读文本，终端对客户进行语音和视频的录制，服务器可以从终端获取录制的语音数据。具体来说，可以是在签约客户朗读完整个文本后，服务器获取终端上传的整个文本对应的语音数据；也可以是在签约客户朗读的过程中，服务器间隔一定的时间从终端获取语音数据，例如，可以约定签约用户每读完一句完整的句子，进行停顿，当终端检测到语音空白时段超过预设阈值时，将当前录制好的语音数据发送至服务器，当前录制好的语音数据指的是从上一次发送完语音数据开始录制的语音数据。

步骤S204，对语音数据进行语音识别得到对应的语音文本，对语音文本提取关键词，将提取的关键词与预设文本对应的预设关键词进行匹配，得到文本匹配分数。

具体地，预设文本指的是给定的朗读文本，是签约客户进行语音视频双录时需要朗读的原始文本。在本实施例中，对于预设文本，需要预先进行关键词提取，提取的关键词作为预设关键词。当服务器获取到终端录制的语音数据时，首先对语音数据进行预处理，包括降噪和语音增强等，然后对预处理后的语音数据进行语音识别得到语音文本，然后将得到的语音文本进行关键词提取，得到该语音文本对应的关键词，将这些关键词与预设关键词进行匹配，并计算匹配度，得到文本匹配分数。语音识别可采用现有技术中任意语音识别方法，本申请在此不再赘述。

在一些实施例中，对语音文本提取关键词，包括：对语音文本进行分词，对分词得到的各个词计算TF-IDF权重，然后根据TF-IDF权重对各个词进行降序排列，将排序靠前的预设数量的词作为关键词。

在一些实施例中，将提取的关键词与预设文本对应的预设关键词进行匹配，得到文本匹配分数，包括：首先计算语音文本对应的关键词中与预设关键词相匹配的词数量，根据匹配上的词数量与预设关键词的总词数的比值得到文本匹配分数。举例来说，语音文本对应的关键词为A、B、D，预设关键词包括A、B、C、D、E，则匹配词数量为3，文本匹配分数为：3/5x100＝60。

步骤S206，从语音数据中提取语音特征向量，将提取到的语音特征向量输入到已训练的欺诈风险预测模型中，得到欺诈风险系数值。

欺诈风险预测模型用于根据语音数据对签约客户的欺诈风险系数值进行预测，欺诈风险系数值用于表征签约客户可能存在的欺诈风险，欺诈风险系数值越大，表示签约客户存在的欺诈风险越大。欺诈风险预测模型可基于历史数据通过有监督的机器学习模型训练得到，机器学习模型包括但不限于SVM(Support Vector Machine，支持向量机)、逻辑回归模型、决策树等等。

在一些实施例中，服务器获取到语音数据后，可以利用MFCC(Mel-Frequency Cepstral Coefficients，梅尔倒谱系数)对语音数据进行语音特征提取，得到对应的特征系数，将特征系数矢量化，得到对应的语音特征向量。

步骤S208，从终端获取图像数据，对获取到的图像数据进行人脸识别，得到人脸识别分数。

具体地，服务器可以按照预设的时间间隔从终端获取一帧或者连续几帧图像数据，对获取到的图像数据分别进行人脸识别，得到多个人脸识别分数，然后对得到的多个人脸识别分数取平均值，得到最终的人脸识别分数。具体来说，服务器对获取到的图像数据进行人脸识别时，首先对图片数据进行人脸检测，得到人脸图像，然后对得到的人脸图像进行预处理，预处理过程主要包括对人脸图像的光线补偿、灰度变换、直方图均衡化、归一化、几何校正、滤波以及锐化等，接着对预处理后的人脸图像进行特征提取，最后将提取到的特征数据与该签约用户预先保存的人脸图像的特征进行比对，签约用户预先保存的人脸图像可以是身份证图像，或者是通过调用公安部人脸识别接口进行人脸识别时采集的图像。

步骤S210，获取当前业务场景对应的场景标识，根据场景标识获取对应的目标审核规则。

具体地，业务场景指的是签约时的场景，包括但不限于是与贷款、租赁、各种保险购买、信用卡办理等相关的场景，当前业务场景指的是签约客户当前签约对应的业务场景，场景标识用于唯一标识业务场景。审核规则指的是用于判断客户签约意向的规则，不同的场景类别，审核规则不同。服务器获取当前业务场景对应的场景标识，可以是终端在进行语音视频双录之前向服务器发送的，也可以是在双录结束后，服务器主动从终端获取的。

进一步，在一些实施例中，服务器获取到场景标识后，可首先根据场景标识去数据库中进行查找，如果当前业务场景为已经出现过的业务场景，其对应的审核规则已保存在数据库中，因此可以直接根据场景标识查找对应的审核规则得到目标审核规则；在另一些实施例中，当前业务场景为第一次出现的业务场景，可根据场景标识查找到对应的合同模板及合同要素，基于查找到的合同要素采用合同模板对应的场景分类模型得到当前业务场景所属的场景类别，获取该场景类别对应的预设审核规则，得到目标审核规则。

步骤S212，根据文本匹配分数、欺诈风险系数值、人脸识别分数及目标审核规则得到签约意向判断结果。

具体地，服务器通过从终端获取到的语音数据、图像数据分别得到文本匹配分数、欺诈风险系数值后，结合当前业务场景对应的审核规则可以得到签约客户对应的签约意向判断结果，签约意向判断结果的分类可以事先确定，例如可以是，“确定为本人意愿签约”、“确定为非本人意愿签约”、“疑似非本人意愿签约”。

在一些实施例中，服务器可以先将文本匹配分数、欺诈风险系数值、人脸识别分数分别与目标审核规则中各自对应的阈值进行比较，根据比较结果分别确定文本匹配分数、欺诈风险系数值、人脸识别分数对应的签约意向判断结果，根据得到的三个签约意向判断结果及目标审核规则中的预设规则得到最终的签约意向判断结果。

举个例子，在车辆租赁对应的业务场景中，文本匹配分数为a1、欺诈风险系数值为a2、人脸识别分数a3，该业务场景对应的审核规则为，将文本匹配分数a1与对应的阈值A1进行比较得到第一判断结果，将欺诈风险系数a2与对应的阈值进行比较得到第二判断结果，将人脸识别分数a3与对应的阈值A3进行比较得到第三判断结果，当三个判断结果均为“确定为非本人意愿签约”时，判定最终的结果为“确定为非本人意愿签约”，当三个判断结果均为“确定为本人意愿签约”时，判定最终的结果为“确定为本人意愿签约”，除上述两种情形外的情形，判定最终的结果为“疑似非本人意愿签约”。

在另一些实施例中，可以是将文本匹配分数、欺诈风险系数值、人脸识别分数分别发送至预设的终端，根据终端返回的文本匹配分数对应的签约意向判断结果、欺诈风险系数值对应的签约意向判断结果及人脸识别分数对应的签约意向判断结果及目标审核规则中的预设规则得到最终的签约意向判断结果，例如，当终端返回的三者对应的欺诈风险系数值对应的签约意向判断结果为“本人意愿签约”时，判定最终的签约意向判断结果为“确定为本人意愿签约”，当终端返回的三者对应的欺诈风险系数值对应的签约意向判断结果均为“非本人意愿签约”时，判定最终的签约意向判断结果为“确定为非本人意向签约”，除上述两种情形外的情形，判定最终的结果为“疑似非本人意愿签约”。

在一些实施例中，当最终的结果为“疑似非本人意愿签约”时，将语音数据、图像数据一起发送至预设的终端进行复核。

上述签约意向判断方法中，服务器通过从终端获取语音数据，对语音数据进行语音识别得到对应的语音文本，对语音文本提取关键词，将提取的关键词与预设文本对应的预设关键词进行匹配，得到文本匹配分数，从语音数据中提取语音特征向量，将提取到的语音特征向量输入到已训练的欺诈风险预测模型中，得到欺诈风险系数值，从终端获取图像数据，对获取到的图像数据进行人脸识别，得到人脸识别分数，获取当前业务场景对应的场景标识，根据场景标识获取对应的目标审核规则，根据文本匹配分数、欺诈风险系数值、人脸识别分数及目标审核规则得到签约意向判断结果，通过本申请的方法，可以实现双录视频的自动审核，提高了签约意向的判断效率和准确性。

在一些实施例中，对语音文本提取关键词，包括：对语音文本进行分词，得到分词结果；对分词结果中的各个词计算特征权重，根据特征权重对分词结果中的各个词进行排序；根据排序结果选取关键词。

具体地，可首先根据标点符号将语音文本分成一条条完整的语句，再对各个切分的语句进行分词处理，如可利用字符串匹配的分词方法对各个切分的语句进行分词处理，如正向最大匹配法，把一个切分的语句中的字符串从左至右来分词；或者，反向最大匹配法，把一个切分的语句中的字符串从右至左来分词；或者，最短路径分词法，一个切分的语句中的字符串里面要求切出的词数是最少的；或者，双向最大匹配法，正反向同时进行分词匹配。还可利用词义分词法对各个切分的语句进行分词处理，词义分词法是一种机器语音判断的分词方法，利用句法信息和语义信息来处理歧义现象来分词。

进一步，服务器对分词结果中的各个词计算特征权重。具体地，首先计算各个词的词频TF，可参考如下公式进行计算：

词频TF＝某个词在文档中出现的次数/文档的总词数；

然后，计算各个词的逆文档词频IDF，可参考如下公式进行计算：

逆文档词频IDF＝错误！未找到引用源。)；

最后，计算词频TF与逆文档词频IDF的乘积得到特征权重。

进一步，计算得到特征权重后，服务器根据特征权重可以对分词结果中各个词进行排序，然后根据排序结果选取关键词。例如可以根据特征权重对各个词进行降序排列，然后选取排序靠前的预设数量的词作为关键词。

上述实施例中，通过计算特征权重选取关键词，可以使得选择的关键词更加准确。

在一些实施例中，如图3所示，获取当前业务场景对应的场景标识，根据场景标识获取对应的审核规则，包括：

步骤S302，根据场景标识查找对应的合同模板及合同要素。

具体地，客户在进行签约之前需要先确定待签约的电子合同。在本实施例中，为提高电子合同的生成效率，预先设置了合同模板，合同模板指的是抽取已有合同的固定格式和/或固定字段得到的模板，合同要素指的是组成合同的变量字段类型，例如，在与贷款有关的场景中，合同要素可以包括借款人、身份证号、住址、贷款人等等，将合同要素写入合同模板中可以得到空白的电子合同。本实施例中，场景标识分别与合同模板、合同要素建立了映射关系，根据场景标识可以查找到对应的合同模板及合同要素。

步骤S304，基于合同要素采用合同模板对应的场景分类模型，得到当前业务场景对应的场景类别。

具体地，场景分类模型用于对各个业务场景进行分类，得到对应的场景类别，场景类别根据需要进行事先划定，本实施例中，可以将审核规则相同的一类业务场景划分为一个场景类别，得到多个场景类别。

在一些实施例中，场景分类模型的训练步骤包括：获取各个合同模板对应的历史合同要素及对应的场景类别，将历史合同要素作为输入样本，将对应的场景类别作为期望的输出样本进行模型训练，得到各个合同模板对应的场景分类模型。在进行模型训练时，可采用有监督的机器学习模型进行训练，例如SVM(Support Vector Machine，支持向量机)、逻辑回归模型、决策树等，在进行模型训练时，可采用最小二乘法和梯度下降等算法。可以理解，本实施例中，可以分别针对每一个合同模板训练一个场景分类模型，也可以对多个合同模型训练一个统一的场景分类模型，如将格式不同、但固定字段相同或相近的多个合同模板训练一个统一的场景分类模型。

步骤S306，获取场景类别对应的预设审核规则，将预设审核规则作为目标审核规则。

具体地，对于每一个场景类别，事先设定了对应的审核规则，服务器在获取到当前业务场景对应的场景类别时，可以将该场景类别对应的审核规则作为目标审核规则。

上述实施例中，通过场景分类模型来获取当前业务场景对应的场景类别，将场景类别对应的审核规则作为目标审核规则，可以提高目标审核规则获取的效率和准确率。

在一些实施例中，为进一步确保获取的审核规则的准确性，基于合同要素采用合同模板对应的场景分类模型，得到当前业务场景对应的场景类别之前，方法包括：获取当前签约用户对应的个人信息；基于合同要素采用合同模板对应的场景分类模型，得到当前业务场景对应的场景类别，包括：基于个人信息、合同要素采用合同模板对应的场景分类模型，得到当前业务场景对应的场景类别。签约客户的个人信息，包括性别、年龄、职业、薪资等。

在一些实施例中，从语音数据中提取语音特征向量，包括：利用MFCC((Mel-scale Frequency Cepstral Coefficients，梅尔倒谱系数)对语音数据进行语音特征提取，得到对应的特征参数；将特征参数矢量化，得到对应的语音特征向量。

具体地，首先对先对语音进行预加重、分帧和加窗，对每一个短时分析窗，通过FFT(Fast Fourier Transform,快速傅利叶转换)得到对应的频谱，将得到的频谱通过Mel滤波器组得到Mel频谱，在Mel频谱上面进行倒谱分析，包括取对数，通过DCT(Discrete cosine transform,离散余弦变换)来实现逆变换，取DCT后的第2个到第13个系数作为特征系数，进一步，将特征系数矢量化，得到语音特征向量。

上述实施例中，通过MFCC提取语音特征向量，得到的语音特征向量能够更加准确的反映语音的特征。

在一些实施例中，欺诈风险预测模型的生成步骤包括：从语音数据库中获取预设数量的历史语音数据及对应的历史欺诈风险系数值；对历史语音数据提取历史语音特征向量；将历史语音特征向量作为输入样本，将对应的历史欺诈风险系数值作为期望的输出样本进行模型训练，得到已训练的欺诈风险预测模型。

具体地，语音数据库中的历史语音数据为欺诈风险系数值已经确定的语音数据，因此可作为机器学习的训练样本，服务器语音数据库中选取到历史语音数据后，可对这些历史语音数据提取历史语音特征向量，将提取的历史语音特征向量作为模型训练时的输入样本，将其对应的欺诈风险系数值作为期望的输出样本进行模型训练，训练的过程就是对模型的参数进行不断调整的过程。在进行模型训练时，可以采用有监督的模型训练方式，例如逻辑回归模型、SVM(Support Vector Machine,支持向量机)以及贝叶斯模型等。

在一些实施例中，以SVM为例，可以采用随机梯度算法进行模型训练，在梯度下降过程中需要使得代价函数J(θ)最小，在一些实施例中，代价函数可以采用以下公式表示：

m表示训练集中样本特征的个数，x ⁽ⁱ⁾为输入的历史语音特征向量，y ⁽ⁱ⁾表示期望输出的欺诈风险系数值，h _θ(x ⁽ⁱ⁾)表示每次训练的实际输出的欺诈风险系数值，其中：

错误！未找到引用源。，即θ ^Tx等于历史语音特征向量与参数的乘积的和。

应该理解的是，虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一些实施例中，如图4所示，提供了一种签约意向判断装置400，包括：语音数据获取模块402、关键词匹配模块404、语音特征向量提取模块406、图像数据获取模块408、目标审核规则获取模块410和签约意向判断模块412，其中：

语音数据获取模块402用于从终端获取语音数据；

关键词匹配模块404用于对语音数据进行语音识别得到对应的语音文本，对语音文本提取关键词，将提取的关键词与预设文本对应的预设关键词进行匹配，得到文本匹配分数；

语音特征向量提取模块406用于从语音数据中提取语音特征向量，将提取到的语音特征向量输入到已训练的欺诈风险预测模型中，得到欺诈风险系数值；

图像数据获取模块408用于从终端获取图像数据，对获取到的图像数据进行人脸识别，得到人脸识别分数；

目标审核规则获取模块410用于获取当前业务场景对应的场景标识，根据场景标识获取对应的目标审核规则；

签约意向判断模块412用于根据文本匹配分数、欺诈风险系数值、人脸识别分数及目标审核规则得到签约意向判断结果。

在一些实施例中，关键词匹配模块404还用于对语音文本进行分词，得到分词结果；对分词结果中的各个词计算特征权重，根据特征权重对分词结果中的各个词进行排序；根据排序结果选取关键词。

在一些实施例中，目标审核规则获取模块410用于根据场景标识查找对应的合同模板及合同要素；基于合同要素采用合同模板对应的场景分类模型，得到当前业务场景对应的场景类别；获取场景类别对应的预设审核规则，将预设审核规则作为目标审核规则。

在一些实施例中，上述装置还包括：个人信息获取模块，用于获取当前签约用户对应的个人信息；目标审核规则获取模块410还用于基于个人信息、合同要素采用合同模板对应的场景分类模型，得到当前业务场景对应的场景类别。

在一些实施例中，语音特征向量提取模块406还用于利用梅尔倒谱系数对语音数据进行语音特征提取，得到对应的特征参数；将特征参数矢量化，得到对应的语音特征向量。

在一些实施例中，上述装置还包括：欺诈风险预测模型生成模块，用于从语音数据库中获取预设数量的历史语音数据及对应的历史欺诈风险系数值；对历史语音数据提取历史语音特征向量；将历史语音特征向量作为输入样本，将对应的历史欺诈风险系数值作为期望的输出样本进行模型训练，得到已训练的欺诈风险预测模型。

关于签约意向判断装置的具体限定可以参见上文中对于签约意向判断方法的限定，在此不再赘述。上述签约意向判断装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一些实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性计算机可读存储介质、内存储器。该非易失性计算机可读存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储语音数据、图像数据、审核规则等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种签约意向判断方法。

本领域技术人员可以理解，图5中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

一种计算机设备，包括存储器和一个或多个处理器，存储器中储存有计算机可读指令，计算机可读指令被处理器执行时，使得一个或多个处理器执行以下步骤：：从终端获取语音数据；对语音数据进行语音识别得到对应的语音文本，对语音文本提取关键词，将提取的关键词与预设文本对应的预设关键词进行匹配，得到文本匹配分数；从语音数据中提取语音特征向量，将提取到的语音特征向量输入到已训练的欺诈风险预测模型中，得到欺诈风险系数值；从终端获取图像数据，对获取到的图像数据进行人脸识别，得到人脸识别分数；获取当前业务场景对应的场景标识，根据场景标识获取对应的目标审核规则；根据文本匹配分数、欺诈风险系数值、人脸识别分数及目标审核规则得到签约意向判断结果。

在一些实施例中，获取当前业务场景对应的场景标识，根据场景标识获取对应的审核规则，包括：根据场景标识查找对应的合同模板及合同要素；基于合同要素采用合同模板对应的场景分类模型，得到当前业务场景对应的场景类别；获取场景类别对应的预设审核规则，将预设审核规则作为目标审核规则。

在一些实施例中，基于合同要素采用合同模板对应的场景分类模型，得到当前业务场景对应的场景类别之前，处理器执行计算机可读指令时还实现以下步骤：获取当前签约用户对应的个人信息；基于合同要素采用合同模板对应的场景分类模型，得到当前业务场景对应的场景类别，包括：基于个人信息、合同要素采用合同模板对应的场景分类模型，得到当前业务场景对应的场景类别。

在一些实施例中，从语音数据中提取语音特征向量，包括：利用梅尔倒谱系数对语音数据进行语音特征提取，得到对应的特征参数；将特征参数矢量化，得到对应的语音特征向量。

在一些实施例中，处理器执行计算机可读指令时还实现以下步骤：从语音数据库中获取预设数量的历史语音数据及对应的历史欺诈风险系数值；对历史语音数据提取历史语音特征向量；将历史语音特征向量作为输入样本，将对应的历史欺诈风险系数值作为期望的输出样本进行模型训练，得到已训练的欺诈风险预测模型。

一个或多个存储有计算机可读指令的非易失性计算机可读存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：：从终端获取语音数据；对语音数据进行语音识别得到对应的语音文本，对语音文本提取关键词，将提取的关键词与预设文本对应的预设关键词进行匹配，得到文本匹配分数；从语音数据中提取语音特征向量，将提取到的语音特征向量输入到已训练的欺诈风险预测模型中，得到欺诈风险系数值；从终端获取图像数据，对获取到的图像数据进行人脸识别，得到人脸识别分数；获取当前业务场景对应的场景标识，根据场景标识获取对应的目标审核规则；根据文本匹配分数、欺诈风险系数值、人脸识别分数及目标审核规则得到签约意向判断结果。

在一些实施例中，基于合同要素采用合同模板对应的场景分类模型，得到当前业务场景对应的场景类别之前，计算机可读指令被处理器执行时还实现以下步骤：获取当前签约用户对应的个人信息；基于合同要素采用合同模板对应的场景分类模型，得到当前业务场景对应的场景类别，包括：基于个人信息、合同要素采用合同模板对应的场景分类模型，得到当前业务场景对应的场景类别。

在一些实施例中，计算机可读指令被处理器执行时还实现以下步骤：从语音数据库中获取预设数量的历史语音数据及对应的历史欺诈风险系数值；对历史语音数据提取历史语音特征向量；将历史语音特征向量作为输入样本，将对应的历史欺诈风险系数值作为期望的输出样本进行模型训练，得到已训练的欺诈风险预测模型。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种签约意向判断方法，包括：

从终端获取语音数据；

对所述语音数据进行语音识别得到对应的语音文本，对所述语音文本提取关键词，将提取的关键词与预设文本对应的预设关键词进行匹配，得到文本匹配分数；

从所述语音数据中提取语音特征向量，将提取到的所述语音特征向量输入到已训练的欺诈风险预测模型中，得到欺诈风险系数值；

从所述终端获取图像数据，对获取到的所述图像数据进行人脸识别，得到人脸识别分数；

获取当前业务场景对应的场景标识，根据所述场景标识获取对应的目标审核规则；及

根据所述文本匹配分数、所述欺诈风险系数值、所述人脸识别分数及所述目标审核规则得到签约意向判断结果。
根据权利要求1所述的方法，其特征在于，所述对所述语音文本提取关键词，包括：

对所述语音文本进行分词，得到分词结果；

对所述分词结果中的各个词计算特征权重，根据所述特征权重对所述分词结果中的各个词进行排序；及

根据排序结果选取关键词。
根据权利要求1所述的方法，其特征在于，所述获取当前业务场景对应的场景标识，根据所述场景标识获取对应的审核规则，包括：

根据所述场景标识查找对应的合同模板及合同要素；

基于所述合同要素采用所述合同模板对应的场景分类模型，得到所述当前业务场景对应的场景类别；及

获取所述场景类别对应的预设审核规则，将所述预设审核规则作为目标审核规则。
根据权利要求3所述的方法，其特征在于，在所述基于所述合同要素采用所述合同模板对应的场景分类模型，得到当前业务场景对应的场景类别之前，所述方法包括：

获取当前签约用户对应的个人信息；及

所述基于所述合同要素采用所述合同模板对应的场景分类模型，得到当前业务场景对应的场景类别，包括：

基于所述个人信息、所述合同要素采用所述合同模板对应的场景分类模型，得到当前业务场景对应的场景类别。
根据权利要求1所述的方法，其特征在于，所述从所述语音数据中提取语音特征向量，包括：

利用梅尔倒谱系数对所述语音数据进行语音特征提取，得到对应的特征参数；及

将所述特征参数矢量化，得到对应的语音特征向量。
根据权利要求1至5任意一项所述的方法，其特征在于，所述欺诈风险预测模型的生成步骤包括：

从语音数据库中获取预设数量的历史语音数据及对应的历史欺诈风险系数值；

对所述历史语音数据提取历史语音特征向量；及

将所述历史语音特征向量作为输入样本，将对应的所述历史欺诈风险系数值作为期望的输出样本进行模型训练，得到已训练的欺诈风险预测模型。
一种签约意向判断装置，包括：

语音数据获取模块，用于从终端获取语音数据；

关键词匹配模块，用于对所述语音数据进行语音识别得到对应的语音文本，对所述语音文本提取关键词，将提取的关键词与预设文本对应的预设关键词进行匹配，得到文本匹配分数；

语音特征向量提取模块，用于从所述语音数据中提取语音特征向量，将提取到的所述语音特征向量输入到已训练的欺诈风险预测模型中，得到欺诈风险系数值；

图像数据获取模块，用于从所述终端获取图像数据，对获取到的所述图像数据进行人脸识别，得到人脸识别分数；

目标审核规则获取模块，用于获取当前业务场景对应的场景标识，根据所述场景标识获取对应的目标审核规则；及

签约意向判断模块，用于根据所述文本匹配分数、所述欺诈风险系数值、所述人脸识别分数及所述目标审核规则得到签约意向判断结果。
根据权利要求7所述的装置，其特征在于，目标审核规则获取模块用于根据所述场景标识查找对应的合同模板及合同要素；基于所述合同要素采用所述合同模板对应的场景分类模型，得到所述当前业务场景对应的场景类别；获取所述场景类别对应的预设审核规则，将所述预设审核规则作为目标审核规则。
一种计算机设备，包括存储器及一个或多个处理器，所述存储器中储存有计算机可读指令，所述计算机可读指令被所述一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

从终端获取语音数据；

对所述语音数据进行语音识别得到对应的语音文本，对所述语音文本提取关键词，将提取的关键词与预设文本对应的预设关键词进行匹配，得到文本匹配分数；

从所述语音数据中提取语音特征向量，将提取到的所述语音特征向量输入到已训练的欺诈风险预测模型中，得到欺诈风险系数值；

从所述终端获取图像数据，对获取到的所述图像数据进行人脸识别，得到人脸识别分数；

获取当前业务场景对应的场景标识，根据所述场景标识获取对应的目标审核规则；及

根据所述文本匹配分数、所述欺诈风险系数值、所述人脸识别分数及所述目标审核规则得到签约意向判断结果。
根据权利要求9所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

对所述语音文本进行分词，得到分词结果；

对所述分词结果中的各个词计算特征权重，根据所述特征权重对所述分词结果中的各个词进行排序；及

根据排序结果选取关键词。
根据权利要求9所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

根据所述场景标识查找对应的合同模板及合同要素；

基于所述合同要素采用所述合同模板对应的场景分类模型，得到所述当前业务场景对应的场景类别；及

获取所述场景类别对应的预设审核规则，将所述预设审核规则作为目标审核规则。
根据权利要求11所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

获取当前签约用户对应的个人信息；及

基于所述个人信息、所述合同要素采用所述合同模板对应的场景分类模型，得到当前业务场景对应的场景类别。
根据权利要求9所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

利用梅尔倒谱系数对所述语音数据进行语音特征提取，得到对应的特征参数；及

将所述特征参数矢量化，得到对应的语音特征向量。
根据权利要求9至13任意一项所述的计算机设备，其特征在于，所述处理器执行所述计算机可读指令时还执行以下步骤：

从语音数据库中获取预设数量的历史语音数据及对应的历史欺诈风险系数值；

对所述历史语音数据提取历史语音特征向量；及

将所述历史语音特征向量作为输入样本，将对应的所述历史欺诈风险系数值作为期望的输出样本进行模型训练，得到已训练的欺诈风险预测模型。
一个或多个存储有计算机可读指令的非易失性计算机可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

从终端获取语音数据；

对所述语音数据进行语音识别得到对应的语音文本，对所述语音文本提取关键词，将提取的关键词与预设文本对应的预设关键词进行匹配，得到文本匹配分数；

从所述语音数据中提取语音特征向量，将提取到的所述语音特征向量输入到已训练的欺诈风险预测模型中，得到欺诈风险系数值；

从所述终端获取图像数据，对获取到的所述图像数据进行人脸识别，得到人脸识别分数；

获取当前业务场景对应的场景标识，根据所述场景标识获取对应的目标审核规则；及

根据所述文本匹配分数、所述欺诈风险系数值、所述人脸识别分数及所述目标审核规则得到签约意向判断结果。
根据权利要求15所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行时还执行以下步骤：

对所述语音文本进行分词，得到分词结果；

对所述分词结果中的各个词计算特征权重，根据所述特征权重对所述分词结果中的各个词进行排序；及

根据排序结果选取关键词。
根据权利要求15所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行时还执行以下步骤：

根据所述场景标识查找对应的合同模板及合同要素；

基于所述合同要素采用所述合同模板对应的场景分类模型，得到所述当前业务场景对应的场景类别；及

获取所述场景类别对应的预设审核规则，将所述预设审核规则作为目标审核规则。
根据权利要求17所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行时还执行以下步骤：

获取当前签约用户对应的个人信息；及

基于所述个人信息、所述合同要素采用所述合同模板对应的场景分类模型，得到当前业务场景对应的场景类别。
根据权利要求15所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行时还执行以下步骤：

利用梅尔倒谱系数对所述语音数据进行语音特征提取，得到对应的特征参数；及

将所述特征参数矢量化，得到对应的语音特征向量。
根据权利要求15至19任意一项所述的存储介质，其特征在于，所述计算机可读指令被所述处理器执行时还执行以下步骤：

从语音数据库中获取预设数量的历史语音数据及对应的历史欺诈风险系数值；

对所述历史语音数据提取历史语音特征向量；及

将所述历史语音特征向量作为输入样本，将对应的所述历史欺诈风险系数值作为期望的输出样本进行模型训练，得到已训练的欺诈风险预测模型。