CN109543516A - 签约意向判断方法、装置、计算机设备和存储介质 - Google Patents
签约意向判断方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN109543516A CN109543516A CN201811202720.0A CN201811202720A CN109543516A CN 109543516 A CN109543516 A CN 109543516A CN 201811202720 A CN201811202720 A CN 201811202720A CN 109543516 A CN109543516 A CN 109543516A
- Authority
- CN
- China
- Prior art keywords
- scene
- voice
- text
- contract
- fraud risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 239000013598 vector Substances 0.000 claims abstract description 61
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 238000013145 classification model Methods 0.000 claims description 35
- 230000011218 segmentation Effects 0.000 claims description 34
- 238000013058 risk prediction model Methods 0.000 claims description 23
- 238000012550 audit Methods 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 17
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 8
- 238000012706 support-vector machine Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 230000002747 voluntary effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/40—Spoof detection, e.g. liveness detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Software Systems (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及自然语言处理技术领域,提供了一种签约意向判断方法、装置、计算机设备和存储介质。所述方法包括:从终端获取语音数据;对语音数据进行语音识别得到对应的语音文本,对语音文本提取关键词,将提取的关键词与预设文本对应的预设关键词进行匹配,得到文本匹配分数;从语音数据中提取语音特征向量,将提取到的语音特征向量输入到已训练的欺诈风险预测模型中,得到欺诈风险系数值;从终端获取图像数据,对获取到的图像数据进行人脸识别,得到人脸识别分数;获取当前业务场景对应的场景标识,根据场景标识获取对应的目标审核规则;根据文本匹配分数、欺诈风险系数值、人脸识别分数及目标审核规则得到签约意向判断结果。
Description
技术领域
本申请涉及自然语言处理技术领域,特别是涉及一种签约意向判断方法、装置、计算机设备和存储介质。
背景技术
现代社会中,需要进行签约的场景非常多,与办理保险业务、借贷业务、租赁业务时,都需要与保险公司、租赁公司等进行签约。
传统技术中,在签约前往往缺乏双录服务。应监管要求,现在大量签约场景需增加视频语音双录功能,但目前的双录材料往往需要后续人工审核校验来判断签约人的签约意向,不仅效率低下而且准确性并不高。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高签约意向判断效率和准确性的签约意向判断方法、装置、计算机设备和存储介质。
一种签约意向判断方法,所述方法包括:
从终端获取语音数据;
对所述语音数据进行语音识别得到对应的语音文本,对所述语音文本提取关键词,将提取的关键词与预设文本对应的预设关键词进行匹配,得到文本匹配分数;
从所述语音数据中提取语音特征向量,将提取到的所述语音特征向量输入到已训练的欺诈风险预测模型中,得到欺诈风险系数值;
从所述终端获取图像数据,对获取到的所述图像数据进行人脸识别,得到人脸识别分数;
获取当前业务场景对应的场景标识,根据所述场景标识获取对应的目标审核规则;
根据所述文本匹配分数、所述欺诈风险系数值、所述人脸识别分数及所述目标审核规则得到签约意向判断结果。
在其中一个实施例中,所述对所述语音文本提取关键词,包括:
对所述语音文本进行分词,得到分词结果;
对所述分词结果中的各个词计算特征权重,根据所述特征权重对所述分词结果中的各个词进行排序;
根据排序结果选取关键词。
在其中一个实施例中,所述获取当前业务场景对应的场景标识,根据所述场景标识获取对应的审核规则,包括:
根据所述场景标识查找对应的合同模板及合同要素;
基于所述合同要素采用所述合同模板对应的场景分类模型,得到所述当前业务场景对应的场景类别;
获取所述场景类别对应的预设审核规则,将所述预设审核规则作为目标审核规则。
在其中一个实施例中,所述基于所述合同要素采用所述合同模板对应的场景分类模型,得到当前业务场景对应的场景类别之前,所述方法包括:、
获取当前签约用户对应的个人信息;
所述基于所述合同要素采用所述合同模板对应的场景分类模型,得到当前业务场景对应的场景类别,包括:
基于所述个人信息、所述合同要素采用所述合同模板对应的场景分类模型,得到当前业务场景对应的场景类别。
在其中一个实施例中,所述从所述语音数据中提取语音特征向量,包括:
利用梅尔倒谱系数对所述语音数据进行语音特征提取,得到对应的特征参数;
将所述特征参数矢量化,得到对应的语音特征向量。
在其中一个实施例中,所述欺诈风险预测模型的生成步骤包括:
从语音数据库中获取预设数量的历史语音数据及对应的历史欺诈风险系数值;
对所述历史语音数据提取历史语音特征向量;
将所述历史语音特征向量作为输入样本,将对应的所述历史欺诈风险系数值作为期望的输出样本进行模型训练,得到已训练的欺诈风险预测模型。
一种签约意向判断装置,所述装置包括:
语音数据获取模块,用于从终端获取语音数据;
关键词匹配模块,用于对所述语音数据进行语音识别得到对应的语音文本,对所述语音文本提取关键词,将提取的关键词与预设文本对应的预设关键词进行匹配,得到文本匹配分数;
语音特征向量提取模块,用于从所述语音数据中提取语音特征向量,将提取到的所述语音特征向量输入到已训练的欺诈风险预测模型中,得到欺诈风险系数值;
图像数据获取模块,用于从所述终端获取图像数据,对获取到的所述图像数据进行人脸识别,得到人脸识别分数;
目标审核规则获取模块,用于获取当前业务场景对应的场景标识,根据所述场景标识获取对应的目标审核规则;
签约意向判断模块,用于根据所述文本匹配分数、所述欺诈风险系数值、所述人脸识别分数及所述目标审核规则得到签约意向判断结果。
在其中一个实施例中,目标审核规则获取模块用于根据所述场景标识查找对应的合同模板及合同要素;基于所述合同要素采用所述合同模板对应的场景分类模型,得到所述当前业务场景对应的场景类别;获取所述场景类别对应的预设审核规则,将所述预设审核规则作为目标审核规则。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任意实施例所述的签约意向判断方法所述的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意实施例所述的签约意向判断方法所述的步骤。
上述签约意向判断方法、装置、计算机设备和存储介质,通过从终端获取语音数据,对所述语音数据进行语音识别得到对应的语音文本,对所述语音文本提取关键词,将提取的关键词与预设文本对应的预设关键词进行匹配,得到文本匹配分数,从所述语音数据中提取语音特征向量,将提取到的所述语音特征向量输入到已训练的欺诈风险预测模型中,得到欺诈风险系数值,从所述终端获取图像数据,对获取到的所述图像数据进行人脸识别,得到人脸识别分数,获取当前业务场景对应的场景标识,根据所述场景标识获取对应的目标审核规则,根据所述文本匹配分数、所述欺诈风险系数值、所述人脸识别分数及所述目标审核规则得到签约意向判断结果,通过本申请的方法,可以实现双录视频的自动审核,提高了签约意向的判断效率和准确性。
附图说明
图1为一个实施例中签约意向判断方法的应用场景图;
图2为一个实施例中签约意向判断方法的流程示意图;
图3为一个实施例中步骤S210的流程示意图;
图4为一个实施例中签约意向判断装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的签约意向判断方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信,终端102用于对客户进行语音和视频的录制。服务器104首先从终端获取语音数据,然后对语音数据进行语音识别得到对应的语音文本,对语音文本提取关键词,将提取的关键词与预设对应的预设关键词进行匹配,得到文本匹配分数;接着从语音数据中提取语音特征向量,将提取到的语音特征向量输入到已训练的欺诈风险预测模型中,得到欺诈风险系数值;从终端获取图像数据,对获取到的图像数据进行人脸识别,得到人脸识别分数;获取当前业务场景对应的场景标识,根据场景标识获取对应的目标审核规则;根据文本匹配分数、欺诈风险系数值、人脸识别分数及审核规则得到签约意向判断结果。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种签约意向判断方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S202,从终端获取语音数据。
本实施例中,给定签约客户一段预设的文本,例如知情同意书等,客户朗读文本,终端对客户进行语音和视频的录制,服务器可以从终端获取录制的语音数据。具体来说,可以是在签约客户朗读完整个文本后,服务器获取终端上传的整个文本对应的语音数据;也可以是在签约客户朗读的过程中,服务器间隔一定的时间从终端获取语音数据,例如,可以约定签约用户每读完一句完整的句子,进行停顿,当终端检测到语音空白时段超过预设阈值时,将当前录制好的语音数据发送至服务器,其中,当前录制好的语音数据指的是从上一次发送完语音数据开始录制的语音数据。
步骤S204,对语音数据进行语音识别得到对应的语音文本,对语音文本提取关键词,将提取的关键词与预设文本对应的预设关键词进行匹配,得到文本匹配分数。
具体地,预设文本指的是给定的朗读文本,是签约客户进行语音视频双录时需要朗读的原始文本。在本实施例中,对于预设文本,需要预先进行关键词提取,提取的关键词作为预设关键词。当服务器获取到终端录制的语音数据时,首先对语音数据进行预处理,包括降噪和语音增强等,然后对预处理后的语音数据进行语音识别得到语音文本,然后将得到的语音文本进行关键词提取,得到该语音文本对应的关键词,将这些关键词与预设关键词进行匹配,并计算匹配度,得到文本匹配分数。其中,语音识别可采用现有技术中任意语音识别方法,本申请在此不再赘述。
在一个实施例中,对语音文本提取关键词,包括:对语音文本进行分词,对分词得到的各个词计算TF-IDF权重,然后根据TF-IDF权重对各个词进行降序排列,将排序靠前的预设数量的词作为关键词。
在一个实施例中,将提取的关键词与预设文本对应的预设关键词进行匹配,得到文本匹配分数,包括:首先计算语音文本对应的关键词中与预设关键词相匹配的词数量,根据匹配上的词数量与预设关键词的总词数的比值得到文本匹配分数。举例来说,语音文本对应的关键词为A、B、D,预设关键词包括A、B、C、D、E,则匹配词数量为3,文本匹配分数为:3/5x100=60。
步骤S206,从语音数据中提取语音特征向量,将提取到的语音特征向量输入到已训练的欺诈风险预测模型中,得到欺诈风险系数值。
其中,欺诈风险预测模型用于根据语音数据对签约客户的欺诈风险系数值进行预测,欺诈风险系数值用于表征签约客户可能存在的欺诈风险,欺诈风险系数值越大,表示签约客户存在的欺诈风险越大。欺诈风险预测模型可基于历史数据通过有监督的机器学习模型训练得到,其中,机器学习模型包括但不限于SVM(Support Vector Machine,支持向量机)、逻辑回归模型、决策树等等。
在一个实施例中,服务器获取到语音数据后,可以利用MFCC(Mel-FrequencyCepstral Coefficients,梅尔倒谱系数)对语音数据进行语音特征提取,得到对应的特征系数,将特征系数矢量化,得到对应的语音特征向量。
步骤S208,从终端获取图像数据,对获取到的图像数据进行人脸识别,得到人脸识别分数。
具体地,服务器可以按照预设的时间间隔从终端获取一帧或者连续几帧图像数据,对获取到的图像数据分别进行人脸识别,得到多个人脸识别分数,然后对得到的多个人脸识别分数取平均值,得到最终的人脸识别分数。具体来说,服务器对获取到的图像数据进行人脸识别时,首先对图片数据进行人脸检测,得到人脸图像,然后对得到的人脸图像进行预处理,预处理过程主要包括对人脸图像的光线补偿、灰度变换、直方图均衡化、归一化、几何校正、滤波以及锐化等,接着对预处理后的人脸图像进行特征提取,最后将提取到的特征数据与该签约用户预先保存的人脸图像的特征进行比对,其中,签约用户预先保存的人脸图像可以是身份证图像,或者是通过调用公安部人脸识别接口进行人脸识别时采集的图像。
步骤S210,获取当前业务场景对应的场景标识,根据场景标识获取对应的目标审核规则。
具体地,业务场景指的是签约时的场景,包括但不限于是与贷款、租赁、各种保险购买、信用卡办理等相关的场景,当前业务场景指的是签约客户当前签约对应的业务场景,场景标识用于唯一标识业务场景。审核规则指的是用于判断客户签约意向的规则,不同的场景类别,审核规则不同。服务器获取当前业务场景对应的场景标识,可以是终端在进行语音视频双录之前向服务器发送的,也可以是在双录结束后,服务器主动从终端获取的。
进一步,在一个实施例中,服务器获取到场景标识后,可首先根据场景标识去数据库中进行查找,如果当前业务场景为已经出现过的业务场景,其对应的审核规则已保存在数据库中,因此可以直接根据场景标识查找对应的审核规则得到目标审核规则;在另一个实施例中,当前业务场景为第一次出现的业务场景,可根据场景标识查找到对应的合同模板及合同要素,基于查找到的合同要素采用合同模板对应的场景分类模型得到当前业务场景所属的场景类别,获取该场景类别对应的预设审核规则,得到目标审核规则。
步骤S212,根据文本匹配分数、欺诈风险系数值、人脸识别分数及目标审核规则得到签约意向判断结果。
具体地,服务器通过从终端获取到的语音数据、图像数据分别得到文本匹配分数、欺诈风险系数值后,结合当前业务场景对应的审核规则可以得到签约客户对应的签约意向判断结果,其中,签约意向判断结果的分类可以事先确定,例如可以是,“确定为本人意愿签约”、“确定为非本人意愿签约”、“疑似非本人意愿签约”。
在一个实施例中,服务器可以先将文本匹配分数、欺诈风险系数值、人脸识别分数分别与目标审核规则中各自对应的阈值进行比较,根据比较结果分别确定文本匹配分数、欺诈风险系数值、人脸识别分数对应的签约意向判断结果,根据得到的三个签约意向判断结果及目标审核规则中的预设规则得到最终的签约意向判断结果。
举个例子,在车辆租赁对应的业务场景中,文本匹配分数为a1、欺诈风险系数值为a2、人脸识别分数a3,该业务场景对应的审核规则为,将文本匹配分数a1与对应的阈值A1进行比较得到第一判断结果,将欺诈风险系数a2与对应的阈值进行比较得到第二判断结果,将人脸识别分数a3与对应的阈值A3进行比较得到第三判断结果,当三个判断结果均为“确定为非本人意愿签约”时,判定最终的结果为“确定为非本人意愿签约”,当三个判断结果均为“确定为本人意愿签约”时,判定最终的结果为“确定为本人意愿签约”,除上述两种情形外的情形,判定最终的结果为“疑似非本人意愿签约”。
在另一个实施例中,可以是将文本匹配分数、欺诈风险系数值、人脸识别分数分别发送至预设的终端,根据终端返回的文本匹配分数对应的签约意向判断结果、欺诈风险系数值对应的签约意向判断结果及人脸识别分数对应的签约意向判断结果及目标审核规则中的预设规则得到最终的签约意向判断结果,例如,当终端返回的三者对应的欺诈风险系数值对应的签约意向判断结果为“本人意愿签约”时,判定最终的签约意向判断结果为“确定为本人意愿签约”,当终端返回的三者对应的欺诈风险系数值对应的签约意向判断结果均为“非本人意愿签约”时,判定最终的签约意向判断结果为“确定为非本人意向签约”,除上述两种情形外的情形,判定最终的结果为“疑似非本人意愿签约”。
在一个实施例中,当最终的结果为“疑似非本人意愿签约”时,将语音数据、图像数据一起发送至预设的终端进行复核。
上述签约意向判断方法中,服务器通过从终端获取语音数据,对语音数据进行语音识别得到对应的语音文本,对语音文本提取关键词,将提取的关键词与预设文本对应的预设关键词进行匹配,得到文本匹配分数,从语音数据中提取语音特征向量,将提取到的语音特征向量输入到已训练的欺诈风险预测模型中,得到欺诈风险系数值,从终端获取图像数据,对获取到的图像数据进行人脸识别,得到人脸识别分数,获取当前业务场景对应的场景标识,根据场景标识获取对应的目标审核规则,根据文本匹配分数、欺诈风险系数值、人脸识别分数及目标审核规则得到签约意向判断结果,通过本申请的方法,可以实现双录视频的自动审核,提高了签约意向的判断效率和准确性。
在一个实施例中,对语音文本提取关键词,包括:对语音文本进行分词,得到分词结果;对分词结果中的各个词计算特征权重,根据特征权重对分词结果中的各个词进行排序;根据排序结果选取关键词。
具体地,可首先根据标点符号将语音文本分成一条条完整的语句,再对各个切分的语句进行分词处理,如可利用字符串匹配的分词方法对各个切分的语句进行分词处理,如正向最大匹配法,把一个切分的语句中的字符串从左至右来分词;或者,反向最大匹配法,把一个切分的语句中的字符串从右至左来分词;或者,最短路径分词法,一个切分的语句中的字符串里面要求切出的词数是最少的;或者,双向最大匹配法,正反向同时进行分词匹配。还可利用词义分词法对各个切分的语句进行分词处理,词义分词法是一种机器语音判断的分词方法,利用句法信息和语义信息来处理歧义现象来分词。
进一步,服务器对分词结果中的各个词计算特征权重。具体地,首先计算各个词的词频TF,可参考如下公式进行计算:
词频TF=某个词在文档中出现的次数/文档的总词数;
然后,计算各个词的逆文档词频IDF,可参考如下公式进行计算:
最后,计算词频TF与逆文档词频IDF的乘积得到特征权重。
进一步,计算得到特征权重后,服务器根据特征权重可以对分词结果中各个词进行排序,然后根据排序结果选取关键词。例如可以根据特征权重对各个词进行降序排列,然后选取排序靠前的预设数量的词作为关键词。
上述实施例中,通过计算特征权重选取关键词,可以使得选择的关键词更加准确。
在一个实施例中,如图3所示,获取当前业务场景对应的场景标识,根据场景标识获取对应的审核规则,包括:
步骤S302,根据场景标识查找对应的合同模板及合同要素。
具体地,客户在进行签约之前需要先确定待签约的电子合同。在本实施例中,为提高电子合同的生成效率,预先设置了合同模板,其中,合同模板指的是抽取已有合同的固定格式和/或固定字段得到的模板,合同要素指的是组成合同的变量字段类型,例如,在与贷款有关的场景中,合同要素可以包括借款人、身份证号、住址、贷款人等等,将合同要素写入合同模板中可以得到空白的电子合同。本实施例中,场景标识分别与合同模板、合同要素建立了映射关系,根据场景标识可以查找到对应的合同模板及合同要素。
步骤S304,基于合同要素采用合同模板对应的场景分类模型,得到当前业务场景对应的场景类别。
具体地,场景分类模型用于对各个业务场景进行分类,得到对应的场景类别,场景类别根据需要进行事先划定,本实施例中,可以将审核规则相同的一类业务场景划分为一个场景类别,得到多个场景类别。
在一个实施例中,场景分类模型的训练步骤包括:获取各个合同模板对应的历史合同要素及对应的场景类别,将历史合同要素作为输入样本,将对应的场景类别作为期望的输出样本进行模型训练,得到各个合同模板对应的场景分类模型。在进行模型训练时,可采用有监督的机器学习模型进行训练,例如SVM(Support Vector Machine,支持向量机)、逻辑回归模型、决策树等,在进行模型训练时,可采用最小二乘法和梯度下降等算法。可以理解,本实施例中,可以分别针对每一个合同模板训练一个场景分类模型,也可以对多个合同模型训练一个统一的场景分类模型,如将格式不同、但固定字段相同或相近的多个合同模板训练一个统一的场景分类模型。
步骤S306,获取场景类别对应的预设审核规则,将预设审核规则作为目标审核规则。
具体地,对于每一个场景类别,事先设定了对应的审核规则,服务器在获取到当前业务场景对应的场景类别时,可以将该场景类别对应的审核规则作为目标审核规则。
上述实施例中,通过场景分类模型来获取当前业务场景对应的场景类别,将场景类别对应的审核规则作为目标审核规则,可以提高目标审核规则获取的效率和准确率。
在一个实施例中,为进一步确保获取的审核规则的准确性,基于合同要素采用合同模板对应的场景分类模型,得到当前业务场景对应的场景类别之前,方法包括:获取当前签约用户对应的个人信息;基于合同要素采用合同模板对应的场景分类模型,得到当前业务场景对应的场景类别,包括:基于个人信息、合同要素采用合同模板对应的场景分类模型,得到当前业务场景对应的场景类别。其中,签约客户的个人信息,包括性别、年龄、职业、薪资等。
在一个实施例中,从语音数据中提取语音特征向量,包括:利用MFCC((Mel-scaleFrequency Cepstral Coefficients,梅尔倒谱系数)对语音数据进行语音特征提取,得到对应的特征参数;将特征参数矢量化,得到对应的语音特征向量。
具体地,首先对先对语音进行预加重、分帧和加窗,对每一个短时分析窗,通过FFT(Fast Fourier Transform,快速傅利叶转换)得到对应的频谱,将得到的频谱通过Mel滤波器组得到Mel频谱,在Mel频谱上面进行倒谱分析,包括取对数,通过DCT(Discrete cosinetransform,离散余弦变换)来实现逆变换,取DCT后的第2个到第13个系数作为特征系数,进一步,将特征系数矢量化,得到语音特征向量。
上述实施例中,通过MFCC提取语音特征向量,得到的语音特征向量能够更加准确的反映语音的特征。
在一个实施例中,欺诈风险预测模型的生成步骤包括:从语音数据库中获取预设数量的历史语音数据及对应的历史欺诈风险系数值;对历史语音数据提取历史语音特征向量;将历史语音特征向量作为输入样本,将对应的历史欺诈风险系数值作为期望的输出样本进行模型训练,得到已训练的欺诈风险预测模型。
具体地,语音数据库中的历史语音数据为欺诈风险系数值已经确定的语音数据,因此可作为机器学习的训练样本,服务器语音数据库中选取到历史语音数据后,可对这些历史语音数据提取历史语音特征向量,将提取的历史语音特征向量作为模型训练时的输入样本,将其对应的欺诈风险系数值作为期望的输出样本进行模型训练,训练的过程就是对模型的参数进行不断调整的过程。在进行模型训练时,可以采用有监督的模型训练方式,例如逻辑回归模型、SVM(Support Vector Machine,支持向量机)以及贝叶斯模型等。
在一个实施例中,以SVM为例,可以采用随机梯度算法进行模型训练,在梯度下降过程中需要使得代价函数J(θ)最小,在一个实施例中,代价函数可以采用以下公式表示:
其中,m表示训练集中样本特征的个数,x(i)为输入的历史语音特征向量,y(i)表示期望输出的欺诈风险系数值,hθ(x(i))表示每次训练的实际输出的欺诈风险系数值,其中:
其中,即θTx等于历史语音特征向量与参数的乘积的和。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种签约意向判断装置400,包括:语音数据获取模块402、关键词匹配模块404、语音特征向量提取模块406、图像数据获取模块408、目标审核规则获取模块410和签约意向判断模块412,其中:
语音数据获取模块402用于从终端获取语音数据;
关键词匹配模块404用于对语音数据进行语音识别得到对应的语音文本,对语音文本提取关键词,将提取的关键词与预设文本对应的预设关键词进行匹配,得到文本匹配分数;
语音特征向量提取模块406用于从语音数据中提取语音特征向量,将提取到的语音特征向量输入到已训练的欺诈风险预测模型中,得到欺诈风险系数值;
图像数据获取模块408用于从终端获取图像数据,对获取到的图像数据进行人脸识别,得到人脸识别分数;
目标审核规则获取模块410用于获取当前业务场景对应的场景标识,根据场景标识获取对应的目标审核规则;
签约意向判断模块412用于根据文本匹配分数、欺诈风险系数值、人脸识别分数及目标审核规则得到签约意向判断结果。
在一个实施例中,关键词匹配模块404还用于对语音文本进行分词,得到分词结果;对分词结果中的各个词计算特征权重,根据特征权重对分词结果中的各个词进行排序;根据排序结果选取关键词。
在一个实施例中,目标审核规则获取模块410用于根据场景标识查找对应的合同模板及合同要素;基于合同要素采用合同模板对应的场景分类模型,得到当前业务场景对应的场景类别;获取场景类别对应的预设审核规则,将预设审核规则作为目标审核规则。
在一个实施例中,上述装置还包括:个人信息获取模块,用于获取当前签约用户对应的个人信息;目标审核规则获取模块410还用于基于个人信息、合同要素采用合同模板对应的场景分类模型,得到当前业务场景对应的场景类别。
在一个实施例中,语音特征向量提取模块406还用于利用梅尔倒谱系数对语音数据进行语音特征提取,得到对应的特征参数;将特征参数矢量化,得到对应的语音特征向量。
在一个实施例中,上述装置还包括:欺诈风险预测模型生成模块,用于从语音数据库中获取预设数量的历史语音数据及对应的历史欺诈风险系数值;对历史语音数据提取历史语音特征向量;将历史语音特征向量作为输入样本,将对应的历史欺诈风险系数值作为期望的输出样本进行模型训练,得到已训练的欺诈风险预测模型。
关于签约意向判断装置的具体限定可以参见上文中对于签约意向判断方法的限定,在此不再赘述。上述签约意向判断装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储语音数据、图像数据、审核规则等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种签约意向判断方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:从终端获取语音数据;对语音数据进行语音识别得到对应的语音文本,对语音文本提取关键词,将提取的关键词与预设文本对应的预设关键词进行匹配,得到文本匹配分数;从语音数据中提取语音特征向量,将提取到的语音特征向量输入到已训练的欺诈风险预测模型中,得到欺诈风险系数值;从终端获取图像数据,对获取到的图像数据进行人脸识别,得到人脸识别分数;获取当前业务场景对应的场景标识,根据场景标识获取对应的目标审核规则;根据文本匹配分数、欺诈风险系数值、人脸识别分数及目标审核规则得到签约意向判断结果。
在一个实施例中,对语音文本提取关键词,包括:对语音文本进行分词,得到分词结果;对分词结果中的各个词计算特征权重,根据特征权重对分词结果中的各个词进行排序;根据排序结果选取关键词。
在一个实施例中,获取当前业务场景对应的场景标识,根据场景标识获取对应的审核规则,包括:根据场景标识查找对应的合同模板及合同要素;基于合同要素采用合同模板对应的场景分类模型,得到当前业务场景对应的场景类别;获取场景类别对应的预设审核规则,将预设审核规则作为目标审核规则。
在一个实施例中,基于合同要素采用合同模板对应的场景分类模型,得到当前业务场景对应的场景类别之前,处理器执行计算机程序时还实现以下步骤:获取当前签约用户对应的个人信息;基于合同要素采用合同模板对应的场景分类模型,得到当前业务场景对应的场景类别,包括:基于个人信息、合同要素采用合同模板对应的场景分类模型,得到当前业务场景对应的场景类别。
在一个实施例中,从语音数据中提取语音特征向量,包括:利用梅尔倒谱系数对语音数据进行语音特征提取,得到对应的特征参数;将特征参数矢量化,得到对应的语音特征向量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从语音数据库中获取预设数量的历史语音数据及对应的历史欺诈风险系数值;对历史语音数据提取历史语音特征向量;将历史语音特征向量作为输入样本,将对应的历史欺诈风险系数值作为期望的输出样本进行模型训练,得到已训练的欺诈风险预测模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:从终端获取语音数据;对语音数据进行语音识别得到对应的语音文本,对语音文本提取关键词,将提取的关键词与预设文本对应的预设关键词进行匹配,得到文本匹配分数;从语音数据中提取语音特征向量,将提取到的语音特征向量输入到已训练的欺诈风险预测模型中,得到欺诈风险系数值;从终端获取图像数据,对获取到的图像数据进行人脸识别,得到人脸识别分数;获取当前业务场景对应的场景标识,根据场景标识获取对应的目标审核规则;根据文本匹配分数、欺诈风险系数值、人脸识别分数及目标审核规则得到签约意向判断结果。
在一个实施例中,对语音文本提取关键词,包括:对语音文本进行分词,得到分词结果;对分词结果中的各个词计算特征权重,根据特征权重对分词结果中的各个词进行排序;根据排序结果选取关键词。
在一个实施例中,获取当前业务场景对应的场景标识,根据场景标识获取对应的审核规则,包括:根据场景标识查找对应的合同模板及合同要素;基于合同要素采用合同模板对应的场景分类模型,得到当前业务场景对应的场景类别;获取场景类别对应的预设审核规则,将预设审核规则作为目标审核规则。
在一个实施例中,基于合同要素采用合同模板对应的场景分类模型,得到当前业务场景对应的场景类别之前,计算机程序被处理器执行时还实现以下步骤:获取当前签约用户对应的个人信息;基于合同要素采用合同模板对应的场景分类模型,得到当前业务场景对应的场景类别,包括:基于个人信息、合同要素采用合同模板对应的场景分类模型,得到当前业务场景对应的场景类别。
在一个实施例中,从语音数据中提取语音特征向量,包括:利用梅尔倒谱系数对语音数据进行语音特征提取,得到对应的特征参数;将特征参数矢量化,得到对应的语音特征向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:从语音数据库中获取预设数量的历史语音数据及对应的历史欺诈风险系数值;对历史语音数据提取历史语音特征向量;将历史语音特征向量作为输入样本,将对应的历史欺诈风险系数值作为期望的输出样本进行模型训练,得到已训练的欺诈风险预测模型。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种签约意向判断方法,所述方法包括:
从终端获取语音数据;
对所述语音数据进行语音识别得到对应的语音文本,对所述语音文本提取关键词,将提取的关键词与预设文本对应的预设关键词进行匹配,得到文本匹配分数;
从所述语音数据中提取语音特征向量,将提取到的所述语音特征向量输入到已训练的欺诈风险预测模型中,得到欺诈风险系数值;
从所述终端获取图像数据,对获取到的所述图像数据进行人脸识别,得到人脸识别分数;
获取当前业务场景对应的场景标识,根据所述场景标识获取对应的目标审核规则;
根据所述文本匹配分数、所述欺诈风险系数值、所述人脸识别分数及所述目标审核规则得到签约意向判断结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述语音文本提取关键词,包括:
对所述语音文本进行分词,得到分词结果;
对所述分词结果中的各个词计算特征权重,根据所述特征权重对所述分词结果中的各个词进行排序;
根据排序结果选取关键词。
3.根据权利要求1所述的方法,其特征在于,所述获取当前业务场景对应的场景标识,根据所述场景标识获取对应的审核规则,包括:
根据所述场景标识查找对应的合同模板及合同要素;
基于所述合同要素采用所述合同模板对应的场景分类模型,得到所述当前业务场景对应的场景类别;
获取所述场景类别对应的预设审核规则,将所述预设审核规则作为目标审核规则。
4.根据权利要求3所述的方法,其特征在于,所述基于所述合同要素采用所述合同模板对应的场景分类模型,得到当前业务场景对应的场景类别之前,所述方法包括:、
获取当前签约用户对应的个人信息;
所述基于所述合同要素采用所述合同模板对应的场景分类模型,得到当前业务场景对应的场景类别,包括:
基于所述个人信息、所述合同要素采用所述合同模板对应的场景分类模型,得到当前业务场景对应的场景类别。
5.根据权利要求1所述的方法,其特征在于,所述从所述语音数据中提取语音特征向量,包括:
利用梅尔倒谱系数对所述语音数据进行语音特征提取,得到对应的特征参数;
将所述特征参数矢量化,得到对应的语音特征向量。
6.根据权利要求1至5任意一项所述的方法,其特征在于,所述欺诈风险预测模型的生成步骤包括:
从语音数据库中获取预设数量的历史语音数据及对应的历史欺诈风险系数值;
对所述历史语音数据提取历史语音特征向量;
将所述历史语音特征向量作为输入样本,将对应的所述历史欺诈风险系数值作为期望的输出样本进行模型训练,得到已训练的欺诈风险预测模型。
7.一种签约意向判断装置,其特征在于,所述装置包括:
语音数据获取模块,用于从终端获取语音数据;
关键词匹配模块,用于对所述语音数据进行语音识别得到对应的语音文本,对所述语音文本提取关键词,将提取的关键词与预设文本对应的预设关键词进行匹配,得到文本匹配分数;
语音特征向量提取模块,用于从所述语音数据中提取语音特征向量,将提取到的所述语音特征向量输入到已训练的欺诈风险预测模型中,得到欺诈风险系数值;
图像数据获取模块,用于从所述终端获取图像数据,对获取到的所述图像数据进行人脸识别,得到人脸识别分数;
目标审核规则获取模块,用于获取当前业务场景对应的场景标识,根据所述场景标识获取对应的目标审核规则;
签约意向判断模块,用于根据所述文本匹配分数、所述欺诈风险系数值、所述人脸识别分数及所述目标审核规则得到签约意向判断结果。
8.根据权利要求7所述的装置,其特征在于,目标审核规则获取模块用于根据所述场景标识查找对应的合同模板及合同要素;基于所述合同要素采用所述合同模板对应的场景分类模型,得到所述当前业务场景对应的场景类别;获取所述场景类别对应的预设审核规则,将所述预设审核规则作为目标审核规则。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811202720.0A CN109543516A (zh) | 2018-10-16 | 2018-10-16 | 签约意向判断方法、装置、计算机设备和存储介质 |
PCT/CN2019/070814 WO2020077895A1 (zh) | 2018-10-16 | 2019-01-08 | 签约意向判断方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811202720.0A CN109543516A (zh) | 2018-10-16 | 2018-10-16 | 签约意向判断方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109543516A true CN109543516A (zh) | 2019-03-29 |
Family
ID=65843802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811202720.0A Pending CN109543516A (zh) | 2018-10-16 | 2018-10-16 | 签约意向判断方法、装置、计算机设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109543516A (zh) |
WO (1) | WO2020077895A1 (zh) |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110134830A (zh) * | 2019-04-15 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 视频信息数据处理方法、装置、计算机设备和存储介质 |
CN110147981A (zh) * | 2019-04-12 | 2019-08-20 | 深圳壹账通智能科技有限公司 | 基于文本分析的合同风险审核方法、装置及终端设备 |
CN110287318A (zh) * | 2019-06-06 | 2019-09-27 | 秒针信息技术有限公司 | 业务操作的检测方法及装置、存储介质、电子装置 |
CN110427453A (zh) * | 2019-05-31 | 2019-11-08 | 平安科技(深圳)有限公司 | 数据的相似度计算方法、装置、计算机设备及存储介质 |
CN110443187A (zh) * | 2019-07-31 | 2019-11-12 | 上海秒针网络科技有限公司 | 特征信息的记录方法及装置 |
CN110442712A (zh) * | 2019-07-05 | 2019-11-12 | 阿里巴巴集团控股有限公司 | 风险的确定方法、装置、服务器和文本审理系统 |
CN110503555A (zh) * | 2019-08-28 | 2019-11-26 | 中国工商银行股份有限公司 | 交易数据的复核方法、装置和服务器 |
CN110689225A (zh) * | 2019-08-26 | 2020-01-14 | 深圳壹账通智能科技有限公司 | 基于外呼的企业金融风险画像创建方法及相关设备 |
CN110717650A (zh) * | 2019-09-06 | 2020-01-21 | 平安医疗健康管理股份有限公司 | 单据数据处理方法、装置、计算机设备和存储介质 |
CN110751553A (zh) * | 2019-10-24 | 2020-02-04 | 深圳前海微众银行股份有限公司 | 潜在风险对象的识别方法、装置、终端设备及存储介质 |
CN111124925A (zh) * | 2019-12-25 | 2020-05-08 | 斑马网络技术有限公司 | 基于大数据的场景提取方法、装置、设备和存储介质 |
CN111275444A (zh) * | 2020-01-14 | 2020-06-12 | 深圳壹账通智能科技有限公司 | 基于合同签署的双录方法、装置、终端及存储介质 |
CN111598041A (zh) * | 2020-05-25 | 2020-08-28 | 青岛联合创智科技有限公司 | 一种用于物品查找的图像生成文本方法 |
CN112069806A (zh) * | 2019-05-21 | 2020-12-11 | 杭州海康威视数字技术股份有限公司 | 简历筛选方法、装置、电子设备及存储介质 |
CN112163585A (zh) * | 2020-11-10 | 2021-01-01 | 平安普惠企业管理有限公司 | 文本的审核方法、装置、计算机设备及存储介质 |
CN112258317A (zh) * | 2020-10-30 | 2021-01-22 | 深圳壹账通智能科技有限公司 | 基于人工智能的线上信贷方法、装置、计算机设备及介质 |
CN112632989A (zh) * | 2020-12-29 | 2021-04-09 | 中国农业银行股份有限公司 | 一种合同文本中风险信息的提示方法、装置及设备 |
CN112802460A (zh) * | 2021-04-14 | 2021-05-14 | 中国科学院国家空间科学中心 | 一种基于语音处理的空间环境预报系统 |
CN112818150A (zh) * | 2021-01-22 | 2021-05-18 | 世纪龙信息网络有限责任公司 | 一种图片内容审核方法、装置、设备和介质 |
CN112861662A (zh) * | 2021-01-22 | 2021-05-28 | 平安科技(深圳)有限公司 | 基于人脸和交互文本的目标对象行为预测方法及相关设备 |
CN113033347A (zh) * | 2021-03-10 | 2021-06-25 | 北京思图场景数据科技服务有限公司 | 一种人体行为和场景分析的交互式风险评估方法 |
CN113658585A (zh) * | 2021-08-13 | 2021-11-16 | 北京百度网讯科技有限公司 | 语音交互模型的训练方法、语音交互方法及装置 |
CN114095282A (zh) * | 2022-01-21 | 2022-02-25 | 杭银消费金融股份有限公司 | 一种基于短文本特征提取的风控处理方法及设备 |
CN114898271A (zh) * | 2022-05-26 | 2022-08-12 | 中国平安人寿保险股份有限公司 | 视频内容监控方法、装置、设备及介质 |
CN114926831A (zh) * | 2022-05-31 | 2022-08-19 | 平安普惠企业管理有限公司 | 基于文本识别方法、装置、电子设备及可读存储介质 |
WO2023272833A1 (zh) * | 2021-06-29 | 2023-01-05 | 未鲲(上海)科技服务有限公司 | 一种数据检测方法、装置、设备及可读存储介质 |
CN117094816A (zh) * | 2023-10-18 | 2023-11-21 | 天津市职业大学 | 一种基于大数据的企业财务评估方法及系统 |
CN117635174A (zh) * | 2023-12-04 | 2024-03-01 | 中国人寿保险股份有限公司山东省分公司 | 综合多模态ai分析的欺诈风险评估方法及系统 |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111581344B (zh) * | 2020-04-26 | 2024-07-23 | 腾讯科技(深圳)有限公司 | 一种接口信息审核方法、装置、计算机设备及存储介质 |
CN112307235B (zh) * | 2020-05-09 | 2024-02-20 | 支付宝(杭州)信息技术有限公司 | 前端页面元素的命名方法、装置及电子设备 |
CN111753516B (zh) * | 2020-06-29 | 2024-04-16 | 平安国际智慧城市科技股份有限公司 | 文本查重处理方法、装置、计算机设备及计算机存储介质 |
CN114140140B (zh) * | 2020-09-03 | 2023-03-21 | 中国移动通信集团浙江有限公司 | 一种场景筛选方法、装置及设备 |
CN112037796B (zh) * | 2020-09-08 | 2024-06-11 | 平安科技(深圳)有限公司 | 一种数据处理方法、装置、设备及介质 |
CN111984779B (zh) * | 2020-09-10 | 2024-05-28 | 支付宝(杭州)信息技术有限公司 | 一种对话文本分析方法、装置、设备和可读介质 |
CN112015747B (zh) * | 2020-09-14 | 2024-04-16 | 支付宝(杭州)信息技术有限公司 | 数据上传方法及装置 |
CN112015869B (zh) * | 2020-09-14 | 2024-07-19 | 支付宝(杭州)信息技术有限公司 | 一种待发布文本的风险检测方法、装置及设备 |
CN112100379B (zh) * | 2020-09-15 | 2023-07-28 | 北京百度网讯科技有限公司 | 用于处理数据的方法、装置、设备以及存储介质 |
CN112215087A (zh) * | 2020-09-21 | 2021-01-12 | 浙江数链科技有限公司 | 图片审核方法、装置、计算机设备和存储介质 |
CN112100357A (zh) * | 2020-09-24 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 引导语的生成方法及装置、电子设备、计算机存储介质 |
CN112257425A (zh) * | 2020-09-29 | 2021-01-22 | 国网天津市电力公司 | 一种基于数据分级模型的电力数据分析方法及系统 |
CN112416476B (zh) * | 2020-11-25 | 2023-03-24 | 武汉联影医疗科技有限公司 | 工作流执行方法、装置、计算机设备和存储介质 |
CN112508717A (zh) * | 2020-12-01 | 2021-03-16 | 中国人寿保险股份有限公司 | 一种影像信息的审核方法、装置、电子设备及存储介质 |
CN114640606A (zh) * | 2020-12-01 | 2022-06-17 | 中移物联网有限公司 | 一种物联网卡终端的异常处理方法及控制器 |
CN112507936B (zh) * | 2020-12-16 | 2024-04-23 | 平安银行股份有限公司 | 图像信息审核方法、装置、电子设备及可读存储介质 |
CN112492343B (zh) * | 2020-12-16 | 2023-11-10 | 浙江大华技术股份有限公司 | 一种视频直播监控方法及相关装置 |
CN112685594B (zh) * | 2020-12-24 | 2022-10-04 | 中国人民解放军战略支援部队信息工程大学 | 基于注意力的弱监督语音检索方法及系统 |
CN113094520B (zh) * | 2021-03-29 | 2023-05-12 | 四川新网银行股份有限公司 | 一种检查电子合同的方法 |
CN113362072B (zh) * | 2021-06-30 | 2023-09-08 | 成都一蟹科技有限公司 | 风控数据处理方法、装置、电子设备及存储介质 |
CN113723759B (zh) * | 2021-07-30 | 2024-06-04 | 北京淇瑀信息科技有限公司 | 基于设备意向度和设备风险度为设备提供互联网服务的方法及装置 |
CN113656543A (zh) * | 2021-08-10 | 2021-11-16 | 深圳壹账通智能科技有限公司 | 数据交易方法、装置、设备及存储介质 |
CN113806505B (zh) * | 2021-09-09 | 2024-04-16 | 科大讯飞股份有限公司 | 要素比对方法、装置、电子设备和存储介质 |
CN113793597A (zh) * | 2021-09-15 | 2021-12-14 | 云知声智能科技股份有限公司 | 一种语音识别方法、装置、电子设备和存储介质 |
CN114282882B (zh) * | 2021-11-15 | 2023-04-14 | 深圳市东信时代信息技术有限公司 | 素材工单审核方法、装置、设备及存储介质 |
CN115526605B (zh) * | 2022-10-21 | 2024-03-08 | 金恒智控管理咨询集团股份有限公司 | 基于企业内部控制管理的审批方法及系统 |
CN116405300B (zh) * | 2023-04-18 | 2024-01-23 | 无锡锡商银行股份有限公司 | 一种基于场景的在线协议签署安全分析系统及方法 |
CN117313723B (zh) * | 2023-11-28 | 2024-02-20 | 广州云趣信息科技有限公司 | 一种基于大数据的语义分析方法、系统和存储介质 |
CN117392694B (zh) * | 2023-12-07 | 2024-04-19 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置及设备 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003263559A (ja) * | 2002-03-11 | 2003-09-19 | Hiromasa Asakawa | プリペイドカードを用いた保険契約処理システム |
US20100306249A1 (en) * | 2009-05-27 | 2010-12-02 | James Hill | Social network systems and methods |
CN103279868A (zh) * | 2013-05-22 | 2013-09-04 | 兰亭集势有限公司 | 一种自动识别欺诈订单的方法和装置 |
CN106506454A (zh) * | 2016-10-10 | 2017-03-15 | 江苏通付盾科技有限公司 | 欺诈业务识别方法及装置 |
CN107395488A (zh) * | 2017-06-08 | 2017-11-24 | 深圳市金立通信设备有限公司 | 一种识别风险账户的方法及终端 |
CN107680602A (zh) * | 2017-08-24 | 2018-02-09 | 平安科技(深圳)有限公司 | 语音欺诈识别方法、装置、终端设备及存储介质 |
CN107885870A (zh) * | 2017-11-24 | 2018-04-06 | 北京神州泰岳软件股份有限公司 | 一种业务文档公式提取方法及装置 |
CN107919137A (zh) * | 2017-10-25 | 2018-04-17 | 平安普惠企业管理有限公司 | 远程审批方法、装置、设备及可读存储介质 |
WO2018104834A1 (en) * | 2016-12-07 | 2018-06-14 | Yogesh Chunilal Rathod | Real-time, ephemeral, single mode, group & auto taking visual media, stories, auto status, following feed types, mass actions, suggested activities, ar media & platform |
CN108205526A (zh) * | 2016-12-20 | 2018-06-26 | 百度在线网络技术(北京)有限公司 | 一种确定综合语义信息的方法与装置 |
CN108399510A (zh) * | 2018-04-16 | 2018-08-14 | 法信公证云(厦门)科技有限公司 | 一种合同风险管控方法和设备 |
CN108520398A (zh) * | 2018-03-28 | 2018-09-11 | 施益斌 | 建筑设计招投标签约系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101697514B (zh) * | 2009-10-22 | 2016-08-24 | 中兴通讯股份有限公司 | 一种身份验证的方法及系统 |
US10154071B2 (en) * | 2015-07-29 | 2018-12-11 | International Business Machines Corporation | Group chat with dynamic background images and content from social media |
-
2018
- 2018-10-16 CN CN201811202720.0A patent/CN109543516A/zh active Pending
-
2019
- 2019-01-08 WO PCT/CN2019/070814 patent/WO2020077895A1/zh active Application Filing
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003263559A (ja) * | 2002-03-11 | 2003-09-19 | Hiromasa Asakawa | プリペイドカードを用いた保険契約処理システム |
US20100306249A1 (en) * | 2009-05-27 | 2010-12-02 | James Hill | Social network systems and methods |
CN103279868A (zh) * | 2013-05-22 | 2013-09-04 | 兰亭集势有限公司 | 一种自动识别欺诈订单的方法和装置 |
CN106506454A (zh) * | 2016-10-10 | 2017-03-15 | 江苏通付盾科技有限公司 | 欺诈业务识别方法及装置 |
WO2018104834A1 (en) * | 2016-12-07 | 2018-06-14 | Yogesh Chunilal Rathod | Real-time, ephemeral, single mode, group & auto taking visual media, stories, auto status, following feed types, mass actions, suggested activities, ar media & platform |
CN108205526A (zh) * | 2016-12-20 | 2018-06-26 | 百度在线网络技术(北京)有限公司 | 一种确定综合语义信息的方法与装置 |
CN107395488A (zh) * | 2017-06-08 | 2017-11-24 | 深圳市金立通信设备有限公司 | 一种识别风险账户的方法及终端 |
CN107680602A (zh) * | 2017-08-24 | 2018-02-09 | 平安科技(深圳)有限公司 | 语音欺诈识别方法、装置、终端设备及存储介质 |
CN107919137A (zh) * | 2017-10-25 | 2018-04-17 | 平安普惠企业管理有限公司 | 远程审批方法、装置、设备及可读存储介质 |
CN107885870A (zh) * | 2017-11-24 | 2018-04-06 | 北京神州泰岳软件股份有限公司 | 一种业务文档公式提取方法及装置 |
CN108520398A (zh) * | 2018-03-28 | 2018-09-11 | 施益斌 | 建筑设计招投标签约系统 |
CN108399510A (zh) * | 2018-04-16 | 2018-08-14 | 法信公证云(厦门)科技有限公司 | 一种合同风险管控方法和设备 |
Non-Patent Citations (3)
Title |
---|
QIANQIAN ZHAO: "Detectin telecommunication fraud by understanding the contents of a call", 《CYBERSECUR》, vol. 1, no. 8, 31 August 2018 (2018-08-31), pages 1 - 15 * |
贾志强等: "数据挖掘在防电信客户欺诈模型中的应用", 《计算机时代》, no. 04, 2 April 2009 (2009-04-02), pages 42 - 44 * |
郭伟: "基于文本的网络欺诈风险识别研究", 《万方学术论文》, 14 December 2017 (2017-12-14), pages 1 - 53 * |
Cited By (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147981A (zh) * | 2019-04-12 | 2019-08-20 | 深圳壹账通智能科技有限公司 | 基于文本分析的合同风险审核方法、装置及终端设备 |
CN110134830A (zh) * | 2019-04-15 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 视频信息数据处理方法、装置、计算机设备和存储介质 |
CN112069806A (zh) * | 2019-05-21 | 2020-12-11 | 杭州海康威视数字技术股份有限公司 | 简历筛选方法、装置、电子设备及存储介质 |
CN112069806B (zh) * | 2019-05-21 | 2024-04-05 | 杭州海康威视数字技术股份有限公司 | 简历筛选方法、装置、电子设备及存储介质 |
CN110427453A (zh) * | 2019-05-31 | 2019-11-08 | 平安科技(深圳)有限公司 | 数据的相似度计算方法、装置、计算机设备及存储介质 |
CN110427453B (zh) * | 2019-05-31 | 2024-03-19 | 平安科技(深圳)有限公司 | 数据的相似度计算方法、装置、计算机设备及存储介质 |
CN110287318A (zh) * | 2019-06-06 | 2019-09-27 | 秒针信息技术有限公司 | 业务操作的检测方法及装置、存储介质、电子装置 |
CN110287318B (zh) * | 2019-06-06 | 2021-09-17 | 秒针信息技术有限公司 | 业务操作的检测方法及装置、存储介质、电子装置 |
CN110442712A (zh) * | 2019-07-05 | 2019-11-12 | 阿里巴巴集团控股有限公司 | 风险的确定方法、装置、服务器和文本审理系统 |
CN110442712B (zh) * | 2019-07-05 | 2023-08-22 | 创新先进技术有限公司 | 风险的确定方法、装置、服务器和文本审理系统 |
CN110443187A (zh) * | 2019-07-31 | 2019-11-12 | 上海秒针网络科技有限公司 | 特征信息的记录方法及装置 |
CN110443187B (zh) * | 2019-07-31 | 2022-08-26 | 上海秒针网络科技有限公司 | 特征信息的记录方法及装置 |
CN110689225A (zh) * | 2019-08-26 | 2020-01-14 | 深圳壹账通智能科技有限公司 | 基于外呼的企业金融风险画像创建方法及相关设备 |
CN110503555A (zh) * | 2019-08-28 | 2019-11-26 | 中国工商银行股份有限公司 | 交易数据的复核方法、装置和服务器 |
CN110717650A (zh) * | 2019-09-06 | 2020-01-21 | 平安医疗健康管理股份有限公司 | 单据数据处理方法、装置、计算机设备和存储介质 |
CN110751553A (zh) * | 2019-10-24 | 2020-02-04 | 深圳前海微众银行股份有限公司 | 潜在风险对象的识别方法、装置、终端设备及存储介质 |
CN111124925A (zh) * | 2019-12-25 | 2020-05-08 | 斑马网络技术有限公司 | 基于大数据的场景提取方法、装置、设备和存储介质 |
CN111124925B (zh) * | 2019-12-25 | 2024-04-05 | 斑马网络技术有限公司 | 基于大数据的场景提取方法、装置、设备和存储介质 |
CN111275444A (zh) * | 2020-01-14 | 2020-06-12 | 深圳壹账通智能科技有限公司 | 基于合同签署的双录方法、装置、终端及存储介质 |
CN111598041A (zh) * | 2020-05-25 | 2020-08-28 | 青岛联合创智科技有限公司 | 一种用于物品查找的图像生成文本方法 |
WO2022088805A1 (zh) * | 2020-10-30 | 2022-05-05 | 深圳壹账通智能科技有限公司 | 基于人工智能的线上信贷方法、装置、计算机设备及介质 |
CN112258317A (zh) * | 2020-10-30 | 2021-01-22 | 深圳壹账通智能科技有限公司 | 基于人工智能的线上信贷方法、装置、计算机设备及介质 |
CN112163585B (zh) * | 2020-11-10 | 2023-11-10 | 上海七猫文化传媒有限公司 | 文本的审核方法、装置、计算机设备及存储介质 |
CN112163585A (zh) * | 2020-11-10 | 2021-01-01 | 平安普惠企业管理有限公司 | 文本的审核方法、装置、计算机设备及存储介质 |
CN112632989A (zh) * | 2020-12-29 | 2021-04-09 | 中国农业银行股份有限公司 | 一种合同文本中风险信息的提示方法、装置及设备 |
CN112632989B (zh) * | 2020-12-29 | 2023-11-03 | 中国农业银行股份有限公司 | 一种合同文本中风险信息的提示方法、装置及设备 |
CN112818150B (zh) * | 2021-01-22 | 2024-05-07 | 天翼视联科技有限公司 | 一种图片内容审核方法、装置、设备和介质 |
CN112861662B (zh) * | 2021-01-22 | 2023-09-01 | 平安科技(深圳)有限公司 | 基于人脸和交互文本的目标对象行为预测方法及相关设备 |
CN112861662A (zh) * | 2021-01-22 | 2021-05-28 | 平安科技(深圳)有限公司 | 基于人脸和交互文本的目标对象行为预测方法及相关设备 |
CN112818150A (zh) * | 2021-01-22 | 2021-05-18 | 世纪龙信息网络有限责任公司 | 一种图片内容审核方法、装置、设备和介质 |
CN113033347A (zh) * | 2021-03-10 | 2021-06-25 | 北京思图场景数据科技服务有限公司 | 一种人体行为和场景分析的交互式风险评估方法 |
CN112802460A (zh) * | 2021-04-14 | 2021-05-14 | 中国科学院国家空间科学中心 | 一种基于语音处理的空间环境预报系统 |
WO2023272833A1 (zh) * | 2021-06-29 | 2023-01-05 | 未鲲(上海)科技服务有限公司 | 一种数据检测方法、装置、设备及可读存储介质 |
CN113658585B (zh) * | 2021-08-13 | 2024-04-09 | 北京百度网讯科技有限公司 | 语音交互模型的训练方法、语音交互方法及装置 |
CN113658585A (zh) * | 2021-08-13 | 2021-11-16 | 北京百度网讯科技有限公司 | 语音交互模型的训练方法、语音交互方法及装置 |
CN114095282A (zh) * | 2022-01-21 | 2022-02-25 | 杭银消费金融股份有限公司 | 一种基于短文本特征提取的风控处理方法及设备 |
CN114095282B (zh) * | 2022-01-21 | 2022-04-15 | 杭银消费金融股份有限公司 | 一种基于短文本特征提取的风控处理方法及设备 |
CN114898271A (zh) * | 2022-05-26 | 2022-08-12 | 中国平安人寿保险股份有限公司 | 视频内容监控方法、装置、设备及介质 |
CN114926831A (zh) * | 2022-05-31 | 2022-08-19 | 平安普惠企业管理有限公司 | 基于文本识别方法、装置、电子设备及可读存储介质 |
CN117094816B (zh) * | 2023-10-18 | 2024-02-06 | 天津市职业大学 | 一种基于大数据的企业财务评估方法及系统 |
CN117094816A (zh) * | 2023-10-18 | 2023-11-21 | 天津市职业大学 | 一种基于大数据的企业财务评估方法及系统 |
CN117635174A (zh) * | 2023-12-04 | 2024-03-01 | 中国人寿保险股份有限公司山东省分公司 | 综合多模态ai分析的欺诈风险评估方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2020077895A1 (zh) | 2020-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109543516A (zh) | 签约意向判断方法、装置、计算机设备和存储介质 | |
CN110021439B (zh) | 基于机器学习的医疗数据分类方法、装置和计算机设备 | |
CN109829628B (zh) | 基于大数据的风险预警方法、装置和计算机设备 | |
CN109165840B (zh) | 风险预测处理方法、装置、计算机设备和介质 | |
CN109871446B (zh) | 意图识别中的拒识方法、电子装置及存储介质 | |
WO2021169111A1 (zh) | 简历筛选方法、装置、计算机设备和存储介质 | |
CN109829629B (zh) | 风险分析报告的生成方法、装置、计算机设备和存储介质 | |
CN111767400B (zh) | 文本分类模型的训练方法、装置、计算机设备和存储介质 | |
CN110569500A (zh) | 文本语义识别方法、装置、计算机设备和存储介质 | |
CN110598206A (zh) | 文本语义识别方法、装置、计算机设备和存储介质 | |
CN112733645B (zh) | 手写签名校验方法、装置、计算机设备及存储介质 | |
CN106991312B (zh) | 基于声纹识别的互联网反欺诈认证方法 | |
CN111191568A (zh) | 翻拍图像识别方法、装置、设备及介质 | |
Siddiqi et al. | Human facial expression recognition using curvelet feature extraction and normalized mutual information feature selection | |
CN110929525A (zh) | 一种网贷风险行为分析检测方法、装置、设备和存储介质 | |
CN113762392A (zh) | 基于人工智能的理财产品推荐方法、装置、设备及介质 | |
CN110909784A (zh) | 一种图像识别模型的训练方法、装置及电子设备 | |
CN111368061B (zh) | 短文本过滤方法、装置、介质及计算机设备 | |
CN111090719A (zh) | 文本分类方法、装置、计算机设备及存储介质 | |
CN105681324A (zh) | 互联网金融交易系统及方法 | |
CN116564315A (zh) | 一种声纹识别方法、装置、设备及存储介质 | |
CN112632248A (zh) | 问答方法、装置、计算机设备和存储介质 | |
Poddar et al. | Quality measures for speaker verification with short utterances | |
CN111680132A (zh) | 一种用于互联网文本信息的噪声过滤和自动分类方法 | |
CN117493645B (zh) | 一种基于大数据的电子档案推荐系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |