CN112766824B - 数据处理方法、装置、电子设备及存储介质 - Google Patents
数据处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112766824B CN112766824B CN202110232424.0A CN202110232424A CN112766824B CN 112766824 B CN112766824 B CN 112766824B CN 202110232424 A CN202110232424 A CN 202110232424A CN 112766824 B CN112766824 B CN 112766824B
- Authority
- CN
- China
- Prior art keywords
- compliance
- audio
- data
- result
- video data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 238000003672 processing method Methods 0.000 title abstract description 11
- 238000000034 method Methods 0.000 claims abstract description 49
- 238000012545 processing Methods 0.000 claims abstract description 41
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 27
- 238000007781 pre-processing Methods 0.000 claims abstract description 19
- 238000005516 engineering process Methods 0.000 claims abstract description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 238000007637 random forest analysis Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 18
- 230000006870 function Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 238000003066 decision tree Methods 0.000 description 11
- 238000012549 training Methods 0.000 description 11
- 238000012937 correction Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 238000007689 inspection Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 6
- 239000000872 buffer Substances 0.000 description 4
- 238000013145 classification model Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Technology Law (AREA)
- Entrepreneurship & Innovation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Evolutionary Computation (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种数据处理方法、装置、电子设备及存储介质,可应用于人工智能技术领域,该方法包括:获取数据处理音视频数据,对音视频数据进行预处理,生成音频数据和视频数据;基于语音识别技术对音频数据进行识别生成文本数据,基于预定的文字匹配算法对文本数据进行关键词匹配,识别文本数据中的预定关键词;根据识别的预定关键词在视频数据中截取预定数量的关键帧图像;基于预定合规规则,根据识别的预定关键词和预定数量的关键帧图像生成数据处理音视频数据的初级合规结果;将初级合规结果输入至预先训练的风险预警模型,生成最终合规结果。通过本发明,可以提高对音视频数据合规性识别的准确率。
Description
技术领域
本发明涉及人工智能技术领域,具体涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
金融机构产品销售环节受到严格的监管管控,包括首次购买理财产品需要柜面风险测评以及购买理财产品重要环节需要配合录音录像等要求。如果销售过程中有不合格的行为和宣传内容,造成日后消费者或客户投诉、监管问责,会给银行带来纠纷,甚至影响银行市场名誉。
现有金融销售合规性检查方法主要利用金融产品销售环节的产品录音录像数据,根据固化专家规则进行合规性检查。然而,该合规性检查存在以下不足:
一、由于现有的专家规则方法可能存在规则不全面的情况,因而可能存在人为未识别的规则和风险;
二、交易场景和客户对象的不同组合使得固化专家规则难以适用于全量销售数据,无法定位特殊的风险和隐患。
也就是说,现有金融销售合规性检查方案存在识别准确率较低的问题。
发明内容
有鉴于此,本发明提供一种数据处理方法、装置、电子设备及存储介质,以解决上述提及的至少一个问题。
根据本发明的第一方面,提供一种数据处理方法,所述方法包括:
获取音视频数据,并对所述音视频数据进行预处理,生成音频数据和视频数据;
基于语音识别技术对所述音频数据进行识别生成文本数据,并基于预定的文字匹配算法对所述文本数据进行关键词匹配,识别文本数据中的预定关键词;
根据识别的预定关键词在所述视频数据中截取预定数量的关键帧图像;
基于预定合规规则,根据识别的预定关键词和预定数量的关键帧图像生成所述音视频数据的初级合规结果;
将所述初级合规结果输入至预先训练的风险预警模型,生成最终合规结果,所述风险预警模型基于随机森林算法、历史音视频数据及其历史初级合规结果和历史最终合规结果进行训练。
根据本发明的第二方面,提供一种数据处理装置,所述装置包括:
数据获取单元,用于获取音视频数据;
预处理单元,用于对所述音视频数据进行预处理,生成音频数据和视频数据;
文本生成单元,用于基于语音识别技术对所述音频数据进行识别生成文本数据;
关键词识别单元,用于基于预定的文字匹配算法对所述文本数据进行关键词匹配,识别文本数据中的预定关键词;
关键帧图像截取单元,用于根据识别的预定关键词在所述视频数据中截取预定数量的关键帧图像;
初级合规结果生成单元,用于基于预定合规规则,根据识别的预定关键词和预定数量的关键帧图像生成所述音视频数据的初级合规结果;
最终合规结果生成单元,用于将所述初级合规结果输入至预先训练的风险预警模型,生成最终合规结果,所述风险预警模型基于随机森林算法、历史音视频数据及其历史初级合规结果和历史最终合规结果进行训练。
根据本发明的第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法的步骤。
根据本发明的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
由上述技术方案可知,通过对获取的音视频数据进行预处理后生成音频数据和视频数据,随后基于语音识别技术对音频数据进行识别生成文本数据,并基于预定的文字匹配算法对文本数据进行关键词匹配,识别文本数据中的预定关键词,之后根据识别的预定关键词在所述视频数据中截取预定数量的关键帧图像,并基于预定合规规则,根据识别的预定关键词和预定数量的关键帧图像生成所述音视频数据的初级合规结果,最后将所述初级合规结果输入至预先训练的风险预警模型,生成最终合规结果,本技术方案基于机器学习技术智能识别音视频数据的合规性,相比于现有技术,本技术方案可以提高对音视频数据合规性识别的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的数据处理方法的流程图;
图2是根据本发明实施例的数据处理方法的详细流程图;
图3是根据本发明实施例的数据处理装置的结构框图;
图4是根据本发明实施例的数据处理系统的示例结构框图;
图5为本发明实施例的电子设备600的系统构成的示意框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
鉴于现有的金融产品销售数据合规性检查方案的识别准确率较低,本发明实施例提供一种数据处理方案,通过该方案,可以提高对金融产品的销售音视频数据的合规性识别的准确率,识别出不合规交易、风险交易、易撤销交易,从而可以降低销售风险。以下结合附图来详细描述本发明实施例。
图1是根据本发明实施例的数据处理方法的流程图,如图1所示,该流程包括:
步骤101,获取音视频数据,并对所述音视频数据进行预处理,生成音频数据和视频数据。
步骤102,基于语音识别技术对所述音频数据进行识别生成文本数据,并基于预定的文字匹配算法(例如,基于词典的KMP(一种改进的字符串匹配算法)模式匹配算法)对所述文本数据进行关键词匹配,识别文本数据中的预定关键词。
这里的预定关键词可以包括:合规词和违规词。
例如,可以采用基于词典的KMP模式匹配算法进行文本合规关键词匹配,采用基于距离的文本相似度模型在对文本内容进行关键词确认的基础上,进行文本相似度的计算归一化处理后确定合规词命中率,命中率越高则表明数据的符合程度越高,即音视频合规的可能性越高。同样地,可以采用上述方式确定违规词命中率,命中率越低则表明数据的符合程度越高。
步骤103,根据识别的预定关键词在所述视频数据中截取预定数量的关键帧图像。
具体地,可以先根据识别的预定关键词在文本数据中的位置信息,确定与该预定关键字对应的视频关键帧在视频数据中的位置信息;之后根据所述视频关键帧的位置信息在视频数据中截取预定数量的关键帧图像。
步骤104,基于预定合规规则,根据识别的预定关键词和预定数量的关键帧图像生成所述音视频数据的初级合规结果。这里的预定合规规则包括:多个合规特征,例如,音视频数据的时长、关键词命中率等。
具体地,可以先对所述关键帧图像进行人脸识别,根据识别结果生成客户信息(用于确认该客户是否为客户本人);之后基于预定合规规则,根据识别的预定关键词和客户信息生成所述音视频数据的初级合规结果。
在一个实施例中,可以通过预先训练合规模型来生成音视频数据的初级合规结果。具体地,可以将识别的预定关键词和客户信息输入至预先训练的合规模型,生成所述音视频数据的初级合规结果,其中,该合规模型可以基于所述预定合规规则、历史音视频数据及其历史初级合规结果进行训练。
步骤105,将所述初级合规结果输入至预先训练的风险预警模型,生成最终合规结果。
上述风险预警模型基于随机森林算法、历史音视频数据及其历史初级合规结果和历史最终合规结果进行训练。
这里的最终合规结果可以是:合规交易、不合规交易或可疑交易。
对于历史最终合规结果,可以是二次合规检查结果,即,上级机构、监管对历史音视频数据的历史初级合规结果进行二次合规检查的结果。
在一个实施例中,可以将音视频数据及其初级合规结果输入至预先训练的风险预警模型,生成最终合规结果,当最终合规结果为不合规交易或可疑交易时,最终合规结果还可以包括:各合规特征的重要性排序信息,即,各合规特征对于最终合规结果的贡献信息排序。
具体地,可以根据所述最终合规结果基于平均不纯度减少计算方法确定各合规特征在该最终合规结果中的贡献信息;之后再根据所述各合规特征在该最终合规结果中的贡献信息生成各合规特征的重要性排序信息。
在实际操作中,还可以根据所述音视频数据及其初级合规结果、最终合规结果更新所述风险预警模型,以提高该模型的预警准确率。
通过对获取的音视频数据进行预处理后生成音频数据和视频数据,随后基于语音识别技术对音频数据进行识别生成文本数据,并基于预定的文字匹配算法对文本数据进行关键词匹配,识别文本数据中的预定关键词,之后根据识别的预定关键词在所述视频数据中截取预定数量的关键帧图像,并基于预定合规规则,根据识别的预定关键词和预定数量的关键帧图像生成所述音视频数据的初级合规结果,最后将所述初级合规结果输入至预先训练的风险预警模型,生成最终合规结果,本发明实施例基于机器学习技术智能识别音视频数据的合规性,相比于现有技术,本发明实施例可以提高对音视频数据合规性识别的准确率。
为了更好地理解本发明,以下结合图2来详细描述销售产品的数据处理流程,如图2所示,该流程包括:步骤S110-S180,以下分别描述各步骤。
S110:获取销售产品的音视频数据。
在一次金融产品销售后,获取包括参与者信息、金融产品信息和产品录音录像数据。其中,参与者信息指:一次金融产品销售过程中涉及的客户与客户经理身份信息;金融产品信息包括:一次金融产品销售过程中涉及产品的基本信息、客户经理销售话术规定,该规定包括:话术中应包含的合规关键词和不应包含的违规词;产品录音录像数据包括:一次金融产品销售过程中录像环节所产生的音视频数据。
在实际操作中,可以从销售管理系统获取交易信息,从产品管理系统获取金融产品信息,从个人营销管理系统获取客户信息、客户经理信息和产品录音录像数据。
S120:提取音视频信息及预处理。
在实际操作中,可以根据上述三个维度的数据(即,参与者信息、金融产品信息和产品录音录像数据)构建金融产品销售数据指标体系,具体为:参与者指标体系、产品指标体系与交易指标体系。以下分别描述这三个指标体系。
(1)参与者指标体系
参与者指标体系包括:客户身份信息指标和客户经理身份信息指标。客户身份信息指标可包括但不限于客户的风险等级、是否为高净值客户、客户金融资产量级、星级等级等。客户经理身份信息指标可包括但不限于客户经理营销编号、业务领域、销售量等。
(2)产品指标体系
产品指标体系包括:产品基本信息指标、合规关键词的命中率及违规词命中率。产品基本信息指标可包括但不限于产品风险等级、业绩比较基准、起购金额等。
(3)交易指标体系
交易指标体系是指产品录音录像产生的音视频基本信息构成的指标体系。
在一个实例中,三个指标体系的示意如下表1所示:
表1
产品录音录像产生的音频基本信息指标包括:合规词命中率、违规词命中率。对音频数据进行预处理(例如,去噪处理等)之后,通过人工智能语音识别技术将音频数据转为文本数据,采用基于词典的KMP模式匹配算法进行文本合规关键词匹配,采用基于距离的文本相似度模型在对文本内容进行关键词确认的基础上,进行文本相似度的计算归一化处理后确定合规词命中率,相似度越高则表明销售话术的符合程度越高,即音视频合规(销售合规)的可能性越高,同样地,采用基于词典的KMP模式匹配算法可计算出违规词命中率。
视频基本信息指标包括:视频分辨率、视频时长、客户身份核查结果等。可以将视频分辨率等类别属性字段,视频时长、音频时长等数值连续性字段进行离散化等预处理。对视频数据进行识别处理,具体地,对视频获取关键帧以识别客户,得到客户身份核查结果,用于判断金融销售视频中是否为客户本人。
获取关键帧的方法可以是:基于各客户经理描述相关产品内容时为匀速表达,即关键词K在文本中的位置,与关键帧在视频中的位置大致相同,通过关键词匹配算法可获得目标关键词K在文本数据中出现的位置t,以此定位视频关键帧的位置,取前后时间范围均匀截取关键帧。
例如,初始关键视频位置T1=(关键词出现位置t/文本总长度N)*视频时长M(秒)。考虑说话语速影响因素以及关键词出现范围均可能包含重要信息这一因素,关键帧获取规则为:以初始关键视频位置T1为中心,前后60s为范围,确定截取关键帧视频图像的范围,即[T1-60,T1+60],以15s为单位,以T1-60位置为原点截取第1帧图像Z1,T1-45位置为原点截取第2帧图像Z2,以此类推,共获取8张关键帧图像,对视频处理过程中获取到的关键信息截图进行人脸识别,并依据客户前期上传的用户信息进行联网核查,确认视频中的关键人物是否与购买产品的用户为同一人,任意关键帧图像中包含客户本人,则认为该销售过程为客户本人参与,即判定规则如下:
if((Z1=1)or(Z2=1)or(Z3=1)or(Z4=1)or(Z5=1)or(Z6=1)or(Z7=1)or(Z8=1))—>确认客户本人参与
关键帧中客户本人出现次数越多,则认为视频合规的可能性越高,若所有关键帧图像均不包含客户,则认为该视频为可疑视频,可进行后续人工核查。
S130:依据合规性规则获得首次合规判别结果。
根据合规性判别规则(即,上述步骤104中的预定合规规则)使用前一步骤的数据进行合规性检查获得首次合规判别结果(即,初级合规结果)。合规性判别规则可包括专家规则,专家规则可包括但不限于如下规则:
(1)视频画质是否清晰,通过视频提取出的分辨率和码率与格式所要求的分辨率边界值进行判断,符合清晰度要求则记录清晰度检查结果为1(即,合格),否则记为0。例如,要求视频格式为mp4的分辨率必须大于320*240,如果待检查的视频分辨率为100*100,低于最低要求,则判定该视频的清晰度检查结果为0。
(2)视频时长是否满足要求,合规的金融销售具有规范的流程,对时长有最低要求,获取交易指标体系中的视频时长指标与所要求的最低时长进行判断,符合时长要求则记录时长检查结果为1(即,合格),否则记为0。例如,要求的视频时长必须大于3分钟,如果待检查的视频时长小于3分钟则判定该视频的长度检查结果为0。
(3)金融销售过程是否为客户本人参与。获取交易指标体系中视频基本信息指标中的客户身份核查结果,为客户本人参与则结果为1,否则结果为0。
(4)判断销售过程话术是否规范。获取交易指标体系中音频基本信息指标的产品合规关键词命中率,值域范围为0到1。命中率越高则表明销售话术的符合程度越高,即音视频合规(销售合规)的可能性越高。
(5)判断销售过程中客户经理是否有违规宣传、过分夸大收益等行为。获取交易指标体系中音频基本信息指标的产品违规关键词命中率,命中率越高则表明销售话术的符合程度越低。
为消除量纲影响,对上述规则判别结果数据采取数据离散化、数据归一化处理等数据处理方法。
在一个实施例中,预先训练基于合规性规则的决策树分类模型(对应于上述的合规模型)。根据上述合规性规则判断结果可以训练决策树分类模型,输入数据为上述对初始数据进行数据预处理后的各属性信息,包括:视频画质是否清晰、视频时长是否满足要求、是否为客户本人参与、产品合规关键词命中率、产品违规关键词命中率等字段。设置模型参数后,进行模型训练。模型的输出为判定该视频是否合规的二叉树。依据模型输出结果对本阶段金融产品销售数据进行首次合规判别。
S140:获取历史金融产品销售数据的根据合规性规则判别的首次合规判别结果(即,获取历史数据)。
基于合规性规则判别的历史数据包括:数据库中储存的根据决策树分类模型得出的合规检查结果以及模型输入数据。此处需要说明的是,若设定以季度为检查频率,则本季度或本阶段金融产品销售数据作为上一步骤利用合规性规则获得首次合规判别结果的输入数据,本步骤将获取的是金融销售合规数据库中的历史数据。
S150:获取经过上级机构及监管检查、客户投诉的事实修正结果。
获取经过上级机构、监管对销售产品数据进行二次检查不通过的销售记录。例如,可以增加“二次检查是否合规”字段,标记为“不合规交易”,标记二次检查通过的销售记录为“合规交易”,标记经过客户投诉的交易为“可疑交易”,标记客户下单后又撤单的交易为“易撤销交易”,可以此作为上一阶段及以前销售合规检查的事实修正结果。
S160:根据历史销售产品数据的首次合规判别结果和事实修正结果,获得最终合规判别结果。
利用S140获取的历史销售数据合规检查结果以及模型输入数据,结合步骤S150中获取的事实修正结果,将首次合规判别和二次人工判别结果(即,事实修正结果)共同作为判别标签生成最终合规判别结果。
在一个实施例中,对二次合规检查结果进行规范化处理,对“不合规交易”记录,赋值为0,“合规交易”记录,赋值为1,认为“可疑交易”记录与“易撤销交易”记录,均为“风险交易”,赋值为2,最终合规判别标签赋值规则如下表2所示:0代表不合规、1代表合规:
初次合规判别 | 二次人工判别 | 最终合规判断 | |
规则1 | 0 | - | 0 |
规则2 | 0 | - | 0 |
规则3 | 1 | 0 | 2 |
规则4 | 1 | 1 | 1 |
规则5 | 1 | 2 | 2 |
表2
S170:构建销售合规风险预警模型(对应于上述的风险预警模型),输出风险预警结果。
具体地,利用步骤S130处理得到的本阶段首次合规检查结果及模型输入数据,与步骤S160中计算得出的历史销售数据的最终合规判别标签,结合随机森林算法模型,构建面向销售合规数据的风险预警模型,以期对本阶段拟检查的销售数据进行自动化判别。
其中,风险预警模型的训练流程主要分为以下几步:
a.将S130步骤中得到的数据集作为初始训练集S,数量记为N,采用自助抽样法,有放回地每次抽取n个样本,作为一个训练子集Sk;
b.对于训练子集Sk,从三个数据指标体系D中,无放回的随机抽取d个特征,作为当前决策树上的每个节点是否进行分裂的依据,自上而下生成一个不进行剪枝的决策树Rk;
c.重复N次步骤a和b,得到n个训练子集S1,S2,…,Sn,并生成决策树R1,R2,…,Rn,其组合即形成随机森林R;
d.将测试集T,共划分为μ个样本集Tμ,将样本集Tμ输入模型中,让决策树R1,R2,…,R分对样本集Tμ中的任意样本t进行决策,然后采用多数投票法对决策结果投票,最终决定t的分类;
e.重复λ次步骤d,直到测试集T分类完成。
经过上述训练流程,生成针对初始训练集S的最终合规判定:合规交易、不合规交易、可疑交易这三种类别,并将不合规交易和可疑交易提示发送到营销管理系统。
S180:销售合规类别特征分析与优化建议推送。
针对步骤S170构建的销售合规风险预警模型,考虑到组成随机森林的每颗决策树特征选择与重要性不尽相同,也为更加有效的定位影响金融产品销售合规的影响因素,可以对三种交易类别的特征进行重要性排序并形成优化建议。例如,针对存在可疑交易的特征进行梳理,即通过采用平均不纯度的减少计算方法,计算每个特征在风险预警模型中的每颗决策树上做的贡献量,取平均值并比较各个特征之间的贡献大小,得出与可疑交易相关的特征重要性排序,具体可通过如下公式计算:
其中,是每个特征Xj的Gini指数评分,i指步骤c生成的随机森林R中的n个决策树,最终得到的特征值重要性排序结果例如为:[(0.605,An),(0.237,Cn),(0.039,Bn)……]。
由数据维度映射至业务流程维度,即可知具有An特征的客户购买Bn特征的产品可能会产生风险交易(如撤单),如此,可以优化业务销售过程中的服务质量、前期视频合规判别过程中的判定质量等。
具体而言,针对可疑交易数据子集Sd,输出按特征值重要性排序的交易记录具体内容,进行分析比对,以提出后续销售服务优化建议与意见。例如,可疑交易数据子集Sd中超过50%的视频时长特征值均超过可接受最大正常值T分钟,则由数据维度映射至业务流程维度,即可知销售时长或音视频时长大于某个值的交易可能会产生风险(如导致客户投诉),系统将优化规则推送到个人营销系统,后续客户经理可着重主要合理把控时间,优化服务体验,降低销售风险。
本发明实施例利用机器学习技术从积累的海量历史销售数据中挖掘潜在信息,使得销售风险得到全面的管控,可以避免人工管理,减少人工干预,减少人工操作风险,不仅可以提高金融产品销售合规识别的准确度,识别出不合规交易、风险交易、易撤销交易,为金融机构智能预警,还可以经过模型训练出销售风险可疑规则来指导优化业务流程,降低销售风险。
基于相似的发明构思,本发明实施例还提供一种数据处理装置,该装置优选地可以实现上述方法实施例中的流程。
图3是该数据处理装置的结构框图,如图3所示,该装置包括:数据获取单元31、预处理单元32、文本生成单元33、关键词识别单元34、关键帧图像截取单元35、初级合规结果生成单元36和最终合规结果生成单元37,其中:
数据获取单元31,用于获取音视频数据。
预处理单元32,用于对所述音视频数据进行预处理,生成音频数据和视频数据。
文本生成单元33,用于基于语音识别技术对所述音频数据进行识别生成文本数据。
关键词识别单元34,用于基于预定的文字匹配算法对所述文本数据进行关键词匹配,识别文本数据中的预定关键词。
关键帧图像截取单元35,用于根据识别的预定关键词在所述视频数据中截取预定数量的关键帧图像。
具体地,关键帧图像截取单元包括:位置信息确定模块和关键帧图像截取模块,其中:
位置信息确定模块,用于根据识别的预定关键词在文本数据中的位置信息,确定与该预定关键字对应的视频关键帧在视频数据中的位置信息;
关键帧图像截取模块,用于根据所述视频关键帧的位置信息在视频数据中截取预定数量的关键帧图像。
初级合规结果生成单元36,用于基于预定合规规则,根据识别的预定关键词和预定数量的关键帧图像生成所述音视频数据的初级合规结果。
具体地,该初级合规结果生成单元包括:客户信息生成模块和初级合规结果生成模块,其中:
客户信息生成模块,用于对所述关键帧图像进行人脸识别,根据识别结果生成客户信息;
初级合规结果生成模块,用于基于预定合规规则,根据识别的预定关键词和客户信息生成所述音视频数据的初级合规结果。
在一个实施例中,初级合规结果生成模块具体用于:将识别的预定关键词和客户信息输入至预先训练的合规模型,生成所述音视频数据的初级合规结果,其中,所述合规模型基于所述预定合规规则、历史音视频数据及其历史初级合规结果进行训练。
最终合规结果生成单元37,用于将所述初级合规结果输入至预先训练的风险预警模型,生成最终合规结果。
其中,所述风险预警模型基于随机森林算法、历史音视频数据及其历史初级合规结果和历史最终合规结果进行训练。
上述预定合规规则包括:多个合规特征。
具体地,所述最终合规结果生成单元具体用于:将所述音视频数据及其初级合规结果输入至预先训练的风险预警模型,生成最终合规结果,响应于所述最终合规结果为不合规交易或可疑交易,所述最终合规结果包括:各合规特征的重要性排序信息。
具体地,最终合规结果生成单元可以先根据所述最终合规结果基于平均不纯度减少计算方法确定各合规特征在该最终合规结果中的贡献信息;再根据所述各合规特征在该最终合规结果中的贡献信息生成各合规特征的重要性排序信息。
通过预处理单元32对数据获取单元31获取的音视频数据进行预处理后生成音频数据和视频数据,随后文本生成单元33基于语音识别技术对音频数据进行识别生成文本数据,关键词识别单元34基于预定的文字匹配算法对文本数据进行关键词匹配,识别文本数据中的预定关键词,之后关键帧图像截取单元35根据识别的预定关键词在所述视频数据中截取预定数量的关键帧图像,初级合规结果生成单元36基于预定合规规则,根据识别的预定关键词和预定数量的关键帧图像生成所述音视频数据的初级合规结果,最后最终合规结果生成单元37将所述初级合规结果输入至预先训练的风险预警模型,生成最终合规结果,本发明实施例基于机器学习技术智能识别音视频数据的合规性,相比于现有技术,本发明实施例可以提高对音视频数据合规性识别的准确率。
在实际操作中,上述装置还包括:更新单元,用于根据所述音视频数据及其初级合规结果、最终合规结果更新所述风险预警模型。
上述各单元、各模块的具体执行过程,可以参见上述方法实施例中的描述,此处不再赘述。
在实际操作中,上述各单元、各模块可以组合设置、也可以单一设置,本发明不限于此。
图4是根据本发明实施例的数据处理系统的示例结构框图,如图4所示,该示例系统包括:第一获取模块210、第一处理模块220、第二处理模块230、第二获取模块240、第三获取模块250、第三处理模块260、第四处理模块270、第五处理模块280、第一存储单元290,其中:
第一获取模块210,用于获取音视频数据,从销售管理系统获取交易信息,从产品管理系统获取产品信息,从个人客户营销管理系统获取客户信息和客户经理信息。
第一处理模块220,用于提取音视频信息、并进行预处理,经过数据处理后可构建金融产品销售数据指标体系,包含:参与者指标体系、产品指标体系与交易指标体系。
第二处理模块230,用于根据合规性判别规则第一处理模块220处理后的数据进行合规性检查获得首次合规判别结果。
第二获取模块240,用于获取历史数据的根据合规性规则的首次合规判别结果。
第三获取模块250,用于获取基于经过上级机构及监管检查、客户投诉的事实修正结果,该模块增加了“二次检查是否合规”字段,标记为“不合规交易”,标记二次检查通过的销售记录为“合规交易”,标记经过客户投诉的交易为“可疑交易”,标记客户下单后又撤单的交易为“易撤销交易”,可以此作为上一阶段及以前销售合规检查的事实修正结果。
第三处理模块260,用于根据历史销售数据的首次合规判别结果和事实修正结果,得到最终合规判别结果。
第四处理模块270,用于利用基于第一获取模块210获取的金融产品销售数据,构建的销售合规风险预警模型,输出风险预警结果,生成对待分析销售记录数据集的最终合规判定的类别,包括:合规交易、不合规交易、可疑交易三种类别,并推送风险预警结果到个人营销管理系统。
第五处理模块280,用于销售合规类别特征分析与推送优化建议到个人客户营销管理系统。
第一存储单元290,用于存储金融产品销售数据指标体系、首次合规检查结果、事实修正结果、最终合规判别结果、风险预警结果以及优化建议。
本实施例还提供一种电子设备,该电子设备可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该电子设备可以参照上述方法实施例进行实施及销售数据处理装置/系统的实施例进行实施,其内容被合并于此,重复之处不再赘述。
图5为本发明实施例的电子设备600的系统构成的示意框图。如图5所示,该电子设备600可以包括中央处理器100和存储器140;存储器140耦合到中央处理器100。值得注意的是,该图是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
一实施例中,销售数据处理功能可以被集成到中央处理器100中。其中,中央处理器100可以被配置为进行如下控制:
获取音视频数据,并对所述音视频数据进行预处理,生成音频数据和视频数据;
基于语音识别技术对所述音频数据进行识别生成文本数据,并基于预定的文字匹配算法对所述文本数据进行关键词匹配,识别文本数据中的预定关键词;
根据识别的预定关键词在所述视频数据中截取预定数量的关键帧图像;
基于预定合规规则,根据识别的预定关键词和预定数量的关键帧图像生成所述音视频数据的初级合规结果;
将所述初级合规结果输入至预先训练的风险预警模型,生成最终合规结果,所述风险预警模型基于随机森林算法、历史音视频数据及其历史初级合规结果和历史最终合规结果进行训练。
从上述描述可知,本申请实施例提供的电子设备,通过对获取的音视频数据进行预处理后生成音频数据和视频数据,随后基于语音识别技术对音频数据进行识别生成文本数据,并基于预定的文字匹配算法对文本数据进行关键词匹配,识别文本数据中的预定关键词,之后根据识别的预定关键词在所述视频数据中截取预定数量的关键帧图像,并基于预定合规规则,根据识别的预定关键词和预定数量的关键帧图像生成所述音视频数据的初级合规结果,最后将所述初级合规结果输入至预先训练的风险预警模型,生成最终合规结果,本发明实施例基于机器学习技术智能识别音视频数据的合规性,相比于现有技术,本发明实施例可以提高对音视频数据合规性识别的准确率。
在另一个实施方式中,数据处理装置/系统可以与中央处理器100分开配置,例如可以将数据处理装置/系统配置为与中央处理器100连接的芯片,通过中央处理器的控制来实现数据处理功能。
如图5所示,该电子设备600还可以包括:通信模块110、输入单元120、音频处理器130、显示器160、电源170。值得注意的是,电子设备600也并不是必须要包括图5中所示的所有部件;此外,电子设备600还可以包括图5中没有示出的部件,可以参考现有技术。
如图5所示,中央处理器100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器100接收输入并控制电子设备600的各个部件的操作。
其中,存储器140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器100可执行该存储器140存储的该程序,以实现信息存储或处理等。
输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向电子设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142,该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行电子设备600的操作的流程。
存储器140还可以包括数据存储部143,该数据存储部143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132,以经由扬声器131提供音频输出,并接收来自麦克风132的音频输入,从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器130还耦合到中央处理器100,从而使得可以通过麦克风132能够在本机上录音,且使得可以通过扬声器131来播放本机上存储的声音。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时以实现上述数据处理方法的步骤。
综上所述,本发明实施例提出了一种基于机器学习的风险预警方案,从积累的海量历史销售数据中挖掘潜在信息,利用机器学习算法对现有销售合规检查流程进行优化,不仅提升了合规销售过程中智能识别与预警的精准度,还可以基于销售风险可疑规则指导优化业务流程,降低销售风险。
以上参照附图描述了本发明的优选实施方式。这些实施方式的许多特征和优点根据该详细的说明书是清楚的,因此权利要求旨在覆盖这些实施方式的落入其真实精神和范围内的所有这些特征和优点。此外,由于本领域的技术人员容易想到很多修改和改变,因此不是要将本发明的实施方式限于所例示和描述的精确结构和操作,而是可以涵盖落入其范围内的所有合适修改和等同物。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种数据处理方法,其特征在于,所述方法包括:
获取音视频数据,并对所述音视频数据进行预处理,生成音频数据和视频数据;
基于语音识别技术对所述音频数据进行识别生成文本数据,并基于预定的文字匹配算法对所述文本数据进行关键词匹配,识别文本数据中的预定关键词;
根据识别的预定关键词在所述视频数据中截取预定数量的关键帧图像;
基于预定合规规则,根据识别的预定关键词和预定数量的关键帧图像生成所述音视频数据的初级合规结果;
将所述初级合规结果输入至预先训练的风险预警模型,生成最终合规结果;
其中,所述风险预警模型基于随机森林算法、历史音视频数据及其历史初级合规结果和历史最终合规结果进行训练。
2.根据权利要求1所述的方法,其特征在于,所述预定合规规则包括:多个合规特征,将所述初级合规结果输入至预先训练的风险预警模型,生成最终合规结果包括:
将所述音视频数据及其初级合规结果输入至预先训练的风险预警模型,生成最终合规结果,响应于所述最终合规结果为不合规交易或可疑交易,根据所述最终合规结果生成各合规特征的重要性排序信息。
3.根据权利要求2所述的方法,其特征在于,根据所述最终合规结果生成各合规特征的重要性排序信息包括:
根据所述最终合规结果基于平均不纯度减少计算方法确定各合规特征在该最终合规结果中的贡献信息;
根据所述各合规特征在该最终合规结果中的贡献信息生成各合规特征的重要性排序信息。
4.根据权利要求1所述的方法,其特征在于,根据识别的预定关键词在所述视频数据中截取预定数量的关键帧图像包括:
根据识别的预定关键词在文本数据中的位置信息,确定与该预定关键词对应的视频关键帧在视频数据中的位置信息;
根据所述视频关键帧的位置信息在视频数据中截取预定数量的关键帧图像。
5.根据权利要求1所述的方法,其特征在于,基于预定合规规则,根据识别的预定关键词和预定数量的关键帧图像生成所述音视频数据的初级合规结果包括:
对所述关键帧图像进行人脸识别,根据识别结果生成客户信息;
基于预定合规规则,根据识别的预定关键词和客户信息生成所述音视频数据的初级合规结果。
6.根据权利要求5所述的方法,其特征在于,基于预定合规规则,根据识别的预定关键词和客户信息生成所述音视频数据的初级合规结果包括:
将识别的预定关键词和客户信息输入至预先训练的合规模型,生成所述音视频数据的初级合规结果,其中,所述合规模型基于所述预定合规规则、历史音视频数据及其历史初级合规结果进行训练。
7.根据权利要求1所述的方法,其特征在于,在生成最终合规结果之后,所述方法还包括:
根据所述音视频数据及其初级合规结果、最终合规结果更新所述风险预警模型。
8.一种音视频数据处理装置,其特征在于,所述装置包括:
数据获取单元,用于获取音视频数据;
预处理单元,用于对所述音视频数据进行预处理,生成音频数据和视频数据;
文本生成单元,用于基于语音识别技术对所述音频数据进行识别生成文本数据;
关键词识别单元,用于基于预定的文字匹配算法对所述文本数据进行关键词匹配,识别文本数据中的预定关键词;
关键帧图像截取单元,用于根据识别的预定关键词在所述视频数据中截取预定数量的关键帧图像;
初级合规结果生成单元,用于基于预定合规规则,根据识别的预定关键词和预定数量的关键帧图像生成所述音视频数据的初级合规结果;
最终合规结果生成单元,用于将所述初级合规结果输入至预先训练的风险预警模型,生成最终合规结果;
其中,所述风险预警模型基于随机森林算法、历史音视频数据及其历史初级合规结果和历史最终合规结果进行训练。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110232424.0A CN112766824B (zh) | 2021-03-02 | 2021-03-02 | 数据处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110232424.0A CN112766824B (zh) | 2021-03-02 | 2021-03-02 | 数据处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112766824A CN112766824A (zh) | 2021-05-07 |
CN112766824B true CN112766824B (zh) | 2024-02-23 |
Family
ID=75690768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110232424.0A Active CN112766824B (zh) | 2021-03-02 | 2021-03-02 | 数据处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112766824B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117494212A (zh) * | 2023-11-24 | 2024-02-02 | 北京风平智能科技有限公司 | 一种人工智能内容生产实时风控方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147726A (zh) * | 2019-04-12 | 2019-08-20 | 财付通支付科技有限公司 | 业务质检方法和装置、存储介质及电子装置 |
CN110837581A (zh) * | 2019-11-04 | 2020-02-25 | 云目未来科技(北京)有限公司 | 视频舆情分析的方法、装置以及存储介质 |
CN110852231A (zh) * | 2019-11-04 | 2020-02-28 | 云目未来科技(北京)有限公司 | 违规视频检测方法、装置以及存储介质 |
CN111198945A (zh) * | 2019-12-03 | 2020-05-26 | 泰康保险集团股份有限公司 | 数据处理方法、装置、介质及电子设备 |
CN111741356A (zh) * | 2020-08-25 | 2020-10-02 | 腾讯科技(深圳)有限公司 | 双录视频的质检方法、装置、设备及可读存储介质 |
-
2021
- 2021-03-02 CN CN202110232424.0A patent/CN112766824B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147726A (zh) * | 2019-04-12 | 2019-08-20 | 财付通支付科技有限公司 | 业务质检方法和装置、存储介质及电子装置 |
CN110837581A (zh) * | 2019-11-04 | 2020-02-25 | 云目未来科技(北京)有限公司 | 视频舆情分析的方法、装置以及存储介质 |
CN110852231A (zh) * | 2019-11-04 | 2020-02-28 | 云目未来科技(北京)有限公司 | 违规视频检测方法、装置以及存储介质 |
CN111198945A (zh) * | 2019-12-03 | 2020-05-26 | 泰康保险集团股份有限公司 | 数据处理方法、装置、介质及电子设备 |
CN111741356A (zh) * | 2020-08-25 | 2020-10-02 | 腾讯科技(深圳)有限公司 | 双录视频的质检方法、装置、设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112766824A (zh) | 2021-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109767787B (zh) | 情绪识别方法、设备及可读存储介质 | |
US9652745B2 (en) | Model-driven evaluator bias detection | |
WO2021190086A1 (zh) | 面审风险控制方法、装置、计算机设备及存储介质 | |
CN111275546B (zh) | 金融客户欺诈风险识别方法及装置 | |
US11252279B2 (en) | Method and system for fraud clustering by content and biometrics analysis | |
CN107807941A (zh) | 信息处理方法和装置 | |
US11741376B2 (en) | Prediction of business outcomes by analyzing voice samples of users | |
WO2019074446A1 (en) | LOAN REQUEST PROCESSING SYSTEM AND METHOD | |
US11120199B1 (en) | Systems for transcribing, anonymizing and scoring audio content | |
CN111178940A (zh) | 一种自动生成销售话术图谱的方法和系统 | |
CN115409518A (zh) | 用户交易风险预警方法及装置 | |
CN111428217A (zh) | 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质 | |
CN106991312A (zh) | 基于声纹识别的互联网反欺诈认证方法 | |
CN112232950A (zh) | 针对借贷风险的评估方法及装置、设备、计算机可读存储介质 | |
CN112766824B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN111783432A (zh) | 信用证审单检查要点清单的生成方法及装置 | |
CN113705792A (zh) | 基于深度学习模型的个性化推荐方法、装置、设备及介质 | |
EP3879418B1 (en) | Identity verification method and device | |
CN113177733B (zh) | 基于卷积神经网络的中小微企业数据建模方法及系统 | |
CN113706258A (zh) | 基于组合模型的产品推荐方法、装置、设备及存储介质 | |
KR102104030B1 (ko) | 크라우드 펀딩 기반의 매장 창업 서비스 관리 장치 및 그 동작 방법 | |
CN113095203A (zh) | 双录数据质检中的客户签名检测方法及装置 | |
CN111935363A (zh) | 呼叫路由方法及系统 | |
CN111932018B (zh) | 银行业务绩效贡献信息预测方法及装置 | |
CN111160929A (zh) | 一种客户类型的确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |