CN116029673A - 业务审批数据抽样评价方法、装置、设备及存储介质 - Google Patents

业务审批数据抽样评价方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116029673A
CN116029673A CN202310017622.4A CN202310017622A CN116029673A CN 116029673 A CN116029673 A CN 116029673A CN 202310017622 A CN202310017622 A CN 202310017622A CN 116029673 A CN116029673 A CN 116029673A
Authority
CN
China
Prior art keywords
data
sampling
type
approval
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310017622.4A
Other languages
English (en)
Inventor
李锦和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
CCB Finetech Co Ltd
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN202310017622.4A priority Critical patent/CN116029673A/zh
Publication of CN116029673A publication Critical patent/CN116029673A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种业务审批数据抽样评价方法、装置、设备及存储介质。涉及大数据数据处理技术领域。该方法包括:获取业务审批数据,其中,业务审批数据包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型,并基于与数据类型对应的抽样规则,对业务审批数据进行抽样,以确定目标样本数据,以及基于预设分配规则,将目标样本数据分配至对应的评价节点,从而针对不同类型的业务审批数据利用抽样规则自动提取目标样本,并利用分配规则对目标样本自动分配,实现全流程的自动化处理。因此,不仅可以减少工作人员的工作量,而且还可以提高抽样的效率以及准确性。

Description

业务审批数据抽样评价方法、装置、设备及存储介质
技术领域
本申请涉及大数据数据处理技术领域,尤其涉及一种业务审批数据抽样评价方法、装置、设备及存储介质。
背景技术
随着互联网金融技术的发展,为了能够更好地进行各种业务,需要对业务审批数据进行抽样评价。相关技术中,抽样评价主要采用系统查询和线下流程结合进行评价工作,抽样人需线下从现有业务系统查询业务审批数据并进行手工提取样本,然后进行报送和流转,最终对样本数据进行评分。其中,业务审批数据会有不同的数据类型,而该流程中的数据抽样以及样本分配主要由人工线下进行,因此会影响抽样的时效性以及准确性。
发明内容
本申请提供一种业务审批数据抽样评价方法、装置、设备及存储介质,旨在至少在一定程度上解决相关技术中的技术问题之一。
第一方面,本申请提供一种业务审批数据抽样评价方法,包括:获取业务审批数据,其中,业务审批数据包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型;基于与数据类型对应的抽样规则,对业务审批数据进行抽样,以确定目标样本数据;以及基于预设分配规则,将目标样本数据分配至对应的评价节点。
第二方面,本申请提供一种业务审批数据抽样评价装置,包括:获取模块,用于获取业务审批数据,其中,业务审批数据包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型;抽样模块,用于基于与数据类型对应的抽样规则,对业务审批数据进行抽样,以确定目标样本数据;以及分配模块,用于基于预设分配规则,将目标样本数据分配至对应的评价节点。
第三方面,本申请提供一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现业务审批数据抽样评价方法。
第四方面,本申请提供一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行业务审批数据抽样评价方法。
第五方面,本申请提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行业务审批数据抽样评价方法。
本申请提供的业务审批数据抽样评价方法、装置、设备及存储介质,通过获取业务审批数据,其中,业务审批数据包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型,并基于与数据类型对应的抽样规则,对业务审批数据进行抽样,以确定目标样本数据,以及基于预设分配规则,将目标样本数据分配至对应的评价节点,从而针对不同类型的业务审批数据利用抽样规则自动提取目标样本,并利用分配规则对目标样本自动分配,实现全流程的自动化处理。因此,不仅可以减少工作人员的工作量,而且还可以提高抽样评价的效率以及准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是根据本申请第一实施例示出的业务审批数据抽样评价方法的流程示意图;
图2是根据本申请实施例示出的业务审批数据抽样评价流程示意图;
图3是根据本申请第二实施例示出的业务审批数据抽样评价方法的流程示意图;
图4是根据本申请第三实施例示出的业务审批数据抽样评价方法的流程示意图;
图5是根据本申请第四实施例示出的业务审批数据抽样评价方法的流程示意图;
图6是根据本申请示出的一种业务审批数据抽样评价装置的框图;
图7示出了适于用来实现本申请实施方式的示例性电子设备的框图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
其中,需要说明的是,本实施例的业务审批数据抽样评价方法的执行主体可以为业务审批数据抽样评价装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以包括但不限于终端、服务器端等。
图1是根据本申请第一实施例示出的业务审批数据抽样评价方法的流程示意图,如图1所示,该方法包括:
S101:获取业务审批数据。
其中,针对业务进行审批得到的数据可以被称为业务审批数据,该业务可以是任意可能的业务,对此不做限制。
在一个具体实例中,业务例如可以是银行信贷业务,则每一条信贷业务的审批记录可以作为本实施例的一条业务审批数据。其中,按照信贷业务类型,本实施例的业务审批数据例如可以分为综合授信业务审批数据、信用额度业务审批数据、单笔信用业务审批数据、项目评估业务审批数据、信用评级业务审批数据等5种类型,用户可以根据实际需求选择获取任意的业务类型的业务审批数据。
在实际应用中,图2是根据本申请实施例示出的业务审批数据抽样评价流程示意图,如图2所示,本实施例首先获取原始系统数据,例如,从银行的信贷业务系统获取该原始信贷审批数据作为业务审批数据。
其中,本实施例获取的业务审批数据例如包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型,也即是说,获取的业务审批数据可以包括结构化类型的业务审批数据,和/或非结构化类型的业务审批数据,和/或批量导入类型的业务审批数据。
其中,具有统一结构的数据类型可以被称为结构化类型。例如,两条业务审批数据为“名称:A公司,批复金额:1000万,客户类型:私企,业务性质:续议项目”、“名称:B公司,批复金额:500万,客户类型:上市公司,业务性质:复议项目”,这两条业务审批数据具有“批复金额”、“客户类型”、“业务性质”等统一的字段结构,因此将这该业务审批数据的数据类型划分为结构化类型。
而不具有统一结构的数据类型可以被称为非结构化类型。例如,业务审批数据中包括:客户调查评价报告、客户评级报告、项目评估报告、综合授信业务申报书、信用业务申报书、合规性审查意见、审批批复报告等,由于上述业务审批数据是根据每个业务的实际情况确定的,因此每个业务审批数据之间不具有统一的结构,因此可以将该类业务审批数据的数据类型划分为非结构化类型。
而批量导入的数据类型可以被称为批量导入类型,例如,信贷业务系统中通过客户端Excel表格导入的业务审批数据的数据类型为批量导入类型。
S102:基于与数据类型对应的抽样规则,对业务审批数据进行抽样,以确定目标样本数据。
也即是说,本公开实施例可以利用预设的抽样规则对业务审批数据进行抽样,抽取到的样本可以被称为目标样本数据。
其中,不同数据类型的业务审批数据,即:结构化类型的业务审批数据、非结构化类型的业务审批数据、批量导入类型的业务审批数据,可以对应不同的抽样规则。
如图2所示,在样本提取过程中,例如利用第一类规则(即:抽样规则,例如抽样评价模型)从结构化类型的业务审批数据中提取结构化样本,该结构化样本被作为目标样本数据;又例如,利用第二类规则(抽样规则)从批量导入类型的业务审批数据(即,Excel批量导入指定数据)提取目标样本数据;又例如,利用第三类规则(即:抽样规则,例如人工智能AI辅助技术)从非结构化类型的业务审批数据提取非结构化样本,该非结构化样本被作为目标样本数据。其中,抽样规则可以是任意的规则,对此不做限制。
在实际应用,上述的第一类规则、第二类规则以及第三类规则可以单独启用/禁用,抽取目标样本数据时被禁用的规则则不发生作用。此外,在抽样之前,用户例如可以选择综合授信业务、信用额度业务、单笔信用业务、项目评估业务、信用评级业务中的一种业务类型,则本次抽取的目标样本数据应符合用户选择的业务类型;并且,用户还可以选择时间限制条件,例如业务审批数据的开始时间和结束时间,以及选择审批机构限制条件,例如评审、批复、审定、评定机构限制条件等,对此不做限制。在完成业务类型以及限制条件设置后,系统可以基于设置的限制条件以及抽样规则从业务审批数据中抽取目标样本数据,并且可以将目标样本数据在系统界面中展示,并且可以导出目标样本数据。此外,用户可对提取出的目标样本数据进行清理,即删除一个或多个已提取的样本,用户可批量选择删除样本。
S103:基于预设分配规则,将目标样本数据分配至对应的评价节点。
在得到目标样本数据后,本实施例可以将基于预设分配规则,将目标样本数据分配至对应的评价节点(例如,评价人的客户端),即:图2的样本分配。其中,该评价节点可以是一个节点或者多个节点,对此不做限制。
一些实施例,分配规则例如可以是平均分配,也即是说,将目标样本数据平均分配至评价节点。例如,有100条目标样本数据和5个评价节点,则每个评价节点分配20条目标样本数据。
另一些实施例,分配规则例如还可以是“双人评价”规则,也即是说,将每个目标样本数据分配至两个评价节点。
另一些实施例,分配规则例如可以是每个分配节点的样本量规则。具体地,本实施例可以设置每个评价节点的最大评价样本量(例如50个),在将目标样本数据分配至对应的评价节点的操作中,本实施例可以获取每个评价节点当前未评价样本量,进一步地,根据评价节点的最大评价样本量以及当前未评价样本量,将目标样本数据分配至评价节点,保证每个评分节点的当前样本量不超过最大评价样本量。
另一些实施例,还可以由人工(抽样人)进行分配。具体地,可对每个评价人(即,评价节点)已分配的样本进行单独或批量增加、删除、移动给其他评价人等操作。移动给其他人的样本数量与该人已分配样本数量之和不得超过该人可评价样本数量。评价人收到样本后,可退回或进行评价。抽样人可将样本分配给预先设置的二次分配人,由二次分配人对评价人进行分配,分配规则与前述保持一致。抽样人可从二次分配人处取回未分配给评价人的样本;二次分配人也可退回样本。其中,系统可以显示每个评价节点的待评价样本数量之和。
在实际应用中,如图2所示,目标样本数据分配至评价节点后,评价人进行样本评价和信息查阅。具体地,评价人对分配给自己的样本进行评价和打分;评价人完成信息查阅、样本评价后,在系统中录入评价结果及意见;评价得分,数值选择形式,以数字0至10为选项;每个评价的评价得分=本次评价中所有评价人的平均分;评价意见,文本录入形式,最多可录入3000个汉字;若评价结果、评价意见有一项为空,则不允许提交。进一步地,系统对评价意见汇总和评价结果生成。具体地,汇总各评价人提交的样本评价意见,计算样本评价结果信息,其中,汇总规则例如:每个样本得分=评价该样本所有评价人评价分的平均值,完成整个抽样评价流程。
需要说明的是,本申请的技术方案中,所涉及到的数据的获取、存储、应用等,均符合相关法律法规的规定,且不违背公序良俗。
本公开实施例,通过获取业务审批数据,其中,业务审批数据包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型,并基于与数据类型对应的抽样规则,对业务审批数据进行抽样,以确定目标样本数据,以及基于预设分配规则,将目标样本数据分配至对应的评价节点,从而针对不同类型的业务审批数据利用抽样规则自动提取目标样本,并利用分配规则对目标样本自动分配,实现全流程的自动化处理。因此,不仅可以减少工作人员的工作量,而且还可以提高抽样评价的效率以及准确性。
图3是根据本申请第二实施例示出的业务审批数据抽样评价方法的流程示意图,如图3所示,该方法包括:
S301:获取业务审批数据,其中,业务审批数据包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型。
S301的具体说明参见上述实施例,此处不再赘述。
S302:确定非结构化类型的业务审批数据中的审批过程文本和审批批复文本。
本公开实施例中,业务审批数据的数据类型为非结构化类型,例如,客户调查评价报告、客户评级报告、项目评估报告、综合授信业务申报书、信用业务申报书、合规性审查意见、审批批复报告等,则本实施例可以利用AI辅助技术(抽样规则)从非结构化类型的业务审批数据中抽取目标样本数据。
在实际应用中,非结构化类型业务审批数据(例如,项目评估报告)是经过多级审批以及最终批复得到的,其中,多级审批过程产生的数据文本可以被称为审批过程文本,而最终批复的数据文本可以被称为审批批复文本,而本实施例首先确定每条非结构化类型的业务审批数据中的审批过程文本和审批批复文本。
S303:确定审批过程文本的情感类型,其中,情感类型分为积极情感、中性情感以及消极情感。
进一步地,本公开实施例可以对每条审批过程文本进行情感分析,确定审批过程文本的情感类型。其中,本实施例的情感类型例如分为积极情感(postive)、中性情感(neutral)以及消极情感(negative)。
一些实施例,在确定审批过程文本的情感类型的操作中,可以对审批过程文本进行分词处理,进一步利用预先训练的词向量模型(FastText)确定分词的词向量,即:用高维向量表示词语;进一步地,根据词向量生成审批过程文本的句向量,该句向量可以被称为第一句向量。其中,可以针对整个审批过程文本确定第一句向量,或者还可以针对审批过程文本中每个语句分别确定第一句向量,对此不做限制。
进一步地,本实施计算第一句向量与第二句向量的相似度(例如,0-1之间的数值),该第二句向量为系统预设的标准负面语句的句向量。其中,可以通过计算第一句向量与第二句向量的距离确定相似度,具体距离计算可为余弦距离、曼哈顿距离以及欧式距离,对此不做限制。
进一步地,根据预设阈值以及相似度,确定审批过程文本的情感类型。具体地,本实施例针对不同情感类型设置相似度阈值区间,例如,积极情感(postive)的相似度阈值为0-0.3,中性情感(neutral)的相似度阈值区间为03-0.7,消极情感(negative)的相似度阈值区间为0.7-1。则本实施例可以将每个审批过程文本的相似度与上述阈值区间进行比较,确定每个审批过程文本的情感类型。
S304:提取消极情感的审批过程文本的关键词。
具体地,首先确定消极情感的审批过程文本,即:确定相似度位于0.7-1区间的审批过程文本。例如,非结构化类型的业务审批数据A中的审批过程文本A的相似度为0.8,非结构化类型的业务审批数据B中审批过程文本B的相似度为0.85,则确定这两条文本为消极情感的审批过程文本。
进一步地,确定消极情感的审批过程文本的关键词(关注要点),例如:可以通过词库提取消极情感的审批过程文本的关键词,或者通过其他任意可能的方式提取消极情感的审批过程文本的关键词,对此不做限制。例如,审批过程文本A的关键词为“延迟还款”,审批过程文本B的关键词为“拖延还款”。
S305:从非结构化类型的业务审批数据中抽取审批过程文本的情感类型为消极情感、且对应的审批批复文本未包含关键词的样本数据作为目标样本数据。
举例而言,审批过程文本A的情感类型为消极情感,但是业务审批数据A的审批批复文本未包含关键词“延迟还款”,则将该业务审批数据A作为目标样本数据;而业务审批数据B的审批过程文本B的情感类型为消极情感,但是业务审批数据B的审批批复文本包含关键词“拖延还款”,则业务审批数据B不作为目标样本数据。
一些实施例,在消极情感的审批过程文本中包括多个关键词的情况下,则对应的审批批复文本未包含全部关键词的样本数据作为目标样本数据,也即是说,从非结构化类型的业务审批数据中抽取审批批复未囊括审批过程中负面关注点的目标样本数据。
从而,本公开实施例可以采用AI技术自动从非结构化类型的业务审批数据中抽取目标样本数据,提高数据抽取效率以及准确性,并且可以处理任意类型的非结构化业务审批数据,试用范围更广。
S306:基于预设分配规则,将目标样本数据分配至对应的评价节点。
S306的具体说明参见上述实施例,此处不再赘述。
本公开实施例,通过获取业务审批数据,其中,业务审批数据包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型,并基于与数据类型对应的抽样规则,对业务审批数据进行抽样,以确定目标样本数据,以及基于预设分配规则,将目标样本数据分配至对应的评价节点,从而针对不同类型的业务审批数据利用抽样规则自动提取目标样本,并利用分配规则对目标样本自动分配,实现全流程的自动化处理。因此,不仅可以减少工作人员的工作量,而且还可以提高抽样评价的效率以及准确性。此外,本公开实施例可以采用AI技术自动从非结构化类型的业务审批数据中抽取目标样本数据,提高数据抽取效率以及准确性,并且可以处理任意类型的非结构化业务审批数据,试用范围更广。
图4是根据本申请第三实施例示出的业务审批数据抽样评价方法的流程示意图,如图4所示,该方法包括:
S401:获取业务审批数据,其中,业务审批数据包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型。
S401的具体说明参见上述实施例,此处不再赘述。
S402:响应于在预设的抽样条件表的选择操作,确定目标抽样条件,其中,抽样条件表记录多个候选抽样条件,每个候选抽样条件包括多个字段规则。
在数据类型为结构化类型的情况下,也即是说,业务审批数据中包括结构化类型的业务审批数据,则本实施例可以基于抽样条件(抽样规则)抽取目标样本数据。
具体地,本实施例可以预先配置抽样条件表,抽样条件表如下表1:
表1
字段规则A 字段规则B 字段规则C 字段规则D 字段规则N
条件1 字段A:A1 字段B:B1 字段C:C1 字段D:D1 字段N:N1
条件2 字段A:A2 字段B:B2 字段C:C2 字段D:D2 字段N:N2
条件3 字段A:A3 字段B:B3 字段C:C3 字段D:D3 字段N:N3
条件4 字段A:A4 字段B:B4 字段C:C4 字段D:D4 字段N:N4
条件5 字段A:A5 字段B:B5 字段C:C5 字段D:D5 字段N:N5
条件6 字段A:A6 字段B:B6 字段C:C6 字段D:D6 字段N:N6
如表1所示,抽样条件表可以记录多个候选抽样条件,例如条件1、条件1、...、条件6,并且每个候选抽样条件可以包括多个字段规则,例如,字段规则A、字段规则B、字段规则C、字段规则D、...、字段规则N,其中,每个字段规则可以是任意的规则,例如,字段规则A为批复金额,字段规则B为客户类型(私企、国企、上市公司等),字段规则C为业务性质(续议项目或复议项目)等,对此不做限制。
在实际应用中,系统可以在界面显示该抽样条件表,用户可以基于该抽样条件表进行选择操作,即:选择一条或者多条候选抽样条件,或者选择候选抽样条件中的一个或者多个字段规则,而系统可以响应于用户在抽样条件表的选择操作,将用户选择的候选抽样条件作为目标抽样条件。
S403:从结构化类型的业务审批数据中抽取符合目标抽样条件的样本数据作为目标样本数据。
也即是说,基于目标抽样条件对结构化类型的业务审批数据进行筛选,抽取符合目标抽样条件的样本数据作为目标样本数据。从而,本实施例可以基于目标抽样条件快速地从结构化类型的业务审批数据中抽取目标样本数据。
S404:基于预设分配规则,将目标样本数据分配至对应的评价节点。
S404的具体说明参见上述实施例,此处不再赘述。
本公开实施例,通过获取业务审批数据,其中,业务审批数据包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型,并基于与数据类型对应的抽样规则,对业务审批数据进行抽样,以确定目标样本数据,以及基于预设分配规则,将目标样本数据分配至对应的评价节点,从而针对不同类型的业务审批数据利用抽样规则自动提取目标样本,并利用分配规则对目标样本自动分配,实现全流程的自动化处理。因此,不仅可以减少工作人员的工作量,而且还可以提高抽样评价的效率以及准确性。此外,本实施例可以基于目标抽样条件快速地从结构化类型的业务审批数据中抽取目标样本数据。
图5是根据本申请第四实施例示出的业务审批数据抽样评价方法的流程示意图,如图5所示,该方法包括:
S501:获取业务审批数据,其中,业务审批数据包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型。
S501的具体说明参见上述实施例,此处不再赘述。
S502:获取批量导入类型的业务审批数据的字段限制条件。
在数据类型为批量导入类型的情况下,也即是说,业务审批数据中包括批量导入类型的业务审批数据,在这种情况下,本实施例可以基于字段限制条件(抽样规则)抽取目标样本数据。
具体地,本实施例Excel批量导入类型的业务审批数据如下表2所示:
表2
业务类型 业务编号 起始日期 截至日期 审批机构
综合授信业务 xxxx1 2021/1/1 2021/12/31 A分行
信用额度业务 xxxx2 2021/1/1 2021/12/31 A分行
单笔信用业务 xxxx3 2021/1/1 2021/12/31 A分行
项目评估业务 xxxx4 2021/1/1 2021/12/31 A分行
信用评级业务 xxxx5 2021/1/1 2021/12/31 B分行
在本实施例中,如表2所示,每个字段都可以有对应的限制条件,起始日期字段限制条件、截至日期字段限制条件、审批机构字段限制条件等,而用户在系统可以针对该批量导入类型的业务审批数据输入一个或者多个字段限制条件,例如,起始日期字段的限制条件为2021/1/1,审批机构字段的限制条件为A分行,则系统可以获取用户输入的字段限制条件。
S503:从批量导入类型的业务审批数据中抽取符合字段限制条件的样本数据作为目标样本数据。
也即是说,从批量导入类型的业务审批数据中筛选符合字段限制条件的样本数据作为目标样本数据,例如,抽取上表2中起始日期为2021/1/1、且审批机构为A分行的样本数据作为目标样本数据。从而,可以利用字段限制条件针对批量导入类型的业务审批数据快速抽取目标样本数据。
S504:基于预设分配规则,将目标样本数据分配至对应的评价节点。
S504的具体说明参见上述实施例,此处不再赘述。
本公开实施例,能够针对不同类型的业务审批数据利用抽样规则自动提取目标样本,并利用分配规则对目标样本自动分配,实现全流程的自动化处理。因此,不仅可以减少工作人员的工作量,而且还可以提高抽样评价的效率以及准确性。此外,本实施例可以利用字段限制条件针对批量导入类型的业务审批数据快速抽取目标样本数据。
图6是根据本申请示出的一种业务审批数据抽样评价装置的框图,如图6所示,该业务审批数据抽样评价装置60包括:
获取模块601,用于获取业务审批数据,其中,业务审批数据包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型;
抽样模块602,用于基于与数据类型对应的抽样规则,对业务审批数据进行抽样,以确定目标样本数据;以及
分配模块603,用于基于预设分配规则,将目标样本数据分配至对应的评价节点。
一些实施例,在数据类型为非结构化类型的情况下,抽样模块602,具体用于:确定每条业务审批数据中的审批过程文本和审批批复文本;确定审批过程文本中的情感类型,其中,情感类型分为积极情感、中性情感以及消极情感;提取消极情感的审批过程文本的关键词;以及从非结构化类型的业务审批数据中抽取审批过程文本的情感类型为消极情感、且对应的审批批复文本未包含关键词的样本数据作为目标样本数据。
一些实施例,抽样模块602,具体用于:利用预先训练的词向量模型确定审批过程文本的第一句向量;计算第一句向量与标准负面语句的第二句向量的相似度;以及根据预设阈值以及相似度,确定审批过程文本的情感类型。
一些实施例,在数据类型为结构化类型的情况下,抽样模块602,具体用于:响应于在预设的抽样条件表的选择操作,确定目标抽样条件,其中,抽样条件表记录多个候选抽样条件,每个候选抽样条件包括多个字段规则;以及从结构化类型的业务审批数据中抽取符合目标抽样条件的样本数据作为目标样本数据。
一些实施例,在数据类型为批量导入类型的情况下,抽样模块602,具体用于:获取批量导入类型的业务审批数据的字段限制条件;以及从批量导入类型的业务审批数据中抽取符合字段限制条件的样本数据作为目标样本数据。
一些实施例,分配模块603,具体用于:将目标样本数据平均分配至评价节点;或者将每个目标样本数据分配至两个评价节点;或者根据评价节点的最大评价样本量以及当前未评价样本量,将目标样本数据分配至评价节点。
本实施例,通过获取业务审批数据,其中,业务审批数据包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型,并基于与数据类型对应的抽样规则,对业务审批数据进行抽样,以确定目标样本数据,以及基于预设分配规则,将目标样本数据分配至对应的评价节点,从而针对不同类型的业务审批数据利用抽样规则自动提取目标样本,并利用分配规则对目标样本自动分配,实现全流程的自动化处理。因此,不仅可以减少工作人员的工作量,而且还可以提高抽样评价的效率以及准确性。
根据本申请的实施例,本申请还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图7是根据本申请示出的一种电子设备的框图。例如,电子设备700可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图7,电子设备700可以包括以下一个或多个组件:处理组件702,存储器704,电源组件706,多媒体组件708,音频组件710,输入/输出(I/O)的接口712,传感器组件714,以及通信组件716。
处理组件702通常控制电子设备700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在电子设备700的操作。这些数据的示例包括用于在电子设备700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件706为电子设备700的各种组件提供电力。电源组件706可以包括电源管理系统,一个或多个电源,及其他与为电子设备700生成、管理和分配电力相关联的组件。
多媒体组件708包括在电子设备700和用户之间的提供一个输出接口的触控显示屏。在一些实施例中,触控显示屏可以包括液晶显示器(LCD)和触摸面板(TP)。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当电子设备700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当电子设备700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。
在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或多个传感器,用于为电子设备700提供各个方面的状态评估。例如,传感器组件714可以检测到电子设备700的打开/关闭状态,组件的相对定位,例如组件为电子设备700的显示器和小键盘,传感器组件714还可以检测电子设备700或电子设备700一个组件的位置改变,用户与电子设备700接触的存在或不存在,电子设备700方位或加速/减速和电子设备700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716被配置为便于电子设备700和其他设备之间有线或无线方式的通信。电子设备700可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述业务审批数据抽样评价方法。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器704,上述指令可由电子设备700的处理器920执行以完成上述方法。可选地,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (15)

1.一种业务审批数据抽样评价方法,其特征在于,包括:
获取业务审批数据,其中,所述业务审批数据包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型;
基于与所述数据类型对应的抽样规则,对所述业务审批数据进行抽样,以确定目标样本数据;以及
基于预设分配规则,将所述目标样本数据分配至对应的评价节点。
2.根据权利要求1所述的方法,其特征在于,在所述数据类型为所述非结构化类型的情况下,所述对所述业务审批数据进行抽样,以确定目标样本数据,包括:
确定非结构化类型的业务审批数据中的审批过程文本和审批批复文本;
确定所述审批过程文本的情感类型,其中,所述情感类型分为积极情感、中性情感以及消极情感;
提取消极情感的审批过程文本的关键词;以及
从非结构化类型的业务审批数据中抽取审批过程文本的情感类型为消极情感、且对应的所述审批批复文本未包含所述关键词的样本数据作为所述目标样本数据。
3.根据权利要求2所述的方法,其特征在于,确定所述审批过程文本的情感类型,包括:
利用预先训练的词向量模型确定所述审批过程文本的第一句向量;
计算所述第一句向量与标准负面语句的第二句向量的相似度;以及
根据预设阈值以及所述相似度,确定所述审批过程文本的情感类型。
4.根据权利要求1所述的方法,其特征在于,在所述数据类型为所述结构化类型的情况下,所述对所述业务审批数据进行抽样,以确定用于评价的目标样本数据,包括:
响应于在预设的抽样条件表的选择操作,确定目标抽样条件,其中,所述抽样条件表记录多个候选抽样条件,每个所述候选抽样条件包括多个字段规则;以及
从结构化类型的业务审批数据中抽取符合所述目标抽样条件的样本数据作为所述目标样本数据。
5.根据权利要求1所述的方法,其特征在于,在所述数据类型为所述批量导入类型的情况下,所述对所述业务审批数据进行抽样,以确定用于评价的目标样本数据,包括:
获取批量导入类型的业务审批数据的字段限制条件;以及
从批量导入类型的业务审批数据中抽取符合所述字段限制条件的样本数据作为所述目标样本数据。
6.根据权利要求1所述的方法,其特征在于,基于预设分配规则,将所述目标样本数据分配至对应的评价节点,包括:
将所述目标样本数据平均分配至所述评价节点;或者
将每个目标样本数据分配至两个所述评价节点;或者
根据所述评价节点的最大评价样本量以及当前未评价样本量,将所述所述目标样本数据分配至所述评价节点。
7.一种业务审批数据抽样评价装置,其特征在于,包括:
获取模块,用于获取业务审批数据,其中,所述业务审批数据包括以下至少一种数据类型:结构化类型、非结构化类型以及批量导入类型;
抽样模块,用于基于与所述数据类型对应的抽样规则,对所述业务审批数据进行抽样,以确定目标样本数据;以及
分配模块,用于基于预设分配规则,将所述目标样本数据分配至对应的评价节点。
8.根据权利要求7所述的装置,其特征在于,在所述数据类型为所述非结构化类型的情况下,所述抽样模块,具体用于:
确定非结构化类型的业务审批数据中的审批过程文本和审批批复文本;
确定所述审批过程文本中的情感类型,其中,所述情感类型分为积极情感、中性情感以及消极情感;
提取消极情感的审批过程文本的关键词;以及
从非结构化类型的业务审批数据中抽取审批过程文本的情感类型为消极情感、且对应的所述审批批复文本未包含所述关键词的样本数据作为所述目标样本数据。
9.根据权利要求8所述的装置,其特征在于,所述抽样模块,具体用于:
利用预先训练的词向量模型确定所述审批过程文本的第一句向量;
计算所述第一句向量与标准负面语句的第二句向量的相似度;以及
根据预设阈值以及所述相似度,确定所述审批过程文本的情感类型。
10.根据权利要求7所述的装置,其特征在于,在所述数据类型为所述结构化类型的情况下,所述抽样模块,具体用于:
响应于在预设的抽样条件表的选择操作,确定目标抽样条件,其中,所述抽样条件表记录多个候选抽样条件,每个所述候选抽样条件包括多个字段规则;以及
从结构化类型的业务审批数据中抽取符合所述目标抽样条件的样本数据作为所述目标样本数据。
11.根据权利要求7所述的装置,其特征在于,在所述数据类型为所述批量导入类型的情况下,所述抽样模块,具体用于:
获取批量导入类型的业务审批数据的字段限制条件;以及
从批量导入类型的业务审批数据中抽取符合所述字段限制条件的样本数据作为所述目标样本数据。
12.根据权利要求7所述的装置,其特征在于,所述分配模块,具体用于:
将所述目标样本数据平均分配至所述评价节点;或者
将每个目标样本数据分配至两个所述评价节点;或者
根据所述评价节点的最大评价样本量以及当前未评价样本量,将所述所述目标样本数据分配至所述评价节点。
13.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-6中任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-6中任一项所述的方法。
15.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-6中任一项所述的方法。
CN202310017622.4A 2023-01-06 2023-01-06 业务审批数据抽样评价方法、装置、设备及存储介质 Pending CN116029673A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310017622.4A CN116029673A (zh) 2023-01-06 2023-01-06 业务审批数据抽样评价方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310017622.4A CN116029673A (zh) 2023-01-06 2023-01-06 业务审批数据抽样评价方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116029673A true CN116029673A (zh) 2023-04-28

Family

ID=86071922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310017622.4A Pending CN116029673A (zh) 2023-01-06 2023-01-06 业务审批数据抽样评价方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116029673A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116777607A (zh) * 2023-08-24 2023-09-19 上海银行股份有限公司 一种基于nlp技术的智能审计方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116777607A (zh) * 2023-08-24 2023-09-19 上海银行股份有限公司 一种基于nlp技术的智能审计方法
CN116777607B (zh) * 2023-08-24 2023-11-07 上海银行股份有限公司 一种基于nlp技术的智能审计方法

Similar Documents

Publication Publication Date Title
US8977573B2 (en) System and method for identifying customers in social media
EP3173948A1 (en) Method and apparatus for recommendation of reference documents
CN111428032B (zh) 内容质量评价方法及装置、电子设备、存储介质
CN105528403B (zh) 目标数据识别方法及装置
CN111191438B (zh) 一种情感分析方法、装置和电子设备
CN108345625B (zh) 一种信息挖掘方法和装置、一种用于信息挖掘的装置
EP3734472A1 (en) Method and device for text processing
CN114328838A (zh) 事件抽取方法、装置、电子设备及可读存储介质
CN110019885B (zh) 一种表情数据推荐方法及装置
CN116029673A (zh) 业务审批数据抽样评价方法、装置、设备及存储介质
CN112183953A (zh) 客服资源的分配方法、装置、电子设备和存储介质
CN116822924A (zh) 工作流配置方法、装置、设备及存储介质
CN113849723A (zh) 搜索方法及搜索装置
CN111813932A (zh) 文本数据的处理方法、分类方法、装置及可读存储介质
CN116610717A (zh) 数据处理方法、装置、电子设备以及存储介质
CN116127062A (zh) 预训练语言模型的训练方法、文本情感分类方法及装置
CN107301188B (zh) 一种获取用户兴趣的方法及电子设备
CN111241238B (zh) 用户测评方法、装置、电子设备及存储介质
CN114138943A (zh) 对话消息生成方法、装置、电子设备及存储介质
CN112766005A (zh) 文本翻译方法、装置、设备及介质
CN111241833A (zh) 一种文本数据的分词方法、装置及电子设备
CN110209775B (zh) 一种文本的处理方法和装置
CN114117019A (zh) 智能问答的处理方法、装置、设备及存储介质
WO2024088039A1 (zh) 人机对话方法、对话网络模型的训练方法及装置
CN112102081B (zh) 生成区块链的方法、装置、可读存储介质及区块链网络

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination