CN112632289B - 业务条款数据的处理方法、装置、设备及存储介质 - Google Patents

业务条款数据的处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112632289B
CN112632289B CN202011506844.5A CN202011506844A CN112632289B CN 112632289 B CN112632289 B CN 112632289B CN 202011506844 A CN202011506844 A CN 202011506844A CN 112632289 B CN112632289 B CN 112632289B
Authority
CN
China
Prior art keywords
business
data
service
target
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011506844.5A
Other languages
English (en)
Other versions
CN112632289A (zh
Inventor
童阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202011506844.5A priority Critical patent/CN112632289B/zh
Publication of CN112632289A publication Critical patent/CN112632289A/zh
Priority to PCT/CN2021/090161 priority patent/WO2022126960A1/zh
Application granted granted Critical
Publication of CN112632289B publication Critical patent/CN112632289B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Technology Law (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Genetics & Genomics (AREA)
  • Physiology (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及大数据技术领域,提供一种业务条款数据的处理方法、装置、设备及存储介质,用于提高生成的业务产品文件的准确性。业务条款数据的处理方法包括:通过业务节点信息,对预先创建的业务方案知识图谱进行检索,得到包括业务条款数据的多个初始业务方案信息;通过遗传算法和多个初始业务方案信息,生成染色体初始种群个体和构建适应度函数;通过适应度函数,计算染色体初始种群个体的适应度函数值;基于适应度函数值,对染色体初始种群个体进行选择处理、交叉处理和变异处理,得到目标业务方案信息;根据得到的目标业务合同书数据,生成目标业务方案信息的目标业务产品文件。此外,本发明还涉及区块链技术,业务节点信息可存储于区块链中。

Description

业务条款数据的处理方法、装置、设备及存储介质
技术领域
本发明涉及大数据的数据处理领域,尤其涉及一种业务条款数据的处理方法、装置、设备及存储介质。
背景技术
随着业务产品的小型化和分时化,业务产品的发展趋向于细分化、异质化且按需订制,基于业务条款的业务产品定制为其中的一种方式。目前,对于基于业务条款的业务产品的定制方法,一般都是采用人工收集和确定的定制信息,将定制信息填充至预置模板,得到业务产品文件,该定制信息包括业务条款。
但是,上述的基于业务条款的业务产品定制方法中,由于受时间、业务背景和业务方案等因素,人工收集和确定的定制信息会存在信息不全、不准确的问题,因而,导致了生成的业务产品文件的准确性低。
发明内容
本发明提供一种业务条款数据的处理方法、装置、设备及存储介质,用于提高生成的业务产品文件的准确性。
本发明第一方面提供了一种业务条款数据的处理方法,包括:
获取业务节点信息,通过所述业务节点信息,对预先创建的业务方案知识图谱进行检索,得到多个初始业务方案信息,所述多个初始业务方案信息均包括业务条款数据;
通过预置的遗传算法和所述多个初始业务方案信息,生成染色体初始种群个体,以及构建适应度函数,一个染色体初始种群个体对应一个初始业务方案信息;
通过所述适应度函数,计算所述染色体初始种群个体的适应度函数值;
基于所述适应度函数值,对所述染色体初始种群个体进行选择处理、交叉处理和变异处理,得到目标业务方案信息;
获取与所述目标业务方案信息对应的目标业务合同书数据,并根据所述目标业务合同书数据,生成所述目标业务方案信息的目标业务产品文件。
可选的,在本发明第一方面的第一种实现方式中,所述基于所述适应度函数值,对所述染色体初始种群个体进行选择处理、交叉处理和变异处理,得到目标业务方案信息,包括:
判断所述适应度函数值是否满足预设遗传终止条件;
若所述适应度函数值满足所述预设遗传终止条件,则将对应的染色体初始种群个体确定为初始个体,从所述初始个体中获取目标业务方案信息;
若所述适应度函数值不满足所述预设遗传终止条件,则将对应的染色体初始种群个体进行稳定迭代的选择处理、交叉处理和变异处理,得到目标个体,直至所述目标个体的适应度函数值满足所述预设遗传终止条件,得到目标业务方案信息。
可选的,在本发明第一方面的第二种实现方式中,所述通过预置的遗传算法和所述多个初始业务方案信息,生成染色体初始种群个体,以及构建适应度函数,包括:
通过预置的遗传算法,随机生成各初始业务方案信息的染色体个体,得到染色体初始种群个体;
获取业务需求信息和基于所述业务节点信息的业务参数,通过预置的遗传算法、所述业务需求信息和所述业务参数,构建适应度函数,所述业务参数包括业务金额数据、业务期限数据、业务费用数据、初始业务方案信息中的业务数量和同种业务的数量,所述业务需求信息包括当遇到业务损失时的补偿金额数据。
可选的,在本发明第一方面的第三种实现方式中,所述获取与所述目标业务方案信息对应的目标业务合同书数据,并根据所述目标业务合同书数据,生成所述目标业务方案信息的目标业务产品文件,包括:
从预先创建的业务合同版块数据库中,匹配与所述目标业务方案信息对应的多个业务合同版块数据;
按照预置的合成顺序,将所述多个业务合同版块数据进行拼接,得到目标业务合同书数据;
将所述目标业务方案信息与所述目标业务合同书数据,依次进行融合和合同书文件生成,得到目标业务产品文件。
可选的,在本发明第一方面的第四种实现方式中,所述获取业务节点信息,通过所述业务节点信息,对预先创建的业务方案知识图谱进行检索,得到多个初始业务方案信息之前,还包括:
获取预处理业务条款数据,并创建所述预处理业务条款数据的复合词组;
对所述预处理业务条款数据依次进行资源描述框架提取模板创建、描述抽取和所述复合词组的校验,得到目标结构化数据;
基于所述目标结构化数据,对所述预处理业务条款数据进行知识抽取和融合,得到业务方案知识图谱。
可选的,在本发明第一方面的第五种实现方式中,所述获取预处理业务条款数据,并创建所述预处理业务条款数据的复合词组,包括:
获取初始业务条款数据,并对所述初始业务条款数据进行预处理,得到预处理业务条款数据,所述预处理业务条款数据包括文本分词;
通过所述文本分词和预置的业务词库,计算所述预处理业务条款数据中各词语的词语共现度和词语权重;
通过所述词语共现度和所述词语权重,提取所述预处理业务条款数据中的目标词,并对所述目标词进行组合得到复合词组。
可选的,在本发明第一方面的第六种实现方式中,所述对所述预处理业务条款数据依次进行资源描述框架提取模板创建、描述抽取和所述复合词组的校验,得到目标结构化数据,包括:
对所述预处理业务条款数据依次进行聚类、关键名词组提取、同义属性去除和含义转换,得到资源描述框架提取模板;
通过所述资源描述框架提取模板,对所述预处理业务条款数据进行描述抽取,得到初始结构化数据;
通过所述复合词组对所述初始结构化数据进行校验,得到目标结构化数据。
本发明第二方面提供了一种业务条款数据的处理装置,包括:
检索模块,用于获取业务节点信息,通过所述业务节点信息,对预先创建的业务方案知识图谱进行检索,得到多个初始业务方案信息,所述多个初始业务方案信息均包括业务条款数据;
构建模块,用于通过预置的遗传算法和所述多个初始业务方案信息,生成染色体初始种群个体,以及构建适应度函数,一个染色体初始种群个体对应一个初始业务方案信息;
计算模块,用于通过所述适应度函数,计算所述染色体初始种群个体的适应度函数值;
处理模块,用于基于所述适应度函数值,对所述染色体初始种群个体进行选择处理、交叉处理和变异处理,得到目标业务方案信息;
生成模块,用于获取与所述目标业务方案信息对应的目标业务合同书数据,并根据所述目标业务合同书数据,生成所述目标业务方案信息的目标业务产品文件。
可选的,在本发明第二方面的第一种实现方式中,所述处理模块具体用于:
判断所述适应度函数值是否满足预设遗传终止条件;
若所述适应度函数值满足所述预设遗传终止条件,则将对应的染色体初始种群个体确定为初始个体,从所述初始个体中获取目标业务方案信息;
若所述适应度函数值不满足所述预设遗传终止条件,则将对应的染色体初始种群个体进行稳定迭代的选择处理、交叉处理和变异处理,得到目标个体,直至所述目标个体的适应度函数值满足所述预设遗传终止条件,得到目标业务方案信息。
可选的,在本发明第二方面的第二种实现方式中,所述构建模块具体用于:
通过预置的遗传算法,随机生成各初始业务方案信息的染色体个体,得到染色体初始种群个体;
获取业务需求信息和基于所述业务节点信息的业务参数,通过预置的遗传算法、所述业务需求信息和所述业务参数,构建适应度函数,所述业务参数包括业务金额数据、业务期限数据、业务费用数据、初始业务方案信息中的业务数量和同种业务的数量,所述业务需求信息包括当遇到业务损失时的补偿金额数据。
可选的,在本发明第二方面的第三种实现方式中,所述生成模块具体用于:
从预先创建的业务合同版块数据库中,匹配与所述目标业务方案信息对应的多个业务合同版块数据;
按照预置的合成顺序,将所述多个业务合同版块数据进行拼接,得到目标业务合同书数据;
将所述目标业务方案信息与所述目标业务合同书数据,依次进行融合和合同书文件生成,得到目标业务产品文件。
可选的,在本发明第二方面的第四种实现方式中,所述业务条款数据的处理装置,还包括:
创建模块,用于获取预处理业务条款数据,并创建所述预处理业务条款数据的复合词组;
校验模块,用于对所述预处理业务条款数据依次进行资源描述框架提取模板创建、描述抽取和所述复合词组的校验,得到目标结构化数据;
融合模块,用于基于所述目标结构化数据,对所述预处理业务条款数据进行知识抽取和融合,得到业务方案知识图谱。
可选的,在本发明第二方面的第五种实现方式中,所述创建模块具体用于:
获取初始业务条款数据,并对所述初始业务条款数据进行预处理,得到预处理业务条款数据,所述预处理业务条款数据包括文本分词;
通过所述文本分词和预置的业务词库,计算所述预处理业务条款数据中各词语的词语共现度和词语权重;
通过所述词语共现度和所述词语权重,提取所述预处理业务条款数据中的目标词,并对所述目标词进行组合得到复合词组。
可选的,在本发明第二方面的第六种实现方式中,所述校验模块具体用于:
对所述预处理业务条款数据依次进行聚类、关键名词组提取、同义属性去除和含义转换,得到资源描述框架提取模板;
通过所述资源描述框架提取模板,对所述预处理业务条款数据进行描述抽取,得到初始结构化数据;
通过所述复合词组对所述初始结构化数据进行校验,得到目标结构化数据。
本发明第三方面提供了一种业务条款数据的处理设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述业务条款数据的处理设备执行上述的业务条款数据的处理方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的业务条款数据的处理方法。
本发明提供的技术方案中,获取业务节点信息,通过业务节点信息,对预先创建的业务方案知识图谱进行检索,得到多个初始业务方案信息,多个初始业务方案信息均包括业务条款数据;通过预置的遗传算法和多个初始业务方案信息,生成染色体初始种群个体,以及构建适应度函数,一个染色体初始种群个体对应一个初始业务方案信息;通过适应度函数,计算染色体初始种群个体的适应度函数值;基于适应度函数值,对染色体初始种群个体进行选择处理、交叉处理和变异处理,得到目标业务方案信息;获取与目标业务方案信息对应的目标业务合同书数据,并根据目标业务合同书数据,生成目标业务方案信息的目标业务产品文件。本发明实施例中,通过预置的遗传算法和从业务方案知识图谱中所得的多个初始业务方案信息,生成染色体初始种群个体,以及构建适应度函数,通过采用业务方案知识图谱,解决了由于受时间、业务背景和业务方案等因素,人工收集和确定的定制信息会存在信息不全、不准确的问题,以及能够有效地自动生成多个初始业务方案信息,通过基于适应度函数值,对染色体初始种群个体进行选择处理、交叉处理和变异处理,根据目标业务合同书数据生成目标业务方案信息的目标业务产品文件,通过结合遗传算法,能够有效地选出多个初始业务方案信息中的最优业务方案信息,提高了目标业务方案信息的质量和匹配度,从而提高了生成的业务产品文件的准确性。
附图说明
图1为本发明实施例中业务条款数据的处理方法的一个实施例示意图;
图2为本发明实施例中业务条款数据的处理方法的另一个实施例示意图;
图3为本发明实施例中业务条款数据的处理装置的一个实施例示意图;
图4为本发明实施例中业务条款数据的处理装置的另一个实施例示意图;
图5为本发明实施例中业务条款数据的处理设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种业务条款数据的处理方法、装置、设备及存储介质,提高了生成的业务产品文件的准确性。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中业务条款数据的处理方法的一个实施例包括:
101、获取业务节点信息,通过业务节点信息,对预先创建的业务方案知识图谱进行检索,得到多个初始业务方案信息,多个初始业务方案信息均包括业务条款数据。
可以理解的是,本发明的执行主体可以为业务条款数据的处理装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
其中,业务节点信息包括业务内容信息和业务对象信息,业务内容信息包括业务类别、业务内容、业务额度和业务期限等,业务对象信息包括业务对象和业务对象属性等,例如:以业务为保险为例说明,业务内容信息包括保险险种类别、保障内容、保障额度、保障期限等,业务对象信息包括保险对象和保险对象属性等。每个初始业务方案信息都包括业务相关信息和业务条款数据,例如:以业务为保险为例说明,每个初始业务方案信息都包括基本的保费范围、保障内容、保障期限和免责条款等。
服务器可通过计算业务节点信息与预先创建的业务方案知识图谱中的节点信息之间的相似度,将相似度大于预设相似度的节点确定为目标节点,从而得到对应的多个目标节点;服务器也可通过创建业务节点信息的索引,通过索引对预先创建的业务方案知识图谱进行检索,得到对应的多个目标节点。服务器根据多个目标节点,对预先创建的业务方案知识图谱进行随机游走,得到多个初始业务方案信息。
102、通过预置的遗传算法和多个初始业务方案信息,生成染色体初始种群个体,以及构建适应度函数,一个染色体初始种群个体对应一个初始业务方案信息。
服务器通过预置的遗传算法,对多个初始业务方案信息进行进化代数初始化,并设置多个初始业务方案信息的最大进化代数,随机生成每个初始业务方案信息对应的染色体个体,得到多个染色体个体,服务器对多个染色体个体进行分组,得到多个染色体个体组,对每个染色体个体组中的染色体个体进行自然数编码,得到染色体初始种群个体。服务器通过接收预置界面输入的业务参数和客户需求,得到适应度函数的构建条件信息,通过该构建条件信息建立适应度函数。
103、通过适应度函数,计算染色体初始种群个体的适应度函数值。
例如,适应度函数为
Figure BDA0002845183630000081
fi表示适应度函数,Rm表示业务金额数据的权重,i表示第i份业务,n表示初始业务方案信息中的业务数量,Xi表示同种业务的数量,Mi表示业务金额数据,Rt表示业务期限数据的权重,Ti表示业务期限数据,Ri表示当遇到业务损失时的补偿金额数据的权重,I(x)表示当遇到业务损失时的补偿金额数据,Rmf表示业务费用数据的权重,Ni表示业务费用数据。
以业务金额数据的权重为保险金额数据的权重、以业务为保险、以初始业务方案信息中的业务数量为保险方案中的保险数量、以同种业务的数量为建议客户购买同种保险的份数、以业务金额数据为保险金额数据、以业务期限数据的权重为保险期限数据的权重、以业务期限数据为保险期限数据、以当遇到业务损失时的补偿金额数据的权重为客户遭受损失时,此保险方案可为客户带来的补偿额度数据的权重、以当遇到业务损失时的补偿金额数据为客户遭受损失时,此保险方案可为客户带来的补偿额度数据、以业务费用数据的权重为保险费用数据的权重和以业务费用数据为保险费用数据,以及以染色体初始种群个体1为例说明,若染色体初始种群个体1的保险金额数据的权重为0.4、保险方案中的保险数量为1、建议客户购买同种保险的份数为3、保险金额数据为100万、保险期限数据的权重为0.3、保险期限数据为12年、客户遭受损失时,此保险方案可为客户带来的补偿额度数据的权重为0.5、客户遭受损失时,此保险方案可为客户带来的补偿额度数据为200万、保险费用数据的权重为0.3和保险费用数据为50万,则染色体初始种群个体的适应度函数值为:
Figure BDA0002845183630000091
104、基于适应度函数值,对染色体初始种群个体进行选择处理、交叉处理和变异处理,得到目标业务方案信息。
服务器得到每个染色体初始种群个体的适应度函数值后,将该适应度函数值进行四舍五入后得到最终的适应度函数值,判断该最终的适应度函数值是否满足预设终止条件,该预设终止条件可为最大进化代数,若是,则停止执行,并将最终的适应度函数值对应的染色体初始种群个体(即初始业务方案信息)确定为目标业务方案信息,若否,则通过预置的选择运算算法,计算所有染色体初始种群个体的适应度函数值和值,计算每个染色体初始种群个体(即初始业务方案信息)基于适应度函数值和值的遗传概率,将所有染色体初始种群个体(即初始业务方案信息)的遗传概率进行归一化处理,得到归一化值,从归一化值中随机生成一个随机数,基于随机数,将染色体初始种群个体进行随机配对、交叉点设置和部分信息交换,得到多个交叉染色体个体,按照预置的变异概率将多个交叉染色体个体进行变异点的信息值取反处理,得到染色体候选种群个体,计算各染色体候选种群个体的候选适应度值,并判断候选适应度值是否满足预设终止条件,若是,则停止执行,并将候选适应度值对应的染色体候选种群个体确定为目标业务方案信息,若否,则迭代执行上述染色体候选种群个体获取的执行过程,直到适应度函数收敛,得到目标业务方案信息。
105、获取与目标业务方案信息对应的目标业务合同书数据,并根据目标业务合同书数据,生成目标业务方案信息的目标业务产品文件。
服务器获取目标业务方案信息的业务类型,根据业务类型从预置数据库中,匹配到对应的多个历史业务合同书数据,计算目标业务方案信息分别与多个历史业务合同书数据的相似度,按照相似度的值从大到小的顺序,对多个历史业务合同书数据进行排序,将排序第一的历史业务合同书数据确定为初始业务合同书数据,获取客户需求信息,根据客户需求信息对初始业务合同书数据进行分析,得到分析信息,该分析信息包括符合客户需求信息的第一数据,以及不符合客户需求信息的第二数据,根据所述第二数据,从预置数据库中匹配对应的模板数据,将模板数据替换第二数据,从而得到目标业务合同书数据,提高了目标业务合同书数据的准确性,通过目标业务合同书数据,将目标业务方案信息生成对应的目标业务产品文件。
本发明实施例中,通过预置的遗传算法和从业务方案知识图谱中所得的多个初始业务方案信息,生成染色体初始种群个体,以及构建适应度函数,通过采用业务方案知识图谱,解决了由于受时间、业务背景和业务方案等因素,人工收集和确定的定制信息会存在信息不全、不准确的问题,以及能够有效地自动生成多个初始业务方案信息,通过基于适应度函数值,对染色体初始种群个体进行选择处理、交叉处理和变异处理,根据目标业务合同书数据生成目标业务方案信息的目标业务产品文件,通过结合遗传算法,能够有效地选出多个初始业务方案信息中的最优业务方案信息,提高了目标业务方案信息的质量和匹配度,从而提高了生成的业务产品文件的准确性。
请参阅图2,本发明实施例中业务条款数据的处理方法的另一个实施例包括:
201、获取预处理业务条款数据,并创建预处理业务条款数据的复合词组。
具体地,服务器获取初始业务条款数据,并对初始业务条款数据进行预处理,得到预处理业务条款数据,预处理业务条款数据包括文本分词;通过文本分词和预置的业务词库,计算预处理业务条款数据中各词语的词语共现度和词语权重;通过词语共现度和词语权重,提取预处理业务条款数据中的目标词,并对目标词进行组合得到复合词组。
服务器通过预置数据库中读取历史存储的业务文件,调用预置的文件格式转换工具,将业务文件进行半结构化数据转换,从而得到初始业务条款数据,例如:以初始业务条款数据为责任险保险保单内容数据,以业务文件为责任险保单文件为例说明,服务器通过预置数据库中读取历史存储的责任险保单文件,责任险保单文件是以图片、PDF和word等格式文件存储,则调用对应的光学字符识别(optical character recognition,OCR)工具、解析器PDFMiner或其他文件格式转换工具,将责任险保单文件进行可扩展标记语言(extensible markup language,XML)格式转换,得到具有逻辑结构的半结构化文档,即初始业务条款数据,初始业务条款数据包括保障责任标题信息和保障责任描述信息。
词语共现度包括共现词语的共现词频和共现词语的共现概率中的至少一个,共现词语用于指示在共同出现在预处理业务条款数据中同一个句子、段落中的联合概率满足一定数值的词语,共现词频用于指示共现词语在同一个句子、段落中的最小频率值,共现概率用于指示共现词语的共现词频与所在句子、段落中词汇总数的比值。服务器对初始业务条款数据依次进行格式转换、编码转换、事项分类、长句切分和分词处理等预处理操作,从而得到预处理业务条款数据,其中,服务器可调用预置的业务条款词典对初始业务条款数据进行分词处理,从而得到文本分词。
服务器通过文本分词和预置的业务词库,计算得到预处理业务条款数据中各词语的词语共现度和词语权重后,可按照词语共现度和词语权重,分别提取预处理业务条款数据中对应的词,得到第一初始词和第二初始词,将第一初始词和第二初始词进行去重融合,得到目标词;也可将词语共现度和词语权重进行加权求和,得到和值,根据该和值提取预处理业务条款数据中对应的词,得到目标词,将目标词进行组合得到复合词组,复合词组的数量包括一个或一个以上。
202、对预处理业务条款数据依次进行资源描述框架提取模板创建、描述抽取和复合词组的校验,得到目标结构化数据。
具体地,服务器对预处理业务条款数据依次进行聚类、关键名词组提取、同义属性去除和含义转换,得到资源描述框架提取模板;通过资源描述框架提取模板,对预处理业务条款数据进行描述抽取,得到初始结构化数据;通过复合词组对初始结构化数据进行校验,得到目标结构化数据。
服务器对预处理业务条款数据中的事项内容长句进行聚类分析,得到聚类结果,预处理业务条款数据包括事项内容长句,通过参数估计算法和聚类结果,对预处理业务条款数据进行关键名词组提取,得到初始关键名词组,计算每两个初始关键名词组之间的余弦相似度,将余弦相似度大于预置的目标值的初始关键名词组去除,得到候选关键名词组,将候选关键名词组进行知识含义转换,得到目标关键名词组,通过预置的回溯算法,对目标关键名词组的属性提取过程进行回溯,得到资源描述框架(resource descriptionframework,RDF)提取模板。通过RDF提取模板建立正则算法,通过正则算法,对预处理业务条款数据进行基于描述数据和描述信息的抽取或实体描述性短语的抽取(即描述抽取),得到初始结构化数据,通过复合词组对初始结构化数据进行校验,将校验通过的初始结构化数据,确定为目标结构化数据,将无法校验或校验失败的初始结构化数据发送至可视化窗口,通过可视化窗口对无法校验的初始结构化数据进行人工校验,并接收可视化窗口发送的人工校验通过的初始结构化数据,得到目标结构化数据,目标结构化数据可用于可视化展示和存储。
203、基于目标结构化数据,对预处理业务条款数据进行知识抽取和融合,得到业务方案知识图谱。
服务器得到目标结构化数据后,对预处理业务条款数据进行基于实体、关系和属性的知识抽取,得到初步知识表示数据,将目标结构化数据和初步知识表示数据进行融合,得到融合数据,调用预先创建的数据模型对融合数据进行规范处理,以及基于表示信息和关联关系和序列顺序的修正处理,得到业务方案知识图谱,该数据模型包括业务条款数据的关联关系、关联顺序和连接关系等。通过创建预处理业务条款数据的复合词组,以及对预处理业务条款数据依次进行资源描述框架提取模板创建、描述抽取和复合词组的校验,得到目标结构化数据,来构建业务方案知识图谱,提高了业务方案知识图谱检索的效率和准确性。
204、获取业务节点信息,通过业务节点信息,对预先创建的业务方案知识图谱进行检索,得到多个初始业务方案信息,多个初始业务方案信息均包括业务条款数据。
该步骤204的执行过程与上述步骤101的执行过程类似,在此不再赘述。
205、通过预置的遗传算法和多个初始业务方案信息,生成染色体初始种群个体,以及构建适应度函数,一个染色体初始种群个体对应一个初始业务方案信息。
具体地,服务器通过预置的遗传算法,随机生成各初始业务方案信息的染色体个体,得到染色体初始种群个体;获取业务需求信息和基于业务节点信息的业务参数,通过预置的遗传算法、业务需求信息和业务参数,构建适应度函数,业务参数包括业务金额数据、业务期限数据、业务费用数据、初始业务方案信息中的业务数量和同种业务的数量,业务需求信息包括当遇到业务损失时的补偿金额数据。
例如,服务器通过预置的遗传算法,对多个初始业务方案信息进行进化代数初始化,并设置多个初始业务方案信息的最大进化代数,随机生成每个初始业务方案信息对应的染色体个体,得到多个染色体个体,服务器对多个染色体个体进行分组,得到多个染色体个体组,对每个染色体个体组中的染色体个体进行自然数编码,得到染色体初始种群个体,并获取业务需求信息和基于业务节点信息的业务参数,通过预置的遗传算法、业务需求信息和业务参数,构建适应度函数,适应度函数具体如下:
Figure BDA0002845183630000131
fi表示适应度函数,Rm表示业务金额数据的权重,i表示第i份业务,n表示初始业务方案信息中的业务数量,Xi表示同种业务的数量,Mi表示业务金额数据,Rt表示业务期限数据的权重,Ti表示业务期限数据,Ri表示当遇到业务损失时的补偿金额数据的权重,I(x)表示当遇到业务损失时的补偿金额数据,Rmf表示业务费用数据的权重,Ni表示业务费用数据。
206、通过适应度函数,计算染色体初始种群个体的适应度函数值。
该步骤206的执行过程与上述步骤103的执行过程类似,在此不再赘述。
207、基于适应度函数值,对染色体初始种群个体进行选择处理、交叉处理和变异处理,得到目标业务方案信息。
具体地,服务器判断适应度函数值是否满足预设遗传终止条件;若适应度函数值满足预设遗传终止条件,则将对应的染色体初始种群个体确定为初始个体,从初始个体中获取目标业务方案信息;若适应度函数值不满足预设遗传终止条件,则将对应的染色体初始种群个体进行稳定迭代的选择处理、交叉处理和变异处理,得到目标个体,直至目标个体的适应度函数值满足预设遗传终止条件,得到目标业务方案信息。
其中,预设遗传终止条件可为预设阈值,该预设阈值小于最大进化代数。当适应度函数值满足预设遗传终止条件,对应的初始个体的数量小于或等于2时,将对应的所有初始个体确定为目标业务方案信息。当适应度函数值满足预设遗传终止条件,对应的初始个体的数量大于2时,按照适应度函数值从大到小的顺序,对初始个体进行排序,将排序第一和第二的初始个体确定为目标业务方案信息。当适应度函数值不满足预设遗传终止条件的染色体初始种群个体的数量为一个时,停止遗传算法的执行,将该染色体初始种群个体的初始业务方案信息剔除。当适应度函数值不满足预设遗传终止条件的染色体初始种群个体的数量为一个以上时,按照预置的选择概率、交叉概率和变异概率,依次对对应的染色体初始种群个体进行稳定迭代的选择处理、交叉处理和变异处理,得到目标个体,通过适应度函数计算目标个体的适应度函数值,直到得到新的适应度函数值符合预设遗传终止条件,停止稳定迭代的选择处理、交叉处理和变异处理的执行,若此时得到的目标个体的数量大于2时,按照目标个体的适应度函数值,对目标个体进行排序,将排序第一和第二的目标个体确定为目标业务方案信息,若此时得到的目标个体的数量小于或等于2,将对应的所有目标个体确定为目标业务方案信息。
208、获取与目标业务方案信息对应的目标业务合同书数据,并根据目标业务合同书数据,生成目标业务方案信息的目标业务产品文件。
具体地,服务器从预先创建的业务合同版块数据库中,匹配与目标业务方案信息对应的多个业务合同版块数据;按照预置的合成顺序,将多个业务合同版块数据进行拼接,得到目标业务合同书数据;将目标业务方案信息与目标业务合同书数据,依次进行融合和合同书文件生成,得到目标业务产品文件。
服务器调用预置的搜索引擎,基于目标业务方案信息,对预先创建的业务合同版块数据库进行检索,得到对应的多个业务合同版块数据,按照预置的合成顺序,将多个业务合同版块数据进行依序拼接,得到目标业务合同书数据,该合成顺序可由用户在预置界面基于多个业务合同版块数据输入的合成版块拼接顺序而得,该合成顺序也可为预先创建的各业务合同版块数据基于各需求而合成的顺序,通过将多个业务合同版块数据进行拼接,得到目标业务合同书数据,增强了目标业务合同书数据的灵活性,有利于目标业务合同书数据的灵活匹配和灵活调整,从而有效地提高了目标业务合同书数据的准确性。
服务器将目标业务方案信息与目标业务合同书数据进行融合并生成合同书文件后,将该合同书文件和审核指令发送至预置审核端,以使得预置审核端基于审核指令,对该合同书文件的完整性、准确性和客户需求符合度进行审核,并将审核通过的合同书文件和审核结果发送至服务器,服务器接收该审核通过的合同书文件和审核结果,从而得到目标业务产品文件,其中,预置审核端基于审核指令,对该合同书文件的完整性、准确性和客户需求符合度进行审核的方式为层级审核,即预置审核端的数量包括一个以上,下一个预置审核端审核上一预置审核端发送的审核结果和合同书文件,以提高审核结果和合同书文件审核的准确性。
本发明实施例中,不仅通过采用业务方案知识图谱,解决了由于受时间、业务背景和业务方案等因素,人工收集和确定的定制信息会存在信息不全、不准确的问题,以及能够有效地自动生成多个初始业务方案信息,通过结合遗传算法,能够有效地选出多个初始业务方案信息中的最优业务方案信息,提高了目标业务方案信息的质量和匹配度,从而提高了生成的业务产品文件的准确性,还通过创建预处理业务条款数据的复合词组,以及对预处理业务条款数据依次进行资源描述框架提取模板创建、描述抽取和复合词组的校验,得到目标结构化数据,来构建业务方案知识图谱,提高了业务方案知识图谱检索的效率和准确性。
上面对本发明实施例中业务条款数据的处理方法进行了描述,下面对本发明实施例中业务条款数据的处理装置进行描述,请参阅图3,本发明实施例中业务条款数据的处理装置一个实施例包括:
检索模块301,用于获取业务节点信息,通过业务节点信息,对预先创建的业务方案知识图谱进行检索,得到多个初始业务方案信息,多个初始业务方案信息均包括业务条款数据;
构建模块302,用于通过预置的遗传算法和多个初始业务方案信息,生成染色体初始种群个体,以及构建适应度函数,一个染色体初始种群个体对应一个初始业务方案信息;
计算模块303,用于通过适应度函数,计算染色体初始种群个体的适应度函数值;
处理模块304,用于基于适应度函数值,对染色体初始种群个体进行选择处理、交叉处理和变异处理,得到目标业务方案信息;
生成模块305,用于获取与目标业务方案信息对应的目标业务合同书数据,并根据目标业务合同书数据,生成目标业务方案信息的目标业务产品文件。
上述业务条款数据的处理装置中各个模块的功能实现与上述业务条款数据的处理方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明实施例中,通过预置的遗传算法和从业务方案知识图谱中所得的多个初始业务方案信息,生成染色体初始种群个体,以及构建适应度函数,通过采用业务方案知识图谱,解决了由于受时间、业务背景和业务方案等因素,人工收集和确定的定制信息会存在信息不全、不准确的问题,以及能够有效地自动生成多个初始业务方案信息,通过基于适应度函数值,对染色体初始种群个体进行选择处理、交叉处理和变异处理,根据目标业务合同书数据生成目标业务方案信息的目标业务产品文件,通过结合遗传算法,能够有效地选出多个初始业务方案信息中的最优业务方案信息,提高了目标业务方案信息的质量和匹配度,从而提高了生成的业务产品文件的准确性。
请参阅图4,本发明实施例中业务条款数据的处理装置的另一个实施例包括:
创建模块306,用于获取预处理业务条款数据,并创建预处理业务条款数据的复合词组;
校验模块307,用于对预处理业务条款数据依次进行资源描述框架提取模板创建、描述抽取和复合词组的校验,得到目标结构化数据;
融合模块308,用于基于目标结构化数据,对预处理业务条款数据进行知识抽取和融合,得到业务方案知识图谱;
检索模块301,用于获取业务节点信息,通过业务节点信息,对预先创建的业务方案知识图谱进行检索,得到多个初始业务方案信息,多个初始业务方案信息均包括业务条款数据;
构建模块302,用于通过预置的遗传算法和多个初始业务方案信息,生成染色体初始种群个体,以及构建适应度函数,一个染色体初始种群个体对应一个初始业务方案信息;
计算模块303,用于通过适应度函数,计算染色体初始种群个体的适应度函数值;
处理模块304,用于基于适应度函数值,对染色体初始种群个体进行选择处理、交叉处理和变异处理,得到目标业务方案信息;
生成模块305,用于获取与目标业务方案信息对应的目标业务合同书数据,并根据目标业务合同书数据,生成目标业务方案信息的目标业务产品文件。
可选的,处理模块304还可以具体用于:
判断适应度函数值是否满足预设遗传终止条件;
若适应度函数值满足预设遗传终止条件,则将对应的染色体初始种群个体确定为初始个体,从初始个体中获取目标业务方案信息;
若适应度函数值不满足预设遗传终止条件,则将对应的染色体初始种群个体进行稳定迭代的选择处理、交叉处理和变异处理,得到目标个体,直至目标个体的适应度函数值满足预设遗传终止条件,得到目标业务方案信息。
可选的,构建模块302还可以具体用于:
通过预置的遗传算法,随机生成各初始业务方案信息的染色体个体,得到染色体初始种群个体;
获取业务需求信息和基于业务节点信息的业务参数,通过预置的遗传算法、业务需求信息和业务参数,构建适应度函数,业务参数包括业务金额数据、业务期限数据、业务费用数据、初始业务方案信息中的业务数量和同种业务的数量,业务需求信息包括当遇到业务损失时的补偿金额数据。
可选的,生成模块305还可以具体用于:
从预先创建的业务合同版块数据库中,匹配与目标业务方案信息对应的多个业务合同版块数据;
按照预置的合成顺序,将多个业务合同版块数据进行拼接,得到目标业务合同书数据;
将目标业务方案信息与目标业务合同书数据,依次进行融合和合同书文件生成,得到目标业务产品文件。
可选的,创建模块306还可以具体用于:
获取初始业务条款数据,并对初始业务条款数据进行预处理,得到预处理业务条款数据,预处理业务条款数据包括文本分词;
通过文本分词和预置的业务词库,计算预处理业务条款数据中各词语的词语共现度和词语权重;
通过词语共现度和词语权重,提取预处理业务条款数据中的目标词,并对目标词进行组合得到复合词组。
可选的,校验模块307还可以具体用于:
对预处理业务条款数据依次进行聚类、关键名词组提取、同义属性去除和含义转换,得到资源描述框架提取模板;
通过资源描述框架提取模板,对预处理业务条款数据进行描述抽取,得到初始结构化数据;
通过复合词组对初始结构化数据进行校验,得到目标结构化数据。
上述业务条款数据的处理装置中各模块和各单元的功能实现与上述业务条款数据的处理方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明实施例中,不仅通过采用业务方案知识图谱,解决了由于受时间、业务背景和业务方案等因素,人工收集和确定的定制信息会存在信息不全、不准确的问题,以及能够有效地自动生成多个初始业务方案信息,通过结合遗传算法,能够有效地选出多个初始业务方案信息中的最优业务方案信息,提高了目标业务方案信息的质量和匹配度,从而提高了生成的业务产品文件的准确性,还通过创建预处理业务条款数据的复合词组,以及对预处理业务条款数据依次进行资源描述框架提取模板创建、描述抽取和复合词组的校验,得到目标结构化数据,来构建业务方案知识图谱,提高了业务方案知识图谱检索的效率和准确性。
上面图3和图4从模块化功能实体的角度对本发明实施例中的业务条款数据的处理装置进行详细描述,下面从硬件处理的角度对本发明实施例中业务条款数据的处理设备进行详细描述。
图5是本发明实施例提供的一种业务条款数据的处理设备的结构示意图,该业务条款数据的处理设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对业务条款数据的处理设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在业务条款数据的处理设备500上执行存储介质530中的一系列指令操作。
业务条款数据的处理设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的业务条款数据的处理设备结构并不构成对业务条款数据的处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行业务条款数据的处理方法的步骤。
进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种业务条款数据的处理方法,其特征在于,所述业务条款数据的处理方法包括:
获取业务节点信息,通过所述业务节点信息,对预先创建的业务方案知识图谱进行检索,得到多个初始业务方案信息,所述多个初始业务方案信息均包括业务条款数据;
通过预置的遗传算法和所述多个初始业务方案信息,生成染色体初始种群个体,以及构建适应度函数,一个染色体初始种群个体对应一个初始业务方案信息,其中,所述适应度函数如下:
Figure FDA0004195196300000011
fi表示适应度函数,Rm表示业务金额数据的权重,i表示第i份业务,n表示初始业务方案信息中的业务数量,Xi表示同种业务的数量,Mi表示业务金额数据,Rt表示业务期限数据的权重,Ti表示业务期限数据,Ri表示当遇到业务损失时的补偿金额数据的权重,I(x)表示当遇到业务损失时的补偿金额数据,Rmf表示业务费用数据的权重,Ni表示业务费用数据;
通过所述适应度函数,计算所述染色体初始种群个体的适应度函数值;
基于所述适应度函数值,对所述染色体初始种群个体进行选择处理、交叉处理和变异处理,得到目标业务方案信息;
其中,所述基于所述适应度函数值,对所述染色体初始种群个体进行选择处理、交叉处理和变异处理,得到目标业务方案信息,包括:
判断所述适应度函数值是否满足预设遗传终止条件;
若所述适应度函数值满足所述预设遗传终止条件,则将对应的染色体初始种群个体确定为初始个体,从所述初始个体中获取目标业务方案信息;
若所述适应度函数值不满足所述预设遗传终止条件,则将对应的染色体初始种群个体进行稳定迭代的选择处理、交叉处理和变异处理,得到目标个体,直至所述目标个体的适应度函数值满足所述预设遗传终止条件,得到目标业务方案信息;
获取与所述目标业务方案信息对应的目标业务合同书数据,并根据所述目标业务合同书数据,生成所述目标业务方案信息的目标业务产品文件。
2.根据权利要求1所述的业务条款数据的处理方法,其特征在于,所述通过预置的遗传算法和所述多个初始业务方案信息,生成染色体初始种群个体,以及构建适应度函数,包括:
通过预置的遗传算法,随机生成各初始业务方案信息的染色体个体,得到染色体初始种群个体;
获取业务需求信息和基于所述业务节点信息的业务参数,通过预置的遗传算法、所述业务需求信息和所述业务参数,构建适应度函数,所述业务参数包括业务金额数据、业务期限数据、业务费用数据、初始业务方案信息中的业务数量和同种业务的数量,所述业务需求信息包括当遇到业务损失时的补偿金额数据。
3.根据权利要求1所述的业务条款数据的处理方法,其特征在于,所述获取与所述目标业务方案信息对应的目标业务合同书数据,并根据所述目标业务合同书数据,生成所述目标业务方案信息的目标业务产品文件,包括:
从预先创建的业务合同版块数据库中,匹配与所述目标业务方案信息对应的多个业务合同版块数据;
按照预置的合成顺序,将所述多个业务合同版块数据进行拼接,得到目标业务合同书数据;
将所述目标业务方案信息与所述目标业务合同书数据,依次进行融合和合同书文件生成,得到目标业务产品文件。
4.根据权利要求1-3中任一项所述的业务条款数据的处理方法,其特征在于,所述获取业务节点信息,通过所述业务节点信息,对预先创建的业务方案知识图谱进行检索,得到多个初始业务方案信息之前,还包括:
获取预处理业务条款数据,并创建所述预处理业务条款数据的复合词组;
对所述预处理业务条款数据依次进行资源描述框架提取模板创建、描述抽取和所述复合词组的校验,得到目标结构化数据;
基于所述目标结构化数据,对所述预处理业务条款数据进行知识抽取和融合,得到业务方案知识图谱。
5.根据权利要求4所述的业务条款数据的处理方法,其特征在于,所述获取预处理业务条款数据,并创建所述预处理业务条款数据的复合词组,包括:
获取初始业务条款数据,并对所述初始业务条款数据进行预处理,得到预处理业务条款数据,所述预处理业务条款数据包括文本分词;
通过所述文本分词和预置的业务词库,计算所述预处理业务条款数据中各词语的词语共现度和词语权重;
通过所述词语共现度和所述词语权重,提取所述预处理业务条款数据中的目标词,并对所述目标词进行组合得到复合词组。
6.根据权利要求4所述的业务条款数据的处理方法,其特征在于,所述对所述预处理业务条款数据依次进行资源描述框架提取模板创建、描述抽取和所述复合词组的校验,得到目标结构化数据,包括:
对所述预处理业务条款数据依次进行聚类、关键名词组提取、同义属性去除和含义转换,得到资源描述框架提取模板;
通过所述资源描述框架提取模板,对所述预处理业务条款数据进行描述抽取,得到初始结构化数据;
通过所述复合词组对所述初始结构化数据进行校验,得到目标结构化数据。
7.一种业务条款数据的处理装置,其特征在于,所述业务条款数据的处理装置包括:
检索模块,用于获取业务节点信息,通过所述业务节点信息,对预先创建的业务方案知识图谱进行检索,得到多个初始业务方案信息,所述多个初始业务方案信息均包括业务条款数据;
构建模块,用于通过预置的遗传算法和所述多个初始业务方案信息,生成染色体初始种群个体,以及构建适应度函数,一个染色体初始种群个体对应一个初始业务方案信息,其中,所述适应度函数如下:
Figure FDA0004195196300000031
fi表示适应度函数,Rm表示业务金额数据的权重,i表示第i份业务,n表示初始业务方案信息中的业务数量,Xi表示同种业务的数量,Mi表示业务金额数据,Rt表示业务期限数据的权重,Ti表示业务期限数据,Ri表示当遇到业务损失时的补偿金额数据的权重,I(x)表示当遇到业务损失时的补偿金额数据,Rmf表示业务费用数据的权重,Ni表示业务费用数据;
计算模块,用于通过所述适应度函数,计算所述染色体初始种群个体的适应度函数值;
处理模块,用于基于所述适应度函数值,对所述染色体初始种群个体进行选择处理、交叉处理和变异处理,得到目标业务方案信息;
其中,所述基于所述适应度函数值,对所述染色体初始种群个体进行选择处理、交叉处理和变异处理,得到目标业务方案信息,包括:
判断所述适应度函数值是否满足预设遗传终止条件;
若所述适应度函数值满足所述预设遗传终止条件,则将对应的染色体初始种群个体确定为初始个体,从所述初始个体中获取目标业务方案信息;
若所述适应度函数值不满足所述预设遗传终止条件,则将对应的染色体初始种群个体进行稳定迭代的选择处理、交叉处理和变异处理,得到目标个体,直至所述目标个体的适应度函数值满足所述预设遗传终止条件,得到目标业务方案信息;
生成模块,用于获取与所述目标业务方案信息对应的目标业务合同书数据,并根据所述目标业务合同书数据,生成所述目标业务方案信息的目标业务产品文件。
8.一种业务条款数据的处理设备,其特征在于,所述业务条款数据的处理设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述业务条款数据的处理设备执行如权利要求1-6中任意一项所述的业务条款数据的处理方法。
9.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-6中任一项所述业务条款数据的处理方法。
CN202011506844.5A 2020-12-18 2020-12-18 业务条款数据的处理方法、装置、设备及存储介质 Active CN112632289B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011506844.5A CN112632289B (zh) 2020-12-18 2020-12-18 业务条款数据的处理方法、装置、设备及存储介质
PCT/CN2021/090161 WO2022126960A1 (zh) 2020-12-18 2021-04-27 业务条款数据的处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011506844.5A CN112632289B (zh) 2020-12-18 2020-12-18 业务条款数据的处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112632289A CN112632289A (zh) 2021-04-09
CN112632289B true CN112632289B (zh) 2023-06-20

Family

ID=75317289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011506844.5A Active CN112632289B (zh) 2020-12-18 2020-12-18 业务条款数据的处理方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN112632289B (zh)
WO (1) WO2022126960A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112632289B (zh) * 2020-12-18 2023-06-20 平安科技(深圳)有限公司 业务条款数据的处理方法、装置、设备及存储介质
CN115314181B (zh) * 2022-10-10 2023-01-24 广东电网有限责任公司江门供电局 一种电力线载波通信方法、系统、设备和介质
CN117609315B (zh) * 2024-01-22 2024-04-16 中债金融估值中心有限公司 一种数据处理方法、装置、设备及可读存储介质
CN117829577B (zh) * 2024-03-06 2024-05-14 江苏益捷思信息科技有限公司 一种业务运维平台的运行管理方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202952A (zh) * 2016-07-19 2016-12-07 南京邮电大学 一种基于机器学习的帕金森疾病诊断方法
CN111953547A (zh) * 2020-08-20 2020-11-17 全球能源互联网研究院有限公司 一种基于业务的异构基站重叠分组及资源配置方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170116522A1 (en) * 2015-10-05 2017-04-27 Telekom Malaysia Berhad Method For Task Scheduling And Resources Allocation And System Thereof
US10769161B2 (en) * 2015-11-03 2020-09-08 International Business Machines Corporation Generating business intelligence analytics data visualizations with genomically defined genetic selection
CN106709572B (zh) * 2015-11-16 2019-11-08 阿里巴巴集团控股有限公司 一种数据处理方法及设备
CN105530707A (zh) * 2015-12-21 2016-04-27 东南大学 一种异构融合场景中基于混合优化的资源分配方法
CN111241185B (zh) * 2020-04-26 2020-10-27 浙江网商银行股份有限公司 数据处理方法以及装置
CN112632289B (zh) * 2020-12-18 2023-06-20 平安科技(深圳)有限公司 业务条款数据的处理方法、装置、设备及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202952A (zh) * 2016-07-19 2016-12-07 南京邮电大学 一种基于机器学习的帕金森疾病诊断方法
CN111953547A (zh) * 2020-08-20 2020-11-17 全球能源互联网研究院有限公司 一种基于业务的异构基站重叠分组及资源配置方法及装置

Also Published As

Publication number Publication date
WO2022126960A1 (zh) 2022-06-23
CN112632289A (zh) 2021-04-09

Similar Documents

Publication Publication Date Title
CN112632289B (zh) 业务条款数据的处理方法、装置、设备及存储介质
WO2022134575A1 (zh) 业务关键词的提取方法、装置、设备及存储介质
Lucia Information retrieval models for recovering traceability links between code and documentation
CN101978348A (zh) 管理关于近似串匹配的档案
CN112732946A (zh) 一种医学文献的模块化数据分析和数据库建立方法
CN113761218A (zh) 一种实体链接的方法、装置、设备及存储介质
CN111986792A (zh) 医疗机构评分方法、装置、设备及存储介质
WO1997012334A1 (en) Matching and ranking legal citations
CN111695336A (zh) 疾病名称对码方法、装置、计算机设备及存储介质
CN112149387A (zh) 财务数据的可视化方法、装置、计算机设备及存储介质
CN111241410A (zh) 一种行业新闻推荐方法及终端
CN111475608B (zh) 一种基于功能语义关联计算的Mashup服务特征表示方法
CN111274494B (zh) 结合深度学习和协同过滤技术的复合标签推荐方法
CN111723192A (zh) 代码推荐方法和装置
CN114610838A (zh) 文本情感分析方法、装置、设备及存储介质
CN114998920B (zh) 基于nlp语义识别的供应链金融文件管理方法及系统
CN111045716B (zh) 一种基于异构数据的相关补丁推荐方法
CN114417010A (zh) 面向实时工作流的知识图谱构建方法、装置和存储介质
CN113571198A (zh) 转化率预测方法、装置、设备及存储介质
CN114328894A (zh) 文档处理方法、装置、电子设备及介质
CN112818215A (zh) 产品数据的处理方法、装置、设备及存储介质
KR20210117601A (ko) 불공정 약관 예측 방법 및 시스템
CN115146630B (zh) 基于专业领域知识的分词方法、装置、设备及存储介质
CN117852553B (zh) 基于聊天记录提取元器件交易场景信息的语言处理系统
CN117273015B (zh) 一种语义分析的电子文件归档分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant