CN111368073A - 系统间数据交互方法、装置、存储介质及电子设备 - Google Patents
系统间数据交互方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN111368073A CN111368073A CN202010078302.6A CN202010078302A CN111368073A CN 111368073 A CN111368073 A CN 111368073A CN 202010078302 A CN202010078302 A CN 202010078302A CN 111368073 A CN111368073 A CN 111368073A
- Authority
- CN
- China
- Prior art keywords
- contract
- field
- data
- target
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 230000003993 interaction Effects 0.000 title claims abstract description 45
- 230000015654 memory Effects 0.000 claims description 22
- 238000007621 cluster analysis Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000012937 correction Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013479 data entry Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
- G06Q50/167—Closing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services; Handling legal documents
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Technology Law (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种系统间数据交互方法、装置、存储介质及电子设备,涉及数据交互技术。具体方案包括:对合同系统中的合同版式样本进行聚类分析,确定合同版式数据;所述合同版式数据包括合同标识数据、合同字段数据、以及合同标识数据和合同字段数据之间的对应关系;获取合同系统中待转换的目标合同数据;根据所述合同标识数据,确定所述目标合同数据的目标合同标识数据;根据所述目标合同标识数据、所述合同字段数据、以及合同标识数据和合同字段数据之间的对应关系,确定所述目标合同数据的目标合同字段数据;将所述目标合同字段数据转换为信息系统中的信息数据。本申请可以顺利地将不同版式的目标合同数据转换为信息数据。
Description
技术领域
本申请涉及数据交互技术,特别是涉及一种系统间数据交互方法、装置、存储介质及电子设备。
背景技术
随着信息化技术的发展,越来越多的线下活动被搬到线上实现。在线上信息系统中,常将信息生成的不同阶段的功能实现为独立的系统,由于不同的系统之间的数据字段定义通常不同,需要在不同的系统间进行数据交互。
尤其是对合同系统来说,由于合同的特殊属性,相同的活动在不同地域和时间使用的合同版式不同,合同中包含的字段也不同。因此,当需要将合同系统中的目标合同数据转换为信息系统中的信息数据时,难以顺利的将目标合同数据转换为信息数据。
发明内容
有鉴于此,本申请的主要目的在于提供一种系统间数据交互方法,该方法可以顺利地将不同版式的目标合同数据转换为信息数据。
为了达到上述目的,本申请提出的技术方案为:
第一方面,本申请实施例提供了一种系统间数据交互方法,包括以下步骤:
对合同系统中的合同版式样本进行聚类分析,确定合同版式数据;所述合同版式数据包括合同标识数据、合同字段数据、以及合同标识数据和合同字段数据之间的对应关系;
获取合同系统中待转换的目标合同数据;
根据所述合同标识数据,确定所述目标合同数据的目标合同标识数据;
根据所述目标合同标识数据、所述合同字段数据、以及合同标识数据和合同字段数据之间的对应关系,确定所述目标合同数据的目标合同字段数据;
将所述目标合同字段数据转换为交易系统中的信息数据。
一种可能的实施方式中,所述对合同系统中的合同版式样本进行聚类分析,确定合同版式数据的步骤,包括:
获取标记了样本字段数据的所述合同版式样本;
根据所述样本字段数据确定所述合同版式样本所属的字段类别、定义类别和枚举类别;
根据所述字段类别、所述定义类别和所述枚举类别确定所述合同字段数据和所述合同标识数据;
确定所述合同字段数据和所述合同标识数据之间的对应关系。
一种可能的实施方式中,所述根据所述样本字段数据确定所述合同版式样本所属的字段类别、定义类别和枚举类别的步骤,包括:
根据所述样本字段数据中包含的字段,确定合同版式样本的字段类别;
针对每个所述字段类别,根据所述字段类别对应字段的字段定义,将所述字段定义相同的合同版式样本确定为一个定义类别;
针对每个所述定义类别,将字段枚举值相同的合同版式样本确定为一个枚举类别。
一种可能的实施方式中,根据所述字段类别、所述定义类别和所述枚举类别确定所述合同字段数据的步骤,包括:
根据所述合同版式样本的字段类别,确定所述合同字段数据包括的所述合同版式样本包含的字段;
根据所述合同版式样本的定义类别,确定所述合同字段数据包括的合同版式样本中包含字段的字段定义;
根据所述合同版式样本的枚举类别,确定所述合同字段数据包括的合同版式样本中包含字段的字段枚举值。
一种可能的实施方式中,根据所述字段类别、所述定义类别和所述枚举类别确定所述合同标识数据的步骤,包括:
将包含每个合同版式样本的所述字段类别对应的字段确定为目标字段;
将对应的字段类别中仅包含一个所述定义类别和一个所述枚举类别的所述目标字段确定为合同标识数据。
一种可能的实施方式中,所述确定所述合同字段数据和所述合同标识数据之间的对应关系的步骤,包括:
确定所述合同标识数据的字段内容与所述合同版式样本所属的字段类别、定义类别及枚举类别之间的对应关系。
一种可能的实施方式中,所述根据所述合同标识数据,确定所述目标合同数据的目标合同标识数据的步骤,包括:
根据所述合同标识数据,将所述目标合同数据中所述合同标识数据对应字段的字段内容,确定为所述目标合同标识数据;
所述根据所述目标合同标识数据、所述合同字段数据、以及合同标识数据和合同字段数据之间的对应关系,确定所述目标合同数据的目标合同字段数据的步骤,包括:
根据所述目标合同标识数据、以及合同标识数据和合同字段数据之间的对应关系,将所述目标合同标识数据对应的合同字段数据的字段内容,确定为所述目标合同数据的目标合同字段数据。
第二方面,本申请实施例提供了一种系统间数据交互装置,包括:
样本聚类模块,用于对合同系统中的合同版式样本进行聚类分析,确定合同版式数据;所述合同版式数据包括合同标识数据、合同字段数据、以及合同标识数据和合同字段数据之间的对应关系;
获取模块,用于获取合同系统中待转换的目标合同数据;
标识确定模块,用于根据所述合同标识数据,确定所述目标合同数据的目标合同标识数据;
字段确定模块,用于根据所述目标合同标识数据、所述合同字段数据、以及合同标识数据和合同字段数据之间的对应关系,确定所述目标合同数据的目标合同字段数据;
数据交互模块,用于将所述目标合同字段数据转换为信息系统中的信息数据。
一种可能的实施方式中,样本聚类模块,包括:
样本获取单元,用于获取标记了样本字段数据的所述合同版式样本;
类别确定单元,用于根据所述样本字段数据确定所述合同版式样本所属的字段类别、定义类别和枚举类别;
合同字段确定单元,用于根据所述字段类别、所述定义类别和所述枚举类别确定所述合同字段数据;
样本标识确定单元,用于根据所述字段类别、所述定义类别和所述枚举类别确定所述合同标识数据;
样本关系确定单元,用于确定所述合同字段数据和所述合同标识数据之间的对应关系。
一种可能的实施方式中,包括,类别确定单元,用于:
根据所述样本字段数据中包含的字段,确定合同版式样本的字段类别;
针对每个所述字段类别,根据所述字段类别对应字段的字段定义,将所述字段定义相同的合同版式样本确定为一个定义类别;
针对每个所述定义类别,将字段枚举值相同的合同版式样本确定为一个枚举类别。
一种可能的实施方式中,合同字段确定单元,用于:
根据所述合同版式样本的字段类别,确定所述合同字段数据包括的所述合同版式样本包含的字段;
根据所述合同版式样本的定义类别,确定所述合同字段数据包括的合同版式样本中包含字段的字段定义;
根据所述合同版式样本的枚举类别,确定所述合同字段数据包括的合同版式样本中包含字段的字段枚举值。
一种可能的实施方式中,样本标识确定单元,用于:
将包含每个合同版式样本的所述字段类别对应的字段确定为目标字段;
将对应的字段类别中仅包含一个所述定义类别和一个所述枚举类别的所述目标字段确定为合同标识数据。
一种可能的实施方式中,样本关系确定单元,用于:
确定所述合同标识数据的字段内容与所述合同版式样本所属的字段类别、定义类别及枚举类别之间的对应关系。
一种可能的实施方式中,标识确定模块,用于:
根据所述合同标识数据,将所述目标合同数据中所述合同标识数据对应字段的字段内容,确定为所述目标合同标识数据;
字段确定模块,用于:
根据所述目标合同标识数据、以及合同标识数据和合同字段数据之间的对应关系,将所述目标合同标识数据对应的合同字段数据的字段内容,确定为所述目标合同数据的目标合同字段数据。
第三方面,本申请实施例还提供一种计算机可读存储介质。具体方案为:
一种计算机可读存储介质,存储有计算机指令,所述指令被处理器执行时可实现上述第一方面及第一方面中任一种可能的实施方式的步骤。
第四方面,本申请实施例还提供一种电子设备。具体方案为:
一种电子设备,该电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述第一方面及第一方面中任一种可能的实施方式的步骤。
综上所述,本申请提出的一种系统间数据交互方法、装置、存储介质及电子设备。本申请首先对合同系统中的合同版式样本进行聚类分析,通过聚类分析确定包括合同标识数据、合同字段数据、以及合同标识数据和合同字段数据之间的对应关系的合同版式数据,采用聚类的方法对合同系统中不同的合同版式样本进行分析,确定得到合同版式数据。当获取合同系统中待转换的目标合同数据时,即可利用确定得到的合同版式数据,根据待转换的目标合同数据确定目标合同字段数据。根据聚类分析得到的合同版式数据,对目标合同数据的版式进行了解析,得到代表合同内容的目标合同字段数据,将目标合同字段数据转换为信息系统中的信息数据,可以顺利地将不同版式的目标合同数据转换为信息数据。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种系统间数据交互方法的流程示意图;
图2为本申请实施例提供的另一种系统间数据交互方法的流程示意图;
图3为系统间数据交互方法中聚类过程的示意图;
图4为本申请实施例提供的一种系统间数据交互装置的结构示意图;
图5为系统间数据交互装置中样本聚类模块的结构示意图;
图6为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语″第一″、″第二″、″第三″、″第四″等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例,例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语″包括″和″具有″以及他们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其他步骤或单元。
随着信息化技术的发展,交易的线上化程度越来越高。在线上交易系统中,常将交易不同阶段的功能实现为独立的系统,由于不同的系统之间的数据字段定义通常不同,需要在不同的系统间进行数据交互。
例如,线上交易系统中通常包括负责记录合同数据的合同系统;以及负责在交易合同签约后,完成交易流程管控的信息系统。因此,合同系统和信息系统间,需要进行数据交互,以便信息系统可以直接获取合同数据,从而获得交易物信息、买卖双方的信息等信息数据,完成交易流程的管控。
但是,不同交易类型的合同版式不同,由于各地政策不同,同一交易类型各地合同的合同版式是不一致的,甚至同一城市也具有不同的合同版式,且不同的合同版式间合同数据是不一样的。因此,当将合同系统中的合同数据传递到信息系统时,难以顺利地将目标合同数据转换为信息数据。同时,由于合同的特殊属性,任何一点细微的改动,例如改动一个标点符号,都需要重新生成一个具有法律效力的合同版式,因此,合同版式的改动很频繁,基本一个城市平均每2天一个合同版式。合同版式的频繁改动,进一步给合同数据由合同系统传递到信息系统的过程带来极大的困难。
具体例如,对房产交易来说,深圳市的房产交易合同版式第1676版中,对买方婚姻这一字段的定义为:使用买方婚姻状况作为字段定义表示描述买方的婚姻情况的字段,买方婚姻字段的枚举值为1表示已婚,2表示未婚,3表示离异,4表示丧偶;而深圳市的房产交易合同版式第1928版中,对买方婚姻这一字段的定义为:使用买方婚姻情况作为字段定义表示描述买方的婚姻情况的字段,且买方婚姻字段的枚举值为2表示已婚,1表示未婚,4表示离异,3表示丧偶;同时,青岛市的房产交易合同版式第8902版中,对买方婚姻这一字段的定义为:使用买方婚姻现状作为字段定义表示描述买方的婚姻情况的字段,且买方婚姻字段的枚举值为0表示已婚,1表示未婚,2表示离异,3表示丧偶。不同城市的合同版式、甚至同一城市不同版本的合同版式中,对同一个字段的字段定义和枚举值均不同。但是在线上交易系统中,为了便于信息系统管控交易流程,需要根据合同数据对信息数据进行录入,具体例如需要在买方婚姻状况为已婚时,填写买方配偶信息来完成交易流程。为了便于对交易流程的管控,需要使用同一个信息系统管控全国的房产交易,因此,在信息系统中同一采用一个固定的字段描述买方的婚姻情况,且描述买方的婚姻情况的字段的枚举值必须是固定的,如1表示已婚,2表示未婚,3表示离异,4表示丧偶。
有鉴于此,本申请的核心发明点在于:首先对合同系统中的合同版式样本进行聚类分析,通过聚类分析确定包括合同标识数据、合同字段数据、以及合同标识数据和合同字段数据之间的对应关系的合同版式数据,采用聚类的方法对合同系统中不同的合同版式样本进行分析,确定得到合同版式数据。当获取合同系统中待转换的目标合同数据时,即可利用确定得到的合同版式数据,根据待转换的目标合同数据确定目标合同字段数据。根据聚类分析得到的合同版式数据,对目标合同数据的版式进行了解析,得到代表合同内容的目标合同字段数据,将目标合同字段数据转换为信息系统中的信息数据,可以顺利地将不同版式的目标合同数据转换为信息数据。
为使本申请的目的、技术方案和优点更加清楚,下面以具体实施例对本发明的技术方案进行详细说明。下面几个具体实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
实施例一
图1为本申请实施例提供的系统间数据交互方法的流程示意图,如图1所示,该实施例主要包括:
S101:对合同系统中的合同版式样本进行聚类分析,确定合同版式数据;所述合同版式数据包括合同标识数据、合同字段数据、以及合同标识数据和合同字段数据之间的对应关系。
虽然合同版式多种多样,但是,由于合同的存在目的是为了明证交易双方对交易的约定,合同中包含的合同数据是有规律可循的,不同合同版式之间合同数据包含的字段和字段内容不会有很大的不同,仅是字段定义和字段枚举值会有所不同。因此,本申请实施例获取合同系统中的合同版式样本,并对合同版式样本进行聚类分析,得出不同合同版式的合同版式数据。合同版式数据用于描述不同合同版式对合同数据的定义和记录方式,根据合同版式数据可以确定不同合同版式的合同的字段定义和字段枚举值。
为了描述合同版式,合同版式数据包括合同标识数据、合同字段数据、以及合同标识数据和合同字段数据之间的对应关系。其中,合同标识数据用于标识不同的合同版式;合同字段数据用于描述合同版式,具体的,合同字段数据通过描述合同中包含的每个字段、合同中每个字段的字段定义、以及字段枚举值来描述合同版式。在实际实施时,合同标识数据通常可以采用数字、字母等任一种常用的标识数据作为合同标识数据,也可以采用合同版式中起到标识作用的字段的字段定义作为合同标识数据。合同标识数据和合同字段数据之间的对应关系,用于以合同标识数据为索引,对合同字段数据进行检索。
S102:获取合同系统中待转换的目标合同数据。
应用合同版式数据将合同系统中的合同数据转换为信息系统中的信息数据时,首先需要获取合同系统中待转换的目标合同数据。
S103:根据所述合同标识数据,确定所述目标合同数据的目标合同标识数据。
获取合同系统中待转换的目标合同数据之后,首先确定目标合同数据的目标合同标识数据。
当合同标识数据为数字、字母等任一种常用的标识数据时,可以根据合同标识数据的数字格式或字母格式,确定目标合同数据的目标合同标识数据。此时,目标合同标识数据为标识目标合同数据应适用的合同版式的具体数字标识或字母标识。
当合同标识数据为合同版式中起到标识作用的字段时,根据合同标识数据的字段定义,从目标合同数据中确定目标合同标识数据。此时,目标合同标识数据为标识目标合同数据应适用的合同版式的字段的具体字段内容。
S104:根据所述目标合同标识数据、所述合同字段数据、以及合同标识数据和合同字段数据之间的对应关系,确定所述目标合同数据的目标合同字段数据。
确定目标合同标识数据后,根据合同标识数据和合同字段数据之间的对应关系,可以根据目标合同标识数据确定目标合同数据对应的合同字段数据,也就是根据目标合同标识数据、以及合同标识数据和合同字段数据之间的对应关系,确定目标合同数据对应的合同版式,也就是确定目标合同数据中每个字段的字段定义和字段枚举值。再根据目标合同数据中每个字段的字段定义和字段枚举值,确定目标合同数据的目标合同字段数据。这里,目标合同字段数据为目标合同数据中每个字段的具体字段内容。
S105:将所述目标合同字段数据转换为信息系统中的信息数据。
确定得到的目标合同字段数据后,也就确定了目标合同数据中每个字段的具体字段内容,根据目标合同字段数据,可以顺利地合同数据转换为信息系统中的信息数据。
本申请实施例采用聚类的方法对合同系统中不同的合同版式样本进行分析,确定得到合同版式数据。当获取合同系统中待转换的目标合同数据时,即可利用确定得到的合同版式数据,将目标合同字段数据转换为信息系统中的信息数据,可以顺利地将不同版式的目标合同数据转换为信息数据。
实施例二
为了更为详尽、准确地将介绍系统间数据交互方法,如图2所示,本申请实施例提供的系统间数据交互方法包括:
S201:获取标记了样本字段数据的所述合同版式样本。
在合同系统中,通常采用合同版式规定合同采用的格式、包括的条款,为了方便对数据转换过程的描述,本申请实施例将合同中的一个条款称为合同数据中一个的字段。因此,本申请实施例获取合同系统中包含各种合同版式内容的合同版式样本,根据合同版式样本确定合同版式数据。
为了能够更好地学习到合同版式数据,本申请实施例采用有监督的方式,获取标记了样本字段数据的合同版式样本。这里,样本字段数据为合同版式样本中标记的字段。示例性的,将本申请实施例的方法应用于房产交易领域时,可以获取合同系统中的合同版式样本,并且将合同版式样本中的买方的姓名、身份证号、婚姻状况,卖方的姓名、身份证号、婚姻状况,房产的属性、价格等字段作为样本字段数据标注在合同版式样本中。
S202:根据所述样本字段数据确定所述合同版式样本所属的字段类别、定义类别和枚举类别。
示例性的,可以采用下述步骤1至步骤3确定合同版式样本所属的字段类别、定义类别和枚举类别:
步骤1、根据所述样本字段数据中包含的字段,确定合同版式样本的字段类别。
合同版式样本中的每一个字段被分别划分为一个字段类别,例如,将本申请实施例的方法应用于房产交易领域时,合同版式样本中的买方婚姻字段被划分为一个字段类别。属于每个所述字段类别的合同版式样本为包含所述字段类别对应字段的合同版式样本,例如,将本申请实施例的方法应用于房产交易领域时,当买方婚姻字段被划分为一个字段类别时,属于该字段类别的合同版式样本中均包含了买方婚姻字段。
一个合同通常由两个以上的合同条款组成,因此,合同版式样本中包含的字段通常为两个以上,进一步的,合同版式样本属于包含的字段对应的每个字段类别,也就是,合同版式样本可以属于两个以上的字段类别。如图3所示,可以将包含同一个字段的合同版式样本划分为一个字段类别。
步骤2、针对每个所述字段类别,根据所述字段类别对应字段的字段定义,将所述字段定义相同的合同版式样本确定为一个定义类别。
合同数据中字段的字段定义为对合同数据中字段的名称的描述,由于合同系统中使用的合同版式不同、建立合同版式的数据录入时间和人员不同等因素,在合同系统中,常会出现采用不同的字段定义描述同一个字段的情况。
如上述示例中,在深圳市的房产交易合同版式第1676版中,使用″买方婚姻状况″作为字段定义表示描述买方的婚姻情况的字段的名称;在深圳市的房产交易合同版式第1928版中,使用″买方婚姻情况″作为字段定义表示描述买方的婚姻情况的字段的名称;在青岛市的房产交易合同版式第8902版中,使用″买方婚姻现状″作为字段定义表示描述买方的婚姻情况的字段的名称。在合同系统中,也可能使用英语″marriage″或者拼音″hunyin″等字符作为字段定义表示描述买方的婚姻情况的字段的名称。
对于每个字段类别,根据该字段类别对应字段的字段定义,将字段定义相同的合同版式样本确定为一个定义类别。
如上述示例中,将本申请实施例的方法应用于房产交易领域时,对于买方婚姻字段,根据字段定义确定合同版式样本的定义类别。例如,将买方婚姻字段的字段定义为″买方婚姻状况″的合同版式样本划分为一个定义类别;将买方婚姻字段的字段定义为″marriage″的合同版式样本划分为一个定义类别,以此类推。如图3所示,可以将包含同一字段的定义相同的合同版式样本划分为一个定义类别。
步骤3、针对每个所述定义类别,将字段枚举值相同的合同版式样本确定为一个枚举类别。
合同数据中字段的字段枚举值为对合同数据中字段的具体内容描述方式的定义,由于合同系统中使用的合同版式不同、建立合同版式的数据录入时间和人员不同等因素,在合同系统中,常会出现采用不同的字段枚举值描述同一个字段的字段内容情况。
如上述示例中,在深圳市的房产交易合同版式第1676版中,买方婚姻字段的枚举值为″1表示已婚,2表示未婚,3表示离异,4表示丧偶″;在深圳市的房产交易合同版式第1928版中,买方婚姻字段的枚举值为″2表示已婚,1表示未婚,4表示离异,3表示丧偶″;在青岛市的房产交易合同版式第8902版中,买方婚姻字段的枚举值为″0表示已婚,1表示未婚,2表示离异,3表示丧偶″。
本申请实施例将使用相同字段枚举值的合同版式样本确定为一个枚举类别。如上述示例中,将本申请实施例的方法应用于房产交易领域时,将″1表示已婚,2表示未婚,3表示离异,4表示丧偶″的合同版式样本确定为一个枚举类别;将″2表示已婚,1表示未婚,4表示离异,3表示丧偶″的合同版式样本确定为一个枚举类别;将″0表示已婚,1表示未婚,2表示离异,3表示丧偶″的合同版式样本确定为一个枚举类别。
S203:根据所述字段类别、所述定义类别和所述枚举类别确定所述合同字段数据。
确定了合同版式样本所属的字段类别、定义类别和枚举类别,实际就是确定了合同版式样本的合同字段数据。合同字段数据用于描述合同版式,具体的,合同字段数据通过描述合同中包含的每个字段、合同中每个字段的字段定义、以及字段枚举值来描述合同版式。根据所述字段类别、所述定义类别和所述枚举类别可以确定合同字段数据。示例性的,根据所述合同版式样本的字段类别,确定所述合同字段数据包括的所述合同版式样本包含的字段;根据所述合同版式样本的定义类别,确定所述合同字段数据包括的合同版式样本中包含字段的字段定义;根据所述合同版式样本的枚举类别,确定所述合同字段数据包括的合同版式样本中包含字段的字段枚举值。
如上述示例中,将本申请实施例的方法应用于房产交易领域时,当合同版式样本属于包含买方婚姻字段的字段类别时,可以确定合同版式样本中包括买方婚姻字段;当合同版式样本属于买方婚姻状况的定义类别时,可以确定合同版式样本中买方婚姻字段的字段定义为买方婚姻状况;当合同版式样本属于″1表示已婚,2表示未婚,3表示离异,4表示丧偶″的枚举类别时,可以确定合同版式样本中买方婚姻字段的字段枚举值为″1表示已婚,2表示未婚,3表示离异,4表示丧偶″。综上,该合同版式样本的合同字段数据包括:合同版式样本包括买方婚姻字段,合同版式样本中的买方婚姻字段的字段定义为″买方婚姻状况″,合同版式样本中的买方婚姻字段的字段枚举值为″1表示已婚,2表示未婚,3表示离异,4表示丧偶″。对其他的合同条款也采用相同的方式确定合同版式所属的字段类别、定义类别和枚举类别,并根据字段类别、定义类别和枚举类别确定合同字段数据。如图3所示,可以将包含同一字段的字段枚举值相同的合同版式样本划分为一个枚举值类别。当存在两个合同版式样本所属的字段类别、定义类别及枚举类别均相同时,上述两个合同版式样本的格式完全相同。
在一种可能的实施方式中,根据所述样本字段数据确定所述合同版式样本所属的字段类别、定义类别和枚举类别的过程,可以采用聚类模型实现,上述聚类模型通过学习合同版式样本中每个字段的特征值进行训练,得到字段类别、定义类别和枚举类别。
可以以下述方式将训练得到的字段类别、定义类别和枚举类别进行存储:
字段类别1:{
定义类别1:字段类别1的某种字段定义,
枚举类别1:{
字段类别1的枚举值1:字段类别1的字段内容1,
字段类别1的枚举值2:字段类别1的字段内容2
}
},
字段类别2:{
定义类别2:字段类别2的某种字段定义,
枚举类别2:{
}
}
示例性的,将本申请实施例的方法应用于房产交易领域时,训练得到的字段类别、定义类别和枚举类别如下:
婚姻类别:{
定义类别1:婚姻状况,
枚举类别1:{
包含未:未婚,
包含已:已婚,
包含离:离异,
包含丧:丧偶
}
枚举类别2:{
包含1:未婚,
包含2:已婚,
包含3:离异,
包含4:丧偶
}
},
身份类别:{
定义类别1:身份证号,
枚举类别1:{
}
}
这里,身份证号这样的字段在合同版式中不会包含字段枚举值,因此,身份证号字段对应的枚举类别为空。
S204:根据所述字段类别、所述定义类别和所述枚举类别确定所述合同标识数据。
合同标识数据用于标识不同的合同版式,可以采用数字、字母等任一种常用的标识数据作为合同标识数据,也可以采用合同版式中起到标识作用的字段的字段定义作为合同标识数据。优选的,本申请实施例采用合同版式中起到标识作用的字段的字段定义作为合同标识数据。这样,更有利于灵活地适应各种不同的合同版式,无需认为介入规定合同标识数据,更有利于系统间数据交互过程的自动化。
当采用合同版式中字段的字段定义作为合同标识数据时,将包含每个合同版式样本的所述字段类别对应的字段确定为目标字段;将对应的字段类别中仅包含一个所述定义类别和一个所述枚举类别的所述目标字段确定为合同标识数据。
当字段类别包含从合同系统中获取的每个合同版式样本时,证明合同系统中获取的每个合同版式样本均包含该字段类型对应的字段,只有当合同系统中获取的每个合同版式样本均包含该字段类型对应的字段时,该字段类型对应的字段才有可能被确定为合同标识数据,否则就有可能出现存在不包含合同标识数据的合同版式样本的情况,合同标识数据就无法当作标识、索引使用。因此,首先将包含每个合同版式样本的字段类别对应的字段确定为目标字段。示例性的,将本申请实施例的方法应用于房产交易领域时,假设经过聚类分析发现,从合同系统获取的每个合同版式样本中,均包含公司名称、交易类型、合同版式版本号、交易金额、交易双方名称等。
针对每个目标字段,当该目标字段对应的字段类别中仅包含一个定义类别和一个枚举类别时,证明在从合同系统获取的每个合同版式样本中,该目标字段的字段定义和字段枚举值均相同。只有从合同系统获取的每个合同版式样本中该目标字段的字段定义和字段枚举值均相同,该目标字段才能起到标识作用。否则,若该目标字段的字段定义和字段枚举值不相同,需要在目标合同字段数据时确定目标合同数据中该目标字段的字段定义和字段枚举值,此时,该目标字段无法起到标识作用。
示例性的,将本申请实施例的方法应用于房产交易领域时,假设经过聚类分析发现,从合同系统获取的每个合同版式样本中,公司名称、交易类型、合同版式版本号的字段定义和字段枚举值均相同,可以将公司名称、交易类型和合同版式版本号中的至少一项确定为合同标识数据。具体实施过程中,可以将公司名称、交易类型或合同版式版本号中的一项确定为合同标识数据;还可以将公司名称和交易类型、公司名称和合同版式版本号、或者交易类型和合同版式版本号进行组合或拼接后确定为合同标识数据;还可以将公司名称、交易类型和合同版式版本号进行组合或拼接后确定为合同标识数据。
在实际实施时,合同产生的公司名称和交易类型不同,合同版式往往不同,同一公司名称和交易类型使用的合同版本号不同,合同版式往往不同;当公司名称、交易类型和合同版本号相同时,合同版式往往相同。并且合同中通常均包括公司名称、交易类型和合同版本号,公司名称、交易类型和合同版本号的字段定义和字段枚举值也通常相同。因此,在实际实施时,通常将公司名称、交易类型和合同版式版本号中的至少一项确定为合同标识数据。
S205:确定所述合同字段数据和所述合同标识数据之间的对应关系。
优选的,确定所述合同标识数据的字段内容与所述合同版式样本所属的字段类别、定义类别及枚举类别之间的对应关系。
示例性的,将本申请实施例的方法应用于房产交易领域时,假设将公司名称确定为合同标识数据时,确定公司名称字段的字段内容,建立公司名称字段的字段内容与合同版式样本所属的字段类别、定义类别及枚举类别之间的对应关系;假设将公司名称、交易类型和合同版式版本号进行组合或拼接后确定为合同标识数据时,确定公司名称、交易类型和合同版式版本号这三个字段的字段内容拼接后得到的字符,建立拼接后得到的字符与合同版式样本所属的字段类别、定义类别及枚举类别之间的对应关系;其他情况依此类推。
下面以将公司名称、交易类型和合同版式版本号进行组合或拼接后确定为合同标识数据为例,介绍确定所述合同标识数据的字段内容与所述合同版式样本所属的字段类别、定义类别及枚举类别之间的对应关系的过程。对于每个合同版式样本,确定该合同版式样本的三个目标字段:公司名称、交易类型和合同版式版本号的字段内容。假设示例合同版式样本的三个目标字段的字段内容分别为:公司名称的字段内容为A公司、交易类型的字段内容为商品房交易、以及合同版式版本号的字段内容为第XXXX版,将三个目标字段的字段内容进行拼接得到A公司商品房交易第XXXX版。该示例合同版式样本所属的字段类别、定义类别及枚举类别包括:买方姓名字段的字段类别、″买方姓名情况″的定义类别;卖方姓名字段的字段类别、″卖方姓名情况″的定义类别;买方性别字段的字段类别、″买方性别情况″的定义类别、″1表示男,2表示女″的枚举类别;卖方性别字段的字段类别、″卖方性别情况″的定义类别、″1表示男,2表示女″的枚举类别;买方婚姻字段的字段类别、″买方婚姻情况″的定义类别和″1表示已婚,2表示未婚,3表示离异,4表示丧偶″的枚举类别;卖方婚姻字段的字段类别、″卖方婚姻情况″的定义类别和″1表示已婚,2表示未婚,3表示离异,4表示丧偶″的枚举类别等等合同字段数据。将该示例合同版式样本的目标字段的字段内容与该示例合同版式样本所属的字段类别、定义类别及枚举类别相对应,即可得到合同标识数据的字段内容与所述合同版式样本所属的字段类别、定义类别及枚举类别之间的对应关系,也就是说,该示例合同版式样本的A公司商品房交易第XXXX版的合同标识数据,与上述买方姓名字段的字段类别、″买方姓名情况″的定义类别;买方性别字段的字段类别、″买方性别情况″的定义类别、″1表示男,2表示女″;买方婚姻字段的字段类别、″买方婚姻情况″的定义类别、″2表示已婚,1表示未婚,4表示离异,3表示丧偶″的枚举类别等等合同字段数据相对应。
S206:获取合同系统中待转换的目标合同数据。
确定了包括合同标识数据、合同字段数据、以及合同标识数据和合同字段数据之间的对应关系的合同版式数据之后,即可使用合同版式数据进行数据转换。首先从合同系统中获取待转换的目标合同数据,目标合同数据包含了需要进行数据交互的目标合同的所有条款,目标合同数据中的每个字段分别为需要进行数据交互的目标合同的一个条款。
S207:根据所述合同标识数据,确定所述目标合同数据的目标合同标识数据。
根据所述合同标识数据,将所述目标合同数据中所述合同标识数据对应字段的字段内容,确定为所述目标合同标识数据。
示例性的,将本申请实施例的方法应用于房产交易领域时,假设将公司名称确定为合同标识数据时,确定目标合同数据中公司名称字段的字段内容,将目标合同数据中公司名称字段的字段内容确定为目标合同标识数据;假设将公司名称、交易类型和合同版式版本号进行组合或拼接后确定为合同标识数据时,确定目标合同数据中公司名称、交易类型和合同版式版本号这三个字段的字段内容拼接后得到的字符,确定为目标合同标识数据。假设目标合同数据中公司名称的字段内容为A公司、交易类型的字段内容为商品房交易、以及合同版式版本号的字段内容为第XXXX版时,目标合同标识数据为A公司商品房交易第XXXX版。
在一种可能的实施方式中,还可以直接获取目标合同标识数据,例如获取人工录入的目标合同标识数据,直接获取的目标合同标识数据可以为字母或数字等字符组成的目标合同标识数据,也可以为公司名称、交易类型和合同版式版本号这三个字段的字段内容拼接后得到的字符。
在一种可能的实施方式中,还可以通过获取标识数据的方式缩小合同字段数据的范围,增加数据转换的效率。例如,将本申请实施例的方法应用于房产交易领域时,可以通过获取合同签署的城市、或者获取合同版式版本号的方式,缩小合同字段数据的范围。此时,可以将公司名称字段和交易类型字段的字段内容确定为合同标识数据。
S208:根据所述目标合同标识数据、所述合同字段数据、以及合同标识数据和合同字段数据之间的对应关系,确定所述目标合同数据的目标合同字段数据。
具体的,根据所述目标合同标识数据、以及合同标识数据和合同字段数据之间的对应关系,将所述目标合同标识数据对应的合同字段数据的字段内容,确定为所述目标合同数据的目标合同字段数据。
示例性的,将本申请实施例的方法应用于房产交易领域时,根据目标合同标识数据″A公司商品房交易第XXXX版″、以及合同标识数据和合同字段数据之间的对应关系,可以根据目标合同标识数据确定目标合同数据对应的合同字段数据,根据上述步骤S204的示例中假设的对应关系,可以根据目标合同标识数据″A公司商品房交易第XXXX版″,确定目标合同数据对应的合同字段数据包括:买方姓名字段的字段类别、″买方姓名情况″的定义类别;买方性别字段的字段类别、″买方性别情况″的定义类别、″1表示男,2表示女″的枚举类别;买方婚姻字段的字段类别、″买方婚姻情况″的定义类别、″2表示已婚,1表示未婚,4表示离异,3表示丧偶″的枚举类别等等合同字段数据。进一步的,确定目标合同数据对应的合同字段数据中每个字段的字段内容,示例性的,基于上述假设,可以根据目标合同数据确定出买方姓名字段的字段内容为:″XXX″、买方性别字段的字段内容为:″1男″、买方婚姻字段的字段内容为:″1未婚″等等合同字段数据中包括每个字段的字段内容。最后,将目标合同标识数据对应的合同字段数据的字段内容,确定为目标合同数据的目标合同字段数据。示例性的,基于上述假设,目标合同字段数据包括:买方姓名字段的字段内容为:″XXX″、买方性别字段的字段内容为:″1男″、买方婚姻字段的字段内容为:″1未婚″等等。
在进行目标合同字段数据的确定过程中,还可以对确定情况信息进行记录,以便于利用确定过程产生的历史数据对本申请实施例提供的方法的实施过程进行改进。
例如,当目标合同数据中的字段,可以与确定所属的字段类别、定义类别及枚举类别相匹配时,可以给目标合同数据的该字段标记上匹配标识,后续可以通过人工核实等方法对标记有匹配标识的字段进行核实,确保数据转换的准确性。
当目标合同数据中存在字段定义与所属定义类别不同的字段、或者目标合同数据中存在字段枚举值与所属枚举类别不同的字段时,可以给目标合同数据的该字段标记上纠正标识,后续可以通过人工纠正等方式对标记有纠正标识的字段进行纠正,将标记有纠正标识的字段的字段定义补充到字段类别、或者标记有纠正标识的字段的字段枚举值补充到枚举类别。
当目标合同数据中存在不属于任一字段类别的字段时,可以给目标合同数据的该字段标记上补充标识,后续可以通过人工补充等方式对标记有补充标识的字段进行补充,将补充标识的字段加入字段类别,并将其字段定义补充到字段类别、以及将其字段枚举值补充到枚举类别。
S209:将所述目标合同字段数据转换为信息系统中的信息数据。
信息系统中的信息数据通常存储在数据库中,因此,也可以采用字段、字段定义及字段枚举值的方式描述信息数据的格式。示例性的,将本申请实施例的方法应用于房产交易领域时,为了对房产买卖过程进行管控,同样需要采集买房婚姻信息,因此,信息系统中的信息数据也包含买方婚姻字段,在存储时,假设以″hunyin_mai″作为信息数据中买房婚姻字段的字段定义、″1表示已婚,2表示未婚,3表示离异,4表示丧偶″作为信息数据中买房婚姻字段的字段枚举值。本申请实施例自动分析目标合同数据的合同版式后,确定目标合同数据的目标合同字段数据,具体例如买方婚姻字段的字段内容:″1未婚″。之后顺利地将目标合同字段数据,具体例如,可以将目标合同字段数据中买方婚姻字段的字段内容:″1未婚″,顺利地转换为信息系统中的信息数据的字段内容为″2未婚″。
在转换过程中,可以采用kafka数据库系统进行合同数据的中转、存储。例如,可以将聚类分析得到的合同版式数据存储在kafka数据库系统中,在进行目标合同标识数据及目标合同字段数据的确定时,从kafka数据库系统中获取合同版式数据。
基于相同的设计构思,本申请实施例还提供了一种系统间数据交互装置、存储介质及电子设备。
实施例三
如图4所示,本申请实施例还提供一种系统间数据交互装置400,包括:
样本聚类模块401,用于对合同系统中的合同版式样本进行聚类分析,确定合同版式数据;所述合同版式数据包括合同标识数据、合同字段数据、以及合同标识数据和合同字段数据之间的对应关系;
获取模块402,用于获取合同系统中待转换的目标合同数据;
标识确定模块403,用于根据所述合同标识数据,确定所述目标合同数据的目标合同标识数据;
字段确定模块404,用于根据所述目标合同标识数据、所述合同字段数据、以及合同标识数据和合同字段数据之间的对应关系,确定所述目标合同数据的目标合同字段数据;
数据交互模块405,用于将所述目标合同字段数据转换为信息系统中的信息数据。
样本聚类模块401和获取模块402分别与标识确定模块403连接,根据样本聚类模块401确定的合同版式数据以及获取模块402获取的目标合同数据,确定目标合同数据的目标合同标识数据。标识确定模块403与字段确定模块404连接,根据目标合同标识数据确定目标合同字段数据。字段确定模块404与数据交互模块405连接,将目标合同字段数据发送给数据交互模块405,数据交互模块405将目标合同字段数据转换为信息系统中的信息数据。
一种可能的实施方式中,如图5所示,样本聚类模块401,包括:
样本获取单元501,用于获取标记了样本字段数据的所述合同版式样本;
类别确定单元502,用于根据所述样本字段数据确定所述合同版式样本所属的字段类别、定义类别和枚举类别;
合同字段确定单元503,用于根据所述字段类别、所述定义类别和所述枚举类别确定所述合同字段数据;
样本标识确定单元504,用于根据所述字段类别、所述定义类别和所述枚举类别确定所述合同标识数据;
样本关系确定单元505,用于确定所述合同字段数据和所述合同标识数据之间的对应关系。
样本获取单元501与类别确定单元502连接,样本获取单元501将获取的合同版式样本发送给类别确定单元502,类别确定单元502根据合同版式样本确定合同版式样本所属的字段类别、定义类别和枚举类别。类别确定单元502分别与合同字段确定单元503和样本标识确定单元504连接,将合同版式样本所属的字段类别、定义类别和枚举类别发送给合同字段确定单元503和样本标识确定单元504,合同字段确定单元503根据字段类别、定义类别和枚举类别确定合同字段数据,样本标识确定单元504根据字段类别、定义类别和枚举类别确定合同标识数据。合同字段确定单元503和样本标识确定单元504分别与样本关系确定单元505连接,样本关系确定单元505确定合同字段数据和合同标识数据之间的对应关系。
一种可能的实施方式中,类别确定单元502,用于:
根据所述样本字段数据中包含的字段,确定合同版式样本的字段类别;
针对每个所述字段类别,根据所述字段类别对应字段的字段定义,将所述字段定义相同的合同版式样本确定为一个定义类别;
针对每个所述定义类别,将字段枚举值相同的合同版式样本确定为一个枚举类别。
一种可能的实施方式中,合同字段确定单元503,用于:
根据所述合同版式样本的字段类别,确定所述合同字段数据包括的所述合同版式样本包含的字段;
根据所述合同版式样本的定义类别,确定所述合同字段数据包括的合同版式样本中包含字段的字段定义;
根据所述合同版式样本的枚举类别,确定所述合同字段数据包括的合同版式样本中包含字段的字段枚举值。
一种可能的实施方式中,样本标识确定单元504,用于:
将包含每个合同版式样本的所述字段类别对应的字段确定为目标字段;
将对应的字段类别中仅包含一个所述定义类别和一个所述枚举类别的所述目标字段确定为合同标识数据。
一种可能的实施方式中,样本关系确定单元505,用于:
确定所述合同标识数据的字段内容与所述合同版式样本所属的字段类别、定义类别及枚举类别之间的对应关系。
一种可能的实施方式中,标识确定模块403,用于:
根据所述合同标识数据,将所述目标合同数据中所述合同标识数据对应字段的字段内容,确定为所述目标合同标识数据;
字段确定模块404,用于:
根据所述目标合同标识数据、以及合同标识数据和合同字段数据之间的对应关系,将所述目标合同标识数据对应的合同字段数据的字段内容,确定为所述目标合同数据的目标合同字段数据。
一种可能的实施方式中,本申请实施例提供的系统间数据交互装置还可以包括中央控制模块和存储模块,系统间数据交互装置中的每个模块均与中央控制模块连接,存储模块也与中央控制模块连接,由中央控制模块进行每个模块之间执行顺序和数据交互的调度,并将每个中间数据存存储在内部存储或存储器中,通过中央控制模块从内部存储或存储器读取中间数据、或者将中间数据写入内部存储或存储器中。
本申请实施例提供的系统间数据交互装置,根据聚类分析得到的合同版式数据,对目标合同数据的版式进行了解析,得到代表合同内容的目标合同字段数据,将目标合同字段数据转换为信息系统中的信息数据,可以顺利地将不同版式的目标合同数据转换为信息数据。
实施例四
一种计算机可读介质,所述计算机可读存储介质存储指令,所述指令在由处理器执行时使得所述处理器执行本申请实施例提供的任一种系统间数据交互方法的步骤。实际应用中,所述的计算机可读介质可以是上述实施例中描述的设备/装置/系统中所包含的,也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或多个程序被执行时,实现根据参考本申请实施例提供的任一种系统间数据交互装置进行本申请实施例提供的任一种系统间数据交互方法的步骤。
根据本申请公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件,或者上述的任意合适的组合,但不用于限制本申请保护的范围。在本申请公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
本申请所述的方法步骤除了可以用数据处理程序来实现,还可以由硬件来实现,例如,可以由逻辑门、开关、专用集成电路(ASIC)、可编程逻辑控制器和嵌微控制器等来实现。因此这种可以实现本申请所述方法的硬件也可以构成本申请。
实施例五
本申请实施例还提供一种电子设备,可以是计算机或服务器,其中可以集成本申请实施例提供的任一种系统间数据交互装置。如图6所示,其示出了本申请实施例提供的电子设备600。
该电子设备可以包括一个或者一个以上处理核心的处理器601、一个或一个以上用于存储所述处理器601可执行指令的存储器602。该电子设备还可以包括电源603、输入输出单元604。本领域技术人员可以理解,图6中并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中:
处理器601是该电子设备的控制部分,利用各种接口和线路连接各个部分,从存储器602中读取所述可执行指令,通过运行或执行存储在存储器602中的指令以实现本申请实施例提供的任一种系统间数据交互方法的步骤。
存储器602可用于存储软件程序,即本申请实施例提供的任一种系统间数据交互方法中涉及的程序。
处理器601通过运行存储在存储器602的软件程序,从而执行各种功能应用以及数据处理。存储器602可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据电子设备需要使用的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器602还可以包括存储器控制器,以提供处理器601对存储器602的访问。
电子设备还包括给各个部件供电的电源603,优选的,电源603可以通过电源管理系统与处理器601逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源603还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该服务器还可包括输入输出单元604,比如可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入;比如可用于显示由用户输入的信息或提供给用户的信息以及服务器的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。
本申请实施例提供的任一种系统间数据交互方法、装置、存储介质及电子设备均基于相同的设计构思,并且本申请任一个实施例中的技术手段可以进行自由组合,组合得到的技术手段仍在本申请的保护范围之内。
本申请附图中的流程图和框图,示出了按照本申请公开的各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或者代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应该注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同附图中所标准的顺序发生。例如,两个连接地表示的方框实际上可以基本并行地执行,它们有时也可以按照相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或者流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本申请的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本申请中。特别地,在不脱离本申请精神和教导的情况下,本申请的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,所有这些组合和/或结合均落入本申请公开的范围。
本申请中应用了具体实施例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思路,并不用于限制本申请。对于本领域的技术人员来说,可以依据本申请的思路、精神和原则,在具体实施方式及应用范围上进行改变,其所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
Claims (10)
1.一种系统间数据交互方法,其特征在于,包括:
对合同系统中的合同版式样本进行聚类分析,确定合同版式数据;所述合同版式数据包括合同标识数据、合同字段数据、以及合同标识数据和合同字段数据之间的对应关系;
获取所述合同系统中待转换的目标合同数据;
根据所述合同标识数据,确定所述目标合同数据的目标合同标识数据;
根据所述目标合同标识数据、所述合同字段数据、以及合同标识数据和合同字段数据之间的对应关系,确定所述目标合同数据的目标合同字段数据;
将所述目标合同字段数据转换为信息系统中的信息数据。
2.根据权利要求1所述的方法,其特征在于,所述对合同系统中的合同版式样本进行聚类分析,确定合同版式数据的步骤,包括:
获取标记了样本字段数据的所述合同版式样本;
根据所述样本字段数据确定所述合同版式样本所属的字段类别、定义类别和枚举类别;
根据所述字段类别、所述定义类别和所述枚举类别确定所述合同字段数据和所述合同标识数据;
确定所述合同字段数据和所述合同标识数据之间的对应关系。
3.根据权利要求2所述的方法,其特征在于,所述根据所述样本字段数据确定所述合同版式样本所属的字段类别、定义类别和枚举类别的步骤,包括:
根据所述样本字段数据中包含的字段,确定合同版式样本的字段类别;
针对每个所述字段类别,根据所述字段类别对应字段的字段定义,将所述字段定义相同的合同版式样本确定为一个定义类别;
针对每个所述定义类别,将字段枚举值相同的合同版式样本确定为一个枚举类别。
4.根据权利要求3所述的方法,其特征在于,根据所述字段类别、所述定义类别和所述枚举类别确定所述合同字段数据的步骤,包括:
根据所述合同版式样本的字段类别,确定所述合同字段数据包括的所述合同版式样本包含的字段;
根据所述合同版式样本的定义类别,确定所述合同字段数据包括的合同版式样本中包含字段的字段定义;
根据所述合同版式样本的枚举类别,确定所述合同字段数据包括的合同版式样本中包含字段的字段枚举值。
5.根据权利要求3所述的方法,其特征在于,根据所述字段类别、所述定义类别和所述枚举类别确定所述合同标识数据的步骤,包括:
将包含每个合同版式样本的所述字段类别对应的字段确定为目标字段;
将对应的字段类别中仅包含一个所述定义类别和一个所述枚举类别的所述目标字段确定为合同标识数据。
6.根据权利要求4所述的方法,其特征在于,所述确定所述合同字段数据和所述合同标识数据之间的对应关系的步骤,包括:
确定所述合同标识数据的字段内容与所述合同版式样本所属的字段类别、定义类别及枚举类别之间的对应关系。
7.根据权利要求6所述的方法,其特征在于,所述根据所述合同标识数据,确定所述目标合同数据的目标合同标识数据的步骤,包括:
根据所述合同标识数据,将所述目标合同数据中所述合同标识数据对应字段的字段内容,确定为所述目标合同标识数据;
所述根据所述目标合同标识数据、所述合同字段数据、以及合同标识数据和合同字段数据之间的对应关系,确定所述目标合同数据的目标合同字段数据的步骤,包括:
根据所述目标合同标识数据、以及合同标识数据和合同字段数据之间的对应关系,将所述目标合同标识数据对应的合同字段数据的字段内容,确定为所述目标合同数据的目标合同字段数据。
8.一种系统间数据交互装置,其特征在于,包括:
样本聚类模块,用于对合同系统中的合同版式样本进行聚类分析,确定合同版式数据;所述合同版式数据包括合同标识数据、合同字段数据、以及合同标识数据和合同字段数据之间的对应关系;
获取模块,用于获取合同系统中待转换的目标合同数据;
标识确定模块,用于根据所述合同标识数据,确定所述目标合同数据的目标合同标识数据;
字段确定模块,用于根据所述目标合同标识数据、所述合同字段数据、以及合同标识数据和合同字段数据之间的对应关系,确定所述目标合同数据的目标合同字段数据;
数据交互模块,用于将所述目标合同字段数据转换为信息系统中的信息数据。
9.一种计算机可读存储介质,存储有计算机指令,其特征在于,所述指令被处理器执行时可实现权利要求1~7任一项所述的方法的步骤。
10.一种电子设备,其特征在于,该电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现权利要求1-7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010078302.6A CN111368073A (zh) | 2020-02-06 | 2020-02-06 | 系统间数据交互方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010078302.6A CN111368073A (zh) | 2020-02-06 | 2020-02-06 | 系统间数据交互方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111368073A true CN111368073A (zh) | 2020-07-03 |
Family
ID=71207942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010078302.6A Pending CN111368073A (zh) | 2020-02-06 | 2020-02-06 | 系统间数据交互方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111368073A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106777970A (zh) * | 2016-12-15 | 2017-05-31 | 北京锐软科技股份有限公司 | 一种医疗信息系统数据模板化的集成系统及方法 |
CN107767929A (zh) * | 2017-11-13 | 2018-03-06 | 医渡云(北京)技术有限公司 | 病例报告表填写方法、装置、电子设备及存储介质 |
CN108052321A (zh) * | 2017-12-28 | 2018-05-18 | 杭州趣链科技有限公司 | 一种基于配置信息自动生成区块链智能合约的方法 |
CN108090068A (zh) * | 2016-11-21 | 2018-05-29 | 医渡云(北京)技术有限公司 | 医院数据库中的表的分类方法及装置 |
CN109254992A (zh) * | 2018-10-12 | 2019-01-22 | 北京京东金融科技控股有限公司 | 项目生成方法及系统、计算机系统和计算机可读存储介质 |
CN109344154A (zh) * | 2018-08-22 | 2019-02-15 | 中国平安人寿保险股份有限公司 | 数据处理方法、装置、电子设备及存储介质 |
-
2020
- 2020-02-06 CN CN202010078302.6A patent/CN111368073A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108090068A (zh) * | 2016-11-21 | 2018-05-29 | 医渡云(北京)技术有限公司 | 医院数据库中的表的分类方法及装置 |
CN106777970A (zh) * | 2016-12-15 | 2017-05-31 | 北京锐软科技股份有限公司 | 一种医疗信息系统数据模板化的集成系统及方法 |
CN107767929A (zh) * | 2017-11-13 | 2018-03-06 | 医渡云(北京)技术有限公司 | 病例报告表填写方法、装置、电子设备及存储介质 |
CN108052321A (zh) * | 2017-12-28 | 2018-05-18 | 杭州趣链科技有限公司 | 一种基于配置信息自动生成区块链智能合约的方法 |
CN109344154A (zh) * | 2018-08-22 | 2019-02-15 | 中国平安人寿保险股份有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN109254992A (zh) * | 2018-10-12 | 2019-01-22 | 北京京东金融科技控股有限公司 | 项目生成方法及系统、计算机系统和计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
杨胜刚等: "《公共信用信息采集技术及其应用研究》", 30 June 2018, pages: 179 - 181 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Beynon-Davies | Information Systems Development: an introduction to information systems engineering | |
US11119988B2 (en) | Performing logical validation on loaded data in a database | |
CN109522312A (zh) | 一种数据处理方法、装置、服务器和存储介质 | |
US20170212748A1 (en) | System and method for providing supplemental functionalities to a computer program | |
CN110750654A (zh) | 知识图谱获取方法、装置、设备和介质 | |
CN116701662A (zh) | 基于知识图谱的供应链数据管理方法、装置、设备及介质 | |
CN113868507A (zh) | 结合rpa和ai的招投标信息获取方法、装置及电子设备 | |
CN114610795A (zh) | 应用于大数据挖掘的数字化业务信息处理方法及服务器 | |
CN112395432B (zh) | 课程推送方法、装置、计算机设备及存储介质 | |
CN111242779B (zh) | 金融数据特征选择和预测方法、装置、设备及存储介质 | |
CN112084177A (zh) | 基于数据采集治理及挖掘分析的数据池应用方法及装置 | |
CN111368073A (zh) | 系统间数据交互方法、装置、存储介质及电子设备 | |
CN115907875A (zh) | 价格区间的造价编制方法、装置、电子设备及介质 | |
CN114168565B (zh) | 业务规则模型的回溯测试方法、装置、系统及决策引擎 | |
CN116168848A (zh) | 一种基于Faiss算法的药品信息匹配方法及装置 | |
CN109800147A (zh) | 一种测试案例生成方法及终端设备 | |
CN115564250A (zh) | 一种计算机业务建模方法及装置 | |
JP2022082525A (ja) | 機械学習基盤情報の提供方法および装置 | |
CN113987351A (zh) | 基于人工智能的智能推荐方法、装置、电子设备及介质 | |
CN113344674A (zh) | 基于用户购买力的产品推荐方法、装置、设备及存储介质 | |
May et al. | BIM in Real Estate Operations: Application, Implementation, Digitalization Trends and Case Studies | |
Unger | Data acquisition and the implications of machine learning in the development of a Clinical Decision Support system | |
JP2020155074A (ja) | 情報処理装置、プログラム、及び情報処理方法 | |
CN113282795B (zh) | 数据结构图生成及更新方法、装置、电子设备及存储介质 | |
CN113052695A (zh) | 一种基于机器学习的数字资源处理方法、装置和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |