CN112650864A - 一种数据处理方法、装置、电子设备及存储介质 - Google Patents

一种数据处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112650864A
CN112650864A CN201910969586.5A CN201910969586A CN112650864A CN 112650864 A CN112650864 A CN 112650864A CN 201910969586 A CN201910969586 A CN 201910969586A CN 112650864 A CN112650864 A CN 112650864A
Authority
CN
China
Prior art keywords
contract data
contract
data
information
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910969586.5A
Other languages
English (en)
Inventor
郎儒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201910969586.5A priority Critical patent/CN112650864A/zh
Publication of CN112650864A publication Critical patent/CN112650864A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

在本发明提供的在本发明提供的一种数据处理方法、装置、电子设备及存储介质,其中所述方法包括:对合同数据库中的图像合同数据进行解析,得到包含销售合同数据、采购合同数据的文本合同数据;根据标的信息、名称信息、开始日期、结束日期以及款项信息,从销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定目标销售合同数据与目标采购合同数据存在转包关系。通过识别并提取项目承包双方的合同中的合同数据,并根据所提取到的合同数据中的关键信息进行数据分析,确定存在转包关系的销售合同以及采购合同,减少了合同转包审计过程中的人为参与,从而提高了合同转包审计的效率和准确性。

Description

一种数据处理方法、装置、电子设备及存储介质
技术领域
本发明涉及信息技术领域,特别是涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
转包是指承包人在承包工程项目后,未经发包人同意将其承包的工程建设任务私自转发给第三方,转让人退出现场承包关系,受让人成为承包合同的实际另一方当事人的行为。这种情况使得工程的实际参与方与合同相对方不一致,可能存在实际当事人的挂靠、履约能力不足、资质不符等风险,给工程质量带来了安全隐患。
针对这种现象,企业通常通过人工审核,对项目涉及公司的合同进行人工审核,人为判断承包方是否存在非法转包的现象。
这种方式由于审计材料存在局限性,并且过于依赖于人为参与,难以避免人为疏漏,无法保证转包审计的准确性以及效率。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据处理方法及装置。
依据本发明的第一方面,提供了一种数据处理方法,所述方法包括:
对合同数据库中的图像合同数据进行解析,得到文本合同数据,所述文本合同数据包括:销售合同数据、采购合同数据,所述销售合同数据与所述采购合同数据包括:标的信息、名称信息、开始日期、结束日期以及款项信息;
根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系。
可选的,所述根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系的步骤,包括:
若销售合同数据与采购合同数据中,名称信息之间的相似度大于预设的第一阈值,且标的信息之间的相似度大于预设的第二阈值,且销售合同数据的款项信息与采购合同数据的款项信息之间的比值小于或等于所述预设阈值,且所述款项信息之间的比值大于或等于一,且销售合同数据的开始日期与采购合同数据的开始时间之间的差值小于或等于零,且销售合同数据的结束日期与采购合同数据的结束时间之间差值大于或等于零,则确定所述销售合同数据与所述采购合同数据分别为目标销售合同数据、目标采购合同数据,且所述目标销售合同数据与所述目标采购合同数据之间存在转包关系。
可选的,所述对合同数据库中的图像合同数据进行解析,提取文本合同数据的步骤,包括:
接收合同转包审计请求,所述合同转包审计请求包括:第一注册信息、第二注册信息;
对合同数据库中的图像合同数据进行自然语言解析,得到所述图像合同数据的合同文档数据;
从所述合同文档数据中提取与所述第一注册信息相对应的销售合同数据,从所述合同文档数据中提取与所述第二注册信息相对应的采购合同数据,得到文本合同数据。
可选的,所述销售合同数据与所述采购合同数据还包括:相对人信息,所述根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系的步骤之前,还包括:
根据预置关联信息表,剔除所述销售合同数据中相对人信息与所述第一注册信息或所述第二注册信息存在预设关联关系的数据,所述预置关联信息表是通过抓取到的企业注册信息得到的,所述预置关联信息表包括企业注册信息与相对人信息之间的预置关联关系。
可选的,所述根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系的步骤之后,还包括:
根据所述目标销售合同数据与所述目标采购合同数据,生成合同转包审计报告,并输出所述合同转包审计报告,所述合同转包审计报告至少包括:业务流转顺序、款项流转顺序、业务参与方、流程参与人、业务内容。
根据本发明的第二方面,提供了一种数据处理装置,所述装置包括:
提取模块,用于对合同数据库中的图像合同数据进行解析,得到文本合同数据,所述文本合同数据包括:销售合同数据、采购合同数据,所述销售合同数据与所述采购合同数据包括:标的信息、名称信息、开始日期、结束日期以及款项信息;
确定模块,用于根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系。
可选的,所述确定模块,包括:
确定子模块,用于若销售合同数据与采购合同数据中,名称信息之间的相似度大于预设的第一阈值,且标的信息之间的相似度大于预设的第二阈值,且销售合同数据的款项信息与采购合同数据的款项信息之间的比值小于或等于所述预设阈值,且所述款项信息之间的比值大于或等于一,且销售合同数据的开始日期与采购合同数据的开始时间之间的差值小于或等于零,且销售合同数据的结束日期与采购合同数据的结束时间之间差值大于或等于零,则确定所述销售合同数据与所述采购合同数据分别为目标销售合同数据、目标采购合同数据,且所述目标销售合同数据与所述目标采购合同数据之间存在转包关系。
可选的,所述提取模块,包括:
接收子模块,用于接收合同转包审计请求,所述合同转包审计请求包括:第一注册信息、第二注册信息;
第一提取子模块,用于对合同数据库中的图像合同数据进行自然语言解析,提取所述图像合同数据的合同文档数据;
第二提取子模块,用于从所述合同文档数据中提取与所述第一注册信息相对应的销售合同数据,从所述合同文档数据中提取与所述第二注册信息相对应的采购合同数据,得到文本合同数据。
可选的,所述销售合同数据与所述采购合同数据还包括:相对人信息,所述装置,还包括:
剔除模块,用于根据预置关联信息表,剔除所述销售合同数据中相对人信息与所第一注册信息或所述第二注册信息存在企业内部关联关系的数据,所述预置关联信息表是通过依据网络爬虫抓取到的企业注册信息得到,所述预置关联信息表包括企业注册信息与相对人信息之间的预置关联关系。
可选的,所述装置,还包括:
生成模块,用于根据所述目标销售合同数据与所述目标采购合同数据,生成合同转包审计报告,并输出所述合同转包审计报告,所述合同转包审计报告至少包括:业务流转顺序、款项流转顺序、业务参与方、流程参与人、业务内容。
依据本发明第三方面,提供一种电子设备,设备包括至少一个处理器、以及与处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述第一方面任一所述的数据处理方法。
依据本发明第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一所述的数据处理方法。
在本发明提供的一种数据处理方法、装置、电子设备及存储介质,其中所述方法包括:对合同数据库中的图像合同数据进行解析,得到文本合同数据,所述文本合同数据包括:销售合同数据、采购合同数据,所述销售合同数据与所述采购合同数据包括:标的信息、名称信息、开始日期、结束日期以及款项信息;根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系。通过识别并提取项目承包双方的合同中的合同数据,并根据所提取到的合同数据中的关键信息进行数据分析,确定存在转包关系的销售合同以及采购合同,减少了合同转包审计过程中的人为参与,从而提高了合同转包审计的效率和准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例的一种数据处理方法的流程图;
图2示出了本发明实施例的一种提取文本合同数据方法的流程图;
图3示出了本发明实施例的一种转包关系确定方法的流程图;
图4示出了本发明实施例的一种合同数据剔除方法的流程图;
图5示出了本发明实施例的一种审计报告生成方法的流程图;
图6示出了本发明实施例的一种数据处理装置的结构框图;
图7是本发明实施例提供的一种设备的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
参照图1,示出了本发明实施例的一种数据处理方法的流程图,具体可以包括如下步骤:
步骤101,对合同数据库中的图像合同数据进行解析,得到文本合同数据,所述文本合同数据包括:销售合同数据、采购合同数据,所述销售合同数据与所述采购合同数据包括:标的信息、名称信息、开始日期、结束日期以及款项信息。
在本发明实施例中,出于对企业工程项目合同的审计需求,需要对发包企业以及承包企业的合同进行审计,而所述合同数据库是指存储承包企业的所有工程合同的数据库。通常情况下,企业会将纸质的合同通过扫描以图像数据的形式进行存储,因此需要对图像格式的图像合同数据进行信息提取,具体的可以通过预先训练的数据识别模型,对合同中的各种文字信息进行识别,由于合同中的信息属于非结构化数据,因此需要对识别获得的文字数据需要根据格式以及文字内容进行分析,从而判断合同中的标的信息、名称信息、日期以及款项信息等。此处也可以通过其他本领域公知的非结构化文档提取技术进行提取,只需可以获取合同数据即可,此处不做限定。
可选,在图1的基础上参照图2,所述步骤101,可以包括步骤1011至1013:
步骤1011,接收合同转包审计请求,所述合同转包审计请求包括:第一注册信息、第二注册信息。
在本发明实施例中,可以开发用于合同转包审计的应用程序,或插件、功能模块的形式集成于合同审核软件中,或集成于设置可对合同数据处理的应用程序,具体存在形式可根据开发人员及用户的实际需要确定,此处不做限定。
进一步的,若用户需要对某项目的承包方进行合同审核,势必是对项目的承包方以及发包方的合同共同进行审核。在进行审核前,需要用户确定项目发包方的第一注册信息以及承包方的第二注册信息,所述企业注册信息可以包括企业的企业注册编码、注册名称、法人代表、注册地址、注册日期等信息。
步骤1012,对合同数据库中的图像合同数据进行自然语言解析,得到所述图像合同数据的合同文档数据。
在本发明实施例中,首先可以通过预先训练的图像识别模型对所述合同数据中的文档信息进行识别得到合同文档数据,然后通过采用NLP(Natural Language Processing,自然语言处理)的语义识别模型对得到的合同文档数据进行语义识别,对其中的文档数据按照不同的类型进行归类存储,例如:标的信息、名称信息、日期以及款项信息等。所述图像识别模型可采用本领域公知的图像识别模型对图像合同数据进行训练得到。
步骤1013,从所述合同文档数据中提取与所述第一注册信息相对应的销售合同数据,从所述合同文档数据中提取与所述第二注册信息相对应的采购合同数据,得到文本合同数据。
在本发明实施例中,出于针对项目发送方与项目承包方之间项目合同的审计需要,因此在审计的过程中,仅需对项目承包方与项目发包方签署的销售图像合同数据以及项目承包方与其他第三方企业签署的采购合同进行数据比对。可以理解,项目的承包方在获得项目合同时,与发包方签署的是销售合同,而若需将该项目转包给第三方需要与第三方签署采购合同,从而减小了后续合同数据处理的数据量,无需对承包方的所有合同数据进行处理。
在实际应用中,也可无需对项目承包方的合同数据进行筛选,可直接对该承包方的全部合同数据进行分析处理,通过这种方式可以完整的获取到项目承包方的整体业务能力,以及进行其他方面的审计工作,具体可根据用户的实际需求进行设置,此处不做限定。
步骤102,根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系。
在本发明实施例中,由于合同的标的信息、名称信息通常是依据实际目标内容注定的,因此若承包方将项目转包给第三方企业,则所签署的采购合同中的标的信息与名称信息与其针对该项目与发包方签署的销售合同,会存在一定程度的相似性,例如针对某地区某区段道路中的某部分桥梁建设项目,两份合同中均会指明项目所在地点、具体区段以及具体项目内容,针对相同的项目内容,项目的标的也会存在极大程度的相似度,因此首先可以根据销售合同数据与采购合同数据的名称信息以及标的信息初步判断是否存在转包关系;其次,仅依靠合同的名称信息以及标的信息无法合理判断是否存在转包关系,还需要依据合同中的款项信息作为辅助依据,具体的,对于转包现象,涉及转包的采购合同数据与销售合同数据中的款项信息应该是方向相反,并且采购合同中的采购款项信息小于或等于销售合同中的销售款项信息,非法承包方通常采用这种方式谋取不正当收益;最后,由于项目承包方是在与发包方签署销售合同,也就是获取该项目之后才能将项目转包出去,因此其与第三方企业签署的采购合同中的开始日期一定是晚于与发包方签署的销售合同中的开始日期,并且由于承包方需要销售合同的结束日期向项目发包方交付项目成果,因此需要第三方企业在销售合同的结束日期前让第三方企业交付该项目成果,因此采购合同数据中的结束日期一般会早于销售合同数据中的结束日期。通过对上述四种因素进行赋权,确定不同因素占的权重,通过赋权求和确定的评估值,与预设的评估阈值进行比对,将评估值大于或等于评估阈值的采购合同数据及销售合同数据确定为存在转包关系。通过综合多种评估因素对合同进行分析处理,判断存在转包关系的销售合同以及采购合同,提高了合同转包审计的效率以及准确性。
可选,在图1的基础上参照图3,所述步骤102,包括:
步骤1021,若销售合同数据与采购合同数据中,名称信息之间的相似度大于预设的第一阈值,且标的信息之间的相似度大于预设的第二阈值,且销售合同数据的款项信息与采购合同数据的款项信息之间的比值小于或等于所述预设阈值,且所述款项信息之间的比值大于或等于一,且销售合同数据的开始日期与采购合同数据的开始时间之间的差值小于或等于零,且销售合同数据的结束日期与采购合同数据的结束时间之间差值大于或等于零,则确定所述销售合同数据与所述采购合同数据分别为目标销售合同数据、目标采购合同数据,且所述目标销售合同数据与所述目标采购合同数据之间存在转包关系。
在本发明实施例中,对于某一项目的项目主体若被承包方转包,通常依据不同的项目类型存在差异,具体可以通过针对不同样本转包项目的销售合同数据以及采购合同数据进行实验,对其中的名称信息、标的信息、款项信息进行统计分析,确定针对不同项目类型的合同中存在转包关系的销售合同数据与采购合同数据中标的信息之间相似度最小值,即第一阈值,以及名称信息之间相似度最小值,即第二阈值,以及款项信息之间最小比值,即第三阈值。在实际应用中,由于所述合同的名称信息、标的信息、款项信息之间存在一定程度的对应关系,名称信息存在相对应的标的信息,标的信息存在相对应的款项信息,因此所述第一阈值、第二阈值以及第三阈值可保持在同一数值。
针对具体根据项目类型,在合同审计过程中,若销售合同数据与采购合同数据之间名称信息的相似度大于或等于第一阈值,且标的信息的相似度大于或等于第二阈值,且款项信息之间的比值大于或等于第三阈值,则可认定所涉及项目的主体被转包,其对项目整体产生的影响可以等效于该项目整体被转包所产生的影响,因此可以认定该销售合同数据与采购合同数据之间存在转包关系,例如对于建筑企业,可确定将第一阈值、第二阈值第三阈值均确定为70%,即若名称相似度大于或等于百分之70%,且标的信息的相似度大于或等于70%,且销售合同与采购合同的款项信息之比大于或等于70%,则可确定该项目的主体已被转包。可以理解,对于某一项目,项目主体虽然不是项目内容的全部,但是项目中的核心部分,直接关系到项目的质量,若被非法转包给第三方资质不合格的企业,会给项目带来巨大质量以及安全隐患,因此即可确定该项目已被转包。通过固化合同审计过程中的审计规则,提高了合同转包审计的效率。
进一步的,还可在上述判别策略的基础上添加依据销售合同数据以及采购合同数据中开始时间、结束时间的策略信息,由于承包方只能在于发包方签署销售合同后才能将项目转包给第三方,即与第三方签署采购合同,因此所述销售合同数据的开始时间是早于采购合同数据的开始时间,因此销售合同数据与采购合同数据的开始时间之间的差值小于或等于零。由于需要在承包方向发包方交付项目之前向承包方提前交付项目,因此所述销售合同数据的结束时间是晚于所述采购合同数据的结束时间,因此所述销售合同数据与所述采购合同数据的结束时间之间的差值大于或等于零。通过添加依据销售合同数据与采购合同数据中开始时间与结束时间的辅助策略,提高了确定转包关系的准确率。
可选的,所述销售合同数据与所述采购合同数据还包括:相对人信息,在图2的基础上参照图4,所述步骤102之前,还包括:
步骤103,根据预置关联信息表,剔除所述销售合同数据中相对人信息与所述第一注册信息或所述第二注册信息存在预设关联关系的数据,所述预置关联信息表是通过抓取到的企业注册信息得到的,所述预置关联信息表包括企业注册信息与相对人信息之间的预置关联关系。
在本发明实施例中,对于承包企业而言,处于管理或经营需要,其可能将工程以转包的形式转包给其内部关联的子公司,而对于这种转包关系,从项目承接资质角度来说,其仍然可以享受母公司的承包资质,因此对于工程质量不会带来实质性的风险,此种合同转包方式属于合理范畴。
具体的,可通过网络爬虫技术在企业信息网站搜集企业注册信息,通过根据搜集到企业注册信息对采购合同数据中涉及的第三方企业存在的内部关联关系进行识别,从而确定第三方企业是否为与承包方内部关联,若该第三方企业与承包方存在内部关联关系,则可以从采购合同数据删除,从而缩小后续数据处理的数据范围,提高合同转包审计的效率以及准确率。
可选的,在图1的基础上参照图5,所述步骤102之后,还包括:
步骤104,根据所述目标销售合同数据与所述目标采购合同数据,生成合同转包审计报告,并输出所述合同转包审计报告,所述合同转包审计报告至少包括:业务流转顺序、款项流转顺序、业务参与方、流程参与人、业务内容。
在本发明实施例中,可通过所确定的目标销售合同数据与所述目标采购合同数据中的各种信息生成结构化的数据报表,以直观展示存在转包关系的合同数据。具体的,可通过对所述目标销售合同数据以及目标采购合同数据所涉及的相关企业进行数据挖掘,将通过分析所述转包关系获取业务流转顺序视图,并标注通过分析款项信息获取的款项流转顺序以及金额、通过分析所对应企业注册信息获取的业务参与方、分析所包含的相对人获取的流程参与人、通过分析标的信息获取的业务内容,以生成包含转包业务流程视图,并附注详细的结构化表格数据,作为输出的合同转包审计报告。通过生成转包升级报告,使得用户可以更加直观的了解转包关系的相关信息,提升用户体验。
在本发明提供的一种数据处理方法,所述方法包括:对合同数据库中的图像合同数据进行解析,得到文本合同数据,所述文本合同数据包括:销售合同数据、采购合同数据,所述销售合同数据与所述采购合同数据包括:标的信息、名称信息、开始日期、结束日期以及款项信息;根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系。通过识别并提取项目承包双方的合同中的合同数据,并根据所提取到的合同数据中的关键信息进行数据分析,确定存在转包关系的销售合同以及采购合同,减少了合同转包审计过程中的人为参与,从而提高了合同转包审计的效率和准确性。
实施例二
参照图6,示出了本发明实施例的一种数据处理装置200,所述装置包括:
提取模块201,用于对合同数据库中的图像合同数据进行解析,得到文本合同数据,所述文本合同数据包括:销售合同数据、采购合同数据,所述销售合同数据与所述采购合同数据包括:标的信息、名称信息、开始日期、结束日期以及款项信息;
确定模块202,用于根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系。
可选的,所述确定模块202,包括:
确定子模块2021,用于若销售合同数据与采购合同数据中,名称信息之间的相似度大于预设的第一阈值,且标的信息之间的相似度大于预设的第二阈值,且销售合同数据的款项信息与采购合同数据的款项信息之间的比值小于或等于所述预设阈值,且所述款项信息之间的比值大于或等于一,且销售合同数据的开始日期与采购合同数据的开始时间之间的差值小于或等于零,且销售合同数据的结束日期与采购合同数据的结束时间之间差值大于或等于零,则确定所述销售合同数据与所述采购合同数据分别为目标销售合同数据、目标采购合同数据,且所述目标销售合同数据与所述目标采购合同数据之间存在转包关系。
可选的,所述提取模块201,包括:
接收子模块2011,用于接收合同转包审计请求,所述合同转包审计请求包括:第一注册信息、第二注册信息;
第一提取子模块2012,用于对合同数据库中的图像合同数据进行自然语言解析,提取所述图像合同数据的合同文档数据;
第二提取子模块2013,用于从所述合同文档数据中提取与所述第一注册信息相对应的销售合同数据,从所述合同文档数据中提取与所述第二注册信息相对应的采购合同数据,得到文本合同数据。
可选的,所述销售合同数据与所述采购合同数据还包括:相对人信息,所述装置,还包括:
剔除模块203,用于根据预置关联信息表,剔除所述销售合同数据中相对人信息与所第一注册信息或所述第二注册信息存在企业内部关联关系的数据,所述预置关联信息表是通过依据网络爬虫抓取到的企业注册信息得到,所述预置关联信息表包括企业注册信息与相对人信息之间的预置关联关系。
可选的,所述装置,还包括:
生成模块204,用于根据所述目标销售合同数据与所述目标采购合同数据,生成合同转包审计报告,并输出所述合同转包审计报告,所述合同转包审计报告至少包括:业务流转顺序、款项流转顺序、业务参与方、流程参与人、业务内容。
在本发明提供的一种数据处理装置,所述装置包括:提取模块,用于对合同数据库中的图像合同数据进行解析,得到文本合同数据,所述文本合同数据包括:销售合同数据、采购合同数据,所述销售合同数据与所述采购合同数据包括:标的信息、名称信息、开始日期、结束日期以及款项信息;确定模块,用于根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系。通过识别并提取项目承包双方的合同中的合同数据,并根据所提取到的合同数据中的关键信息进行数据分析,确定存在转包关系的销售合同以及采购合同,减少了合同转包审计过程中的人为参与,从而提高了合同转包审计的效率和准确性。
对于上述终端设备实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
所述数据处理装置包括处理器和存储器,上述提取模块、确定模块、确定子模块、接收子模块、第一提取子模块、第二提取子模块、剔除模块、生成模块均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决现有浏览器页面所展示下拉列表在滚动时,加载数据效率低,浏览器缓存压力大的问题。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述数据处理方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述数据处理方法。
参照图7,本发明实施例提供了一种设备,设备包括至少一个处理器301、以及与处理器301连接的至少一个存储器302、总线303;其中,处理器301、存储器302通过总线303完成相互间的通信;处理器301用于调用存储器302中的程序指令,以执行上述的数据处理方法。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
一种数据处理方法,所述方法包括:
对合同数据库中的图像合同数据进行解析,得到文本合同数据,所述文本合同数据包括:销售合同数据、采购合同数据,所述销售合同数据与所述采购合同数据包括:标的信息、名称信息、开始日期、结束日期以及款项信息;
根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系。
可选的,所述根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系的步骤,包括:
若销售合同数据与采购合同数据中,名称信息之间的相似度大于预设的第一阈值,且标的信息之间的相似度大于预设的第二阈值,且销售合同数据的款项信息与采购合同数据的款项信息之间的比值小于或等于所述预设阈值,且所述款项信息之间的比值大于或等于一,且销售合同数据的开始日期与采购合同数据的开始时间之间的差值小于或等于零,且销售合同数据的结束日期与采购合同数据的结束时间之间差值大于或等于零,则确定所述销售合同数据与所述采购合同数据分别为目标销售合同数据、目标采购合同数据,且所述目标销售合同数据与所述目标采购合同数据之间存在转包关系。
可选的,所述对合同数据库中的图像合同数据进行解析,提取文本合同数据的步骤,包括:
接收合同转包审计请求,所述合同转包审计请求包括:第一注册信息、第二注册信息;
对合同数据库中的图像合同数据进行自然语言解析,得到所述图像合同数据的合同文档数据;
从所述合同文档数据中提取与所述第一注册信息相对应的销售合同数据,从所述合同文档数据中提取与所述第二注册信息相对应的采购合同数据,得到文本合同数据。
可选的,所述销售合同数据与所述采购合同数据还包括:相对人信息,所述根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系的步骤之前,还包括:
根据预置关联信息表,剔除所述销售合同数据中相对人信息与所述第一注册信息或所述第二注册信息存在预设关联关系的数据,所述预置关联信息表是通过抓取到的企业注册信息得到的,所述预置关联信息表包括企业注册信息与相对人信息之间的预置关联关系。
可选的,所述根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系的步骤之后,还包括:
根据所述目标销售合同数据与所述目标采购合同数据,生成合同转包审计报告,并输出所述合同转包审计报告,所述合同转包审计报告至少包括:业务流转顺序、款项流转顺序、业务参与方、流程参与人、业务内容。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在一个典型的配置中,设备包括一个或多个处理器(CPU)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种数据处理方法,其特征在于,所述方法包括:
对合同数据库中的图像合同数据进行解析,得到文本合同数据,所述文本合同数据包括:销售合同数据、采购合同数据,所述销售合同数据与所述采购合同数据包括:标的信息、名称信息、开始日期、结束日期以及款项信息;
根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系。
2.根据权利要求1所述的方法,其特征在于,所述根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系的步骤,包括:
若销售合同数据与采购合同数据中,名称信息之间的相似度大于预设的第一阈值,且标的信息之间的相似度大于预设的第二阈值,且销售合同数据的款项信息与采购合同数据的款项信息之间的比值小于或等于所述预设阈值,且所述款项信息之间的比值大于或等于一,且销售合同数据的开始日期与采购合同数据的开始时间之间的差值小于或等于零,且销售合同数据的结束日期与采购合同数据的结束时间之间差值大于或等于零,则确定所述销售合同数据与所述采购合同数据分别为目标销售合同数据、目标采购合同数据,且所述目标销售合同数据与所述目标采购合同数据之间存在转包关系。
3.根据权利要求1所述的方法,其特征在于,所述对合同数据库中的图像合同数据进行解析,提取文本合同数据的步骤,包括:
接收合同转包审计请求,所述合同转包审计请求包括:第一注册信息、第二注册信息;
对合同数据库中的图像合同数据进行自然语言解析,得到所述图像合同数据的合同文档数据;
从所述合同文档数据中提取与所述第一注册信息相对应的销售合同数据,从所述合同文档数据中提取与所述第二注册信息相对应的采购合同数据,得到文本合同数据。
4.根据权利要求3所述的方法,其特征在于,所述销售合同数据与所述采购合同数据还包括:相对人信息,所述根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系的步骤之前,还包括:
根据预置关联信息表,剔除所述销售合同数据中相对人信息与所述第一注册信息或所述第二注册信息存在预设关联关系的数据,所述预置关联信息表是通过抓取到的企业注册信息得到的,所述预置关联信息表包括企业注册信息与相对人信息之间的预置关联关系。
5.根据权利要求1所述的方法,其特征在于,所述根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系的步骤之后,还包括:
根据所述目标销售合同数据与所述目标采购合同数据,生成合同转包审计报告,并输出所述合同转包审计报告,所述合同转包审计报告至少包括:业务流转顺序、款项流转顺序、业务参与方、流程参与人、业务内容。
6.一种数据处理装置,其特征在于,所述装置包括:
提取模块,用于对合同数据库中的图像合同数据进行解析,得到文本合同数据,所述文本合同数据包括:销售合同数据、采购合同数据,所述销售合同数据与所述采购合同数据包括:标的信息、名称信息、开始日期、结束日期以及款项信息;
确定模块,用于根据所述标的信息、名称信息、开始日期、结束日期以及款项信息,从所述销售合同数据、采购合同数据中筛选符合预设合同转包规则的目标销售合同数据与目标采购合同数据,并确定所述目标销售合同数据与所述目标采购合同数据存在转包关系。
7.根据权利要求6所述的装置,其特征在于,所述确定模块,包括:
确定子模块,用于若销售合同数据与采购合同数据中,名称信息之间的相似度大于预设的第一阈值,且标的信息之间的相似度大于预设的第二阈值,且销售合同数据的款项信息与采购合同数据的款项信息之间的比值小于或等于所述预设阈值,且所述款项信息之间的比值大于或等于一,且销售合同数据的开始日期与采购合同数据的开始时间之间的差值小于或等于零,且销售合同数据的结束日期与采购合同数据的结束时间之间差值大于或等于零,则确定所述销售合同数据与所述采购合同数据分别为目标销售合同数据、目标采购合同数据,且所述目标销售合同数据与所述目标采购合同数据之间存在转包关系。
8.根据权利要求6所述的装置,其特征在于,所述提取模块,包括:
接收子模块,用于接收合同转包审计请求,所述合同转包审计请求包括:第一注册信息、第二注册信息;
第一提取子模块,用于对合同数据库中的图像合同数据进行自然语言解析,提取所述图像合同数据的合同文档数据;
第二提取子模块,用于从所述合同文档数据中提取与所述第一注册信息相对应的销售合同数据,从所述合同文档数据中提取与所述第二注册信息相对应的采购合同数据,得到文本合同数据。
9.一种电子设备,其特征在于,设备包括至少一个处理器、以及与处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如权利要求1至5中任一项所述的数据处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现权利要求1至5中任一所述的数据处理方法。
CN201910969586.5A 2019-10-12 2019-10-12 一种数据处理方法、装置、电子设备及存储介质 Pending CN112650864A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910969586.5A CN112650864A (zh) 2019-10-12 2019-10-12 一种数据处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910969586.5A CN112650864A (zh) 2019-10-12 2019-10-12 一种数据处理方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112650864A true CN112650864A (zh) 2021-04-13

Family

ID=75343043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910969586.5A Pending CN112650864A (zh) 2019-10-12 2019-10-12 一种数据处理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112650864A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113778424A (zh) * 2021-09-27 2021-12-10 常州市公共资源交易中心 评审配置方法、装置和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090182606A1 (en) * 2008-01-10 2009-07-16 American Express Travel Related Services Company, Inc. System and Method for Facilitating Strategic Contract Audit, Resolution and Recovery
CN109344382A (zh) * 2018-10-23 2019-02-15 出门问问信息科技有限公司 审核合同的方法、装置、电子设备及计算机可读存储介质
CN109829692A (zh) * 2019-01-17 2019-05-31 深圳壹账通智能科技有限公司 基于人工智能的合同审理方法、装置、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090182606A1 (en) * 2008-01-10 2009-07-16 American Express Travel Related Services Company, Inc. System and Method for Facilitating Strategic Contract Audit, Resolution and Recovery
CN109344382A (zh) * 2018-10-23 2019-02-15 出门问问信息科技有限公司 审核合同的方法、装置、电子设备及计算机可读存储介质
CN109829692A (zh) * 2019-01-17 2019-05-31 深圳壹账通智能科技有限公司 基于人工智能的合同审理方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
许丕藤: "对"工程转包"审计的一些思考", Retrieved from the Internet <URL:https://www.audit.gov.cn/n6/n41/c20006/content.html> *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113778424A (zh) * 2021-09-27 2021-12-10 常州市公共资源交易中心 评审配置方法、装置和存储介质

Similar Documents

Publication Publication Date Title
AU2017280904B2 (en) Automation of image validation
CN111553137B (zh) 报告生成方法、装置、存储介质及计算机设备
CN110992167A (zh) 银行客户业务意图识别方法及装置
CN109542956A (zh) 报表生成方法、装置、计算机设备和存储介质
CN112949963A (zh) 员工服务质量的评估方法、装置、存储介质和智能设备
CN112650864A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN112148603A (zh) 小程序风险识别方法及装置
CN111553597A (zh) 一种对企业进行财务舞弊风险识别的方法及装置
CN109992614B (zh) 数据获取方法、装置和服务器
CN109711984B (zh) 一种基于催收的贷前风险监控方法及装置
CN115618120B (zh) 一种公众号信息推送方法、系统、终端设备及存储介质
CN116993484A (zh) 一种信用模型生成方法、装置、电子设备及存储介质
CN110858214B (zh) 推荐模型训练、及进一步审计程序推荐方法、装置及设备
CN114398562B (zh) 一种店铺数据管理方法、装置、设备及存储介质
CN111275071A (zh) 预测模型训练、预测方法、装置及电子设备
KR102462728B1 (ko) Esg경영 중요 이슈 선정 방법
CN111190986B (zh) 一种地图数据对比方法和装置
CN112581323A (zh) 虚假诉讼的判断方法及装置
CN110956445A (zh) 用于生成风险文件的方法和装置
CN112465509A (zh) 签约合同的预警方法及装置
CN110738498A (zh) 客户风险识别方法及装置
CN113971592B (zh) 一种推广信息发布主体的监管评定方法、系统以及装置
CN111090700B (zh) 数据管理方法、装置和电子设备
CN111783152B (zh) 基于决策树的会计核算防篡改摘要生成方法及系统
CN112581071B (zh) 合同处理方法和装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination