CN113094520B - 一种检查电子合同的方法 - Google Patents
一种检查电子合同的方法 Download PDFInfo
- Publication number
- CN113094520B CN113094520B CN202110336101.6A CN202110336101A CN113094520B CN 113094520 B CN113094520 B CN 113094520B CN 202110336101 A CN202110336101 A CN 202110336101A CN 113094520 B CN113094520 B CN 113094520B
- Authority
- CN
- China
- Prior art keywords
- information
- contract
- checking
- data
- electronic contract
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种检查电子合同的方法,涉及软件开发和软件测试领域,本发明包括以下步骤:步骤1:依据所有合同模板进行信息库建立并建立核对规则;步骤2:设定特定合同核对规则;步骤3:通过OCR识别技术将电子合同的图片数据转变成为文本数据,转换后的文本数据再同源数据进行比对。本发明的有益效果在于:本发明依据合同模板,将所有类型的合同,需要反写的数据进行归纳整理形成反写信息库,针对每一类信息,编写能够在合同文本中进行匹配抽取该信息的正则表达式。从而只需要归纳整理,后续对所有类型的合同都可以复用该反写信息库,快速实现对电子合同文本中的反写信息进行抽取。
Description
技术领域
本发明涉及软件开发和软件测试领域,尤其是一种检查电子合同的方法。
背景技术
由于电子合同是通过业务系统程序控制自动生成,可能会存在业务需求和程序编写不一致的情况发生,为了保证系统生成的电子合同是符合业务需求,且数据正确,需要对电子合同进行单独复核。当前的方案是人工抽查部分正式生成的电子合同文本,与合同模板文件的文字描述进行比对,检查文字描述是否正确;对于合同模板中标注的需要反写的数据,复核人员通过人工将电子合同的数据,同业务数据进行手动核对,确认数据的正确性。该方案存在检查速度慢,不能全面及时进行检查的问题,以及业务数据真实性的复核完全依靠人工检查,存在人为差错的情况。
相关技术术语介绍:
电子合同:又称电子商务合同,根据联合国国际贸易法委员会《电子商务示范法》以及世界各国颁布的电子交易法,同时结合我国《合同法》的有关规定,电子合同可以界定为:电子合同是双方或多方当事人之间通过电子信息网络以电子的形式达成的设立、变更、终止财产性民事权利义务关系的协议。
合同模板文件:指作为模板的合同文本,里面包含了固定不变的合同内容文字描述及需要反写的标识,反写的标识在生成正式合同的时候,通过将真实的业务数据反写到模板文件里,最终生成一个真实的具有法律效力的电子合同。
OCR(Optical Character Recognition,光学字符识别):指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
正则表达式:又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
发明内容
针对上述现有技术中存在的不足,本发明的目的在于提供一种检查电子合同的方法,解决现有技术准确率低且效率低的问题。
为解决上述问题,本发明公开了一种检查电子合同的方法,包括以下步骤:步骤1:依据所有合同模板进行信息库建立并建立核对规则;步骤2:设定特定合同核对规则;步骤3:通过OCR识别技术将电子合同的图片数据转变成为文本数据,转换后的文本数据再同源数据进行比对。
作为优先,步骤1具体包括以下步骤:
1.1根据合同模板所有可能的反写内容进行归纳整理形成反写信息库,并对信息库里的每一类信息取名,综合每类信息的各种特征、数据类型及信息的上下文,针对每一类信息,编写能够在合同文本中进行匹配抽取该信息的正则表达式,后续通过对电子合同文本进行模式匹配,抽取出制定的反写信息;
1.2根据每一类反写信息确定其数据类型,并对每一类数据类型设定判断规则。
作为优选:步骤2具体包括以下步骤:
2.1根据特定合同模板,确定需要核对的固定格式文本;
2.2根据特定合同模板的反写部分,确定特定合同需要核对的反写信息并确认反写信息的数据类型;
2.3根据特定合同模板的反写信息,并同业务设计文档及程序设计文档核对,确定该反写信息的源数据在业务系统数据库的存储位置及存储方式,及最终生产信息反写到电子合同的计算转换方式,然后依据存储位置、存储方式、计算转换方式及业务设计文档,再编写一套独立于业务系统设计的反写数据生成方法,作为同电子合同文本内容进行核对基准;
2.4依据特定合同模板需要比对的信息及数据类型,按照步骤1.2设计的检核规则及步骤2.3实现的核对基准,确定电子合同核对规则。
作为优选:步骤3具体包括以下步骤:
3.1对电子合同进行OCR识别,将电子合同的图片数据转化为文本数据;
3.2根据模板合同的反写部分,使用步骤1.1设计的正则表达式规则从步骤3.1识别出来的文本数据里抽取出电子合同的反写信息内容;
3.3根据步骤2.3的生成的核对基准与步骤3.2获得的电子合同反写信息及步骤2.4设定的电子合同检核规则进行比对,从而发现电子合同内容存在与核对基准不一致的地方,从而实现通过程序手动,自动执行合同比对。
作为优选:所述步骤1.1中对信息库里的每一类信息取名如下:身份证信息、电话号码信息、邮箱信息、借款金额信息、利率信息、借款人信息、贷款人信息。
作为优选:所述步骤1.2中设定判断规则如下:对文本类型设定完全等于、包含、不等于检核规则;对数字类型设定等于、大于、小于检核规则;对日期类型设置大于、小于、等于检核规则。
本发明的有益效果如下:
本发明依据合同模板,将所有类型的合同,需要反写的数据进行归纳整理形成反写信息库,针对每一类信息,编写能够在合同文本中进行匹配抽取该信息的正则表达式。从而只需要归纳整理,后续对所有类型的合同都可以复用该反写信息库,快速实现对电子合同文本中的反写信息进行抽取。本发明提出了根据合同模板反写信息的每一类信息,确定其数据类型,并对每一类数据类型,设定判断规则的方法,从而可以快速实现对每一类反写信息进行核对,极大提升了准确率和工作效率。
附图说明
图1是本发明的实施例示意图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
如图1,为解决上述问题,本发明公开了一种检查电子合同的方法,包括:
步骤1:依据所有合同模板进行信息库建立并建立核对规则:
1.1根据合同模板所有可能的反写内容进行归纳整理形成反写信息库,并对信息库里的每一类信息取名(如:身份证信息、电话号码信息、邮箱信息、借款金额信息、利率信息、借款人信息、贷款人信息等),综合每类信息的各种特征、数据类型及信息的上下文,针对每一类信息,编写能够在合同文本中进行匹配抽取该信息的正则表达式等各种匹配方式,后续通过对对电子合同文本进行模式匹配,抽取出制定的反写信息;
1.2根据每一类反写信息,确定其数据类型如数字类型,百分制类型,文本类型,日期规则等,并对每一类数据类型,设定判断规则:如对文本类型设定完全等于、包含、不等于检核规则;对数字类型设定等于、大于、小于等检核规则;对日期类型设置大于、小于、等于检核规则。
步骤2:特定合同检核规则设定。
2.1根据特定合同模板,确定需要核对的固定格式文本;
2.2根据特定合同模板的反写部分,确定特定合同需要核对的反写信息并确认反写信息的数据类型;
2.3根据特定合同模板的反写信息,并同业务设计文档及程序设计文档核对,确定该反写信息的源数据在业务系统数据库的存储位置及存储方式,及最终生产信息反写到电子合同的计算转换方式,然后依据存储位置、存储方式、计算转换方式及业务设计文档,再编写一套独立于业务系统设计的反写数据生成方法,作为同电子合同文本内容进行核对基准;
2.4依据特定合同模板需要比对的信息及数据类型,按照步骤1.2设计的检核规则,及步骤2.3实现的核对基准,确定电子合同检核规则。
步骤3:电子合同比对。
本步骤包括如下步骤:
3.1对电子合同进行OCR识别,将合同的图片数据转化为文本数据;
3.2根据模板合同的反写部分,使用步骤1.1设计的正则表达式规则从步骤3.1识别出来的文本里抽取出电子合同的反写信息内容;
3.3根据步骤2.3的生成的核对基准与步骤3.2获得的电子合同反写信息及步骤2.4设定的电子合同检核规则进行比对,从而发现电子合同内容存在与核对基准不一致的地方,从而实现通过程序手动,自动执行合同比对。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (3)
1.一种检查电子合同的方法,其特征在于,包括以下步骤:
步骤1:依据所有合同模板进行信息库建立并建立核对规则;
步骤2:设定特定合同核对规则;
步骤3:通过OCR识别技术将电子合同的图片数据转变成为文本数据,转换后的文本数据再同源数据进行比对;
步骤1具体包括以下步骤:
1.1 根据合同模板所有可能的反写内容进行归纳整理形成反写信息库,并对信息库里的每一类信息取名,综合每类信息的各种特征、数据类型及信息的上下文,针对每一类信息,编写能够在合同文本中进行匹配抽取该信息的正则表达式,后续通过对电子合同文本进行模式匹配,抽取出制定的反写信息;
1.2 根据每一类反写信息确定其数据类型,并对每一类数据类型设定判断规则;
步骤2具体包括以下步骤:
2.1根据特定合同模板,确定需要核对的固定格式文本;
2.2根据特定合同模板的反写部分,确定特定合同需要核对的反写信息并确认反写信息的数据类型;
2.3根据特定合同模板的反写信息,并同业务设计文档及程序设计文档核对,确定该反写信息的源数据在业务系统数据库的存储位置及存储方式,及最终生产信息反写到电子合同的计算转换方式,然后依据存储位置、存储方式、计算转换方式及业务设计文档,再编写一套独立于业务系统设计的反写数据生成方法,作为同电子合同文本内容进行核对基准;
2.4 依据特定合同模板需要比对的信息及数据类型,按照步骤1.2设计的检核规则及步骤2.3实现的核对基准,确定电子合同核对规则;
步骤3具体包括以下步骤:
3.1 对电子合同进行OCR识别,将电子合同的图片数据转化为文本数据;
3.2 根据模板合同的反写部分,使用步骤1.1设计的正则表达式规则从步骤3.1识别出来的文本数据里抽取出电子合同的反写信息内容;
3.3 根据步骤2.3的生成的核对基准与步骤3.2获得的电子合同反写信息及步骤2.4设定的电子合同检核规则进行比对,从而发现电子合同内容存在与核对基准不一致的地方,从而实现通过程序手动,自动执行合同比对。
2.根据权利要求1所述的一种检查电子合同的方法,其特征在于:所述步骤1.1中对信息库里的每一类信息取名如下:身份证信息、电话号码信息、邮箱信息、借款金额信息、利率信息、借款人信息、贷款人信息。
3.根据权利要求1所述的一种检查电子合同的方法,其特征在于:所述步骤1.2中设定判断规则如下:对文本类型设定完全等于、包含、不等于检核规则;对数字类型设定等于、大于、小于检核规则;对日期类型设置大于、小于、等于检核规则。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110336101.6A CN113094520B (zh) | 2021-03-29 | 2021-03-29 | 一种检查电子合同的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110336101.6A CN113094520B (zh) | 2021-03-29 | 2021-03-29 | 一种检查电子合同的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113094520A CN113094520A (zh) | 2021-07-09 |
CN113094520B true CN113094520B (zh) | 2023-05-12 |
Family
ID=76670649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110336101.6A Active CN113094520B (zh) | 2021-03-29 | 2021-03-29 | 一种检查电子合同的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113094520B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109800404A (zh) * | 2019-01-03 | 2019-05-24 | 深圳壹账通智能科技有限公司 | 电子合同模板生成方法、装置、计算机设备和存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855304B (zh) * | 2012-08-20 | 2015-04-15 | 清华大学 | 用于b2c交易中的可变条款电子合同自动生成方法 |
CN103679315A (zh) * | 2012-09-21 | 2014-03-26 | 金蝶软件(中国)有限公司 | 基于业务流程的单据反写的方法和装置 |
CN103699693B (zh) * | 2014-01-10 | 2015-08-19 | 中国南方电网有限责任公司 | 一种基于元数据的数据质量管理方法及系统 |
CN109033058B (zh) * | 2018-08-14 | 2023-06-09 | 深圳壹账通智能科技有限公司 | 合同文本验证方法、装置、计算机设备和存储介质 |
CN109543516A (zh) * | 2018-10-16 | 2019-03-29 | 深圳壹账通智能科技有限公司 | 签约意向判断方法、装置、计算机设备和存储介质 |
CN109816327B (zh) * | 2018-12-14 | 2024-05-14 | 平安国际融资租赁有限公司 | 合同数据处理方法、装置、计算机设备和存储介质 |
CN110222692A (zh) * | 2019-05-21 | 2019-09-10 | 深圳壹账通智能科技有限公司 | 一种合同校验方法及相关设备 |
CN111753090A (zh) * | 2020-06-30 | 2020-10-09 | 北京来也网络科技有限公司 | 基于rpa及ai的文档审核方法、装置、设备及介质 |
-
2021
- 2021-03-29 CN CN202110336101.6A patent/CN113094520B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109800404A (zh) * | 2019-01-03 | 2019-05-24 | 深圳壹账通智能科技有限公司 | 电子合同模板生成方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113094520A (zh) | 2021-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107608958B (zh) | 基于条款统一建模的合同文本风险信息挖掘方法和系统 | |
CN108960223B (zh) | 基于票据智能识别自动生成凭证的方法 | |
US5251273A (en) | Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms | |
CN111753717B (zh) | 用于提取文本的结构化信息的方法、装置、设备及介质 | |
CN111652232A (zh) | 票据识别方法及装置、电子设备和计算机可读存储介质 | |
CN109271951A (zh) | 一种提升记账审核效率的方法及系统 | |
CN105825214A (zh) | 一种基于tesseract引擎的文字识别方法及装置 | |
CN109886076B (zh) | 发票存储方法 | |
CN112464927B (zh) | 一种信息提取方法、装置及系统 | |
CN115116068B (zh) | 一种基于ocr的档案智能归档系统 | |
CN107203500A (zh) | 基于递归替换展开回溯的excel公式面向对象语言的自动转换方法 | |
CN112949455A (zh) | 一种增值税发票识别系统及方法 | |
CN111539414B (zh) | 一种ocr图像字符识别和字符校正的方法及系统 | |
CN112749649A (zh) | 一种智能识别并生成电子合同的方法及系统 | |
CN112668580A (zh) | 一种文本识别方法、文本识别装置及终端设备 | |
CN114445836A (zh) | 结合rpa和ai的信息审核方法、装置及电子设备 | |
CN114612905A (zh) | 基于rpa和ai的发票处理方法、装置、设备和介质 | |
CN112560855B (zh) | 图像信息提取方法、装置、电子设备及存储介质 | |
CN110688998A (zh) | 票据识别方法及装置 | |
CN113094520B (zh) | 一种检查电子合同的方法 | |
CN113902402A (zh) | 基于ar技术的单据辅助填写方法、系统、存储介质及装置 | |
CN117807967A (zh) | 一种基于ocr智能填单的财务报账方法、装置及电子设备 | |
CN117274969A (zh) | 一种印章识别方法、装置、设备及介质 | |
CN111046864A (zh) | 一种合同扫描件五要素自动提取方法及系统 | |
CN106170798A (zh) | 用于上下文相关的工作流的智能光学输入/输出(i/o)扩展 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |