CN116757886B - 数据分析方法及分析装置 - Google Patents
数据分析方法及分析装置 Download PDFInfo
- Publication number
- CN116757886B CN116757886B CN202311030547.1A CN202311030547A CN116757886B CN 116757886 B CN116757886 B CN 116757886B CN 202311030547 A CN202311030547 A CN 202311030547A CN 116757886 B CN116757886 B CN 116757886B
- Authority
- CN
- China
- Prior art keywords
- input
- seal
- words
- information
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 63
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000007405 data analysis Methods 0.000 title claims abstract description 13
- 238000000605 extraction Methods 0.000 claims abstract description 102
- 238000013479 data entry Methods 0.000 claims abstract description 26
- 238000010586 diagram Methods 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 9
- 230000002159 abnormal effect Effects 0.000 claims description 7
- 238000012544 monitoring process Methods 0.000 claims description 3
- 239000000758 substrate Substances 0.000 claims 2
- 239000000523 sample Substances 0.000 claims 1
- 239000000284 extract Substances 0.000 description 6
- 238000012550 audit Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/904—Browsing; Visualisation therefor
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Technology Law (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提供一种数据分析方法及分析装置,获取待分析列表内目标合同的合同类型,根据合同类型调取相应的数据录入表,提取数据录入表的待录入维度信息,以及待录入维度信息的维度属性,维度属性包括内容属性和签订属性;根据文字提取策略和具有内容属性的待录入维度信息,获取目标合同中对应的内容录入信息,根据签订提取策略和具有签订属性的待录入维度信息,获取目标合同中对应的签订录入信息,将内容录入信息和签订录入信息填充至数据录入表中;获取数据录入表的待录入维度信息的维度数量,以及待录入维度信息的维度展示结果,根据维度数量转换得到位于编号展示区周围的维度展示区,基于维度展示结果对维度展示区进行处理,得到分析展示图。
Description
技术领域
本发明涉及数据分析技术,尤其涉及一种数据分析方法及分析装置。
背景技术
目前,企业和个人用户通常会使用签订合同的方式来缔结契约关系,从而通过合同来保障自身的合法权益。
现有技术中,合同在签订完后,通常会采用人工的方式对其进行审核,然而,由于合同文件的类型有很多,通过这种方式对合同文件进行审核可能会出现问题,从而导致在事后对合同文件进行追溯时可能已经为时过晚。
因此,如何结合合同类型对合同文件进行多维度的自动化分析审核,并对审核结果进行直观展示成为了急需解决的问题。
发明内容
本发明实施例提供一种数据分析方法及分析装置,可以结合合同类型对合同文件进行多维度的自动化分析审核,并对审核结果进行直观展示成为了急需解决的问题。
本发明实施例的第一方面,提供一种数据分析方法,包括:
接收用户端输入的分析请求,响应所述分析请求调用分析单元生成相应的请求编号,基于目标合同的上传属性对所述请求编号进行分类,得到待签订列表和待分析列表;
获取所述待分析列表内目标合同的合同类型,根据所述合同类型调取相应的数据录入表,不同所述合同类型预先配置有不同所述数据录入表,提取所述数据录入表的待录入维度信息,以及所述待录入维度信息的维度属性,所述维度属性包括内容属性和签订属性;
根据文字提取策略和具有内容属性的待录入维度信息,获取所述目标合同中对应的内容录入信息,根据签订提取策略和具有签订属性的待录入维度信息,获取所述目标合同中对应的签订录入信息,将所述内容录入信息和签订录入信息填充至所述数据录入表中;
获取所述数据录入表的待录入维度信息的维度数量,以及所述待录入维度信息的维度展示结果,根据所述维度数量转换得到位于编号展示区周围的维度展示区,基于所述维度展示结果对所述维度展示区进行处理,得到分析展示图。
可选地,在第一方面的一种可能实现方式中,接收用户端输入的分析请求,响应所述分析请求调用分析单元生成相应的请求编号,基于目标合同的上传属性对所述请求编号进行分类,得到待签订列表和待分析列表,包括:
接收用户端输入的分析请求,响应所述分析请求调用分析单元生成相应的请求编号,所述请求编号与目标合同一一对应,根据所述请求编号生成待签订列表;
实时监测所述请求编号对应的目标合同的上传属性,若所述上传属性为已上传,将所述请求编号由待签订列表移动至待分析列表内。
可选地,在第一方面的一种可能实现方式中,根据文字提取策略和具有内容属性的待录入维度信息,获取所述目标合同中对应的内容录入信息,将所述内容录入信息填充至所述数据录入表中,包括:
对具有内容属性的待录入维度信息进行解析得到多个待录入词,对所述目标合同中的文字进行遍历,获取所述目标合同中所述待录入词所在的行作为目标行;
统计所述目标行的目标行字数,若所述目标行字数小于预设字数,则获取所述目标行中位于所述待录入词之后的文字作为内容录入词,将所述内容录入词填充至所述数据录入表中相应待录入词对应的信息录入区域内;
若所述目标行字数等于所述预设字数,则获取所述目标行的下一行作为关联行,提取所述关联行中的文字,若所述关联行中存在与其他所述待录入词相应的文字组,则删除所述关联行,获取所述目标行中位于所述待录入词之后的文字作为内容录入词;
若所述关联行中不存在与其他所述待录入词相应的文字组,则获取所述目标行中位于所述待录入词之后的文字,以及所述关联行中的文字作为内容录入词,将所述内容录入词填充至所述数据录入表中相应待录入词对应的信息录入区域内。
可选地,在第一方面的一种可能实现方式中,根据签订提取策略和具有签订属性的待录入维度信息,获取所述目标合同中对应的签订录入信息,将所述签订录入信息填充至所述数据录入表中,包括:
对具有签订属性的待录入维度信息进行解析得到印章核对词和印章定位词,对所述目标合同中的文字进行遍历,获取所述目标合同中与所述印章定位词一样的文字生成所述印章定位词对应的定位文字集合;
获取所述定位文字集合的定位中心点,调取印章提取框,基于所述定位中心点对所述印章提取框进行定位,将所述印章提取框放置于所述目标合同中,基于所述印章提取框对所述目标合同中的印章图像进行提取;
对所述印章图像进行文字提取得到印章文字集合,根据所述印章文字集合得到所述印章定位词对应的印章词,获取所述印章核对词对应的预设印章词,若所述印章词和所述预设印章词一致,则将所述印章词填充至所述数据录入表中所述印章核对词对应的信息录入区域内。
可选地,在第一方面的一种可能实现方式中,获取所述定位文字集合的定位中心点,调取印章提取框,基于所述定位中心点对所述印章提取框进行定位,将所述印章提取框放置于所述目标合同中,基于所述印章提取框对所述目标合同中的印章图像进行提取,包括:
获取所述定位文字集合对应的多个文字坐标,以及多个所述文字坐标中的最大x坐标值、最小x坐标值、最大y坐标值和最小y坐标值,根据所述最大x坐标值和所述最小x坐标值的差值的中间值得到x中间坐标值,根据所述最大y坐标值和所述最小y坐标值的差值的中间值得到y中间坐标值;
根据所述x中间坐标值和所述y中间坐标值得到所述定位文字集合对应的定位中心点;
调取印章提取框,获取所述印章提取框的提取中心点,基于所述定位中心点对所述提取中心点进行定位,将所述印章提取框放置于所述目标合同中;
获取所述目标合同中所述印章提取框圈定的区域作为待处理区域,根据提取策略对所述待处理区域中的印章图像进行提取。
可选地,在第一方面的一种可能实现方式中,获取所述目标合同中所述印章提取框圈定的区域作为待处理区域,根据提取策略对所述待处理区域中的印章图像进行提取,包括:
获取所述待处理区域内像素值不在预设的像素值区间内的像素点作为干扰像素点,基于预设的替换像素点对所述干扰像素点进行替换得到替换区域;
获取所述替换区域内像素值在所述像素值区间的像素点作为印章像素点,以及相邻所述印章像素点组成的印章像素点集合,提取所述印章像素点集合对应的印章图像。
可选地,在第一方面的一种可能实现方式中,还包括:
获取所述印章图像最外侧的印章轮廓,若所述印章轮廓与预设印章轮廓不一致,则生成移动信息,所述预设印章轮廓为圆形轮廓;
响应所述移动信息,任取所述印章轮廓上两个轮廓点作为切线点,生成所述印章轮廓上与各所述切线点对应的切线,基于各所述切线生成与各所述切线垂直的直径线;
获取两条所述直径线的交点作为移动点,控制所述印章提取框移动至所述移动点对应的位置处。
可选地,在第一方面的一种可能实现方式中,获取所述数据录入表的待录入维度信息的维度数量,以及所述待录入维度信息的维度展示结果,根据所述维度数量转换得到位于编号展示区周围的维度展示区,基于所述维度展示结果对所述维度展示区进行处理,得到分析展示图,包括:
根据所述维度数量生成形状为多边形的编号展示区,并获取所述目标合同对应的请求编号展示在所述中心展示区内;
对所述维度展示结果进行解析得到多个维度展示信息,所述维度展示信息包括所述待录入词对应的内容录入信息,以及所述印章核对词对应的签订录入信息,将各所述维度展示信息填充至各所述维度展示区内,得到分析展示图。
可选地,在第一方面的一种可能实现方式中,还包括:
若所述数据对应表中不存在所述待录入词对应的内容录入信息,和/或不存在所述印章核对词对应的签订录入信息,则获取相应所述内容录入信息和/或所述签订录入信息对应的维度展示区作为空白展示区;
根据预设像素值对所述空白展示区的像素值进行替换,并将所述空白展示区对应的所述内容录入信息和/或所述签订录入信息作为异常录入信息发送至管理端。
本发明实施例的第二方面,提供一种数据分析装置,包括:
编号模块,用于接收用户端输入的分析请求,响应所述分析请求调用分析单元生成相应的请求编号,基于目标合同的上传属性对所述请求编号进行分类,得到待签订列表和待分析列表;
属性模块,用于获取所述待分析列表内目标合同的合同类型,根据所述合同类型调取相应的数据录入表,不同所述合同类型预先配置有不同所述数据录入表,提取所述数据录入表的待录入维度信息,以及所述待录入维度信息的维度属性,所述维度属性包括内容属性和签订属性;
录入模块,用于根据文字提取策略和具有内容属性的待录入维度信息,获取所述目标合同中对应的内容录入信息,根据签订提取策略和具有签订属性的待录入维度信息,获取所述目标合同中对应的签订录入信息,将所述内容录入信息和签订录入信息填充至所述数据录入表中;
展示模块,用于获取所述数据录入表的待录入维度信息的维度数量,以及所述待录入维度信息的维度展示结果,根据所述维度数量转换得到位于编号展示区周围的维度展示区,基于所述维度展示结果对所述维度展示区进行处理,得到分析展示图。
本发明的有益效果如下:
1、本发明可以结合合同类型对合同文件进行多维度的自动化分析审核,并对审核结果进行直观展示成为了急需解决的问题。本发明在对合同中的审核结果进行直观地展示的时候,会首先对合同中多个维度的数据进行提取,然后再通过分析展示图对合同中提取到的维度数据进行展示,这样可以通过展示图的方式对合同中的维度数据进行直观地展示,并且在提取合同的维度数据时,本发明会依据维度数据的不同属性为其配置不同的信息提取方式,这样可以提高提取维度数据时的准确性和效率。
2、当合同中维度数据的属性为内容属性时,本发明会通过文字提取策略快速找到合同中与待录入词相应的文字,然后再对相应待录入词后的文字信息进行提取得到内容录入信息,从而可以提高寻找内容维度数据时的效率。当合同中的维度数据的属性为签订属性时,本发明会通过签订提取策略对合同中的印章图像进行提取,然后再对印章图像中的印章词进行提取,当判断印章词和印章核对词对应的预设印章词一样时,将相应的印章词作为印章核对词对应的签订录入信息,这样可以提高提取签订录入信息时的准确性,并且在提取合同中的印章图像时,本发明会先通过印章定位词对印章提取框进行定位,然后再对印章提取框圈定的区域中的印章图像进行提取,这样可以快速找到印章图像所在的区域,提高提取印章图像时的效率,当提取到的印章图像不完整时,本发明还会对印章提取框的位置进行移动调整,使得印章提取框圈定的区域可以覆盖住完整的印章图像,提高提取印章图像时的准确性。
3、本发明在生成分析展示图时,会依据维度数量生成多个维度展示区和编号展示区,通过维度展示区来展示数据录入表中多个维度的录入数据,通过编号展示区来展示合同对应的编号,从而可以将分析展示图和相应的合同进行对应,并且通过分析展示图直观地对合同中多个维度的数据进行展示,使用户可以快速了解到合同的审核信息。此外,当存在有的内容录入信息和/或签订录入信息没有被录入时,本发明还会将相应的内容录入信息和/或签订录入信息对应的维度展示区进行异常展示,从而将其的展示方式与其他的维度展示区的展示方式区分开来,使用户可以快速发现录入异常的审核数据,从而对异常数据做出相应的处理。
附图说明
图1为本发明实施例提供的一种分析展示图的示意图;
图2为本发明实施例提供的一种数据分析装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的执行主体可以包括但不限于以下中的至少一个:用户设备、网络设备等。其中,用户设备可以包括但不限于计算机、智能手机、个人数字助理(Personal DigitalAssistant,简称:PDA)及上述提及的电子设备等。网络设备可以包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机组成的一个超级虚拟计算机。本实施例对此不做限制。包括步骤S1至步骤S4,具体如下:
S1,接收用户端输入的分析请求,响应所述分析请求调用分析单元生成相应的请求编号,基于目标合同的上传属性对所述请求编号进行分类,得到待签订列表和待分析列表。
可以理解的是,本方案会对目标合同中多个维度的审核信息进行提取,然后再通过展示图的方式对合同中多个维度的审核信息进行展示。然而,在实际应用中,有些合同可能已经签订了,而有些合同可能还没有签订,对于没有签订的合同来讲,没有对应的文件可以进行审核。
因此在提取目标合同中多个维度的信息之前,本方案会将完成签订的目标合同和未完成签订的目标合同区分开,具体的,本方案会为各个合同匹配与其对应的请求编号,然后依据合同的的上传属性对请求编号进行分类,得到待签订列表和待分析列表,依据待签订列表和待分析列表对没有完成签订的合同和完成签订的合同分别进行储存,然后再在后续对待分析列表中的目标合同进行信息提取。
在上述实施例的基础上步骤S1的具体实现方式可以是:
S11,接收用户端输入的分析请求,响应所述分析请求调用分析单元生成相应的请求编号,所述请求编号与目标合同一一对应,根据所述请求编号生成待签订列表。
在实际应用中,当服务器接收到用户输入的分析请求后,合同分析单元可以生成相应的请求编号,请求编号可以依据各个目标合同的请求顺序依次生成。
在为目标合同配置好与其对应的请求编号后,由于此时目标合同可能还没有完成签订,因此可以依据请求编号生成待签订列表,从而表明与请求编号对应的目标合同还没有完成签订。
S12,实时监测所述请求编号对应的目标合同的上传属性,若所述上传属性为已上传,将所述请求编号由待签订列表移动至待分析列表内。
如果目标合同的上传属性为已上传,说明目标合同已经完成了签订,因此可以将目标合同对应的请求编号移动至待分析列表中,然后依据待分析列表对相应的目标合同进行后续的信息分析。
通过上述方式,可以将完成签订的合同和未完成签订的合同区分开,从而可以对完成签订的合同文件进行数据审核。
S2,获取所述待分析列表内目标合同的合同类型,根据所述合同类型调取相应的数据录入表,不同所述合同类型预先配置有不同所述数据录入表,提取所述数据录入表的待录入维度信息,以及所述待录入维度信息的维度属性,所述维度属性包括内容属性和签订属性。
在实际应用中,合同有很多种类型,例如租赁合同、借贷合同等等合同类型,每种合同类型对应的录入数据可能会各不相同。因此,为了提取出不同合同类型所对应的录入数据,可以事先为各个合同类型设置与其对应的数据录入表,然后再通过该数据录入表对目标合同中多个维度的录入数据进行提取,从而可以依据这些数据生成展示图对目标合同的数据信息进行展示。
可以理解的是,合同一般会包括内容信息和签订信息,而本方案中的签订信息是指图案签订信息,例如是公司签章信息,值得一提的是,针对于人为签字的签订信息,本方案不适用。因此在对内容信息和签订信息进行提取时本方案分别采用了不同的提取方式,所以需要获取到待录入维度信息的维度属性,然后依据该维度属性进行不同方式的数据提取。
S3,根据文字提取策略和具有内容属性的待录入维度信息,获取所述目标合同中对应的内容录入信息,根据签订提取策略和具有签订属性的待录入维度信息,获取所述目标合同中对应的签订录入信息,将所述内容录入信息和签订录入信息填充至所述数据录入表中。
具体的,在上述实施例的基础上步骤S3中的“根据文字提取策略和具有内容属性的待录入维度信息,获取所述目标合同中对应的内容录入信息,将所述内容录入信息填充至所述数据录入表中”的具体实现方式可以是:
S31,对具有内容属性的待录入维度信息进行解析得到多个待录入词,对所述目标合同中的文字进行遍历,获取所述目标合同中所述待录入词所在的行作为目标行。
其中,待录入词可以由工作人员依据实际需求实现进行设置,例如,待录入词可以是当事人的名称、联系电话、统一社会信用代码、地址等表示合同内容的信息词。在实际应用中,在对目标合同中的文字进行遍历时,可以采用现有技术中的文字识别技术对目标合同中的文字进行识别,例如可以采用OCR技术对目标合同中的文字进行识别,此处为现有技术,本方案在此不做赘述。
S32,统计所述目标行的目标行字数,若所述目标行字数小于预设字数,则获取所述目标行中位于所述待录入词之后的文字作为内容录入词,将所述内容录入词填充至所述数据录入表中相应待录入词对应的信息录入区域内。
在实际应用中,预设字数可以和目标行顶格时的整行字数一样。可以理解的是,录入的信息和待录入词通常情况下会处在同一行,如果目标行字数小于预设字数,说明目标行中提取的文字是没有占满整行的,其可能不会出现因字数太多而占据两行的情况,因此可以将位于待录入词之后的文字作为内容录入词填到数据录入表中。
S33,若所述目标行字数等于所述预设字数,则获取所述目标行的下一行作为关联行,提取所述关联行中的文字,若所述关联行中存在与其他所述待录入词相应的文字组,则删除所述关联行,获取所述目标行中位于所述待录入词之后的文字作为内容录入词。
如果目标行字数等于预设字数,说明目标行的文字是占满整行的,这种情况下可能会出现内容录入词由于字数太多而占据两行的情况,因此可以将目标行的下一行作为关联行,如果关联行中存在与其他待录入词一样的文字组,说明关联行中的信息可能是其他待录入词对应的录入信息,这种情况下需要将关联行删除,然后将目标行中位于待录入词之后的文字作为内容录入词填入数据录入表中。
S34,若所述关联行中不存在与其他所述待录入词相应的文字组,则获取所述目标行中位于所述待录入词之后的文字,以及所述关联行中的文字作为内容录入词,将所述内容录入词填充至所述数据录入表中相应待录入词对应的信息录入区域内。
如果关联行中不存在与其他待录入词一样的文字组,说明关联行中的文字可能与目标行中的文字是衔接的,因此可以将目标行和关联行中的文字作为内容录入词填到数据录入表中。
通过上述方式,可以通过文字提取的方式快速得到目标合同中的内容录入信息,提高信息搜索时的效率。
在上述实施例中,可能会存在一个待录入词对应多个无用文字的情况出现,此时,可以人为主动介入进行剔除修改,得到最后的内容录入词。在另一些实施例中,如果多个待录入词位于同一行,也可以相邻待录入词之间的文字作为前一个待录入词的内容录入词,最后一个待录入词的内容录入词的提取方式可以采用上述实施例得到。
在上述实施例的基础上步骤S3中的“根据签订提取策略和具有签订属性的待录入维度信息,获取所述目标合同中对应的签订录入信息,将所述签订录入信息填充至所述数据录入表中”的具体实现方式可以是:
S35,对具有签订属性的待录入维度信息进行解析得到印章核对词和印章定位词,对所述目标合同中的文字进行遍历,获取所述目标合同中与所述印章定位词一样的文字生成所述印章定位词对应的定位文字集合。
在实际应用中,印章核对词可以是甲方和乙方,印章定位词可以是盖章。值得一提的是,本方案中的签订信息是指印章信息,且印章形状为圆形的印章信息。
可以理解的是,在实际应用中,签订时的印章信息一般都会盖印在固定的位置,例如盖章文字的上方,因此在提取印章信息的时候,可以先依据印章定位词对需要进行提取的区域进行定位,再对相应区域内的印章信息进行提取。
S36,获取所述定位文字集合的定位中心点,调取印章提取框,基于所述定位中心点对所述印章提取框进行定位,将所述印章提取框放置于所述目标合同中,基于所述印章提取框对所述目标合同中的印章图像进行提取。
在实际应用中,印章提取框的规格大小可以依据用户想要提取印章区域的大小进行相应的设置,从而可以依据该印章提取框在目标合同中圈定相应的区域进行印章信息的提取。
在一些实施例中,步骤S36包括步骤S361至步骤S364,具体如下:
S361,获取所述定位文字集合对应的多个文字坐标,以及多个所述文字坐标中的最大x坐标值、最小x坐标值、最大y坐标值和最小y坐标值,根据所述最大x坐标值和所述最小x坐标值的差值的中间值得到x中间坐标值,根据所述最大y坐标值和所述最小y坐标值的差值的中间值得到y中间坐标值。
S362,根据所述x中间坐标值和所述y中间坐标值得到所述定位文字集合对应的定位中心点。
可以理解的是,由于印章定位词可能会包含多个文字,因此在依据定位文字集合的中心点对印章提取框进行定位时,可以先得到定位文字集合对应的多个文字坐标,然后再依据文字坐标得到定位中心点。
S363,调取印章提取框,获取所述印章提取框的提取中心点,基于所述定位中心点对所述提取中心点进行定位,将所述印章提取框放置于所述目标合同中。
在实际应用中,印章提取框的形状可以由工作人员依据需求进行相应的设置,例如可以设置成矩形或者圆形。
S364,获取所述目标合同中所述印章提取框圈定的区域作为待处理区域,根据提取策略对所述待处理区域中的印章图像进行提取。
具体的,步骤S364包括步骤S3641至步骤S3642:
S3641,获取所述待处理区域内像素值不在预设的像素值区间内的像素点作为干扰像素点,基于预设的替换像素点对所述干扰像素点进行替换得到替换区域。
可以理解的是,在提取印章图像时,可能会存在很多干扰的像素点对提取的结果造成影响,因此为了提高提取印章图像时的准确性,减少其他像素点的干扰,可以先对待处理区域内的干扰像素点进行剔除,再对待处理区域内的印章图像进行提取,在剔除干扰像素点时,可以通过预先设置的替换像素点对其进行替换。
其中,像素值区间是指与印章图像所对应的像素值区间,可以由工作人员依据印章的像素值进行相应的设置。替换像素点的像素值可以是白色所对应的像素值,也可以是由工作人员依据实际情况预设设置的其他像素值。
S3642,获取所述替换区域内像素值在所述像素值区间的像素点作为印章像素点,以及相邻所述印章像素点组成的印章像素点集合,提取所述印章像素点集合对应的印章图像。
在实际应用中,在提取印章图像时,可以采用现有技术中的图像提取技术对其进行提取,此处为现有技术,本方案在此不做赘述。
此外,在上述方案的技术上,本方案还包括以下实施例:
A1,获取所述印章图像最外侧的印章轮廓,若所述印章轮廓与预设印章轮廓不一致,则生成移动信息,所述预设印章轮廓为圆形轮廓。
可以理解的是,在实际应用中,印章图像的位置可能会发生偏差,从而使得通过印章定位词和印章提取框圈定的待处理区域可能不能覆盖住完整的印章图像,因此为了减少这种情况下所带来的误差,本方案还会对印章提取框的位置进行移动,从而使得依据印章提取框圈定的区域可以覆盖住完整的印章图像,提高图像提取的准确性。
具体的,当判定印章轮廓与预设印章轮廓不一致时,说明待处理区域覆盖的印章图像可能不是完整的印章图像,因此可以生成移动信息,通过移动信息来对印章提取框的位置进行调整。
A2,响应所述移动信息,任取所述印章轮廓上两个轮廓点作为切线点,生成所述印章轮廓上与各所述切线点对应的切线,基于各所述切线生成与各所述切线垂直的直径线。
A3,获取两条所述直径线的交点作为移动点,控制所述印章提取框移动至所述移动点对应的位置处。
在移动印章提取框时,为了使移动后的印章提取框圈定的区域可以覆盖住完整的印章图像,可以将印章提取框移动至印章图像的中心位置处,由于印章图像的最外部轮廓为圆,因此可以通过圆周轮廓得到两条切线,然后再依据切线生成直径,通过直径的交点来得到圆心,即印章图像的中心点,从而可以将圆心作为移动点控制印章提取框移动至移动点所对应的位置处。
通过上述方式,可以通过印章图像的位置对印章提取框进行相应的移动操作,从而可以提高提取印章图像时的准确性。
S37,对所述印章图像进行文字提取得到印章文字集合,根据所述印章文字集合得到所述印章定位词对应的印章词,获取所述印章核对词对应的预设印章词,若所述印章词和所述预设印章词一致,则将所述印章词填充至所述数据录入表中所述印章核对词对应的信息录入区域内。
在得到印章图像后,便可以对印章图像中的文字信息进行提取,可以理解的是,由于印章核对词的不同,印章图像中的文字信息可能也会不同,因此为了判定印章图像与印章核对词之间是否是对应的,可以将预设印章词和提取出来的印章词进行比对,如果两者是一致的,说明印章图像中的文字信息和印章核对词之间是对应的,因此可以将印章词填充至数据录入表中印章核对词对应的信息录入区域内。
通过上述方式,可以快速对合同中的签订信息进行提取,提高信息提取时的效率和准确性。
S4,获取所述数据录入表的待录入维度信息的维度数量,以及所述待录入维度信息的维度展示结果,根据所述维度数量转换得到位于编号展示区周围的维度展示区,基于所述维度展示结果对所述维度展示区进行处理,得到分析展示图。
在对数据录入表中的录入信息进行转化时,本方案会依据维度数量生成多个维度展示区和编号展示区,通过维度展示区来展示数据录入表中多个维度的录入数据,通过编号展示区来展示目标合同对应的编号,从而可以将分析展示图和相应的目标合同进行对应。
在上述实施例的基础上步骤S4的具体实现方式可以是:
S41,根据所述维度数量生成形状为多边形的编号展示区,并获取所述目标合同对应的请求编号展示在所述中心展示区内。
参加图1,为本发明实施例提供的一种分析展示图的示意图。如图1所示,如果维度数量为5,则编号展示区可以是五边形。
S42,对所述维度展示结果进行解析得到多个维度展示信息,所述维度展示信息包括所述待录入词对应的内容录入信息,以及所述印章核对词对应的签订录入信息,将各所述维度展示信息填充至各所述维度展示区内,得到分析展示图。
在实际应用中,每个维度展示区内可以填入一个维度展示信息,从而可以依据各个维度展示区对多个维度的录入信息进行展示。通过维度展示区和编号展示区生成的分析展示图可以直观地对目标合同中多个维度的数据进行展示,使用户可以快速了解到目标合同的审核信息。
此外,在上述方案的基础上,本方案还包括以下实施例:
S43,若所述数据对应表中不存在所述待录入词对应的内容录入信息,和/或不存在所述印章核对词对应的签订录入信息,则获取相应所述内容录入信息和/或所述签订录入信息对应的维度展示区作为空白展示区。
可以理解的是,数据录入表中还可能存在有的内容录入信息和/或签订录入信息没有被录入的情况,在这种情况下,在对相应的内容录入信息和/或签订录入信息进行展示时,可以将其对应的维度展示区作为空白展示区,通过该空白展示区对相应的内容录入信息和/或签订录入信息进行异常展示。
S44,根据预设像素值对所述空白展示区的像素值进行替换,并将所述空白展示区对应的所述内容录入信息和/或所述签订录入信息作为异常录入信息发送至管理端。
在通过空白展示区对相应的内容录入信息和/或签订录入信息进行异常展示时,可以对空白展示区的像素值进行替换,从而将其的展示方式与其他的维度展示区的展示方式区分开来,以此来提醒用户该展示区内的录入数据是异常,从而使得用户在后续可以做出相应的处理。
通过上述方式,可以将出现异常的审核信息对用户进行展示提醒,使用户可以做出相应的处理。
参见图2,是本发明实施例提供的一种数据分析装置的结构示意图,该数据分析装置包括:
编号模块,用于接收用户端输入的分析请求,响应所述分析请求调用分析单元生成相应的请求编号,基于目标合同的上传属性对所述请求编号进行分类,得到待签订列表和待分析列表;
属性模块,用于获取所述待分析列表内目标合同的合同类型,根据所述合同类型调取相应的数据录入表,不同所述合同类型预先配置有不同所述数据录入表,提取所述数据录入表的待录入维度信息,以及所述待录入维度信息的维度属性,所述维度属性包括内容属性和签订属性;
录入模块,用于根据文字提取策略和具有内容属性的待录入维度信息,获取所述目标合同中对应的内容录入信息,根据签订提取策略和具有签订属性的待录入维度信息,获取所述目标合同中对应的签订录入信息,将所述内容录入信息和签订录入信息填充至所述数据录入表中;
展示模块,用于获取所述数据录入表的待录入维度信息的维度数量,以及所述待录入维度信息的维度展示结果,根据所述维度数量转换得到位于编号展示区周围的维度展示区,基于所述维度展示结果对所述维度展示区进行处理,得到分析展示图。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (8)
1.一种数据分析方法,其特征在于,包括:
接收用户端输入的分析请求,响应所述分析请求调用分析单元生成相应的请求编号,基于目标合同的上传属性对所述请求编号进行分类,得到待签订列表和待分析列表;
获取所述待分析列表内目标合同的合同类型,根据所述合同类型调取相应的数据录入表,不同所述合同类型预先配置有不同所述数据录入表,提取所述数据录入表的待录入维度信息,以及所述待录入维度信息的维度属性,所述维度属性包括内容属性和签订属性;
根据文字提取策略和具有内容属性的待录入维度信息,获取所述目标合同中对应的内容录入信息,根据签订提取策略和具有签订属性的待录入维度信息,获取所述目标合同中对应的签订录入信息,将所述内容录入信息和签订录入信息填充至所述数据录入表中;
获取所述数据录入表的待录入维度信息的维度数量,以及所述待录入维度信息的维度展示结果,根据所述维度数量转换得到位于编号展示区周围的维度展示区,基于所述维度展示结果对所述维度展示区进行处理,得到分析展示图;
根据文字提取策略和具有内容属性的待录入维度信息,获取所述目标合同中对应的内容录入信息,将所述内容录入信息填充至所述数据录入表中,包括:
对具有内容属性的待录入维度信息进行解析得到多个待录入词,对所述目标合同中的文字进行遍历,获取所述目标合同中所述待录入词所在的行作为目标行;
统计所述目标行的目标行字数,若所述目标行字数小于预设字数,则获取所述目标行中位于所述待录入词之后的文字作为内容录入词,将所述内容录入词填充至所述数据录入表中相应待录入词对应的信息录入区域内;
若所述目标行字数等于所述预设字数,则获取所述目标行的下一行作为关联行,提取所述关联行中的文字,若所述关联行中存在与其他所述待录入词相应的文字组,则删除所述关联行,获取所述目标行中位于所述待录入词之后的文字作为内容录入词;
若所述关联行中不存在与其他所述待录入词相应的文字组,则获取所述目标行中位于所述待录入词之后的文字,以及所述关联行中的文字作为内容录入词,将所述内容录入词填充至所述数据录入表中相应待录入词对应的信息录入区域内;
根据签订提取策略和具有签订属性的待录入维度信息,获取所述目标合同中对应的签订录入信息,将所述签订录入信息填充至所述数据录入表中,包括:
对具有签订属性的待录入维度信息进行解析得到印章核对词和印章定位词,对所述目标合同中的文字进行遍历,获取所述目标合同中与所述印章定位词一样的文字生成所述印章定位词对应的定位文字集合;
获取所述定位文字集合的定位中心点,调取印章提取框,基于所述定位中心点对所述印章提取框进行定位,将所述印章提取框放置于所述目标合同中,基于所述印章提取框对所述目标合同中的印章图像进行提取;
对所述印章图像进行文字提取得到印章文字集合,根据所述印章文字集合得到所述印章定位词对应的印章词,获取所述印章核对词对应的预设印章词,若所述印章词和所述预设印章词一致,则将所述印章词填充至所述数据录入表中所述印章核对词对应的信息录入区域内。
2.根据权利要求1所述的方法,其特征在于,
接收用户端输入的分析请求,响应所述分析请求调用分析单元生成相应的请求编号,基于目标合同的上传属性对所述请求编号进行分类,得到待签订列表和待分析列表,包括:
接收用户端输入的分析请求,响应所述分析请求调用分析单元生成相应的请求编号,所述请求编号与目标合同一一对应,根据所述请求编号生成待签订列表;
实时监测所述请求编号对应的目标合同的上传属性,若所述上传属性为已上传,将所述请求编号由待签订列表移动至待分析列表内。
3.根据权利要求1所述的方法,其特征在于,
获取所述定位文字集合的定位中心点,调取印章提取框,基于所述定位中心点对所述印章提取框进行定位,将所述印章提取框放置于所述目标合同中,基于所述印章提取框对所述目标合同中的印章图像进行提取,包括:
获取所述定位文字集合对应的多个文字坐标,以及多个所述文字坐标中的最大x坐标值、最小x坐标值、最大y坐标值和最小y坐标值,根据所述最大x坐标值和所述最小x坐标值的差值的中间值得到x中间坐标值,根据所述最大y坐标值和所述最小y坐标值的差值的中间值得到y中间坐标值;
根据所述x中间坐标值和所述y中间坐标值得到所述定位文字集合对应的定位中心点;
调取印章提取框,获取所述印章提取框的提取中心点,基于所述定位中心点对所述提取中心点进行定位,将所述印章提取框放置于所述目标合同中;
获取所述目标合同中所述印章提取框圈定的区域作为待处理区域,根据提取策略对所述待处理区域中的印章图像进行提取。
4.根据权利要求3所述的方法,其特征在于,
获取所述目标合同中所述印章提取框圈定的区域作为待处理区域,根据提取策略对所述待处理区域中的印章图像进行提取,包括:
获取所述待处理区域内像素值不在预设的像素值区间内的像素点作为干扰像素点,基于预设的替换像素点对所述干扰像素点进行替换得到替换区域;
获取所述替换区域内像素值在所述像素值区间的像素点作为印章像素点,以及相邻所述印章像素点组成的印章像素点集合,提取所述印章像素点集合对应的印章图像。
5.根据权利要求4所述的方法,其特征在于,还包括:
获取所述印章图像最外侧的印章轮廓,若所述印章轮廓与预设印章轮廓不一致,则生成移动信息,所述预设印章轮廓为圆形轮廓;
响应所述移动信息,任取所述印章轮廓上两个轮廓点作为切线点,生成所述印章轮廓上与各所述切线点对应的切线,基于各所述切线生成与各所述切线垂直的直径线;
获取两条所述直径线的交点作为移动点,控制所述印章提取框移动至所述移动点对应的位置处。
6.根据权利要求5所述的方法,其特征在于,
获取所述数据录入表的待录入维度信息的维度数量,以及所述待录入维度信息的维度展示结果,根据所述维度数量转换得到位于编号展示区周围的维度展示区,基于所述维度展示结果对所述维度展示区进行处理,得到分析展示图,包括:
根据所述维度数量生成形状为多边形的编号展示区,并获取所述目标合同对应的请求编号展示在所述中心展示区内;
对所述维度展示结果进行解析得到多个维度展示信息,所述维度展示信息包括所述待录入词对应的内容录入信息,以及所述印章核对词对应的签订录入信息,将各所述维度展示信息填充至各所述维度展示区内,得到分析展示图。
7.根据权利要求6所述的方法,其特征在于,还包括:
若所述数据对应表中不存在所述待录入词对应的内容录入信息,和/或不存在所述印章核对词对应的签订录入信息,则获取相应所述内容录入信息和/或所述签订录入信息对应的维度展示区作为空白展示区;
根据预设像素值对所述空白展示区的像素值进行替换,并将所述空白展示区对应的所述内容录入信息和/或所述签订录入信息作为异常录入信息发送至管理端。
8.一种数据分析装置,其特征在于,包括:
编号模块,用于接收用户端输入的分析请求,响应所述分析请求调用分析单元生成相应的请求编号,基于目标合同的上传属性对所述请求编号进行分类,得到待签订列表和待分析列表;
属性模块,用于获取所述待分析列表内目标合同的合同类型,根据所述合同类型调取相应的数据录入表,不同所述合同类型预先配置有不同所述数据录入表,提取所述数据录入表的待录入维度信息,以及所述待录入维度信息的维度属性,所述维度属性包括内容属性和签订属性;
录入模块,用于根据文字提取策略和具有内容属性的待录入维度信息,获取所述目标合同中对应的内容录入信息,根据签订提取策略和具有签订属性的待录入维度信息,获取所述目标合同中对应的签订录入信息,将所述内容录入信息和签订录入信息填充至所述数据录入表中;
展示模块,用于获取所述数据录入表的待录入维度信息的维度数量,以及所述待录入维度信息的维度展示结果,根据所述维度数量转换得到位于编号展示区周围的维度展示区,基于所述维度展示结果对所述维度展示区进行处理,得到分析展示图;
根据文字提取策略和具有内容属性的待录入维度信息,获取所述目标合同中对应的内容录入信息,将所述内容录入信息填充至所述数据录入表中,包括:
对具有内容属性的待录入维度信息进行解析得到多个待录入词,对所述目标合同中的文字进行遍历,获取所述目标合同中所述待录入词所在的行作为目标行;
统计所述目标行的目标行字数,若所述目标行字数小于预设字数,则获取所述目标行中位于所述待录入词之后的文字作为内容录入词,将所述内容录入词填充至所述数据录入表中相应待录入词对应的信息录入区域内;
若所述目标行字数等于所述预设字数,则获取所述目标行的下一行作为关联行,提取所述关联行中的文字,若所述关联行中存在与其他所述待录入词相应的文字组,则删除所述关联行,获取所述目标行中位于所述待录入词之后的文字作为内容录入词;
若所述关联行中不存在与其他所述待录入词相应的文字组,则获取所述目标行中位于所述待录入词之后的文字,以及所述关联行中的文字作为内容录入词,将所述内容录入词填充至所述数据录入表中相应待录入词对应的信息录入区域内;
根据签订提取策略和具有签订属性的待录入维度信息,获取所述目标合同中对应的签订录入信息,将所述签订录入信息填充至所述数据录入表中,包括:
对具有签订属性的待录入维度信息进行解析得到印章核对词和印章定位词,对所述目标合同中的文字进行遍历,获取所述目标合同中与所述印章定位词一样的文字生成所述印章定位词对应的定位文字集合;
获取所述定位文字集合的定位中心点,调取印章提取框,基于所述定位中心点对所述印章提取框进行定位,将所述印章提取框放置于所述目标合同中,基于所述印章提取框对所述目标合同中的印章图像进行提取;
对所述印章图像进行文字提取得到印章文字集合,根据所述印章文字集合得到所述印章定位词对应的印章词,获取所述印章核对词对应的预设印章词,若所述印章词和所述预设印章词一致,则将所述印章词填充至所述数据录入表中所述印章核对词对应的信息录入区域内。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311030547.1A CN116757886B (zh) | 2023-08-16 | 2023-08-16 | 数据分析方法及分析装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311030547.1A CN116757886B (zh) | 2023-08-16 | 2023-08-16 | 数据分析方法及分析装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116757886A CN116757886A (zh) | 2023-09-15 |
CN116757886B true CN116757886B (zh) | 2023-11-28 |
Family
ID=87959418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311030547.1A Active CN116757886B (zh) | 2023-08-16 | 2023-08-16 | 数据分析方法及分析装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116757886B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117743615B (zh) * | 2024-02-19 | 2024-04-16 | 精灵控(南京)智能科技有限公司 | 基于自然语言的数据处理方法及处理平台 |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012008791A (ja) * | 2010-06-24 | 2012-01-12 | Hitachi Computer Peripherals Co Ltd | 帳票認識装置及び帳票認識方法 |
CN110555372A (zh) * | 2019-07-22 | 2019-12-10 | 深圳壹账通智能科技有限公司 | 数据录入方法、装置、设备及存储介质 |
CN110765770A (zh) * | 2019-09-04 | 2020-02-07 | 平安科技(深圳)有限公司 | 一种合同自动生成方法及装置 |
CN111160345A (zh) * | 2019-12-31 | 2020-05-15 | 重庆木舌科技有限公司 | 一种企业合同智能生成系统及方法 |
CN111275051A (zh) * | 2020-02-28 | 2020-06-12 | 上海眼控科技股份有限公司 | 字符识别方法、装置、计算机设备和计算机可读存储介质 |
CN111353485A (zh) * | 2018-12-20 | 2020-06-30 | 中国移动通信集团辽宁有限公司 | 印章识别方法、装置、设备及介质 |
CN111950555A (zh) * | 2020-08-17 | 2020-11-17 | 北京字节跳动网络技术有限公司 | 文本识别方法、装置、可读介质及电子设备 |
CN112818852A (zh) * | 2021-02-01 | 2021-05-18 | 上海眼控科技股份有限公司 | 印章校验方法、装置、设备及存储介质 |
CN113255686A (zh) * | 2021-07-15 | 2021-08-13 | 恒生电子股份有限公司 | 图像中印章的识别方法、装置、处理设备及存储介质 |
CN113627432A (zh) * | 2021-08-18 | 2021-11-09 | 南京中孚信息技术有限公司 | 图像中印章识别方法、装置、计算机设备及可读存储介质 |
CN113627423A (zh) * | 2021-07-08 | 2021-11-09 | 广州广电运通金融电子股份有限公司 | 圆形印章字符识别方法、装置、计算机设备和存储介质 |
CN114445836A (zh) * | 2022-01-26 | 2022-05-06 | 来也科技(北京)有限公司 | 结合rpa和ai的信息审核方法、装置及电子设备 |
CN114639173A (zh) * | 2022-05-18 | 2022-06-17 | 国网浙江省电力有限公司 | 基于ocr技术的稽查佐证材料智能审核方法及装置 |
CN114708186A (zh) * | 2021-11-23 | 2022-07-05 | 山东浪潮爱购云链信息科技有限公司 | 一种电子签章定位方法及装置 |
CN114758341A (zh) * | 2022-03-16 | 2022-07-15 | 北京易道博识科技有限公司 | 一种智能化合同图像识别与合同要素抽取方法及装置 |
CN115620328A (zh) * | 2022-10-28 | 2023-01-17 | 国网安徽省电力有限公司物资分公司 | 基于图像识别的合同图章位置识别系统及方法 |
KR20230027605A (ko) * | 2021-08-19 | 2023-02-28 | (주)복부인 | 부동산 계약서 자동 분석 및 관리 장치 |
CN115995022A (zh) * | 2023-01-10 | 2023-04-21 | 达而观信息科技(上海)有限公司 | 一种印章识别方法、装置、设备及存储介质 |
CN116311300A (zh) * | 2023-02-16 | 2023-06-23 | 北京百度网讯科技有限公司 | 表格生成方法、装置、电子设备以及存储介质 |
-
2023
- 2023-08-16 CN CN202311030547.1A patent/CN116757886B/zh active Active
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012008791A (ja) * | 2010-06-24 | 2012-01-12 | Hitachi Computer Peripherals Co Ltd | 帳票認識装置及び帳票認識方法 |
CN111353485A (zh) * | 2018-12-20 | 2020-06-30 | 中国移动通信集团辽宁有限公司 | 印章识别方法、装置、设备及介质 |
CN110555372A (zh) * | 2019-07-22 | 2019-12-10 | 深圳壹账通智能科技有限公司 | 数据录入方法、装置、设备及存储介质 |
WO2021012570A1 (zh) * | 2019-07-22 | 2021-01-28 | 深圳壹账通智能科技有限公司 | 数据录入方法、装置、设备及存储介质 |
CN110765770A (zh) * | 2019-09-04 | 2020-02-07 | 平安科技(深圳)有限公司 | 一种合同自动生成方法及装置 |
CN111160345A (zh) * | 2019-12-31 | 2020-05-15 | 重庆木舌科技有限公司 | 一种企业合同智能生成系统及方法 |
CN111275051A (zh) * | 2020-02-28 | 2020-06-12 | 上海眼控科技股份有限公司 | 字符识别方法、装置、计算机设备和计算机可读存储介质 |
CN111950555A (zh) * | 2020-08-17 | 2020-11-17 | 北京字节跳动网络技术有限公司 | 文本识别方法、装置、可读介质及电子设备 |
CN112818852A (zh) * | 2021-02-01 | 2021-05-18 | 上海眼控科技股份有限公司 | 印章校验方法、装置、设备及存储介质 |
CN113627423A (zh) * | 2021-07-08 | 2021-11-09 | 广州广电运通金融电子股份有限公司 | 圆形印章字符识别方法、装置、计算机设备和存储介质 |
CN113255686A (zh) * | 2021-07-15 | 2021-08-13 | 恒生电子股份有限公司 | 图像中印章的识别方法、装置、处理设备及存储介质 |
CN113627432A (zh) * | 2021-08-18 | 2021-11-09 | 南京中孚信息技术有限公司 | 图像中印章识别方法、装置、计算机设备及可读存储介质 |
KR20230027605A (ko) * | 2021-08-19 | 2023-02-28 | (주)복부인 | 부동산 계약서 자동 분석 및 관리 장치 |
CN114708186A (zh) * | 2021-11-23 | 2022-07-05 | 山东浪潮爱购云链信息科技有限公司 | 一种电子签章定位方法及装置 |
CN114445836A (zh) * | 2022-01-26 | 2022-05-06 | 来也科技(北京)有限公司 | 结合rpa和ai的信息审核方法、装置及电子设备 |
CN114758341A (zh) * | 2022-03-16 | 2022-07-15 | 北京易道博识科技有限公司 | 一种智能化合同图像识别与合同要素抽取方法及装置 |
CN114639173A (zh) * | 2022-05-18 | 2022-06-17 | 国网浙江省电力有限公司 | 基于ocr技术的稽查佐证材料智能审核方法及装置 |
CN115620328A (zh) * | 2022-10-28 | 2023-01-17 | 国网安徽省电力有限公司物资分公司 | 基于图像识别的合同图章位置识别系统及方法 |
CN115995022A (zh) * | 2023-01-10 | 2023-04-21 | 达而观信息科技(上海)有限公司 | 一种印章识别方法、装置、设备及存储介质 |
CN116311300A (zh) * | 2023-02-16 | 2023-06-23 | 北京百度网讯科技有限公司 | 表格生成方法、装置、电子设备以及存储介质 |
Non-Patent Citations (2)
Title |
---|
基于深度学习的OCR文字识别在银行业的应用研究;王阳 等;计算机应用研究;第37卷(第S2期);375-379 * |
基于特征的表格内容识别的研究;李华桥;中国优秀硕士学位论文全文数据库信息科技辑(第01期);I138-1521 * |
Also Published As
Publication number | Publication date |
---|---|
CN116757886A (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111079387B (zh) | 一种问卷自动化生成方法、装置、计算机设备及存储介质 | |
US8958643B2 (en) | Recognition of numerical characters in digital images | |
US9298685B2 (en) | Automatic creation of multiple rows in a table | |
CN116757886B (zh) | 数据分析方法及分析装置 | |
US20130238968A1 (en) | Automatic Creation of a Table and Query Tools | |
CN107193467B (zh) | 用于展示智能笔书写内容的方法及设备 | |
US20220198489A1 (en) | Method and system for automatically generating data acquisition module | |
CN110992303A (zh) | 一种异常细胞筛选方法、装置、电子设备和存储介质 | |
CN111507354A (zh) | 信息抽取方法、装置、设备以及存储介质 | |
CN113821602A (zh) | 基于图文聊天记录的自动答疑方法、装置、设备及介质 | |
CN111985467B (zh) | 聊天记录截图处理方法、装置、计算机设备和存储介质 | |
CN111027533B (zh) | 一种点读坐标的变换方法、系统、终端设备及存储介质 | |
CN113420684A (zh) | 基于特征提取的报表识别方法、装置、电子设备及介质 | |
CN112101336A (zh) | 一种基于计算机视觉的智能数据采集方式 | |
CN108369647B (zh) | 基于图像的质量控制 | |
CN117095275A (zh) | 一种数据中心资产盘点方法、系统、装置及存储介质 | |
CN116664066B (zh) | 一种管理企业计划收入与实际收入的方法及系统 | |
CN114925153B (zh) | 基于业务的地理信息数据质量检测方法、装置和设备 | |
CN116702703A (zh) | 自动排版方法和电子设备 | |
CN115689650A (zh) | 广告投放方法、装置、计算机设备及存储介质 | |
CN114913350A (zh) | 素材查重方法、装置、设备及存储介质 | |
CN114724170A (zh) | 一种bom的生成方法、装置、电子设备及存储介质 | |
TWM607472U (zh) | 文字區段標籤系統 | |
CN110909098A (zh) | 一种云端地理信息数据分析方法及系统 | |
CN111401262A (zh) | 非电子医学科研数据自动录入方法、系统及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |