CN112668571A - 一种基于人工智能ocr技术的财务报表识别系统 - Google Patents
一种基于人工智能ocr技术的财务报表识别系统 Download PDFInfo
- Publication number
- CN112668571A CN112668571A CN202011442221.6A CN202011442221A CN112668571A CN 112668571 A CN112668571 A CN 112668571A CN 202011442221 A CN202011442221 A CN 202011442221A CN 112668571 A CN112668571 A CN 112668571A
- Authority
- CN
- China
- Prior art keywords
- financial statement
- result
- artificial intelligence
- pictures
- recognition system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 18
- 238000000034 method Methods 0.000 claims description 7
- 238000013524 data verification Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 abstract description 2
- 230000009466 transformation Effects 0.000 abstract description 2
- 230000009471 action Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
本发明公开了一种基于人工智能OCR技术的财务报表识别系统,涉及数据识别技术领域,包括以下步骤:S1、图片上传、识别结果并进行保存;S2、图片的上传保存与客户信息进行关联;S3、识别结果进行二次编辑,编辑后的结果进行保存;S4、对跨页识别的表格进行智能合并;S5、识别的结果可进行线上预览和导出功能;S6、自动识别分拣财务报表类型;本发明建设一套功能完整、性能稳定、能够满足需求的财务报表OCR系统,可通过手机和PAD拍照、扫描仪等多种方式把从客户处采集到的纸质财务报表变成电子图片后,通过OCR技术进行自动识别提取和结构化转化,可对识别结果进行核对修改。
Description
技术领域
本发明涉及数据识别技术领域,具体为一种基于人工智能OCR技术的财务报表识别系统。
背景技术
为了减少低效重复人力消耗,节约人力成本,提高作业效率,有效规避风险,能够节省时间专注用于新客户开发和产品营销,我们有必要设计一种基于人工智能OCR技术的财务报表识别系统来解决上述问题。
发明内容
针对现有技术的不足,本发明提供了一种基于人工智能OCR技术的财务报表识别系统,解决了背景技术中提到的问题。
为实现以上目的,本发明通过以下技术方案予以实现:一种基于人工智能 OCR技术的财务报表识别系统,包括以下步骤:
S1、图片上传、识别结果并进行保存;
S2、图片的上传保存与客户信息进行关联;
S3、识别结果进行二次编辑,编辑后的结果进行保存;
S4、对跨页识别的表格进行智能合并;
S5、识别的结果可进行线上预览和导出功能;
S6、自动识别分拣财务报表类型。
如上述的基于人工智能OCR技术的财务报表识别系统,其中,优选的是,所述S1中图片识别包含文字图片识别、表格图片识别,且图片识别支持单图片、多图片。
如上述的基于人工智能OCR技术的财务报表识别系统,其中,优选的是,图片上传格式:支持.jpg、.png、.bmp格式。
如上述的基于人工智能OCR技术的财务报表识别系统,其中,优选的是,对跨页识别的表格进行智能合并。
如上述的基于人工智能OCR技术的财务报表识别系统,其中,优选的是,对表格识别的结果进行数据校验。
如上述的基于人工智能OCR技术的财务报表识别系统,其中,优选的是,对图片识别的结果与原图片进行比对,光标进行定位校验。
本发明与现有技术相比具备以下有益效果:建设一套功能完整、性能稳定、能够满足需求的财务报表OCR系统,可通过手机和PAD拍照、扫描仪等多种方式把从客户处采集到的纸质财务报表变成电子图片后,通过OCR技术进行自动识别提取和结构化转化,可对识别结果进行核对修改,当对识别结果确认无误后可提交到后台的信贷管理系统中。
具体实施方式
下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种技术方案:一种基于人工智能OCR技术的财务报表识别系统,包括以下步骤:
S1、图片上传、识别结果并进行保存;
S2、图片的上传保存与客户信息进行关联;
S3、识别结果进行二次编辑,编辑后的结果进行保存;
S4、对跨页识别的表格进行智能合并;
S5、识别的结果可进行线上预览和导出功能;
S6、自动识别分拣财务报表类型。
S1中图片识别包含文字图片识别、表格图片识别,且图片识别支持单图片、多图片,系统提供自动识别带有污渍印章的图片功能,支持自动识别分拣财务报表类型,针对不同行业的报表区分不同的科目。
图片上传格式:支持.jpg、.png、.bmp格式。
对跨页识别的表格进行智能合并(一张表格分两页同时识别后,进行合并成一张表格)。
对表格识别的结果进行数据校验,数据校验公式来源“系统设置-校验公式管理”,通过设置好的公式与识别出来的小计公式进行检验比较得出校验结果,并提供自动检测纠错功能。
对图片识别的结果与原图片进行比对,光标进行定位校验。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (6)
1.一种基于人工智能OCR技术的财务报表识别系统,其特征在于:包括以下步骤:
S1、图片上传、识别结果并进行保存;
S2、图片的上传保存与客户信息进行关联;
S3、识别结果进行二次编辑,编辑后的结果进行保存;
S4、对跨页识别的表格进行智能合并;
S5、识别的结果可进行线上预览和导出功能;
S6、自动识别分拣财务报表类型。
2.根据权利要求1所述的一种基于人工智能OCR技术的财务报表识别系统,其特征在于:所述S1中图片识别包含文字图片识别、表格图片识别,且图片识别支持单图片、多图片。
3.根据权利要求2所述的一种基于人工智能OCR技术的财务报表识别系统,其特征在于:图片上传格式:支持.jpg、.png、.bmp格式。
4.根据权利要求3所述的一种基于人工智能OCR技术的财务报表识别系统,其特征在于:对跨页识别的表格进行智能合并。
5.根据权利要求4所述的一种基于人工智能OCR技术的财务报表识别系统,其特征在于:对表格识别的结果进行数据校验。
6.根据权利要求4所述的一种基于人工智能OCR技术的财务报表识别系统,其特征在于:对图片识别的结果与原图片进行比对,光标进行定位校验。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011442221.6A CN112668571A (zh) | 2020-12-08 | 2020-12-08 | 一种基于人工智能ocr技术的财务报表识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011442221.6A CN112668571A (zh) | 2020-12-08 | 2020-12-08 | 一种基于人工智能ocr技术的财务报表识别系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112668571A true CN112668571A (zh) | 2021-04-16 |
Family
ID=75402125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011442221.6A Pending CN112668571A (zh) | 2020-12-08 | 2020-12-08 | 一种基于人工智能ocr技术的财务报表识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112668571A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113672739A (zh) * | 2021-07-28 | 2021-11-19 | 达而观智能(深圳)有限公司 | 一种图像格式财报文档的数据抽取方法 |
CN113947389A (zh) * | 2021-12-20 | 2022-01-18 | 佛山众陶联供应链服务有限公司 | 一种陶瓷供应链系统磅单的数字化方法及其数字化系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929580A (zh) * | 2019-10-25 | 2020-03-27 | 北京译图智讯科技有限公司 | 一种基于ocr的财务报表信息快速提取方法及系统 |
CN112016481A (zh) * | 2020-08-31 | 2020-12-01 | 民生科技有限责任公司 | 基于ocr的财务报表信息检测和识别方法 |
CN112598503A (zh) * | 2020-12-25 | 2021-04-02 | 四川享宇金信金融科技有限公司 | 一种基于征信识别的ocr识别系统及方法 |
-
2020
- 2020-12-08 CN CN202011442221.6A patent/CN112668571A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929580A (zh) * | 2019-10-25 | 2020-03-27 | 北京译图智讯科技有限公司 | 一种基于ocr的财务报表信息快速提取方法及系统 |
CN112016481A (zh) * | 2020-08-31 | 2020-12-01 | 民生科技有限责任公司 | 基于ocr的财务报表信息检测和识别方法 |
CN112598503A (zh) * | 2020-12-25 | 2021-04-02 | 四川享宇金信金融科技有限公司 | 一种基于征信识别的ocr识别系统及方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113672739A (zh) * | 2021-07-28 | 2021-11-19 | 达而观智能(深圳)有限公司 | 一种图像格式财报文档的数据抽取方法 |
CN113947389A (zh) * | 2021-12-20 | 2022-01-18 | 佛山众陶联供应链服务有限公司 | 一种陶瓷供应链系统磅单的数字化方法及其数字化系统 |
CN113947389B (zh) * | 2021-12-20 | 2022-04-22 | 佛山众陶联供应链服务有限公司 | 一种陶瓷供应链系统磅单的数字化方法及其数字化系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112668571A (zh) | 一种基于人工智能ocr技术的财务报表识别系统 | |
CN105824833A (zh) | 基于用户行为反馈的关键词推荐方法和系统 | |
CN106055618A (zh) | 一种基于网络爬虫与结构化存储的数据处理方法 | |
CN111553137A (zh) | 报告生成方法、装置、存储介质及计算机设备 | |
CN110263201A (zh) | 一种电子产品品类识别、缺损识别方法及其应用 | |
CN108595421A (zh) | 一种中文实体关联关系的抽取方法、装置及系统 | |
CN110008180A (zh) | 财务数据记录方法、装置、计算机设备和存储介质 | |
CN115578045A (zh) | 招标审核方法、电子设备及相关产品 | |
CN111159117B (zh) | 一种低开销的文件操作日志采集方法 | |
CN116798061A (zh) | 一种票据审核识别方法、装置、终端和存储介质 | |
CN112183037A (zh) | 一种平行企业财税SaaS系统中数据分类汇总方法及系统 | |
CN104408097A (zh) | 一种基于字符段热更新的混合索引方法及系统 | |
CN115756486A (zh) | 一种数据接口解析方法及装置 | |
CN106899447A (zh) | 一种链路确定的方法及装置 | |
TWM575887U (zh) | 智能會計帳務系統 | |
CN107967641A (zh) | 商品推荐方法、装置及计算机可读存储介质 | |
Wang et al. | Review of used mobile phone recognition method for recycling equipment | |
CN113935296A (zh) | 一种使用滑动模板技术进行纸质银行流水信息提取的方法 | |
CN109325843A (zh) | 业务规则控制方法、装置、设备及存储介质 | |
CN112232894A (zh) | 基于增值税发票的数据分析方法 | |
CN110247956A (zh) | 用户画像生成方法、装置、计算机设备和存储介质 | |
CN106909570B (zh) | 一种数据转换方法及装置 | |
CN113222703B (zh) | 一种商品图片批量上传方法及装置 | |
CN117764033B (zh) | 一种企业财报智能识别方法、系统、设备及存储介质 | |
CN106970941A (zh) | 一种销售数据对比方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |