CN111382742A - 一种云财务平台集成ocr识别软件的方法 - Google Patents

一种云财务平台集成ocr识别软件的方法 Download PDF

Info

Publication number
CN111382742A
CN111382742A CN202010178857.8A CN202010178857A CN111382742A CN 111382742 A CN111382742 A CN 111382742A CN 202010178857 A CN202010178857 A CN 202010178857A CN 111382742 A CN111382742 A CN 111382742A
Authority
CN
China
Prior art keywords
unit
module
template
bill
cloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010178857.8A
Other languages
English (en)
Inventor
黄云峰
刘杨
唐丽娟
莫新春
何关新
木俊蛟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cela Artificial Intelligence Technology Yunnan Co ltd
Original Assignee
Cela Artificial Intelligence Technology Yunnan Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cela Artificial Intelligence Technology Yunnan Co ltd filed Critical Cela Artificial Intelligence Technology Yunnan Co ltd
Priority to CN202010178857.8A priority Critical patent/CN111382742A/zh
Publication of CN111382742A publication Critical patent/CN111382742A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本发明公开了一种云财务平台集成OCR识别软件的方法,步骤一、票据订单的建立:在财务云平台中创建与票据对应的订单并通过图片上传单元将该票据的高清晰度图片上传到财务云平台,并且将该票据的多余空白部分剪切掉;步骤二、票据信息的识别:通过图片分类单元将票据信息进行分类,通过OCR文字识别单元对票据信息的要素进行识别,本发明涉及云财务平台技术领域。该云财务平台集成OCR识别软件的方法,在进行识别后,通过计算机进行大部分的文档修订功能,并且将错误处进行标红,人工处理通过与图片进行对比,可以快速的对文档进行修订,修订效率更高,大大降低了人工操作的强度,节省了人力成本,并且不容易出现误差。

Description

一种云财务平台集成OCR识别软件的方法
技术领域
本发明涉及云财务平台技术领域,具体为一种云财务平台集成OCR识别软件的方法。
背景技术
财务云将集团企业财务共享管理模式与云计算、移动互联网、大数据等计算机技术有效融合,实现财务共享服务、财务管理、资金管理三中心合一,建立集中、统一的企业财务云中心,支持多终端接入模式,实现“核算、报账、资金、决策”在全集团内的协同应用,财务云强化企业财务管控力度、强化管理会计建设,通过业务标准化、人员专业化,提高财务工作效率,提升财务服务质量,财务云平台是基于XBRL技术,将所有元素颗粒化和标准化后,建立颗粒中心,涵盖所有票据元素、记账元素和主数据元素;在定义中心,除定义业务类型外,使用颗粒中心的元素颗粒,组装定义会计票据、规则公式、记账逻辑和主数据范围;在构建中心,使用定义中心的成果,对每个业务类型所需要的票据、所有会计检查规则和记账时生成的会计凭证进行构建;在业务中心,将构建中心构建好每个业务类型按照租户业务的需求设置业务计划后,使得租户拥有处理该业务类型会计记账的能力,除此之外还为租户提供如报表分析、税务云等服务。
根据专利号为CN107256515A所述的财务云平台集成OCR识别软件的方法,用上述财务云平台集成OCR识别软件的方法,节省了人力成本,但是在进行人工纠偏时,大量的票据混合在一起,长时间就便宜后容易造成数据混淆导致错误,人工劳动强度较大。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种云财务平台集成OCR识别软件的方法,解决了在进行人工纠偏时,大量的票据混合在一起,长时间就便宜后容易造成数据混淆导致错误,人工劳动强度较大的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种云财务平台集成OCR识别软件的方法,:包括以下步骤:
步骤一、票据订单的建立:在财务云平台中创建与票据对应的订单并通过图片上传单元将该票据的高清晰度图片上传到财务云平台,并且将该票据的多余空白部分剪切掉;
步骤二、票据信息的识别:通过图片分类单元将票据信息进行分类,通过OCR文字识别单元对票据信息的要素进行识别,并且将文字粘贴到新建的文档内;
步骤三、对文字的修订:通过文档内的文档修错模块对文档进行校对,校对完毕后,对确认错误文字进行替换修改,然后通过乱码删除模块将识别出来的乱码符号进行统一删除处理,再通过疑似错误标红单元将疑似错误的文字进行标红处理后,转到人工修订模块,进行人工审核,通过对比步骤二中图片分类单元所分类的票据图片进行人工修订纠错,并且对修订结果进行保存;
步骤四、格式转换:通过模板导入单元导入不同票据的模板,通过模板导入模块导入模板,通过模板选择模块选择票据对应的,通过模板替换模块将步骤三中修订后的要素进行替换,然后在财务云平台中通过格式转换单元将纠偏结果转换成SAP系统需要的格式;
步骤五、会计凭证的生成:通过会计凭证生成单元调用SAP系统,生成会计凭证。
优选的,所述包括图片上传单元、图片分类单元、OCR文字识别单元、文字修订单元、模板导入单元、格式转换单元和会计凭证生成单元。
优选的,所述图片上传单元的输出端与图片分类单元的输入端连接,并且图片分类单元的输出端分别与OCR文字识别单元和文字修订单元的输入端连接,所述OCR文字识别单元的输出端与文字修订单元的输入端连接。
优选的,所述文字修订单元的输出端与模板导入单元的输入端连接,所述模板导入单元的输出端与格式转换单元的输入端连接,并且格式转换单元的输出端与会计凭证生成单元的输入端连接。
优选的,所述文字修订单元包括文档修错模块、乱码删除模块、疑似错误标红单元和人工修订模块,所述文档修错模块的输出端与乱码删除模块的输入端连接。
优选的,所述乱码删除模块的输出端与疑似错误标红单元的输入端连接,并且疑似错误标红单元的输出端与人工修订模块的输入端连接。
优选的,所述模板导入单元包括模板导入模块、模板选择模块和模板替换模块。
优选的,所述述模板导入模块的输出端与模板选择模块的输入端连接,并且模板选择模块的输出端与模板替换模块的输入端连接。
(三)有益效果
本发明提供了一种云财务平台集成OCR识别软件的方法。与现有技术相比,具备以下有益效果:
(1)、该云财务平台集成OCR识别软件的方法,通过在文档内的文档修错模块对文档进行校对,校对完毕后,对确认错误文字进行替换修改,然后通过乱码删除模块将识别出来的乱码符号进行统一删除处理,再通过疑似错误标红单元将疑似错误的文字进行标红处理后,转到人工修订模块,进行人工审核,通过对比步骤二中图片分类单元所分类的票据图片进行人工修订纠错,并且对修订结果进行保存,在进行识别后,通过计算机进行大部分的文档修订功能,并且将错误处进行标红,人工处理通过与图片进行对比,可以快速的对文档进行修订,修订效率更高,大大降低了人工操作的强度,节省了人力成本,并且不容易出现误差。
(2)、该云财务平台集成OCR识别软件的方法,通过在。模板导入单元导入不同票据的模板,通过模板导入模块导入模板,通过模板选择模块选择票据对应的,通过模板替换模块将步骤三中修订后的要素进行替换,然后在财务云平台中通过格式转换单元将纠偏结果转换成SAP系统需要的格式,根据不同的票据选择不同的票据模板进行导入,不同模板进行显示数据更加的直观,转换效果更好。
(3)、该云财务平台集成OCR识别软件的方法,通过在,在财务云平台中创建与票据对应的订单并通过图片上传单元将该票据的高清晰度图片上传到财务云平台,并且将该票据的多余空白部分剪切掉,将图片多余处剪切掉,防止在进行图片识别时,对识别进行干扰,并且可以剔除无关信息,识别效果更好。
附图说明
图1为本发明的系统原理框图;
图2为本发明文字修订单元的原理框图;
图3为本发明模板导入单元的原理框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-3,本发明实施例提供一种技术方案:一种云财务平台集成OCR识别软件的方法,包括以下步骤:
步骤一、票据订单的建立:在财务云平台中创建与票据对应的订单并通过图片上传单元将该票据的高清晰度图片上传到财务云平台,并且将该票据的多余空白部分剪切掉,将图片多余处剪切掉,防止在进行图片识别时,对识别进行干扰,并且可以剔除无关信息,识别效果更好;
步骤二、票据信息的识别:通过图片分类单元将票据信息进行分类,通过OCR文字识别单元对票据信息的要素进行识别,并且将文字粘贴到新建的文档内;
步骤三、对文字的修订:通过文档内的文档修错模块对文档进行校对,校对完毕后,对确认错误文字进行替换修改,然后通过乱码删除模块将识别出来的乱码符号进行统一删除处理,再通过疑似错误标红单元将疑似错误的文字进行标红处理后,转到人工修订模块,进行人工审核,通过对比步骤二中图片分类单元所分类的票据图片进行人工修订纠错,并且对修订结果进行保存;
步骤四、格式转换:通过模板导入单元导入不同票据的模板,通过模板导入模块导入模板,通过模板选择模块选择票据对应的,通过模板替换模块将步骤三中修订后的要素进行替换,然后在财务云平台中通过格式转换单元将纠偏结果转换成SAP系统需要的格式;
步骤五、会计凭证的生成:通过会计凭证生成单元调用SAP系统,生成会计凭证。
包括图片上传单元、图片分类单元、OCR文字识别单元、文字修订单元、模板导入单元、格式转换单元和会计凭证生成单元,图片上传单元的输出端与图片分类单元的输入端连接,并且图片分类单元的输出端分别与OCR文字识别单元和文字修订单元的输入端连接,OCR文字识别单元的输出端与文字修订单元的输入端连接,文字修订单元的输出端与模板导入单元的输入端连接,模板导入单元的输出端与格式转换单元的输入端连接,在财务云平台中通过格式转换单元将纠偏结果转换成SAP系统需要的格式,根据不同的票据选择不同的票据模板进行导入,不同模板进行显示数据更加的直观,转换效果更好,并且格式转换单元的输出端与会计凭证生成单元的输入端连接,文字修订单元包括文档修错模块、乱码删除模块、疑似错误标红单元和人工修订模块,文档修错模块的输出端与乱码删除模块的输入端连接,乱码删除模块的输出端与疑似错误标红单元的输入端连接,并且疑似错误标红单元的输出端与人工修订模块的输入端连接,模板导入单元包括模板导入模块、模板选择模块和模板替换模块,模板导入模块的输出端与模板选择模块的输入端连接,并且模板选择模块的输出端与模板替换模块的输入端连接,在进行识别后,通过计算机进行大部分的文档修订功能,并且将错误处进行标红,人工处理通过与图片进行对比,可以快速的对文档进行修订,修订效率更高,大大降低了人工操作的强度,节省了人力成本,并且不容易出现误差。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种云财务平台集成OCR识别软件的方法,其特征在于:包括以下步骤:
步骤一、票据订单的建立:在财务云平台中创建与票据对应的订单并通过图片上传单元将该票据的高清晰度图片上传到财务云平台,将该票据的多余空白部分剪切掉;
步骤二、票据信息的识别:通过图片分类单元将票据信息进行分类,通过OCR文字识别单元对票据信息的要素进行识别,并且将文字粘贴到新建的文档内;
步骤三、对文字的修订:通过文档内的文档修错模块对文档进行校对,校对完毕后,对确认错误文字进行替换修改,然后通过乱码删除模块将识别出来的乱码符号进行统一删除处理,再通过疑似错误标红单元将疑似错误的文字进行标红处理后,转到人工修订模块,进行人工审核,通过对比步骤二中图片分类单元所分类的票据图片进行人工修订纠错,并且对修订结果进行保存;
步骤四、格式转换:通过模板导入单元导入不同票据的模板,通过模板导入模块导入模板,通过模板选择模块选择票据对应的,通过模板替换模块将步骤三中修订后的要素进行替换,然后在财务云平台中通过格式转换单元将纠偏结果转换成SAP系统需要的格式;
步骤五、会计凭证的生成:通过会计凭证生成单元调用SAP系统,生成会计凭证。
2.根据权利要求1所述的一种云财务平台集成OCR识别软件的方法,其特征在于:所述包括图片上传单元、图片分类单元、OCR文字识别单元、文字修订单元、模板导入单元、格式转换单元和会计凭证生成单元。
3.根据权利要求2所述的一种云财务平台集成OCR识别软件的方法,其特征在于:所述图片上传单元的输出端与图片分类单元的输入端连接,并且图片分类单元的输出端分别与OCR文字识别单元和文字修订单元的输入端连接,所述OCR文字识别单元的输出端与文字修订单元的输入端连接。
4.根据权利要求2所述的一种云财务平台集成OCR识别软件的方法,其特征在于:所述文字修订单元的输出端与模板导入单元的输入端连接,所述模板导入单元的输出端与格式转换单元的输入端连接,并且格式转换单元的输出端与会计凭证生成单元的输入端连接。
5.根据权利要求1所述的一种云财务平台集成OCR识别软件的方法,其特征在于:所述文字修订单元包括文档修错模块、乱码删除模块、疑似错误标红单元和人工修订模块,所述文档修错模块的输出端与乱码删除模块的输入端连接。
6.根据权利要求5所述的一种云财务平台集成OCR识别软件的方法,其特征在于:所述乱码删除模块的输出端与疑似错误标红单元的输入端连接,并且疑似错误标红单元的输出端与人工修订模块的输入端连接。
7.根据权利要求1所述的一种云财务平台集成OCR识别软件的方法,其特征在于:所述模板导入单元包括模板导入模块、模板选择模块和模板替换模块。
8.根据权利要求7所述的一种云财务平台集成OCR识别软件的方法,其特征在于:所述模板导入模块的输出端与模板选择模块的输入端连接,并且模板选择模块的输出端与模板替换模块的输入端连接。
CN202010178857.8A 2020-03-15 2020-03-15 一种云财务平台集成ocr识别软件的方法 Pending CN111382742A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010178857.8A CN111382742A (zh) 2020-03-15 2020-03-15 一种云财务平台集成ocr识别软件的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010178857.8A CN111382742A (zh) 2020-03-15 2020-03-15 一种云财务平台集成ocr识别软件的方法

Publications (1)

Publication Number Publication Date
CN111382742A true CN111382742A (zh) 2020-07-07

Family

ID=71215357

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010178857.8A Pending CN111382742A (zh) 2020-03-15 2020-03-15 一种云财务平台集成ocr识别软件的方法

Country Status (1)

Country Link
CN (1) CN111382742A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465525A (zh) * 2020-12-02 2021-03-09 无锡朝阳供应链科技股份有限公司 一种农贸市场商品进货溯源方法、装置及系统
CN113807071A (zh) * 2021-08-31 2021-12-17 浙江浙大中控信息技术有限公司 一种基于ocr的文档生成方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106372632A (zh) * 2016-08-23 2017-02-01 山西同方知网数字出版技术有限公司 一种基于ocr的漏识文字自动检测的方法
CN107256515A (zh) * 2017-07-04 2017-10-17 深圳易嘉恩科技有限公司 财务云平台集成ocr识别软件的方法
CN109255113A (zh) * 2018-09-04 2019-01-22 郑州信大壹密科技有限公司 智能校对系统
CN109635110A (zh) * 2018-11-30 2019-04-16 北京百度网讯科技有限公司 数据处理方法、装置、设备以及计算机可读存储介质
US20190164231A1 (en) * 2016-07-26 2019-05-30 Sichuan Changhong Electric Co., Ltd. Xbrl-based intelligent financial cloud platform system, construction method and business implementation method thereof
CN110674815A (zh) * 2019-09-29 2020-01-10 四川长虹电器股份有限公司 基于深度学习关键点检测的发票图像畸变校正方法
CN110737855A (zh) * 2019-09-03 2020-01-31 赵廷江 一种不可复制文字网页内文字的提取方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190164231A1 (en) * 2016-07-26 2019-05-30 Sichuan Changhong Electric Co., Ltd. Xbrl-based intelligent financial cloud platform system, construction method and business implementation method thereof
CN106372632A (zh) * 2016-08-23 2017-02-01 山西同方知网数字出版技术有限公司 一种基于ocr的漏识文字自动检测的方法
CN107256515A (zh) * 2017-07-04 2017-10-17 深圳易嘉恩科技有限公司 财务云平台集成ocr识别软件的方法
CN109255113A (zh) * 2018-09-04 2019-01-22 郑州信大壹密科技有限公司 智能校对系统
CN109635110A (zh) * 2018-11-30 2019-04-16 北京百度网讯科技有限公司 数据处理方法、装置、设备以及计算机可读存储介质
CN110737855A (zh) * 2019-09-03 2020-01-31 赵廷江 一种不可复制文字网页内文字的提取方法
CN110674815A (zh) * 2019-09-29 2020-01-10 四川长虹电器股份有限公司 基于深度学习关键点检测的发票图像畸变校正方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韦斌: "从TS文件中提取DVB Subtitle字幕的简要教程", 《卫星电视与宽带多媒体》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465525A (zh) * 2020-12-02 2021-03-09 无锡朝阳供应链科技股份有限公司 一种农贸市场商品进货溯源方法、装置及系统
CN113807071A (zh) * 2021-08-31 2021-12-17 浙江浙大中控信息技术有限公司 一种基于ocr的文档生成方法

Similar Documents

Publication Publication Date Title
CN109887153B (zh) 一种财税处理方法和处理系统
US9460472B2 (en) System and method for reconciling one or more financial transactions
US20160196254A1 (en) Feedback validation of electronically generated forms
US20210049711A1 (en) Method of automatically transmitting data information and device of automatically transmitting data information
CN105023340A (zh) 基于扫描仪的云智能发票识别查验系统及方法
CN107067228A (zh) 一种手持式认证智能审核系统及其审核方法
US20140207631A1 (en) Systems and Method for Analyzing and Validating Invoices
CN111382742A (zh) 一种云财务平台集成ocr识别软件的方法
CN110288310A (zh) 工作签报管理方法、设备、存储介质及装置
CN115017272A (zh) 基于登记数据的智能核验方法及装置
US20230058570A1 (en) Automated data extraction and document generation
CN110599319A (zh) 自动审计方法、装置、终端及存储介质
CN116126911A (zh) 数据分析方法及装置
CN114663061A (zh) 一种全场景网上智能审批方法
CN115482075A (zh) 财务数据的异常分析方法、装置、电子设备及存储介质
CN114549177A (zh) 保函审查方法、装置、系统与计算机可读存储介质
CN108415930B (zh) 一种数据解析方法及装置
CN113779998A (zh) 业务信息的结构化处理方法、装置、设备及存储介质
US11557107B2 (en) Intelligent recognition and extraction of numerical data from non-numerical graphical representations
CN111932412A (zh) 合同起草及修订方法、装置、存储介质及设备
Lee Robotics Process Automation (RPA) And The Import/Export Customs Declaration Process
CN116664066B (zh) 一种管理企业计划收入与实际收入的方法及系统
CN113094520A (zh) 一种检查电子合同的方法
US20240046353A1 (en) Digital workbench for trade finance operation
CN112651725B (zh) 电子发票解析方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200707