CN111898433A - 一种纸质票据数字化方法和装置 - Google Patents

一种纸质票据数字化方法和装置 Download PDF

Info

Publication number
CN111898433A
CN111898433A CN202010596567.5A CN202010596567A CN111898433A CN 111898433 A CN111898433 A CN 111898433A CN 202010596567 A CN202010596567 A CN 202010596567A CN 111898433 A CN111898433 A CN 111898433A
Authority
CN
China
Prior art keywords
layer
paper
electronic image
ticket
double
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010596567.5A
Other languages
English (en)
Other versions
CN111898433B (zh
Inventor
陈杰
杨正道
冯辉
韩宇菲
王燕燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baiwang Co ltd
Original Assignee
Baiwang Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baiwang Co ltd filed Critical Baiwang Co ltd
Priority to CN202010596567.5A priority Critical patent/CN111898433B/zh
Publication of CN111898433A publication Critical patent/CN111898433A/zh
Application granted granted Critical
Publication of CN111898433B publication Critical patent/CN111898433B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems

Abstract

本申请公开了一种纸质票据数字化方法和装置。该方法包括:将纸质票据转换为电子图像;对所述电子图像进行OCR识别得到所述电子图像中的文字信息;将所述电子图像和所述文字信息写入OFD,生成双层OFD文件;对所述双层OFD文件进行票面样式分析,识别出所述纸质票据所属的票种;对所述双层OFD文件中的文字信息进行分析,得到对应所述票种的结构化数据;将所述结构化数据与所述文字信息相结合,形成数据标引;将所述数据标引存入所述双层OFD文件中。本申请的方法,能够根据文字数据信息进行数据检索、提取、分析、归集,既实现了形式上的电子化,又实现了应用上的电子化,不需要人工参与手工摘录财务数据,既节省了人力成本又降低了出错的概率。

Description

一种纸质票据数字化方法和装置
技术领域
本申请涉及电子票据技术领域,具体涉及一种纸质票据数字化方法和装置。
背景技术
在信息技术高速发展的时代,社会对于降低运转成本、提升服务能力的需求日益迫切,能为国家经济运行、数据统计、分析决策提供参考价值的电子凭证得到重视,电子票据作为生活工作中的重要电子凭证,其应用逐渐得到推广,但票据电子化并非一撮而就,在电票平台全面推广、会计系统升级改造及相关管理办法落地之前的相当长一段时间内纸质票据都会与电子票据共存,进入会计系统及档案系统前的纸质票据数字化也成为各单位的刚性需求。
在现有技术中,纸质票据数字化的通用方法是将纸质票据通过扫描仪扫描或相机拍摄为电子图像文件,做的好一些的会把电子图像文件转换为PDF文件,同时利用OCR(Optical Character Recognition,光学字符识别)技术识别票面上的六要素存入数据库供财务人员对纸质票据和扫描后的电子文件进行必要的关联。财务人员收到扫描后的票据图像或PDF文件后,人工核对扫描后的票面信息并将财务入账所需信息摘抄下来,进行报销处理及财务记账。具体步骤参见附图1。基本流程如下:
1.纸质票据通过扫描仪扫描或相机拍摄,生成电子图像文件。
2.对电子图像文件的六要素位置进行OCR识别,提取六要素存入数据库。
3.将电子图像文件转换为单层PDF文件。
4.数据库中六要素与PDF文件对应,供财务人员进行纸质票据与电子票据的关联。
5.财务人员使用纸质票据生成的图像或单层PDF文件,进行人工财务信息录入、记账等处理。
现有的纸质票据数字化方法生成的是电子图像文件或单层PDF文件,所得电子图像文件和PDF文件没有任何文字数据信息,无法进行数据检索、提取、分析、归集,票据电子文件脱离了业务系统很难被利用,实现了形式上的电子化,但未实现应用上的电子化,财务数据需要人工参与手工摘录,既浪费了人力成本又增加了出错的概率。
发明内容
本申请的目的是提供一种纸质票据数字化方法和装置。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
根据本申请实施例的一个方面,提供一种纸质票据数字化方法,包括:
将纸质票据转换为电子图像;
对所述电子图像进行OCR识别得到所述电子图像中的文字信息;
将所述电子图像和所述文字信息写入OFD,生成双层OFD文件。
进一步地,所述纸质票据数字化方法还包括:
对所述双层OFD文件进行票面样式分析,识别出所述纸质票据所属的票种;
对所述双层OFD文件中的文字信息进行分析,得到对应所述票种的结构化数据;
将所述结构化数据与所述文字信息相结合,形成数据标引;
将所述数据标引存入所述双层OFD文件中。
进一步地,所述将纸质票据转换为电子图像,包括:将所述纸质票据通过扫描仪扫描或相机拍摄,生成电子图像。
进一步地,所述双层OFD文件的上层是图像层,所述图像层为电子图像;所述双层OFD文件的下层是文字层,所述文字层是对应于所述图像层中每一个字形的文字。
进一步地,所述纸质票据为增值税普通发票、专用发票、行程单、通行费发票、火车票、长途汽车票、对账单、报销单或收据。
根据本申请实施例的另一个方面,提供一种纸质票据数字化装置,包括:
转换模块,用于将纸质票据转换为电子图像;
OCR识别模块,用于对所述电子图像进行OCR识别得到所述电子图像中的文字信息;
写入模块,用于将所述电子图像和所述文字信息写入OFD,生成双层OFD文件。
进一步地,所述纸质票据数字化装置还包括:
第一分析模块,用于对所述双层OFD文件进行票面样式分析,识别出所述纸质票据所属的票种;
第二分析模块,用于对所述双层OFD文件中的文字信息进行分析,得到对应所述票种的结构化数据;
结合模块,用于将所述结构化数据与所述文字信息相结合,形成数据标引;
存入模块,用于将所述数据标引存入所述双层OFD文件中。
根据本申请实施例的另一个方面,提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现上述的纸质票据数字化方法。
根据本申请实施例的另一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以实现上述的纸质票据数字化方法。
本申请实施例的其中一个方面提供的技术方案可以包括以下有益效果:
本申请实施例提供的纸质票据数字化方法,将纸质票据转换为电子图像,对电子图像进行OCR识别得到电子图像中的文字信息,将电子图像和文字信息写入OFD,生成双层OFD文件,根据文字数据信息能够进行数据检索、提取、分析、归集,既实现了形式上的电子化,又实现了应用上的电子化,不需要人工参与手工摘录财务数据,既节省了人力成本又降低了出错的概率,能够很好地满足实际应用的需要。
本申请的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者,部分特征和优点可以从说明书中推知或毫无疑义地确定,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了现有技术的纸质票据数字化的流程图;
图2示出了本申请的一个实施例的纸质票据数字化方法流程图;
图3示出了本申请的另一实施例的纸质票据数字化方法流程图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图和具体实施例对本申请做进一步说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
如图2所示,本申请的一个实施例提供了一种纸质票据数字化方法,包括:
S10、将纸质票据转换为电子图像;
S20、对所述电子图像进行OCR识别得到所述电子图像中的文字信息;
S30、将所述电子图像和所述文字信息写入OFD,生成双层OFD文件。
在某些实施方式中,所述纸质票据数字化方法还包括:
S40、对所述双层OFD文件进行票面样式分析,识别出所述纸质票据所属的票种;
S50、对所述双层OFD文件中的文字信息进行分析,得到对应所述票种的结构化数据;
S60、将所述结构化数据与所述文字信息相结合,形成数据标引;
S70、将所述数据标引存入所述双层OFD文件中。
在某些实施方式中,所述将纸质票据转换为电子图像,包括:将所述纸质票据通过扫描仪扫描或相机拍摄,生成电子图像。
在某些实施方式中,所述双层OFD文件的上层是图像层,所述图像层为电子图像;所述双层OFD文件的下层是文字层,所述文字层是对应于所述图像层中每一个字形的文字。
在某些实施方式中,所述纸质票据为增值税普通发票、专用发票、行程单、通行费发票、火车票、长途汽车票、对账单、报销单或收据。
本申请实施例提供的纸质票据数字化方法,将纸质票据转换为电子图像,对电子图像进行OCR识别得到电子图像中的文字信息,将电子图像和文字信息写入OFD,生成双层OFD文件,根据文字数据信息能够进行数据检索、提取、分析、归集,既实现了形式上的电子化,又实现了应用上的电子化,不需要人工参与手工摘录财务数据,既节省了人力成本又降低了出错的概率,能够很好地满足实际应用的需要。
本申请另一个实施例提供了一种纸质票据数字化装置,包括:
转换模块,用于将纸质票据转换为电子图像;
OCR识别模块,用于对所述电子图像进行OCR识别得到所述电子图像中的文字信息;
写入模块,用于将所述电子图像和所述文字信息写入OFD,生成双层OFD文件。
在某些实施方式中,所述纸质票据数字化装置还包括:
第一分析模块,用于对所述双层OFD文件进行票面样式分析,识别出所述纸质票据所属的票种;
第二分析模块,用于对所述双层OFD文件中的文字信息进行分析,得到对应所述票种的结构化数据;
结合模块,用于将所述结构化数据与所述文字信息相结合,形成数据标引;
存入模块,用于将所述数据标引存入所述双层OFD文件中。
本申请另一个实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现上述的纸质票据数字化方法。
本申请另一个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以实现上述的纸质票据数字化方法。计算机可读存储介质可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读存储介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
本申请的另一个实施例提供了一种纸质票据数字化方法。本方法在扫描生成的电子图像文件的基础上,通过OCR(Optical Character Recognition,光学字符识别)对全票面信息进行识别,并将识别到的文字信息写入OFD(Open Fixed-layout Document,开放式版式文档),生成票据的双层OFD文件,同时,根据不同的票面样式进行分析,识别出对应的票面种类,并根据票面种类对票面信息进行分析,生成与票种一致的结构化数据信息,以非接触式引用的方式存放在数据标引中,生成一个可供人机共读的票据OFD文件,便于在ERP、SAP、会计档案等各种系统中为各种应用需求提供信息支撑。
如图3所示,本实施例的一个实施方式的基本流程包括如下步骤:
S1.1将纸质票据通过扫描仪扫描或相机拍摄,生成电子图像文件。
S1.2对电子图像文件进行OCR识别,将电子图像文件和识别所得文字信息写入OFD,生成双层OFD文件,双层OFD文件上层是图像层,图像层为扫描所得的图像,双层OFD文件下层是文字层,文字层是对应于图像层中每一个字形的文字,图像层与文字层相互对应,显示效果与原纸质票据完全相同,同时,可对票面上的文字进行检索、拷贝。
S1.3对双层OFD文件进行票面样式分析,识别出该纸质票据所属的票种,比如,是增值税普通发票、专用发票、行程单、通行费发票、火车票、长途汽车票还是对账单、报销单、收据等,每种票据都有各自的票面样式。
S1.4对双层OFD文件中的文字层信息进行分析,梳理出对应所属票种的结构化数据。
S1.5将结构化数据与票面文字内容结合,形成票据的数据标引,存入该双层OFD文件中。
人读,数据标引可提供阅读导览,双层OFD文件可供内容检索、拷贝;机读,数据标引可供数据提取、票据归集、财务入账。
本实施例通过OCR识别全票面信息,通过票面信息分析识别票据种类,并梳理出业务相关的结构化数据信息;数字化后的票据电子文件是双层OFD文件,双层OFD票据文件中业务相关的结构化数据与内容关联形成数据标引。
在另一实施方式中,纸质票据以一张增值税普通发票的纸质发票为例,其数字化过程包括以下步骤:
S2.1通过扫描仪扫描或相机拍照生成纸质发票的电子图像。
S2.2对纸质发票的电子图像进行OCR识别,获取该电子图像中的文字内容。
S2.3将电子图像置于上层,将文字内容置于下层,存入OFD,生成双层OFD发票文件,如图3所示。
S2.4分析双层OFD发票文件的票头信息,识别票种为增值税普通发票。
S2.5按照增值税普通发票的票面布局,将OCR识别所得文字内容整理为普通发票业务相关的结构化数据,并以标引的形式存放到OFD文件中。
S2.6用于阅读时,可通过面板进行快速导览。用于批量票据自动化归集时,可通过数据分析提取发票业务相关的结构化数据。另外,由于这是下面有文字层的双层OFD,因此可以对内容进行选择、查找、拷贝处理。
本发明在扫描生成电子图像文件的基础上,利用OCR技术对全票面信息进行识别,利用对OCR所得票面信息的智能分析实现票种归类、获取与业务相关的票据结构化信息并与票面内容相结合以数据标引的形式写入OFD文件中,得到带有票据语义的双层OFD票据文件。
使用本发明的方法,在当前电子票据刚刚起步、纸质票据与电子票据共存时期,纸质票据在数字化后不仅可以维持原有纸票的样式作为会计入账的有力凭证,而且还可以拥有更多的数字化内容信息,既可为人读提供导览、检索、拷贝等便利,又能通过新增的业务相关数据信息使票据具备自动化数据分析条件,无需人工参与即可实现票据的数据分析、归集、财务入账,使纸质票据做到便于再利用的深度电子化,减少出错概率,节约人力成本,提高工作效率,为国家经济运行、数据统计、分析决策提供数据支撑,为降低社会运转成本、提升服务能力打好基础,并为票据生命周期的下一个环节--进入会计档案实现长期保存做好准备。
需要说明的是:
术语“模块”并非意图受限于特定物理形式。取决于具体应用,模块可以实现为硬件、固件、软件和/或其组合。此外,不同的模块可以共享公共组件或甚至由相同组件实现。不同模块之间可以存在或不存在清楚的界限。
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述实施例仅表达了本申请的实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (9)

1.一种纸质票据数字化方法,其特征在于,包括:
将纸质票据转换为电子图像;
对所述电子图像进行OCR识别得到所述电子图像中的文字信息;
将所述电子图像和所述文字信息写入OFD,生成双层OFD文件。
2.根据权利要求1所述的纸质票据数字化方法,其特征在于,所述纸质票据数字化方法还包括:
对所述双层OFD文件进行票面样式分析,识别出所述纸质票据所属的票种;
对所述双层OFD文件中的文字信息进行分析,得到对应所述票种的结构化数据;
将所述结构化数据与所述文字信息相结合,形成数据标引;
将所述数据标引存入所述双层OFD文件中。
3.根据权利要求1所述的纸质票据数字化方法,其特征在于,所述将纸质票据转换为电子图像,包括:将所述纸质票据通过扫描仪扫描或相机拍摄,生成电子图像。
4.根据权利要求1所述的纸质票据数字化方法,其特征在于,所述双层OFD文件的上层是图像层,所述图像层为电子图像;所述双层OFD文件的下层是文字层,所述文字层是对应于所述图像层中每一个字形的文字。
5.根据权利要求1所述的纸质票据数字化方法,其特征在于,所述纸质票据为增值税普通发票、专用发票、行程单、通行费发票、火车票、长途汽车票、对账单、报销单或收据。
6.一种纸质票据数字化装置,其特征在于,包括:
转换模块,用于将纸质票据转换为电子图像;
OCR识别模块,用于对所述电子图像进行OCR识别得到所述电子图像中的文字信息;
写入模块,用于将所述电子图像和所述文字信息写入OFD,生成双层OFD文件。
7.根据权利要求6所述的纸质票据数字化装置,其特征在于,所述纸质票据数字化装置还包括:
第一分析模块,用于对所述双层OFD文件进行票面样式分析,识别出所述纸质票据所属的票种;
第二分析模块,用于对所述双层OFD文件中的文字信息进行分析,得到对应所述票种的结构化数据;
结合模块,用于将所述结构化数据与所述文字信息相结合,形成数据标引;
存入模块,用于将所述数据标引存入所述双层OFD文件中。
8.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-5中任一所述的纸质票据数字化方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以实现如权利要求1-5中任一所述的纸质票据数字化方法。
CN202010596567.5A 2020-06-22 2020-06-22 一种纸质票据数字化方法和装置 Active CN111898433B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010596567.5A CN111898433B (zh) 2020-06-22 2020-06-22 一种纸质票据数字化方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010596567.5A CN111898433B (zh) 2020-06-22 2020-06-22 一种纸质票据数字化方法和装置

Publications (2)

Publication Number Publication Date
CN111898433A true CN111898433A (zh) 2020-11-06
CN111898433B CN111898433B (zh) 2024-04-09

Family

ID=73207142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010596567.5A Active CN111898433B (zh) 2020-06-22 2020-06-22 一种纸质票据数字化方法和装置

Country Status (1)

Country Link
CN (1) CN111898433B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112488674A (zh) * 2020-12-24 2021-03-12 航天信息股份有限公司企业服务分公司 电子档案管理系统和方法
CN115934653A (zh) * 2023-01-04 2023-04-07 百望股份有限公司 一种在ofd文件中添加外部ofd页面内容的方法和装置
CN116704540A (zh) * 2023-08-09 2023-09-05 江苏中威科技软件系统有限公司 将纸质文件内容进行标识并高保真的转换为ofd文件的技术

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160038122A1 (en) * 2014-08-05 2016-02-11 Samsung Medison Co., Ltd. Ultrasound diagnosis apparatus
CN106485556A (zh) * 2016-10-21 2017-03-08 百望股份有限公司 一种电子发票生成系统
CN107463712A (zh) * 2017-08-23 2017-12-12 上海中信信息发展股份有限公司 文件格式可用性评估方法及装置
US20180054579A1 (en) * 2015-04-03 2018-02-22 Sony Corporation Solid-state image capture element, driving method, and electronic device
CN107844465A (zh) * 2017-11-11 2018-03-27 江西金格科技股份有限公司 一种ofd格式文档支持脚本的方法
CN108921627A (zh) * 2018-06-07 2018-11-30 国信电子票据平台信息服务有限公司 一种生成电子发票ofd版式文件的方法及系统
CN109377342A (zh) * 2018-12-04 2019-02-22 金蝶软件(中国)有限公司 单据处理方法、装置、计算机设备和存储介质
CN109492211A (zh) * 2018-11-13 2019-03-19 江西金格科技股份有限公司 一种基于ofd文档的表格提取方法
CN109977088A (zh) * 2019-03-30 2019-07-05 湖北畅云时讯软件技术有限公司 一种预设格式文件转换为ofd格式的方法
CN110717127A (zh) * 2019-10-14 2020-01-21 北京华宇信息技术有限公司 一种ofd文件在线解析与浏览的方法与装置
CN111125439A (zh) * 2019-12-06 2020-05-08 北京信息科技大学 一种xml数据处理方法、系统和存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160038122A1 (en) * 2014-08-05 2016-02-11 Samsung Medison Co., Ltd. Ultrasound diagnosis apparatus
US20180054579A1 (en) * 2015-04-03 2018-02-22 Sony Corporation Solid-state image capture element, driving method, and electronic device
CN106485556A (zh) * 2016-10-21 2017-03-08 百望股份有限公司 一种电子发票生成系统
CN107463712A (zh) * 2017-08-23 2017-12-12 上海中信信息发展股份有限公司 文件格式可用性评估方法及装置
CN107844465A (zh) * 2017-11-11 2018-03-27 江西金格科技股份有限公司 一种ofd格式文档支持脚本的方法
CN108921627A (zh) * 2018-06-07 2018-11-30 国信电子票据平台信息服务有限公司 一种生成电子发票ofd版式文件的方法及系统
CN109492211A (zh) * 2018-11-13 2019-03-19 江西金格科技股份有限公司 一种基于ofd文档的表格提取方法
CN109377342A (zh) * 2018-12-04 2019-02-22 金蝶软件(中国)有限公司 单据处理方法、装置、计算机设备和存储介质
CN109977088A (zh) * 2019-03-30 2019-07-05 湖北畅云时讯软件技术有限公司 一种预设格式文件转换为ofd格式的方法
CN110717127A (zh) * 2019-10-14 2020-01-21 北京华宇信息技术有限公司 一种ofd文件在线解析与浏览的方法与装置
CN111125439A (zh) * 2019-12-06 2020-05-08 北京信息科技大学 一种xml数据处理方法、系统和存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
丁德胜: "《纸质档案数字复制件光学字符识别(OCR)工作规范》解读", 《中国档案》, pages 40 *
李青: "浅谈档案数字化图像信息的处理", 《山东档案》, pages 54 - 56 *
赵屹: "电子文件防篡改技术发展对档案管理的影响及启示", 《档案学研究》, no. 6, pages 77 - 85 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112488674A (zh) * 2020-12-24 2021-03-12 航天信息股份有限公司企业服务分公司 电子档案管理系统和方法
CN115934653A (zh) * 2023-01-04 2023-04-07 百望股份有限公司 一种在ofd文件中添加外部ofd页面内容的方法和装置
CN116704540A (zh) * 2023-08-09 2023-09-05 江苏中威科技软件系统有限公司 将纸质文件内容进行标识并高保真的转换为ofd文件的技术

Also Published As

Publication number Publication date
CN111898433B (zh) 2024-04-09

Similar Documents

Publication Publication Date Title
CN111898433B (zh) 一种纸质票据数字化方法和装置
CN109858453B (zh) 一种通用的多引擎票据识别系统及方法
US8233751B2 (en) Method and system for simplified recordkeeping including transcription and voting based verification
CN110929580A (zh) 一种基于ocr的财务报表信息快速提取方法及系统
Tang et al. Information acquisition and storage of forms in document processing
CN112052749A (zh) 档案的归档方法、装置、电子设备及计算机可读存储介质
CN110889310B (zh) 金融文档信息智能提取系统及方法
JPH06501584A (ja) 情報処理装置
WO2006002009A2 (en) Document management system with enhanced intelligent document recognition capabilities
CN110414927A (zh) 一种票据处理自动生成凭证的方法及装置
CN103488923B (zh) 一种电子签名方法、装置及系统
CN103246953A (zh) 一种单据稽核方法
CN104346415A (zh) 图像文档命名的方法
CN109190611A (zh) 一种基于众包的互联网编修家谱系统
CN1750018A (zh) 文档处理装置、文档处理方法和记录相关程序的存储介质
CN116092108A (zh) 一种实体文档扫描生成pdf文件的方法、系统及存储介质
CN110688998A (zh) 票据识别方法及装置
CN115116068A (zh) 一种基于ocr的档案智能归档系统
CN111476648A (zh) 一种财务凭证的收录方法
CN115830620B (zh) 一种基于ocr的档案文本数据处理方法及系统
CN116403233A (zh) 一种基于数字化档案图像定位及识别方法
US5339409A (en) Image storage/search apparatus for merging image and related key codes when match found between key code and specific character code of image
CN114495138A (zh) 一种智能文档识别与特征提取方法、装置平台和存储介质
JP2002024761A (ja) 画像処理装置及び画像処理方法並びに記憶媒体
WO2011027113A1 (en) Method and apparatus for segmenting images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant