CN112699635A - 一种工程造价软件的数据录入方法及相关装置 - Google Patents

一种工程造价软件的数据录入方法及相关装置 Download PDF

Info

Publication number
CN112699635A
CN112699635A CN202110313469.0A CN202110313469A CN112699635A CN 112699635 A CN112699635 A CN 112699635A CN 202110313469 A CN202110313469 A CN 202110313469A CN 112699635 A CN112699635 A CN 112699635A
Authority
CN
China
Prior art keywords
data
target
data entry
dimensional array
json
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110313469.0A
Other languages
English (en)
Inventor
贺文峰
段启鹏
陈石磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Pinming Safety Control Information Technology Co ltd
Original Assignee
Hangzhou Pinming Safety Control Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Pinming Safety Control Information Technology Co ltd filed Critical Hangzhou Pinming Safety Control Information Technology Co ltd
Priority to CN202110313469.0A priority Critical patent/CN112699635A/zh
Publication of CN112699635A publication Critical patent/CN112699635A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/114Pagination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请公开了一种工程造价软件的数据录入方法,包括读取目标文件;通过对所述目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间;截取位于所述页码区间的所述目标工程量清单表格的数据,并将截取的所述数据转化为JSON数据;对所述JSON数据进行排版布局,形成表格形式的二维数组;根据预设匹配规则录入所述二维数组。该方法能够有效提高数据录入的效率,降低出错概率。本申请还公开了一种工程造价软件的数据录入装置、设备以及计算机可读存储介质,均具有上述技术效果。

Description

一种工程造价软件的数据录入方法及相关装置
技术领域
本申请涉及工程造价技术领域,特别涉及一种工程造价软件的数据录入方法;还涉及一种工程造价软件的数据录入装置、设备以及计算机可读存储介质。
背景技术
目前,造价工程中的工程量清单等数据在招标文件中通常是以PDF或Word形式存在的电子表格。针对工程量清单等数据录入工程造价软件,现有的录入方式是人工手动录入,由人工手动将招标文件等表格逐行填写到工程造价软件中。然而采用人工手动录入的方式需要耗费大量的人力,数据录入效率较低,并且由于是人工逐条录入,因此还存在数据录入失准的风险。
有鉴于此,如何提高数据录入的效率,降低出错概率已成为本领域技术人员亟待解决的技术问题。
发明内容
本申请的目的是提供一种工程造价软件的数据录入方法,能够提高数据录入的效率,降低出错概率。本申请的另一个目的是提供一种工程造价软件的数据录入装置、设备以及计算机可读存储介质,均具有上述技术效果。
为解决上述技术问题,本申请提供了一种工程造价软件的数据录入方法,包括:
读取目标文件;
通过对所述目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间;
截取位于所述页码区间的所述目标工程量清单表格的数据,并将截取的所述数据转化为JSON数据;
对所述JSON数据进行排版布局,形成表格形式的二维数组;
根据预设匹配规则录入所述二维数组。
可选的,所述通过对所述目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间包括:
提取所述目标文件的文件内容的长字符集;
对所述长字符集进行关键字正则匹配,定位目标工程量清单表格所在的页码区间。
可选的,所述截取位于所述页码区间的所述目标工程量清单表格的数据,包括:
根据所述目标工程量清单表格的横竖线条截取所述目标工程量清单表格中各单元格中的所述数据。
可选的,所述对所述JSON数据进行排版布局,形成表格形式的二维数组包括:
通过将所述JSON数据的列关键字与预设列关键字进行比对,定位所述JSON数据所在列;
以定位的所述JSON数据所在列为首,划分行间步距与列间步距;
根据所述行间步距与所述列间步距对所述JSON数据进行排版布局,形成表格形式的二维数组。
可选的,所述对所述JSON数据进行排版布局,形成表格形式的二维数组前还包括:
对所述JSON数据进行数据清洗。
可选的,还包括:
检查导入的所述数据是否符合预设规则;
若不符合预设规则,则进行调整提示。
可选的,还包括:
当用户触发调整操作后,将所述数据以表格的形式打开,以便用户对所述数据进行调整。
为解决上述技术问题,本申请还提供了一种工程造价软件的数据录入装置,包括:
读取模块,用于读取目标文件;
定位模块,用于通过对所述目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间;
截取模块,用于截取位于所述页码区间的所述目标工程量清单表格的数据,并将截取的所述数据转化为JSON数据;
排版模块,用于对所述JSON数据进行排版布局,形成表格形式的二维数组;
录入模块,用于根据预设匹配规则录入所述二维数组。
为解决上述技术问题,本申请还提供了一种工程造价软件的数据录入设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上任一项所述的工程造价软件的数据录入方法的步骤。
为解决上述技术问题,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的工程造价软件的数据录入方法的步骤。
本申请所提供的工程造价软件的数据录入方法,包括:读取目标文件;通过对所述目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间;截取位于所述页码区间的所述目标工程量清单表格的数据,并将截取的所述数据转化为JSON数据;对所述JSON数据进行排版布局,形成表格形式的二维数组;根据预设匹配规则录入所述二维数组。
可见,本申请所提供的工程造价软件的数据录入方法,在读取目标文件后,通过对目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间,进而截取位于所述页码区间的所述目标工程量清单表格的数据,并将数据自动录入。较之手工录入的传统技术方案,本申请所提供的数据录入方法能够实现数据自动录入,由此能够极大的提高数据录入的效率,降低出错概率。
本申请所提供的工程造价软件的数据录入装置、设备以及计算机可读存储介质均具有上述技术效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例所提供的一种工程造价软件的数据录入方法的流程示意图;
图2为本申请实施例所提供的一种调整提示界面的示意图;
图3为本申请实施例所提供的一种表格的示意图;
图4为本申请实施例所提供的一种工程造价软件的数据录入装置的示意图;
图5为本申请实施例所提供的一种工程造价软件的数据录入设备的示意图。
具体实施方式
本申请的核心是提供一种工程造价软件的数据录入方法,能够提高数据录入的效率,降低出错概率。本申请的另一个核心是提供一种工程造价软件的数据录入装置、设备以及计算机可读存储介质,均具有上述技术效果。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参考图1,图1为本申请实施例所提供的一种工程造价软件的数据录入方法的流程示意图,参考图1所示,该方法包括:
S101:读取目标文件;
S102:通过对所述目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间;
具体的,用户选择需要导入到工程造价软件中的PDF或Word文件,并将PDF或Word文件拖拉至到工程造价软件中。要导入到工程造价软件中的PDF或Word文件由用户人工指定,用户可使用鼠标选择要导入到工程造价软件中的PDF或Word文件。在用户将PDF或Word文件拖拉到工程造价软件中后,工程造价软件可以从电子设备获取到该PDF或Word文件的存储位置的链接,进而将该PDF或Word文件导入到电子设备的内存中以供后续工程造价软件读取。
工程造价软件从电子设备的内存中读取导入的PDF或Word文件即目标文件,并进一步通过对目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间。例如,定位到目标工程量清单表格位于PDF文件的第15页至第18页。
其中,在一种具体的实施方式中,通过对所述目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间的方式为:提取所述目标文件的文件内容的长字符集;对所述长字符集进行关键字正则匹配,定位目标工程量清单表格所在的页码区间。
S103:截取位于所述页码区间的所述目标工程量清单表格的数据,并将截取的所述数据转化为JSON数据;
具体的,定位到目标工程量清单表格所在的页码区间后,截取位于页码区间的目标工程量清单表格,而去除目标工程量清单表格之外其他的无效数据,并进一步从目标工程量清单表格中截取数据,并将从目标工程量清单中截取的数据以行列二维数组的方式转化为JSON数据。
其中,在一种具体的实施方式中,截取位于所述页码区间的所述目标工程量清单表格的数据的方式为:根据所述目标工程量清单表格的横竖线条截取所述目标工程量清单表格中各单元格中的所述数据。
具体而言,识别PDF或Word文件中的目标工程量清单表格的横竖线条,依据横竖线的分割,截取目标工程量清单表格中各单元格中的数据,并将截取的数据以行列二维数组的方式转化为JSON数据。
S104:对所述JSON数据进行排版布局,形成表格形式的二维数组;
S105:根据预设匹配规则录入所述二维数组。
具体的,将截取的数据转化为JSON数据后,进一步对JSON数据进行排版布局,形成表格形式的二维数组,并最终依据预设匹配规则录入二维数组。
其中,在一种具体的实施方式中,对所述JSON数据进行排版布局,形成表格形式的二维数组的方式为:通过将所述JSON数据的列关键字与预设列关键字进行比对,定位所述JSON数据所在列;以定位的所述JSON数据所在列为首,划分行间步距与列间步距;根据所述行间步距与所述列间步距对所述JSON数据进行排版布局,形成表格形式的二维数组。
具体而言,通常工程量清单表格包含表格名称、工程名称、序号、项目编号、清单名称、计量单位、工程量、主要技术条款编码以及页码,因此,预设列关键字可以包含序号、编号、名称、单位、工程量等等。将JSON数据的列关键字与预设列关键字进行比对即可定位JSON数据所在列。以定位的列为首,划分行间步距与列间步距,对所述JSON数据进行排版布局,形成表格形式的二维数组。进而以列之间的步距和表头匹配规则即预设匹配规则,录入二维数组,由此完成数据的录入。
另外,对所述JSON数据进行排版布局,形成表格形式的二维数组前还包括:对所述JSON数据进行数据清洗。
具体而言,目标工程量清单表格中可能存在空列、无关列,转化得到的JSON数据中可能存在空数据,另外,目标工程量清单表格表头与列头不需要导入到工程造价软件中,为此,在对JSON数据重新进行排版布局,形成表格形式的二维数组前,首先进行数据清洗,去除其中的空数据以及表头与列头,保留实际需要导入到工程造价软件的数据。其中,JSON数据中可能存在的表头与列头可通过模糊识别的方式寻找。
进一步,在上述实施例的基础上,还包括:
检查导入的数据是否符合预设规则;
若不符合预设规则,则进行调整提示。
具体而言,本实施例在数据导入后,进一步进行合理性规则检查,检查导入的数据是否符合预设规则,如果数据不符合预设规则,则进行调整提示,此时用户可以选择进行人工调整,如图2所示。相反,如果数据符合预设规则,则不进行调整提示。在图2所示的提示下,用户可以通过点击确定选项而进入人工调整流程,用户也可以点击取消选项,而忽略本次提醒。
进一步,在上述实施例的基础上,还包括:
当用户触发调整操作后,将所述数据以表格的形式打开,以便用户对所述数据进行调整。
具体而言,用户触发调整操作后,即用户点击图2所述的确定选项后,将数据以表格的形式打开,以便用户对所述数据进行手动调整。其中,所打开的表格中可以有根据检测规则做出的数据不完整或者数据不符合规则的标记和提示。例如,如图3所示,打开的表格中存在细目名称需要合并单元各的提示。用户根据提示做好数据的修改和调整后,再对表格进行保存操作,然后将表格拖拉入工程造价软件再次进行导入操作。
本实施例在数据导入后对数据存在的合理性和完整性的检查,进一步跟进了数据的准确性,大大增加了导入数据后修改的灵活性,更便捷了用户操作。
综上所述,本申请所提供的工程造价软件的数据录入方法,在读取目标文件后,通过对目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间,进而截取位于所述页码区间的所述目标工程量清单表格的数据,并将数据自动录入。较之手工录入的传统技术方案,本申请所提供的数据录入方法能够实现数据自动录入,由此能够极大的提高数据录入的效率,降低出错概率。
本申请还提供了一种工程造价软件的数据录入装置,下文描述的该装置可以与上文描述的方法相互对应参照。请参考图4,图4为本申请实施例所提供的一种工程造价软件的数据录入装置的示意图,结合图4所示,该装置包括:
读取模块10,用于读取目标文件;
定位模块20,用于通过对所述目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间;
截取模块30,用于截取位于所述页码区间的所述目标工程量清单表格的数据,并将截取的所述数据转化为JSON数据;
排版模块40,用于对所述JSON数据进行排版布局,形成表格形式的二维数组;
录入模块50,用于根据预设匹配规则录入所述二维数组。
在上述实施例的基础上,可选的,所述定位模块20包括:
提取单元,用于提取所述目标文件的文件内容的长字符集;
定位单元,用于对所述长字符集进行关键字正则匹配,定位目标工程量清单表格所在的页码区间。
在上述实施例的基础上,可选的,所述截取模块30具体用于根据所述目标工程量清单表格的横竖线条截取所述目标工程量清单表格中各单元格中的所述数据。
在上述实施例的基础上,可选的,所述排版模块40包括:
比对单元,用于通过将所述JSON数据的列关键字与预设列关键字进行比对,定位所述JSON数据所在列;
划分单元,用于以定位的所述JSON数据所在列为首,划分行间步距与列间步距;
排版单元,用于根据所述行间步距与所述列间步距对所述JSON数据进行排版布局,形成表格形式的二维数组。
在上述实施例的基础上,可选的,还包括:
清洗模块,用于对所述JSON数据进行数据清洗。
在上述实施例的基础上,可选的,还包括:
检查模块,用于检查导入的所述数据是否符合预设规则;
提示模块,用于若不符合预设规则,则进行调整提示。
在上述实施例的基础上,可选的,还包括:
打开模块,用于当用户触发调整操作后,将所述数据以表格的形式打开,以便用户对所述数据进行调整。
本申请还提供了一种工程造价软件的数据录入设备,参考图5所示,该设备包括存储器1和处理器2。
存储器1,用于存储计算机程序;
处理器2,用于执行计算机程序实现如下的步骤:
读取目标文件;通过对所述目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间;截取位于所述页码区间的所述目标工程量清单表格的数据,并将截取的所述数据转化为JSON数据;对所述JSON数据进行排版布局,形成表格形式的二维数组;根据预设匹配规则录入所述二维数组。
对于本申请所提供的设备的介绍请参照上述方法实施例,本申请在此不做赘述。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现如下的步骤:
读取目标文件;通过对所述目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间;截取位于所述页码区间的所述目标工程量清单表格的数据,并将截取的所述数据转化为JSON数据;对所述JSON数据进行排版布局,形成表格形式的二维数组;根据预设匹配规则录入所述二维数组。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory ,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本申请所提供的计算机可读存储介质的介绍请参照上述方法实施例,本申请在此不做赘述。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备以及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的技术方案进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围。

Claims (10)

1.一种工程造价软件的数据录入方法,其特征在于,包括:
读取目标文件;
通过对所述目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间;
截取位于所述页码区间的所述目标工程量清单表格的数据,并将截取的所述数据转化为JSON数据;
对所述JSON数据进行排版布局,形成表格形式的二维数组;
根据预设匹配规则录入所述二维数组。
2.根据权利要求1所述的数据录入方法,其特征在于,所述通过对所述目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间包括:
提取所述目标文件的文件内容的长字符集;
对所述长字符集进行关键字正则匹配,定位目标工程量清单表格所在的页码区间。
3.根据权利要求1所述的数据录入方法,其特征在于,所述截取位于所述页码区间的所述目标工程量清单表格的数据,包括:
根据所述目标工程量清单表格的横竖线条截取所述目标工程量清单表格中各单元格中的所述数据。
4.根据权利要求1所述的数据录入方法,其特征在于,所述对所述JSON数据进行排版布局,形成表格形式的二维数组包括:
通过将所述JSON数据的列关键字与预设列关键字进行比对,定位所述JSON数据所在列;
以定位的所述JSON数据所在列为首,划分行间步距与列间步距;
根据所述行间步距与所述列间步距对所述JSON数据进行排版布局,形成表格形式的二维数组。
5.根据权利要求1所述的数据录入方法,其特征在于,所述对所述JSON数据进行排版布局,形成表格形式的二维数组前还包括:
对所述JSON数据进行数据清洗。
6.根据权利要求1所述的数据录入方法,其特征在于,还包括:
检查导入的所述数据是否符合预设规则;
若不符合预设规则,则进行调整提示。
7.根据权利要求6所述的数据录入方法,其特征在于,还包括:
当用户触发调整操作后,将所述数据以表格的形式打开,以便用户对所述数据进行调整。
8.一种工程造价软件的数据录入装置,其特征在于,包括:
读取模块,用于读取目标文件;
定位模块,用于通过对所述目标文件的文件内容进行关键字正则匹配,定位目标工程量清单表格所在的页码区间;
截取模块,用于截取位于所述页码区间的所述目标工程量清单表格的数据,并将截取的所述数据转化为JSON数据;
排版模块,用于对所述JSON数据进行排版布局,形成表格形式的二维数组;
录入模块,用于根据预设匹配规则录入所述二维数组。
9.一种工程造价软件的数据录入设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的工程造价软件的数据录入方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的工程造价软件的数据录入方法的步骤。
CN202110313469.0A 2021-03-24 2021-03-24 一种工程造价软件的数据录入方法及相关装置 Pending CN112699635A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110313469.0A CN112699635A (zh) 2021-03-24 2021-03-24 一种工程造价软件的数据录入方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110313469.0A CN112699635A (zh) 2021-03-24 2021-03-24 一种工程造价软件的数据录入方法及相关装置

Publications (1)

Publication Number Publication Date
CN112699635A true CN112699635A (zh) 2021-04-23

Family

ID=75515629

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110313469.0A Pending CN112699635A (zh) 2021-03-24 2021-03-24 一种工程造价软件的数据录入方法及相关装置

Country Status (1)

Country Link
CN (1) CN112699635A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113409001A (zh) * 2021-05-17 2021-09-17 林基础 一种控制建筑工程工程量清单自动组价的方法
CN114724158A (zh) * 2022-04-21 2022-07-08 北京梦诚科技有限公司 一种工程量审核方法、系统、电子设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897690A (zh) * 2017-02-22 2017-06-27 南京述酷信息技术有限公司 Pdf表格提取方法
CN110457302A (zh) * 2019-07-31 2019-11-15 河南开合软件技术有限公司 一种结构化数据智能清洗方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897690A (zh) * 2017-02-22 2017-06-27 南京述酷信息技术有限公司 Pdf表格提取方法
CN110457302A (zh) * 2019-07-31 2019-11-15 河南开合软件技术有限公司 一种结构化数据智能清洗方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YOOONGCHUN: "提取指定的PDF表格保存到Excel", 《HTTPS://WWW.CNBLOGS.COM/YCZHA/P/13160206.HTML》 *
梁俊有等: "表格数据直接录入数据库方法探讨", 《洛阳工业高等专科学校学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113409001A (zh) * 2021-05-17 2021-09-17 林基础 一种控制建筑工程工程量清单自动组价的方法
CN114724158A (zh) * 2022-04-21 2022-07-08 北京梦诚科技有限公司 一种工程量审核方法、系统、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN110909226B (zh) 金融类文档信息处理方法、装置、电子设备及存储介质
CA2895917C (en) System and method for data extraction and searching
US10049096B2 (en) System and method of template creation for a data extraction tool
Shen et al. A large dataset of historical japanese documents with complex layouts
US20050289182A1 (en) Document management system with enhanced intelligent document recognition capabilities
CN112699635A (zh) 一种工程造价软件的数据录入方法及相关装置
CN1492377A (zh) 表格处理系统及方法
EP3022659A1 (en) Systems and methods for extracting table information from documents
US9286526B1 (en) Cohort-based learning from user edits
EP3588376A1 (en) System and method for enrichment of ocr-extracted data
CN110110313A (zh) 文档表格解析方法及装置
CN111914805A (zh) 表格结构化方法、装置、电子设备及存储介质
CN115828874A (zh) 基于图像识别技术的行业表格数字化处理方法
CN115240213A (zh) 表格图像识别方法、装置、电子设备及存储介质
CN111539414B (zh) 一种ocr图像字符识别和字符校正的方法及系统
US10643022B2 (en) PDF extraction with text-based key
RU2597163C2 (ru) Сравнение документов с использованием достоверного источника
CN113158988A (zh) 财务报表处理方法、装置以及计算机可读存储介质
Hocking et al. Optical character recognition for South African languages
US7016535B2 (en) Pattern identification apparatus, pattern identification method, and pattern identification program
CN115116084A (zh) 引注识别方法、装置、设备及存储介质
US11256760B1 (en) Region adjacent subgraph isomorphism for layout clustering in document images
JP6968173B2 (ja) 特許クレームにおける参照を特定するためのシステム及び方法
US11651606B1 (en) Method and system for document data extraction
CN115408302B (zh) 一种app多语文案测试方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210423