CN103729464A - 一种报告文档的汇总方法 - Google Patents

一种报告文档的汇总方法 Download PDF

Info

Publication number
CN103729464A
CN103729464A CN201410017617.4A CN201410017617A CN103729464A CN 103729464 A CN103729464 A CN 103729464A CN 201410017617 A CN201410017617 A CN 201410017617A CN 103729464 A CN103729464 A CN 103729464A
Authority
CN
China
Prior art keywords
report
bookmark
file
minute
configuration file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410017617.4A
Other languages
English (en)
Inventor
胡建明
邓春光
赵阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING SHENZHOU PUHUI SCIENCE & TECHNOLOGY Co Ltd
Original Assignee
BEIJING SHENZHOU PUHUI SCIENCE & TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING SHENZHOU PUHUI SCIENCE & TECHNOLOGY Co Ltd filed Critical BEIJING SHENZHOU PUHUI SCIENCE & TECHNOLOGY Co Ltd
Priority to CN201410017617.4A priority Critical patent/CN103729464A/zh
Publication of CN103729464A publication Critical patent/CN103729464A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了本发明提供的一种报告文档的汇总方法,用于将各分报告文档中的报告项目汇总到总报告文档中,该汇总方法包括以下步骤,建立文档配置文件,该配置文件根据各分报告所包含的报告项目设置标识;根据文档配置文件中的标识依次对分报告文档中的各报告项目进行自动复制并粘贴到总报告中;重复复制粘贴步骤,直至所有分报告文档中的报告项目均完成汇总。本发明的有益效果为:通过在分报告文档中插入书签,使分报告文档的内容摘取和复制能够自动完成,速度快,错误率低,节省人力。

Description

一种报告文档的汇总方法
技术领域
本发明涉及通信技术领域,具体涉及一种报告文档的汇总方法。
背景技术
做汇总报告的时候,需要从不同的分报告文档中摘取不同的内容。现有技术中,需要人工从不同的分报告文档中摘取不同的内容插入到总报告中。在需要大量报告汇总时,人工汇总耗费时间长,且都是单调重复的运动,长时间摘取和插入也容易出错。
发明内容
有鉴于此,本发明提供的一种报告文档的汇总方法,以解决现有技术的上述不足。
为达到上述目的,本发明采用的技术方案是:
一种报告文档的汇总方法,用于将各分报告文档中的报告项目汇总到总报告文档中,该汇总方法包括以下步骤,
101:建立文档配置文件,该配置文件根据各分报告所包含的报告项目设置标识;
102:根据文档配置文件中的标识依次对分报告文档中的各报告项目进行自动复制并粘贴到总报告中;
103:重复步骤102,直至所有分报告文档中的报告项目均完成汇总。自动提取分报告文档中的内容并生成总报告,速度快,错误率低。快捷方便,节省人力。
优选的,步骤101中,标识为分报告文档自带的额定格式标记或额定文字内容。对于很多文件来说,例如试验报告、专利文件等,格式固定,固定项目的前后都有固定的格式和文字,便于定义。
优选的,步骤101中,标识为书签,书签配置文件用于设置分报告文档类型、起始书签、结束书签以及写入书签,步骤102中复制前,将起始书签和结束书签分别插入到分报告文档中各个报告项目的起始和结束处,将写入书签插入到总报告文档中。书签为WORD文档自带,且不占位置。
进一步的,步骤102中编写软件自动插入起始书签、结束书签以及写入书签。自动插入比手动插入更加节省时间且更准确。
进一步的,步骤103中,复制时,若分报告文档中没有文档配置文件中相应的报告项目,予以忽略。多种类型的分报告文档中,可能出现配置文件定义的报告项目某份分报告项目没有,此时予以忽略,以继续文件的运行。
本发明的有益效果为:通过在分报告文档中插入标识,使分报告文档的内容摘取和复制能够自动完成,速度快,错误率低,节省人力。
附图说明
图1为本发明所述报告汇总方法的流程图;
图2为本发明所述报告汇总方法的原理图。
具体实施方式
下面结合附图对本发明的技术方案进行描述,很显然的,附图所描述的仅仅是本发明的一部分而不是全部实施例。
如图1所示,本发明提供的一种报告文档的汇总方法,用于将各分报告文档中的报告项目汇总到总报告文档中,该汇总方法包括以下步骤,建立文档配置文件,该配置文件根据各分报告所包含的报告项目设置标识;根据文档配置文件中的标识依次对分报告文档中的各报告项目进行自动复制并粘贴到总报告中;重复复制粘贴步骤,直至所有分报告文档中的报告项目均完成汇总。在这里,优选标识为书签,下面的实施例也均为书签。书签为word自带,使用方便且不占位置。实际应有中也可使用其他的符号或文字作为标识。
本发明提供的汇总方法,处理模块优选为两个:书签配置文件(MarkConfig.xml)和主处理模块。分报告文档作为内容提取的源文件,总报告文档作为生成对象。书签配置文件用于定义分报告文档中每个段落的起始书签名、结束书签名和总报告中需要合并的位置书签,代码主处理模块主要用于打开分报告文档、总报告文档、读取书签配置文件并按书签配置文件执行内容提取和内容插入工作。
具体应用时,如图2所示,图中,上方为书签配置文件,下方左侧为分报告文档,下方右侧为总报告。图中采用一个分报告文档作为示例性说明,分报告文档和总报告都是汇总完成后的效果。
书签配置文件配置的是所有分报告文档中的书签,按type进行区别模板类别,其中主要节点在于writer节点属性的定义,writer节点包括以下属性:
序号 属性 描述
1 Type(11) 描述本节点所属分报告文档类型
2 Name(12) 描述书签定义在word分报告文档中位置的内容的名称。
3 Start(13) 描述在word分报告文档中某一段落起始书签名。
4 End(14) 描述在word分报告文档中某一段落结束书签名。
5 writeTo(15) 描述在word总报告中某一段落位置书签名。
图2中,Type为分报告文档类型,Name为书签名称,Start为起始书签,End为结束书签,writeTo为写入书签。
图2的分报告文档为动力学试验示例,其中用书签标记的部分为需要汇总到总报告中的内容段落,分别检测项目、试验日期、结论与建议,在这三个段落中每一段落前后都有一书签,书签插入方法为:第一步点击word选项-->高级-->显示书签-->确定;第二步点击word菜单插入-->书签-->输入书签名称(同图中的start和end属性一致)。插入时,可以人工插入,也可以编辑软件自动插入。段落判别和书签插入均为简单的word操作,本领域技术人员不付出创造性劳动即可编辑出上述软件,在此不赘述。当自动插入时,可以以word文档的各种格式标记或额定文字作为插入位置,例如专利文件中以说明书起始位置和第一个段落标记为符号,提取的就是专利的名称。以“背景技术”和“发明内容”为插入位置则可汇总背景技术内容。
图2中右下侧为总报告,书签定义方式与分报告文档中一致,利用本发明汇总报告的方法,执行第一步根据配置文件markConfig.xml中的定义的起始书签(上图中13)和结束书签(图中14)找到分报告文档中的内容段落用程序进行复制,执行第二步根据配置文件markConfig.xml中定义的总报告写入书签(上图中15)找到总报告中写入位置进行粘贴,循环执行第一步、第二步将所有分报告文档内容汇总到总报告中来完成报告生成。
本发明提供的汇总方法,在上例中,书签配置文件包括四个单元:分报告文档类型、书签名称、起始书签以及结束书签,这样的配置在文件编写时每份分报告的每对书签均需要一行文件,例如分报告有100份,每份需要提取3个内容,这样书签配置文件就需要300行.作为更进一步的改进,可以只包含书签名称单元、起始书签单元以及结束书签单元这三个单元,其中书签名称单元穷举所有需要的单元,这样,在分报告较多时,能极大的减少文件的编写量。在实际运行时,分报告逐项运行文件,分报告具有的书签名称予以提取和插入,分报告没有的类型自动予以忽略,运行下一行。还是上例,这100份分报告提取的3个内容可能仅三个类型,采用第二种方法仅需三行文件就够了。
本发明提供的汇总方法,上述方法中标识均为插入的书签,很显然的,实际上,不通过插入书签也是可以定义的,例如专利文件中的专利名称,定义为说明书中背景技术前面的内容即可。不通过插入标识也可以是因为在众多具有固定格式的文件中,文件中每个报告项目前后的文字或格式标记都是固定的。凭借这些文字和格式标记即可定义这些报告项目。同是专利文件,定义背景技术为说明书中文字“背景技术”和“发明内容”或“实用新型内容”之间的部分即可,提取和粘贴时亦然。
本发明提供的汇总方法,优选实施例如图1所示,步骤S11则打开分报告文档,步骤S12根据分报告文档名称在配置文件markConfig.xml中找到相应类型type的writer节点,根据writer节点中定义的起始书签start和结束书签end找到分报告文档中的内容段落,步骤S13用程序进行复制,步骤S14根据配置文件markConfig.xml中定义的总报告写入书签找到总报告中写入位置进行粘贴,循环执行步骤S12、S13、S14完成单份分报告文档汇总到总报告,循环执行步骤S11、S12、S13、S14完成多份分报告文档汇总到总报告。
利用本发明,可提取一份或多分报告文档内容并自动汇总成总报告,此方法或用于B/S、C/S结构软件,不限开发语言。
上述技术方案的描述仅体现了本发明的优选技术方案,而并不是无遗漏的,或者将本发明限于所公开的形式。基于本发明的实施例,任何人在没有做出创造性劳动的前提下所获得的其他形式的技术方案,不论其在结构或形式上作出何种变化,均属于本发明的保护范围之内。

Claims (5)

1.一种报告文档的汇总方法,其特征在于,用于将各分报告文档中的报告项目汇总到总报告文档中,该汇总方法包括以下步骤,
101:建立文档配置文件,该配置文件根据各分报告所包含的报告项目设置标识;
102:根据文档配置文件中的标识依次对分报告文档中的各报告项目进行自动复制并粘贴到总报告中;
103:重复步骤102,直至所有分报告文档中的报告项目均完成汇总。
2.根据权利要求1所述的报告汇总方法,其特征在于,步骤101中,标识为分报告文档自带的额定格式标记或额定文字内容。
3.根据权利要求1所述的报告汇总方法,其特征在于,步骤101中,标识为书签,书签配置文件用于设置分报告文档类型、起始书签、结束书签以及写入书签,步骤102中复制前,将起始书签和结束书签分别插入到分报告文档中各个报告项目的起始和结束处,将写入书签插入到总报告文档中。
4.根据权利要求3所述的报告汇总方法,其特征在于,步骤102中编写软件自动插入起始书签、结束书签以及写入书签。
5.根据权利要求1-4任一项所述的报告汇总方法,其特征在于,步骤103中,复制时,若分报告文档中没有文档配置文件中相应的报告项目,予以忽略。
CN201410017617.4A 2014-01-15 2014-01-15 一种报告文档的汇总方法 Pending CN103729464A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410017617.4A CN103729464A (zh) 2014-01-15 2014-01-15 一种报告文档的汇总方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410017617.4A CN103729464A (zh) 2014-01-15 2014-01-15 一种报告文档的汇总方法

Publications (1)

Publication Number Publication Date
CN103729464A true CN103729464A (zh) 2014-04-16

Family

ID=50453538

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410017617.4A Pending CN103729464A (zh) 2014-01-15 2014-01-15 一种报告文档的汇总方法

Country Status (1)

Country Link
CN (1) CN103729464A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105786779A (zh) * 2016-03-01 2016-07-20 万达信息股份有限公司 Wps在线插件中实现基于文档模板的多行报告的方法
CN112256459A (zh) * 2020-11-18 2021-01-22 四川长虹电器股份有限公司 一种可自定义复制粘贴文档中的文字的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1952925A (zh) * 2005-10-17 2007-04-25 佳能株式会社 文档处理设备和方法
CN101388036A (zh) * 2008-10-08 2009-03-18 金蝶软件(中国)有限公司 一种数据表的汇总方法和装置
US20090150394A1 (en) * 2007-12-06 2009-06-11 Microsoft Corporation Document Merge
CN101477517A (zh) * 2009-01-21 2009-07-08 传神联合(北京)信息技术有限公司 一种office文档编辑多点远程同步的方法
CN102323927A (zh) * 2011-07-29 2012-01-18 无锡永中软件有限公司 一种文档合并方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1952925A (zh) * 2005-10-17 2007-04-25 佳能株式会社 文档处理设备和方法
US20090150394A1 (en) * 2007-12-06 2009-06-11 Microsoft Corporation Document Merge
CN101388036A (zh) * 2008-10-08 2009-03-18 金蝶软件(中国)有限公司 一种数据表的汇总方法和装置
CN101477517A (zh) * 2009-01-21 2009-07-08 传神联合(北京)信息技术有限公司 一种office文档编辑多点远程同步的方法
CN102323927A (zh) * 2011-07-29 2012-01-18 无锡永中软件有限公司 一种文档合并方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
卓正软件: ""如何把服务器上的多个Word文档合并到一个Word文档中并且动态填充指定的内容"", 《HTTP://WWW.ZHUOZHENGSOFT.COM/PAGEOFFICE-ALL-DETAILS.ASPX?ID=34&FLG=RM》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105786779A (zh) * 2016-03-01 2016-07-20 万达信息股份有限公司 Wps在线插件中实现基于文档模板的多行报告的方法
CN105786779B (zh) * 2016-03-01 2019-03-05 万达信息股份有限公司 Wps在线插件中实现基于文档模板的多行报告的方法
CN112256459A (zh) * 2020-11-18 2021-01-22 四川长虹电器股份有限公司 一种可自定义复制粘贴文档中的文字的方法

Similar Documents

Publication Publication Date Title
CN104346319B (zh) 检查文档样式的方法及系统
CN109492203B (zh) 一种核电大型综合报告格式校验方法及系统
CN103123618B (zh) 文本相似度获取方法和装置
CN102254009B (zh) 一种网页表格数据抽取的方法
CN104063380A (zh) 将图片类文件转换为网页文件的方法和装置
JP5930496B2 (ja) レイアウトファイルにおける構造化情報の取得方法及び装置
WO2019080402A1 (zh) 结构化文本的文本信息提取方法、存储介质和服务器
CN101770446A (zh) 一种版式文件中表格识别方法及系统
CN101727438B (zh) 一种数字报刊版面信息的自动提取方法
CN102970373B (zh) 一种数据同步方法、装置及系统
CN103514274A (zh) 非关系型数据库HBase的数据迁移方法
CN102591612A (zh) 一种基于标点连续性的通用网页正文提取方法及其系统
CN105718584A (zh) 网页正文提取的方法及装置
CN109683881B (zh) 一种代码格式调整方法及装置
CN103778259A (zh) 基于Sqlite3实现智能手机数据恢复的方法
CN108665244B (zh) 基于61850模型的定值单自动生成方法及存储介质
CN105488471B (zh) 一种字形识别方法及装置
CN104657347A (zh) 一种面向新闻优化阅读类移动应用的自动摘要方法
CN102521713B (zh) 数据处理装置和数据处理方法
CN103729464A (zh) 一种报告文档的汇总方法
CN104217025B (zh) 针对多记录网页的记录项抽取系统及方法
CN109783784A (zh) 一种基于最小表单组合的数据处理方法和表单生成器
CN103853771A (zh) 一种搜索结果的推送方法及系统
CN104699664A (zh) 一种模板独立的排版系统及方法
CN113094442A (zh) 全量数据同步方法、装置、设备和介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140416