CN102841886A - 拆分文档的方法和装置 - Google Patents

拆分文档的方法和装置 Download PDF

Info

Publication number
CN102841886A
CN102841886A CN2011101682413A CN201110168241A CN102841886A CN 102841886 A CN102841886 A CN 102841886A CN 2011101682413 A CN2011101682413 A CN 2011101682413A CN 201110168241 A CN201110168241 A CN 201110168241A CN 102841886 A CN102841886 A CN 102841886A
Authority
CN
China
Prior art keywords
paragraph
file
document
paragraph style
style
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011101682413A
Other languages
English (en)
Other versions
CN102841886B (zh
Inventor
岳永强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201110168241.3A priority Critical patent/CN102841886B/zh
Publication of CN102841886A publication Critical patent/CN102841886A/zh
Application granted granted Critical
Publication of CN102841886B publication Critical patent/CN102841886B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种拆分文档的方法和装置,其方法包括:解析出原始文档的xml格式的内容文件和段落样式文件;在所述内容文件中,查找应用所述段落样式文件中的每个段落样式的段落位置;将所述查找到的各个段落位置处的段落内容分别输出到不同的新文档中。本发明提供了一种拆分文档的装置。本发明的实施例通过解析原始文档的内容文件和段落样式文件,通过段落样式文件中段落样式对内容文件中的内容进行拆分,提取出的内容存储到新的文档中。所以克服了人工直接从文档中提取内容,拆分成新的文档效率较低的问题,达到了高效、快捷的效果。

Description

拆分文档的方法和装置
技术领域
本发明涉及印刷领域,具体而言,涉及一种拆分文档的方法和装置。
背景技术
图书通常由主书名页、文前辅文、正文、文中辅文和文后辅文这几个部分组成。其中,正文由篇、章和节组成。通过对图书数字化处理,可将图书以电子文档的形式保存。
在图书出版前,需要对图书进行编纂。由于图书是由多个部分组成,在编纂过程中,可将各个部分由不同的作者编纂。例如,将含有一本图书内容的文档进行拆分,拆分为三个文档,再将三个文档交给三个不同的作者处理,如审校、修改或排版等。
目前对文档进行拆分的过程,采用人工的方式进行拆分。这种拆分方式存在效率低、时间长的问题,影响了图书的出版时间。
发明内容
本发明旨在提供一种拆分文档的方法和装置,以解决上述人工拆分文档效率低、时间长的问题。
在本发明的实施例中,提供了一种拆分文档的方法,包括:解析出原始文档的xml格式的内容文件和段落样式文件;在所述内容文件中,查找应用所述段落样式文件中的每个段落样式的段落位置;将所述查找到的各个段落位置处的段落内容分别输出到不同的新文档中。
在本发明的实施例中,提供了一种拆分文档的装置,包括:解析模块,用于解析出原始文档的xml格式的内容文件和段落样式文件;查找模块,用于在所述内容文件中,查找应用所述段落样式文件中的每个段落样式的段落位置;拆分模块,用于将所述查找到的各个段落位置处的段落内容分别输出到不同的新文档中。
本发明的实施例通过解析原始文档的内容文件和段落样式文件,通过段落样式文件中段落样式对内容文件中的内容进行拆分,提取出的内容存储到新的文档中。所以克服了人工直接从文档中提取内容,拆分成新的文档效率较低的问题,达到了高效、快捷的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了本发明实施例一的流程图;
图2示出了本发明实施例二的流程图;
图3示出了本发明实施例中所显示的内容文件的屏幕截图;
图4示出了本发明实施例中所显示的段落样式文件的屏幕截图;
图5示出了本发明实施例三的流程图;
图6示出了本发明实施例中所显示的实例文件的屏幕截图;
图7示出了本发明实施例中所显示的大纲文件的屏幕截图;
图8示出了本发明实施例四的装置结构框图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。参见图1,实施例一包括以下步骤:
步骤S11:解析出原始文档的xml格式的内容文件和段落样式文件。
原始文档是由多个文件组成,至少包括记录原始文档中存储的字数数据的xml格式的内容文件,规定字符数据显示的段落结构样式存储在xml格式的段落样式文件中。如word格式的文档,通过压缩/解压算法,可提取出xml格式的内容文件和段落样式文件。
步骤S12:在所述内容文件中,查找应用所述段落样式文件中的每个段落样式的段落位置。
步骤S13:将所述查找到的各个段落位置处的段落内容分别输出到不同的新文档中。
通过在内容文件中按照各个段落样式查找的段落位置,将原始文档分为各个不同的新的文档。由于不同的段落样式体现了文档的结构,通过段落样式拆分文档,可将原始文档规范的拆分为多个文档,且处理时间短,效率高。
各个不同的新文档采用不同的段落样式结构,以便于后续的处理、编纂。
在内容文件中查找段落样式文件中的各个段落样式、以及输出文档的过程,可有多种不同的方式,下面给出优选的方式并通过实施例二说明,参见图2,包括以下步骤:
S21:解析出原始文档的xml格式的内容文件和段落样式文件。
S22:在所述内容文件中遍历所述段落样式文件中的每个段落样式所对应的段落样式ID。
内容文件存在的段落样式ID与段落样式文件中的段落样式具有对应关系。
参见图3、图4所示的内容文件、段落样式文件的屏幕截图,图3中所示的ID为<w:P style w:val=“1”/>,说明段落样式ID为“1”,该段落样式ID对应图4中的段落样式名称为“章标题”的段落样式。参见图4的屏幕截图上所示的命令参数:
<w:style w:type  =“paragraph”w:styleid=“1”/>,
<w:name w:val=“章标题”/>
该命令参数为段落样式ID为“1”,段落样式的名称为“章标题”。通过这种对应关系,可在内容文件中找到对应段落样式文件中各个段落样式的段落样式ID。
S23:查找当前的所述段落样式ID在所述内容文件中所对应的所有标识段落的段落标记作为所述段落位置。
在内容文件中找到段落样式ID后,可查找到应用该段落样式ID所对应的段落样式的各个段落。参见图3,遍历与段落样式ID为“1”对应的段落标记<w:p>,统计遍历到的段落标记数量。
S24:为所述段落标记排序并记录序号。
在内容文件中,会有多个段落样式ID,每个段落样式ID又分别与段落标记相对应,为这些段落标记排序并记录序号后,可区别出应用不同段落样式的各个段落。序号包括起始序号和结束序号,例如:在内容文件中应用段落样式名称为“章标题”的段落样式共有5段,对应的起始序号为3,结束序号为7。
S25:将所述记录的序号与所述不同的新文档的标识建立关联关系。
创建新文档,将记录的起始序号、结束序号与新文档的标识建立关联关系。
S26:在所述内容文件中提取所述起始序号和结束序号之间的段落内容,存储到对应的所述新文档中。
在本实施例中,将起始序号为3、结束序号为7之间的段落的内容存储到新的文档中。
通过上述的过程,将内容文件中应用各个不同段落样式的各个段落的内容,存储到相应的各个不同的新文档中。
为便于对内容文件和段落样式文件进行处理,本发明的实施例还创建用于存储原始文档的段落样式的结构的大纲文件。大纲文件采用xml格式,其每个节点对应一种段落样式,将为每个段落样式ID记录的序号与不同的新文档的标识建立关联关系,并存储到大纲文件的相应节点内。使用大纲文件,按照记录的序号,从内容文件中提取各个段落的内容存储到相关联的文档内。下面通过实施例三详细说明,参见图5,包括以下步骤:
S31:预先通过schema文件生成树形实例文件;
schema文件定义了构成原始文档的各个元素的之间的结构关系,将元素的名称作为所述实例文件的节点的名称。
通过schema文件,可定义多种不同段落样式结构的多个原始文档。如在其中一个原始文档中的“章标题”的段落样式下添加“节标题”的段落样式;在另一个原始文档的“正文”段落样式下添加“文前辅文”的段落样式。
由于各个原始文档的各个元素之间的结构关系,都是通过schema文件定义,通过schema文件生成的实例文件,包含最全的文档的段落样式的结构关系,这些结构关系通过文档的各个元素之间的关系体现。实例文件的体现各个段落样式之间结构的屏幕截图可参见图6。
S32:在所述段落样式文件中查找到与段落样式ID对应的段落样式的名称。
原始文档的段落样式文件中包括多个段落样式,每个段落样式的名称也存在于段落样式文件中,如图4中的段落样式名称“章标题”。
S33:使用所述查找的段落样式的名称,遍历所述实例文件中具有相同名称的节点,采用遍历到的节点构建所述大纲文件。
原始文档通过schema文件定义生成的,通schema文件生成的实施文件的各个节点的名称包括原始文档的段落样式文件中的段落样式名称。通过在实例文件中遍历原始文档的段落样式文件中的段落样式名称,可映射出原始文档的段落样式之间的结构。
S34:解析出原始文档的xml格式的内容文件和段落样式文件。
S35:在所述内容文件中遍历所述段落样式文件中的每个段落样式所对应的段落样式ID。
S36:查找当前的所述段落样式ID在所述内容文件中所对应的所有标识段落的段落标记作为所述段落位置。
S37:为所述段落标记排序并记录序号。
S38:将所述记录的序号与所述不同的新文档的标识建立关联关系,将关联关系存储到大纲文件中。
存储关联关系的大纲文件可参见图7,大纲文件中,段落样式的名称为“一级标题”,段落样式的ID为“3”,起始序号paraIndex和结束序号paraEnd均为“2”,关联的新文档的标识为“template=1747”。将这些作为属性值存储在该节点中。
S39:在所述内容文件中提取所述起始序号和结束序号之间的段落内容,存储到对应的所述新文档中。
提取内容文件中相应段落的内容,通过大纲文件存储的关联关系,将提取的内容存储到新的文档中。
在提取过程中,可创建以下的命令形式:
Figure BSA00000522206300071
Figure BSA00000522206300081
上述命令中,Name值为SplitDocument表示自动拆分命名;TaskId值表示当前任务的GUID值;命令参数:DocumentId表示图书主文档的资源ID,如定义原始文档的schema文件和实例文件。用于拆分后的各个新的子文档关联原始的主文档;命令参数:Word表示当前主文档的GUID值,用于从数据库里获取原始文档;命令参数:xml表示当前的原始文档的大纲文件和GUID值,用于拆分原始文档,并输出到新的文档。
调用该command机制后,从原始文档的大纲文件中得到paraIndex和paraEnd属性值,在原始文档的内容文件中确定需要拆分的文档区域;利用word的API函数获取段数大于paraEnd的内容区域、段数小于paraIndex的内容区域将其删除,或者提取段数在paraIndex和paraEnd之间的区域的内容,存储到新的文档,实现对文档的拆分。
上述的实施例详细说明了本发明拆分文档的过程,本发明还提供一种拆分文档的装置,该装置可集成在计算机、服务器等电子设备中,该装置的内部可采用多种形式的结构,下面通过实施例四详细说明一种优选的方式。参见图8,该装置包括:
解析模块41,用于解析出原始文档的xml格式的内容文件和段落样式文件;
查找模块42,用于在所述解析模块41解析出的内容文件中,查找应用所述段落样式文件中的每个段落样式的段落位置;
拆分模块43,用于将所述查找模块42查找到的各个段落位置处的段落内容分别输出到不同的新文档中。
优选地,所述查找模块42包括:
段落样式查找模块421,用于在所述解析模块41解析出的内容文件中遍历所述段落样式文件中的每个段落样式所对应的段落样式ID;
段落标记查找模块422,用于根据段落样式查找模块421查找到的段落样式ID,查找当前的所述段落样式ID在所述内容文件中所对应的所有标识段落的段落标记作为所述段落位置;
排序模块423,用于为所述段落标记查找模块422查找的段落标记排序并记录序号。
优选地,所述拆分模块43包括:
创建模块431,用于创建所述不同的新文档;
关联模块432,用于将所述排序模块423记录的序号与所述创建模块431创建的不同的新文档的标识建立关联关系;所述序号包括起始序号和结束序号;
提取模块433,用于按照所述关联模块432建立的关联关系,在所述内容文件中提取所述起始序号和结束序号之间的段落内容,存储到对应的所述新文档中。
优选地,该装置还包括:
大纲创建模块44,用于建立含有所述原始文档的段落样式的结构的大纲文件,其中,所述大纲文件为xml格式,其节点的名称来自所述段落样式文件中各个段落样式的名称;
属性模块45,用于将所述关联模块432建立的关联关系作为属性值存储在所述大纲创建模块44创建的大纲文件的各个节点中。
优选地,所述大纲创建模块44包括:
实例文件模块441,用于预先通过schema文件生成树形实例文件;其中,所述schema文件定义了构成所述原始文档的各个元素的之间的结构关系,将所述元素的名称作为所述实例文件的节点的名称;
段落样式名称匹配模块442,用于在所述解析模块41解析出的段落样式文件中查找到与所述段落样式ID对应的段落样式的名称;
节点匹配模块443,用于使用所述段落样式名称匹配模块442查找的段落样式的名称,遍历所述实例文件模块441创建的实例文件中具有相同名称的节点;
映射模块444,用于采用节点匹配模块443遍历到的节点构建所述大纲文件。
从以上的描述中可以看出,本发明上述的实施例通过段落样式对文档进行拆分,可按照文档的段落结构,将文档拆分为多个文档,时间短,效率高。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种拆分文档的方法,其特征在于,包括:
解析出原始文档的xml格式的内容文件和段落样式文件;
在所述内容文件中,查找应用所述段落样式文件中的每个段落样式的段落位置;
将所述查找到的各个段落位置处的段落内容分别输出到不同的新文档中。
2.根据权利要求1所述的方法,其特征在于,所述查找的过程包括:
在所述内容文件中遍历所述段落样式文件中的每个段落样式所对应的段落样式ID;
查找当前的所述段落样式ID在所述内容文件中所对应的所有标识段落的段落标记作为所述段落位置;
为所述段落标记排序并记录序号。
3.根据权利要求2所述的方法,其特征在于,所述输出的过程包括:
创建所述不同的新文档;
将所述记录的序号与所述不同的新文档的标识建立关联关系;
所述序号包括起始序号和结束序号;
在所述内容文件中提取所述起始序号和结束序号之间的段落内容,存储到对应的所述新文档中。
4.根据权利要求3所述的方法,其特征在于,还包括:
建立含有所述原始文档的段落样式的结构的大纲文件,其中,所述大纲文件为xml格式,其节点的名称来自所述段落样式文件中各个段落样式的名称;
将所述建立的关联关系作为属性值存储在所述各个节点中。
5.根据权利要求4所述的方法,其特征在于,所述建立含有文档的段落样式的结构的大纲文件包括:
预先通过schema文件生成树形实例文件;其中,所述schema文件定义了构成所述原始文档的各个元素的之间的结构关系,将所述元素的名称作为所述实例文件的节点的名称;
在所述段落样式文件中查找到与所述段落样式ID对应的段落样式的名称;
使用所述查找的段落样式的名称,遍历所述实例文件中具有相同名称的节点;
采用遍历到的节点构建所述大纲文件。
6.一种拆分文档的装置,其特征在于,包括:
解析模块,用于解析出原始文档的xml格式的内容文件和段落样式文件;
查找模块,用于在所述内容文件中,查找应用所述段落样式文件中的每个段落样式的段落位置;
拆分模块,用于将所述查找到的各个段落位置处的段落内容分别输出到不同的新文档中。
7.根据权利要求6所述的装置,其特征在于,所述查找模块包括:
段落样式查找模块,用于在所述内容文件中遍历所述段落样式文件中的每个段落样式所对应的段落样式ID;
段落标记查找模块,用于查找当前的所述段落样式ID在所述内容文件中所对应的所有标识段落的段落标记作为所述段落位置;
排序模块,用于为所述段落标记排序并记录序号。
8.根据权利要求7所述的方法,其特征在于,所述拆分模块包括:
创建模块,用于创建所述不同的新文档;
关联模块,用于将所述记录的序号与所述不同的新文档的标识建立关联关系;所述序号包括起始序号和结束序号;
提取模块,用于在所述内容文件中提取所述起始序号和结束序号之间的段落内容,存储到对应的所述新文档中。
9.根据权利要求8所述的装置,其特征在于,还包括:
大纲创建模块,用于建立含有所述原始文档的段落样式的结构的大纲文件,其中,所述大纲文件为xml格式,其节点的名称来自所述段落样式文件中各个段落样式的名称;
属性模块,用于将所述建立的关联关系作为属性值存储在所述各个节点中。
10.根据权利要求9所述的装置,其特征在于,所述大纲创建模块包括:
实例文件模块,用于预先通过schema文件生成树形实例文件;其中,所述schema文件定义了构成所述原始文档的各个元素的之间的结构关系,将所述元素的名称作为所述实例文件的节点的名称;
段落样式名称匹配模块,用于在所述段落样式文件中查找到与所述段落样式ID对应的段落样式的名称;
节点匹配模块,用于使用所述查找的段落样式的名称,遍历所述实例文件中具有相同名称的节点;
映射模块,用于采用遍历到的节点构建所述大纲文件。
CN201110168241.3A 2011-06-21 2011-06-21 拆分文档的方法和装置 Expired - Fee Related CN102841886B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110168241.3A CN102841886B (zh) 2011-06-21 2011-06-21 拆分文档的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110168241.3A CN102841886B (zh) 2011-06-21 2011-06-21 拆分文档的方法和装置

Publications (2)

Publication Number Publication Date
CN102841886A true CN102841886A (zh) 2012-12-26
CN102841886B CN102841886B (zh) 2015-09-16

Family

ID=47369259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110168241.3A Expired - Fee Related CN102841886B (zh) 2011-06-21 2011-06-21 拆分文档的方法和装置

Country Status (1)

Country Link
CN (1) CN102841886B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103226587A (zh) * 2013-04-10 2013-07-31 中标软件有限公司 一种字处理文档的段落分组方法及装置
CN103927296A (zh) * 2014-03-06 2014-07-16 广东电网公司电网规划研究中心 输变电工程word文档段落内容中工程特性指标的智能提取方法
CN104573896A (zh) * 2013-10-18 2015-04-29 北大方正集团有限公司 数字出版物的输出方法和装置
CN106469137A (zh) * 2015-08-19 2017-03-01 互联网域名系统北京市工程研究中心有限公司 Xml文档解析方法及装置
CN107153633A (zh) * 2016-03-02 2017-09-12 北大方正集团有限公司 在线文档文件的切分方法和在线文档文件的切分系统
CN110059226A (zh) * 2019-04-26 2019-07-26 深圳市元征科技股份有限公司 一种xml数据存储解析方法、装置、设备及计算机介质
CN110956019A (zh) * 2019-11-27 2020-04-03 北大方正集团有限公司 列表处理系统、方法、装置、计算机可读存储介质
CN112463746A (zh) * 2020-12-11 2021-03-09 杭州海康汽车软件有限公司 一种文件存储、生成方法、装置及电子设备
CN113128178A (zh) * 2019-12-31 2021-07-16 安徽佰通教育科技发展有限公司 一种通过xml文档对office文件解析的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1828607A (zh) * 2006-04-03 2006-09-06 无锡永中科技有限公司 用于树型结构文件的数据查找方法
CN101308488A (zh) * 2008-06-05 2008-11-19 北大方正集团有限公司 基于版式文件的文档流式信息处理方法及装置
CN101430714A (zh) * 2008-12-08 2009-05-13 北大方正集团有限公司 一种基于样式的内容结构化加工方法及系统
CN101520770A (zh) * 2008-02-29 2009-09-02 国际商业机器公司 分析、转换和拆分结构化数据的方法和装置
US7895350B1 (en) * 2001-07-05 2011-02-22 Motive, Inc. N-way data stream splitter

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7895350B1 (en) * 2001-07-05 2011-02-22 Motive, Inc. N-way data stream splitter
CN1828607A (zh) * 2006-04-03 2006-09-06 无锡永中科技有限公司 用于树型结构文件的数据查找方法
CN101520770A (zh) * 2008-02-29 2009-09-02 国际商业机器公司 分析、转换和拆分结构化数据的方法和装置
CN101308488A (zh) * 2008-06-05 2008-11-19 北大方正集团有限公司 基于版式文件的文档流式信息处理方法及装置
CN101430714A (zh) * 2008-12-08 2009-05-13 北大方正集团有限公司 一种基于样式的内容结构化加工方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
孙静等: "大型XML文件的分割和动态加载研究", 《计算机工程与应用》, no. 16, 31 December 2003 (2003-12-31) *
李宁等: "文档格式中"内容"与"表现"的分离与融合", 《电子学报》, vol. 35, no. 2, 28 February 2007 (2007-02-28), pages 375 - 378 *
田英爱等: "基于本体的办公文档处理研究", 《北京信息科技大学学报》, vol. 25, 31 December 2010 (2010-12-31) *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103226587A (zh) * 2013-04-10 2013-07-31 中标软件有限公司 一种字处理文档的段落分组方法及装置
CN103226587B (zh) * 2013-04-10 2016-03-16 中标软件有限公司 一种字处理文档的段落分组方法及装置
CN104573896A (zh) * 2013-10-18 2015-04-29 北大方正集团有限公司 数字出版物的输出方法和装置
CN103927296A (zh) * 2014-03-06 2014-07-16 广东电网公司电网规划研究中心 输变电工程word文档段落内容中工程特性指标的智能提取方法
CN106469137A (zh) * 2015-08-19 2017-03-01 互联网域名系统北京市工程研究中心有限公司 Xml文档解析方法及装置
CN107153633A (zh) * 2016-03-02 2017-09-12 北大方正集团有限公司 在线文档文件的切分方法和在线文档文件的切分系统
CN110059226A (zh) * 2019-04-26 2019-07-26 深圳市元征科技股份有限公司 一种xml数据存储解析方法、装置、设备及计算机介质
CN110956019A (zh) * 2019-11-27 2020-04-03 北大方正集团有限公司 列表处理系统、方法、装置、计算机可读存储介质
CN110956019B (zh) * 2019-11-27 2021-10-26 北大方正集团有限公司 列表处理系统、方法、装置、计算机可读存储介质
CN113128178A (zh) * 2019-12-31 2021-07-16 安徽佰通教育科技发展有限公司 一种通过xml文档对office文件解析的方法
CN112463746A (zh) * 2020-12-11 2021-03-09 杭州海康汽车软件有限公司 一种文件存储、生成方法、装置及电子设备
CN112463746B (zh) * 2020-12-11 2023-11-03 杭州海康汽车软件有限公司 一种文件存储、生成方法、装置及电子设备

Also Published As

Publication number Publication date
CN102841886B (zh) 2015-09-16

Similar Documents

Publication Publication Date Title
CN102841886A (zh) 拆分文档的方法和装置
US8756495B2 (en) Computer-implemented system and method for tagged and rectangular data processing
US20140297680A1 (en) Analyzing multiple data streams as a single data object
US20150310129A1 (en) Method of managing database, management computer and storage medium
CN103123631B (zh) 文案的生成、网页文案的展示方法、装置及网站服务器
CN106294695A (zh) 一种面向实时大数据搜索引擎的实现方法
US20130191328A1 (en) Standardized framework for reporting archived legacy system data
CN103440233A (zh) 一种科技论文标准化自动检测编辑系统
CN103914488A (zh) 文档的采集、标识、关联、搜索及展现的系统
CN105404677A (zh) 一种基于树形结构的检索方法
JP2003173280A (ja) データベース生成装置、データベース生成方法及びデータベース生成プログラム
CN103914486B (zh) 文档的搜索及展现的系统
CN103914487A (zh) 文档的采集、标识及关联的系统
CN106503040A (zh) 适用sql查询方法的kv数据库及其创建方法
CN105653576A (zh) 信息搜索的方法及装置、人工座席服务方法及系统
CN102236713A (zh) 一种数字电视交互服务页面的信息提取方法及其装置
CN103853771A (zh) 一种搜索结果的推送方法及系统
WO2007129660A1 (ja) 静的ウェブページ生成方法、プログラム、記録媒体及び静的ウェブページ生成管理システム
CN105955680A (zh) 一种支持动态附加扩展信息的单据打印方法
CN110032664A (zh) 一种快速建立比特币区块链全节点地址索引的方法
CN105740250B (zh) 一种创建xml节点的属性索引的方法及装置
CN102890704A (zh) 一种在线更新兴趣信息的采集方法
CN103377183A (zh) 重复排版的方法和装置
JP7081155B2 (ja) 選択プログラム、選択方法、及び選択装置
US8498988B2 (en) Fast search

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150916

Termination date: 20170621