CN103186510B - 一种转换文档格式的方法和装置 - Google Patents

一种转换文档格式的方法和装置 Download PDF

Info

Publication number
CN103186510B
CN103186510B CN201110456098.8A CN201110456098A CN103186510B CN 103186510 B CN103186510 B CN 103186510B CN 201110456098 A CN201110456098 A CN 201110456098A CN 103186510 B CN103186510 B CN 103186510B
Authority
CN
China
Prior art keywords
paragraph
rectangle frame
pel
information
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110456098.8A
Other languages
English (en)
Other versions
CN103186510A (zh
Inventor
邢国峰
何震生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Founder Apabi Technology Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Apabi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Apabi Technology Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201110456098.8A priority Critical patent/CN103186510B/zh
Priority to US13/731,717 priority patent/US20130174024A1/en
Publication of CN103186510A publication Critical patent/CN103186510A/zh
Application granted granted Critical
Publication of CN103186510B publication Critical patent/CN103186510B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及通信领域技术,尤其涉及一种转换文档格式的方法和装置,包括:利用排版工具对原始流式文档进行排版;提取所述排版后的原始流式文档中图元的第一逻辑结构信息;将所述排版后的原始流式文档中的属于同一图元的版式元素,映射到所述图元第一逻辑结构信息构成的矩形框中;将所述矩形框中版式元素的转换为目标文档格式中的第二逻辑结构信息的描述形式后进行保存。使用本发明实施例提供的转换文档格式的方法和装置,可以生成兼有版式和流式格式信息的文档格式,使其既能符合电脑显示时的格式要求,又符合移动阅读设备上显示时的格式要求。而且,使得一个文档同时符合两种显示要求,节约了转换文档格式的成本。

Description

一种转换文档格式的方法和装置
技术领域
本发明涉及通信领域技术,尤其涉及一种转换文档格式的方法和装置。
背景技术
在文档格式转换领域,可以通过虚拟打印将流式文档转换到版式文档。但是,在虚拟打印过程中会丢失一些流式文档的文档结构信息,如段落、标题、分栏、是否跨页、是否为表格以及是否为公式等信息。所以,一般情况下,版式文档中仅保留了原流式文档在排版软件中的原始版式。但是,这样的版式文档在手持阅读设备等设备上阅读时,如手机、电子书阅读器,无法做到屏幕自适应排版。也就是,无法有效地保持与原文档一样的段落顺序,无法很好地区分一个完整的表格或公式。所以,在手持阅读设备上阅读时,一般都需要另外生成一种文档格式,专门供手持设备流式显示,无法共用同一个文档。
发明内容
本发明实施例提供了一种转换文档格式的方法和装置,可以生成兼有版式和流式格式信息的文档格式,使其既能符合电脑显示时的格式要求,又符合移动阅读设备上显示时的格式要求。
本发明实施例提供了一种转换文档格式的方法,包括:
利用排版工具对原始流式文档进行排版;
提取所述排版后的原始流式文档中图元的第一逻辑结构信息;
将所述排版后的原始流式文档中的属于同一图元的版式元素,映射到所述图元第一逻辑结构信息构成的矩形框中;
将所述矩形框中版式元素的转换为目标文档格式中的第二逻辑结构信息的描述形式后进行保存。
相应的,本发明实施例提供了一种转换文档格式的装置,包括:
排版模块,用于利用排版工具对原始流式文档进行排版;
提取模块,用于提取所述排版后的原始流式文档的第一逻辑结构信息;
映射模块,用于将所述排版后的原始流式文档中的属于同一图元的版式元素,映射到所述图元第一逻辑结构信息构成的矩形框中;
转换模块,用于将所述矩形框中的版式元素转换为目标文档格式中的第二逻辑结构信息的描述形式后进行保存。
本发明实施例提供了一种转换文档格式的方法和装置,用于利用排版工具对原始流式文档进行排版;提取所述排版后的原始流式文档中图元的第一逻辑结构信息;将所述排版后的原始流式文档中的属于同一图元的版式元素,映射到所述图元第一逻辑结构信息构成的矩形框中;将所述矩形框中版式元素的转换为目标文档格式中的第二逻辑结构信息的描述形式后进行保存。使用本发明实施例提供的转换文档格式的方法和装置,通过提取原始流式文档中的图元的逻辑结构信息,并获得这些逻辑结构信息构成的矩形框;然后将相应位置的版式元素映射到矩形框中,再将版式元素转换为目标文档格式需要的类型。由此,可以生成兼有版式和流式格式信息的文档格式,使其既能符合电脑显示时的格式要求,又符合移动阅读设备上显示时的格式要求。而且,使得一个文档同时符合两种显示要求,节约了转换文档格式的成本。
附图说明
图1为本发明实施例中转换文档格式的方法流程示意图;
图2为本发明实施例中提取段落的第一逻辑结构信息的流程示意图;
图3为本发明另一实施例中提取段落的第一逻辑结构信息的流程示意图;
图4为本发明另一实施例中提取表格的第一逻辑结构信息的流程示意图;
图5为本发明另一实施例中转换文档格式的装置示意图。
具体实施方式
下面结合各个附图对本发明实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细地阐述。
现有技术中将流式文档转化为版式文档后,该版式文档仅适用在电脑上进行显示,而无法适用于移动终端上的显示方式。为了解决现有技术存在的问题,本发明实施例提供了一种转换文档格式的方法,如图1所示,包括以下步骤:
步骤101、利用排版工具对原始流式文档进行排版;
步骤102、提取排版后的原始流式文档中图元的第一逻辑结构信息;
步骤103、将排版后的原始流式文档中的属于同一图元的版式元素,映射到图元第一逻辑结构信息构成的矩形框中;
步骤104、将矩形框中版式元素的转换为目标文档格式中的第二逻辑结构信息的描述形式后进行保存。
具体的,将含有原始逻辑结构信息的原始流式文档进行排版,使原始逻辑结构信息转换为具有位置信息和/或属性信息的第一逻辑结构信息。流式文档中包括多种图元,例如标题、段落、表格、公式、图片、复合图元等。使用排版工具对该流式文档进行排版后,使每个图元均具有位置信息和/或属性信息,这样每个图元的第一逻辑结构信息包括了上述位置信息和/或属性信息。例如,图元为段落时,其第一逻辑结构信息可以包括段落是否跨页、是否具有分栏格式、是否包含标题、是否首行缩进、对齐方式、位置区域等。
然后,可以提取该文档中图元的第一逻辑结构信息,以便获知文档的具体结构,例如:图元为段落时,提取排版后的原始流式文档中图元的第一逻辑结构信息,如图2所示,包括以下步骤:
步骤201、获取当前的段落;
步骤202、判断该段落是否跨页;若未跨页,执行步骤203;若跨页,执行步骤204;具体的,将当前段落的第一个字符和最后一个字符所在的页码进行比较,若页码相同,则表明该段落未跨页;若页码不相同,则表明该段落跨页。
步骤203、将段落作为一个矩形框单元,获取段落的位置信息。
步骤204、将每页中段落作为一个矩形框单元,分别保存每个矩形框单元的位置信息,并将该段落的所有矩形框单元均标记统一标识,标明属于同一段落。而且,获取段落的位置信息的同时,还可以获取段落的属性信息,例如标题、段落样式等信息。
图元为段落时,提取排版后的原始流式文档中图元的第一逻辑结构信息,还可以为提取该段落是否分栏,如图3所示,包括以下步骤:
步骤301、获取当前的段落;
步骤302、判断该段落是否具有分栏结构;若不具有分栏结构,执行步骤303;若具有分栏结构,则执行步骤304;具体的,获取当前段落中文本栏的数量,若文本栏数量大于1,则说明该段落具有分栏结构;若文本栏数量等于1,则说明该段落不具有分栏结构。
步骤303、将该段落作为一个矩形框单元,获取段落的位置信息;
步骤304、将每一栏作为一个矩形框单元,分别保存每个矩形框单元的位置信息,并将该段落的所有矩形框单元均标记统一标识,标明属于同一段落。
对于同一个段落判断是否分栏和是否跨页,没有既定的先后顺序。但从实践角度,可以先判断该段落是否分栏,再判断该段落是否跨页,这样的效果较佳。
当图元为表格时,提取排版后的原始流式文档中图元的第一逻辑结构信息,如图4所示,可以包括以下步骤:
步骤401、获取当前的表格;
步骤402、判断该表格是否跨页;若未跨页,执行步骤403;若跨页,执行步骤404;具体的,将当前表格的第一个单元格和最后一个单元格所在的页码进行比较,若页码相同,则表明该表格未跨页;若页码不相同,则表明该表格跨页。
步骤403、将表格作为一个矩形框单元,获取表格的位置信息。
步骤404、将每页中表格作为一个矩形框单元,分别保存每个矩形框单元的位置信息,并将该表格的所有矩形框单元均标记统一标识,标明属于同一表格。而且,获取表格的位置信息的同时,还可以获取表格的属性信息,例如标题、段落样式等信息。
通过获取上述文档中图元的第一逻辑结构信息,可以将该文档由多个矩形框构成,然后,将相应内容映射到矩形框中即可。具体的,获取排版后的原始流式文档中的属于同一图元的版式元素,将版式元素按照位置信息,映射到图元的第一逻辑结构信息构成的具有相应位置信息矩形框单元中。可以获取版式元素(例如字符)的位置信息,判断其位于哪个矩形框单元内,并与具有相应位置信息矩形框单元建立映射关系。
最后,将每个矩形框单元中的版式元素转换为目标文档格式中的第二逻辑结构信息的描述形式并保存。该目标文档格式可以为版式文档格式或者其他文档格式。
通过上述描述,可以看出,使用本发明实施例提供的转换文档格式的方法,通过提取原始流式文档中的图元的逻辑结构信息,并获得这些逻辑结构信息构成的矩形框;然后将相应位置的版式元素映射到矩形框中,再将版式元素转换为目标文档格式需要的类型。由此,可以生成兼有版式和流式格式信息的文档格式,使其既能符合电脑显示时的格式要求,又符合移动阅读设备上显示时的格式要求。而且,使得一个文档同时符合两种显示要求,节约了转换文档格式的成本。
相应的,本发明实施例还提供一种转换文档格式的装置,如图5所示,具体包括:
排版模块501,用于利用排版工具对原始流式文档进行排版;
提取模块502,用于提取所述排版后的原始流式文档的第一逻辑结构信息;
映射模块503,用于将所述排版后的原始流式文档中的属于同一图元的版式元素,映射到所述图元第一逻辑结构信息构成的矩形框中;
转换模块504,用于将所述矩形框中的版式元素转换为目标文档格式中的第二逻辑结构信息的描述形式后进行保存。
较佳的,所述排版模块501,具体用于将含有原始逻辑结构信息的所述原始流式文档进行排版,使所述原始逻辑结构信息转换为具有位置信息和/或属性信息的第一逻辑结构信息。
较佳的,所述图元为段落或表格时,所述提取模块502用于判断所述段落或表格是否跨页;若未跨页,将所述段落或表格作为一个矩形框单元,获取所述段落或表格的位置信息;若跨页,将每页中所述段落或表格作为一个矩形框单元,分别保存每个矩形框单元的位置信息,并将所述段落或表格的所有矩形框单元均标记统一标识,标明属于同一段落或表格;或者
所述图元为段落时,所述提取模块502,用于判断所述段落是否分栏结构;若不具有分栏结构,则将所述段落作为一个矩形框单元,获取所述段落的位置信息;若具有分栏结构,则将每一栏作为一个矩形框单元,分别保存每个矩形框单元的位置信息,并将所述段落的所有矩形框单元均标记统一标识,标明属于同一段落或表格。
较佳的,所述映射模块503,具体用于获取所述排版后的原始流式文档中的属于同一图元的版式元素,将所述版式元素按照位置信息,映射到所述图元的第一逻辑结构信息构成的具有相应位置信息矩形框单元中。
通过上述描述,可以看出,使用本发明实施例提供的转换文档格式的方法和装置,通过提取原始流式文档中的图元的逻辑结构信息,并获得这些逻辑结构信息构成的矩形框;然后将相应位置的版式元素映射到矩形框中,再将版式元素转换为目标文档格式需要的类型。由此,可以生成兼有版式和流式格式信息的文档格式,使其既能符合电脑显示时的格式要求,又符合移动阅读设备上显示时的格式要求。而且,使得一个文档同时符合两种显示要求,节约了转换文档格式的成本。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种转换文档格式的方法,其特征在于,包括:
利用排版工具对原始流式文档进行排版;
提取所述排版后的原始流式文档中图元的第一逻辑结构信息;其中,所述第一逻辑结构信息包括以下内容中的任一项或任几项:是否跨页、是否具有分栏格式、是否包含标题、是否首行缩进、对齐方式、位置区域;
将所述排版后的原始流式文档中的属于同一图元的版式元素,映射到所述图元第一逻辑结构信息构成的矩形框中;
将所述矩形框中版式元素转换为目标文档格式中的第二逻辑结构信息的描述形式后进行保存;以使所述目标文档格式中包括版式元素和所述排版后的原始流式文档中图元的所述第一逻辑结构信息;
其中,所述目标文档格式为版式文档格式。
2.如权利要求1所述的方法,其特征在于,所述利用排版工具对原始流式文档进行排版,包括:
将含有原始逻辑结构信息的所述原始流式文档进行排版,使所述原始逻辑结构信息转换为具有位置信息和/或属性信息的第一逻辑结构信息。
3.如权利要求1所述的方法,其特征在于,所述图元为段落或表格时,提取所述排版后的原始流式文档中图元的第一逻辑结构信息,包括:
获取当前的段落或表格;
判断所述段落或表格是否跨页;
若未跨页,将所述段落或表格作为一个矩形框单元,获取所述段落或表格的位置信息;
若跨页,将每页中所述段落或表格作为一个矩形框单元,分别保存每个矩形框单元的位置信息,并将所述段落或表格的所有矩形框单元均标记统一标识,标明属于同一段落或表格。
4.如权利要求3所述的方法,其特征在于,获取所述段落或表格的位置信息的同时,还获取所述段落或表格的属性信息。
5.如权利要求1所述的方法,其特征在于,所述图元为段落时,提取所述排版后的原始流式文档中图元的第一逻辑结构信息,包括:
获取当前的段落;
判断所述段落是否具有分栏结构;
若不具有分栏结构,则将所述段落作为一个矩形框单元,获取所述段落的位置信息;
若具有分栏结构,则将每一栏作为一个矩形框单元,分别保存每个矩形框单元的位置信息,并将所述段落的所有矩形框单元均标记统一标识,标明属于同一段落。
6.如权利要求1所述的方法,其特征在于,将所述排版后的原始流式文档中的属于同一图元的版式元素,映射到所述图元第一逻辑结构信息构成的矩形框中,包括:
获取所述排版后的原始流式文档中的属于同一图元的版式元素,将所述版式元素按照位置信息,映射到所述图元的第一逻辑结构信息构成的具有相应位置信息矩形框单元中。
7.一种转换文档格式的装置,其特征在于,包括:
排版模块,用于利用排版工具对原始流式文档进行排版;
提取模块,用于提取所述排版后的原始流式文档的第一逻辑结构信息;
映射模块,用于将所述排版后的原始流式文档中的属于同一图元的版式元素,映射到所述图元第一逻辑结构信息构成的矩形框中;其中,所述第一逻辑结构信息包括以下内容中的任一项或任几项:是否跨页、是否具有分栏格式、是否包含标题、是否首行缩进、对齐方式、位置区域;
转换模块,用于将所述矩形框中的版式元素转换为目标文档格式中的第二逻辑结构信息的描述形式后进行保存以使所述目标文档格式中包括版式元素和所述排版后的原始流式文档中图元的所述第一逻辑结构信息;
其中,所述目标文档格式为版式文档格式。
8.如权利要求7所述的装置,其特征在于,所述排版模块,具体用于将含有原始逻辑结构信息的所述原始流式文档进行排版,使所述原始逻辑结构信息转换为具有位置信息和/或属性信息的第一逻辑结构信息。
9.如权利要求7所述的装置,其特征在于,所述图元为段落或表格时,所述提取模块用于判断所述段落或表格是否跨页;若未跨页,将所述段落或表格作为一个矩形框单元,获取所述段落或表格的位置信息;若跨页,将每页中所述段落或表格作为一个矩形框单元,分别保存每个矩形框单元的位置信息,并将所述段落或表格的所有矩形框单元均标记统一标识,标明属于同一段落或表格;或者
所述图元为段落时,所述提取模块,用于判断所述段落是否具有分栏结构;若不具有分栏结构,则将所述段落作为一个矩形框单元,获取所述段落的位置信息;若具有分栏结构,则将每一栏作为一个矩形框单元,分别保存每个矩形框单元的位置信息,并将所述段落的所有矩形框单元均标记统一标识,标明属于同一段落。
10.如权利要求7所述的装置,其特征在于,所述映射模块,具体用于获取所述排版后的原始流式文档中的属于同一图元的版式元素,将所述版式元素按照位置信息,映射到所述图元的第一逻辑结构信息构成的具有相应位置信息矩形框单元中。
CN201110456098.8A 2011-12-30 2011-12-30 一种转换文档格式的方法和装置 Expired - Fee Related CN103186510B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110456098.8A CN103186510B (zh) 2011-12-30 2011-12-30 一种转换文档格式的方法和装置
US13/731,717 US20130174024A1 (en) 2011-12-30 2012-12-31 Method and device for converting document format

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110456098.8A CN103186510B (zh) 2011-12-30 2011-12-30 一种转换文档格式的方法和装置

Publications (2)

Publication Number Publication Date
CN103186510A CN103186510A (zh) 2013-07-03
CN103186510B true CN103186510B (zh) 2016-08-03

Family

ID=48677681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110456098.8A Expired - Fee Related CN103186510B (zh) 2011-12-30 2011-12-30 一种转换文档格式的方法和装置

Country Status (2)

Country Link
US (1) US20130174024A1 (zh)
CN (1) CN103186510B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346322B (zh) * 2013-08-08 2018-07-10 北大方正集团有限公司 文档格式处理装置和文档格式处理方法
CN106776495B (zh) * 2016-11-23 2020-06-09 北京信息科技大学 一种文档逻辑结构重建方法
CN107844468A (zh) * 2017-10-16 2018-03-27 平安科技(深圳)有限公司 表格信息跨页识别方法、电子设备及计算机可读存储介质
CN109542554B (zh) * 2018-10-26 2022-06-10 金蝶软件(中国)有限公司 文档布局转换的方法、装置、计算机设备和存储介质
CN111198664B (zh) * 2018-11-16 2024-01-26 珠海金山办公软件有限公司 一种文档打印的方法、装置、计算机存储介质及终端
CN109582934B (zh) * 2018-12-04 2023-02-10 万兴科技股份有限公司 版式文档的转换方法及装置
CN110069767B (zh) * 2019-04-23 2020-02-28 掌阅科技股份有限公司 基于电子书的排版方法、电子设备及计算机存储介质
CN111222314B (zh) * 2020-01-03 2021-12-21 北大方正集团有限公司 版式文档的比对方法、装置、设备及存储介质
CN111444452B (zh) * 2020-02-21 2023-06-23 广州杰赛科技股份有限公司 网页页面的转换方法、装置及存储介质
CN111611776B (zh) * 2020-05-22 2023-07-25 北京信息科技大学 一种兼容版流文档内容并支持同步阅读的方法和装置
CN112232032B (zh) * 2020-09-04 2023-08-18 科航(苏州)信息科技有限公司 docx文档的内容样式自动转换方法
CN112507666B (zh) * 2020-12-21 2023-07-11 北京百度网讯科技有限公司 文档转换方法、装置、电子设备及存储介质
CN113011131B (zh) * 2021-03-22 2022-02-22 掌阅科技股份有限公司 基于图片类电子书的排版方法、电子设备及存储介质
CN113239661A (zh) * 2021-04-30 2021-08-10 北京方正阿帕比技术有限公司 一种基于版流结合的多终端电子文档的编辑方法和装置
CN113283217A (zh) * 2021-05-28 2021-08-20 珠海金山办公软件有限公司 文档转换方法、装置、电子设备及存储介质
CN113515928B (zh) * 2021-07-13 2023-03-28 抖音视界有限公司 电子文本生成方法、装置、设备及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011059795A1 (en) * 2009-11-16 2011-05-19 Apple Inc. Supporting platform-independent typesetting for documents

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01183784A (ja) * 1988-01-19 1989-07-21 Toshiba Corp 文書画像処理装置
JP3302147B2 (ja) * 1993-05-12 2002-07-15 株式会社リコー 文書画像処理方法
US7149347B1 (en) * 2000-03-02 2006-12-12 Science Applications International Corporation Machine learning of document templates for data extraction
CN101393647B (zh) * 2008-10-23 2012-03-07 浙江大学 一种基于友好用户交互的文档排版方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011059795A1 (en) * 2009-11-16 2011-05-19 Apple Inc. Supporting platform-independent typesetting for documents

Also Published As

Publication number Publication date
CN103186510A (zh) 2013-07-03
US20130174024A1 (en) 2013-07-04

Similar Documents

Publication Publication Date Title
CN103186510B (zh) 一种转换文档格式的方法和装置
US20150046797A1 (en) Document format processing apparatus and document format processing method
CN101719335B (zh) 用于地理信息系统的栅格图片电子地图
KR102348766B1 (ko) 데이터 처리 방법 및 장치
CN103853806A (zh) 一种表格转换方法及装置
CN104462029A (zh) 一种智能终端中富文本显示的方法和系统
WO2019041442A1 (zh) 图表数据结构化提取方法、系统、电子设备及计算机可读存储介质
CN105956133B (zh) 智能终端上显示文件的方法及装置
CN110851050B (zh) 页面元素点击测试的方法及装置
CN104462036A (zh) 一种同步编辑文档的格式信息的方法及系统
US9529781B2 (en) Apparatus and method for document format conversion
CN107193815B (zh) 一种页面代码的处理方法、装置及设备
CN109492211A (zh) 一种基于ofd文档的表格提取方法
CN102591849B (zh) 文档格式转换的方法及装置
CN104516919A (zh) 一种引用注释处理方法和系统
CN113254131A (zh) 一种页面背景展示方法及装置
CN103488440A (zh) 单据打印装置和单据打印方法
CN110263310B (zh) 数据图生成方法、装置及计算机可读存储介质
CN102799423A (zh) Jsf中执行动态方法的方法及装置
CN103914223A (zh) 终端应用界面的生成方法及装置
CN108109106B (zh) 一种图片生成的方法、装置及计算机设备
CN105700825A (zh) 一种基于Android系统的缩略图存储方法和装置
CN111724453A (zh) 富文本渲染方法、装置、终端设备及计算机存储介质
US9092687B2 (en) Automatically converting a sign and method for automatically reading a sign
CN109918633B (zh) 一种信息快速填写方法及终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220622

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: FOUNDER APABI TECHNOLOGY Ltd.

Address before: 100871, Beijing, Haidian District Cheng Fu Road 298, founder building, 9 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: FOUNDER APABI TECHNOLOGY Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160803