CN106168944A - 文档转换方法 - Google Patents

文档转换方法 Download PDF

Info

Publication number
CN106168944A
CN106168944A CN201610329682.XA CN201610329682A CN106168944A CN 106168944 A CN106168944 A CN 106168944A CN 201610329682 A CN201610329682 A CN 201610329682A CN 106168944 A CN106168944 A CN 106168944A
Authority
CN
China
Prior art keywords
purpose object
document
converted
html
regulation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610329682.XA
Other languages
English (en)
Other versions
CN106168944B (zh
Inventor
黒木纯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Konica Minolta Opto Inc
Original Assignee
Konica Minolta Opto Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Opto Inc filed Critical Konica Minolta Opto Inc
Publication of CN106168944A publication Critical patent/CN106168944A/zh
Application granted granted Critical
Publication of CN106168944B publication Critical patent/CN106168944B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/154Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Document Processing Apparatus (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

提供能够根据通过办公套件·应用而制成的OOXML格式、ODF等格式的文档,生成用户所期望的能够由网页浏览器利用的格式固有的目的对象的文档转换方法。一种文档转换方法,用于将使用办公套件·应用而制成的第一格式的原文档转换为能够由网页浏览器利用的第二格式的文档的装置,其特征在于,执行:分析处理,分析所述原文档,确定按照所述第一格式以规定的表现类型记述的目的对象;以及转换处理,参照预先存储且将按照所述第一格式记述的规定的表现类型和能够由使所述网页浏览器动作的装置的操作部操作的所述第二格式的功能目的对象相对应的相对应信息,将以所述规定的表现类型记述的目的对象转换为所述第二格式的功能目的对象而生成所述第二格式的文档。

Description

文档转换方法
技术领域
本发明涉及文档转换方法,特别是涉及将通过办公套件·应用而制成的OOXML(Office Open XML)格式或ODF(开放文档格式(Open DocumentFormat))等格式的文档转换为能够由网页浏览器利用的HTML(超文本标记语言(Hyper Text Markup Language))等格式的文档的文档转换方法。
背景技术
web页面由HTML这样的标记语言构成,在制成主页等Web页面的情况下,需要掌握该HTML的记述规则。但是,为了掌握HTML的记述规则,需要专业知识,存在对初学者来说难度高,不能简单地制成Web页面的问题。
另一方面,能够进行文档制成、表计算等处理的办公套件·应用一般在办公室工作、教育、家庭等一切场景中被使用。作为代表性的办公套件·应用,可列举Microsoft(注册商标,以下省略)的Word(注册商标,以下省略)、Excel(注册商标,以下省略)、PowerPoint(注册商标,以下省略)等的Office。此外,Apache OpenOffice等具有同样的功能的应用也流通多个。上述Microsoft的Office、开放源的Apache Openoffice由标准化团体进行标准化,支持这些文件格式(OOXML、ODF)的多个互换应用也被提供。通过使用这样的惯用的办公套件·应用来制成Web页面的草稿并以HTML格式来保存,从而能够简单地制成Web页面。
虽不是将OOXML、ODF的文档转换为HTML格式的文档的技术,但作为与数据转换关联的技术,例如,在下述专利文献1中,公开了资料制成装置,其用于将转写源的资料的每个项目的数据转写为转写目标的资料的各项目,该资料制成装置具备:数据文件制成部,对所述转写源的资料的全部或一部分的项目附加表示该项目的含义内容的含义数据;以及数据转写部,将所述转写源的资料的项目和所述转写目标的资料的项目进行对比,确定一致的项目,使用对所述转写源的资料附加的所述含义数据,将所述转写源的资料的一致的项目的数据转写为所述转写目标的资料的项目。
现有技术文献
专利文献
专利文献1:(日本)特开2012-220965号公报
发明内容
在HTML中,通过记述对要素附加的属性,能够实现使得能够选择期望的选项的功能(所谓下拉菜单)、使得能够同时选择多个选项的功能(所谓多选菜单)、展开或折叠文档的功能(所谓折叠菜单)等HTML固有的功能。但是,在将通过办公套件·应用而制成的OOXML、ODF的文档以HTML格式来保存的情况下,OOXML、ODF的文档以原有外观被HTML化,所以存在难以实现HTML固有的功能的问题。
对于该问题,在专利文献1中,通过对转写源的资料的特定的项目附加表示该项目的含义内容的含义数据,从而转写为转写目标的资料的项目,但该技术是用于使得能够分析转写源的账票的特有的功能的技术,不是指定转写目标的账票所特有的功能的技术。从而,即使利用该技术,也不能根据通过办公套件·应用而制成的OOXML、ODF的文档,生成实现HTML固有的功能的目的对象(object)。
本发明是鉴于上述问题而完成的,其主要目的在于,提供能够根据通过办公套件·应用而制成的OOXML、ODF等第一格式的文档,生成用户所期望的能够由网页浏览器利用的第二格式固有的目的对象(例如,HTML固有的目的对象)的文档转换方法。
本发明的一方面是一种文档转换方法,用于将使用办公套件·应用而制成的第一格式的原文档转换为能够由网页浏览器利用的第二格式的文档的装置,其特征在于,所述文档转换方法执行:分析处理,分析所述原文档,确定按照所述第一格式以规定的表现类型(type of representation)记述的目的对象;以及转换处理,参照预先存储且将按照所述第一格式记述的规定的表现类型和能够由使所述网页浏览器动作的装置的操作部操作的所述第二格式的功能目的对象相对应的相对应信息,将以所述规定的表现类型记述的目的对象转换为所述第二格式的功能目的对象而生成所述第二格式的文档。
根据本发明的文档转换方法,能够根据通过办公套件·应用而制成的OOXML、ODF等第一格式的文档,生成用户所期望的能够由网页浏览器利用的HTML等第二格式固有的目的对象。
其理由是因为,在进行文档转换的计算机装置中,进行以下控制:对使用办公套件·应用而制成的第一格式的原文档进行分析,确定按照第一格式以规定的表现类型记述的目的对象(例如,被附加了规定的识别符的目的对象、使用特定的xml要素而记述的目的对象、包含特定的记述的目的对象),将该目的对象转换为能够由网页浏览器利用的第二格式的功能目的对象,生成第二格式的文档。
这样,通过将办公套件·应用的规定的表现类型和构成能够由网页浏览器利用的格式的文档(以下,网页文档)的功能目的对象(HTML的功能目的对象)相关联而转换,从而根据使用平常惯用的办公套件·应用而制成的文档,能够容易地制成网页文档固有的功能目的对象(例如,HTML固有的目的对象),能够容易地制成有效的Web页面。
附图说明
图1A、1B是表示本发明的第一实施例所涉及的计算机装置的结构的框图。
图2是表示本发明的第一实施例所涉及的计算机装置的整体处理(文档转换处理)的流程图。
图3是表示在本发明的第一实施例所涉及的计算机装置中显示的画面(模式选择画面)的一例。
图4是表示本发明的第一实施例所涉及的计算机装置的处理(HTML固有目的对象转换处理)的流程图。
图5是表示本发明的第一实施例所涉及的OOXML目的对象和明示识别符的关系的表。
图6是表示本发明的第一实施例所涉及的计算机装置的处理(基于明示识别符的HTML固有目的对象转换处理)的流程图。
图7A、7B是表示本发明的第一实施例所涉及的多选菜单目的对象的转换例的图。
图8A、8B是表示本发明的第一实施例所涉及的下拉菜单目的对象的转换例的图。
图9是表示本发明的第二实施例所涉及的计算机装置的处理(HTML固有目的对象转换处理)的流程图。
图10是表示本发明的第二实施例所涉及的计算机装置的处理(基于特定的xml要素的HTML固有目的对象转换处理)的流程图。
图11是表示本发明的第二实施例所涉及的计算机装置的处理(基于特定的记述的HTML固有目的对象转换处理)的流程图。
图12A、12B是表示本发明的第二实施例所涉及的多选菜单目的对象的转换例的图。
图13A、13B是表示本发明的第二实施例所涉及的下拉菜单目的对象的转换例的图。
图14A、14B、14C是表示本发明的第二实施例所涉及的附带章节标题的目的对象的转换例的图。
图15是表示OOXML文件的文件夹结构的一例的图。
图16A、16B、16C是表示本发明的第二实施例所涉及的多选菜单目的对象的记述例(基于特定的xml要素的情况)的图。
图17A、17B、17C是表示本发明的第二实施例所涉及的下拉菜单目的对象的记述例(基于特定的xml要素的情况)的图。
图18A、18B、18C是表示本发明的第二实施例所涉及的附带章节标题的目的对象的记述例(基于特定的xml要素的情况)的图。
图19A、19B是表示本发明的第二实施例所涉及的多选菜单目的对象的记述例(基于特定的记述的情况)的图。
图20A、20B是表示本发明的第二实施例所涉及的下拉菜单目的对象的记述例(基于特定的记述的情况)的图。
图21A、21B是表示本发明的第二实施例所涉及的附带章节标题的目的对象的记述例(基于特定的记述的情况)的图。
标号说明
10 计算机装置
11 控制部
11a OS
11b 办公套件·应用
11c 文档转换程序
12 CPU
13 ROM
14 RAM
15 存储装置
16 输入装置
17 显示装置
20 模式选择画面
具体实施方式
如背景技术所示,通过由惯用的办公套件·应用而制成Web页面的草稿并以HTML格式来保存,从而能够简单地制成Web页面,但在将通过办公套件·应用而制成的OOXML、ODF的文档以能够由网页浏览器利用的格式即HTML格式保存的情况下,以原有外观被HTML化,所以存在难以实现HTML固有的功能的问题。
即,由于在办公套件·应用中不存在这些功能,所以即使将使用办公套件·应用而制成的文档以HTML格式来保存,也不能生成实现上述功能的HTML固有的目的对象。
因此,在本发明的一实施方式中,在将通过办公套件·应用而制成的第一格式(例如,OOXML、ODF)的原文档转换为能够由网页浏览器利用的第二格式(例如,HTML格式)的文档的情况下,不是转换为相同描绘表现,而是将按照办公套件·应用的格式而记述的规定的表现类型和第二格式的功能目的对象(例如,构成网页文档的用户界面部件等实现HTML的功能的目的对象)相关联,能够将以规定的表现类型记述的目的对象转换为第二格式的功能目的对象(HTML固有的功能目的对象)。即,将按照第一格式而记述的规定的表现类型和第二格式的功能目的对象相对应而存储,对第一格式的原文档进行分析,确定按照第一格式以规定的表现类型记述的目的对象,且参照预先存储的相对应信息,将以所确定的规定的表现类型记述的目的对象转换为对应的第二格式的功能目的对象,生成第二格式的文档。在此,第二格式的功能目的对象构成第二格式的文档,是能够由使网页浏览器动作的装置的操作部操作的目的对象,例如,也可以是使得能够选择多个选项的多选菜单目的对象、使得能够选择多个选项之一的下拉菜单目的对象、使得能够进行文章的展开/非展开的折叠菜单目的对象等实现HTML的功能的用户界面部件。
具体而言,在使用办公套件·应用而制成OOXML、ODF等第一格式的原文档时,附加规定的识别符,或使用办公套件·应用的规定的功能,或按照规定的规则而进行了记述的情况下,在本发明的一实施方式中,将所制成的原文档如以下那样转换为第二格式的文档。
首先,分析原文档,确定按照第一格式以规定的表现类型记述的目的对象。
此时,也可以判定在构成原文档的第一格式的目的对象中是否附加有规定的识别符,将附加有规定的识别符的目的对象确定为以所述规定的表现类型记述的目的对象。在原文档的第一格式的目的对象中附加有规定的识别符的情况下,基于该识别符,将第一格式的目的对象转换为第二格式的功能目的对象。例如,也可以确定与该识别符对应的HTML固有的功能,在将原文档转换为HTML格式的文档时,生成实现所确定的功能的HTML固有目的对象。另外,所确定的第一格式的目的对象是并列记述多个要素的目的对象,在对该第一格式的目的对象的第一要素记述有规定的识别符的情况下,也可以将除了该第一要素以外的要素转换为与规定的识别符相对应的第二格式的功能目的对象。
此外,也可以判定在原文档的文件夹结构内是否存在特定的xml要素,基于该特定的xml要素,确定以所述规定的表现类型记述的目的对象。在存在特定的xml要素的情况下,基于该特定的xml要素,将第一格式的目的对象转换为所述第二格式的功能目的对象。例如,也可以在制成原文档时,使用办公套件·应用的规定的功能来制成目的对象的情况下,通过判定在原文档的文件夹结构内是否存在特定的xml要素,从而确定与该功能对应的HTML固有的功能,在将原文档转换为HTML格式时,生成实现所确定的功能的HTML固有目的对象。此时,也可以确定与在特定的xml要素中记述的字符串相对应的第二格式的功能目的对象,将第一格式的目的对象转换为所确定的功能目的对象。
此外,也可以判定在原文档内是否包含特定的记述,基于该特定的记述来确定以所述规定的表现类型记述的目的对象。在特定的记述被包含于原文档的情况下,基于该特定的记述,将第一格式的目的对象转换为第二格式的功能目的对象。例如,也可以在原文档之中存在规定的规则的记述的情况下,确定与该记述对应的HTML固有的功能,在将原文档转换为HTML格式时,生成实现所确定的功能的HTML固有目的对象。另外,也可以在段落的开头部配置的字符、数字或记号作为特定的记述而被包含于原文档的情况下,将该段落的内容转换为与所述特定的记述相对应的第二格式的功能目的对象。
这样,在使用惯用的办公套件·应用而制成文档时,只要附加规定的识别符,或使用办公套件·应用的规定的功能,或按照规定的规则而记述,就能够容易地生成能够由网页浏览器利用的格式固有(HTML固有)的期望的目的对象,能够制成有效的web页面。
【实施例1】
为了更详细地说明上述的本发明的实施方式,参照图1A至图8B说明本发明的第一实施例所涉及的文档转换程序以及文档转换方法。图1A、1B是表示本实施例的计算机装置的结构的框图,图2、图4、图6是表示本实施例的计算机装置的处理的流程图。此外,图3是在本实施例的计算机装置中显示的画面(模式选择画面)的一例,图5是表示OOXML目的对象和明示识别符的关系的表。此外,图7A、7B、图8A、8B是表示从OOXML向HTML格式的转换例的图。
如图1A所示,本实施例的计算机装置10是个人计算机、智能手机、平板等便携终端、在网络上配置的服务器等信息处理装置。该计算机装置10由控制部11、输入装置16、显示装置17等构成。
控制部11由CPU(中央处理单元(Central Processing Unit))12、ROM(只读存储器(Read Only Memory))13、RAM(随机存取存储器(RandomAccess Memory))14等存储器、HDD(硬盘驱动(Hard Disk Drive))、SSD(固态硬盘(Solid State Drive))等存储装置15构成,CPU12通过将在ROM13、存储装置15中存储的控制程序在RAM14中展开并执行,从而控制计算机装置10整体的动作。
输入装置16由鼠标、键盘、触摸面板等构成,使得能够进行使用了办公套件·应用11b的文档的制成、后述的转换模式的选择、Web浏览器的画面(Web页面)中的菜单操作等操作。
显示装置17由液晶显示装置(LCD:Liquid Crystal Display)、有机EL(电致发光(electroluminescence))显示装置等构成,显示办公套件·应用11b的文档制成画面、转换模式的选择画面、Web浏览器的画面等。
此外,如图1B所示,通过上述控制部11,执行OS(操作系统(OperatingSystem))11a、办公套件·应用11b、文档转换程序11c等程序。
OS11a是Windows(注册商标)、OS X(注册商标)等,能够通过计算机装置10使办公套件·应用11b、文档转换程序11c动作。
办公套件·应用11b是进行文章制成、表计算、图像加工等的软件,制成成为Web页面的源的OOXML、ODF的文档(称为原文档)。另外,在本实施例中,作为办公套件·应用11b,以Microsoft的Word为例进行说明。
文档转换程序11c将通过办公套件·应用11b制成的OOXML、ODF(第一格式)的原文档转换为能够由网页浏览器利用的HTML格式(第二格式)的文档。该文档转换程序11c作为分析部、转换部等而发挥作用。
分析部对OOXML、ODF的原文档进行分析,判定在原文档的文件名中是否包含预先决定的规定的关键词。此外,分析部判定是否在原文档的目的对象中附加有指定HTML固有的功能的规定的识别符(称为明示识别符)。即,分析部确定按照第一格式以规定的表现类型记述的目的对象。此外,分析部判断原文档的目的对象是否是成为向HTML固有目的对象的转换对象的目的对象,或参照预先保持的表而判断是否能够对原文档的目的对象指定向HTML固有目的对象的转换。
转换部基于在原文档的文件名中是否包含规定的关键词,切换将原文档的目的对象转换为HTML固有目的对象的模式(即,将以上述规定的表现类型记述的目的对象转换为第二格式的功能目的对象的第一模式)、和将原文档的目的对象转换为通常的HTML目的对象的模式(即,将以上述规定的表现类型记述的目的对象转换为相同或类似的方式的第二格式的目的对象的第二模式),按照切换后的模式,将通过办公套件·应用11b制成的OOXML、ODF(第一格式)的原文档转换为能够由网页浏览器利用的HTML格式(第二格式)的文档,生成HTML格式(第二格式)的文档。此外,转换部在原文档的目的对象中附加有明示识别符(在并列记述了多个要素的目的对象的第一要素中记述有明示识别符)的情况下,基于明示识别符,将除了第一要素以外的要素转换为HTML固有目的对象。即,转换部参照预先存储的相对应信息,将以上述规定的表现类型记述的目的对象转换为能够由使Web浏览器动作的装置的操作部(例如,计算机装置10的输入装置16)操作的第二格式的功能目的对象。
另外,在图1A中,将计算机装置10作为信息处理装置进行了说明,但例如也可以作为MFP(多功能外设(Multi-Functional Peripherals))等图像形成装置。此外,在图1A中,设为将计算机装置10以单体进行动作的结构,但也可以设为接收由连接到通信网络的其他计算机装置制成的OOXML、ODF的原文档的数据而转换为HTML格式的结构,进而也可以设为将转换后的HTML格式的数据发送给连接到通信网络的其他计算机装置、服务器的结构。即,本实施例的计算机装置10是至少文档转换程序进行动作的结构即可。
接着,说明上述结构的计算机装置10的处理。CPU12通过将在ROM13、存储装置15中存储的文档转换程序在RAM14中展开并执行,从而进行图2、图4、图6的流程图所示的各步骤的处理。另外,在以下的说明中,将转换对象的原文档设为OOXML格式的文档,但在ODF的文档的情况下也同样。
若从计算机装置10内部的办公套件·应用11b、外部的计算机装置等接收OOXML文档(S101),则文档转换程序确定HTML转换模式(S102)。作为该HTML转换模式,存在将特定的OOXML目的对象转换为HTML固有目的对象的模式(HTML固有目的对象转换模式)、和按照OOXML文档的表现而将OOXML目的对象转换为HTML目的对象(转换为与OOXML目的对象相同或类似的方式的HTML目的对象)的模式(HTML通常目的对象转换模式)这两个模式。
在文档转换程序中搭载有GUI(图形用户界面(Graphical User Interface))的情况下,这些模式的切换能够经由该GUI来设定。图3是在通过GUI设定模式的情况下的对话窗(模式选择画面20)的一例,若用户通过模式选择画面20选择模式,则文档转换程序(转换部)将动作模式切换为所选择的模式。
此外,在所接收到的OOXML文档的文件名中附加有对模式进行明示的规定的关键词的情况下,也可以按照文档转换程序(分析部)判定的关键词的有无,文档转换程序(转换部)切换模式。例如,在如"sample1[Specific].docx"那样在文件名中包含有[Specific]这样的关键词的情况下,切换为HTML固有目的对象转换模式,在如"sample1[ordinary].docx"那样在文件名中包含有[ordinary]这样的关键词的情况或关键词没有被明示的情况下,切换为HTML通常目的对象转换模式。
并且,在动作模式为固有HTML目的对象转换模式的情况下(S103的是),文档转换程序进行HTML固有目的对象转换处理(S104),在动作模式不是固有HTML目的对象转换模式的情况下(S103的否),文档转换程序进行按照OOXML表现的HTML目的对象转换处理(S105)。
图4示出上述S104的HTML固有目的对象转换处理的细节。首先,文档转换程序(分析部)对所接收到的OOXML文档进行分析(S201),对OOXML文档的每个目的对象,判断是否是HTML固有目的对象转换对象(S202)。例如,判断为使用办公套件·应用11b的特定的功能(Microsoft的Word中的分条写功能、段落号功能)而制成的目的对象是HTML固有目的对象转换对象的目的对象。在不是HTML固有目的对象转换对象的OOXML目的对象的情况下,文档转换程序(转换部)按照通常的OOXML表现而转换为HTML目的对象从而生成HTML文档(S205)。
在HTML固有目的对象转换对象的OOXML目的对象的情况下,文档转换程序(分析部)参照在文档转换程序内部预先保持的表,判断该OOXML目的对象是否是明示识别符能够指定的目的对象(S203)。图5是该表的一例,例如,分条写的OOXML目的对象、被赋予段落号的OOXML目的对象是明示识别符能够指定的目的对象,附带章节标题的OOXML目的对象是明示识别符不能指定的目的对象。并且,在判断为不是明示识别符能够指定的目的对象的情况下,文档转换程序按照通常的OOXML表现而转换为HTML目的对象从而生成HTML文档(S205),在判断为是明示识别符能够指定的目的对象的情况下,文档转换程序基于该明示识别符而将OOXML目的对象转换为HTML固有目的对象从而生成HTML文档(S204)。
图6示出基于S204的明示识别符的HTML固有目的对象转换处理的细节。首先,文档转换程序(分析部)对OOXML目的对象的第一要素(例如,分条写的目的对象、被赋予段落号的目的对象的最初的行)进行分析(S301)。在分析的结果能够进行基于明示识别符的处理的情况下(S302的是),文档转换程序(转换部)将OOXML目的对象转换为由该明示识别符指定的HTML固有目的对象(S303)。另一方面,在不能进行基于明示识别符的处理的情况下(S302的否),转换为按照通常的OOXML表现的HTML目的对象(S304)。另外,不能进行基于明示识别符的处理的情况例如是在明示识别符中存在拼写错误,或被指定了不能与OOXML目的对象进行对比的明示识别符的情况等。
图7A、7B是在明示识别符能够指定的OOXML目的对象的第一要素中附加有"<multipleselect>"作为明示识别符的情况下的HTML固有目的对象转换的一例,图7A示出转换前的OOXML目的对象,图7B示出转换后的HTML固有目的对象。在附加有"<multipleselect>"的情况下,文档转换程序(转换部)将使用OOXML的分条写功能而记述的第二要素以后的分条写的要素转换为HTML的多选菜单目的对象。
图8A、8B是在明示识别符能够指定的OOXML目的对象的第一要素中附加有"<pulldown>"作为明示识别符的情况下的HTML固有目的对象转换的一例,图8A示出转换前的OOXML目的对象,图8B示出转换后的HTML固有目的对象。在附加有"<pulldown>"的情况下,文档转换程序(转换部)将使用OOXML的分条写功能而记述的第二要素以后的分条写的要素转换为HTML的下拉菜单目的对象。
另外,上述明示识别符为例示,能够将文档转换程序能够辨识的任意的字符串设为明示识别符。此外,在上述中,对OOXML目的对象的第一要素附加了明示识别符,但明示识别符只要在文档转换程序能够辨识的位置,就能够附加在OOXML目的对象的任意的位置(例如,最后的要素)。此外,在上述中,作为明示识别符能够指定的OOXML目的对象,例示了对要素的开头附加点标记的分条写,但标记的种类是任意的,也可以设为代替标记而附加了数字(段落号)的目的对象。
这样,在本实施例中,在特定的OOXML目的对象中附加有预先决定的明示识别符的情况下,该OOXML目的对象被转换为由该明示识别符指示的HTML固有目的对象,所以能够将由办公套件·应用11b制成的文档转换为反映了用户的意图的HTML格式的文档。
【实施例2】
接着,参照图9至图21B说明本发明的第二实施例所涉及的文档转换程序以及文档转换方法。图9至11是表示本实施例的计算机装置的处理的流程图,图12A至图14C是从OOXML格式向HTML格式的转换例。此外,图15是表示OOXML文件的文件夹结构的图,图16A至图21B是用于生成特定的HTML固有目的对象的记述例。
在所述的第一实施例中,设为在使用办公套件·应用11b制成文档时,用户对OOXML目的对象附加明示识别符的结构,但在本实施例中,文档转换程序进行控制以使自动地判别特定的OOXML目的对象并转换为HTML固有目的对象。
在该情况下,计算机装置10的结构与第一实施例的图1A、1B同样,但文档转换程序的分析部对OOXML、ODF的原文档进行分析,判断在原文档的文件夹结构内是否存在特定的xml要素、或在原文档内是否包含特定的记述、即按照特定的规则而记述的字符、数字或记号。此外,转换部在将OOXML、ODF的原文档转换为HTML格式的文档时,在文件夹结构内存在特定的xml要素的情况下,基于特定的xml要素而将OOXML目的对象转换为HTML固有目的对象,在原文档内包含特定的记述、即按照特定的规则而记述的字符、数字、记号的情况下,基于该特定的记述而将OOXML目的对象转换为HTML固有目的对象。
以下,说明上述结构的计算机装置10的处理。CPU12通过将在ROM13、存储装置15中存储的文档转换程序在RAM14中展开并执行,从而进行图9至图11的流程图所示的各步骤的处理。另外,在以下的说明中,将转换对象的原文档设为OOXML格式的文档,但在ODF的文档的情况下也同样。此外,第一实施例的图2的流程图所示的处理是同样的,所以省略说明。
图9示出图2的S104的HTML固有目的对象转换处理的细节。首先,文档转换程序(分析部)对所接收到的OOXML文档进行分析(S401),判断在OOXML文档的文件夹结构内是否存在特定的xml要素(S402)。在OOXML文档的文件夹结构中包含特定的xml要素的情况下,文档转换程序(转换部)将由特定的xml要素指定的OOXML目的对象转换为HTML固有目的对象而生成HTML文档(S403)。另外,关于OOXML文档的文件夹结构以及特定的xml要素在后面叙述。
在OOXML文档的文件夹结构内不包含特定的xml要素的情况下,文档转换程序(分析部)判断在OOXML文档内是否存在特定的记述(按照特定的规则而记述的字符、数字或记号)(S404)。关于该特定的记述也在后面叙述。并且,文档转换程序(转换部)在OOXML文档内存在特定的记述的情况下,将存在特定的记述的OOXML目的对象转换为与该记述对应的HTML固有目的对象而生成HTML文档(S405),在OOXML文档内不存在特定的记述的情况下,按照通常的OOXML表现而转换为HTML目的对象从而生成HTML文档(S406)。
图10示出基于S403的特定的xml要素的HTML固有目的对象转换处理的细节。首先,文档转换程序(分析部)确认由xml要素指定的OOXML目的对象的类别(S501)。由xml要素指定的OOXML目的对象的类别例如能够基于在xml要素中记述的字符串来确认。并且,文档转换程序(转换部)参照预先存储的相对应信息,基于目的对象类别进行目的对象转换。具体而言,在目的对象类别为“分条写目的对象”的情况下(S502的是),文档转换程序(转换部)如图12A、12B所示,将OOXML目的对象转换为HTML的多选菜单目的对象(S503)。在目的对象类别为“段落号目的对象”的情况下(S502的否,S504的是),文档转换程序(转换部)如图13A、13B所示,将OOXML目的对象转换为HTML的下拉菜单目的对象(S505)。在目的对象类别为“附带章节标题的目的对象”的情况下(S504的否,S506的是),文档转换程序(转换部)如图14A、14B、14C所示,将OOXML目的对象转换为HTML的折叠菜单目的对象(S507),在不是“附带章节标题的目的对象”的情况下(S506的否),按照通常的OOXML表现而转换为HTML目的对象(S508)。另外,若除了这些目的对象以外还定义了转换目标HTML目的对象,则按照该定义而进行向HTML固有目的对象的转换。
图11示出基于S405的特定的记述的HTML固有目的对象转换处理的细节。首先,文档转换程序(分析部)判断在段落的开头部是否存在特定的记号(例如,点标记等)(S601)。在段落的开头部存在特定的记号的情况下,如图12A、12B所示,文档转换程序(转换部)将段落的内容转换为HTML的多选菜单目的对象(S602)。在段落的开头部不存在特定的记号的情况下,文档转换程序(分析部)判断是否在段落的开头部存在连续的序号、字符(例如,1、2…或a、b…等)(S603)。在段落的开头部存在连续的序号、字符的情况下,如图13A、13B所示,文档转换程序(转换部)将段落的内容转换为HTML的下拉菜单目的对象(S604)。在段落的开头部不存在连续的序号的情况下,文档转换程序(转换部)判断目的对象是否被分章(S605)。在目的对象被分章的情况下,文档转换程序(转换部)如图14A、14B、14C所示,将OOXML目的对象转换为HTML的折叠菜单目的对象(S606),在目的对象没有被分章的情况下,按照通常的OOXML表现而转换为HTML目的对象(S607)。另外,若除了这些目的对象以外还定义了转换目标HTML目的对象,则按照该定义而进行向HTML固有目的对象的转换。
图12A、12B是将OOXML的分条写目的对象转换为HTML的多选菜单目的对象的情况下的输入(OOXML的目的对象)和输出(HTML固有的目的对象)的一例。此外,图13A、13B是将OOXML的段落号目的对象转换为HTML的下拉菜单目的对象的情况下的输入(OOXML的目的对象)和输出(HTML固有的目的对象)的一例。图14A、14B、14C是将OOXML的附带章节标题的目的对象转换为HTML的折叠菜单目的对象的情况下的输入(OOXML的目的对象)和输出(HTML固有的目的对象)的一例,图14B示出将全部章进行了展开的情况,图14C示出将第一章和第二章非展开(折叠)而将第三章进行了展开的情况下的HTML固有的目的对象的例子。
图15示出OOXML文件的文件夹结构,OOXML文件由[Content_Types].xml、_rels文件夹、docProps文件夹、word文件夹等构成,在OOXML文档中包含分条写目的对象、段落号目的对象、附带章节标题的目的对象的情况下,在word文件夹内制成特定的xml文件即“numbering.xml”。从而,在OOXML文件的文件夹结构中包含“numbering.xml”的情况下,能够判断为能够进行HTML固有目的对象转换。
图16A至图21B是作为办公套件·应用11b使用Microsoft的Word制成文档的情况下的转换的具体例。图16A、17A、18A、19A、20A、21A是办公套件·应用11b中的记述例,图16B、17B、18B、19B、20B、21B是OOXML文件的xml记述例,图16C、17C、18C是HTML记述例。
例如,在使用Microsoft的Word的分条写功能来制成了如图16A所示的分条写目的对象的情况下,如图16B所示在OOXML文件的“numbering.xml”内记述"<w:numFmt w:val=〝bullet〝/>"的字符串。从而,在“numbering.xml”内存在"bullet"的字符串的情况下,能够判断为该OOXML目的对象是分条写目的对象,所以文档转换程序(转换部)能够通过如图16C所示那样进行HTML记述,生成多选菜单目的对象。
此外,在使用Word的段落号功能来制成了如图17A所示的段落号目的对象的情况下,如图17B所示在OOXML文件的“numbering.xml”内记述"<w:numFmt w:val=〝decimal〝/>"的字符串。从而,在“numbering.xml”内存在"decimal"的字符串的情况下,能够判断为该目的对象是段落号目的对象,所以文档转换程序(转换部)能够通过如图17C所示那样进行HTML记述,生成下拉菜单目的对象。
此外,在使用Word的章节标题功能,制成了如图18A所示的附带章节标题的目的对象的情况下,如图18B所示在OOXML文件的“numbering.xml”内记述"<w:numFmt w:val=〝decimalFullWidth〝/>"、"<w:lblText w:val=〝第%一章〝/>"的字符串。从而,在“numbering.xml”内存在"decimalFullWidth"、"第%一章"等字符串的情况下,能够判断为该目的对象是附带章节标题的目的对象,所以文档转换程序(转换部)能够通过如图18C所示那样进行HTML记述,生成折叠菜单目的对象。
此外,在不使用Word的分条写功能而制成了如图19A所示的分条写目的对象的情况下,如图19B所示那样在OOXML文件的“document.xml”的"<w:body>″内反复记述"<w:t>·</w:t>"的字符串。从而,在“document.xml”内反复配置"·"的字符串的情况下,能够判断为该目的对象是分条写目的对象,所以文档转换程序(转换部)能够与图16C同样地生成多选菜单目的对象。
此外,在不使用Word的段落号功能而制成了如图20A所示的段落号目的对象的情况下,在如图20B所示那样在OOXML文件的“document.xml”的"<w:body>"内反复记述"<w:t>1.</w:t>"、"<w:t>2.</w:t>"…的字符串。从而,在“document.xml”内存在"1"、"2"…的连续的字符串的情况下,能够判断为该目的对象是段落号目的对象,所以文档转换程序(转换部)能够与图17C同样地生成下拉菜单目的对象。
此外,在不使用Word的段落号功能而制成如图21A所示的附带章节标题的目的对象的情况下,在OOXML文件的“document.xml”的"<w:body>"内如图21B所示那样记述"<w:t>第一章序言</w:t>"等字符串。从而,在“document.xml”内存在"第一章"等字符串的情况下,能够判断为该目的对象是附带章节标题的目的对象,所以文档转换程序(转换部)能够与图18C同样地生成折叠菜单(折叠/展开)目的对象。
这样,在本实施例中,在OOXML文件中包含特定的xml要素的情况或包含特定的记述的情况下,OOXML目的对象被转换为与特定的xml要素或特定的记述对应的HTML固有目的对象,所以能够将由办公套件·应用11b制成的文档转换为反映了用户的意图的HTML格式的文档。
另外,本发明不限定于上述实施例,只要不脱离本发明的意旨,其结构、控制能够适当进行变更。
例如,在上述实施例中,作为由办公套件·应用11b制成的文档,例示了OOXML文件,但对ODF文件也能够同样地应用本发明的文档转换方法。
工业上的可利用性
本发明能够利用于将OOXML、ODF的文档转换为HTML格式的文档转换程序以及记录了该文档转换程序的记录介质及文档转换方法。

Claims (10)

1.一种文档转换方法,用于将使用办公套件·应用而制成的第一格式的原文档转换为能够由网页浏览器利用的第二格式的文档的装置,其特征在于,所述文档转换方法执行:
分析处理,分析所述原文档,确定按照所述第一格式以规定的表现类型记述的目的对象;以及
转换处理,参照预先存储、且将按照所述第一格式记述的规定的表现类型、和能够由使所述网页浏览器动作的装置的操作部操作的所述第二格式的功能目的对象相对应的相对应信息,将以所述规定的表现类型记述的目的对象转换为所述第二格式的功能目的对象而生成所述第二格式的文档。
2.如权利要求1所述的文档转换方法,其特征在于,
在所述分析处理中,判定在所述原文档的文件名中是否存在规定的关键词,
在所述转换处理中,基于有无所述规定的关键词,切换将以所述规定的表现类型记述的目的对象转换为所述第二格式的功能目的对象的第一模式、和将以所述规定的表现类型记述的目的对象转换为相同或类似的方式的所述第二格式的目的对象的第二模式。
3.如权利要求1或2所述的文档转换方法,其特征在于,
在所述分析处理中,判定在所述第一格式的目的对象中是否附加有规定的识别符,
在所述转换处理中,在附加有所述规定的识别符的情况下,基于该规定的识别符,将所述第一格式的目的对象转换为所述第二格式的功能目的对象。
4.如权利要求3所述的文档转换方法,其特征在于,
所述第一格式的目的对象是并列记述多个要素的目的对象,
在所述转换处理中,在所述第一格式的目的对象的第一要素中记述有所述规定的识别符的情况下,将除了该第一要素以外的要素转换为与所述规定的识别符相对应的所述功能目的对象。
5.如权利要求1或2所述的文档转换方法,其特征在于,
在所述分析处理中,判定在所述原文档的文件夹结构内是否存在特定的xml要素,
在所述转换处理中,在存在所述特定的xml要素的情况下,基于所述特定的xml要素,将所述第一格式的目的对象转换为所述第二格式的功能目的对象。
6.如权利要求5所述的文档转换方法,其特征在于,
在所述转换处理中,将所述第一格式的目的对象转换为与在所述特定的xml要素中记述的字符串相对应的所述功能目的对象。
7.如权利要求1或2所述的文档转换方法,其特征在于,
在所述分析处理中,判定在所述原文档内是否包含特定的记述,
在所述转换处理中,在包含所述特定的记述的情况下,基于该特定的记述,将所述第一格式的目的对象转换为所述第二格式的功能目的对象。
8.如权利要求7所述的文档转换方法,其特征在于,
所述特定的记述是在段落的开头部配置的字符、数字或记号,
在所述转换处理中,在包含所述特定的记述的情况下,将所述段落的内容转换为与所述特定的记述相对应的所述功能目的对象。
9.如权利要求1至8的任一项所述的文档转换方法,其特征在于,
所述第一格式是OOXML或ODF,所述第二格式是HTML。
10.如权利要求9所述的文档转换方法,其特征在于,
所述功能目的对象是使得能够选择多个选项的多选菜单目的对象、使得能够选择多个选项之一的下拉菜单目的对象、使得能够进行文章的展开/非展开的折叠菜单目的对象。
CN201610329682.XA 2015-05-20 2016-05-18 文档转换方法 Active CN106168944B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015-102361 2015-05-20
JP2015102361A JP6308169B2 (ja) 2015-05-20 2015-05-20 文書変換プログラム及び文書変換方法

Publications (2)

Publication Number Publication Date
CN106168944A true CN106168944A (zh) 2016-11-30
CN106168944B CN106168944B (zh) 2021-08-10

Family

ID=55968997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610329682.XA Active CN106168944B (zh) 2015-05-20 2016-05-18 文档转换方法

Country Status (4)

Country Link
US (1) US20160342575A1 (zh)
EP (1) EP3101554A1 (zh)
JP (1) JP6308169B2 (zh)
CN (1) CN106168944B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108614839A (zh) * 2016-12-13 2018-10-02 上海宝信软件股份有限公司 基于浏览器的word文档转html页面可视化编辑方法及系统
CN109145268A (zh) * 2018-08-22 2019-01-04 中国建设银行股份有限公司 一种文档转换方法及装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6897303B2 (ja) * 2017-05-17 2021-06-30 富士通株式会社 文書変換プログラム、文書変換方法および文書変換装置
JP6904098B2 (ja) * 2017-06-26 2021-07-14 コニカミノルタ株式会社 文書変換装置、文書変換プログラム及び文書変換方法
JP7024511B2 (ja) * 2018-03-09 2022-02-24 コニカミノルタ株式会社 文書変換装置、文書変換プログラム及び文書変換方法
CN113297425B (zh) * 2021-06-22 2023-09-12 超凡知识产权服务股份有限公司 文档转换方法、装置、服务器及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6182092B1 (en) * 1997-07-14 2001-01-30 Microsoft Corporation Method and system for converting between structured language elements and objects embeddable in a document
EP1672524A2 (en) * 2004-12-16 2006-06-21 Microsoft Corporation Systems and methods for converting a formatted document to a web page
US7133935B2 (en) * 1999-10-19 2006-11-07 Shad Hedy System and method for real-time electronic inquiry, delivery, and reporting of credit information
CN101583938A (zh) * 2006-03-29 2009-11-18 校园基督传道会 用于万维网络社区和万维网络应用的转换数据的系统和方法
CN102096661A (zh) * 2009-12-10 2011-06-15 国际商业机器公司 用于对电子文档进行在线编辑的方法和系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06217044A (ja) * 1993-01-19 1994-08-05 Ricoh Co Ltd ファクシミリ装置
US6336124B1 (en) * 1998-10-01 2002-01-01 Bcl Computers, Inc. Conversion data representing a document to other formats for manipulation and display
US7398464B1 (en) * 2002-05-31 2008-07-08 Oracle International Corporation System and method for converting an electronically stored document
WO2008128079A1 (en) * 2007-04-13 2008-10-23 Captaris, Inc. Application isolation system
US20080306986A1 (en) * 2007-06-08 2008-12-11 Accenture Global Services Gmbh Migration of Legacy Applications
US20090222447A1 (en) * 2008-02-18 2009-09-03 Justsystems Corporation Data processing apparatus and data processing method
JP5511016B2 (ja) 2011-04-04 2014-06-04 Necシステムテクノロジー株式会社 書類作成装置、書類作成方法、およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6182092B1 (en) * 1997-07-14 2001-01-30 Microsoft Corporation Method and system for converting between structured language elements and objects embeddable in a document
US7133935B2 (en) * 1999-10-19 2006-11-07 Shad Hedy System and method for real-time electronic inquiry, delivery, and reporting of credit information
EP1672524A2 (en) * 2004-12-16 2006-06-21 Microsoft Corporation Systems and methods for converting a formatted document to a web page
CN101583938A (zh) * 2006-03-29 2009-11-18 校园基督传道会 用于万维网络社区和万维网络应用的转换数据的系统和方法
CN102096661A (zh) * 2009-12-10 2011-06-15 国际商业机器公司 用于对电子文档进行在线编辑的方法和系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108614839A (zh) * 2016-12-13 2018-10-02 上海宝信软件股份有限公司 基于浏览器的word文档转html页面可视化编辑方法及系统
CN109145268A (zh) * 2018-08-22 2019-01-04 中国建设银行股份有限公司 一种文档转换方法及装置

Also Published As

Publication number Publication date
JP2016218698A (ja) 2016-12-22
JP6308169B2 (ja) 2018-04-11
US20160342575A1 (en) 2016-11-24
EP3101554A1 (en) 2016-12-07
CN106168944B (zh) 2021-08-10

Similar Documents

Publication Publication Date Title
CN106168944A (zh) 文档转换方法
US8826169B1 (en) Hiding content of a digital content item
US8127239B2 (en) Object transitions
KR20090013927A (ko) 전자책 뷰어화면 상에서의 메모 실행 방법 및 이에적용되는 장치
US8074167B2 (en) Cross domain presence of web user interface and logic
US20210287570A1 (en) Systems and methods for accessible widget selection
US20090150822A1 (en) Method and system for scrolling
CN106843715A (zh) 用于远程化的应用的触摸支持
US20150113503A1 (en) Selectively enabling runtime editing of an application
CN111936970B (zh) 交叉应用特征链接和教育消息传送
KR20030034037A (ko) 컴퓨터상에서 애플리케이션 소프트웨어를 시작하기 위한제어 장치와 제어 방법, 멀티-모니터 컴퓨터,클라이언트-서버 시스템, 및 이를 이용한 기억 매체
CN105359131B (zh) 栓系选择句柄
US9313239B2 (en) Information processing apparatus, electronic meeting system, and program
US20130139061A1 (en) Desktop sound source discovery
US9727210B2 (en) User terminal device for supporting data share function and methods thereof
KR101498533B1 (ko) 컴포넌트 분리 표시 기반의 전자 문서 출력 장치 및 방법
King -Screenreaders, Magnifiers, and Other Ways of Using Computers
CN112583603B (zh) 可视化签名方法、装置、电子设备和计算机可读存储介质
JP2009211713A (ja) ユーザインタフェース制御装置および方法
Pacey Starterator guide
US9519623B2 (en) Method and apparatus for presenting and navigating bookmarks in a set of electronic reading material
US20120173997A1 (en) System and method for capturing a state of a running application
US9619915B2 (en) Method and apparatus for converting an animated sequence of images into a document page
JP2008041002A (ja) 文書処理装置および文書処理プログラム
KR102487810B1 (ko) 저시력자를 위한 웹문서 제공방법 및 그 사용자 단말

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant