CN1947115A - 文档处理装置和文档处理方法 - Google Patents

文档处理装置和文档处理方法 Download PDF

Info

Publication number
CN1947115A
CN1947115A CNA2005800121433A CN200580012143A CN1947115A CN 1947115 A CN1947115 A CN 1947115A CN A2005800121433 A CNA2005800121433 A CN A2005800121433A CN 200580012143 A CN200580012143 A CN 200580012143A CN 1947115 A CN1947115 A CN 1947115A
Authority
CN
China
Prior art keywords
document
unit
sgml
document processing
processing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800121433A
Other languages
English (en)
Inventor
桧山正幸
和家伸明
大岛教雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Publication of CN1947115A publication Critical patent/CN1947115A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

能够对由多种标记语言描述的文档进行适当处理。文档处理装置(100)通过插件针对每个词汇实现了进行显示/编辑的处理系统,例如用于显示/编辑HTML文档的HTML单元(150)、用于显示/编辑SVG文档的SVG单元(160)。当作为处理对象的文档是由已安装的插件所不能相容的词汇描述时,VC单元(180)将该文档映射至可显示的词汇如HTML和SVG,并通过HTML单元(150)或SVG单元(160)进行显示/编辑。该文档处理装置(100)将由多种词汇描述的文档分别以与各自的词汇对应的插件显示,以接受用户对文档的编辑。

Description

文档处理装置和文档处理方法
技术领域
本发明涉及一种文档处理技术,特别是涉及一种对通过标记语言描述的文档进行处理的文档处理装置和文档处理方法。
背景技术
XML作为适用于通过如网络等与他人共享数据的格式受到人们的关注,且人们正开发用于编写、显示和编辑XML文档的应用软件(例如,请参照专利文献1)。XML文档根据由文档类型定义等定义的词汇(标签集)编写。
专利文献1:特开2001-290804号公报
发明内容
发明要解决的课题
词汇可以任意进行定义,可以存在无限多的词汇。在XML文档中,一个文档在理论上可以混合有多种词汇,但是还没有确立适当地处理这样的复合文档的方法论。
本发明鉴于这种状况而做出的,其目的在于,提供一种适当对由多个标记语言描述的文档进行处理的技术。
为解决课题的方案
本发明的一个实施方式涉及文档处理装置,其特征在于,该文档处理装置包括:多个对由特定的标记语言描述的文档进行处理的处理系统,通过与各自的标记语言相对应的所述处理系统将由多种的标记语言描述的文档显示在同一屏幕上,并接受用户对所述文档的编辑。
标记语言可以是XML的一种方式,例如XHTML、SVG、MathML等,也可以是SGML、HTML等。由于可以对由不同的多种标记语言描述的复合文档进行处理,所以能够编写结构更灵活的文档,可提高用户的便利性。
本发明可以进一步包括变换部,在描述所述文档的标记语言中包含有处理系统不能处理的标记语言时,将由该标记语言描述的部分映射为可以进行处理的标记语言。由于变换后的文档可以通过专用的处理系统进行处理,所以即使是包含有不可处理的标记语言的文档也可以适当地进行显示和编辑。
在描述所述文档的标记语言中包含有处理系统不能处理的标记语言时,可以对由该标记语言描述的部分进行源显示或者树显示。
对描述所述编辑位置所属部分的标记语言进行处理的处理系统可以根据编辑位置来提示编辑用菜单。由此,根据编辑位置可以提供适当的编辑环境。
在由多种标记语言描述的文档中,可以参考由不同的标记语言描述的部分的数据。由标记语言描述的文档基本上以文本为基础来描述,所以即使没有设有专用的处理系统也可以访问数据。因此,在多个标记语言混合的文档中,也可以在由不同的标记语言描述的部分之间参考数据。由此能够编写结构更灵活的文档,可提高用户的便利性。
本发明的另一实施方式涉及一种文档处理方法,其特征在于,通过与各自的标记语言相对应的处理系统将由多种的标记语言描述的文档显示在同一屏幕上,并接受用户对所述文档的编辑。
另外,作为本发明的实施方式,以上构成要素的任意组合、以及将本发明的描述在方法、装置、系统等之间进行变换的方式也是有效的。
发明效果
根据本发明,可提供一种对由多个标记语言描述的文档进行适当处理的技术。
附图说明
图1是有关本发明实施方式的文档处理装置的结构示意图;
图2是通过文档处理装置编辑的XML文档的一个例子的示意图;
图3是将图2所示的XML文档变换为由HTML描述的表的一个例子的示意图;
图4是用来将图2所示的XML文档变换为图3所示的表的定义文件的一个例子的示意图;
图5是将图2所示的XML文档通过图3所示的对应映射为HTML而显示的屏幕的一个例子的示意图;
图6是为了使用户生成定义文件而由定义文件生成部提示给用户的图形用户界面的一个例子的示意图;
图7是由定义文件生成部生成的屏幕布局的其它例子的示意图;
图8是通过文档处理装置形成的XML文档的编辑屏幕的一个例子的示意图;
图9是通过文档处理装置编辑的XML文档的其它例的示意图;
图10是显示图9所示的文档的屏幕的一个例子的示意图。
标号说明
100  文档处理装置  110  主控单元    120  编辑单元
130  DOM单元       132  DOM提供器   134  DOM构造器
136  输出单元      140  CSS单元     150  HTML单元
160  SVG单元       180  VC单元      182  映射单元
184 定义文件获取单元    186定义文件生成单元
发明的优选实施方式
图1示出了本发明实施方式的文档处理装置100的结构。文档处理装置100对结构化的文档进行处理,该文档中的数据被分为具有分级结构的多个构成元素。该实施方案中表示的是一个实施例,其中,对作为结构化文档之一例的XML文档进行处理。文档处理装置100包括:主控单元110、编辑单元120、DOM单元130、CSS单元140、HTML单元150、SVG单元160以及用作变换部一个示例的VC单元180。就硬件部件而言,这些结构可由任意的计算机的CPU或存储器、存储器载入的程序等来实现,但是在此描述为通过它们的协作而实现的功能模块。本领域技术人员能够理解,这些功能模块可仅通过硬件的方式、仅通过软件的方式或通过二者相结合的方式等多种方式来实现。
主控单元110提供插件的载入,和提供执行命令的框架。编辑单元120提供用于编辑XML文档的框架。文档处理装置100中的文档的显示和编辑功能是通过插件来实现的,根据所处理的文档类型,必要的插件通过主控单元110或编辑单元120载入。主控单元110或编辑单元120通过参考待处理的文档的命名空间来确定哪个或哪些词汇描述了待处理的XML文档的内容,并且对应于所确定的词汇载入用于显示和编辑的插件从而执行显示和编辑。例如,对HTML文档进行显示和编辑的HTML单元150、对SVG文档进行显示和编辑的SVG单元160在文档处理装置100中被实现为处理单元。也就是说,对于各个词汇(标签集),将显示系统和编辑系统实现为插件,以使得在对HTML文档和SVG文档进行编辑时,分别将HTML单元150和SVG单元160与其各自的控制单元进行协同载入。如以下将描述的那样,在要对既包括HTML又包括SVG组件的复合文档进行处理时,HTML单元150和SVG单元160均被载入。
通过以上结构,用户能够仅选择必要的功能以安装该功能,如果需要,也能够在稍后的阶段增加或删除适当的功能。因此,能够有效利用记录介质的存储区域(例如储存程序的硬盘),并能够避免在执行程序的时候存储器使用的浪费。此外,由于这一结构有利于功能的扩展,因此开发者自己能够以插件的形式处理新的词汇,因而能够促进开发过程。因此,用户也能够通过增加插件而以较低成本轻易地增加功能。
编辑单元120通过用户界面接收来自用户的编辑指令的事件,将事件通知给适当的插件并控制处理,所述处理可包括重新执行事件的重做(redo)处理以及取消事件的撤消(undo)处理。
DOM单元130包括DOM提供器132、DOM构造器134以及输出单元136。DOM单元130实现了与文档对象模型(Document Object Model:DOM)相符的功能。在XML文档作为数据被处理时,所述文档对象模型被定义以提供访问方法。DOM构造器132是满足由编辑单元120所定义界面的DOM的实现。DOM创建器134从XML文档创建DOM树。如以下将描述的那样,当通过VC单元180将待处理的XML文档映射为其它词汇时,生成与映射源中的XML文档相对应的源树以及与映射目标中的XML文档相对应的目的树。输出单元136例如在编辑结束时,输出作为XML文档的DOM树。
CSS单元140包括CSS分析器142、CSS提供器144以及呈现单元146,并提供与CSS相符的显示功能。CSS分析器142具有用于分析CSS语法的分析功能。CSS提供器144是CSS对象的实现,并执行对DOM树的CSS层叠处理。呈现单元146是CSS的呈现引擎,并用来显示以诸如HTML等词汇描述的、利用CSS布置的文档。
HTML单元150对以HTML描述的文档进行显示或编辑。SVG单元160对以SVG描述的文档进行显示或编辑。这些显示/编辑系统以插件的形式实现,分别包括显示器(Canvas)156、166,用以显示文档;控制器(Editlet)152、162,接收或发送包含了编辑指令的事件;编辑器(Zone)154、164,接收编辑指令以对DOM进行编辑。在控制器152或162从外部源接收到用于DOM树的编辑命令时,编辑器154或164修改DOM树,而显示器156或166更新显示。这些单元具有与被称作MVC(Model-View-Controllers,模型-视图-控制器)的框架相类似的结构,大体上,显示器156及166与“View”对应,控制器152及162与“Controller”对应,编辑器154及164与DOM的实体“Model”分别对应。本实施方式中的文档处理装置100不仅以树的显示格式编辑XML文档,还可以对应于不同的词汇进行编辑。例如,HTML单元150提供用于以类似于文字处理的方式编辑HTML文档的界面,SVG单元160提供用于以类似于图像描绘工具的形式编辑SVG文档的界面。
VC单元180包括映射单元182、定义文件获取单元184以及定义文件生成单元186。通过将以某个词汇描述的文档映射为另一词汇,VC单元180提供了一种框架,以通过与被映射的词汇相对应的显示和编辑插件来显示或编辑文档。在本实施方案中,该功能被称为词汇连接(Vocabulary Connection:VC)。在VC单元180中,定义文件获取单元184获取描述了映射定义的定义文件。该定义文件逐个节点地描述了节点间的对应(连接)。此时,可规定各节点的元素值或属性值是否可以编辑。也可描述使用了节点的元素值或属性值的运算表达式。这些功能将在稍后进行描述。映射单元182使得DOM构造器134通过参考定义文件获取单元184已经获取的定义文件来生成目的树,以使得映射单元182能够管理源树与目的树之间的对应关系。定义文件生成单元186为用户提供图形用户界面,以生成定义文件。
VC单元180对源树与目的树之间的连接进行监控。当VC单元180通过由负责显示的插件提供的用户界面从用户处接收编辑指令时,它首先修改源树的相应节点。因此,DOM单元130将发出表明源树已经被修改的变化事件。然后,VC单元180接收该变化事件,并对应于被修改的节点而修改目的树的节点,以使得目的树与源树的修改同步。当为显示/编辑目的树提供必要的处理的插件(例如HTML单元150)接收了表明目的树已经被修改的变化事件时,该插件通过参考被修改的目的树而对显示进行更新。通过执行将词汇转换为另一主要词汇的上述结构,即使是以少数用户使用的局部词汇来描述文档,也能够正确显示文档,并能够相应地提供理想的编辑环境。
下面将对利用文档处理装置100显示和/或编辑文档的操作进行说明。当文档处理装置100读取作为处理对象的文档时,DOM构造器134从XML文档生成DOM树。主控单元110或编辑单元120通过参考命名空间来判别描述文档的词汇。如果与词汇相对应的插件安装在文档处理装置100中,则该插件被载入以显示/编辑文档。另一方面,如果插件并未安装其中,则确认是否存在映射的定义文件。如果存在定义文件,则定义文件获取单元184获取该定义文件,并根据定义生成目的树,以使得能够通过与映射目标的词汇相对应的插件来显示/编辑文档。如果该文档是包含多个词汇的复合文档,则通过与各词汇相对应的插件来显示/编辑该文档的相关部分,以下将对此详细描述。如果不存在定义文件,则显示文档的源或树型结构,并在所显示的屏幕中进行编辑。
图2示出了待处理的XML文档的一个实施例。该XML文档用于管理与学生已获得的评分或成绩相关的数据。作为XML文档的上部节点的构成元素“成績”包括:在“成績”下方为各个学生设置的多个构成元素“生徒”。构成元素“生徒”具有属性“名前”,并包括作为子元素“国語”、“数学”、“理科”以及“社会”。属性“名前”存储学生的姓名。构成元素“国語”、“数学”、“理科”和“社会”分别存储日语、数学、自然科学和社会科学的成绩。例如,姓名为“A”的学生的成绩是:日语成绩为“90”、数学成绩为“50”、自然科学成绩为“75”以及社会科学成绩为“60”。下文中,该文档中使用的词汇(标签集)被称作“成绩管理词汇”。
由于根据本实施方案的文档处理装置100不具有与成绩管理词汇的显示和/或编辑相对应的插件,因此,将使用以上描述的VC功能,以不使用源显示和树显示的其它显示方法来显示该文档。也就是说,通过准备定义文件,使得成绩管理词汇可映射为已具有插件的另一词汇,例如HTML或SVG等。下面的说明是在假设已经具备了定义文件的情况下进行的,不过对于用户本身用以创建定义文件所必需的用户界面将在后面描述。
图3示出了图2中所示的XML文档映射为以HTML描述的表的一个实施例。在图3所示的实施例中,以成绩管理词汇描述的“生徒”节点与以HTML描述的表(“TABLE”节点)的行(“TR”节点)相关。各行的第一列与属性值“名前”相对应,第二列与“国語”节点的元素值相对应,第三列与“数学”节点的元素值相对应,第四列与“理科”节点的元素值相对应,而第五列与“社会”节点的元素值相对应。因此,图2所示的XML文档能以HTML的列表格式来显示。此外,这些属性值和元素值被指定为能够编辑,以使得用户能够使用HTML单元150的编辑功能在显示屏上对这些值进行编辑。在第六列中,指定了用来计算日语、数学、自然科学以及社会科学的成绩的加权平均的运算表达式,并显示每个学生成绩的平均值。以这种方式,通过在定义文件中指定运算表达式来完成更灵活的显示,从而提高用户在进行编辑时的便利性。在图3所示的实施例中,将对第六列的编辑指定为不允许,以使得不能单独对平均值本身进行编辑。因此,在映射定义中,能够指明可编辑或不能编辑,以避免用户可能的错误操作。
图4表示定义文件的一个实施例,以将图2所示的XML文档映射为图3所示的表。该定义文件通过被定义用于和定义文件一起使用的脚本语言来描述。在图4所示的实施例中,定义了“生徒の追加”(意为“增加学生”)和“生徒の削除”(意为“删除学生”)作为命令,并分别涉及将节点“生徒”插入源树中的操作以及将节点“生徒”从源树中删除的操作。模板描述了诸如“名前”和“国語”等标题显示于表的第一行中,而节点“生徒”的内容显示于第二行及其随后的行中。在显示节点“生徒”内容的模板中,包含“text-of”的项表示允许进行编辑,而包含“value-of”的项表示不允许进行编辑。在这些显示了节点“生徒”内容的行中,在第六行中描述了运算表达式“(src:国語+src:数学+scr:理科+scr:社会)div 4”。这意味着显示学生成绩的平均值。
图5示出了将图2所示的由成绩管理词汇描述的XML文档利用图3所示的对应关系映射至HTML以使其显示在显示屏上时,显示屏的一个实施例。在表200各行中从左至右显示的是各学生的姓名,以及日语成绩、数学成绩、自然科学成绩、社会科学成绩及平均分数。用户能够在屏幕上对XML文档进行编辑。例如,当第二行第三列中的值变为“70”时,源树中与该节点相对应的元素值(亦即学生“B”的数学成绩)变为“70”。此时,为了使目的树符合源树,VC单元180修改目的树的相应部分,从而使得HTML单元150能够根据改变的目的树来对显示进行更新。因此,学生“B”的数学成绩变为“70”,而平均分数相应地变为“55”。
在图5所示的屏幕上,例如“生徒の追加”和“生徒の削除”的命令被显示为菜单,如图4所示的定义文件中所定义的那样。当用户从这些命令中选择一个命令时,节点“生徒”增加至源树中或从源树中删除。以这种方式,利用根据本实施方案的文档处理装置100,不仅能够对分级结构末端中的构成元素的元素值进行编辑,而且能够对该分级结构进行编辑。具有上述树型结构的编辑功能能够以命令的形式提供给用户。例如,增加或删除表中的行的命令与增加或删除节点“生徒”的操作相关。此外,嵌入其它词汇中的命令也可提供给用户。该表可用作输入模板,以使得对于新学生的成绩数据能够以填空的方式来增加。如上所述,在使用HTML单元150的显示/编辑功能的同时,以成绩管理词汇描述的文档可通过VC功能来编辑。
图6示出了由定义文件生成单元186呈现给用户的图形用户界面的一个实施例,以使用户能够生成定义文件。待映射(即映射源)的XML文档在屏幕的左侧区域202显示为树。映射后(即映射目标)的XML文档的屏幕布局显示在屏幕的右侧区域204中。该屏幕布局可通过HTML单元150来编辑,用户在屏幕的右侧区域204中确定并创建用于对文档进行显示的屏幕布局。例如,使用诸如鼠标等的指示设备将屏幕的左侧区域202中显示的XML文档的映射源的节点拖动并放置到屏幕的右侧区域204中的HTML屏幕布局中,以指定映射源处的节点与映射目标处的节点之间的连接。例如,当作为元素“生徒”的子元素的“数学”被放置到HTML屏幕上的表200中第一行第三列的交叉处时,“数学”节点与第三列中的“TD”节点之间建立连接。各节点均如此被指定为可编辑或者不可编辑。此外,可在显示屏中嵌入运算表达式。当完成屏幕编辑时,定义文件生成单元186生成定义文件,其描述屏幕布局与节点之间的连接。
虽然已经开发出了能够处理例如XHTML(可扩展超文本标记语言)、MathML(数学标记语言)以及SVG(可缩放向量图形)等主要词汇的浏览器或编辑器,但是,并未开发出适于以自创词汇描述的所有文档(例如图2中所示的文档)的浏览器或编辑器。然而,如果如上所述创建了用于映射为其它词汇的定义文件,那么以自创词汇描述的文档就能够使用VC功能来显示和/或编辑,而无需不断开发新的浏览器或编辑器。
图7示出了由定义文件生成单元186生成的屏幕布局的另一实施例。在图7所示的实施例中,在屏幕上产生表200和圆图206用于显示以成绩管理词汇描述的XML文档。圆图206以SVG描述。如以下将讨论的那样,根据本示例性实施方案的文档处理装置100能够对在单个XML文档内以多个词汇描述的复合文档进行处理。这就是为什么以HTML描述的表200以及以SVG描述的圆图206能够显示在同一屏幕上的原因。
图8示出了用于由文档处理装置100处理的XML文档的媒体显示,在一个优选但非限制性的实施方案中,其为编辑屏幕。在图8所示的实施例中,单个屏幕被分割为多个区域,而待处理的XML文档在各个区域以多种不同显示格式来显示。该文档的源在区域210中显示,该文档的树结构在区域212中显示,而图5所示的、以HTML描述的表在区域214中显示。该文档在这些区域中可被编辑,当用户对这些区域中的内容进行编辑时,源树将被相应修改,从而负责各屏幕显示的各插件对屏幕进行更新,以使得对源树的上述修改有效。具体而言,负责显示各编辑屏幕的插件的显示单元被预先注册为变化事件的监听器,所述变化事件提供源树中发生了改变的通知。当源树被任意插件或VC单元180修改时,编辑屏幕的显示中的所有显示单元接收所发出的变化事件,由此更新屏幕。此时,如果插件正在通过VC功能进行显示,则VC单元180通过遵循对源树的修改来修改目的树。之后,插件的显示单元通过参考上述经过修改的目的树来更新屏幕。
例如,当通过专用插件来实现源显示和树显示时,源显示插件和树显示插件通过直接参考源树而不是利用目的树来实现它们的显示。在这种情况下,当在屏幕的任何区域中完成编辑时,源显示插件和树显示插件通过参考修改后的源树来更新屏幕。同样,负责显示区域214的HTML单元150通过参考跟随对源树的修改而变更的目的树来更新屏幕。
源显示和树显示也可通过使用VC功能来实现。也就是说,例如,如果HTML被用于源和树型结构的布局,则XML文档可映射为HTML以通过HTML单元150来显示。在这种情况下,将生成具有源格式、树格式、表格式的三个目的树。如果在任意一个屏幕中进行编辑,则VC单元180对源树进行修改,并在之后分别对具有源格式、树格式、表格式的三个目的树进行修改。然后,HTML单元150通过参考三个目的树来更新三个屏幕。
以这种方式,在单个屏幕上以多种显示格式显示文档,从而提高了用户的便利性。例如,用户能够利用表200或类似物来以视觉上易于了解的格式显示和编辑文档,同时通过源显示或树显示来掌握文档的分级结构。在上述实施例中,单个屏幕被划分为多个显示格式,它们被同时显示。但是,也可在单个屏幕上显示单个显示格式,以使得可通过用户指令来切换显示格式。在这种情况下,主控单元110从用户处接收用于切换显示格式的请求,并随后命令各自的插件进行显示切换。
图9示出了由文档处理装置100编辑的XML文档的另一实施例。在图9所示的XML文档中,XHTML文档被嵌入SVG文档的“foreignObject”标签,而该XHTML文档包含以MathML描述的公式。在这种情况下,编辑单元120通过参考命名空间而将描绘任务分配或赋予给适当的显示系统。在图9所示的实施例中,编辑单元120首先使SVG单元160描绘矩形,然后使HTML单元150描绘XHTML文档。此外,编辑单元120使得MathML单元(未示出)描绘公式。以这种方式,包含多个词汇的复合文档被适当地显示。图10示出了显示结果。
在对文档进行编辑期间,可根据光标(キヤリツジ)的位置对被显示的菜单进行切换。也就是说,当光标位于显示SVG文档的区域中时,显示SVG单元160提供的菜单或用于映射SVG文档的定义文件所定义的命令。当光标位于显示XHTML文档的区域中时,显示HTML单元150提供给用户的菜单或用于映射XHTML文档的定义文件所定义的命令。因此,可根据编辑位置提供适当的用户界面。
如果在复合文档中不存在与词汇对应的适当插件或映射定义文件,则以该词汇描述的部分可显示为源或树格式。现有技术中,在打开其中某个文档中嵌有另一文档的复合文档时,如果其中未安装有显示该嵌入文档的应用程序,则不能显示其内容。但是,在本实施方式中,即使不存在显示用的应用程序,也可以通过对由文本数据组成的XML文档进行源显示或树显示,来确定其内容。这是以文本为基础的XML文档等文档的特征。
以文本的语言来描述数据的另一个优点在于,例如,在复合文档中以某词汇描述的部分的数据可以参考同一文档中以其他词汇描述的部分的数据。此外,当在该文档中进行搜索时,嵌入SVG等的图片中的字符串也可作为搜索对象。
在以某个词汇记述的文档中,也可以使用其它词汇的标签。虽然该XML文档通常并不有效(valid),但只要它结构良好(well-formed),就可作为有效的XML文档进行处理。在这种情况下,被插入的其它词汇的标签也可以通过定义文件来进行映射。例如,在XHTML文档中,可以使用“重要”、“最重要”等标签对这些标签包围的部分进行强调显示,也可以以重要性的顺序来排序并显示。
在图10所示的编辑屏幕中,当用户对文档进行编辑时,负责对被编辑的部分进行处理的插件或VC单元180对源树进行修改。在源树中,对各个节点均可注册对于变化事件的监听器。通常,与各个节点所属的词汇对应的插件的显示单元或VC单元180被注册为监听器。当源树被修改时,DOM提供器132从被修改的节点向更高层搜索。如果存在注册的监听器,则DOM提供器132向该监听器发出变化事件。例如,参照图9中所示的文档,如果位于<html>节点下方的节点被修改,那么该变化事件被通报给被注册为<html>节点的监听器的HTML单元150。在同一时刻,该变化事件被通报给被注册为位于<html>节点上方的<svg>节点中的监听器的SVG单元160。此时,HTML单元150通过参考被修改的源树而更新显示。由于属于SVG单元160的词汇的节点本身并未被修改,因此SVG单元160可忽视该变化事件。
根据编辑的内容,由HTML单元150对显示进行的更新可改变总体布局。在这种情况下,对于各插件的各个显示区域的布局将由管理屏幕布局的组件(例如,负责显示最高节点的插件)来更新。例如,当由HTML单元150显示的区域较之以前变大时,HTML单元150首先描绘HTML单元150本身所负责的区域,然后确定显示区域的大小。然后,显示区域的大小被通报给管理屏幕布局的组件,以请求对布局进行更新。负责屏幕布局的组件一收到该通知便为各个插件重新布置显示区域。因此,被编辑的部分的显示被适当更新,且屏幕总体的布局被更新。
以上对本发明的实施方式进行了说明,但该实施方式只是举例说明。所属领域的技术人员可以知道,在各构成要素和各处理程序的组合中可以有各种变化例,且这种变化例也属于本发明的范围。
在实施方式中虽然对处理XML文档的例子进行了说明,但是,本实施方式的文档处理装置100同样可以进行由其它标记语言,例如SGML、HTML等描述的文档的处理。
产业上的利用可行性
本发明可以用于对由标记语言描述的文档进行处理的文档处理装置。

Claims (7)

1.文档处理装置,其特征在于,所述文档处理装置包括多个对由特定的标记语言描述的文档进行处理的处理系统,
其中,将由多种标记语言描述的文档通过与各标记语言相对应的所述处理系统显示在同一屏幕上,并接受由用户对所述文档的编辑。
2.根据权利要求1所述的文档处理装置,其特征在于,所述文档处理装置进一步包括:
变换部,在描述所述文档的标记语言中包含有处理系统不能处理的标记语言的情况下,将由该标记语言描述的部分映射为能够被处理的标记语言。
3.根据权利要求1所述的文档处理装置,其特征在于,
在描述所述文档的标记语言中包含有处理系统不能处理的标记语言时,对由该标记语言描述的部分进行源显示或者树显示。
4.根据权利要求1至3的任一项所述的文档处理装置,其特征在于,
根据编辑位置,对描述所述编辑位置所属部分的标记语言进行处理的处理系统提示用于编辑的菜单。
5.根据权利要求1至4的任一项所述的文档处理装置,其特征在于,在由多种标记语言描述的文档中,能够参考由不同标记语言描述的部分的数据。
6.文档处理方法,其特征在于,所述方法通过与各标记语言相对应的处理系统将由多种标记语言描述的文档显示在同一屏幕上,并接受用户对所述文档的编辑。
7.计算机程序,其特征在于,该计算机程序通过计算机实现以下功能:通过与各自的标记语言相对应的处理系统,将由多种标记语言描述的文档显示在同一屏幕上,并接受用户对所述文档的编辑。
CNA2005800121433A 2004-04-08 2005-04-06 文档处理装置和文档处理方法 Pending CN1947115A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004114529 2004-04-08
JP114529/2004 2004-04-08

Publications (1)

Publication Number Publication Date
CN1947115A true CN1947115A (zh) 2007-04-11

Family

ID=35125271

Family Applications (2)

Application Number Title Priority Date Filing Date
CNA2005800121433A Pending CN1947115A (zh) 2004-04-08 2005-04-06 文档处理装置和文档处理方法
CNA2005800121429A Pending CN1947114A (zh) 2004-04-08 2005-04-08 处理使用标记语言的文档的装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNA2005800121429A Pending CN1947114A (zh) 2004-04-08 2005-04-08 处理使用标记语言的文档的装置

Country Status (5)

Country Link
US (1) US20080256437A1 (zh)
EP (1) EP1744253A1 (zh)
JP (1) JPWO2005098662A1 (zh)
CN (2) CN1947115A (zh)
WO (1) WO2005098662A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425468A (zh) * 2012-05-17 2013-12-04 航天信息股份有限公司 插件式软件集成方法及装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1821220A1 (en) * 2004-11-12 2007-08-22 JustSystems Corporation Data processing device, document processing device, and document processing method
CN102479212B (zh) * 2010-11-30 2016-06-22 国际商业机器公司 识别网页上键盘不可访问节点的方法以及装置
CN103150742A (zh) * 2011-12-06 2013-06-12 上海可鲁系统软件有限公司 一种矢量图形动态渲染方法及其装置
CN107368561B (zh) * 2017-07-07 2020-06-02 北京小米移动软件有限公司 页面的绘制方法、装置及终端
CN107506431A (zh) * 2017-08-22 2017-12-22 广州创维平面显示科技有限公司 由xml文件生成html文件的方法、存储介质及终端

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4815029A (en) * 1985-09-23 1989-03-21 International Business Machines Corp. In-line dynamic editor for mixed object documents
JPH10307816A (ja) * 1997-05-08 1998-11-17 Just Syst Corp 構造化文書処理装置、構造化文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3460597B2 (ja) * 1998-09-22 2003-10-27 日本電気株式会社 複合文書管理システム及び複合文書の構造管理方法ならびに複合文書構造管理プログラムを格納した記録媒体
US7284199B2 (en) * 2000-03-29 2007-10-16 Microsoft Corporation Process of localizing objects in markup language documents
JP2001290803A (ja) * 2000-04-07 2001-10-19 Just Syst Corp 文書処理方法、文書処理装置、および記録媒体
GB0107784D0 (en) * 2001-03-28 2001-05-16 Hewlett Packard Co Improvement relating to developing documents
JP3857663B2 (ja) * 2002-04-30 2006-12-13 株式会社東芝 構造化文書編集装置、構造化文書編集方法及びプログラム
US7228496B2 (en) * 2002-07-09 2007-06-05 Kabushiki Kaisha Toshiba Document editing method, document editing system, server apparatus, and document editing program
US20040268229A1 (en) * 2003-06-27 2004-12-30 Microsoft Corporation Markup language editing with an electronic form
JP4553599B2 (ja) * 2003-08-29 2010-09-29 コニカミノルタビジネステクノロジーズ株式会社 データ表示システム、データ出力装置、画像形成装置、データ表示装置およびデータ表示プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425468A (zh) * 2012-05-17 2013-12-04 航天信息股份有限公司 插件式软件集成方法及装置
CN103425468B (zh) * 2012-05-17 2016-12-14 航天信息股份有限公司 插件式软件集成方法及装置

Also Published As

Publication number Publication date
JPWO2005098662A1 (ja) 2008-02-28
CN1947114A (zh) 2007-04-11
EP1744253A1 (en) 2007-01-17
US20080256437A1 (en) 2008-10-16
WO2005098662A1 (ja) 2005-10-20

Similar Documents

Publication Publication Date Title
US20100107048A1 (en) Document processor and document processing method
CN1950817A (zh) 文档处理装置和文档处理方法
US20100100807A1 (en) Data processing device, and data processing method
CN1977259A (zh) 文档处理装置和文档处理方法
CN101057231A (zh) 文档处理装置和文档处理方法
CN1947115A (zh) 文档处理装置和文档处理方法
CN1977260A (zh) 文档处理装置和文档处理方法
JPWO2006137563A1 (ja) データ処理装置及びデータ処理方法
JP4566196B2 (ja) 文書処理方法および装置
CN101057232A (zh) 文档处理装置和文档处理方法
US20070260973A1 (en) Document Processing Method and Device
JPWO2007052680A1 (ja) 文書処理装置及び文書処理方法
CN101268438A (zh) 数据处理装置
US20070240036A1 (en) Document Processing Device and Document Processing Method
JP4719743B2 (ja) グラフ処理装置
US20090094509A1 (en) Document processing device, and document processing method
JP2008257277A (ja) 文書処理装置、方法、及びプログラム
JP2006139623A (ja) 文書処理装置
JP2008225931A (ja) 文書処理装置及び文書処理方法
JPH07225764A (ja) 文書編集装置
CN101278256A (zh) 数据处理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication