CN101057232A - 文档处理装置和文档处理方法 - Google Patents

文档处理装置和文档处理方法 Download PDF

Info

Publication number
CN101057232A
CN101057232A CNA200580038723XA CN200580038723A CN101057232A CN 101057232 A CN101057232 A CN 101057232A CN A200580038723X A CNA200580038723X A CN A200580038723XA CN 200580038723 A CN200580038723 A CN 200580038723A CN 101057232 A CN101057232 A CN 101057232A
Authority
CN
China
Prior art keywords
document
note
document processing
satellite information
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CNA200580038723XA
Other languages
English (en)
Inventor
辻井雅树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Publication of CN101057232A publication Critical patent/CN101057232A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提供对以标记语言记述的文档进行适当处理的技术。当文档处理装置获取标记语言记述的文档时,提取该文档中所包含的用于注释的元素。在存在为了添加注释而准备的元素的情况下,在该元素的元素值的附近显示该元素的元素名。元素名可以显示为文本形式,也可以显示为注释框形式。此外,元素名也可以显示在状态显示区域等区域。

Description

文档处理装置和文档处理方法
技术领域
本发明涉及一种文档处理技术,特别是涉及一种处理由标记语言记述的文档的文档处理装置和文档处理方法。
背景技术
XML作为适用于通过网络等与他人共享数据的格式受到人们的关注,且人们正开发用于编写、显示和编辑XML文档的应用软件(例如,请参考专利文献1)。XML文档基于利用文档类型定义等定义的词汇(标签组)形成。
专利文献1:特开2001-290804号公报。
发明内容
发明要解决的课题
词汇可以任意进行定义,在理论上可以存在无限多的词汇。对应于所有这些词汇提供专用的显示和编辑环境是不太现实的。在现有技术中,在对由专用编辑环境未准备的词汇描述的文档进行编辑的情况下,直接用文本编辑器等编辑由文本数据构成的文档的源。
本发明是鉴于这种状况而做出的,其目的在于提供一种在对基于标记语言的结构化数据进行处理时可提高用户的便利性的技术。
解决课题的手段
本发明涉及文档处理装置。这种文档处理装置的特征在于包括:文档获取装置,获取以标记语言记述的文档;提取装置,提取上述文档中所包含的元素或者属性;和显示装置,显示所提取的上述元素或者属性名称。
上述的提取装置可以提取上述文档所包含的为添加注释而准备的元素或者属性。上述名称可以以文本形式在上述元素的元素值、上述属性的属性值、上述属性所属的元素的元素值的任一种的附近显示。上述名称也可以以注释框形式在上述元素的元素值、上述属性的属性值、上述属性所属的元素的元素值的任一种的附近显示。上述名称也可以在状态显示区域中显示。
本发明也可以是其他方式的文档处理装置,该装置具有:文档获取单元,获取以标记语言构造的文档文件作为源文件;定义文件获取单元,获取记述了源文件所含数据的显示方法的定义文件;和数据显示单元,通过执行定义文件所记述的逻辑对源文件所含的数据进行屏幕显示。
所述定义文件记述了注释信息,所述注释信息用于确定源文件所包含的附属信息中应作为注释来显示的附属信息,所述附属信息是附属于标签并表示元素特性的信息。数据显示单元把根据定义文件的注释信息所确定的附属信息作为对正文的注释来显示。
本发明也可以是其他方式的文档处理装置。该装置具有:文档获取单元,用于获取以标记语言记述的结构化文档文件作为源文件;和数据显示单元,以预定的显示形式对源文件中所包含的数据进行屏幕显示。
在源文件中,在附属于标签而表示元素特性的附属信息中,对于应显示注释的附属信息附加有注释符,数据显示单元把依据注释符所确定的附属信息作为对正文的注释来显示。
还可以包括操作检测部,用于检测用户对屏幕显示数据的操作。当通过用户的操作指定了元素(该元素被设定作为注释来显示的对象)时,数据显示单元可以使该元素的附属信息作为注释来显示。
数据显示单元可以将对象元素的标签名、对象元素的元素值、对象元素的属性名和对象元素的属性的属性值的其中至少之一作为附属信息而显示为注释。
本发明的另外的形式是文档处理方法,其特征在于包括:获取以标记语言构造的文档文件作为源文件的步骤;获取记述了源文件所含数据的显示方法的定义文件的步骤;和通过执行定义文件所记述的逻辑来对源文件中所包含的数据进行屏幕显示的步骤。
在定义文件中,把标签所附属的表示元素特性的信息作为附属信息,记述了用于确定源文件所含的附属信息中应作为注释来显示的附属信息的注释信息。在屏幕显示数据的步骤中,依据定义文件的注释信息所确定的附属信息作为对正文的注释来显示。
本发明另外的形式是文档处理方法,其特征在于包括:获取以标记语言构造的文档文件作为源文件的步骤,和以预定的显示形式对源文件中所包含的数据进行屏幕显示的步骤。
在源文件中附属于标签而表示元素特性的附属信息中,在应显示注释的附属信息上附加有注释符,在对数据进行屏幕显示的步骤中,将根据注释符所确定的附属信息作为对正文的注释来显示。
此外,以上构成要素的任意组合、以及将本发明的表现在方法、装置、系统等之间变换的方式,作为本发明的形式也是有效的。
发明效果
利用本发明对以标记语言记述的结构化数据进行处理,可以为用户提供便利性。
附图说明
图1是与前提技术相关的文档处理装置的构成示意图;
图2示出了由文档处理装置编辑的XML文档的例子;
图3示出了将图2所示的XML文档映射为HTML描述的表的例子;
图4(a)示出了用于将图2所示的XML文档映射为图3所示的表的定义文件的例子;
图4(b)示出了用于将图2所示的XML文档映射为图3所示的表的定义文件的例子;
图5示出了通过图3所示的对应关系将图2所示的XML文档映射为HTML并显示的屏幕的例子;
图6示出的是为了用户创建定义文件而将定义文件生成单元提供给用户的图形用户界面;
图7示出了利用定义文件生成单元生成的屏幕布局(layout)的另一例;
图8示出了文档处理装置提供的XML文档的编辑屏幕的例子;
图9示出了利用文档处理装置编辑的XML文档的另一例子;
图10示出了显示图9所示文档的屏幕显示的例子;
图11所示的是含有注释的XML文档的一部分;
图12所示的是显示有图11的XML文档的屏幕的例子;
图13所示的是显示有图11的XML文档的屏幕的另外的例子;
图14所示的是显示有图11的XML文档的屏幕的其他的例子;
图15所示的是与实施方式有关的文档处理装置的构成图。
符号说明
20文档处理装置      22主控单元        24编辑单元
30 DOM单元          32 DOM提供单元    34 DOM生成单元
36输出单元          40 CSS单元        42分析单元
44 CSS提供单元      46呈现单元        50 HTML单元
52、62控制单元      54、64编辑单元    56、66显示单元
60 SVG单元          70数据获取单元    72文档获取单元
74定义文件获取单元  80 VC单元         82映射单元
84定义文件获取单元  86定义文件生成单元
100文档处理装置
具体实施方式
(前提技术)
图1示出了与前提技术相关的文档处理装置20的结构。文档处理装置20对结构化的文档进行处理,该文档中的数据被分为具有分级结构的多个构成元素。在本前提技术中以对作为结构化文档一例的XML文档进行处理为例来说明。文档处理装置20包括主控单元22、编辑单元24、DOM(文档对象模块)单元30、CSS(层叠样式表)单元40、HTML(超文本标记语言)单元50、SVG(可缩放矢量图形)单元60以及用作变换单元一个示例的VC(词汇连接)单元80。在硬件组件方面,这些单元结构可由任意计算机的CPU、存储器、载入存储器中的程序等来实现。这里,描述了由它们的协作而实现的功能模块。因此,本领域技术人员能够理解,这些功能模块可仅通过硬件的方式、仅通过软件的方式或通过二者相结合的方式以多种形式来实现。
主控单元22提供插件的载入或提供执行命令的框架。编辑单元24提供了用于编辑XML文档的框架。文档处理装置20中的文档的显示和编辑功能是通过插件来实现的,而必要的插件是根据所处理的文档类型、通过主控单元22或编辑单元24来载入的。主控单元22或编辑单元24通过参考作为处理对象的XML文档的命名空间来确定哪个或哪些词汇描述了待处理的XML文档的内容,并且载入与所确定的词汇对应的用于显示和编辑的插件,从而执行显示和编辑。例如,在文档处理装置20中,对HTML文档进行显示和编辑的HTML单元50、以及对SVG文档进行显示和编辑的SVG单元60等对于各词汇(标签集)的显示系统和编辑系统作为插件被安装,以分别在对HTML文档进行编辑时载入HTML单元50,和在对SVG文档进行编辑时载入SVG单元60。如以下将描述的那样,在要对既包括HTML又包括SVG组件的复合文档进行处理时,既载入HTML单元50又载入SVG单元60。
通过实现以上结构,由于用户能够仅选择并安装必要的功能,然后可以增加或删除适当的功能。因此,能够有效利用记录媒介的存储区域(例如硬盘),并在执行程序的时候还能够避免存储器的浪费。此外,由于这一结构有利于性能扩展,因此开发者自己能够以插件的形式处理新的词汇,因而能够促进开发过程;用户也能够通过增加插件而以较低成本轻易地增加功能。
编辑单元24通过用户接口从用户处接收编辑指令的事件,将事件通知适当的插件等并对包括事件的重做(redo)以及执行的撤消(undo)等处理进行控制。
DOM单元30包括DOM提供单元32、DOM生成单元34以及输出单元36。DOM单元30实现了与文档对象模型(DOM)相符的功能,在XML文档作为数据被处理时,所述文档对象模型被定义以提供访问方法。DOM提供单元32是满足由编辑单元24定义的接口的DOM的实现。DOM生成单元34从XML文档生成DOM树。如以下将描述的那样,当通过VC单元80将待处理的XML文档映射为其它词汇时,生成与映射源中的XML文档相对应的源树以及与映射目的中的XML文档相对应的目的树。例如,在编辑结束时,输出单元36输出作为XML文档的DOM树。
CSS单元40提供与CSS相符的显示功能,并包括CSS分析单元42、CSS提供单元44以及呈现单元46。CSS分析单元42具有用于分析CSS语法的分析功能。CSS提供单元44是CSS对象的实现,并对DOM树执行CSS的层叠处理。呈现单元46是CSS的呈现引擎,并用来显示利用CSS设置的以诸如HTML等的词汇描述的文档。
HTML单元50对以HTML描述的文档进行显示或编辑。SVG单元60对以SVG描述的文档进行显示或编辑。这些显示/编辑系统以插件的形式实现,各个系统包括对文档进行显示的显示单元“画布(Canvas)”56、66、发送和接收包括编辑命令的事件的控制单元“Editlet”52、62以及在接收到编辑命令时对DOM进行编辑的编辑单元“区(zone)”54、64。在控制单元52或62从外部源接收到用于DOM树的编辑命令时,编辑单元54或64修改DOM树,而显示单元56或66更新显示。这些单元具有与被称作MVC(Model-View-Controllers,模型-视图-控制器)的框架相类似的结构,通常,显示单元56及66对应于“视图(View)”,控制单元52及62对应于“控制器(Controller)”,而编辑单元54及64和DOM实体对应于“模型(Model)”。在本前提技术的文档处理装置20中,不仅能够以树型视图显示格式来编辑XML文档,而且能够根据相应的词汇来完成编辑。例如,HTML单元50提供了用户界面,通过该用户界面能够以一种类似于Word处理器的方法对HTML文档进行编辑,而SVG单元60提供了一种用户界面,通过该用户界面能够以一种类似于图像绘制工具的方法对SVG文档进行编辑。
VC单元80包括映射单元82、定义文件获取单元84以及定义文件生成单元86。VC单元80提供了一种框架,通过将以某个词汇描述的文档映射为另一词汇,以通过与被映射的词汇相对应的显示和编辑插件来显示或编辑文档。在本前提技术中,该功能被称为词汇连接(Vocabulary Connection:VC)。定义文件获取单元84获取描述了映射定义的脚本文件。该定义文件逐个节点地描述了节点间的对应(连接)。此时,可规定各节点的元素值或属性值是否可以编辑。也可描述使用了节点的元素值或属性值的运算表达式。这些功能将在稍后进行描述。映射单元82使得DOM生成单元34通过参考VC定义文件获取单元84已经获取的脚本文件来生成目的树,以管理源树与目的树之间的对应关系。定义文件生成单元86为用户提供图形用户界面,以生成定义文件。
VC单元80对源树与目的树之间的连接进行监控。当VC单元80通过由负责显示的插件提供的用户接口从用户处接收编辑指令时,它首先修改源树的相关节点。因此,DOM单元30将发出指示源树已经被修改的变化事件。然后,VC单元80接收该变化事件,并修改对应于被修改的节点的目的树的节点,以使得目的树与源树的修改同步。当显示/编辑目的树的插件(例如HTML单元50)接收了指示目的树已经被修改的变化事件时,该插件通过参考被修改的目的树而对显示进行更新。通过执行将词汇转换为另一主要词汇的上述结构,即使是以少数用户使用的局部词汇来描述文档,也能够显示文档,并提供编辑环境。
以下对文档处理装置20显示和/或编辑文档的操作进行描述。当文档处理装置20载入待处理的文档时,DOM生成单元34从XML文档生成DOM树。主控单元22或编辑单元24通过参考待处理的XML文档的命名空间来对描述XML文档的词汇进行判别。如果与词汇相对应的插件安装在文档处理装置20中,则该插件被载入以显示/编辑文档。另一方面,如果插件并未安装其中,则进行检查以确认是否存在映射的定义文件。如果存在定义文件,则定义文件获取单元84获取该定义文件,并根据定义生成目的树,以使得能够通过与要被映射的词汇相对应的插件来显示/编辑文档。如果该文档是包含多个词汇的复合文档,如后面所述,则通过与各词汇相对应的插件来显示/编辑该文档的相关部分。如果不存在定义文件,则显示文档的源或树型结构,并在显示屏中进行编辑。
图2示出了作为处理对象的XML文档的例子。该XML文档用于管理学生的成绩数据。作为XML文档的上部节点的元素“成績”包括:在“成績”下方为各个学生设置的多个元素“生徒”。元素“生徒”具有属性“名前”,并包括作为子元素的学科“国語”(日语)、“数学”、“理科”以及“社会”(社会科学)。属性“名前”存储学生的姓名。组件“国語”、“数学”、“理科”和“社会”存储分别为日语、数学、自然科学和社会科学的学科的测试成绩。例如,姓名为“A”的学生的成绩是:日语为“90”、数学为“50”、自然科学为“75”以及社会科学为“60”。下文中,该文档中使用的词汇(标签集)被称作“成绩管理词汇”。
由于本前提技术的文档处理装置20不具有与成绩管理词汇的显示和/或编辑相对应的插件,因此,将使用以上描述的VC功能,而不使用源显示和树显示的其它显示方法来显示该文档。也就是说,通过准备定义文件,使得成绩管理词汇可映射为已具有插件的另一词汇,例如HTML或SVG。下面将要进行的说明是在假设已经具备了定义文件的情况下进行的,不过对于用户本身用以创建定义文件所必需的用户界面将在后面描述。
图3示出了将图2中所示的XML文档映射为以HTML描述的表的例子。在图3所示的例子中,使以成绩管理词汇描述的“生徒”节点与以HTML描述的表(“TABLE”节点)的行(“TR”节点)相对应。各行的第一列与属性值“名前”相对应,第二列与“国語”节点的元素值相对应,第三列与“数学”节点的元素值相对应,第四列与“理科”节点的元素值相对应,而第五列与“社会”节点的元素值相对应。因此,图2所示的XML文档能以HTML的列表格式来显示。此外,这些属性值和元素值被指定为能够编辑,以使得用户能够使用HTML单元50的编辑功能在利用HTML显示的屏幕上对这些值进行编辑。在第六列中,指定了用来计算日语、数学、自然科学以及社会科学的分数的加权平均的运算表达式,并显示每个学生的分数的平均值。以这种方式,通过在定义文件中指定运算表达式来完成更灵活的显示,从而提高用户在进行编辑时的便利性。另外,将对第六列的编辑指定为不允许,以使得不能单独对平均值本身进行编辑。因此,在映射定义中,能够指定可编辑或不能编辑,以避免用户可能的错误操作。
图4(a)和4(b)表示定义文件的例子,以将图2所示的XML文档映射为图3所示的表。该定义文件通过被定义用于和定义文件一起使用的脚本语言来描述。在图4(a)和4(b)所示的例子中,“生徒の追加”和“生徒の削除”被定义为命令,并分别涉及将节点“生徒”插入源树中的操作以及将节点“生徒”从源树中删除的操作。作为模板,描述了诸如“名前”和“国語”的标题显示于表的第一行中,而节点“生徒”的内容显示于第二行及其随后的行中。在显示节点“生徒”内容的模板中,包含“text-of”的项表示允许进行编辑,而包含“value-of”的项表示不允许进行编辑。在这些显示了节点“生徒”内容的行中,在第六列中描述了运算表达式“(src:国語+src:数学+src:理科+src:社会)div 4”。这意味着显示学生成绩的平均值。
图5示出了将图2所示的由成绩管理词汇描述的XML文档利用图3所示的对应关系映射为HTML以使其显示在显示屏上时,显示屏的一个例子。在表90各行中从左至右显示的是各学生的姓名、日语成绩、数学成绩、自然科学成绩、社会科学成绩及其平均值。用户能够在该屏幕上对XML文档进行编辑。例如,当第二行第三列中的值变为“70”时,源树中与该节点相对应的元素值(亦即学生“B”的数学成绩)变为“70”。此时,为了使目的树与源树一致,目的树的相应部分因此而改变,从而使得HTML单元50能够根据改变的目的树来对显示进行更新。因此,学生“B”的数学成绩变为“70”,而平均值相应地变为“55”。
在图5所示的屏幕上,例如“生徒の追加”和“生徒の削除”的命令被显示为菜单,如图4(a)、(b)所示的定义文件中所定义的那样。当用户从这些命令中选择一个命令时,节点“生徒”增加至源树中或从源树中删除。以这种方式,利用根据本前提技术的文档处理装置20,不仅能够对分级结构下端中的组件的元素值进行编辑,而且能够对该分级结构进行编辑。具有上述树型结构的编辑功能能够以命令的形式显现给用户。此外,增加或删除表中的行的命令可例如与增加或删除节点“生徒”的操作相关。嵌入其它词汇中的命令可显现给用户。该表可用作输入模板,以使得对于新学生的成绩数据能够以填空的方式来增加。如上所述,在使用HTML单元50的显示/编辑功能的同时,以成绩管理词汇描述的文档可通过VC功能来编辑。
图6示出了由定义文件生成单元86显现给用户的图形用户界面的例子,以使用户能够生成定义文件。待映射的XML文档在屏幕的左侧区域91显示为树。被映射成的XML文档的屏幕布局显示在屏幕的右侧区域92中。该屏幕布局可通过HTML单元50来编辑,用户在屏幕的右侧区域92中确定并创建用于对文档进行显示的屏幕布局。然后,例如,使用诸如鼠标等的指示设备将屏幕的左侧区域91中显示的XML文档的待映射的节点拖动并放置到屏幕的左侧区域91中的HTML屏幕布局中,以指定映射源处的节点与映射目的处的节点之间的连接。例如,当作为元素“生徒”的子元素的“数学”被放置到HTML屏幕上的表90中第一行与第三列的交叉处时,“数学”节点与第三列中的“TD”节点之间建立连接。各节点均如此被指定为可编辑或者不可编辑。此外,可在显示屏中嵌入运算表达式。当完成屏幕编辑时,定义文件生成单元86生成描述屏幕布局与节点之间的连接的定义文件。
已经开发出了能够处理主要词汇(例如XHTML(可扩展超文本标记语言)、MathML(数学标记语言)以及SVG(可缩放矢量图形))的浏览器或编辑器。但是,不可能开发出适于以自创词汇描述的所有文档(例如图2中所示的文档)的浏览器或编辑器。然而,如果如上所述创建了用于映射为其它词汇的定义文件,那么以自创词汇描述的文档就能够使用VC功能来显示和/或编辑,而不需不断开发新的浏览器或编辑器。
图7示出了由定义文件生成单元86生成的屏幕布局的另一例子。在图7所示的例子中,在屏幕上产生表90和圆形图93用于显示以成绩管理词汇描述的XML文档。圆形图93以SVG描述。如以下将讨论的那样,由于根据本前提技术的文档处理装置20能够对在单个XML文档内以多个词汇描述的复合文档进行处理,因此,如该例子所示,以HTML描述的表90以及以SVG描述的圆形图93能够显示在同一屏幕上。
图8示出了用于由文档处理装置20处理的XML文档的编辑屏幕的一例。在图8所示的例子中,单个屏幕被分割为多个区域,而待处理的XML文档在各个区域以多种不同显示格式显示。该文档的源在区域94中显示,该文档的树结构在区域95中显示,而以图5所示的HTML描述的表在区域96中显示。该文档在这些区域中的任意区域均可被编辑,当用户对这些区域中的任意区域的内容进行编辑时,源树将被相应修改,从而负责各屏幕显示的插件更新应反映源树变更的屏幕。具体而言,负责显示对应编辑屏幕的插件的显示单元被预先注册为变化事件的监听器,所述变化事件提供源树中发生了改变的通知。当源树被任意插件或VC单元80修改时,显示编辑屏幕的所有显示单元接收发出的一个或多个变化事件,并从而更新屏幕。此时,如果插件正在通过VC功能进行显示,则VC单元80根据对源树的修改来修改目的树。之后,插件的显示单元通过参考上述经过修改的目的树来对屏幕进行修改。
例如,当通过专用插件来实现源显示和树型视图显示时,源显示插件和树显示插件通过直接参考源树而不是利用目的树来实现它们的显示。在这种情况下,当在屏幕的任何区域中完成编辑时,源显示插件和树显示插件通过参考修改后的源树来更新屏幕。同样,负责显示区域96的HTML单元50通过参考目的树来更新屏幕,该目的树已根据对源树的修改而做了修改。
源显示和树型视图显示也可通过使用VC功能而实现。也就是说,例如,如果HTML被用于源和树型结构的布局,则XML文档可映射为HTML以通过HTML单元50来显示。在这种情况下,将生成具有源格式、树格式、表格式的三个目的树。如果在屏幕上的三个区域的任意一个中进行编辑,则VC单元80对源树进行修改,并在之后分别对具有源格式、树格式、表格式的三个目的树进行修改。然后,HTML单元50通过参考三个目的树来更新屏幕的三个区域。
以这种方式,在单个屏幕上以多种显示格式显示文档,从而提高了用户的便利性。例如,用户能够利用表90等以视觉上易于理解的格式显示和编辑文档,同时通过源显示或树显示来理解文档的分级结构。在上述实施例中,单个屏幕被划分为多个显示格式,它们被同时显示。但是,也可在单个屏幕上显示单个显示格式,从而可通过用户指令来切换显示格式。在这种情况下,主控单元22从用户处接收用于切换显示格式的请求,并随后命令各插件进行显示切换。
图9示出了由文档处理装置20编辑的XML文档的另一例。在图9所示的XML文档中,XHTML文档被嵌入SVG文档的“foreignObject”标签中,而该XHTML文档包含以MathML描述的公式。在这种情况下,编辑单元24通过参考命名空间而将描绘任务分配或指派给适当的显示系统。在图9所示的实施例中,编辑单元24首先使SVG单元60描绘矩形,然后使HTML单元50描绘XHTML文档。此外,编辑单元24使MathML单元(未示出)描绘公式。以这种方式,包含多个词汇的复合文档被适当地显示。图10示出了显示结果。
在对文档进行编辑期间,待显示的菜单可根据光标(キヤリツジ)的位置被切换。也就是说,当光标位于显示SVG文档的区域中时,显示SVG单元60提供的菜单、或用于映射SVG文档的定义文件中定义的命令。当光标位于显示XHTML文档的区域中时,显示HTML单元50提供的菜单、或用于映射XHTML文档的定义文件中定义的命令。因此,可根据编辑位置提供适当的用户界面。
如果在复合文档中不存在与某词汇相符的适当插件或映射定义,则以该词汇描述的部分可以源或树格式显示。在传统实践中,当要打开在某个文档中嵌有其它文档的复合文档时,如果没有安装能够显示该嵌入文档的应用程序,则它们的内容不能显示。但是,根据本前提技术,即使不存在用于显示的应用程序,也可以将由文本数据组成的XML文档显示为源或树格式,从而能够确定其内容。这是基于文本的XML文档或类似文档的一个特征。
以基于文本的语言来描述数据的另一个有益方面例如在于,在同一文档中以其它词汇描述的部分的数据可被该复合文档中以某个词汇描述的另一文档所参考。此外,当在该文档中进行搜索时,嵌入SVG等图片中的字符串也可作为被搜索的对象。
在以某个词汇描述的文档中,可使用属于其它词汇的标签。虽然该XML文档通常并不有效,但只要它结构良好(well-formed),就可作为有效的XML文档而被处理。在这种情况下,被插入的属于其它词汇的标签可使用定义文件来进行映射。例如,在XML文档中,可使用诸如“重要”和“最重要”的标签以通过强调的方式来显示这些标签周围的部分,或者可将这些标签按重要性的顺序来排序以进行相应显示。
当用户在图10所示的编辑屏幕上对文档进行编辑时,负责对被编辑的部分进行处理的插件或VC单元80对源树进行修改。能够为源树中的各个节点注册对于变化事件的监听器。通常,与属于各个节点的词汇相符的插件的显示单元或VC单元80被注册为监听器。当源树被修改时,DOM提供单元32从被修改的节点向较高层次探索。如果存在注册的监听器,则DOM提供单元32向该监听器发出变化事件。例如,参考如图9中所示的文档,如果位于<html>节点下方的节点被修改,那么该变化事件被通报给被注册为<html>节点的监听器的HTML单元50。在同一时刻,该变化事件被通报给被注册为位于<html>节点上方的<svg>节点中的监听器的SVG单元60。此时,HTML单元50通过参考被修改的源树而更新显示。由于属于SVG单元60本身的词汇的节点并未被修改,因此SVG单元60可忽视该变化事件。
根据编辑的内容,可以随着HTML单元50对显示进行的修改来改变总体布局。在这种情况下,对于各插件的各个显示区域的布局将由管理屏幕布局的组件(例如,负责显示最高节点的插件)来更新。例如,当由HTML单元50显示的区域较之以前变大时,HTML单元50首先描绘HTML单元50本身所负责的区域,然后确定显示区域的大小。然后,显示区域的大小被通报给管理屏幕布局的组件,以请求对布局进行更新。负责屏幕布局的组件一收到该通知便为各个插件重新布置显示区域。因此,被编辑的部分的显示被适当更新,且总体屏幕布局被更新。
(实施方式)
在本实施方式中,提出了在文档文件中存在用于加注释的注释元素或者属性的场合,对该元素或者属性的名称进行显示的技术。在阅览或者编辑文档时,有时想着重显示文档的一部分。在字处理器等中,一般可以用给文字加下线、变成粗体字、变颜色等方法来对文字进行强调显示。在本实施方式中,对在编辑XML文档时也实现同样功能的技术进行说明。
注释标签可以是例如为给某些词汇加注释而准备的标签,也可以是属于为了加注释而准备的词汇的标签。此外,也可以是用户等在定义文件等中作为注释标签所指定的标签。也可以根据属性来附加注释。
文档处理装置20对文档文件中是否存在注释标签或者属性进行判断,当注释标签或者属性存在的场合,显示该名称。例如,标签名可以显示在由注释标签所包围的文本的一侧,也可以在文本的周围以注释框形式显示,也可以显示在状态显示区域等区域中。因此,用注释标签可以有效地对作为注释而指定的内容进行强调显示。
图11所示的是含有注释的XML文档的一部分。在图11的例子中,在元素“sprinkle:役割”中,对属性“name”被指定为“資本コスト”的元素进行强调显示。因此,文档处理装置20在以属性被指定为“資本コスト”的“sprinkle:役割”标签所包围的文本“10%”的周围或者状态显示区域中显示属性名“資本コスト”。
图12所示的是显示图11的XML文档的屏幕显示的例子。在图12中,注释用的属性名称“資本コスト”显示在了文本“10%”的一侧。在这个例子中,也显示了属性“id”的属性值。名称既可以一直显示,也可以在光标指到文本上时在该文本附近显示。名称也可以显示在文本的上、下、右、左等任意位置。
图13所示的是显示图11的XML文档的屏幕显示的其他例子。在图13中,注释用的属性名称“資本コスト”以注释框的形式显示在了文本“10%”的附近。名称既可以是一直以注释框来显示,也可以在光标指到文本上时在该文本附近以注释框来显示。注释框可以显示在文本的上、下、右、左等任意位置。
图14所示的是显示图11的XML文档的屏幕显示的其他例子。
在图14中,注释用的属性的名称“資本コスト”显示在了状态显示区域中。名称既可以一直显示,也可以在光标指到文本上时显示。名称也可以显示在状态显示区域以外的弹出窗口等任意的区域。
下面对文档处理装置20显示注释标签的标签名的操作进行说明。下面虽然只是对标签名进行说明,但是对于属性名的场合也是同样的。首先,作为第1个例子,以对用于在定义文件中处理注释元素的模板的记述例子进行说明。在与含有注释标签的XML文档所对应的定义文件中,准备有注释元素的模板,在该模板中将注释元素的文本节点与连接器“text_of”建立对应。而且,在目的树中,记述有用于生成储存注释元素的元素名的文本节点的连接器。据此,在目的树中将生成储存有注释元素文本的文本节点,和储存有该元素名的文本节点。在这种场合,元素名将一直显示在文本的旁边,如果想只有在光标指到文本上时才显示元素名,可以进一步在定义文件中记述用于实现此目的的逻辑。
作为第2个例子,以VC单元80自动生成标签名的显示为例进行说明。当VC单元80检测到注释元素时,即使在定义文件中没有记述该元素的模板,也将自动生成用于生成储存有元素名的文本节点的连接器。据此,将在目的树中生成储存有元素名的文本节点,元素名将被显示。
作为第3个例子,以另外准备的、具有显示注释元素的元素名功能的单元为例进行说明。该注释显示单元以插件的形式提供,也可以增加到文档处理装置20中。例如,注释显示单元可以生成用于显示注释元素的元素名的透明层,把该层重叠显示在显示文档的画面上。当注释显示单元检测出注释元素时,在用于显示注释的层上、注释元素的文本附近或者系统行等处把元素名作为文本或者注释框来写入。注释显示单元可以只在光标指到文本上时,才把元素名显示在用于注释显示的层上。
下面对本实施方式提供附加的说明。
图15所示的是与实施方式有关的文档处理装置100的构成图。在文档处理装置100的构成中显示了为获取处理对象数据而构成的数据获取单元70。数据获取单元70包含有文档获取单元72和定义文件获取单元74。文档获取单元72获取作为处理对象的XML文档文件。定义文件获取单元74获取用于确定已经获取的XML文件显示形式的定义文件。文档获取单元72也可以经由网络从因特网服务器等外部装置获取XML文档文件。
在上述第1个例子的情况下,在此定义文件中,记述用于对XML文件中预定的标签、预定的元素的标签名、元素值等附属于标签的各种信息进行注释显示的逻辑。例如,可以记述将与图11相关说明的由<sprinkle>标签所示的属性中的name属性的值以注释框形式显示的逻辑。在上述第2、第3个例子的情况下,VC单元80、注释显示单元等具备把XML文档文件中预定的标签上所附属的信息进行注释显示的功能。例如,可以具备这样的功能,即在检测出与图11相关地说明的<sprinkle>标签时,把它的属性名和属性值显示在状态栏上。在这种场合,原本存在于XML文档文件中的<sprinkle>标签起到用于确定注释显示对象数据的注释符的作用。
以上根据实施方式对本发明进行了说明。本领域技术人员可以理解,这些实施方式只是个例子,这些构成要素、各个处理过程的组合可以形成各种各样的变化例子,这些变化的例子也属于本发明的范围内。
虽然在实施方式中对处理XML文档的例子进行了说明,本实施方式的文档处理装置100对以其他的标记语言(例如,SGML、HTML等)描述的文档也可以进行同样的处理。
产业上利用的可能性
利用本发明对以标记语言描述的结构化数据进行处理,可以提高用户的便利性。

Claims (13)

1.文档处理装置,其特征在于,包括:
文档获取装置,获取以标记语言记述的文档;
提取装置,提取所述文档中包含的元素或者属性;和
显示装置,显示所提取的所述元素或者属性的名称。
2.权利要求1所述的文档处理装置,其特征在于,所述提取装置提取所述文档中所包含的为了提供注释而准备的元素或者属性。
3.权利要求1或2所述的文档处理装置,其特征在于,所述名称以文本形式显示在所述元素的元素值、所述属性的属性值、以及所述属性所属的元素的元素值中任一个的附近。
4.权利要求1或2所述的文档处理装置,其特征在于,所述名称与所述元素的元素值,所述属性的属性值,以及所述属性所属的元素的元素值中任一个相邻地以注释框形式显示。
5.权利要求1或2所述的文档处理装置,其特征在于,所述名称显示在状态显示区域中。
6.文档处理装置,其特征在于包括:
文档获取单元,获取以标记语言记述的结构化文档文件作为源文件;
定义文件获取单元,获取记述了源文件中所包含数据的显示方法的定义文件;
数据显示单元,通过执行定义文件所记述的逻辑,对源文件中所包含的数据进行屏幕显示,其中
在上述定义文件中记述有注释信息,所述注释信息用于确定源文件所包含的附属信息中应作为注释来显示的附属信息,所述附属信息是附属于标签并表示元素特性的信息;以及
所述数据显示单元把由定义文件的注释信息所确定的附属信息作为对正文的注释来显示。
7.文档处理装置,其特征在于包括:
文档获取单元,获取以标记语言记述的结构化文档文件作为源文件;
数据显示单元,将源文件所含的数据以预定的显示形式进行屏幕显示,
其中,在所述源文件中,在附属于标签并表示元素特性的附属信息中的应作为注释显示的附属信息上附加有注释符,
所述数据显示单元把由所述注释符所确定的附属信息显示为对正文的注释。
8.权利要求6或7所述的文档处理装置,其特征在于,还包括操作检测单元,检测用户对屏幕显示数据的操作,
当根据用户的操作指定了元素,该元素被设定为作为注释来显示的对象时,所述数据显示单元将与该元素有关的附属信息显示为注释。
9.权利要求6至8任一项所述的文档处理装置,其特征在于,所述数据显示单元将对象元素的标签名、所述对象元素的元素值、所述对象元素的属性名和所述对象元素的属性的属性值的至少任意一项作为所述附属信息而显示为注释。
10.文档处理方法,其特征在于包括:
获取以标记语言记述的结构化文档文件作为源文件的步骤;
获取记述了源文件所含数据的显示方法的定义文件的步骤;和
通过执行定义文件所记述的逻辑来对源文件所含数据进行屏幕显示的步骤;
在所述定义文件中,把附属于标签并表示元素特性的信息作为附属信息来记述注释信息,所述注释信息用于确定源文件所含的附属信息中应作为注释来显示的附属信息;
在对数据进行屏幕显示的步骤中,将由上述定义文件的注释信息所确定的附属信息作为对正文的注释来显示。
11.文档处理方法,其特征在于包括:
获取以标记语言记述的结构化文档文件作为源文件的步骤;和
以预定的显示形式对源文件所含的数据进行屏幕显示的步骤,
其中,在所述源文件中,对附属于标签而表示元素特性的附属信息中应作为注释来显示的附属信息附加注释符,
在对数据进行屏幕显示的步骤中,将由所述注释符所确定的附属信息作为对正文的注释来显示。
12.文档处理程序,其特征在于在计算机中实现如下功能:
获取以标记语言记述的结构化文档文件作为源文件的功能;
获取记述了源文件所含数据的显示方法的定义文件的功能;
通过执行定义文件所记述的逻辑来对源文件所含数据进行屏幕显示的功能;和
以附属于标签而表示元素特性的信息作为附属信息,从定义文件中读出用于确定在源文件所含的附属信息中应作为注释来显示的附属信息的注释信息,把根据该注释信息所确定的源文件的附属信息作为对正文的注释来显示的功能。
13.文档处理程序,在计算机中实现如下功能:
获取以标记语言记述的结构化文档文件的功能,所述结构化文档文件在附属于标签而表示元素特性的附属信息中应作为注释来显示的附属信息上附加有注释符,
以预定的显示形式对源文件所含数据进行屏幕显示的功能,和
把根据所述源文件的注释符确定的附属信息作为对正文的注释来显示的功能。
CNA200580038723XA 2004-11-12 2005-11-14 文档处理装置和文档处理方法 Withdrawn CN101057232A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004329806 2004-11-12
JP329806/2004 2004-11-12

Publications (1)

Publication Number Publication Date
CN101057232A true CN101057232A (zh) 2007-10-17

Family

ID=36336639

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200580038723XA Withdrawn CN101057232A (zh) 2004-11-12 2005-11-14 文档处理装置和文档处理方法

Country Status (5)

Country Link
US (1) US20080270887A1 (zh)
EP (1) EP1837776A1 (zh)
JP (1) JPWO2006051974A1 (zh)
CN (1) CN101057232A (zh)
WO (1) WO2006051974A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107636641A (zh) * 2015-05-22 2018-01-26 微软技术许可有限责任公司 用于处理附加至电子邮件消息的注释的统一消息传送平台
CN109844711A (zh) * 2016-09-23 2019-06-04 苹果公司 用于向设备上显示的内容加注释的统一注释层的设备、方法和图形用户界面
US10846459B2 (en) 2015-05-22 2020-11-24 Microsoft Technology Licensing, Llc Unified messaging platform and interface for providing user callouts

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201013430A (en) * 2008-09-17 2010-04-01 Ibm Method and system for providing suggested tags associated with a target page for manipulation by a user
CN102236713A (zh) * 2011-07-05 2011-11-09 广东星海数字家庭产业技术研究院有限公司 一种数字电视交互服务页面的信息提取方法及其装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08320882A (ja) * 1995-03-17 1996-12-03 Hitachi Ltd 文書処理装置および文書検索装置
JPH1040236A (ja) * 1996-07-19 1998-02-13 Nec Corp コメント付きハイパーテキスト文書処理装置
JP4030674B2 (ja) * 1999-03-10 2008-01-09 株式会社エヌ・ティ・ティ・データ 地理情報システム及び記録媒体
JP3674905B2 (ja) * 1999-09-29 2005-07-27 日立ソフトウエアエンジニアリング株式会社 文書編集装置
US6859909B1 (en) * 2000-03-07 2005-02-22 Microsoft Corporation System and method for annotating web-based documents
JP2001350742A (ja) * 2000-06-06 2001-12-21 Hitachi Ltd 埋め込み型用語解説情報表示装置
US7284191B2 (en) * 2001-08-13 2007-10-16 Xerox Corporation Meta-document management system with document identifiers
US7747943B2 (en) * 2001-09-07 2010-06-29 Microsoft Corporation Robust anchoring of annotations to content
US7739588B2 (en) * 2003-06-27 2010-06-15 Microsoft Corporation Leveraging markup language data for semantically labeling text strings and data and for providing actions based on semantically labeled text strings and data
CN100555264C (zh) * 2003-10-21 2009-10-28 国际商业机器公司 电子文档的注释方法、装置和系统
US20050108630A1 (en) * 2003-11-19 2005-05-19 Wasson Mark D. Extraction of facts from text
US7343552B2 (en) * 2004-02-12 2008-03-11 Fuji Xerox Co., Ltd. Systems and methods for freeform annotations
US7284192B2 (en) * 2004-06-24 2007-10-16 Avaya Technology Corp. Architecture for ink annotations on web documents

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107636641A (zh) * 2015-05-22 2018-01-26 微软技术许可有限责任公司 用于处理附加至电子邮件消息的注释的统一消息传送平台
US10846459B2 (en) 2015-05-22 2020-11-24 Microsoft Technology Licensing, Llc Unified messaging platform and interface for providing user callouts
US10897441B2 (en) 2015-05-22 2021-01-19 Microsoft Technology Licensing, Llc Unified messaging platform for displaying attached content in-line with e-mail messages
CN109844711A (zh) * 2016-09-23 2019-06-04 苹果公司 用于向设备上显示的内容加注释的统一注释层的设备、方法和图形用户界面
CN109844711B (zh) * 2016-09-23 2022-07-15 苹果公司 用于向设备上显示的内容加注释的统一注释层的设备、方法和图形用户界面

Also Published As

Publication number Publication date
WO2006051974A1 (ja) 2006-05-18
US20080270887A1 (en) 2008-10-30
EP1837776A1 (en) 2007-09-26
JPWO2006051974A1 (ja) 2008-05-29

Similar Documents

Publication Publication Date Title
CN1783085A (zh) 网页编辑设备、网页编辑方法及程序
US20100107048A1 (en) Document processor and document processing method
CN101057231A (zh) 文档处理装置和文档处理方法
EP1821219A1 (en) Document processing device and document processing method
US20100100807A1 (en) Data processing device, and data processing method
JPWO2006137563A1 (ja) データ処理装置及びデータ処理方法
CN1977259A (zh) 文档处理装置和文档处理方法
CN1950817A (zh) 文档处理装置和文档处理方法
CN101057232A (zh) 文档处理装置和文档处理方法
WO2006137562A1 (ja) 文書処理装置及び文書処理方法
CN1947115A (zh) 文档处理装置和文档处理方法
JP4373470B2 (ja) 文書変換活用システム
EP1830274A1 (en) Server device and name space issuing method
JP4566196B2 (ja) 文書処理方法および装置
CN1977260A (zh) 文档处理装置和文档处理方法
US20090287994A1 (en) Document processing device and document processing method
CN1973284A (zh) 文档处理方法及其装置
US20080005085A1 (en) Server Device and Search Method
EP1821220A1 (en) Data processing device, document processing device, and document processing method
JP2007265011A (ja) 画面プログラムレイアウト変更方法および情報処理装置およびプログラムおよび記録媒体
JP2007183849A (ja) 文書処理装置
JP4417384B2 (ja) 文書処理装置および文書処理方法
CN101268438A (zh) 数据处理装置
JP4719743B2 (ja) グラフ処理装置
US20090083620A1 (en) Document processing device and document processing method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C04 Withdrawal of patent application after publication (patent law 2001)
WW01 Invention patent application withdrawn after publication