CN1462401A - 文档数据处理器、服务器设备、终端设备、和文档数据处理系统 - Google Patents

文档数据处理器、服务器设备、终端设备、和文档数据处理系统 Download PDF

Info

Publication number
CN1462401A
CN1462401A CN02801445A CN02801445A CN1462401A CN 1462401 A CN1462401 A CN 1462401A CN 02801445 A CN02801445 A CN 02801445A CN 02801445 A CN02801445 A CN 02801445A CN 1462401 A CN1462401 A CN 1462401A
Authority
CN
China
Prior art keywords
document data
link
link information
data
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN02801445A
Other languages
English (en)
Inventor
多田浩之
竹内俊一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1462401A publication Critical patent/CN1462401A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

将指示到另一页的链路的链路信息加入分文档数据的每一页,并将另一页的标题、另一页的首字/短语、或代表另一页的字/短语加入到所述链路信息中。根据与链路信息对应的另一页的数据量改变添加到分文档数据的每一页的链路信息的字/短语长度、字符颜色、或字符大小。

Description

文档数据处理器、服务器设备、 终端设备、和文档数据处理系统
技术领域
本发明涉及用于处理用结构描述语言描述的文档数据的文档数据处理器、服务器设备、终端设备、和文档数据处理系统。
背景技术
随着近年来因特网的普及,用便于WWW(World Wide Web,万维网)使用的诸如HTML(Hyper Text Markup Language,超文本标记语言)之类的结构描述语言描述的内容(诸如文档、图像和声音之类的多媒体数据)也正迅速传播起来。
至于HTML,W3C(万维网联盟(World Wide Web Consortium))正在把它标准化,在如下网站的W3C网页上描述了HTML 4.01的技术规范:http://www.w3.org/TR/html401/。
接着,参照图1说明HTML的描述。图1示出了HTML描述的例子。
如图1所示,通过定义HEAD标记、TITLE标记、HTML标记、和BODY标记,HTML能够构造一个文档。此外,如图中的4201所示,HTML的特征在于,它具有使用如<A HREF>所指的超文本链接标记(HYPERTEXT LINKTAG)(下文称之为“链接标记)来实现建立与另一个HTML文件、图像文件或声音文件的链接的超文本的能力。
并且,WWW被构造成对应于其中在网络上连接存储用HTML描述的内容(诸如文档、图像和声音之类的多媒体数据)的服务器和请求获得服务器存储的多媒体数据的客户机的系统。通过提供这样的系统,在HTTP(HyperText Transport Protocol,超文本传输协议)下,以把数据请求从客户机发送到服务器和把与请求相对应的数据从服务器发送到客户机的方式构造WWW。至于HTTP的技术规范,描述在RFC 2616中。
另外,借助于服务器和客户机,可以利用诸如工作站和个人计算机之类的通用计算机实现WWW。根据服务器计算机,执行HTTP服务器程序。另一方面,在客户机计算机上,利用HTTP进行通信,并且,执行翻译HTML和显示数据的HTML浏览器程序。
接着,参照图2描述WWW的操作。图2示出了实现WWW的系统的方块图。
首先,用户通过客户机4320的输入部分4321指定所需HTML内容的URL(Uniform Resource Locator,统一资源定位符),请求HTML内容。URL是与网络上资源标识符相关的标准,并且,描述在RFC 1738中。
从输入部分4321输入的请求由数据请求发送部分4322通过网络4330发送到服务器4310。
服务器4310利用文档数据请求接收部分4311接收从客户机4320发送的请求。接着,服务器4310利用数据获取部分4312从数据库4313中获取所请求的HTML内容。然后,数据获取部分4312把获取的HTML内容发送到数据发送部分4314。文档数据发送部分4314通过网络4330把接收的HTML内容发送到客户机4320。
客户机4320利用数据接收部分4323接收请求的HTML内容。
然后,客户机4320把接收的HTML内容显示在数据显示部分4324。
例如,如果客户机4320接收到图1所示的HTML内容,数据显示部分4324把<BODY>4218和</BODY>4220之间的字节序列4219,即,“HELLO”翻译成要显示的内容。然后,数据显示部分4324显示字节序列4219,“HELLO”。另外,数据显示部分4324把4201所示的<A HREF>和</A>之间的字符“2”翻译成链接文本。然后,数据显示部分4324显示字符“2”。图3示出数据显示部分4324翻译和示出图1的HTML内容的例子。
此外,随着WWW的广泛使用,移动电话和PHS等的移动计算环境也迅速普及起来。
在这样的环境下,已经出现了对资源有限的设备,即移动电话的信息提供服务,譬如,NTT DoCoMo公司提供的“i-mode”服务、KDDI公司提供的“EZweb”服务、和J-PHONE公司提供的“J-SKY Web”服务。
与“i-mode”、“EZweb”和“J-SKY Web”服务有关的信息可分别从http://www.nttdocomo.co.jp/i/index.htnl、http://www.au.kddi.co.jp/ezweb/index.html、和http://www.j-phone-east.com/p_and_s/sds/jskyweb/star/t.htm网站上获得。
但是,就它们能够显示和分辨等的信息的数量而言,利用来自这种来自服务器的信息提供服务的移动终端设备仍然存在各种各样的局限性。因此,就信息获取和显示而言,移动电话存在着一些局限性。由于这个原因,服务器把信息划分成几块,并且把连接这些分块内容的链路提供给移动电话用户。目前,已经提出了几种这样的内容提供方法。
例如,待审日本专利公布第10-143498号陈述了以每页为基础划分用HTML描述的文档数据,并且把另一页的页码加入每个分页中,作为指示到另一页的链路的信息(下文用短语表达成“到另一页的链接信号”)的技术。
此外,待审日本专利公布第11-175426号陈述了把原始内容划分成几页,并且,把前一页和后一页、和首页和末页加入每个分页中,作为到其它页的链路信息的技术。这个公布进一步公开了把输入列提供到监视器屏幕上,以便输入用户想要显示的页数的技术,或显示滚动条和利用这个滚动条改变要显示的页面的技术。
并且,待审日本专利公布第2000-76473号陈述了以每个部分为基础分页文档数据,把每个分页标题集中在一起,形成索引页,用户通过从索引页上的标题中选择想选标题,能够显示所需内容的页面的技术。
但是,根据在待审日本专利公布第10-143498号、待审日本专利公布第11-175426号、和待审日本专利公布第2000-76473号中陈述的技术,与其它页内容有关的信息没有包含在链路信息中。这样就造成了用户难以根据链路信息选择所需内容的页面的问题。
另外,根据在待审日本专利公布第2000-76473号中陈述的技术,可以从以每个部分为基础划分的页面的标题中获取有关每页内容的信息。但是,仍然造成当用户想要显示另一页时,用户不得不首先显示控制起来有些麻烦的索引页的问题。
并且,就上述所有技术而论,均没有提供有关与链路信息对应的链接页的数据量的信息。因此,当用户想要显示某一页时,用户没有办法知道那一页的数据量,从而,没有办法知道那一页的数据量是否与用户终端的容量相匹配。由于这个原因,存在着无法判断某一页是否适合于显示的用户在选择适合于显示的页面时会遇到困难的问题。
发明内容
本发明的目的是在划分文档数据时,使用户能够轻而易举地观看文档数据。
为了达到上述目的,本发明被配置成把不同分文档数据的标题、不同分文档数据中的首字/短语加入分文档数据中,或者把代表不同分文档数据的字/短语加入指示到不同分文档数据的链路的链路信息中。
借助于这种方法,观看文档数据的用户从加入每一页的链路信息中的标题、首短语或代表另一页的短语中,能够轻而易举地知道另一页的内容。结果,用户从用户当前观看的页面中,能够轻而易举地获得有关另一页的内容的信息。因此,即使划分了文档内容,用户也能够毫无困难地观看文档数据。
另外,本发明被配置成字/短语长度、字符颜色、和字符大小随链路信息与之对应的远程页的数据量而改变。
借助于这种方法,观看文档数据的用户能够根据字/短语长度、字符颜色、和字符大小确定每个分页的数据量。通过这种方法,用户能够判断是否适合显示某一页和选择适合显示的页面。结果,用户可以轻而易举地观看文档数据。
另外,借助于本发明,在接收文档数据的终端设备中内置存储文档数据的高速缓冲存储器,并且,当另一个分页存在于高速缓冲存储器之中时,字/短语长度、字符颜色、和字符大小等随链接到高速缓冲存储器中的这一页的链路信息而改变。
借助于这种方法,观看文档数据的用户能够根据字/短语长度、字符颜色、和字符大小判断链接的远程页是否存在于高速缓冲存储器中。这样就使用户能够选择存储在高速缓冲存储器中的页面,然而显示该页面。结果,用户可以轻而易举地观看文档数据。
附图说明
图1示出了HTML描述的例子;
图2示出了实现WWW的系统的方块图;
图3示出了图1所示的HTML文档的显示例子;
图4是示出根据本发明实施例1的文档数据处理系统的配置的方块图;
图5是根据实施例1的服务器设备和终端设备的硬件配置图;
图6是示出根据实施例1的文档数据处理系统的流程图;
图7示出了HTML描述的例子;
图8示出了划分图7所示的HTML文档的例子;
图9示出了根据实施例1把链路加入其它分页中的例子;
图10是示出原HTML文档与分HTML文档之间的关系图;
图11是示出如图9所示的HTML文档的显示例子的图;
图12示出了根据实施例1把链路加入其它分页中的例子;
图13是示出在终端设备方上图12所示的HTML文档的显示例子的图;
图14是示出根据本发明实施例2的文档数据处理系统的配置的方块图;
图15是示出根据实施例2的服务器设备的操作的流程图;
图16示出了HTML描述的例子;
图17示出了划分图16所示的HTML文档的例子;
图18示出了根据实施例2把链路加入其它分页中的例子;
图19是示出如图18所示的HTML文档的显示例子的图;
图20示出了根据实施例2把链路加入其它分页中的例子;
图21A示出了图20所示的HTML文档的显示例子;
图21B是示出图20所示的HTML文档的另一个显示例子的图;
图21C是显示图20所示的HTML文档的再一个显示例子的图;
图22是示出根据本发明实施例3的系统的配置的方块图;
图23是示出根据实施例3的服务器设备的操作的流程图;
图24示出了HTML描述的例子;
图25示出了划分图24所示的HTML文档的情况;
图26示出了根据实施例3把链路加入其它分页中的例子;
图27示出了把指定划分尺寸的链路加入图26所示的HTML文档中的例子;
图28是示出图27所示的HTML文档的显示例子的图;
图29示出了划分图24所示的HTML文档的例子;
图30示出了根据实施例3把链路加入其它分页中的例子;
图31示出了把指定划分尺寸的链路加入图30所示的HTML文档中的例子;
图32示出了图31所示的HTML文档的显示例子;
图33是示出根据本发明实施例4的系统的配置的方块图;
图34是示出根据实施例4的系统的硬件配置的方块图;
图35是示出根据实施例4的中继设备的操作的流程图;
图36是示出根据实施例4的服务器设备的操作的流程图;
图37是示出根据本发明实施例5的系统的配置的方块图;
图38是示出根据实施例5的系统的硬件配置的方块图;
图39是示出根据实施例5的文档数据处理器的操作的流程图;
图40是示出根据本发明实施例6的系统的配置的方块图;
图41是示出根据实施例6的系统的硬件配置的方块图;
图42是示出根据实施例6的终端设备的操作的流程图;
图43示出了HTML描述的例子;和
图44示出了图43所示的HTML文档的显示例子。
最佳实施方式
现在参照附图,详细描述本发明的实施例。
(实施例1)
下面参照附图描述本发明的实施例1。
首先,参照图4描述根据本发明实施例1的文档数据处理系统的配置。图4是示出根据本发明实施例1的文档数据处理系统的配置的方块图。在该图中,作为数据处理设备的服务器设备110和终端设备120与诸如因特网之类的网络130相连接。
服务器设备110包括管理和存储文档数据的数据库113。存储在数据库113中的文档数据是用诸如HTML,也就是说,超文本标记语言之类的结构描述语言描述的。
另外,服务器设备110包括文档数据请求接收部分111,文档数据请求接收部分111接收从终端设备120发送的文档数据发送请求。文档数据请求接收部分111把接收的请求发送到包含在服务器设备110中的文档数据获取部分112。
文档数据获取部分112根据接收的请求,获取文档数据,并且把获取的文档数据发送到包含在服务器设备110中的文档数据划分部分114。
文档数据划分部分114划分从文档数据获取部分112发送的文档数据,并且把分文档数据(divided document data)发送到包含在服务器设备110中的文档数据特征提取部分115。
文档数据特征提取部分115提取分文档数据每一页的特征,并且把提取的特征与分文档数据一起发送到包含在服务器设备110中的文档数据传输链路附加部分116。
然后,文档数据传输链路附加部分116把指示到另一页的链路的链路信息加以分文档数据的每一页中,并且把该页发送到包含在服务器设备110中的文档数据发送部分117。文档数据传输链路附加部分116将其加入每个分文档数据页的链路信息是文档数据特征提取部分115提取的每页特征。
文档数据发送部分117通过网络130,把已经把链路信息加入每个分文档数据页中的文档数据发送到终端设备120。
终端设备120是可以用诸如个人计算机之类的通用计算机实现的用户终端。
终端设备120包括接受来自用户的输入的输入部分121。输入部分121把来自用户的输入发送到包含在终端设备120中的文档数据请求发送部分122。
文档数据请求发送部分122通过网络130把对与从输入部分121发送的输入信息相对应的文档数据的请求发送到服务器设备110。
另外,终端设备120包括文档数据接收部分123,文档数据接收部分123接收向服务器设备110请求的文档数据。文档数据接收部分123把文档数据发送到作为图像显示装置的文档数据显示部分124。
文档数据显示部分124具有浏览器的功能,从而,分析接收的文档,将其转换成可显示模式,并且显示在显示器上。
图5示出了通过计算机实现服务器设备110和终端设备120的硬件配置。
当用计算机实现时,服务器设备110借助于执行存储在存储器201中的程序的CPU 200,起文档数据划分部分114、文档数据特征提取部分115、和文档数据传输链路附加部分116的作用。另外,借助于执行存储在存储器201中的程序和利用网络接口202的CPU 200,承担文档数据接收部分111和文档数据发送部分117的功能。并且,借助于执行存储在存储器201中的程序和利用输入/输出接口203的CPU 200,承担文档数据获取部分112的功能。
存储器201由许多个诸如ROM(只读存储器)和RAM(随机存取存储器)之类的存储介质组成,并且把程序存储在ROM中。至于RAM,当CPU200根据程序描述执行处理时,它成为工作区。
类似地,利用计算机的终端设备120,借助于执行存储在存储器211中的程序和利用网络接口215和输入/输出接口213的CPU 200,起文档数据请求发送部分122和文档数据接收部分123的作用。并且,借助于执行存储在存储器201中的程序和利用显示部分214的CPU 210,实现文档数据显示部分124的功能。存储器201由许多个诸如ROM(只读存储器)和RAM(随机存取存储器)之类的存储介质组成,并且把程序存储在ROM中。至于RAM,当CPU 200根据程序描述执行处理时,它成为工作区。
当用户通过终端设备120中的输入部分121,指定诸如统一资源定位符,也就是说,URL之类的标识符时,根据实施例1的文档数据处理系统请求存储在服务器设备110中的数据库113中的、和用诸如超文本标记语言,也就是说,HTML之类的结构描述语言描述的文档数据。对此作出回答,服务器设备110向终端设备120发送与来自终端设备120的请求相对应的文档数据。
下面参照图6所示的流程图,描述根据实施例1的文档数据处理系统的操作。
首先,终端设备120通过输入部分121接收与用户请求的文档数据有关的信息(S301),并且把输入请求发送到服务器设备110(S302)。然后,终端设备120等待接收从服务器设备110发送的文档数据(S303)。
对此作出回答,服务器设备110利用文档数据请求接收部分111接收从终端设备120发送的文档数据发送请求(S304)。接着,文档数据获取部分112从数据库113中获取终端设备120请求的文档数据(S305)。
图7示出了文档数据获取部分112从数据库113获取的文档数据的例子。图7所示的文档数据400是用HTML描述的。
接着,文档数据划分部分114划分文档数据获取部分112获取的文档数据(S306)。文档数据划分部分114通过,例如,作为TITLE标记的、图7中的H1标记401a到401c分开数据,进行文档数据的划分。然后,文档数据划分部分114把缺少的标记加入每个分文档数据页中,以便每一页都遵从HTML的语法(S307)。图8示出了文档数据获取部分114已经划分了图7所示的文档数据的情况。
如图8所示,图7所示的文档数据400被划分成3个页面500到502。在页面500上描述了H1标记401a和H1标记401b之间的数据,在页面501上描述了H1标记401b和H1标记401c之间的数据,和在页面502上描述了在H1标记401c之后的数据。
接着,文档数据划分部分114把每个分页500到502发送到文档数据特征提取部分115。然后,文档数据特征提取部分115提取每一页500到502的特征(S308)。对于实施例1,采用每一页500到502的标题,作为每一页500到502的特征。更具体地说,应用<H1>-</H1>之间描述的文本作为每一页500到502的特征。
例如,当文档数据特征提取部分115提取作为标题标记的H1标记401a到401c的内容,作为每一页的特征时,图8所示的每一页500到502的特征如图中的801a到801c所示,分别变成“land”、“climate”和“population”。
接着,文档数据特征提取部分115把每个分页500到502和文档数据特征提取部分115提取的每页提取特征801a到801c发送到文档数据传输链路附加部分116。此时,文档数据传输链路附加部分116加入指示链路的链路标记<A href>和</A>之间的、另一页的特征801,作为到另一页的链路信息。
图9示出了把到另一页的链路信息加入图8的页面500中的例子。从图9中可显然看出,在文档数据900中,描述了指示到页面501的链路的链路标记901a和指示到页面502的链路的链路标记901b。另外,在链路标记901a中,把页面501的特征“climate”801b描述成链路信息。在链路标记901b中,把页面502的特征“population”801c描述成链路信息。
并且,图10示出了请求的文档数据与每个分页间的关系。如1001所示的文档数据对应于图7的文档数据400;如1002所示的文档数据对应于图8的文档数据500;如1003所示的文档数据对应于图8的文档数据501;和如1004所示的文档数据对应于图8的文档数据502。在文档数据1002中,除了示出它自己的特征的文本1004a之外,还把链接到文档数据1003的文本1004b、和把链接到文档数据1004的文本1004c描述成链路信息。在文档数据1003中,除了示出它自己的特征的文本1005b之外,还把链接到文档数据1002的文本1005a、和把链接到文档数据1004的文本1005c描述成链路信息。在文档数据1004中,除了示出它自己的特征的文本1006c之外,还把链接到文档数据1002的文本1006a、和把链接到文档数据1003的文本1006b描述成链路信息。
接着,文档数据传输链路附加部分116依次向文档数据发送部分117发送把到另一页的链路信息加入的每一页。然后,文档数据发送部分117向终端设备120发送作为加入链路信息的分文档数据的首页的文档数据900(S310)。
对此作出回答,终端设备120利用文档数据接收部分123接收从服务器设备110发送的分页(S311)。然后,文档数据接收部分123把接收的页面发送到文档数据显示部分124。接着,文档数据显示部分124分析用HTML描述的接收页,并且把它显示在监视器上(S312)。像如此描述的那样,显示用户请求的文档数据的首页。
例如,终端设备120的文档数据显示部分124把图9所示的页面显示成图11所示的那样。在显示在文档数据显示部分124上的页面1000上,除了显示它自己的内容的部分1001和显示它自己的特征的文本1002a之外,还显示了链接到页面501的文本1002b和链接到页面502的文本1002c。
接着,当用户想要观看另一页和通过终端设备120的输入部分121选择到另一页的链路信息,请求显示另一页时(S313),文档数据请求发送部分122把对另一页的请求发送到服务器设备110(S302)。
这里,假设用户选择“climate”1002b作为指示到页面501的链路的文本,并且请求另一页的情况,描述服务器设备110的操作。
服务器设备110通过文档数据请求接收部分111接收请求(S304),和文档数据获取部分112从数据库113获取作为请求页来源的文档数据(S305)。
接着,文档数据划分部分114划分获取的文档数据(S306)。如前所述,划分是通过用H1标记分开数据,然后加入缺少的标记进行的,从而每个分页遵从HTML的语法(S307)。图8示出了分文档数据的例子。
接着,文档数据划分部分114把分页500到502发送到文档数据特征提取部分115。然后,文档数据特征提取部分115提取每一页500到502的数据特征(S308)。这里,文档数据特征提取部分115还提取H1标记400a到401c,作为每一页500到502的特征。更具体地说,每一页500到502的特征分别成图如801a到801c所示的“land”、“climate”、和“population”。
接着,文档数据特征提取部分115把每个分页500到502和每页提取特征801a到801c发送到文档数据传输链路附加部分116。然后,文档数据传输链路附加部分116把到另一页的链路信息加入每个分页中(S309)。
图12示出了作为加入链路901和902的图5的页面501的文档1200。从12可明显看出,在文档数据1200中,描述了指示到页面500的链路的链路标记1201a和指示到页面502的链路的链路标记1201b。并且,在链路标记1201a中,把页面500的特征“land”1202描述成链路信息。在链路标记1001b中,描述了页面502的特征“population”801c。
接着,文档数据传输链路附加部分116向文档数据发送部分117发送把到另一页的链路信息加入的文档数据1200。然后,文档数据发送部分117把从终端设备120请求的分页发送到终端设备120(S130)。
终端设备120利用文档数据接收部分123接收从服务器设备110发送的分页(S311)。
文档数据接收部分123把接收页面发送到文档数据显示部分124,和文档数据显示部分123显示用户请求的页面(S312)。
图13示出了显示在文档数据显示部分124上的页面。
在显示在文档数据显示部分124上的页面1300上,除了示出它自己的内容部分1301和示出它自己的特征的文本1302b之外,还把链接到页面500的文本1302a和链接到页面502的文本1302c描述成链路信息。
即使选择了指示到其它页的链路的“population”和“land”,终端设备120也能够通过重复S310到S313的处理,显示这些页面。
如上所述,根据实施例1,可以把分文档数据的每一页上指示另一页的内容的信息描述成到另一页的链路信息。借助于这种方法,观看文档数据的用户能够从加入每一页中的链路信息,知道另一页的内容。用户还能够从用户当前观看的页面中知道有关另一页的信息,并且能够轻而易举地获取另一页的内容。因此,即使对文档数据进行划分,用户也能毫无困难地观看文档数据。
另外,根据实施例1,可以应用另一页的标题作为指示另一页的内容的链路信息。每个标题是表示该页面的特征的一段信息,从而,该链路信息精确地表示另一页的内容。结果,用户能够精确地获知另一页的内容。
顺便提一下,尽管实施例1应用另一页的标题作为指示另一页的内容的链路信息,但是,也可以应用另一页正文中的首字/短语。在这种情况下,需要从作为表示正文的标记的<body>和</body>之间描述的文本中提取首字/短语。
另外,这种从在<body>和</body>之间描述的文本的顶端提取给定个数的字符作为链路信息的配置也是可以的。
并且,尽管实施例1应用另一页的标题作为指示另一页的内容的链路信息,但是,也可以应用来自另一页的内容的关键字。在这种情况下,从包含在指示正文的标记<body>和</body>之间描述的文本中的字/短语中提取使用最频繁的字/短语,作为内容的关键字。内容的关键字是最能表示每页特征的字/短语的可能性很高,从而,链路信息精确地表示另一页的内容。
顺便提一下,尽管实施例1应用HTML作为描述文档数据的语言,但是,能够描述有关到其它页的链路的信息的任何语言都能担当此任。
(实施例2)
本发明的实施例2被配置成链路信息的描述随相应页面的数据量而改变,从而使用户可以知道链接页的数据量。
下面参照附图详细描述根据实施例2的文档数据处理系统。首先,参照图14描述根据本发明实施例2的文档数据处理系统的配置。图14是示出根据本发明实施例2的文档数据处理系统的配置的方块图。
在上图中,服务器设备110和终端设备120与诸如因特网之类的网络130相连接。尤其是,实施例2的文档数据处理系统与实施例1的文档数据处理系统不同之处在于服务器设备1110的配置。
更具体地说,服务器设备110从数据除了标记之外的顶端中提取个数与每个分页的数据量相对应的字符序列,作为每页的特征。借助于这种方法,观看文档数据的用户可以从链路信息中知道每个分页的数据量,并且选择要显示的页面。
服务器设备1110包括文档数据量检查部分1115,文档数据量检查部分1115检验文档数据划分部分114划分的文档数据的每一页的数据量。文档数据量检查部分1115把每页的检查数据量输出到包含在服务器设备1110中的文档数据特征提取部分1116。
文档数据特征提取部分1116提取分文档数据每一页的特征,并且把提取的特征与分文档数据一起发送到包含在服务器设备1110中的文档数据传输链路附加部分1117。取决于每页数据量,文档数据特征提取部分1116改变作为特征提取的字符序列的长度。更具体地说,每一页的数据量越大,文档数据特征提取部分1116使作为特征提取的字符序列的长度越长。
文档数据传输链路附加部分1117把到另一页的链路信息加以每个分页中。文档数据传输链路附加部分1117将其加入每个分文档数据页的链路信息是文档数据特征提取部分1116提取的每页特征。
终端设备120与实施例1的终端设备相同,因此,略去对它描述。
此外,当服务器设备1110和终端设备120利用个人计算机来实现时,它将是如图5所示的那样。借助于执行存储在存储器201中的程序的CPU 200,实现文档数据划分部分114、文档数据量检查部分1115、文档数据特征提取部分1116、和文档数据传输链路附加部分1117的功能。类似地利用计算机的终端设备120与实施例1相同,因此,略去对它描述。
根据基于实施例2的文档数据处理系统,用户通过终端设备120的输入部分121,指定诸如URL之类的标识符,请求存储在服务器设备1110的数据库113中的、和用诸如HTML之类的结构描述语言描述的文档数据。对此作出回答,服务器设备1110向终端设备120发送与来自终端设备120的请求相对应的文档数据。
下面参照图15所示的流程图,描述根据实施例2的文档数据处理系统的操作。
首先,服务器设备1110利用文档数据请求接收部分111接收从终端设备120发送的文档数据发送请求(S1201)。接着,文档数据获取部分112从数据库113中获取终端设备120请求的文档数据(S1202)。
图16示出了文档数据获取部分112从数据库113获取的文档数据的例子。图16所示的文档数据是用HTML描述的。顺便提一下,在图16中,显示这些符号是为了便于说明字符序列;但是,实际上,其中描述了传达含义的字符。
接着,文档数据划分部分114划分获取的文档数据(S1203)。文档数据划分部分114通过,例如,作为段落标记的、图16中的P标记1601a到1601c分开数据,进行文档数据的划分。然后,文档数据划分部分114把缺少的标记加入每个分文档数据页中,以便每一页都遵从HTML的语法(S1204)。图17示出了文档数据获取部分114划分了图16所示的文档数据的例子。
如图17所示,图16所示的文档数据被划分成3个页面1400到1402。如上图中的1403所示,在页面1400上描述了P标记1601a的数据;如上图中的1404到1407所示,在页面1401上描述了P标记1601b的数据;和如上图中的1408到1409所示,在页面1402上描述了在P标记1601c的数据。
接着,文档数据划分部分114把每个分页1400到1402发送到文档数据量检查部分1115。然后,文档数据量检查部分1115检查不计标记的、每个页面1400到1402上正文标记之间的内容的数据量(S1205)。
例如,对于图17所示的页面1400到1402,1403、1404、1405、1406、1407、1408、和1409是在S1205中由文档数据量检查部分1115进行数据量检查的部分。在本例中,一个字符是两个字节,因此,在页面1400上,描述了等于44个字节的数据量的字符序列,在页面1401上,描述了等于224个字节的数据量的字符序列,和在页面1402上,描述了等于116个字节的数据量的字符序列。
接着,文档数据量检查部分1115把每个分页1400到1402和每页检查数据量发送到文档数据特征提取部分1116。然后,文档数据特征提取部分1116提取从除了标记之外,正文标记之间的内容的数据的顶端开始,根据数据量提取字符序列,作为每一页1400到1402的特征(S1206)。
更具体地说,从每一页1400到1402上除了标记之外,正文标记之间的内容的数据的顶端开始,文档数据特征提取部分1116提取与把每一页1400到1402上数据量的1/10四舍五入成最接近十分之一个的字节数相对应的字符序列,作为每一页的特征。例如,图17的页面1400到1402的特征将分别是4-字节序列“○ ○”1501、22-字节序列“□□□□□□□□□□□”1502、和12-字节字符串“◇◇◇◇◇◇”1503。
接着,文档数据特征提取部分1116把每个分页1400到1402和每页提取特征1501到1503发送到文档数据传输链路附加部分1117。然后,文档数据传输链路附加部分1117把到另一页的链路信息加入每个分页1400到1402中(S1207)。此时,文档数据传输链路附加部分1117加入指示链路的链路标记<A href>和</A>之间的、文档数据特征提取部分1116提取的另一页的特征,作为指示到另一页的链路的链路信息。
图18示出了把链路信息加入图17的页面1400中的例子。从图18中可显然看出,在文档数据1800中,除了页面1400的特征“○ ○”1501之外,还描述了指示到页面1401的链路的链路标记1504和指示到页面1402的链路的链路标记1505。在链路标记1504中,描述了页面1401的特征“□□□□□□□□□□□”1502。在链路标记1505中,描述了页面1402的特征“◇◇◇◇◇◇”1503。
接着,文档数据传输链路附加部分1117向文档数据发送部分117发送把到另一页的链路信息加入的每一页。然后,文档数据发送部分117向终端设备120发送分文档数据(S1208)。在这种情况中,文档数据发送部分117把作为分文档数据的顶端的文档数据1800发送到终端设备120。
同时,终端设备120利用文档数据接收部分123接收从服务器设备110发送的、作为分文档数据的首页的文档数据1800。
文档数据接收部分123把接收的文档数据1800发送到文档数据显示部分124。然后,文档数据显示部分124分析接收的文档数据,并且向用户显示它。
图19示出了通过终端设备120的文档数据显示部分124显示图18所示的文档数据1800的例子。在显示在文档数据显示部分124上的页面1601上,除了显示它自己的内容的部分1604和显示它自己的特征的文本1605之外,还显示了链接到页面1401的文本1602和链接到页面1402的文本1603。
接着,当用户通过终端设备120的输入部分121选择到另一页的链路信息,由此请求显示另一页时,文档数据请求发送部分122把对另一页的请求发送到服务器设备1110。这里,假设用户通过选择链路1602“□□□□□□□□□□□”来请求页面。
服务器设备1110通过文档数据请求接收部分111接收请求(S1201),和通过文档数据获取部分112从数据库113获取作为请求页来源的文档数据(S1202)。
接着,文档数据划分部分114划分文档数据获取部分112获取的文档数据(S1203)。如前所述,划分是通过用作为标题标记的P标记分开数据,然后加入缺少的标记进行的,从而每个分页遵从HTML的语法(S1204)。图17示出了分文档数据的例子。
接着,文档数据划分部分114把每个分页1400到1402发送到文档数据量检查部分1115。文档数据量检查部分1115从每一页1400到1402上BODY标记之间的内容中检查除了标记之外的数据量(S1205)。在图17中,页面1400的数据量变成44个字节,页面1401的数据量变成224个字节,和页面1402的数据量变成116个字节。
接着,文档数据量检查部分1115把每个分页和每页检查数据量发送到文档数据特征提取部分1116。然后,文档数据特征提取部分1116从除了标记之外,正文标记之间的内容的数据的顶端开始,根据数据量提取字符序列(S1206)。并且,从每一页1400到1402上除了标记之外,正文标记之间的内容的数据的顶端开始,文档数据特征提取部分1116提取与把每一页1400到1402上数据量的1/10四舍五入成最接近十分之一个的字节数相对应的字符序列,作为每一页的特征。图17的1400到1402的特征将分别是“○ ○”1501、“□□□□□□□□□□□”1502、和“◇◇◇◇◇◇”1503。
接着,文档数据特征提取部分1116把每个分页1400到1402和每页提取特征1501到1503发送到文档数据传输链路附加部分1117。然后,文档数据传输链路附加部分1117把到另一页的链路信息加入每个分页1400到1402中(S1207)。
图20示出了把链路加入图17的页面1401中的例子。从图20中可显然看出,在文档数据2000中,除了页面1401的特征“□□□□□□□□□□□”1502之外,还描述了指示到页面1400的链路的链路标记1704和指示到页面1402的链路的链路标记1705。在链路标记1704中,描述了页面1400的特征“○ ○”1701。在链路标记1705中,描述了页面1402的特征“◇◇◇◇◇◇”1703。
接着,文档数据传输链路附加部分1117向文档数据发送部分117发送把到另一页的链路信息加入的每一页。然后,文档数据发送部分117向终端设备120发送终端设备120请求的分页(S1208)。
同时,终端设备120利用文档数据接收部分123接收从服务器设备1110发送的分页的文档数据2000。
文档数据接收部分123把接收页发送到文档数据显示部分124。然后,文档数据显示部分124分析接收的文档数据2000,并且向用户显示它。
图21A示出了文档数据显示部分124显示图20所示的页面的例子。在显示在文档数据显示部分124上的页面2101上,除了显示它自己的内容的部分2102和显示它自己的特征的文本2104之外,还显示了链接到页面1400的文本2103和链接到页面1402的文本2105。
如上所述,借助于实施例2,可以在分文档数据的每一页上描述到另一页的链路信息,并且根据相应页面的数据量修改这样的描述。借助于这种方法,观看文档数据的用户能够从链路信息的描述中,判断每一页的数据量。借助于这种方法,用户能够判断某一页是否适合于显示,并且选择适合于显示的页面。结果,用户可以轻而易举地观看文档数据。
另外,借助于实施例2,可以根据相应页面的数据量,改变被描述成链路信息的字符序列的长度。这样使用户能够从链路信息中字符序列的长度中,看出另一页的数据量。
顺便提一下,尽管把实施例2配置成使被描述成链路信息的字符序列的长度随相应页面的数据量而改变,但是,这种使被描述成链路信息的字符序列的字符大小随相应页面的数据量而改变的描述也是可以的。如图21B中页面2106所示,这使得可以像文档数据显示部分124那样,根据相应页面的数据量改变每一个都指示链路的文本2107到2109的字符大小。结果,用户能够观看指示链路的文本的大小,和识别相对页面的数据量。
顺便提一下,这种把有关链接页的数据量的信息从服务器设备1110发送到终端设备120,并且,在终端设备120这一方,使指示链路的文本的显示划分尺寸随上述数据量信息而改变的配置也是可以的。
并且,这种使被描述成链路信息的字符序列的颜色或颜色深度随数据量而改变的配置也是可以的。如图21C中页面2110所示,这使得可以像文档数据显示部分124那样,根据相应页面的数据量改变每一个都指示链路的文本2107到2109的颜色或颜色深度。结果通过观看指示链路的文本的颜色或颜色深度,用户能够识别相对页面的数据量。
顺便提一下,这种把有关链接页的数据量的信息从服务器设备1110发送到终端设备120,并且,在终端设备120这一方,使指示链路的文本的颜色或颜色深度随上述数据量信息而改变的配置也是可以的。
顺便提一下,尽管实施例2采用指示链接页的内容的字符序列作为指示链接的文本,但是,这种链接文本未必是指示链接页的内容的字符序列。
(实施例3)
本发明的实施例3被配置成把加入指定文档数据划分尺寸的链路信息的文档数据划分修改链路附加部分加入实施例1中,从而使观看文档数据的用户能够修改页面划分的尺寸。
下面描述根据实施例3的文档数据处理系统。首先,参照图22描述根据本发明实施例3的文档数据处理系统的配置。图22是示出根据本发明实施例3的文档数据处理系统的配置的方块图。顺便提一下,把相同的标号指定给已经描述过的部分。
在图22中,作为数据处理设备的服务器设备1910和终端设备120与诸如因特网之类的网络130相连接。实施例3的文档数据处理部分与实施例1的文档数据处理部分不同之处在于服务器设备1910的配置。
下面描述服务器设备1910的配置。服务器设备1910包括划分请求的文档数据的文档数据划分部分1914。并且,文档数据划分部分1914根据来自终端设备120的、有关划分修改的指令,对划分作进一步修改。
服务器设备1910还包括文档数据划分修改链路附加部分1917,文档数据划分修改链路附加部分1917把根据分文档数据重新指定划分尺寸的链路信息加入每个分文档数据页中。
终端设备120与实施例1的终端设备相同,因此,略去对它的描述。
此外,当用计算机实现服务器设备1910和终端设备120时,借助于执行存储在存储器201中的程序的CPU 200,实现文档数据划分部分1914和文档数据划分修改链路附加部分1917的功能。类似地使用计算机的终端设备120与实施例1的终端设备相同,因此,略去对它的描述。
根据基于实施例3的文档数据处理系统,用户通过终端设备120的输入部分121指定诸如URL之类的标识符,请求存储在服务器设备1910的数据库113中的、和用诸如HTML之类的结构描述语言描述的文档数据。对此作出回答,服务器设备1910把与来自终端设备120的请求相对应的文档数据发送到终端设备120。
下面参照图23所示的流程图,描述根据实施例3的文档数据处理系统的操作。
首先,服务器设备1910利用文档数据请求接收部分111接收来自终端设备120的、有关发送文档数据的请求(S2001)。接着,文档数据获取部分112从数据库113中获取终端设备120请求的文档数据(S2002)。
图24示出了从数据库113获取的文档数据的例子。图24所示的文档数据2400是用HTML描述的。顺便提一下,在图24中,这些符号用于使字符序列便于说明,但是,实际上,其中描述了有含有的字符。此外,1个字符含有2个字节的数据量。
接着,文档数据划分部分1914划分获取的文档数据(S2003)。文档数据划分部分1914通过,例如,每固定个数的字节划分除了标记之外BODY之间的内容的数据,进行文档数据的划分。然后,文档数据划分部分1914把缺少的标记加入每个分文档数据页中,以便每一页都遵从HTML的语法(S2004)。图25示出了在上面给定的条件下,把图24所示的文档数据划分成128个字节的文档数据的例子。
如图25所示,图24所示的文档数据2400被划分成3个页面2200到2202。如上图中2203所示,在页面2200上,描述了被划分成128个字节的、和作为来自正文标记之间的内容除了标记之外的图24所示的部分2401中的数据的第一数据块的数据2203;如上图中2204所示,在页面2201上,描述了被划分成图24所示的128个字节的、和作为来自正文标记之间的内容除了标记之外的部分2401中的第二数据块的数据2204;和如上图中2205所示,在页面2202上,描述了被划分成128个字节的、和作为来自正文标记之间的内容除了标记之外的部分2401中的第三数据块的数据2205。
接着,文档数据划分部分1914把每个分页2200到2202发送到文档数据特征提取部分115。然后,文档数据特征提取部分115提取每一页2200到2202的特征(S2005)。
例如,当文档数据特征提取部分115从每一页2200到2202上除了标记之外的BODY标记之间的内容的数据的顶端开始提取8-字节字符序列,作为每一页2200到2202的特征时,每一页2200到2202的特征将分别是“○ ○○ ○”2301、“△△△△”2302、和“◎◎◎◎”2303。
接着,文档数据特征提取部分115把每个分页2200到2202和每页提取特征2301到2303发送到文档数据传输链路附加部分116。然后,与实施例1的处理类似,文档数据传输链路附加部分116把指示到另一页的链路的链路信息加入每个分页2200到2202中(S2006)。
图26示出了把到另一页的链路信息加入图25的页面2200中的例子。从图26中可显然看出,在文档数据2300中,除了页面2200特征“○ ○ ○ ○”2301之外,还描述了指示到页面2201的链路的链路标记2304和指示到页面2202的链路的链路标记2305。在链路标记2304中,描述了页面2201的特征“△△△△”2302。在链路标记2305中,描述了页面2202的特征“◎◎◎◎”2303。
接着,文档数据传输链路附加部分116向文档数据划分修改链路附加部分1917发送把到另一页的链路信息加入的每一页。然后,文档数据划分修改链路附加部分1917把根据新划分的文档数据指定划分尺寸的链路信息加入每个分页中(S2007)。
图27示出了把指定划分尺寸的链路信息2401和2402加入图26所示的每个分页中的文档数据的例子。与文件数据2400一样,把指定划分尺寸的链路信息2401和2402加入图26所示的文档数据2300中。在链路信息2401中,存在指示划分尺寸的描述2403和指示链路信息2401的内容的描述2405“divide small”。另外,在链路信息2402中,存在指示划分尺寸的描述2404和指示链路信息2402的内容的描述2406“divide big”。
通过如此把链路信息2401和2402和指示每个链路信息的内容的描述2405和2406加入其中,用户能够知道根据链路信息2401和2402进行划分的方式。
接着,文档数据划分修改链路附加部分1917向文档数据发送部分117发送把指定划分尺寸的链路信息加入的每一页。然后,文档数据发送部分117向终端设备120发送分文档数据的首页(S2008)。
终端设备120利用文档数据接收部分123接收从服务器设备1910发送的分首页的文档数据2300。
文档数据接收部分123把接收的文档数据2300发送到文档数据显示部分124。接着,文档数据显示部分124分析接收的文档数据2300,并且向用户显示它。
图28示出了显示在文档数据显示部分124上的图27所示的页面的显示例子。在显示在文档数据显示部分124上的页面2500上,除了显示它自己的内容的部分2501和显示它自己的特征的文本2502之外,还显示了链接到页面2201的文本2503和链接到页面2202的文本2503。并且,在页面2500上,还显示了指令使文档数据划分尺寸变小的文本2505和指令使文档数据划分尺寸变大的文本2506。
接着,当用户通过终端设备120的输入部分121请求通过选择指示指定划分尺寸的链路的文本2505和2506时,文档数据请求发送部分122把对改变划分尺寸的请求发送到服务器设备1910。这里假设用户选择了文本“dividebig”2505和请求改变划分尺寸。
服务器设备1910通过文档数据请求接收部分111接收请求(S2001)。然后,文档数据获取部分112从数据库113获取作为请求页来源的文档数据(S2002)。
接着,文档数据划分部分1914划分获取的文档数据(S2003)。如前所述,划分是通过按固定个数的字节划分除了标记之外BODY标记之间的内容中的数据的方式进行的。在这种情况中,文档数据划分部分1914根据来自用户的划分尺寸修改请求,按固定个数的字节划分标记之间的内容除了标记之外BODY的数据。这里假设,根据来自用户的划分尺寸修改请求,指定固定个数的字节为200。
然后,在按每200个字节划分获取的文档数据之后,文档数据划分部分1914加入缺少的标记,以便每个分页遵从HTML的语法(S2004)。
图29示出了在给定条件下,其中按每200个字节划分图24所示的文档数据的文档数据的例子。如图29所示,把图24所示的文档数据2400划分成两个页2600和2601。如上图中2602所示,在页面2600上,描述了按200个字节划分的、和作为正文标记之间的内容除了标记之外的图24所示的部分2401中的数据的顶端数据块的数据2602,和如上图中2603所示,在页面2601上,描述了按图24所示的200个字节划分的、和作为正文标记之间的内容除了标记之外的部分2401中的第二数据块的数据2603。
接着,文档数据划分部分1914把每个分页2600到2601发送到文档数据特征提取部分115。然后,文档数据特征提取部分115提取每一页2600到2601的特征(S2005)。这里,文档数据特征提取部分115再次从每一页2600到2601上除了标记之外的BODY标记之间的内容中提取8-字节字符序列。例如,每一页2600和2601的特征将分别是“○ ○ ○ ○”2701和“×××◎”2702。
接着,文档数据特征提取部分115把每个分页和每页提取特征发送到文档数据传输链路附加部分1916。然后,文档数据传输链路附加部分1916把这些特征2701和2702加入每个分页2600和2601上每一个都指示到另一页的链路的链路信息中(S2006)。
图30示出了把链路信息加入图29的页面2600中的例子。从图30中可显然看出,在文档数据2700中,除了页面2600特征“○ ○ ○ ○”2701之外,还描述了指示到页面2601的链路的链路标记2703。在链路标记2703中,描述了页面2601的特征“×××◎”2702。
接着,文档数据传输链路附加部分116向文档数据划分修改链路附加部分1917发送把到另一页的链路信息加入的每一页。然后,与上述处理一样,文档数据划分修改链路附加部分1917把指定划分尺寸的链路信息加入每个分页中(S2007)。
图31示出了把指定划分尺寸的链路信息2801和2802加入图30所示的每一页中的示范性文档数据2800。与文件数据2800一样,把指定划分尺寸的链路信息2801和2802加入图30所示的文档数据2700中。在链路信息2801中,存在指示划分尺寸的描述2803和指示链路信息2801的内容的描述2805“divide small”。另外,在链路信息2802中,存在指示划分尺寸的描述2804和指示链路信息2802的内容的描述2806“divide big”。
接着,文档数据划分修改链路附加部分1917向文档数据发送部分117发送把指定划分尺寸的链路信息加入的每一页。然后,文档数据发送部分117向终端设备120发送分文档数据的首页(S2008)。另一方面,终端设备120利用文档数据接收部分123接收从服务器设备1910发送的分首页的文档数据2800。
文档数据接收部分123把接收的文档数据2800发送到文档数据显示部分124。接着,文档数据显示部分124分析接收的文档数据2800,并且向用户显示它。
图32示出了显示在文档数据显示部分124上的图31所示的页面的显示例子。在显示在文档数据显示部分124上的页面2900上,除了显示它自己的内容的部分2901和显示它自己的特征的文本2902之外,还显示了链接到页面2601的文本2903和链接到页面2602的文本2903。并且,在页面2900上,还显示了指令使文档数据划分尺寸变小的文本2905和指令使文档数据划分尺寸变大的文本2906。
然后,用户观看页面2900,并且,通过指定用于显示所需页面的文本和通过指定用于进行所需划分的文本,获取所需文档数据。
如上所述,根据实施例3,可以把划分方案的内容描述成指令划分修改的划分修改链路信息。借助于这种方法,观看文档数据的用户能够从划分修改链路信息的描述中知道划分方案。结果,用户能够适当地划分文档数据。
(实施例4)
本发明的实施例4单独包括具有累加和管理文档数据的服务器功能的设备和具有提取每个分文档数据的特征和把提取的特征加入分文档数据中作为到另一页的链路信息的文档数据编辑功能的设备。
下面描述根据实施例4的文档数据处理系统。首先,参照图33描述根据本发明实施例4的文档数据处理系统的配置。图33是示出根据实施例4的文档数据处理系统的配置的方块图。顺便提一下,把相同的标号指定给已经描述过的部分。
在图33中,中继设备(relay apparatus)3010、服务器设备3020和终端设备120与诸如因特网之类的网络130相连接。
中继设备3010包括文档数据请求接收部分3011,文档数据请求接收部分3011接收从终端设备120发送的文档数据请求。文档数据请求接收部分3011把接收的文档数据请求发送到包含在中继设备3010中的文档数据请求发送部分3012。然后,文档数据请求发送部分3012把接收的文档数据请求传送到服务器设备3020。另外,中继设备3010还包括文档数据接收部分3013,文档数据接收部分3013接收从服务器设备3020发送的文档数据。文档数据接收部分3013把接收的文档数据发送到文档数据划分部分114。
此外,中继设备3010还包括文档数据划分部分114、文档数据特征提取部分115、文档数据传输链路附加部分116、和文档数据发送部分117。参照实施例1已经对文档数据划分部分114、文档数据特征提取部分115、文档数据传输链路附加部分116、和文档数据发送部分117都作了描述,因此略去对它们的详细描述。
另一方面,服务器设备3020包括文档数据请求接收部分3021,文档数据请求接收部分3021接收从中继设备3010或终端设备120发送的文档数据发送请求。文档数据请求接收部分3021把接收的文档数据请求发送到包含在服务器设备3020中的文档数据获取部分3022。
文档数据获取部分3022从数据库113中获取与接收的文档数据请求相对应的文档数据,并且把获取的文档数据发送到包含在服务器设备3020中的文档数据发送部分3024。至于数据库113,前面已经给出对它的描述,因此,这里略去不述。
文档数据发送部分3024把从文档数据获取部分3022发送的文档数据发送到中继设备3010或终端设备120。
另外,终端设备120应用与已经描述的配置相同的配置。在用户进行操作之后,使终端设备120能够把文档数据请求发送到中继设备3010,接收请求的文档数据,和显示文档数据。
图34是示出用计算机实现的中继设备3010的硬件配置图。
借助于执行存储在存储器201中的程序的CPU 200,实现文档数据划分部分114、文档数据特征提取部分115、和文档数据传输链路附加部分116的功能。另外,借助于执行存储在存储器201中的程序的CPU 200和利用网络接口202,实现文档数据请求接收部分3011、文档数据请求发送部分3012、文档数据接收部分3013、和文档数据发送部分117的功能。
根据实施例4的文档数据处理系统通过从终端设备120中的输入部分121指定诸如URL之类的标识符,向中继设备3010作出对文档数据的请求。然后,中继设备3010从服务器设备3020中获取与从终端设备120发送的请求相对应的文档数据,并且,对这个文档数据施加预定处理,和将经处理的文档数据发送到终端设备120。
下面参照图35和36所示的流程图,描述根据实施例4的文档数据处理系统的操作。图35是示出中继设备3010的操作的流程图,和图36是示出服务器设备3020的操作的流程图。
首先,中继设备3010利用文档数据请求接收部分3011接收从终端设备120发送的文档数据请求(S3201),和通过文档数据请求发送部分3012把接收的请求发送到服务器设备3020(S3202)。
相反,服务器设备3020利用文档数据请求接收部分3021接收从中继设备3010发送的文档数据请求(S3301),和文档数据获取部分3022从数据库113中获取请求的文档数据(S3302)。图7示出了文档数据获取部分3022从数据库3023获取的文档数据的例子。
文档数据获取部分3022把接收的文档数据发送到文档数据发送部分3024。然后,文档数据发送部分3024把文档数据发送到中继设备3010(S3303)。
相反,中继设备3010利用文档数据接收部分3013接收从服务器设备3020发送的文档数据(S3203),和文档数据接收部分3013把接收的文档数据发送到文档数据划分部分114。然后,文档数据划分部分114划分文档数据(S3204)。与实施例1一样,文档数据划分部分114通过,例如,作为标题标记的H1标记分开数据,进行文档数据的划分。然后,文档数据划分部分114把缺少的标记加入每一页中,以便每一页都遵从HTML的语法(S3205)。图8示出了划分图7所示的文档数据的例子。
接着,文档数据划分部分114把每个分页发送到文档数据特征提取部分115。然后,文档数据特征提取部分115提取每个分页的特征(S3206)。例如,当提取作为标题标记的H1标记之间的内容,作为每一页的特征时,图8所示的每一页500到502的特征分别是“land”、“climate”和“population”。
接着,文档数据特征提取部分115把每个分页和每页提取特征发送到文档数据传输链路附加部分116。然后,文档数据传输链路附加部分116把到另一页的链路信息加入每个分页中(S3207)。图9示出了把链路信息加入图8的页面500中的例子。
接着,文档数据传输链路附加部分116向文档数据发送部分117发送把到另一页的链路信息加入的每一页。然后,文档数据发送部分117向终端设备120发送分文档数据的首页(S3308)。
与此相对应,终端设备120利用文档数据接收部分123接收从中继设备3010发送的每个分页。然后,文档数据接收部分123把接收的页面发送到文档数据显示部分124。接着,文档数据显示部分124分析接收页,并且向用户显示它。
图11示出了显示在文档数据显示部分124上的图9所示的页面的显示例子。
接着,当用户通过终端设备120的输入部分121选择到另一页的链路,由此请求另一页的文档数据时,文档数据请求发送部分122把对另一页的请求发送到中继设备3010。这里,假设用户通过选择链路“climate”来请求页面。
中继设备3010通过文档数据请求接收部分3011接收请求(S3201),和通过文档数据请求发送部分3012把接收的请求传送到服务器设备3020(S3202)。服务器设备3020通过文档数据请求接收部分3021接收从中继设备3010发送的文档数据请求(S3301),和通过文档数据获取部分3022从数据库113获取请求的文档数据(S3302)。
接着,文档数据获取部分3022把获取的文档数据发送到文档数据发送部分3024,和文档数据发送部分3024把文档数据发送到中继设备3010(S3303)。
中继设备3010通过文档数据接收部分3013接收从服务器设备3020发送的文档数据(S3203),和通过文档数据划分部分114划分接收的文档数据(S3204)。与上述这些方法类似,文档数据划分部分114通过作为标题标记的H1标记分开数据,划分文档数据。然后,文档数据划分部分114把缺少的标记加入每个分文档数据页中,以便每一页都遵从HTML的语法(S3205)。图8示出了分文档数据的例子。
接着,文档数据划分部分114把每个分页发送到文档数据特征提取部分115。然后,文档数据特征提取部分115提取每一页的特征(S3206)。与上述这些方法类似,文档数据特征提取部分115提取H1标记之间的内容,作为每一页的特征。图8的每一页500到502的特征分别是“land”、“climate”、和“population”。
接着,文档数据特征提取部分115把每个分页和每页提取特征发送到文档数据传输链路附加部分116。然后,文档数据传输链路附加部分116把到另一页的链路信息加入每个分页中(S3207)。图12示出了把链路信息加入图8的页面501中的例子。
接着,文档数据传输链路附加部分116向文档数据发送部分117发送把到另一页的链路信息加入的每一页。然后,文档数据发送部分117把从终端设备120请求的分页发送到终端设备120(S3208)。
终端设备120利用文档数据接收部分123接收从中继设备3010发送的分页(divided page)。
文档数据接收部分123把接收页面发送到文档数据显示部分124,然后,文档数据显示部分123向用户显示接收的页面。
图13示出了显示在文档数据显示部分124上的图12所示的页面的显示例子。
如上所述,根据实施例4,可以分离具有累加和管理文档数据的服务器功能的服务器设备3020和具有划分文档数据、从分文档数据提取特征、和把提取的特征加入分文档数据中作为到另一页的链路信息的文档数据编辑功能的中继设备3010。
(实施例5)
本发明的实施例5涉及划分输入文档数据、从分文档数据中提取特征、把提取的特征加入分文档数据中作为到其它页的链路信息、和输出数据的文档数据处理器。
下面参照图37描述根据实施例5的文档数据处理器的配置。图37是示出根据实施例5的文档数据处理系统的配置的方块图。顺便提一下,把相同的标号指定给已经描述过的部分。
文档数据处理器3400包括文档数据输入部分3401,文档数据输入部分3401接受从其它设备发送的输入文档数据。文档数据输入部分3401把输入的文档数据发送到包含在文档数据处理器3400中的文档数据划分部分3400。
另外,文档数据处理器3400还包括文档数据划分部分114、文档数据特征提取部分115、和文档数据传输链路附加部分116。参照实施例1已经对文档数据划分部分114、文档数据特征提取部分115、和文档数据传输链路附加部分116都作了描述,因此略去对它们的详细描述。
另外,文档数据处理器3400还包括文档数据输出部分3405,文档数据输出部分3405把从文档数据传输链路附加部分116输出的文档数据输出到其它设备。
图38是示出用计算机实现时文档数据处理器3400的硬件配置图。
借助于执行存储在存储器201中的程序的CPU 200,实现文档数据划分部分114、文档数据特征提取部分115、和文档数据传输链路附加部分116的功能。另外,借助于执行存储在存储器201中的程序的CPU 200和利用输入/输出接口3501,实现文档数据输入部分3401和文档数据输出部分3405的功能。
下面参照图39所示的流程图,描述根据实施例5的文档数据处理器3400的操作。图39是示出文档数据处理器3400的操作的流程图。
首先,文档数据处理器3400通过文档数据输入部分3401接收从其它设备发送的输入文档数据(S3601)。图7示出了通过文档数据输入部分3401输入和接收文档数据的例子。
接着,文档数据输入部分3401把输入的文档数据发送到文档数据划分部分114。文档数据划分部分114划分输入和接收的文档数据(S3602)。文档数据划分部分114通过,例如,作为标题标记的H1标记分开数据,划分文档数据,然后加入缺少的标记,以便使每个分页都遵从HTML的语法(S3603)。图8示出了划分图7所示的文档数据的例子。
接着,文档数据划分部分114把每个分页发送到文档数据特征提取部分115。然后,文档数据特征提取部分115提取每一页的特征(S3604)。例如,当提取作为标题标记的H1标记之间的内容,作为每一页的特征时,图8的每一页500到502的特征分别是“land”、“climate”、和“population”。
接着,文档数据特征提取部分115把每个分页和每页提取特征发送到文档数据传输链路附加部分116。然后,文档数据传输链路附加部分116把到另一页的链路信息加入每个分页中(S3605)。图9示出了把链路信息加入图8的页面500中的例子。并且,图10示出了请求的文档数据与每个分页之间的关系。
接着,文档数据传输链路附加部分116向文档数据输出部分3405发送把到另一页的链路信息加入的每一页。然后,文档数据输出部分3405把分文档数据的首页发送到其它设备(S3606)。
如上所述,根据实施例5,可以划分从其它设备发送的文档数据,从分文档数据中提取特征,和把提取的特征加入分文档数据中作为到另一页的链路信息。
(实施例6)
根据本发明的实施例6,在接收文档数据的终端设备中内置存储文档数据的高速缓冲存储器部分,并且,当在高速缓冲存储器中找到分页时,改变把链路信息描述到这个页面中的方式。
下面参照附图详细描述根据实施例6的文档数据处理系统。首先,参照图40描述根据实施例6的文档数据处理系统的配置。图40是示出根据实施例6的文档数据处理系统的配置的方块图。顺便提一下,把相同标号指定给已经描述过的部分。
服务器设备110和终端设备3720与诸如因特网之类的网络130相连接。
服务器设备110的配置与实施例1相同,因此,这里略去对它的描述。
终端设备3720可以通过诸如个人计算机之类的通用机器来实现。终端设备3720包括输入部分121和文档数据请求发送部分122。
另外,终端设备3720还包括文档数据接收部分3723,文档数据接收部分3723接收从服务器设备110发送的文档数据。文档数据接收部分3723把接收的文档数据发送到包含在终端设备3720中的高速缓冲存储器部分3724和文档数据分析部分3725。
高速缓冲存储器部分3724是存储接收文档数据的存储装置。
文档数据分析部分3725分析接收的文档数据和获取文档数据的链路信息等。然后,文档数据分析部分3725把分析结果发送到包含在终端设备3720中的文档数据显示部分3727和高速缓冲存储器检查部分3726。
高速缓冲存储器检查部分3726检查在高速缓冲存储器部分3724中是否存在与文档数据分析部分3725获取的链路信息相对应的文档数据。高速缓冲存储器检查部分3726把这个检查结果发送到文档数据显示部分3727。
另外,文档数据显示部分3727按照在高速缓冲存储器检查部分3726中的检查结果,显示从文档数据分析部分3725发送的文档数据。
图41是示出当利用计算机实现时终端设备3720的硬件配置图。
利用计算机的终端设备3720借助于执行存储在存储器201中的程序的CPU 200和利用网络接口215和输入/输出接口213,起文档数据请求发送部分122、文档数据请求接收部分3723、文档数据分析部分3725、和高速缓冲存储器检查部分3726的作用。此外,借助于执行存储在存储器211中的程序的CPU 210和利用显示部分214,实现文档数据显示部分3727的功能。
下面参照图42的流程图,描述终端设备3720的操作。
首先,通过终端设备3720的输入部分121,用户通过指定诸如URL之类的标识符,请求存储在服务器设备110的数据库113中的、和用诸如HTML之类的结构描述语言描述的文档数据。接着,文档数据请求发送部分122把输入请求发送到服务器设备110(S3901)。
与此相对应,服务器设备110通过文档数据请求接收部分111接收从终端设备3720发送的请求,并且通过文档数据获取部分112从数据库113中获取请求的文档数据。
然后,文档数据划分部分114划分获取的文档数据。接着,文档数据特征提取部分115提取分文档数据每一页的特征。接着,文档数据传输链路附加部分117把另一页的提取特征加入每个分页中,并且把每一页发送到文档数据发送部分117。然后,文档数据发送部分117把这个加入了链路信息的文档数据发送到终端设备3720。
图43示出了从文档数据发送部分117发送的文档数据的例子。从图43中可明显看出,在文档数据4300中,描述了每一个都指示到另一页的链路的链路信息4301a和4301b。此外,在链路标记4301a和4301b中,描述了作为其它页面的特征的“climate”4302a和“population”4302b。
接着,终端设备3720通过文档数据接收部分3723接收从服务器设备110发送的文档数据(S3902)。
文档数据接收部分3723把接收的文档数据发送到高速缓冲存储器部分3724,并且,在存储与文档数据的标识符相匹配的文档数据的同时(S3903),将其发送到文档数据分析部分3725。
文档数据分析部分3725分析接收的文档数据(S3904),和检查在文档数据中是否存在到另一个文档数据的链路(S3905)。
当在S3905中判断在文档数据中存在到另一个文档数据的链路时,文档数据分析部分3725把这样链接的、不同的文档数据的标识符发送到高速缓冲存储器检查部分3726。
高速缓冲存储器检查部分3726检查在高速缓冲存储器部分3724中是否存在与接收标识符相对应的文档数据(S3906,S3907)。
当在S3907中判断在高速缓冲存储器部分3724中存在与到不同文档数据的链路信息相对应的文档数据时,高速缓冲存储器检查部分3726把它的标识符告知文档数据显示部分3727(S3908)。
接着,文档数据显示部分3727按照从文档数据分析部分3725发送的文档数据和从高速缓冲存储器检查部分3726发送的检查结果,放大显示在链路信息中描述的和指示到其它页面的链路的字符序列(S3909)。
同时,当高速缓冲存储器检查部分在S3907中判断在高速缓冲存储器部分3724中不存在与链路信息相对应的文档数据时,高速缓冲存储器检查部分3726把与文档数据相对应的标识符告知文档数据显示部分3727。
然后,文档数据显示部分3727按照从文档数据分析部分3725发送的文档数据和从高速缓冲存储器检查部分3726发送的检查结果,以正常尺寸显示在链路信息中描述的和指示到另一页的链路的字符序列(S3910)。
图44示出了显示在终端设备3720的文档数据显示部分3727上的图43所示的页面。
在显示在文档数据显示部分3727上的页面4102上,除了指示它自己的内容的部分4104和指示它自己的特征的文本4103之外,还显示了链接到其它页面的文本4100和4101。从上图中可明显看出,文本4100显示得比以正常尺寸显示的文本4101大。
换句话说,这表明,链接到文本4100的文档数据存在于高速缓冲存储器部分3724中,和链接到文本4101的文档数据没有存在于高速缓冲存储器部分3724中。
如上所述,根据实施例6,当在高速缓冲存储器部分3724中找到分页时,可以修改描述到这个在高速缓冲存储器部分3724中的页面的链路信息的方式。借助于这种方法,观看文档数据的用户可以根据描述链路信息的方式的差异,判断链接页面是否存在于高速缓冲存储器部分3724中。这使得用户能够有选择地显示存储在高速缓冲存储器部分3724中的页面。结果,用户可以轻而易举地观看文档数据。
另外,根据实施例6,可以使指示到存在于高速缓冲存储器部分3724中的页面的链路的文本比指示到没有存在于高速缓冲存储器部分3724中的页面的链路的文本大。借助于这种方法,用户能够从链路文本中可视地识别出存在于高速缓冲存储器部分3724中的页面。
此外,尽管借助于实施例6,指示到存在于高速缓冲存储器部分3724中的页面的链路的文本大于指示到没有存在于高速缓冲存储器部分3724中的页面的链路的文本,但是,也可以使指示到存在于高速缓冲存储器部分3724中的页面的链路的文本的长度比指示到没有存在于高速缓冲存储器部分3724中的页面的链路的文本的长度长。并且,可以改变指示到存在于高速缓冲存储器部分3724中的页面的链路的文本的颜色或颜色深度。也可以把指示到存在于高速缓冲存储器部分3724中的页面的链路的文本显示成带阴影的。
顺便提一下,尽管实施例6采用指示链接页面的内容的文本作为指示链路的文本,但是,也可以不采用指示链接页面的内容的文本作为指示链路的文本的配置。
并且,尽管实施例1到实施例6被描述成把未划分文档数据存储在数据库113中,然后利用文档数据划分部分114对其加以划分,但是,这种数据库113存储事先以固定尺寸划分的文档数据的配置也是可以的。
本说明书是基于2001年3月23日提出的日本专利申请第2001-84803号和2002年3月6日提出的日本专利申请第2002-61132号的,特此引用,以供参考。
工业可应用性
如上所述,根据本发明,用户通过诸如移动电话之类的资源有限的终端设备向服务器设备或中继设备作出对文档数据的请求,服务器设备或中继设备划分请求的文档数据,并且把诸如标题之类从不同页面提取的特征加入每个分页中,作为指示到另一页的链路的文本。借助于这种方法,用户能够根据其它链接页的特征,判断是否转到其它页上。其结果是,可以达到用户能够轻而易举地观看文档数据的有利效果。
此外,根据本发明,当用户通过诸如移动电话之类的资源有限的终端设备向服务器设备或中继设备作出对文档数据的请求时,服务器设备或中继设备划分请求的文档数据,并且根据每一页的数据量,把诸如标题之类从不同页面提取的特征可变地加入每个分页中,作为指示到另一页的链路的文本。借助于这种方法,根据有关其它链接页的数据量的信息,用户能够判断是否转到其它链接页上。其结果是,可以达到用户能够轻而易举地观看文档数据的有利效果。
此外,根据本发明,当用户通过诸如移动电话之类的资源有限的终端设备向服务器设备或中继设备作出对文档数据的请求时,服务器设备或中继设备划分请求的文档数据,并且把指定划分尺寸的链路加入每个分页中。借助于这种方法,可以达到用户能够轻而易举地指定划分尺寸和观看文档数据的有利效果。
此外,根据本发明,当终端设备从服务器设备或中继设备获取文档数据时,在检查高速缓冲存储器是否存储链接到所获取文档数据的不同文档数据的同时,可以把获取的文档数据存储在高速缓冲存储器中,并且,当把这样不同的文档数据存储在高速缓冲存储器中时,改变指示到这个不同文档数据的链路的文本的文本显示。借助于这种方法,通过观看链接的文档数据,用户能够从指示链路的文本中,获知是否有必要从服务器设备或中继设备中获取文档数据。其结果是,可以达到用户能够轻而易举地观看文档数据的有利效果。

Claims (30)

1.一种文档数据处理器,包括:
特征提取部分,用于从把一个文档数据划分而成的数个分文档数据的每一个中提取显示分文档数据的特征的信息;和
链路附加部分,用于把指示到所述不同分文档数据的链路的链路信息加入所述一个分文档数据中,和把所述特征提取部分提取的显示所述不同文档数据的特征的信息加入所述链路信息中。
2.根据权利要求1所述的文档数据处理器,其中,显示所述分文档数据的所述特征的信息是所述分文档数据的标题。
3.根据权利要求1所述的文档数据处理器,其中,显示所述分文档数据的所述特征的信息是所述分文档数据中的首字或短语。
4.根据权利要求1所述的文档数据处理器,其中,显示所述分文档数据的所述特征的信息是所述分文档数据中最频繁记录的字符序列。
5.一种文档数据处理器,包括:
数据量检查部分,用于检查把一个文档数据划分而成的数个分文档数据的每一个的数据量;和
链路附加部分,用于把指示到所述不同分文档数据的链路的链路信息加入所述一个分文档数据中,和把指示所述不同文档数据的字符序列加入所述链路信息中,其中,根据所述数据量检查部分检查的所述不同分文档数据的数据量对所述字符序列加以改变。
6.根据权利要求5所述的文档数据处理器,其中,所述链路附加部分根据所述分文档数据的所述数据量改变所述字符序列的长度。
7.根据权利要求5所述的文档数据处理器,其中,所述链路附加部分根据所述分文档数据的所述数据量改变所述字符序列的颜色。
8.根据权利要求5所述的文档数据处理器,其中,所述链路附加部分根据所述分文档数据的所述数据量改变所述字符序列的字符大小。
9.一种文档数据处理器,包括:
划分部分,用于把文档数据划分成数个分文档数据;
链路附加部分,用于把指示到所述不同分文档数据的链路的链路信息加入所述一个分文档数据中,和把指示所述不同文档数据的字符序列加入所述链路信息中;和
划分链路附加部分,用于把指令所述划分部分按预定尺寸重新划分所述文件数据的划分链路信息加入所述划分部分中,和把指示要借此重新划分所述文档数据的所述预定尺寸的字符序列加入所述划分链路信息中。
10.一种服务器设备,包括:
请求接收部分,用于通过网络从终端设备接收文档数据请求;
特征提取部分,用于从把与所述请求相对应的文档数据划分而成的数个分文档数据的每一个中提取显示分文档数据的特征的信息;
链路附加部分,用于把指示到所述不同分文档数据的链路的链路信息加入所述一个分文档数据中,和把所述特征提取部分提取的显示所述不同文档数据的特征的信息加入所述链路信息中;和
发送部分,用于把加入了所述链路信息的链接文档数据发送到所述终端设备。
11.一种服务器设备,包括:
请求接收部分,用于通过网络从终端设备接收对文档数据的请求;
数据量检查部分,用于检查把与所述请求相对应的文档数据划分而成的数个分文档数据的每一个的数据量;
链路附加部分,用于把指示到所述不同分文档数据的链路的链路信息加入所述一个分文档数据中,和把指示所述不同文档数据的字符序列加入所述链路信息中,其中,根据所述数据量检查部分检查的所述不同分文档数据的数据量对所述字符序列加以改变。
发送部分,用于把加入了所述链路信息的链接文档数据发送到所述终端设备。
12.一种服务器设备,包括:
请求接收部分,用于通过网络从终端设备接收文档数据请求;
链路附加部分,用于把指示到所述不同分文档数据的链路的链路信息加入所述数个分文档数据的每一个中,和把指示所述不同文档数据的字符序列加入所述链路信息中;
划分链路附加部分,用于把指令一划分部分按预定尺寸重新划分所述文件数据的划分链路信息加入所述划分部分中,和把指示要借此重新划分所述文档数据的所述预定尺寸的字符序列加入所述划分链路信息中;和
发送部分,用于把加入了所述链路信息和所述划分链路信息的链路指定文档数据发送到所述终端设备。
13.一种终端设备,包括:
输入部分,用于从用户那里接受对文档数据的请求;
请求发送部分,用于通过网络把所述请求发送到根据权利要求10所述的服务器设备;
接收部分,用于接收从所述服务器设备发送的与所述请求相对应的所述链路指定文档数据;和
显示部分,用于分析所述链路指定文档数据,显示把特征加入所述链路信息中的所述链路指定文档数据的内容。
14.一种终端设备,包括:
输入部分,用于从用户那里接受对文档数据的请求;
请求发送部分,用于通过网络把所述请求发送到根据权利要求11所述的服务器设备;
接收部分,用于接收从所述服务器设备发送的与所述请求相对应的所述链接文档数据;和
显示部分,用于显示根据所述数据量对其作了改变的、把特征加入所述链路信息中的所述链路指定文档数据的内容。
15.一种终端设备,包括:
输入部分,用于从用户那里接受对文档数据的请求;
请求发送部分,用于通过网络把所述请求发送到根据权利要求12所述的服务器设备;
接收部分,用于接收从所述服务器设备发送的与所述请求相对应的所述链路指定文档数据;和
显示部分,用于显示把指示所述不同分文档数据的字符序列加入所述链路信息中的、和把指示所述预定尺寸的字符序列加入所述划分链路信息中的所述链路指定文档数据的内容。
16.一种终端设备,包括:
请求发送部分,用于把对文档数据的请求发送到通过划分一个文档数据形成数个分文档数据和发送链路指定文档数据的服务器设备,所述链路指定文档数据是加入指示到所述不同分文件数据的链路的链路信息和指示所述不同分文档数据的字符序列的所述一个分文件数据;
接收部分,用于接收从所述服务器设备发送的与所述请求相对应的所述链路指定文档数据;
高速缓冲存储器部分,用于保存发送的链路指定文档数据;
高速缓冲存储器检查部分,用于检查链路到所述发送的链路指定文档数据的链接文档数据是否在所述高速缓冲存储器部分中;和
文档数据显示部分,用于以与加入在到处在所述高速缓冲存储器部分中的链接分文档数据的链路信息中的字符序列不同的方式,显示加入在到没有处在所述高速缓冲存储器部分中的所述链接分文档数据的链路信息中的所述字符序列。
17.根据权利要求16所述的终端设备,其中,所述文档数据显示部分以与加入在到处在所述高速缓冲存储器部分中的链接分文档数据的链路信息中的字符序列不同的颜色,显示加入在到没有处在所述高速缓冲存储器部分中的所述链接分文档数据的链路信息中的所述字符序列。
18.根据权利要求16所述的终端设备,其中,所述文档数据显示部分以与加入在到处在所述高速缓冲存储器部分中的链接分文档数据的链路信息中的字符序列不同的长度,显示加入在到没有处在所述高速缓冲存储器部分中的所述链接分文档数据的链路信息中的所述字符序列。
19.根据权利要求16所述的终端设备,其中,所述文档数据显示部分以与加入在到处在所述高速缓冲存储器部分中的链接分文档数据的链路信息中的字符序列不同的字符大小,显示加入在到没有处在所述高速缓冲存储器部分中的所述链接分文档数据的链路信息中的所述字符序列。
20.一种文档数据处理系统,包括根据权利要求10所述的服务器设备和根据权利要求13所述的终端设备。
21.一种文档数据处理系统,包括根据权利要求11所述的服务器设备和根据权利要求14所述的终端设备。
22.一种文档数据处理系统,包括根据权利要求12所述的服务器设备和根据权利要求15所述的终端设备。
23.一种文档数据处理方法,包括:
从把一个文档数据划分而成的数个分文档数据的每一个中提取显示分文档数据的特征的信息;
把指示到所述不同分文档数据的链路的链路信息加入所述一个分文档数据中;和
把显示所述不同分文档数据的特征的信息加入所述链路信息中。
24.一种文档数据处理方法,包括:
检查把一个文档数据划分而成的数个分文档数据的每一个的数据量;
把指示到所述不同分文档数据的链路的链路信息加入所述一个分文档数据中;和
把指示所述不同文档数据的字符序列加入所述链路信息中,其中,根据所述不同分文档数据的所述数据量对所述字符序列加以改变。
25.一种文档数据处理方法,包括:
把文档数据划分成数个分文档数据;
把指示到所述不同分文档数据的链路的链路信息加入所述一个分文档数据中;
加入指示所述不同分文档数据的字符序列;
加入指示到所述不同分文档数据的链路的链路信息;
加入指令划分部分按预定尺寸重新划分所述文件数据的划分链路信息;和
把指示要借此重新划分所述文档数据的所述预定尺寸的字符序列加入所述划分链路信息中。
26.一种文档数据处理方法,包括:
当发送所述文档数据时,通过划分文档数据,形成数个分文档数据;
把对所述文档数据的请求发送到服务器设备,所述服务器设备把指示到所述不同分文档数据的链路的链路信息加入所述一个分文档数据中,和发送包括指示所述不同分文档数据的字符序列的所述链路信息;
接收从所述服务器设备发送的与所述请求相对应的分文档数据;和
在链接到发送的分文档数据的所述不同分文档数据中,以与为处在高速缓冲存储器部分中的链接分文档数据加入链路信息中的字符序列不同的方式,显示为没有处在所述高速缓冲存储器部分中的链接分文档数据加入链路信息中的字符序列。
27.一种程序,计算机借此实现:
从把一个文档数据划分而成的数个分文档数据的每一个中提取显示分文档数据的特征的信息;和
把指示到所述不同分文档数据的链路的链路信息加入所述一个分文档数据中,和把显示所述不同分文档数据的特征的信息加入所述链路信息中。
28.一种程序,计算机借此实现:
检查把一个文档数据划分而成的数个分文档数据的每一个的数据量;
把指示到所述不同分文档数据的链路的链路信息加入所述一个分文档数据中;和
把指示所述不同文档数据和根据所述不同分文档数据的所述数据量对其加以改变的字符序列加入所述链路信息中。
29.一种程序,计算机借此实现:
把文档数据划分成数个分文档数据;
把指示到所述不同分文档数据的链路的链路信息加入所述一个分文档数据中;
把指示所述不同分文档数据的字符序列加入所述链路信息中;
加入指示到所述不同分文档数据的链路的链路信息;
加入指令划分部分按预定尺寸重新划分所述文件数据的划分链路信息;知
把指示要借此重新划分所述文档数据的所述预定尺寸的字符序列加入所述划分链路信息中。
30.一种程序,计算机借此实现:
把对文档数据的请求发送到服务器设备,所述服务器设备通过划分所述文档数据形成数个分文档数据,和通过把指示到所述不同分文档数据的链路的链路信息加入所述一个分文档数据中,和把指示所述不同分文档数据的字符序列加入所述链路信息中,发送所述文档数据;和
在链接到发送的分文档数据的所述不同分文档数据中,以与为处在高速缓冲存储器部分中的链接分文档数据加入链路信息中的字符序列不同的方式,显示为没有处在所述高速缓冲存储器部分中的链接分文档数据加入链路信息中的字符序列。
CN02801445A 2001-03-23 2002-03-14 文档数据处理器、服务器设备、终端设备、和文档数据处理系统 Pending CN1462401A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2001084803 2001-03-23
JP084803/2001 2001-03-23
JP061132/2002 2002-03-06
JP2002061132A JP2002351736A (ja) 2001-03-23 2002-03-06 文書データ処理装置、サーバ装置、端末装置、及び文書データ処理システム

Publications (1)

Publication Number Publication Date
CN1462401A true CN1462401A (zh) 2003-12-17

Family

ID=26611900

Family Applications (1)

Application Number Title Priority Date Filing Date
CN02801445A Pending CN1462401A (zh) 2001-03-23 2002-03-14 文档数据处理器、服务器设备、终端设备、和文档数据处理系统

Country Status (6)

Country Link
US (1) US20030079183A1 (zh)
EP (1) EP1372088A1 (zh)
JP (1) JP2002351736A (zh)
KR (1) KR20030003767A (zh)
CN (1) CN1462401A (zh)
WO (1) WO2002077866A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101866256A (zh) * 2009-04-16 2010-10-20 鸿富锦精密工业(深圳)有限公司 电子设备系统及电子设备用户操作界面显示方法
CN101606371B (zh) * 2007-02-08 2013-03-06 株式会社Ntt都科摩 内容发布管理装置、通信终端、程序以及内容发布系统
CN109815243A (zh) * 2019-02-18 2019-05-28 北京仁和汇智信息技术有限公司 一种文档界面化修改时的结构化存储方法和装置

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004086846A (ja) * 2002-06-27 2004-03-18 Oki Electric Ind Co Ltd 情報区分装置、方法及びプログラム、並びに、情報区分プログラムを記録した記録媒体
US7366981B2 (en) * 2002-10-04 2008-04-29 Fuji Xerox Co., Ltd. Image forming device and method
JP3935856B2 (ja) 2003-03-28 2007-06-27 インターナショナル・ビジネス・マシーンズ・コーポレーション レイアウトの定められた文書のダイジェストを作成するための情報処理装置、サーバ、方法及びプログラム
JP4014160B2 (ja) * 2003-05-30 2007-11-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、プログラム、及び記録媒体
US9094805B2 (en) * 2003-06-25 2015-07-28 Oracle International Corporation Mobile messaging concierge
JP4340483B2 (ja) * 2003-06-27 2009-10-07 富士通株式会社 複合コンテンツの配信方法および配信システム
WO2006123429A1 (ja) * 2005-05-20 2006-11-23 Fujitsu Limited 情報検索方法、装置、プログラム、該プログラムを記録した記録媒体
JP4811069B2 (ja) * 2005-10-24 2011-11-09 大日本印刷株式会社 情報提示装置、情報提示方法、及び情報提示処理プログラム
JP4928117B2 (ja) * 2005-11-10 2012-05-09 キヤノン株式会社 画像処理装置、画像管理方法、文書管理装置、文書管理方法、コンピュータプログラム及びコンピュータ読み取り可能な記憶媒体
JP4771915B2 (ja) 2006-11-15 2011-09-14 京セラミタ株式会社 Htmlテキストを変換する装置、方法、およびプログラム
JP4935396B2 (ja) * 2007-02-09 2012-05-23 日本電気株式会社 Webコンテンツ提供装置、Webコンテンツ提供方法およびプログラム
JP4700637B2 (ja) * 2007-02-28 2011-06-15 関西電力株式会社 Web文書分割方法、システム及びプログラム
JP5530217B2 (ja) * 2010-02-24 2014-06-25 富士フイルム株式会社 文書閲覧システム及びドキュメント変換サーバ
US9001390B1 (en) * 2011-10-06 2015-04-07 Uri Zernik Device, system and method for identifying sections of documents
US8504827B1 (en) * 2013-02-27 2013-08-06 WebFilings LLC Document server and client device document viewer and editor
US10417338B2 (en) 2014-09-02 2019-09-17 Hewlett-Packard Development Company, L.P. External resource identification
CN111291152A (zh) * 2018-12-07 2020-06-16 北大方正集团有限公司 案例文书的推荐方法、装置、设备及存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143498A (ja) * 1996-11-08 1998-05-29 Nippon Telegr & Teleph Corp <Ntt> リンク付与機能を持つページ分割通信中継装置
JPH10143403A (ja) * 1996-11-12 1998-05-29 Fujitsu Ltd 情報管理装置および情報管理プログラム記憶媒体
US6266683B1 (en) * 1997-07-24 2001-07-24 The Chase Manhattan Bank Computerized document management system
US6857102B1 (en) * 1998-04-07 2005-02-15 Fuji Xerox Co., Ltd. Document re-authoring systems and methods for providing device-independent access to the world wide web
US6037935A (en) * 1998-04-28 2000-03-14 International Business Machines Corporation Web page exploration indicator and method
US6769096B1 (en) * 1998-06-24 2004-07-27 Microsoft Corporation System and method for updating a table of contents in a frameset
JP2000276471A (ja) * 1999-03-23 2000-10-06 Seiko Epson Corp リンク先情報の概要提示方法およびリンク先情報の概要提示装置ならびにリンク先情報の概要提示処理プログラムを記録した記録媒体
JP2001056778A (ja) * 1999-08-18 2001-02-27 Sharp Corp 情報取得装置及びその制御方法
US6754873B1 (en) * 1999-09-20 2004-06-22 Google Inc. Techniques for finding related hyperlinked documents using link-based analysis
US6839702B1 (en) * 1999-12-15 2005-01-04 Google Inc. Systems and methods for highlighting search results
US6848075B1 (en) * 2000-02-10 2005-01-25 International Business Machines Corporation Internet web browser with memory enhanced hyperlink display
US20040054973A1 (en) * 2000-10-02 2004-03-18 Akio Yamamoto Method and apparatus for transforming contents on the web
US6874019B2 (en) * 2001-03-08 2005-03-29 International Business Machines Corporation Predictive caching and highlighting of web pages

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101606371B (zh) * 2007-02-08 2013-03-06 株式会社Ntt都科摩 内容发布管理装置、通信终端、程序以及内容发布系统
CN101866256A (zh) * 2009-04-16 2010-10-20 鸿富锦精密工业(深圳)有限公司 电子设备系统及电子设备用户操作界面显示方法
CN109815243A (zh) * 2019-02-18 2019-05-28 北京仁和汇智信息技术有限公司 一种文档界面化修改时的结构化存储方法和装置
CN109815243B (zh) * 2019-02-18 2020-03-03 北京仁和汇智信息技术有限公司 一种文档界面化修改时的结构化存储方法和装置

Also Published As

Publication number Publication date
US20030079183A1 (en) 2003-04-24
KR20030003767A (ko) 2003-01-10
JP2002351736A (ja) 2002-12-06
EP1372088A1 (en) 2003-12-17
WO2002077866A1 (fr) 2002-10-03

Similar Documents

Publication Publication Date Title
CN1462401A (zh) 文档数据处理器、服务器设备、终端设备、和文档数据处理系统
CN1274207A (zh) 信息终端装置
CN1109994C (zh) 文件处理装置与记录媒体
CN1293500C (zh) 组织计算机网络中电子邮件文档的方法及电子邮件系统
CN1154935C (zh) 设备控制装置及设备判断方法
CN1269059C (zh) 访问网络中位置的方法
CN100336018C (zh) 用于对应用启动进行管理的便携式终端和方法
CN1202486C (zh) 搜索网络上的装置用的系统
CN1815476A (zh) 显示装置
CN1289096A (zh) 数据转换系统
CN1112637C (zh) 信息获取代理系统和信息传送管理系统
CN1711784A (zh) 用于发送sms以及文本消息的系统和方法
CN1264090A (zh) 图像数据通信系统、服务器系统和控制方法及其记录媒体
CN1765099A (zh) 能够容易控制协议消息的通信系统的模拟装置与模拟方法
CN1799051A (zh) 使用页面存储文件浏览内容的方法
CN101048773A (zh) 文件分析系统、以及文件适应系统
CN1221110C (zh) 通信系统及其网关、无线信息终端和无线通信方法
CN1193402A (zh) 构造报交通信系统
CN1288584C (zh) 电子词典和服务器
CN1656452A (zh) 用于数据管理的电子设备、方法、程序和存储介质
CN1760869A (zh) 信息显示控制装置、服务器以及信息显示控制方法
CN1777890A (zh) 支持使用关键字的数据注册/搜索的设备、以及报告预备支持设备和程序
CN1174354A (zh) 利用网络的信息分发系统
CN1887000A (zh) 位置信息服务提供系统及其方法
CN1290026C (zh) 信息提供系统和信息服务设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication