WO2002077866A1 - Dispositif de traitement de donnees documentaires, dispositif serveur, dispositif terminal et systeme de traitement de documents - Google Patents

Dispositif de traitement de donnees documentaires, dispositif serveur, dispositif terminal et systeme de traitement de documents Download PDF

Info

Publication number
WO2002077866A1
WO2002077866A1 PCT/JP2002/002396 JP0202396W WO02077866A1 WO 2002077866 A1 WO2002077866 A1 WO 2002077866A1 JP 0202396 W JP0202396 W JP 0202396W WO 02077866 A1 WO02077866 A1 WO 02077866A1
Authority
WO
WIPO (PCT)
Prior art keywords
document data
link
divided
unit
link information
Prior art date
Application number
PCT/JP2002/002396
Other languages
English (en)
French (fr)
Inventor
Hiroyuki Tada
Shunichi Takeuchi
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to EP02705164A priority Critical patent/EP1372088A1/en
Publication of WO2002077866A1 publication Critical patent/WO2002077866A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes

Definitions

  • the present invention relates to a document data processing device, a server device, a terminal device, and a document data processing system for processing document data described in a structure description language.
  • HTML is standardized by W3C (Worl d Wide Web Consortium), and for the HTML 4.01 standard, ht tp in the W3C WWW page: // www. W3. Or g / TR / ht ml 401 /.
  • FIG. 1 is a diagram showing a description example of HTML.
  • HTML can structure a document by defining a HEAD tag, TITLE tag, HTML tag, and B ⁇ DY tag.
  • HTML is shown in 4201 in the figure.
  • the WWW uses content (such as documents, images and audio) written in HTML.
  • content such as documents, images and audio
  • This is a mechanism that supports a system in which a server that stores multimedia data) and a client that requests acquisition of multimedia data stored in the server are both connected via a network.
  • the WWW uses HTTP (HyperText Transport Protocol 1) to transmit a data request from the client to the server and data transmission in response to the request from the server to the client. It is a mechanism to do.
  • HTTP HyperText Transport Protocol 1
  • the HTTP standard is described in RFC2616.
  • both servers and clients are realized by general-purpose computers such as workstations or personal computers.
  • an HTTP server program is running on the server computer.
  • an HTML browser program that performs communication using HTTP, interprets HTML, and displays data on the computer is executed on the client computer.
  • FIG. Figure 2 is a block diagram of a system that implements the WWW.
  • the user requests the HTML content by specifying the URL (Uniform Resource Locator or s) of the desired HTML content from the input unit 4321 of the client 4320.
  • URLs are a standard for identifiers of resources on the network and are described in RFC 1738.
  • the request input from the input unit 4321 is transmitted by the data request transmission unit 4322 to the server 4310 via the network 4330.
  • the server 4310 receives the request sent from the client 4320 in the document data request receiving unit 4311. Next, the server 4310 obtains the requested HTML content from the database 4313 in the data obtaining unit 4312. Then, the data acquisition unit 4312 sends the acquired HTML content to the data transmission unit 4314. The document data transmission unit 4314 transmits the received HTML content to the client 4 via the network 4330. Send to 320.
  • the client 4320 receives the requested HTML content in the data receiving unit 4323. Then, the client 4320, the data display unit 4
  • the received HTML content is displayed.
  • the data display section 4324 is displayed as BODY> 42 18 and ZBODY>
  • the data display unit 4324 displays the string 421 9 referred to as "Hello”.
  • the overnight display section 4324 interprets the character “2” surrounded by ⁇ A HRE special> indicated by 4201 in the figure as a linked text. Then, the overnight display section 4324 displays the character “2”.
  • FIG. 3 shows an example in which the data display unit 4324 interprets and displays the HTML content in FIG.
  • i-mode operated by NTT DOCOMO
  • EZweb operated by KDD I
  • J-PHONE have been provided as information provision services for devices with limited resources such as mobile phones.
  • J—SKY Web that it operates is emerging.
  • a portable terminal device that enjoys an information providing service from a server has a limitation on a displayable size and resolution of information. Yotsu Thus, the mobile terminal device has a limitation in obtaining information and displaying information. For this reason, the server divides one content into a plurality of contents, and provides the user of the portable terminal device with the divided content and a link linking the divided content.
  • the server divides one content into a plurality of contents, and provides the user of the portable terminal device with the divided content and a link linking the divided content.
  • Japanese Patent Laid-Open Publication No. Hei 10-14-498 discloses that a document file described using HTML is divided into page units, and each divided page shows a link to another page. It describes a method of adding the page number of another page to information (hereinafter referred to as link information).
  • Japanese Patent Application Laid-Open No. H11-17546426 discloses that the original content is divided into a plurality of pages, and each of the divided pages is used as link information to other pages before and after and at the top of the page. A method for adding a page and the last page is described. Also, this publication discloses a method of providing an input field on a display screen for a user to input a page number to be displayed, or displaying a scroll bar and changing a page to be displayed by the scroll bar. Is described. Further, Japanese Patent Application Laid-Open No. 2000-076473 discloses a document page in which document data is divided into sections, and an index page is created by collecting only the headings of the divided pages.
  • An object of the present invention is to enable a user to easily browse document data even when the document data is divided.
  • link information indicating a link to another page is added to each page of the divided document data, a heading of another page, and a top of another page. Words or words representing other pages are added.
  • a user who views the document can easily edit the content of another page from the heading, the first word, or a word representing another page, which is the link information assigned to each page. Can be grasped. As a result, the user can grasp information of another page from the page currently being browsed, so that the contents of another page can be easily obtained. Therefore, even if the document data is divided, the user can easily browse the divided document data.
  • the length of words, the color of characters, the size of characters, etc. of the link information given to each page of the divided document data are determined by the data amount of other pages corresponding to the link information. It changes according to.
  • the user who views the document data can determine the data amount of each divided page based on the length of the words, the character color, or the character size of the link information. This allows the user to determine whether a page is appropriate for display and to select the appropriate page to display. As a result, The user can easily browse the document data.
  • a cache for storing the document data is provided in the terminal device receiving the document data, and when another divided page exists in the cache, another page existing in the cache is provided. Change the length of words, text color, or text size of the link information.
  • the user who browses the document data can judge whether or not there is another linked page in the cache based on the length of the phrase in the link information, the color of the character, or the size of the character. As a result, the user can select and display another page stored in the cache. As a result, the user can easily browse the document data.
  • FIG. 1 is a diagram showing a description example of H TML.
  • FIG. 2 is a block diagram of a system that implements the WWW.
  • FIG. 3 is a diagram showing a display example of the HTML document shown in FIG. 1,
  • FIG. 4 is a block diagram illustrating a configuration of the document data processing system according to the first embodiment of the present invention.
  • FIG. 5 is a hardware configuration diagram of the server device and the terminal device according to the first embodiment.
  • FIG. 6 is a flowchart showing the operation of the document data processing system according to the first embodiment.
  • FIG. 7 is a diagram showing a description example of H TML.
  • FIG. 8 is a diagram showing an example in which the HTML document shown in FIG. 7 is divided
  • FIG. 9 is a diagram showing an example in which a link to another divided page according to the first embodiment is added.
  • 10 is a diagram showing the relationship between the original HTML document and the divided HTML document
  • FIG. 11 is a diagram showing a display example of the HTML document shown in FIG. 9,
  • FIG. 12 is a diagram illustrating an example in which a link to another divided page according to the first embodiment is added.
  • FIG. 13 is a diagram showing a display example of the HTML document shown in FIG. 12 on the terminal device side.
  • FIG. 14 is a block diagram showing a configuration of a document data processing system according to the second embodiment of the present invention.
  • FIG. 15 is a flowchart showing the operation of the server device according to the second embodiment.
  • FIG. 16 is a diagram showing an example of HTML description.
  • FIG. 17 is a diagram showing an example in which the HTML document shown in FIG. 16 is divided
  • FIG. 18 is a diagram showing an example in which a link to another divided page according to the second embodiment is added.
  • FIG. 19 is a diagram showing a display example of the HTML document shown in FIG. 18,
  • FIG. 20 is a diagram illustrating an example of adding a link to another divided page according to the second embodiment.
  • FIG. 21A is a diagram showing a display example of the HTML document shown in FIG. 20
  • FIG. 21B is a diagram showing another display example of the HTML document shown in FIG. 20
  • FIG. 21C is a diagram shown in FIG.
  • FIG. 22 is a block diagram showing a configuration of a system according to the third embodiment of the present invention.
  • FIG. 23 is a flowchart illustrating the operation of the server device according to the third embodiment.
  • FIG. 24 is a diagram illustrating a description example of HTML.
  • FIG. 25 is a diagram showing an example in which the HTML document shown in FIG. 24 is divided
  • FIG. 26 is a diagram showing an example in which a link to another divided page according to the third embodiment is added.
  • FIG. 27 is a diagram showing an example in which a link specifying the size of division is added to the HTML document shown in FIG. 26.
  • FIG. 28 is a diagram showing a display example of the HTML document shown in FIG. 27.
  • FIG. 29 is a diagram showing an example in which the HTML document shown in FIG. 24 is divided, and
  • FIG. 30 is a diagram showing an example in which a link to another divided page according to the third embodiment is added. Yes,
  • FIG. 31 is a diagram showing an example in which a link specifying the size of division is added to the HTML document shown in FIG. 30.
  • FIG. 32 is a diagram showing a display example of the HTML document shown in FIG. 31, and FIG. 33 is a block diagram showing a configuration of a system according to the fourth embodiment of the present invention.
  • FIG. 34 is a block diagram illustrating a hardware configuration of a system according to the fourth embodiment.
  • FIG. 35 is a flowchart illustrating the operation of the relay device according to the fourth embodiment.
  • FIG. 36 is a flowchart illustrating the operation of the server device according to the fourth embodiment.
  • FIG. 37 is a flowchart illustrating the operation of the present invention.
  • FIG. 9 is a block diagram showing a configuration of a system according to mode 5;
  • FIG. 38 is a block diagram showing a hardware configuration of the system according to the fifth embodiment.
  • FIG. 39 is a flowchart showing the operation of the document data processing apparatus according to the fifth embodiment.
  • FIG. 40 is a block diagram showing a configuration of a system according to Embodiment 6 of the present invention.
  • FIG. 41 is a block diagram illustrating a hardware configuration of a system according to the sixth embodiment.
  • FIG. 42 is a flowchart showing the operation of the terminal device according to the sixth embodiment.
  • FIG. 43 is a diagram showing a description example of H TML,
  • FIG. 44 is a diagram showing a display example of the HTML document shown in FIG.
  • FIG. 4 is a block diagram illustrating a configuration of the document data processing system according to the first embodiment.
  • a server device 110 and a terminal device 120 which are data processing devices, are connected to a network 130 such as an Internet connection network.
  • the server 110 is provided with a database 113 for managing and storing document data.
  • the document data stored in the database 113 is, for example, a document data described in a structure description language such as HyperTelexTtMarkupLanguage, that is, HTML.
  • the server device 110 is provided with a document data request receiving unit 111 for receiving a document data transmission request sent from the terminal device 120.
  • the document data request receiving unit 111 sends the received request to the document data obtaining unit 112 provided in the server 110.
  • the document data acquiring unit 111 acquires document data from the database 113 and sends it to the document data dividing unit 114 provided in the server 110.
  • the document data division unit 114 divides the document data sent from the document data acquisition unit 112 and sends the document data to the document data feature extraction unit 115 provided in the server 110.
  • the document data feature extracting unit 115 extracts the features of each page of the divided document data, and the document data moving link adding unit 1 provided in the server 110 together with the divided document data. Send to 6.
  • the document data overnight movement link adding section 1 16 adds link information indicating a link to another page to each page of the divided document data overnight, and is provided in the server device 110. Sent to the sent document data transmission section 1 17.
  • the link information added by the document data transfer link adding unit 116 to each page of the divided document data is a feature of each page extracted by the document data feature extracting unit 115.
  • the document data transmission unit 117 transmits document data in which link information is added to each page of the divided document data to the terminal device 120 via the network 130.
  • the terminal device 120 is a user terminal, and is realized using a general-purpose machine such as a personal convenience store.
  • the terminal device 120 is provided with an input unit 121 for receiving an input from a user.
  • the input unit 122 sends the input from the user to the document data request transmission unit 122 provided in the terminal device 120.
  • the document data request transmitting unit 122 transmits a request for document data corresponding to the input information transmitted from the input unit 122 to the server 110 via the network 130.
  • the terminal device 120 is provided with a document data receiving section 123 for receiving the document data requested to the server device 110.
  • the document data receiving section 123 sends the document data to the document data displaying section 124 serving as an image display means.
  • the document data display section 124 has a function as a browser, analyzes the received document data, converts it into a form that can be displayed, and displays it on the screen.
  • FIG. 5 is a diagram showing a hardware configuration when the server device 110 and the terminal device 120 are realized by a computer.
  • the CPU 200 executes a program stored in the memory 201 to generate a document data overnight dividing unit 114 and a document data feature extracting unit 115. , And the function of the document data overnight movement link addition section 1 16.
  • the CPU 200 executes the program stored in the memory 201 and uses the network interface 202 so that the document data overnight request receiving unit 111 and the document data transmitting unit 117 can be used.
  • CP The U200 executes the program stored in the memory 201 and uses the input / output interface 203 to function as the document data acquisition unit 112 ( memory 20: U ⁇ ROM, RAM, etc.
  • the program is stored in a ROM, and the RAM is a work area when the CPU 200 executes a process based on the description of the program.
  • the CPU 210 executes a program stored in the memory 211, and uses the network interface 215 and the input / output interface 213 to send the document data request transmission unit 122. And the function of the document data overnight receiving unit 123 is realized.
  • the function of the document data display unit 124 is realized by the CPU 210 executing the program stored in the memory 211 and using the display unit 214.
  • the memory 211 is composed of several storage media such as ROM and RAM, and the program is stored in ROM.
  • the RAM serves as a work area when the CPU 210 executes a process based on the description of the program.
  • the document data processing system is configured such that a user instructs, for example, Un if 0 rm Resource Locators, that is, an identifier such as a URL from the input unit 121 of the terminal device 120.
  • data of the server device 1 10 - evening Bae - scan 1 1 for example is stored in the 3 H yp ⁇ r T ex t Markup language, i.e., those requiring document data described in a structured description language such as H TML is there.
  • the server device 1 10 is configured such that a user instructs, for example, Un if 0 rm Resource Locators, that is, an identifier such as a URL from the input unit 121 of the terminal device 120.
  • data of the server device 1 10 - evening Bae - scan 1 1 for example is stored in the 3 H yp ⁇ r T ex t Markup language, i.e., those requiring document data described in a structured description language such as H TML is there.
  • the document data corresponding to the request from 20 is transmitted to the terminal device 120.
  • the terminal device 120 inputs document data information requested by the user from the input unit 121 (S301), and transmits the input request to the server device 110 (S301).
  • the terminal device 120 transmits the sentence sent from the server device 110. Wait for the book to be received (S303).
  • the server device 110 receives the document data transmission request sent from the terminal device 120 in the document data request receiving unit 111 (S304).
  • the document data acquisition unit 112 acquires the document data requested by the terminal device 120 from the data server 113 (S305).
  • FIG. 7 shows an example of the document data acquired by the document data acquisition unit 112 from the database 113.
  • the document data 400 shown in FIG. 7 is described in HTML.
  • the document data dividing section 114 divides the document data acquired by the document data acquiring section 112 (S306).
  • the document data division unit 114 divides the document data by, for example, delimiting the H1 tags 401 a to 401 c which are the heading tags shown in FIG.
  • the missing tag is added to the document data division unit 114 so that each page of the divided document data conforms to the HTML grammar (S307).
  • FIG. 8 shows an example in which the document data division unit 114 divides the document data shown in FIG.
  • the document data 400 shown in FIG. 7 is divided into three pages 500 to 502.
  • Page 500 contains data between H1 tag 410a and H1 tag 410b
  • page 5001 contains H1 tag 410b to H1 tag 410c.
  • page 502 describes the data after the H1 tag 401c.
  • the document data division unit 114 sends the divided pages 500 to 502 to the document data feature extraction unit 115. Then, the document data feature extraction unit 115 extracts the features of each of the pages 500 to 502 (S308).
  • a heading of each page 500 to 502 is adopted.
  • a text described between H1> to ⁇ / HI> is adopted.
  • the document data overnight feature extraction unit 115 extracts the contents of the heading tags HIAg 401 a to 401 c as features of each page,
  • the characteristics of 0 to 502 are "land”, “climate”, and “population”, which are indicated by 801a to 801c in the figure, respectively.
  • the document data overnight feature extraction unit 115 outputs the divided pages 500 to 502 and the features 8001 a to 8 of each page extracted by the document data feature extraction unit 115.
  • 0 1 c is sent to the document data overnight movement link addition section 1 16.
  • the document data moving link adding unit 116 adds link information indicating a link to another page to each of the divided pages 500 to 502 (S309).
  • the document data moving link addition section 1 16 includes the link tags ⁇ A href> to ⁇ ZA> indicating the link as link information to other pages, and the features of other pages. 8 0 1 is added.
  • FIG. 9 shows an example of a document file in which link information to another page is added to page 500 in FIG.
  • the document data 900 has a link tag 900 a indicating a link to page 501 and a link tag 900 b indicating a link to page 502. It has been described.
  • “climate” 800 1 b which is a characteristic of the ⁇ 501, is described as link information.
  • “population” 801 c which is a feature of the page 502 is described as link information.
  • FIG. 10 shows the relationship between the requested document data and each of the divided pages.
  • the document data indicated by 1001 corresponds to the document data 400 in FIG. 7, and the document data indicated by 1002 corresponds to the page 500 in FIG.
  • the document data described by 1003 corresponds to page 501 of FIG. 8, and the document data described by 1004 corresponds to page 5 of FIG. It corresponds to 02.
  • the document data 1002 contains, in addition to the text 1004a indicating its own characteristics, the text 1004b linked to the document data 1003 as link information and the document data 100a.
  • the text 1004c linked to 1004 is described.
  • the document data 1003 is linked to the document data 1002 as link information in addition to the text 1005b showing its own characteristics.
  • the document data 1004 includes, in addition to the text 1006c indicating its own characteristic, the text 1006a linked to the document data 1002a and the document data 1
  • the text 1 0 6 b linked to 0 3 is described.
  • the document data overnight movement link adding section 1 16 sequentially sends each page to which a link to another page is added to the document data transmitting section 1 17.
  • the document data transmitting section 117 transmits document data 900 in which link information has been added to the first page of the divided document data to the terminal device 120 (S310).
  • the terminal device 120 receives the divided page transmitted from the server device 110 in the document data receiving section 123 (S311). Then, the document data receiving section 123 sends the received page to the document data overnight display section 124. c And the document data overnight display section 124 displays the page described in the sent HTML. The message is analyzed and displayed on the screen (S312). In this way, the first page of the document data requested by the user is displayed.
  • the document data display section 124 of the terminal device 120 displays the page shown in FIG. 9 as shown in FIG.
  • the page 100 0 0 displayed on the document data display section 124 includes a page 100 1 indicating the content of the user and a text 100 2 a indicating the feature of the user, and a page 501 The text linked to page 102 and the text linked to page 502 are displayed.
  • the document data request transmission section 122 transmits another page request to the server apparatus 110 (S310) o
  • the server apparatus 110 receives the request by the document data overnight request receiving section 111 (S304), and the document data overnight obtaining section 112 receives the request as the source of the requested page. Obtain the document data from the data at a pace 1 1 3 (S 3 05) o
  • the document data dividing section 114 divides the acquired document data (S306).
  • the division is performed with the H1 tag, which is the heading tag, as a delimiter as in the beginning, and a missing page is added so that each divided page conforms to the grammar of HTML (S307).
  • Fig. 8 shows an example where the document data is divided.
  • the document data dividing section 114 sends the divided pages 500 to 502 to the document data extracting section 115.
  • the document data feature extraction unit 115 extracts the features of the pages 500 to 502 (S 308).
  • the document data overnight feature extraction unit 1 15 extracts the contents of the H 1 tags 4 0 1 a to 4 0 1 c as the heading tags as the features of each page 5 0 0 to 5 0 2.
  • the features of each page 500 to 502 are "national land”, “climate”, and “population”, respectively, as shown at 81a to 81c in the figure.
  • the document data feature extraction unit 115 extracts the divided pages and the extracted features 5001 to 502 of each page 500 to 502 into the document data. Evening movement link addition section Send to 1 1 6 Then, the document data overnight movement link adding unit 116 adds a link to another page to each of the divided pages (S309).
  • FIG. 12 shows a document 1200 in which links 91 to 902 are added to the page 501 of FIG.
  • the document data 1 2 0 0 has a link tag 1 2 0 1 a indicating a link to the page 5 0 0 and a link tag 1 2 indicating a link to the page 5 0 1 2 0 lb has been described.
  • link tag 1201a "land" 1202, which is a feature of page 500, is described as link information.
  • "population" 801c which is a feature of the page 502 is described.
  • the document data overnight movement link adding unit 1 16 sends the document data overnight 1 2000 with the link information to another page added to the document data overnight transmitting unit 1 17. And the statement The document data transmission unit 1117 transmits the divided page requested from the terminal device 120 to the terminal device 120 (S310).
  • the terminal device 120 receives the divided page transmitted from the server device 110 in the document data receiving section 123 (S311).
  • FIG. 13 shows a diagram in which the data display section 124 displays the page shown in FIG.
  • the page 1303 displayed on the document data display section 124 contains, as link information, in addition to a part 1301 showing its own content and a text 1302b showing its own characteristics. Text 1302a linked to page 500 and text 1320c linked to page 502 are described.
  • the terminal device 120 repeats the processing of S310 to S313. , Other pages can be displayed as well.
  • information indicating the content of another page can be described as link information to another page in each page of the divided document data.
  • the user who browses the document can easily grasp the contents of other pages from the link information given to each page.
  • the user since the user can grasp the information of the other page from the page currently being viewed, the user can easily obtain the contents of the other page. Therefore, even if the document data is divided, the user can easily view the divided document data.
  • a heading of another page can be used as information indicating the content of another page to be adopted as link information. Since the headline is information indicating the characteristics of each page, the link information accurately indicates the content of another page. As a result, the user can accurately grasp the contents of another page.
  • the heading of another page is used as information indicating the content of another page used in the link information. May be used. In this case, it is sufficient to extract the first phrase of the text described between body> ⁇ ⁇ / bo (1>), which is a tag indicating the entity.
  • a form may be employed in which a predetermined number of characters are extracted from the beginning of the text described between / body>.
  • the heading of another page is used as the information indicating the content of another page to be adopted as the link information, but a keyword of the content on another page may be used.
  • a keyword of the content on another page may be used.
  • the content keywords are likely to be the words that best describe the features of each page, so that the link information accurately describes the content of other pages.
  • HTML is used as a language for describing document data.
  • any language may be used as long as it can describe link information to another page.
  • the description of the link information is changed according to the data amount of the corresponding page so that the user can grasp the data amount of the linked page.
  • FIG. 14 is a block diagram illustrating a configuration of the document data processing system according to the second embodiment.
  • a server device 110 and a terminal device 120 are connected to a network 130 such as the Internet.
  • the document data processing system according to the second embodiment differs from the document data system according to the first embodiment in the configuration of the server device 110.
  • the number of server devices 1 1 1 0 is determined by the number of divided Is extracted from the beginning of the data other than the tag as a feature of each page, and this feature is used as link information.
  • the user who browses the document data can know the amount of data of the divided page from the link information and can select which page to display.
  • the server device 110 is provided with a document data amount checking unit 111 for checking the amount of data of each page of the document data divided by the document data dividing unit 114. .
  • the document data overnight amount checking unit 111 outputs the data amount of each checked page to the document data overnight feature extracting unit 111 provided in the server device 110.
  • the document data feature extracting unit 1 1 16 extracts the features of each page of the divided document data, and adds a document data movement link provided in the server device 110 together with the divided document data. Send to part 1 1 1 7
  • the document data feature extraction unit 111 changes the length of a character string to be extracted as a feature according to the data amount of each page. More specifically, the document data feature extraction unit 111 increases the length of the character string extracted as a feature as the amount of data on each page increases.
  • the document data movement link adding unit 1 1 17 adds link information to other pages to each divided page.
  • the link information added by the document data movement link adding unit 111 to each page of the divided document data is the feature of each page extracted by the document data feature extracting unit 111.
  • the terminal device 120 is the same as the terminal device of the first embodiment. Description is omitted.
  • the server device 110 and the terminal device 120 are realized by a computer, the result is as shown in FIG.
  • the CPU 2000 executes the program stored in the memory 201, and thereby the document data dividing unit 114, the document data amount checking unit 111, and the document data to evening feature extracting unit 111 6 and the function of the document data movement link addition unit 1 1 1 7 are realized.
  • a terminal device using a computer Since the device 120 is the same as in the first embodiment, the description is omitted.
  • the document data processing system when the user specifies an identifier such as a URL from the input unit 121 of the terminal device 120, the document data is stored in the database 113 of the server device 110. It requests a document written in a structured description language such as HTML. On the other hand, the server device 110 transmits a document data corresponding to the request from the terminal device 120 to the terminal device 120.
  • an identifier such as a URL from the input unit 121 of the terminal device 120
  • the document data is stored in the database 113 of the server device 110. It requests a document written in a structured description language such as HTML.
  • the server device 110 transmits a document data corresponding to the request from the terminal device 120 to the terminal device 120.
  • the server device 110 receives the document data transmission request sent from the terminal device 120 in the document data overnight request receiving unit 111 (S1201).
  • the document data acquisition unit 112 acquires the document data requested by the terminal device 120 from the data base 113 (S1202).
  • FIG. 16 shows an example of document data acquired by the document data acquisition unit 112 from the data base 113.
  • the document data shown in Fig. 16 is described in HTML.
  • symbols are used in character strings for the sake of simplicity of description, but actually, meaningful character strings are described.
  • the document data overnight dividing unit 114 divides the acquired document data (S1233).
  • the document data division unit 114 performs the division of the document data by dividing, for example, P tags 1601 a to l 601 c which are paragraph tags shown in FIG.
  • the document data overnight division unit 114 adds a missing tag so that each page of the divided document data conforms to the HTML grammar (S1204).
  • FIG. 17 shows an example in which the document data dividing unit 114 divides the document data shown in FIG.
  • the document data shown in FIG. 16 is divided into three pages 1400 to 1402.
  • the page 1400 contains the data of the P tag 1601a
  • page 1401 contains the data of the P tag 1601b
  • Pages as shown in 1408, 1409 1402 describes the data of the P tag 1601 c.
  • the document data dividing unit 114 sends the divided pages 1400 to 1402 to the document data feature extracting unit 1116. Then, the document data feature extraction unit 1115 confirms the data obtained by removing the tag from the content of the BODY tag of each page 1400 to 1402 (S1205).
  • each character is 2 bytes
  • page 1400 is a 44-byte character string
  • page 1401 is a 224-byte character string
  • page 1402 is a 116-byte character string. The character string of the amount of night is described.
  • the document data amount confirmation unit 1115 sends the divided pages and the data amount of each confirmed page 1400 to 1402 to the document data overnight feature extraction unit 1116 c.
  • the unit 1116 extracts a character string corresponding to the amount of data from the beginning of the data, excluding evening, from the content of the: BODY tag of each page as a feature of each page 1400 to 1402 (S1206). ).
  • the document data feature extraction unit 1116 calculates one-tenth of the data amount for each of the pages 1400 to 1402 from the beginning of the data obtained by removing the tag from the content of the BODY tag of each page 1400 to 1402.
  • a character string equivalent to the number of bytes obtained by rounding off the decimal part of the 4 is extracted as a feature of each page.
  • the features of pages 1400 to 1402 in Fig. 17 are the four-byte character string " ⁇ " 1
  • the document data overnight feature extracting unit 1116 sends the divided pages 1400 to 1402 and the extracted features 1501 to 1503 of each page to the document data overnight moving link adding unit 1117. Then, the document data movement link adding unit 1117 The link information to another page is added to each of the divided pages 140 to 1402 (S1207). At this time, the document data overnight movement link adding unit 1 16 transmits the document data between ⁇ A href> and ⁇ ZA>, which are link tags indicating links, as link information indicating a link to another page. Evening feature extraction unit 1 1 Adds features of other pages extracted by 1 6.
  • FIG. 18 shows an example in which link information is added to the page of 140 in FIG.
  • the document data 1800 shows a link to page 1401 in addition to the " ⁇ " 1501 which is a feature of page 1400.
  • Link tag 1 5
  • ⁇ 1502 is described.
  • link tag 1505, 1503, which is a feature of the page 1402, is described.
  • the document data movement link adding unit 111 sends the page to which the link information to another page is added to the document data transmitting unit 117. Then, the document data transmitting unit 1117 transmits the divided document data to the terminal device 120 (S128). In this case, the document data transmission unit 1 17
  • the terminal device 120 receives the document data 180 0 of the first page transmitted from the server device 110 by the document data receiving unit 123.
  • the document data overnight receiving unit 123 sends the received document data 180 to the document data overnight display unit 124. Then, the document data display section 124 analyzes the received document data 180 and displays it to the user.
  • FIG. 19 shows an example in which the document data 1800 shown in FIG. 18 is displayed on the document data display section 124 of the terminal device 120.
  • the page 1601 displayed in the document data overnight display section 124 includes, in addition to the part 1604 indicating the content of the user and the text 1605 indicating the characteristics of the user, Page 1 4 0 1 Text linked to 1 6 0 2 And text 1603 linked to page 1402.
  • the document data request transmission unit 122 sends a request to the server device 1110 for the other page. Submit the request.
  • the user selects the link 1602 to request a page.
  • the server device 1110 receives the request by the document data request receiving unit 111 (S 1201), and the document data source which is the source of the requested page is received by the document data receiving unit 112 on a data basis. Obtained from 113 (S1202).
  • the document data dividing unit 114 divides the document data acquired by the document data acquiring unit 112 (S1203).
  • the division is performed with the P tag as the heading tag as in the beginning, and the missing tags are added so that each divided page conforms to the HTML grammar (S1204).
  • Figure 17 shows an example of document data divided.
  • the document data overnight dividing unit 114 sends the divided pages 1400 to 1402 to the document data overnight amount checking unit 1115.
  • the document data amount checking unit 1115 checks the amount of data obtained by removing the tag from the contents of the BODY tags of each of the pages 1400 to 1402 (S1205).
  • the data size of page 1400 shown in Fig. 17 is 44 bytes
  • the data size of page 1401 is 224 bytes
  • the data size of page 1402 is 116 bytes.
  • the document data amount confirmation unit 1115 sends the divided pages and the data amount of each confirmed page to the document data feature extraction unit 1116.
  • the document data feature extraction unit 1116 extracts a character string corresponding to the data amount as a feature of each page from the beginning of the data excluding the tag from the content of the BODY tag of each page (S1206).
  • the document data overnight feature extraction unit 1116 determines each page from the top of the data obtained by removing the tag from the content of the BODY tag for each page 1400 to 1402. ⁇ Extract a character string equivalent to the number of bytes obtained by rounding off the decimal point of 1/10 of the data amount in 0 to 1402 as a feature of each page.
  • the feature of page 1400 to 1402 in Fig. 17 is " ⁇ ⁇ " 1501
  • the document data feature extraction unit 1 1 16 moves the divided pages 140 0 to 140 2 and the features 150 0 1 to 150 3 of each extracted page to the document data overnight. Send to link addition section 1 1 1 7 Then, the document data overnight movement link adding unit 1117 adds the features 1501 to 1503 of each page to each of the divided pages as link information indicating a link to another page. Yes (S122).
  • FIG. 20 shows an example in which a link is added to the page 401 of FIG.
  • the document data 20000 has the features of the page 1
  • a link tag 1704 indicating a link to page 1404 and a link tag 1705 indicating a link to page 1402 are described.
  • “ ⁇ " 1701, which is a feature of the page 1400 is described.
  • “1703”, which is a feature of the page 1402 is described.
  • Each page to which the link to the page is added is sent to the document data transmitting unit 117.
  • the document data transmitting unit 117 transmits the divided page requested from the terminal device 120 to the terminal device 1.
  • the terminal device 120 receives the document data 20000 of the divided page transmitted from the server device 110 by the document data receiver 1 23.
  • the document data overnight receiving section 123 sends the received page to the document data display section 124. Then, the document data display section 124 analyzes the received document data 2000 and displays it to the user.
  • FIG. 21A shows a display example in which the document data display section 124 displays the page shown in FIG.
  • the page 2 1 0 1 displayed in the document data overnight display section 1 2 4 includes Content 2 1 0 2, plus text 2 1 0 4 that identifies itself, plus text 2 1 0 3 and text linked to page 1 4 0 2 2 105 is displayed.
  • the description of the link information to other pages in each page of the divided document data can be changed according to the amount of data of the corresponding page.
  • the user who browses the document data can determine the data amount of each divided page from the description of the link information.
  • the length of a character string described as link information can be changed according to the data amount of a corresponding page.
  • the user can visually grasp the data amount of another page from the length of the character string of the link information.
  • the length of the character string described as the link information is changed according to the data amount of the corresponding page.
  • the font size of the character string described as the link information is changed.
  • the description may be changed in accordance with the data amount of the page to be written.
  • the document data display section 124 displays the font size of the link texts 210 to 210 in the corresponding page. It can be changed according to the amount of data. As a result, the user can recognize the data amount of the corresponding page by looking at the size of the text indicating the link.
  • the server device 110 sends information about the amount of data of the linked page to the terminal device 120, and the terminal device 120 sends text indicating the link according to the information about the data amount. May be changed.
  • the document data display section 1 2 4 is to change the color or shading of the link texts 2 11 1 to 2 11 3 according to the data amount of the corresponding page, as shown in page 2 11 10 shown in Figure 21 C. it can.
  • the user can recognize the amount of data on the corresponding page by looking at the color or shade of the text indicating the link.
  • the server device 110 sends information about the data amount of the linked page to the terminal device 120, and the terminal device 120 sends the link color according to the information about the data amount. Alternatively, the shading may be changed.
  • a character string indicating the content of the linked page is used as the text indicating the link. However, a character string indicating the content of the linked page may not be used as the text indicating the link.
  • the third embodiment of the present invention is different from the first embodiment in that a user who browses the document data by adding a document data division change link adding unit for adding link information specifying the size of the document data division is added to the first embodiment. Can change the size of the page division.
  • FIG. 22 is a block diagram illustrating a configuration of the document data processing system according to the third embodiment. The same parts as those already described are given the same reference numerals.
  • a server device 1910 and a terminal device 120 are connected to a network 130 such as the Internet.
  • the document data overnight processing system according to the third embodiment differs from the document data system according to the first embodiment in the configuration of the server device 1910.
  • the server device 1910 is provided with a document data division unit 1914 for dividing the requested document data.
  • the document data overnight division unit 191 4 The division is changed in accordance with further instructions.
  • the server device 1910 includes, in each page of the divided document data, a document data for adding link information for specifying the size of division when newly re-dividing the document data. Evening split change link adding section 19 17 is provided.
  • the terminal device 120 is the same as the terminal device of the first embodiment. Description is omitted.
  • the server device 1910 and the terminal device 120 are realized by a computer, the result is as shown in FIG.
  • the CPU 200 executes the programs stored in the memory 201, thereby realizing the functions of the document data division unit 1914 and the document data division change link addition unit 1917. ing.
  • the terminal device 120 using the convenience store is the same as that of the first embodiment, and therefore the description is omitted.
  • the document data processing system is configured such that the user designates an identifier such as a URL from the input unit 121 of the terminal device 120 so that the data base of the server device 1910 can be used. It requests document data written in a structure description language such as HTML stored in 13. On the other hand, the server device 1910 transmits the document data corresponding to the request from the terminal device 120 to the terminal device 120.
  • the server device 1910 receives a document data transmission request from the terminal device 120 by the document data request receiving unit 111 (S2001).
  • the document data request acquisition unit 112 acquires the document data requested by the terminal device 120 from the data source 113 (S2002).
  • FIG. 24 shows an example of the document data obtained from the database 113.
  • the document data 2400 shown in Fig. 24 is described in HTML.
  • symbols are used in character strings for the sake of simplicity of explanation, but actually, meaningful character strings Is described.
  • One character has a 2-byte data amount.
  • the document data dividing unit 1914 divides the acquired document data (S2003).
  • the document data dividing unit 1914 divides the document data by, for example, dividing the data obtained by removing the tag from the content of the BODY tag by a fixed number of bytes. Then, the document data dividing unit 1914 adds a missing tag so that each divided page conforms to the HTML grammar (S2004).
  • FIG. 25 shows an example of document data obtained by dividing the document data shown in FIG. 24 into 128 bytes under the above-described conditions.
  • the document data 2400 shown in FIG. 24 is divided into three pages 2200 to 2202.
  • page 2200 contains the first data 2203 obtained by dividing the part 2401 excluding the tag from the content of the BODY tag shown in FIG. 24 into 128 bytes, as shown at 2204 in the page.
  • Figure 1 shows the second data 2204 obtained by dividing the part 2401 excluding the tag from the content of the BODY tag shown in Fig. 24 into 128 bytes
  • the page 2203 contains the content of the BODY tag shown in Fig. 24 as shown in 2205 in the figure.
  • the third data 2205 obtained by dividing the part 2401 excluding the tag from the data into 128 bytes is described.
  • the document data dividing unit 1914 sends the divided pages 2200 to 2202 to the document data feature extracting unit 115. Then, the document data overnight feature extraction unit 115 extracts the features of each of the pages 2200 to 2202 (S2005).
  • the document data feature extraction unit 115 extracts the 8-byte character string from the beginning of the data obtained by removing the tag from the content of the BODY tag of each page 2200 to 2202 as the feature of each page 2200 to 2202
  • the feature of pages 2200-22 02 is that " ⁇ " 2301, 2302, " ⁇
  • the document data overnight feature extraction unit 115 converts the divided pages and the extracted features 2301 to 2303 of each of the pages 2200 to 2202 into a document data overnight moving link.
  • the document data movement link adding unit 116 adds link information indicating a link to another page to each of the divided pages 220 to 222. It culls (S206).
  • FIG. 26 shows an example in which link information is added to page 220 of FIG.
  • the document 2300 has a link to page 2201, A link tag 2304 indicating a link to the page 222 and a link tag 2305 indicating a link to the page 222 are described. Also, in the link tag 2304, "m
  • the document data movement link adding section 1 16 sends each page to which a link to another page has been added to the document data overnight division change link adding section 19 17. Then, the document data division change link adding unit 1917 adds, to each of the divided pages, link information designating the size of division when newly dividing the document data (S2007).
  • FIG. 27 shows an example of a document file in which link information 2401 and 2402 for specifying the size of division are added to the page shown in FIG.
  • link information 2401 and 2402 for specifying the size of division are added to the document data 2300 shown in FIG.
  • the link information 2401 there is a description 2403 indicating the size of the division and a description 2405 indicating "small division” indicating the content of the link information 2401. .
  • a description 2404 indicating the size of the division and a description 2406 indicating "enlarge the division” indicating the content of the link information 2402 are made.
  • the user can obtain the link information 2401 and It is possible to know what kind of division is made by 2402.
  • the document data overnight division change link adding section 1917 specifies the size of the division. Each page to which the link information is added is sent to the document data transmission section 117. Then, the document data transmitting section 1 17 transmits the first page of the divided document data to the terminal device 1 20 (S 2 0 8) o
  • the terminal device 120 receives the document data 230 of the divided first page transmitted from the server device 190 in the document data receiving unit 123.
  • the document data receiving unit 123 sends the received document data 230 to the document data display unit 124. Then, the document data overnight display section 124 analyzes the received document data 230 and displays it to the user.
  • FIG. 27 A display example of the page shown in FIG. 27 displayed on the document data display section 124 is shown in FIG.
  • the page 250 displayed on the document data overnight display section 124 includes a page 2505 indicating the content of the user and a text 2502 indicating the characteristics of the user. Text 2503 linked to 2221 and page 2503 linked to page 2022 are displayed. In addition, on page 250, text 2505 instructing to reduce the change in the division of the document data and text 2505 instructing to increase the change in the division of the document data are displayed. Have been.
  • the user requests a change in the size of the division by selecting the texts 2505 and 2506 indicating the link that specifies the size of the division from the input unit 122 of the terminal device 120. Then, the document data request transmission unit 122 transmits a request to change the size of the division to the server device 910.
  • the user has selected the text "Large division" 2505 and made a request to change the division size.
  • the server device 1910 receives the request in the document data overnight request receiving unit 111 (S201). Then, the document data acquisition unit 112 acquires the document data that is the source of the requested page from the database 113 (S201).
  • the document data overnight dividing unit 1914 divides the acquired document data overnight (S2003). The division is performed in the same way as at the beginning; the data obtained by removing the tag from the content of the BODY tag is divided into fixed bytes. In this case, the document data division unit 1914 divides the data by removing the tag from the content of the B ⁇ DY tag with a fixed number of bytes based on a request for changing the size of the division from the user. . Here, it is assumed that the fixed number of bytes is specified to be 200 bytes by a user's request to change the size of the division. C Then, the document data division unit 1914 divides the acquired document data every 200 bytes, and Add missing tags so that each divided page conforms to the HTML grammar (S 2004).
  • FIG. 29 shows an example of the document data obtained by dividing the document data shown in FIG. 24 into 200 bytes under the above-described conditions.
  • the document data 2400 shown in FIG. 24 is divided into two pages 2600 and 2601.
  • page 2600 has the first data 2602, which is the portion 2401 obtained by removing the tag from the contents of the B ⁇ DY tag shown in Fig. 24 divided into 200 bytes, as shown at 2403 in the figure.
  • the second data 2603 obtained by dividing the portion 2401 excluding the evening from the content of the B0DY tag shown in FIG. 24 into 200 bytes is described.
  • the document data dividing unit 1914 sends the divided pages 2600 and 2601 to the document data feature extracting unit 115.
  • the document data feature extraction unit 115 extracts features of each of the divided pages 2600 and 2601 (S2005). Also in this case, the document data feature extraction unit 115 extracts the 8-byte character string from the beginning of the data of the B0DY tag of each page 2600, 2601 excluding evening, as a feature of each page. For example, the features of the pages 2600 and 2601 in FIG. 26 are “ ⁇ ” 2701 and “XXX ⁇ ” 2702, respectively.
  • the document data feature extracting unit 115 sends the divided page and the extracted feature of each page to the document data moving link adding unit 1916.
  • the document link is added to the moving link adding unit 1916.
  • Add this feature 2701, 2702 to the link information to the page (S2006) cExample of adding link information to page 260 of Fig.29 in Fig.30 Is shown.
  • the document data 2700 shows a link to page 2601 in addition to " ⁇ " 2701, which is a feature of page 260.
  • a link tag 270 3 is described.
  • “XXX ⁇ ” 2702 which is a feature of the page 2601, is described.
  • the document data movement link adding unit 117 sends each page to which the link information to another page is added to the document data overnight change link adding unit 1917. Then, the document data division change link addition unit 1917 adds the link information designating the size of the division to each divided page in the same manner as the above-described processing (S2007).
  • Figure 31 shows the link 2801, which specifies the size of the division on the page shown in Figure 30.
  • Document data 280 00 with 280 2 added An example of document data 280 00 with 280 2 added is shown.
  • a link 2801, 2802 for specifying the size of division is added to the document data 270,000 shown in 30.
  • a description 2803 indicating the size of the division and a description “reduce the division” 2805 indicating the content of the link 2801 are made.
  • a description 2804 indicating the size of the division and a description “enlarge the division” 2806 indicating the content of the link 2802 are made.
  • the document data division change link addition section 1917 sends each page to which the link information designating the size of division is added to the document data transmission section 117. Then, the document data transmitting unit 117 transmits the first page of the newly divided document data to the terminal device 120 (S2008). On the other hand, the terminal device 120 receives the document data 280 0 of the divided first page transmitted from the server device 1.9 10 by the document data overnight receiving unit 123.
  • the document data overnight receiving section 123 sends the received document data 280 to the document data display section 124. Then, the document data display section 1 2 4 displays the received document data 2 800 is analyzed and displayed to the user.
  • FIG. 32 shows a display example in which the page shown in FIG. 31 is displayed on the document data display section 124.
  • the page 2900 displayed on the document data display section 124 includes a part 2901 indicating the content of the user and a text 2902 indicating the characteristic of the user. 0 1 Linked text 2 9 03 and page 2 6 0 2 Linked text 2 9 0 3 is displayed.
  • the page 290 00 includes a text 290 5 instructing to reduce the change in the division of the document data, and a text 290 6 instructing to increase the change in the division of the document data. Is displayed.
  • the user looks at the page 2900, and instructs text to display a desired page or text to perform a desired division, thereby acquiring a desired document data.
  • the content of the division method can be described in the division change link information instructing the change of the division. This allows a user who browses the document data to know the division method from the description of the division change link information. As a result, the user can appropriately perform the document division.
  • Embodiment 4 of the present invention relates to a device having a server function for storing and managing document data, dividing the document data, extracting features of the divided document data, and dividing the extracted features. And a device having a document data editing function for adding as link information to another page as soon as the document is generated.
  • FIG. 33 is a block diagram illustrating a configuration of the document data processing system according to the fourth embodiment. The same parts as those already described are given the same reference numerals.
  • relay device 310 In FIG. 33, relay device 310, server device 320, terminal device 120
  • the network is connected to a network 130, such as the Internet.
  • the relay device 310 is provided with a document data request receiving unit 3101, which receives the document data request transmitted from the terminal device 120.
  • the document data request receiving section 3101 transmits the received document data request to the document data overnight request transmitting section 3102 provided in the relay device 310. Then, the document data overnight request transmitting unit 3102 transfers the received document data request to the server device 32020.
  • the relay device 310 is provided with a document data receiving unit 310 13 for receiving the document data sent from the server device 320.
  • the document data receiving unit 310 sends the received document data to the document data dividing unit 114.
  • a document data dividing unit 114 In the relay device 310, a document data dividing unit 114, a document data feature extracting unit 115, a document data moving link adding unit 116, and a document data transmitting unit 117 are provided. Have been.
  • the document data dividing unit 114, the document data feature extracting unit 115, the document data moving link adding unit 116, and the document data transmitting unit 117 are described in detail in the first embodiment, and thus are described in detail. Omit the explanation.
  • the server device 320 is provided with a document data request receiving unit 3002 for receiving a document data request sent from the relay device 310 or the terminal device 120. ing.
  • the document data request receiving unit 3202 sends the received document data request to the document data obtaining unit 3002 provided in the server device 320.
  • the document data obtaining unit 302 obtains the document data corresponding to the received document data request from the data base 113, and obtains the document data provided in the server device 320. Evening transmitter Send to 3 0 2 4 Also, since the database 113 has already been described, the description is omitted.
  • the document data overnight transmission unit 304 transmits the document data transmitted from the document data acquisition unit 302 to the relay device 310 or the terminal device 120.
  • the terminal device 120 adopts the same configuration as that already described.
  • the terminal device 120 transmits a document data request to the relay device 310 according to a user operation, receives the requested document data, and displays the document data. Is possible.
  • FIG. 34 is a diagram showing a hardware configuration when the relay device 310 is realized by a computer.
  • the CPU 200 executes the document data dividing section 114, the document data extracting section 115, and the document data moving link adding section 116. Function. Also, the CPU 200 executes the program stored in the memory 201 and uses the network interface 202 so that the document data request receiving section 3101, the document data request transmitting section Function as 301, document data receiving section 310, and document data transmitting section 117.
  • the document data processing system is characterized in that the user designates an identifier such as a URL from the input unit 121 of the terminal device 120 so that the document is transmitted to the relay device 310. Make a request overnight. Then, the relay device 310 obtains the document data corresponding to the request sent from the terminal device 120 from the server device 320, performs predetermined processing on the document data, and performs a predetermined process on the document data. Send to 0.
  • an identifier such as a URL from the input unit 121 of the terminal device 120 so that the document is transmitted to the relay device 310. Make a request overnight. Then, the relay device 310 obtains the document data corresponding to the request sent from the terminal device 120 from the server device 320, performs predetermined processing on the document data, and performs a predetermined process on the document data. Send to 0.
  • FIG. 35 is a flowchart of the operation of the relay device 310
  • FIG. 36 is a flowchart of the operation of the server device 320.
  • the relay device 310 0 receives the document data request sent from the terminal device 120 by the document data request receiving unit 310 1 (S 3 201) and receives it.
  • the request is transferred to the server device 320 by the document data request transmission section 310 (S322).
  • the server device 320 0 receives the document data overnight request transmitted from the relay device 310 by the document data overnight request receiving unit 3002 (S3301).
  • the document data acquisition unit 3 0 2 2 stores the requested document data in a data base 1 1 Obtained from 3 (S3302).
  • FIG. 7 shows an example of document data acquired by the document data acquisition unit 302 from the database 302.
  • the document data acquisition section 302 sends the acquired document data to the document data transmission section 304.
  • the document data overnight transmission unit 304 transmits the document data to the relay device 310 (S330).
  • the relay device 310 receives the document data transmitted from the server device 320 by the document data receiving unit 310 (S320), and receives the document data.
  • the document data received by the unit 301 is sent to the document data dividing unit 114.
  • the document data dividing section 114 divides the document data (S320).
  • the document data division unit 114 divides the document data in the same manner as in the first embodiment, for example, by separating the H1 tag which is a heading tag.
  • the document data division unit 114 adds a missing tag to each page so that each divided page conforms to the grammar of HTML (S325).
  • Fig. 8 shows an example of dividing the document data shown in Fig. 7.
  • the document data division unit 114 sends each of the divided pages to the document data feature extraction unit 115.
  • the document data feature extracting unit 115 extracts the feature of each of the divided pages (S320). For example, when the content of the H1 tag, which is the heading tag, is extracted as the feature of each page, the features of each page 500 to 502 in FIG. 8 are “land”, “climate”, and “population”, respectively. Become.
  • the document data overnight feature extracting unit 115 sends the divided pages and the extracted features of each page to the document data moving link adding unit 116. Then, the document data moving link adding section 1 16 adds link information to another page to each of the divided pages (S3207).
  • FIG. 9 shows an example in which link information is added to page 500 of FIG.
  • the document data transfer link adding unit 116 sends each page to which link information to another page is added to the document data transmitting unit 117. Then, the document data transmission unit 1 17 transmits the first page of the divided document data to the terminal device 120. Yes (S3208).
  • the terminal device 120 receives the divided page transmitted from the relay device 310 by the document data overnight receiving unit 123.
  • the document data receiving section 123 sends the received page to the document data display section 124.
  • the document data display section 124 analyzes the received page and displays it to the user.
  • FIG. 11 shows a display example in which the page shown in FIG. 9 is displayed on the document data display section 124.
  • the document data request transmitting unit 122 Sends a request for another page to the relay device 310.
  • the relay device 310 1 receives the request by the document data request receiving unit 310 1 (S 3 201), and receives the received request by the document data request transmitting unit 3 0 1 2 to the server device.
  • the data is transferred to 320 (S3202).
  • the server apparatus 320 receives the request transmitted from the relay apparatus 310 by the document data request receiving section 3002 (S3301), and obtains the document data obtaining section 3002.
  • the document data for which the request is made is acquired from the data base 113 (S3302).
  • the document data acquisition section 302 sends the acquired document data to the document data transmission section 304, and the document data transmission section 302 transmits the document data to the relay device 300.
  • the data is transmitted to 010 (S3303).
  • the relay device 310 receives the document data transmitted from the server device 320 by the document data receiving unit 310 (S320), and divides the received document data into document data. It is divided by the section 114 (S320).
  • the document data division unit 114 performs the division of the document data in the same manner as described above, with the H1 tag as a heading tag as a delimiter. Then, the document data division unit 114 adds a missing tag so that each of the divided pages conforms to the HTML grammar (S325).
  • Figure 8 shows an example of divided document data.
  • the document data division unit 114 sends each of the divided pages to the document data feature extraction unit 115. Then, the document data overnight feature extraction unit 115 extracts the features of each page (S320).
  • the document data feature extraction unit 115 extracts the feature of each page as the feature of each page, as in the above-described method, the content of the H1 tag, which is a heading tag.
  • the feature of each page 500-502 in Fig. 8 is "land”, “climate”, and "population”.
  • the document data feature extracting unit 115 sends the divided pages and the extracted features of each page to the document data overnight movement link adding unit 116. Then, the document data moving link adding unit 116 adds link information to other pages to each of the divided pages (S3207).
  • FIG. 12 shows an example in which link information S is added to page 501 of FIG.
  • the document data overnight movement link adding unit 116 sends each page to which the link information to another page is added to the document data transmitting unit 117. Then, the document data overnight transmission unit 117 transmits the divided page requested from the terminal device 120 to the terminal device 120 (S3208).
  • the terminal device 120 receives the divided page transmitted from the relay device 310 by the document data receiving unit 123.
  • the document data receiving unit 123 sends the received page to the document data display unit 124, and the page received by the document data display unit 124 is displayed to the user.
  • FIG. 13 shows a display example in which the page shown in FIG. 12 is displayed on the document data overnight display section 124.
  • the server device 320 having a server function of storing and managing the document data, the document data is divided, and the features of the divided document data are obtained.
  • the relay device 3101 which has a document data overnight editing function of extracting and adding the extracted features to the divided document data as link information to another page, can be separated.
  • the fifth embodiment of the present invention divides input document data, extracts features of the divided document data, and adds the extracted features to the divided document data as link information to other pages.
  • the present invention relates to a document data processing device for producing and outputting a document.
  • FIG. 37 is a block diagram of the document data processing device according to the fifth embodiment. The same parts as those already described are given the same reference numerals.
  • the document data processing device 3400 is provided with a document data input unit 3401 that receives an input of document data sent from another device.
  • the document data input unit 3401 sends the input document data to the document data division unit 114 provided in the document data processing device.
  • the document data processing device 3400 is provided with a document data dividing section 114, a document data overnight feature extracting section 115, and a document data overnight moving link adding section 116. Since the document data overnight division unit 114, the document data feature extraction unit 115, and the document data movement link addition unit 116 have already been described in the first embodiment, detailed descriptions thereof will be omitted.
  • the document data processing device 3400 is provided with a document data output unit 3405 which outputs the document data output from the document data movement link adding unit 116 to another device. ing.
  • FIG. 38 is a diagram showing a hardware configuration when the document data processing device 3400 is realized by a computer.
  • the CPU 2000 executes the program stored in the memory 201, and thereby the document data dividing unit 114, the document data extracting unit 115, and the document data moving link adding unit 111 Perform 6 functions. Also, the CPU 2000 executes the program stored in the memory 201 and uses the input / output interface 3501, so that the document data input unit 3401 and the document data output unit can be used. Functions as 3405.
  • the operation of the document data processing device 3400 according to the fifth embodiment will be described with reference to the flowchart in FIG. FIG. 39 is a flowchart of the operation of the document data processing device 3400.
  • the document data processing device 3400 accepts the input of the document data by the document data input unit 3401 sent from another device (S3601).
  • FIG. 7 shows an example of the document data that the document data input unit 3401 has received the input.
  • the document data input section 340 1 sends the input document data to the document data overnight division section 114.
  • the document data division unit 114 divides the input document data (S3662).
  • the document data division unit 114 divides the document data using, for example, the H1 tag, which is a heading tag, and adds missing tags so that each divided page conforms to the HTML grammar. (S3663).
  • FIG. 8 shows an example of dividing the document data shown in FIG.
  • the divided data division unit 114 sends each of the divided pages to the document data overnight feature extraction unit 115.
  • the document data overnight feature extraction unit 115 extracts the features of each page (S3664). For example, if the contents of the heading H1 group are extracted as the features of each page, the features of each page 500-502 in Fig. 8 are "land", “climate”, “Population”.
  • the document data overnight feature extraction unit 115 sends the divided pages and the extracted features of each page to the document data overnight movement link adding unit 116. Then, the document data moving link adding section 1 16 adds link information to other pages to each of the divided pages (S3655).
  • FIG. 9 shows an example in which link information is added to page 500 of FIG.
  • FIG. 10 illustrates the relationship between the requested document data and each divided page.
  • the document data transfer link adding unit 116 sends each page to which link information to another page is added to the document data output unit 340. Then, the document data output unit outputs the first page of the divided document data to another device (S366). As described above, according to the fifth embodiment, the document data sent from another device is divided, the features of the divided document data are extracted, and the extracted document data is divided. Can be added as link information to other pages and output to other devices.
  • FIG. 40 is a block diagram illustrating a configuration of the document data processing system according to the sixth embodiment. The same parts as those already described are given the same reference numerals.
  • the server device 110 and the terminal device 3720 are connected to a network 130 such as the Internet.
  • the configuration of the server device 110 is the same as that of the first embodiment, and the description is omitted.
  • the terminal device 3720 is realized using a general-purpose machine such as a personal computer.
  • the terminal device 372 0 is provided with an input unit 122 and a document data request transmission unit 122.
  • the terminal device 372 0 is provided with a document data receiving unit 372 3 for receiving the document data sent from the server device 110.
  • the document data receiving section 372 3 sends the received document data to the cache section 372 4 and the document data analyzing section 372 5 provided in the terminal device 370.
  • the cache unit 3724 is storage means for storing received document data.
  • the document data analysis section 3725 analyzes the received document data and obtains link information of the document data. Then, the document data analysis unit 3 7 2 5 terminates the analysis result. It is sent to the document data overnight display section 3 7 2 7 and the cache confirmation section 3 7 2 6 provided in the terminal device 3 720.
  • the cache checking unit 372 6 checks whether the document data corresponding to the link information obtained by the document data analyzing unit 372 5 exists in the cache unit 372 4. Then, the cache confirmation unit 372 6 sends the confirmation result to the document data overnight display unit 372 7 1 ⁇ 3 ⁇ ⁇ .
  • FIG. 41 is a diagram showing a hardware configuration when the terminal device 372 0 is realized by a computer.
  • the CPU 210 executes a program stored in the memory 211 and uses the network interface 215 and the input / output interface 213.
  • the functions of the document data request transmitting unit 122, the document data receiving unit 372, the document data corner analyzing unit 372, and the cache checking unit 372, 6 are realized.
  • the function of the document data display section 3727 is realized by the CPU 210 executing the program stored in the memory 211 and using the display section 214.
  • the document data request transmitting unit 122 transmits the input request to the server device 110 (S3901).
  • the server device 110 receives the request sent from the terminal device 372 0 by the document data request receiving unit 111, and the document data obtaining unit 112 requests the document.
  • the document data overnight division unit 114 divides the document data overnight acquired.
  • the document data feature extraction unit 115 extracts features of each page of the divided document data.
  • the document data transfer link adding unit 117 adds the extracted features of the other pages to each of the divided pages as link information, and sends the link information to the document data transmitting unit 117.
  • the document data transmitting unit 117 sends the document data with the link information added thereto to the terminal device 370.
  • FIG. 43 shows an example of the document data transmitted by the document data transmission section 117.
  • the document data 4300 contains link tags 4301a and 4301b, which are link information indicating links to other pages.
  • link tags 4301 a and 4301b “climate” 4302a and “population” 4302b, which are features of other pages, are described.
  • the terminal device 370 20 receives the document data transmitted from the server device 110 by the document data receiving unit 372 3 (S3902).
  • the document data receiving unit 3723 sends the received document data to the cache unit 3724, stores it in association with the document data identifier (S3903), and stores the document data. Send it to the analysis unit 3 7 2 5.
  • the document data analysis section 3725 analyzes the sent document data (S 3904) and determines whether there is a link to other document data within the document data. (S3905) o
  • the document data analysis unit 3725 determines in S3905 that there is link information to another document data within the document data, the linked document data The document data identifier is sent to the cache confirmation unit 3 7 2 6.
  • the cache checking unit 37262 checks whether the document data corresponding to the transmitted identifier exists in the cache unit 3724 (S3906, S390). 7).
  • the document data display section 372 7 generates link information according to the document data sent from the document data analysis section 372 and the confirmation result sent from the cache confirmation section 372 6.
  • the character string indicating the content of the other page being described is displayed in large size (S3109) o
  • the document data overnight display section 372 7 is linked according to the result of the document data transmitted from the document data analysis section 3 725 and the confirmation result transmitted from the cache confirmation section 372 6.
  • a character string indicating the content of the other page described in the information is displayed in a normal size (S3910).
  • FIG. 44 shows a page in which the page shown in FIG. 43 is displayed on the document data display section 37 27 of the terminal device 3720.
  • the page 4 10 2 displayed on the document data display section 3 7 2 7 includes a part 4 10 4 indicating its own content, a text 4 10 ⁇ ⁇ ⁇ ⁇
  • the linked texts 4100 and 4101 are displayed. As can be seen, the text 4100 is displayed larger than the text 4101 displayed in normal size.
  • the document data linked to the text 4100 exists in the cache section 3724, and the document data linked to the text 4101 does not exist in the cache section 3724. It indicates that.
  • the description mode of the link information to the page existing in the cache section 3724 is changed. be able to.
  • the user who browses the document data can determine from the difference in the description form of the link information whether or not another linked page exists in the cache section 372 4.
  • the user can select and display another page stored in the cache unit 3724. Therefore, the user can easily view the document data.
  • the text indicating a link to a page existing in cache unit 3724 can be made larger than the text indicating a link to a page not existing in cache unit 3724. Accordingly, the user can visually recognize the page existing in the cache unit 3724 from the text indicating the link.
  • the text indicating the link to the page existing in the cache unit 3724 is larger than the text indicating the link to the page not existing in the cache unit 3724. May be longer than the text indicating a link to a page that does not exist in the cache unit 3724. Further, the color or shade of the text indicating the link to the page existing in the cache section 3724 may be changed. Further, text indicating a link to a page existing in the cache unit 3724 may be shaded.
  • the text that indicates the content of the linked page is used as the text indicating the link in the sixth embodiment, the text that indicates the content of the linked page may not be used as the text indicating the link. good.
  • the document data which has not been divided into the database 113 is stored, and the document data is divided by the document data dividing unit 114.
  • a configuration may be used in which the document data divided into a predetermined size is stored in the memory 113 in advance.
  • the server device or the relay device when a user requests a server device or a relay device to perform a document de-emission from a terminal device having limited resources such as a mobile phone, the server device or the relay device requests the document.
  • the data is divided, and a feature such as a headline extracted from another page can be added to each divided page as text indicating a link of another page while changing the feature according to the data amount of each page.
  • the user can determine the necessity of moving to another page based on the information on the amount of data of another linked page.
  • the server device or the relay device when a user requests a server device or a relay device to perform a document de-emission from a terminal device having limited resources such as a mobile phone, the server device or the relay device requests the document.
  • the data can be split and a link can be added to each split page to specify the size of the split.
  • the user can specify the size of the division, and an advantageous result that the browsing of the document data by the user is comfortable can be obtained.
  • the terminal device acquires the document data from the server device or the relay device
  • the acquired document data is stored in the cache and linked to the acquired document data. It is possible to confirm whether or not the document data exists in the cache, and if other document data exists in the cache, change the display of the text indicating the link to the other document data.
  • the user browses the linked document data, it is possible to know from the text 1 indicating the link whether or not it is necessary to acquire the document data from the server device or the relay device. As a result, an advantageous result that the user can comfortably browse the document data can be obtained.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

明 細 書 文書データ処理装置、 サーバ装置、 端末装置、 及び文書データ処理システム
技術分野
本発明は、構造記述言語で言 3述された文書データを処理するための文書デー 夕処理装置、 サーバ装置、 端末装置及び文書デ一夕処理システムに関する。 背景技術
近年、 インタ一ネットの普及とあいまって、 WWW (Wo r 1 d Wide Web) による HTML (HyperText Markup L angua ge)等の構造記述言語によって記述されたコンテンヅ (文書、 画像及び音声 などのマルチメディアデ一夕) の流通が急速に進んでいる。
HTMLは、 W3 C (Wo r 1 d Wide Web Consort iu m) が標準ィ匕を行っており、 HTML4. 01の規格に関しては、 W3Cの W WWページ内の ht t p: //www. w3. or g/TR/ht ml 401 /に記述されている。
次に、 HTMLの記述について図 1を用いて説明する。 図 1は、 HTMLの 記述例を示す図である。
図 1に示すように、 HTMLは、 HEADタグ、 TITLEタグ、 HTML タグ、 および B〇 D Y夕グなどを定義することによつて文書の構造化が行える c また、 HTMLは、 図中 4201に示すように、 <A HREF>で示される ハイパーテキストリンクタグ (HYPERTEXT LINK TAG) (以 下、単にリンクタグと呼ぶ)を用いて、他の HTMLファイル、画像ファイル、 または音声ファイルにリンクを張るハイパーテキストを実現できることに特 徴がある Q
また、 WWWは、 HTMLで記述されたコンテンヅ (文書、 画像及び音声な どのマルチメディアデータ) を格納しているサーバと、 サーバに格納されてい るマルチメディアデ一夕の取得を要求するクライアントが共にネットワーク で接続されたシステムに対応する仕組みである。 そして、 WWWは、 このシス テムにおいて、 クライアントからサーバへのデ一夕要求の送信と、 サーバから クライアントへの要求に応じたデータの送信とを、 HTTP (HyperTe x t Transport P r o t o c o 1 ) の下で行う仕組みである。 な お、 HTTPの規格に関しては、 RFC2616に記載されている。
また、 サーバ、 クライアント共にワークステーションあるいはパソコンなど の、汎用コンピュータによって実現される。 また、 サ一バとなるコンピュータ上 では HTTPのサーバプログラムが実行されている。 一方、 クライアントとな るコンピュータ上では HTTPを用いて通信を行い、 HTMLを解釈してデ一 夕の表示を行う HTMLブラゥザプログラムが実行されている。
次に、 WWWの動作について、 図 2を用いて説明する。 図 2は、 WWWを実 現するシステムのブロック図である。
まず、 ユーザはクライアント 4320の入力部 4321より所望する HTM Lコンテンヅの URL (Unif orm Res ource Locat or s) を指定することで、 HTMLコンテンヅを要求する。 URLは、 ネットヮ —ク上のリソースの識別子に関する規格であり、 RFC 1738に記載されて いる。
入力部 4321から入力された要求は、 データ要求送信部 4322によりネ ヅトワーク 4330を通じてサーバ 4310に送信される。
サーバ 4310は、 文書データ要求受信部 4311において、 クライアント 4320から送られてきた要求を受信する。 次に、 サーバ 4310は、 デ一夕 取得部 4312において、 要求されている HTMLコンテンヅをデータベース 4313より取得する。 そして、 データ取得部 4312は、 取得した HTML コンテンヅをデータ送信部 4314に送る。 文書データ送信部 4314は、 受 け取った HTMLコンテンヅをネヅトワーク 4330経由でクライアント 4 320に送信する。
クライアント 4320は、 データ受信部 4323において、 要求した HTM Lコンテンツを受信する。 そして、 クライアント 4320は、 データ表示部 4
324において、 受信した HTMLコンテンツを表示する。
例えば、 クライアント 4320が図 1に示した HTMLコンテンヅを受信し たとすると、 デ一夕表示部 4324はく BODY>42 18とく ZBODY>
4220で囲まれた「こんにちは」 という文字列 42 1 9を表示するべき内容 として解釈する。 そして、 データ表示部 4324は、 「こんにちは」 という文 字列 421 9を表示する。 また、 デ一夕表示部 4324は、 図中 420 1で示 される <A HRE とく 〉で囲まれた 「2」 という文字をリンク付け されたテキストとして解釈する。 そして、 デ一夕表示部 4324は、 「2」 と いう文字を表示する。 データ表示部 4324が、 図 1の HTMLコンテンヅ を解釈して表示した例を図 3に示す。
また、 WWWの普及と共に携帯電話や PHSなどによるモバイルコンピュー ティング環境の普及も急速に進んでいる。
そのような背景の元、 携帯電話という、 資源が限られた装置に対する情報提 供サ一ビスとして、 NTTドコモが運営する 「iモード」や KDD Iが運営す る 「EZweb」や J— PHONEが運営する 「J— SKY ウェブ」 などが 出現している。
「iモード」、 「EZweb」及び「J— SKY ウェブ」に関する情報は、 それぞれ、 h t t p: / / www. nt t do c omo. c o . j p/ 1/ ι n d e x . html、 h t t p / / www. a u · k d d i . c o . j / e z w e / index, h t m 1、 h t t p : // www. j— phone — e a s t , c o m/ p― an d― s/ s ds/ j s k y w e / s t art . htmから入手可能である。
しかし、 そのようなサービスにおいて、 サーバから情報提供サービスを享受 する携帯端末装置は、 情報の表示可能サイズや解像度などに制限がある。 よつ て、 携帯端末装置は、 情報の取得や情報の表示に制限が生じる。 そのため、 サ —バは、 1つのコンテンツを複数のコンテンヅに分割し、 分割したコンテンツ と共に分割したコンテンツ間を関連つけるリンクを携帯端末装置のユーザに 提供するようにしている。 現在、 このような、 コンテンヅ提供手法がいくつか 考案されている。
例えば、 特開平 1 0— 1 4 3 4 9 8号公報には、 H T M Lを用いて記述され た文書デ一夕をページ単位に分割し、 分割した各ページに他のページへのリン クを示す情報 (以下、 リンク情報という) に他のページのページ番号を付加す る手法が記載されている。
また、 特開平 1 1— 1 7 5 4 2 6号公報には、 オリジナルのコンテンヅを複 数のページに分割し、 分割した各ページに他のページへのリンク情報として前 後のページ及び先頭のページと最後尾のぺ一ジを付加する手法が記載されて いる。 また、 この公報には、 ユーザが表示したいページ番号を入力するための 入力欄を表示画面に設けたり、 あるいはスクロールバーを表示しスクロールバ 一によつて表示するページの変更を実現したりする手法が記載されている。 さらに、 特開 2 0 0 0— 7 6 4 7 3号公幸 gには、 文書データをセクション単 位にページ分割し、 分割した各ページの見出しだけを集めたィンデックスぺ一 ジを生成し、 ユーザがィンデックスページに記述された見出しから所望の見出 しを選択することで所望する内容のページを表示する手法が記載されている。 しかしながら、 特開平 1 0— 1 4 3 4 9 8号公報及び特開平 1 1— 1 7 5 4 2 6号公報に記載の手法では、 リンク情報に他のページの内容に関する情報が ない。 このため、 ユーザが所望する内容のページをリンク情報から選択するの は困難であるという課題がある。
また、 特開 2 0 0 0— 7 6 4 7 3号公報に記載された手法では、 セクション 毎に分割されたページの見出しによって各ページの内容に関する情報は得ら れる。 しかし、 ユーザが他のページを表示するためには、 一旦インデックスぺ ージを表示する必要があり、 操作が煩雑になるという課題がある。 さらに、 上述したいずれに手法においても、 リンク情報に対応するリンク先 のページのデータ量に関する情報が欠如している。 よって、 ユーザがあるぺー ジを表示しょうとした際に そのページのデ一夕量がリンク情報からわからず、 そのページがユーザの端末の能力に適合したデ一夕量のものかわからない。 こ のため、ユーザが、あるページが表示するのに適切であるか判断できないので、 表示するのに適切なページを選択するのが困難であるという課題がある。 発明の開示
本発明の目的は、 文書データが分割されている場合であっても、 ユーザが文 書データの閲覧を容易にできるようにすることである。
本発明では、 上記の課題を解決するために、 分割した文書デ一夕の各ページ に、 他のページへのリンクを示すリンク情報に、 他のページの見出し、 他のぺ 一ジにおける先頭の語句、 あるいは他のぺージを代表する語句を付与するよう にした。
これにより、 文書デ一夕を閲覧するユーザは、 各ページに付与されたリンク 情報である他のページの見出し、 先頭の語句、 あるいは他のページを代表する 語句から、 他のページの内容を容易に把握できる。 この結果、 ユーザは、 現在 閲覧しているページから他のページの情報を把握できるので、 容易に他のぺー ジの内容を得ることができる。よって、文書データが分割されていたとしても、 ユーザは分割された文書データの閲覧を容易にできる。
また、 本発明では、 分割された文書データの各ページに付与されたリンク情 報の語句の長さ、 文字の色、 あるいは文字の大きさなどを、 リンク情報に対応 する他のページのデータ量に応じて変化させる。
これにより、 文書デ一夕を閲覧するユーザが、 リンク情報の語句の長さ、 文 字の色、 あるいは文字の大きさなどから分割された各ページのデータ量を判断 できる。 これにより、 ユーザが、 あるページが表示するのに適切であるか判断 でき、 表示するのが適切なページを選択するのが可能になる。 この結果、 ユー ザは文書データを容易に閲覧することができる。
また、 本発明では、 文書デ一夕の提供を受ける端末装置に文書デ一夕を格納 するキャッシュを設け、 分割された他のぺ一ジがキヤッシュに存在する場合に キャッシュに存在する他のページへのリンク情報の語句の長さ、 文字の色、 あ るいは文字の大きさなどを変化させる。
これにより、 文書データを閲覧するユーザは、 リンク情報の語句の長さ、 文 字の色、 あるいは文字の大きさなどから、 リンクされている他のページがキヤ ヅシュに存在するかどうか判断できる。 この結果、 ユーザがキャッシュに蓄積 されている他のページを選択して表示させることができる。 この結果、 ュ一ザ は、 文書データを容易に閲覧できる。
図面の簡単な説明
図 1は、 H T M Lの記述例を示す図であり、
図 2は、 WWWを実現するシステムのプロック図であり、
図 3は、 図 1に示した H T M L文書の表示例を示す図であり、
図 4は、 本発明の実施の形態 1にかかる文書データ処理システムの構成を示 すブロック図であり、
図 5は、 実施の形態 1にかかるサーバ装置および端末装置のハードウエア構 成図であり、
図 6は、 実施の形態 1の文書データ処理システムの動作を示すフローチヤ一 トであり、
図 7は、 H T M Lの記述例を示す図であり、
図 8は、 図 7に示した H T M L文書を分割した例を示す図であり、 図 9は、 実施の形態 1にかかる分割した他のページへのリンクを付加した例 を示す図であり、 図 1 0は、 元の H T ML文書と分割された H T ML文書の関係を示す図であ り、 図 11は、 図 9に示した HTML文書の表示例を示す図であり、
図 12は、 実施の形態 1にかかる分割した他のページへのリンクを付加した 例を示す図であり、
図 13は、 図 12に示した HTML文書の端末装置側の表示例を示す図であ り、
図 14は、 本発明の実施の形態 2にかかる文書デ一夕処理システムの構成を 示すプロック図であり、
図 15は、 実施の形態 2のサーバ装置の動作を示すフローチャートであり、 図 16は、 HTMLの記述例を示す図であり、
図 17は、 図 16に示した HTML文書を分割した例を示す図であり、 図 18は、 実施の形態 2にかかる分割した他のページへのリンクを付加した 例を示す図であり、
図 19は、 図 18に示した HTML文書の表示例を示す図であり、
図 20は、 実施の形態 2にかかる分割した他のページへのリンクを付加した 例を示す図であり
図 21Aは、 図 20に示した HTML文書の表示例を示す図であり、 図 21Bは、 図 20に示した HTML文書のその他の表示例を示す図であり、 図 21Cは、 図 20に示した HTML文書のその他の表示例を示す図であり、 図 22は、 本発明の実施の形態 3にかかるシステムの構成を示すプロック図 であり、
図 23は、 実施の形態 3のサーバ装置の動作を示すフローチャートであり、 図 24は、 HTMLの記述例を示す図であり、
図 25は、 図 24に示した HTML文書を分割した例を示す図であり、 図 26は、 実施の形態 3にかかる分割した他のページへのリンクを付加した 例を示す図であり、
図 27は、 図 26に示した HTML文書に分割の大きさを指定するリンクを 付加した例を示す図であり、
図 28は、 図 27に示した HTML文書の表示例を示す図であり、 図 2 9は、 図 2 4に示した H T M L文書を分割した例を示す図であり、 図 3 0は、 実施の形態 3にかかる分割した他のページへのリンクを付加した 例を示す図であり、
図 3 1は、 図 3 0に示した H T ML文書に分割の大きさを指定するリンクを 付加した例を示す図であり、
図 3 2は、 図 3 1に示した H T M L文書の表示例を示す図であり、 図 3 3は、 本発明の実施の形態 4にかかるシステムの構成を示すブロック図 を示す図であり、
図 3 4は、 実施の形態 4にかかるシステムのハードウェア構成を示すブロヅ ク図であり、
図 3 5は、 実施の形態 4の中継装置の動作を示すフローチャートであり、 図 3 6は、 実施の形態 4のサーバ装置の動作を示すフローチャートであり、 図 3 7は、 本発明の実施の形態 5にかかるシステムの構成を示すブロック図 であり、
図 3 8は、 実施の形態 5にかかるシステムのハ一ドウェア構成を示すプロヅ ク図であり、
図 3 9は、 実施の形態 5の文書データ処理装置の動作を示すフローチャート であり、
図 4 0は、 本発明の実施の形態 6にかかるシステムの構成を示すブロック図 を示す図であり、
図 4 1は、 実施の形態 6にかかるシステムのハードウェア構成を示すブロヅ ク図であり、
図 4 2は、 実施の形態 6の端末装置の動作を示すフローチャートであり、 図 4 3は、 H T M Lの記述例を示す図であり、
そして、 図 4 4は、 図 4 3に示した H T M L文書の表示例を示す図である。
発明を実施するための最良の形態 以下、 本発明の実施の形態について、 添付図面を用いて説明する。
(実施の形態 1 )
本発明の実施の形態 1について、 添付図面を参照して説明する。 - まず、 本発明の実施の形態 1にかかる文書データ処理システムの構成につい て図 4を用いて説明する。 図 4は、 実施の形態 1にかかる文書データ処理シス テムの構成を示すプロック図である。 同図において、 データ処理装置であるサ ーバ装置 1 1 0、 端末装置 1 2 0は、 ィン夕一ネットなどのネットワーク 1 3 0に接続されている。
サーバ装置 1 1 0には、 文書デ一夕を管理、 保存するデータベース 1 1 3が 設けられている。 データベース 1 1 3に格納された文書データは、 例えば H y p e r T e x t M a r k u p L a n g u a g e、 即ち、 H T M Lなどの構 造記述言語で記述された文書デ一夕である。
また、 サーバ装置 1 1 0には、 端末装置 1 2 0から送られてきた、 文書デ一 夕の送信要求を受信する文書データ要求受信部 1 1 1が設けられている。文書 データ要求受信部 1 1 1は、 受信した要求を、 サ一バ装置 1 1 0に設けられた 文書データ取得部 1 1 2に送る。
文書デ一夕取得部 1 1 2は、 受信した要求に従ってデータベース 1 1 3より 文書デ—夕を取得し、 サーバ装置 1 1 0に設けられた文書データ分割部 1 1 4 に送る。
文書データ分割部 1 1 4は、 文書データ取得部 1 1 2から送られてきた文書 データを分割し、 サーバ装置 1 1 0に設けられた文書データ特徴抽出部 1 1 5 に送る。
文書データ特徴抽出部 1 1 5は、 分割された文書データの各ページの特徴を 抽出し、 分割された文書デ一夕と共にサーバ装置 1 1 0に設けられた文書デ一 夕移動リンク付加部 1 1 6に送る。
文書デ一夕移動リンク付加部 1 1 6は、 分割された文書デ一夕の各ページに 他のページへのリンクを示すリンク情報を付加し、 サーバ装置 1 1 0に設けら れた文書データ送信部 1 1 7に送る。 文書データ移動リンク付加部 1 1 6が、 分割された文書デ一夕の各ページに付加するリンク情報は、 文書データ特徴抽 出部 1 1 5が抽出した各ページの特徴である。
文書デ一夕送信部 1 1 7は、 分割された文書データの各ページにリンク情報 が付与された文書データを、 ネットヮ一ク 1 3 0を介して端末装置 1 2 0に送 信する。
一方、 端末装置 1 2 0は、 ユーザ端末であり、 例えばパーソナルコンビユー 夕等の汎用マシンを用いて実現される。
端末装置 1 2 0には、ユーザからの入力を受け付ける入力部 1 2 1が設けら れている。 入力部 1 2 1は、 ユーザからの入力を、 端末装置 1 2 0に設けられ た文書データ要求送信部 1 2 2に送る。
文書データ要求送信部 1 2 2は、 入力部 1 2 1から送られてきた入力情報に 対応した文書データの要求を、 ネットワーク 1 3 0を介してサーバ装置 1 1 0 に送信する。
また、 端末装置 1 2 0には、 サーバ装置 1 1 0に対して要求した文書データ を受信する文書データ受信部 1 2 3が設けられている。文書データ受信部 1 2 3は、 画像表示手段である文書データ表示部 1 2 4に送る。
文書デ一夕表示部 1 2 4は、 ブラウザとしての機能を有し、 受信した文書デ —夕を解析し表示できる形態に変換し、 画面に表示する。
図 5は、 サーバ装置 1 1 0及び端末装置 1 2 0をコンピュータにより実現し た場合のハードゥエァ構成を示す図である。
サーバ装置 1 1 0をコンピュータで実現した場合、 C P U 2 0 0がメモリ 2 0 1に格納されたプログラムを実行することにより、 文書デ一夕分割部 1 1 4、 文書データ特徴抽出部 1 1 5、 および文書デ一夕移動リンク付加部 1 1 6の機 能をする。 また、 C P U 2 0 0がメモリ 2 0 1に格納されたプログラムを実行 し、 ネットワークインターフェース 2 0 2を使用することで、 文書デ一夕要求 受信部 1 1 1および文書データ送信部 1 1 7としての機能をする。 また、 C P U200がメモリ 201に格納されたプログラムを実行し、 入出力イン夕一フ エース 203を使用することで、 文書デ一夕取得部 112としての機能をする ( メモリ 20 :U±ROM、 RAM等の幾つかの記憶媒体で構成されており、 プ ログラムは ROMに記憶される。 RAMは CPU 200がプログラムの記述に 基づいた処理を実行する際の作業エリアとなる。
同様に、 コンピュータを用いた端末装置 120は、 CPU 210がメモリ 2 11に格納され プログラムを実行し、 ネットワークインターフェース 2 15 及び入出力イン夕一フェース 213を使用することで、 文書データ要求送信部 122および文書デ一夕受信部 123の機能を実現する。 また、 CPU 2 10 がメモリ 21 1に格納されたプログラムを実行し表示部 2 14を使用するこ とで、 文書デ一夕表示部 124の機能を実現する。 また、 メモリ 211は RO M、 RAM等の幾つかの記憶媒体で構成されており、 プログラムは ROMに記 憶される。 RAMは CPU 210がプログラムの記述に基づいた処理を実行す る際の作業エリアとなる。
実施の形態 1にかかる文書デ一夕処理システムは、ュ一ザが端末装置 120 の入力部 12 1から例えば Un i f 0 rm Re s our c e Lo c a t o r s、 即ち、 URL等の識別子を指示することにより、 サーバ装置 1 10の デ—夕ぺ―ス 1 13に格納された例えば H yp Θ r T ex t Markup Language, 即ち、 H TML等の構造記述言語で記述された文書データ を要求するものである。 そして、 これに対し、 サーバ装置 1 10が端末装置 1
20からの要求に対応した文書デ一夕を、 端末装置 120に送信するものであ る。
以下、 実施の形態 1にかかる文書デ一夕処理システムの動作について図 6の フローチャートを用いて説明する。
まず、 端末装置 120は、 ユーザが要求する文書データの情報を入力部 12 1から入力し(S 301)、入力された要求をサーバ装置 110に送信する(S
302) 。 そして、 端末装置 120は、 サーバ装置 110から送られてくる文 書デ一夕が受信するのを待つ (S 3 0 3 ) 。
これに対し、 サーバ装置 1 1 0は、 文書データ要求受信部 1 1 1において、 端末装置 1 2 0から送られてきた文書データの送信要求を受信する (S 3 0 4 ) 。 次に、 文書データ取得部 1 1 2が、 端末装置 1 2 0が要求する文書デー 夕をデ一夕べ一ス 1 1 3から取得する (S 3 0 5 ) 。
文書データ取得部 1 1 2がデータベース 1 1 3から取得した文書データの 例を図 7に示す。図 7に示す文書データ 4 0 0は、 H T M Lで記述されている。 次に、 文書デ一夕分割部 1 1 4が、 文書データ取得部 1 1 2が取得した文書 データを分割する (S 3 0 6 ) 。 文書データ分割部 1 1 4は、 文書データの分 割を、 例えば図 7に示す見出しタグである H 1タグ 4 0 1 a〜4 0 1 cを区切 りにして行う。 そして、 文書データ分割部 1 1 4ほ、 分割された文書デ一夕の 各ページが H T M Lの文法に合うように、 不足しているタグを付加する (S 3 0 7 ) 。 文書データ分割部 1 1 4が、 図 7に示す文書デ一夕を分割した例を図 8に示す。
図 8に示すように、 図 7に示す文書データ 4 0 0は 3つのページ 5 0 0〜 5 0 2に分割される。ページ 5 0 0には H 1タグ 4 0 1 aから H 1タグ 4 0 1 b の間のデータが、 ページ 5 0 1には H 1タグ 4 0 1 bから H 1夕グ 4 0 1 cの 間のデータが、 ページ 5 0 2には H 1タグ 4 0 1 c以降のデータが記述されて いる。
次に、 文書データ分割部 1 1 4は、 分割した各ページ 5 0 0〜 5 0 2を、 文 書デ一夕特徴抽出部 1 1 5に送る。 そして、 文書データ特徴抽出部 1 1 5は、 各ページ 5 0 0〜 5 0 2の特徴を抽出する ( S 3 0 8 ) 。 実施の形態 1では、 各ページ 5 0 0〜5 0 2の特徴として、 各ページ 5 0 0〜5 0 2の見出しを採 用する。 具体的には、 各ページ 5 0 0〜5 0 2の特徴として、 く H 1 >〜</ H I >の間に記述されたテキストを採用する。
例えば、 文書デ一夕特徴抽出部 1 1 5が、 見出しタグである H I夕グ 4 0 1 a〜4 0 1 cの内容を各ページの特徴として抽出すると、 図 8の各ページ 5 0 0〜5 0 2の特徴は、 それぞれ図中 8 0 1 a〜8 0 1 cに示す "国土"、 "気 候"、 "人口" となる。
次に、 文書デ一夕特徴抽出部 1 1 5は、 分割された各ページ 5 0 0〜 5 0 2 と文書データ特徴抽出部 1 1 5によって抽出された各ページの特徴 8 0 1 a 〜8 0 1 cを、 文書デ一夕移動リンク付加部 1 1 6に送る。 そして、 文書デ一 夕移動リンク付加部 1 1 6は、 分割された各ページ 5 0 0〜5 0 2に他のベー ジへのリンクを示すリンク情報を付加する (S 3 0 9 ) 。 このとき、 文書デ一 夕移動リンク付加部 1 1 6は、 他のページへのリンク情報として、 リンクを示 すリンクタグである < A h r e f >〜<ZA >の閭に、 他のページの特徴 8 0 1を付加する。
図 9に、 図 8のページ 5 0 0に他のページへのリンク情報を付加した文書デ 一夕の例を示す。 図 9からわかるように、 文書デ一夕 9 0 0には、 ページ 5 0 1へのリンクを示すリンクタグ 9 0 1 aと、 ページ 5 0 2へのリンクを示すリ ンクタグ 9 0 1 bが記述されている。 また、 リンク夕グ 9 0 1 aの中には、 ぺ —ジ 5 0 1の特徴である"気候" 8 0 1 bがリンク情報として記述されている。 また、 リンクタグ 9 0 l bの中には、 ページ 5 0 2の特徴である "人口" 8 0 1 cがリンク情報として記述されている。
また、 図 1 0に要求された文書データと分割された各ページとの関係を図示 する。 1 0 0 1で記される文書デ一夕は図 7の文書デ一夕 4 0 0に対応するも のであり、 1 0 0 2で記される文書デ一夕は図 8のページ 5 0 0に対応するも のであり、 1 0 0 3で記される文書デ一夕は図 8のページ 5 0 1に対応するも のであり、 1 0 0 4で記される文書データは図 8のページ 5 0 2に対応するも のである。 文書デ一夕 1 0 0 2には、 自身の特徴を示すテキスト 1 0 0 4 aに 加えて、 リンク情報として文書データ 1 0 0 3ヘリンク付けされたテキスト 1 0 0 4 bおよび文書デ一夕 1 0 0 4ヘリンク付けされたテキスト 1 0 0 4 c が記述されている。 また、 文書デ一夕 1 0 0 3には、 自身の特徴を示すテキス ト 1 0 0 5 bに加えて、 リンク情報として文書デ一夕 1 0 0 2へリンク付けさ れたテキスト 1 0 0 5 aおよび文書データ 1 0 0 4ヘリンク付けされたテキ スト 1 0 0 5 cが記述されている。 また、 文書データ 1 0 0 4には、 自身の特 徴を示すテキスト 1 0 0 6 cに加えて、 リンク情報として文書データ 1 0 0 2 ヘリンク付けされたテキスト 1 0 0 6 aおよび文書データ 1 0 0 3へリンク 付けされたテキスト 1 0 0 6 bが記述されている。
次に、 文書デ一夕移動リンク付加部 1 1 6は、 他のページへのリンクが付加 された各ページを、 文書データ送信部 1 1 7に順次送る。 まず、 文書データ送 信部 1 1 7は、 分割された文書データの先頭のページにリンク情報を付加した 文書データ 9 0 0を端末装置 1 2 0に送信する ( S 3 1 0 ) 。
これに対し、 端末装置 1 2 0は、 文書データ受信部 1 2 3において、 サーバ 装置 1 1 0から送信された分割されたページを受信する(S 3 1 1 )。そして、 文書データ受信部 1 2 3が、 受信したページを文書デ一夕表示部 1 2 4に送る c そして、 文書デ一夕表示部 1 2 4は、 送られてきた H T M Lで記述されたぺー ジを解析し、 画面に表示する (S 3 1 2 ) 。 このように、 ユーザが要求した文 書デ一夕の先頭ページを表示する。
例えば、 端末装置 1 2 0の文書デ一夕表示部 1 2 4は、 図 9に示すページを 図 1 1に示すように表示する。文書データ表示部 1 2 4に表示されるページ 1 0 0 0には、 自身の内容を示す部分 1 0 0 1と、 自身の特徴を示すテキスト 1 0 0 2 aに加えて、 ページ 5 0 1へリンク付けされたテキスト 1 0 0 2 bおよ びページ 5 0 2ヘリンク付けされたテキスト 1 0 0 2 cが表示されている。 次に、 ユーザが他のページの閲覧を希望し、 ュ一ザが端末装置 1 2 0の入力 部 1 2 1より他のページへのリンク情報を選択することによって他のページ の表示を要求すると (S 3 1 3 ) 、 文書データ要求送信部 1 2 2がサーバ装置 1 1 0に対して他のぺ一ジの要求を送信する (S 3 0 2 ) o
ここでは、 ユーザがリンク情報として "気候" 1 0 0 2 bというページ 5 0 1に対するリンクを示すテキストを選択して、 他のページの要求を行った場合 のサーバ装置 1 1 0の動作について説明する。 サーバ装置 1 1 0は、 その要求を文書デ一夕要求受信部 1 1 1によって受信 し (S 3 0 4 )、 文書デ一夕取得部 1 1 2が、 要求されているページの元とな つている文書データをデ一夕ペース 1 1 3より取得する (S 3 0 5 ) o
次に、 文書データ分割部 1 1 4が、 取得した文書デ一夕を分割する (S 3 0 6 ) 。 分割は、 始めと同様に見出しタグである H 1タグを区切りにして行い、 分割された各ページが H T M Lの文法に合うように不足している夕グを付加 する (S 3 0 7 ) 。 図 8に文書デ一夕を分割した例を示す。
次に、 文書データ分割部 1 1 4は、 分割したページ 5 0 0〜5 0 2を文書デ —夕特徴抽出部 1 1 5に送る。 そして、 文書データ特徴抽出部 1 1 5は、 ぺ一 ジ 5 0 0〜5 0 2の特徴を抽出する (S 3 0 8 ) 。 ここでも、 文書デ一夕特徴 抽出部 1 1 5は、 見出しタグである H 1タグ 4 0 1 a~ 4 0 1 cの内容を各ぺ —ジ 5 0 0〜5 0 2の特徴として抽出する。 具体的には、 各ページ 5 0 0〜5 0 2の特徴は、それそれ図中の 8 0 1 a〜8 0 1 cに示す"国土"、 "気候"、 "人口" となる。
次に、 文書デ一夕特徴抽出部 1 1 5は、 分割された各ページと抽出した各ぺ ージ 5 0 0〜 5 0 2の特徴 8 0 1 a〜8 0 1 cを、 文書デ一夕移動リンク付加 部 1 1 6に送る。 そして文書デ一夕移動リンク付加部 1 1 6は、 分割された各 ページに他のページへのリンクを付加する (S 3 0 9 ) 。
図 1 2に、 図 5の 5 0 1のページにリンク 9 0 1〜 9 0 2を付加した文書 1 2 0 0を示す。 図 1 2からわかるように、 文書データ 1 2 0 0には、 ページ 5 0 0へのリンクを示すリンクタグ 1 2 0 1 aと、 ページ 5 0 2へのリンクを示 すリンク夕グ 1 2 0 l bが Ϊ3述されている。 また、 リンクタグ 1 2 0 1 aの中 には、 リンク情報として、 ページ 5 0 0の特徴である "国土" 1 2 0 2が記述 されている。 また、 リンクタグ 1 2 0 1 bの中には、 ページ 5 0 2の特徴であ る "人口" 8 0 1 cが記述されている。
次に、 文書デ一夕移動リンク付加部 1 1 6は、 他のページへのリンク情報を 付加した文書デ一夕 1 2 0 0を、 文書デ一夕送信部 1 1 7に送る。 そして、 文 書デ一夕送信部 1 1 7は、 端末装置 1 2 0から要求された分割されたページを、 端末装置 1 2 0に送信する ( S 3 1 0 ) 。
端末装置 1 2 0は、 文書データ受信部 1 2 3において、 サーバ装置 1 1 0か ら送信された分割されたページを受信する (S 3 1 1 ) 。
文書データ受信部 1 2 3は、 受信したページを文書データ表示部 1 2 4に送 り、文書デ一夕表示部 1 2 4はユーザが要求したページを表示する(S 3 1 2 ) c 文書データ表示部 1 2 4が、 図 1 2に示したページを表示した図を図 1 3に 示す。文書データ表示部 1 2 4に表示されるページ 1 3 0 0には、 自身の内容 を示す部分 1 3 0 1と、 自身の特徴を示すテキスト 1 3 0 2 bに加えて、 リン ク情報としてページ 5 0 0ヘリンク付けされたテキスト 1 3 0 2 aおよびぺ —ジ 5 0 2へリンク付けされたテキスト 1 3 0 2 cが記述される。
また、端末装置 1 2 0は、ユーザが他のページへのリンクを示す "人口 "や" 国土 "を選択した場合であっても、 S 3 1 0〜S 3 1 3の処理を繰り返すこと により、 他のページを同様に表示することができる。
以上説明したように実施の形態 1によれば、 分割した文書データの各ページ に他のページへのリンク情報として他のぺージの内容を示す情報を記述でき る。 これにより、 文書デ一夕を閲覧するユーザは各ページに付与されたリンク 情報から、 他のページの内容を容易に把握できる。 また、 ユーザは、 現在閲覧 しているページから他のページの情報を把握できるので、 容易に他のページの 内容を得ることができる。 よって、 文書データが分割されていたとしても、 ュ —ザは分割された文書デ一夕の閲覧を容易にできる。
また、 実施の形態 1によれば、 リンク情報に採用する他のページの内容を示 す情報として、 他のページの見出しを用いることができる。 見出しは、 各ぺー ジの特徴を現す情報であるので、 リンク情報が他のページの内容を正確に現す ようになる。 この結果、 ユーザが他のページの内容を正確に把握できる。
なお、 実施の形態 1では、 リンク情報に採用する他のページの内容を示す情 報として、 他のページの見出しを使用したが、 他のページにおける実体の先頭 の語句を使用しても良い。 この場合は、 実体を示すタグであるく b o d y >〜 </b o (1 >の間に記述されたテキストの先頭の語句を抽出すれば良い。 また、 リンク情幸艮として、 く b o d y >〜く/ b o d y >の間に記述された テキストの先頭から所定数の文字を抽出する形態であってもよい。
また、 実施の形態 1では、 リンク情報に採用する他のページの内容を示す情 報として、 他のページの見出しを使用したが、 他のページにおける内容のキ一 ワードを使用しても良い。 この場合は、 実体を示すタグであるく b 0 d y >〜 </b o (1 >の間に記述されたテキストに含まれる語句の中から最も使用 されている語句を内容のキ一ワードとして使用する。 内容のキーワードは、 各 ページの特徴を最も良く現す語句である可能性が高いので、 リンク情報が他の ページの内容を正確に現すようになる。
なお、 実施の形態 1では、 文書データを記述する言語として H T M Lを使用 したが、 他のページへのリンク情報を記述できる言語であればいかなる言語で あっても良い。
(実施の形態 2 )
本発明の実施の形態 2は、 ユーザがリンク先のページのデータ量を把握でき るようにするために、 リンク情報の記述を対応ページのデータ量に応じて変え るようにしたものである。
以下、 実施の形態 2にかかる文書データ処理システムについて添付図面を用 いて詳細に説明する。 まず、 実施の形態 2にかかる文書デ一夕処理システムの 構成について図 1 4を用いて説明する。 図 1 4は、 実施の形態 2にかかる文書 データ処理システムの構成を示すプロック図である。
同図において、 サーバ装置 1 1 1 0、 端末装置 1 2 0は、 インターネットな どのネヅトワーク 1 3 0に接続されている。特に、 実施の形態 2の文書デ一夕 処理システムは、 サーバ装置 1 1 1 0の構成が実施の形態 1の文書データシス テムと異なる。
具体的には、 サーバ装置 1 1 1 0は、 分割した各べ一ジデ一夕量に応じた数 の文字列を各ページの特徴としてタグ以外のデ一夕の先頭から抽出し、 この特 徴をリンク情報として使用するようにしたものである。 これにより、 文書デー 夕を閲覧するユーザが、 分割されたページのデ一夕量をリンク情報から把握で き、 どのページを表示するか選択することができるというものである。
以下、 サーバ装置 1 1 1 0の構成について説明する。 なお、 既に説明した文 と同一の部分には同一の符番を付与する。
サーバ装置 1 1 1 0には、 文書デ一夕分割部 1 1 4が分割した文書デ一夕の 各ページのデ一夕量を確認する文書データ量確認部 1 1 1 5が設けられてい る。文書デ一夕量確認部 1 1 1 5は、 確認した各ページのデータ量をサーバ装 置 1 1 1 0に設けられた文書デ一夕特徴抽出部 1 1 1 6に出力する。
文書デ一夕特徴抽出部 1 1 1 6は、 分割された文書データの各ページの特徴 を抽出し、 分割された文書デ一夕と共にサーバ装置 1 1 1 0に設けられた文書 データ移動リンク付加部 1 1 1 7に送る。 文書データ特徴抽出部 1 1 1 6は、 各ページのデータ量に応じて、 特徴として抽出する文字列の長さを変える。 具 体的には、文書データ特徴抽出部 1 1 1 6は、各ページのデ一夕量が多いほど、 特徴として抽出する文字列の長さを長くする。
文書データ移動リンク付加部 1 1 1 7は、 分割した各ページに他のページへ のリンク情報を付加する。文書データ移動リンク付加部 1 1 1 7が、 分割され た文書データの各ページに付加するリンク情報は、 文書デ一夕特徴抽出部 1 1 1 6が抽出した各ページの特徴である。
端末装置 1 2 0は、 実施の形態 1の端末装置と同じであるので。説明を省略 する。
また、 サ一バ装置 1 1 1 0および端末装置 1 2 0をコンピュータで実現する と、 図 5に示すようになる。 C P U 2 0 0が、 メモリ 2 0 1に格納されたプロ グラムを実行することにより、 文書データ分割部 1 1 4、 文書データ量確認部 1 1 1 5、 文書デ~夕特徴抽出部 1 1 1 6、 および文書データ移動リンク付加 部 1 1 1 7の機能を実現している。 なお、 同様にコンピュータを用いた端末装 置 120については、 実施の形態 1と同じなので説明を省略する。
実施の形態 2にかかる文書データ処理システムは、 ユーザが端末装置 120 の入力部 121から例えば URL等の識別子を指示することにより、 サーバ装 置 1 1 1 0のデ一夕べ一ス 1 13に格納された HTML等の構造記述言語で 記述された文書デ一夕を要求するものである。 そして、 これに対し、 サーバ装 置 1 1 10が端末装置 120からの要求に対応した文書デ一夕を、 端末装置 1 20に送信するものである。
以下、 実施の形態 2にかかる文書データ処理システムの動作について図 1 5 のフローチャートを用いて説明する。
まず、 サーバ装置 1 1 10は、 文書デ一夕要求受信部 1 1 1において、 端末 装置 120から送られてきた文書データの送信要求を受信する(S 120 1)。 次に、 文書デ一夕取得部 1 12が、 端末装置 120が要求する文書データをデ 一夕ベース 1 1 3から取得する (S 1202) 。
文書デ一夕取得部 1 12がデータペース 1 1 3より取得した文書データの 例を図 1 6に示す。 図 1 6に示す文書デ一夕は、 HTMLで記述されている。 なお、 図 1 6では、 説明の簡略ィ匕のため文字列に記号を使っているが、 実際に は意味のある文字列が記述されている。
次に、 文書デ一夕分割部 1 14が、 取得した文書データを分割する (S 12 03) 。 文書データ分割部 1 14は、 文書デ一夕の分割を、 例えば図 16に示 す段落タグである Pタグ 160 1 a〜l 601 cを区切りにして行う。 そして、 文書デ一夕分割部 1 14は、 分割された文書データの各ページが HTMLの文 法に合うように不足しているタグを付加する (S 1204) 。 文書デ一夕分割 部 1 14が、 図 16に示した文書データを分割した例を図 17に示す。
図 17に示すように、 図 1 6に示す文書データは 3つのページ 1400~1 402に分割される。 図中 1403に示すようにページ 1400には Pタグ 1 60 1 aのデ一夕が、 図中 1404〜 1407に示すようにページ 1401に は Pタグ 1 60 1 bのデ一夕が、 図中 1408、 1409に示すようにページ 1402には Pタグ 1601 cのデータが記述されている。
次に、文書データ分割部 114は、分割した各ページ 1400〜 1402を、 文書デ一夕特徴抽出部 1116に送る。 そして、 文書データ特徴抽出部 111 5が、 各ページ 1400〜 1402の BODYタグの内容からタグを除いたデ —夕量を確認する (S 1205) o
例えば、 図 17に示した各ページ 1400〜1402の中で、 1403、 1
404、 1405、 1406、 1407、 1408、 1409が、 S 1205 において、 文書デ一夕特徴抽出部 1116がデータ量を確認する条件に合致す る部分である。 この例では、 1文字を 2バイトとし、 ページ 1400には 44 バイト分のデ一夕量の文字列、 ページ 1401には 224バイト分のデ一夕量 の文字列、 ページ 1402には 116バイト分のデ一夕量の文字列が言己述され ている。
次に、 文書データ量確認部 1115は、 分割された各ページと確認した各べ ージ 1400〜1402のデータ量を、 文書デ一夕特徴抽出部 1116に送る c そして、 文書デ一夕特徴抽出部 1116は、 各ページの: BODYタグの内容か ら夕グを除いたデ一夕の先頭から、 デ一夕量に応じた文字列を各ページ 140 0〜1402の特徴として抽出する (S 1206 ) 。
具体的には、 文書データ特徴抽出部 1116は、 各ページ 1400〜 140 2の BODYタグの内容からタグを除いたデータの先頭から、 各ページ 140 0〜 1402におけるデ一夕量の 10分の 1の小数点以下を 4捨 5入したバ ィト数に相当する文字列を各ページの特徴として抽出する。例えば、 図 17の ページ 1400〜 1402の特徴は、 それそれ 4バイト分の文字列 "〇〇" 1
501、 22バイト分の文字列 1502、 "12 バイト分の文字列 1503となる。
次に、 文書デ一夕特徴抽出部 1116は、 分割された各ページ 1400〜 1 402と抽出した各ページの特徴 1501〜 1503を文書デ一夕移動リン ク付加部 1117に送る。 そして、 文書データ移動リンク付加部 1117は、 分割された各ページ 1 4 0 0〜 1 4 0 2に他のページへのリンク情報を付加 する (S 1 2 0 7 ) 。 このとき、 文書デ一夕移動リンク付加部 1 1 6は、 他の ページへのリンクを示すリンク情報として、 リンクを示すリンクタグである < A h r e f >〜<ZA >の間に、 文書デ一夕特徴抽出部 1 1 1 6が抽出した 他のページの特徴を付与する。
図 1 8に、 図 1 7の 1 4 0 0のページにリンク情報を付加した例を示す。 図 1 8からわかるように、 文書デ一夕 1 8 0 0には、 ページ 1 4 0 0の特徴であ る "〇〇" 1 5 0 1に加え、 ページ 1 4 0 1へのリンクを示すリンクタグ 1 5
0 4と、 ページ 1 4 0 2へのリンクを示すリンクタグ 1 5 0 5が記述されてい る。 また、 リンクタグ 1 5 0 4の中には、 ページ 1 4 0 1の特徴である "□□
□ 1 5 0 2が記述されている。 また、 リンクタグ 1 5 0 5 の中には、 ページ 1 4 0 2の特徴である 1 5 0 3が記述され ている。
次に、 文書データ移動リンク付加部 1 1 1 7は、 他のページへのリンク情報 が付加されたページを文書データ送信部 1 1 7に送る。 そして、 文書デ一夕送 信部 1 1 7は分割された文書データを端末装置 1 2 0に送信する (S 1 2 0 8 ) 。 この場合は、 文書デ一夕送信部 1 1 7は、 分割された先頭の文書デ一夕
1 8 0 0を端末装置 1 2 0に送信する。
一方、 端末装置 1 2 0は、 サーバ装置 1 1 1 0から送信された先頭のページ の文書データ 1 8 0 0を、 文書データ受信部 1 2 3により受信する。
文書デ一夕受信部 1 2 3は、 受信した文書データ 1 8 0 0を文書デ一夕表示 部 1 2 4に送る。 そして、 文書デ一夕表示部 1 2 4は、 受信した文書デ一夕 1 8 0 0を解析し、 ユーザに対して表示する。
図 1 9に、 図 1 8に示した文書データ 1 8 0 0を端末装置 1 2 0の文書デー 夕表示部 1 2 4で表示した例を示す。文書デ一夕表示部 1 2 4に表示されるべ ージ 1 6 0 1には、 自身の内容を示す部分 1 6 0 4と、 自身の特徴を示すテキ スト 1 6 0 5に加えて、 ページ 1 4 0 1ヘリンク付けされたテキスト 1 6 0 2 およびページ 1402ヘリンク付けされたテキスト 1603が表示されてい る。
次に、 ユーザが端末装置 120の入力部 121より他のページへのリンクを 選択することによって他のページの表示を要求すると、 文書データ要求送信部 122はサーバ装置 1110に対して他のページの要求を送信する。 ここでは ュ一ザが というリンク 1602を選択してページ の要求を行ったとする。
サーバ装置 1110は、 その要求を文書データ要求受信部 111により受信 し (S 1201)、 要求されているページの元となっている文書デ一夕を文書 デ一夕取得部 112によりデ一夕ベース 113より取得する (S 1202) 。
次に、 文書データ分割部 114が、 文書データ取得部 112が取得した文書 デ一夕を分割する (S 1203)。 分割は、 始めと同様に見出しタグである P 夕グを区切りにして行い、 分割された各ページが H TMLの文法に合うように 不足しているタグを付加する (S 1204)。 図 17に文書データを分割した 例を示す。
次に、 文書デ一夕分割部 114は、 分割した各ページ 1400〜 1402を 文書デ一夕量確認部 1115に送る。 文書データ量確認部 1115は、 各べ一 ジ 1400〜 1402の B ODYタグの内容からタグを除いたデ一夕量を確 認する (S 1205) 。 図 17に示したページ 1400のデータ量は 44バイ ト、 ページ 1401のデ一夕量は 224バイト、 ページ 1402のデ一夕量は 116バイトとなる。
次に、 文書データ量確認部 1115は、 分割された各ページと確認した各べ 一ジのデ一夕量を、 文書データ特徴抽出部 1116に送る。 文書データ特徴抽 出部 1116は、 データ量に応じた文字列を各ページの特徴として、 各ページ の BODYタグの内容からタグを除いたデータの先頭から抽出する (S 120 6)。 ここでも、 文書デ一夕特徴抽出部 1116は、 各ページ 1400〜14 02の BODYタグの内容からタグを除いたデータの先頭から、各ページ 14 ◦ 0〜 1 4 0 2におけるデ一夕量の 1 0分の 1の小数点以下を 4捨 5入した バイト数に相当する文字列を各ページの特徴として抽出する。 図 1 7のページ 1 4 0 0〜 1 4 0 2の特徴は、 それそれ "〇〇" 1 5 0 1、
□ 1 5 0 2、 "◊◊◊◊◊◊,, 1 5 0 3となる。
次に、 文書データ特徴抽出部 1 1 1 6は、 分割された各ページ 1 4 0 0〜 1 4 0 2と抽出した各ページの特徴 1 5 0 1〜1 5 0 3を文書デ一夕移動リン ク付加部 1 1 1 7に送る。 そして、 文書デ一夕移動リンク付加部 1 1 1 7は、 分割された各ページに他のページへのリンクを示すリンク情報として、 各ぺー ジの特徴 1 5 0 1〜 1 5 0 3を付加する ( S 1 2 0 7 ) 。
図 2 0に、 図 1 7の 1 4 0 1のページにリンクを付加した例を示す。 図 2 0 からわかるように、文書デ一夕 2 0 0 0には、ページ 1 4 0 1の特徴である"□
□ 1 7 0 2に加え、 ページ 1 4 0 0へのリンクを示すリ ンクタグ 1 7 0 4と、 ページ 1 4 0 2へのリンクを示すリンクタグ 1 7 0 5が 言 3述されている。 また、 リンクタグ 1 7 0 4の中には、 ページ 1 4 0 0の特徴 である "〇〇" 1 7 0 1が記述されている。 また、 リンクタグ 1 7 0 5の中に は、ページ 1 4 0 2の特徴である" 1 7 0 3が記述されている。 次に、 文書データ移動リンク付加部 1 1 1 7は、 他のページへのリンクが付 加された各ページを文書データ送信部 1 1 7に送る。 そして、 文書データ送信 部 1 1 7は端末装置 1 2 0から要求された分割されたページを、端末装置 1 2 0に送信する (S 1 2 0 8 ) o
端末装置 1 2 0は、 サーバ装置 1 1 1 0から送信された分割されたページの 文書デ一夕 2 0 0 0を、 文書デ一夕受信部 1 2 3により受信する。
文書デ一夕受信部 1 2 3は、 受信したページを文書データ表示部 1 2 4に送 る。 そして、 文書データ表示部 1 2 4は、 受信した文書データ 2 0 0 0を解析 し、 ユーザに対して表示する。
図 2 1 Aに、 図 2 0に示したページを文書データ表示部 1 2 4が表示した表 示例を示す。 文書デ一夕表示部 1 2 4に表示されるページ 2 1 0 1には、 自身 の内容を示す部分 2 1 0 2と、 自身の特徴を示すテキスト 2 1 0 4に加えて、 ページ 1 4 0 0ヘリンク付けされたテキスト 2 1 0 3およびページ 1 4 0 2 ヘリンク付けされたテキスト 2 1 0 5が表示されている。
以上説明したように実施の形態 2によれば、 分割した文書データの各ページ に他のページへのリンク情報の記述を、 対応するページのデ一夕量に応じて変 えることができる。 これにより、 文書データを閲覧するユーザが、 リンク情報 の記述から分割された各ページのデータ量を判断できる。この結果、ユーザが、 あるページが表示するのに適切であるか判断でき、 表示するのが適切なページ を選択するのが可能になる。 この結果、 ユーザは文書デ一夕を容易に閲覧する ことができる。
また、 実施の形態 2によれば、 リンク情報として記述する文字列の長さを対 応するページのデータ量に応じて変化させるようにできる。 これにより、 ユー ザはリンク情報の文字列の長さから、 視覚的に他のページのデータ量を把握で さる。
なお、 実施の形態 2では、 リンク情報として記述する文字列の長さを対応す るページのデータ量に応じて変化させるようにしたが、 リンク情報として記述 する文字列のフォントの大きさを対応するページのデータ量に応じて変化さ せるような記述をしても良い。 これにより、 文書データ表示部 1 2 4には、 図 2 1 Bに示すページ 2 1 0 6ように、 リンクを示すテキスト 2 1 0 7〜 2 1 0 9のフォントの大きさを対応するページのデータ量に応じて変化させるよう にできる。 この結果、 ユーザがリンクを示すテキストの大きさを見ることで、 対応するページのデータ量を認識できる。
なお、 サーバ装置 1 1 1 0から端末装置 1 2 0にリンク先のページのデ一夕 量に関する情報を送信し、 端末装置 1 2 0側でこのデータ量に関する情報に応 じてリンクを示すテキストの表示サイズを変えるようにしても良い。
また、 リンク情報として記述する文字列の色や濃淡をページのデータ量に応 じて変化させるような記述をしても良い。 これにより、 文書データ表示部 1 2 4には、 図 2 1 Cに示すページ 2 1 1 0ように、 リンクを示すテキスト 2 1 1 1〜2 1 1 3の色もしくは濃淡を対応するページのデータ量に応じて変化さ せるようにできる。 この結果、 ユーザがリンクを示すテキストの色もしくは濃 淡を見ることで、 対応するページのデ一夕量を認識できる。
なお、 サーバ装置 1 1 1 0から端末装置 1 2 0にリンク先のページのデータ 量に関する情報を送信し、 端末装置 1 2 0側でこのデータ量に関する情報に応 じてリンクを示すテキストの色もしくは濃淡を変えるようにしても良い。 なお、 実施の形態 2では、 リンクを示すテキストとしてリンク先のページの 内容を示す文字列を用いたが、 リンクを示すテキストとしてリンク先のページ の内容を示す文字列を用いなくても良い。
(実施の形態 3 )
本発明の実施の形態 3は、 実施の形態 1に文書デ一夕の分割の大きさを指定 するリンク情報を付加する文書データ分割変更リンク付加部を付加し、 文書デ 一夕を閲覧するユーザがページの分割の大きさを変えることができるように したものである。
以下、 実施の形態 3にかかる文書データ処理システムについて説明する。 ま ず、 実施の形態 3にかかる文書デ一夕処理システムの構成について図 2 2を用 いて説明する。 図 2 2は、 実施の形態 3にかかる文書データ処理システムの構 成を示すプロック図である。 なお、 既に説明した部分と同一の部分には同一の 符番を付与する。
図 2 2において、 サーバ装置 1 9 1 0、 端末装置 1 2 0は、 インターネヅト などのネヅトワーク 1 3 0に接続されている。実施の形態 3の文書デ一夕処理 システムは、 サーバ装置 1 9 1 0の構成が実施の形態 1の文書データシステム と異なる。
以下、 サーバ装置 1 9 1 0の構成について説明する。 サーバ装置 1 9 1 0に は、 要求された文書データを分割する文書デ一夕分割部 1 9 1 4が設けられて いる。文書デ一夕分割部 1 9 1 4は、 端末装置 1 2 0から送られてくる分割変 更の指示に応じて分割の変更も行う。
また、 サーバ装置 1 9 1 0には、 分割された文書デ一夕の各ページに、 文書 デ一夕を新たに分割し直す場合に分割の大きさを指定するリンク情報を付加 する文書デ一夕分割変更リンク付加部 1 9 1 7が設けられている。
端末装置 1 2 0は、 実施の形態 1の端末装置と同じであるので。説明を省略 する。
また、 サーバ装置 1 9 1 0および端末装置 1 2 0をコンピュータで実現する と、 図 5に示すようになる。 C P U 2 0 0が、 メモリ 2 0 1に格納されたプロ グラムを実行することにより、 文書デ一夕分割部 1 9 1 4、 および文書データ 分割変更リンク付加部 1 9 1 7の機能を実現している。 なお、 同様にコンビュ 一夕を用いた端末装置 1 2 0については、 実施の形態 1と同じなので説明を省 略する。
実施の形態 3にかかる文書データ処理システムは、 ユーザが端末装置 1 2 0 の入力部 1 2 1から例えば U R L等の識別子を指示することにより、 サーバ装 置 1 9 1 0のデ一夕ベース 1 1 3に格納された H T M L等の構造記述言語で 記述された文書データを要求するものである。 そして、 これに対し、 サーバ装 置 1 9 1 0が端末装置 1 2 0からの要求に対応した文書デ一夕を、 端末装置 1 2 0に送信するものである。
以下、 実施の形態 3にかかる文書データ処理システムの動作について図 2 3 のフローチヤ一トを用いて説明する。
まず、 サーバ装置 1 9 1 0は、 端末装置 1 2 0からの文書デ一夕の送信要求 を文書デ一夕要求受信部 1 1 1によって受信する (S 2 0 0 1 )。 次に、 文書 デ一夕要求取得部 1 1 2が、 端末装置 1 2 0が要求する文書データをデ一夕べ —ス 1 1 3より取得する (S 2 0 0 2 ) 。
図 2 4にデータベース 1 1 3より取得した文書データの例を示す。 図 2 4に 示す文書デ一夕 2 4 0 0は、 H T M Lで記述されている。 なお、 図 2 4では、 説明の簡略ィ匕のため文字列に記号を使っているが、 実際には意味のある文字列 が記述されている。 また、 1文字は 2バイトのデ一夕量を持つ。
次に、 文書データ分割部 1914が、 取得した文書データを分割する (S 2 003) 。 文書デ一夕分割部 19 14は、 文書データの分割を、 例えば BOD Yタグの内容からタグを除いたデ一夕を固定のバイト数ごとに区切って行う。 そして、 文書デ一夕分割部 1914は、 分割した各ページが HTMLの文法に 合うように不足しているタグを付加する (S 2004) 。 図 25に、 図 24に 示した文書データを上述した条件で 128バイ トごとに分割した文書デ一夕 例を示す。
図 25に示すように、 図 24に示す文書データ 2400は 3つのページ 22 00〜2202に分割される。 図中 2203に示すようにページ 2200には 図 24に示す BODYタグの内容からタグを除いた部分 2401を 128バ ィトに分割した先頭のデータ 2203が、 図中 2204に示すようにページ 2 20 1には図 24に示す BODYタグの内容からタグを除いた部分 2401 を 128バイトに分割した 2番目のデータ 2204が、 図中 2205に示すよ うにページ 2203には図 24に示す BODYタグの内容からタグを除いた 部分 2401を 128バイトに分割した 3つ目のデータ 2205が、 記述され ている。
次に、 文書デ一夕分割部 1914は、 分割した各ページ 2200〜 2202 を文書データ特徴抽出部 115に送る。 そして、 文書デ一夕特徴抽出部 1 15 は、 各ページ 2200〜2202の特徴を抽出する (S 2005) 。
例えば、 文書データ特徴抽出部 1 15が、 各ページ 2200〜 2202の B ODYタグの内容からタグを除いたデータの先頭から 8バイ トの文字列を各 ページ 2200〜 2202の特徴として抽出すると、 各ページ 2200〜 22 02の特徴は、 それそれ "〇〇〇〇" 2301、 2302、 "◎
2303となる。
次に、 文書デ一夕特徴抽出部 1 15は、 分割された各ページと抽出した各べ ージ 2200〜 2202の特徴 2301〜 2303を、 文書デ一夕移動リンク 付加部 1 1 6に送る。 そして、 文書データ移動リンク付加部 1 1 6は、 実施の 形態 1の処理と同様に、 分割された各ページ 2 2 0 0〜 2 2 0 2に他のページ へのリンクを示すリンク情報を付カ卩する (S 2 0 0 6 ) 。
図 2 6に、 図 2 5のページ 2 2 0 0にリンク情報を付加した例を示す。 図 2 6からわかるように、 文書デ一夕 2 3 0 0には、 ページ 2 2 0 0の特徴である "〇〇〇〇" 2 3 0 1に加え、 ページ 2 2 0 1へのリンクを示すリンクタグ 2 3 0 4と、 ページ 2 2 0 2へのリンクを示すリンクタグ 2 3 0 5が記述されて いる。 また、 リンクタグ 2 3 0 4の中には、 ページ 2 2 0 1の特徴である "厶
2 3 0 2が記述されている。 また、 リンクタグ 2 3 0 5の中には、 ぺ —ジ 2 2 0 2の特徴である 2 3 0 3が記述されている。
次に、 文書データ移動リンク付加部 1 1 6は、 他のページへのリンクが付加 された各ページを文書デ一夕分割変更リンク付加部 1 9 1 7に送る。 そして文 書データ分割変更リンク付加部 1 9 1 7は分割された各ページに、新たに文書 データを分割する場合に分割の大きさを指定するリンク情報を付加する (S 2 0 0 7 ) 。
図 2 6に示したページに分割の大きさを指定するリンク情報 2 4 0 1、 2 4 0 2を付加した文書デ一夕例を図 2 7に示す。 文書データ 2 4 0 0は、 図 2 6 に示す文書データ 2 3 0 0に、 分割の大きさを指定するリンク情報 2 4 0 1、 2 4 0 2が付与されている。 また、 リンク情報 2 4 0 1には、 分割の大きさを 示す記述 2 4 0 3と、 リンク情報 2 4 0 1の内容を示す "分割を小さく" とい う記述 2 4 0 5がなされている。 また、 リンク情報 2 4 0 2には、 分割の大き さを示す記述 2 4 0 4と、 リンク情報 2 4 0 2の内容を示す "分割を大きく" という記述 2 4 0 6がなされている。
このように、 リンク情報 2 4 0 1、 2 4 0 2の中に夫々の内容を示す記述 2 4 0 5、 2 4 0 6を付加することで、 ユーザがこれらのリンク情報 2 4 0 1、 2 4 0 2がどのような分割をするものか知ることができる。
次に、 文書デ一夕分割変更リンク付加部 1 9 1 7は、 分割の大きさを指定す るリンク情報が付加された各ページを文書データ送信部 1 1 7に送る。 そして、 文書データ送信部 1 1 7は、 分割された文書データの先頭のページを端末装置 1 2 0に送信する (S 2 0 0 8 ) o
一方、 端末装置 1 2 0は、 文書デ一夕受信部 1 2 3において、 サ一バ装置 1 9 1 0から送信された、 分割された先頭ページの文書データ 2 3 0 0を受信す る 0
文書データ受信部 1 2 3は、 受信した文書デ一夕 2 3 0 0を文書デ一夕表示 部 1 2 4に送る。 そして、 文書デ一夕表示部 1 2 4は、 受信した文書データ 2 3 0 0を解析し、 ユーザに対して表示する。
図 2 7に示したページを文書データ表示部 1 2 4で表示した表示例を図 2 8に示す。 文書デ一夕表示部 1 2 4に表示されるページ 2 5 0 0には、 自身の 内容を示す部分 2 5 0 1と、 自身の特徴を示すテキスト 2 5 0 2に加えて、 ぺ ージ 2 2 0 1ヘリンク付けされたテキスト 2 5 0 3およびページ 2 2 0 2へ リンク付けされたテキスト 2 5 0 3が表示されている。 さらに、 ページ 2 5 0 0には、 文書データの分割の変更を小さくするように指示するテキスト 2 5 0 5と、 文書データの分割の変更を大きくするように指示するテキスト 2 5 0 6 が表示されている。
次に、 ユーザが端末装置 1 2 0の入力部 1 2 1から分割の大きさを指定する リンクを示すテキスト 2 5 0 5、 2 5 0 6を選択することによって分割の大き さの変更を要求すると、 文書データ要求送信部 1 2 2はサーバ装置 1 9 1 0に 対して分割の大きさ変更の要求を送信する。 ここでは、 ユーザが "分割を大き く" 2 5 0 5というテキストを選択して分割の大きさの変更要求を行ったとす る o
サーバ装置 1 9 1 0は、 文書デ一夕要求受信部 1 1 1において、 その要求を 受信する ( S 2 0 0 1 ) 。 そして、 文書データ取得部 1 1 2が、 要求されてい るページの元となっている文書デ一夕をデータベース 1 1 3より取得する (S
2 0 0 2 ) o 次に、 文書デ一夕分割部 19 14は、 取得した文書デ一夕を分割する (S 2 003) 。 分割は、 始めと同様に; BODYタグの内容からタグを除いたデ一夕 を固定のバイト数ごとに区切って行う。 この場合は、 文書デ一夕分割部 19 1 4は、 ユーザからの分割の大きさの変更要求に基づいた固定バイト数で: B〇D Yタグの内容からタグを除いたデ一夕を分割する。 ここでは、 ユーザから分割 の大きさの変更要求により、 固定バイト数が 200バイトに指定されたとする c そして、 文書データ分割部 1914は, 取得した文書デ一夕を 200バイ ト ごとに分割した後に、 分割した各ページが H TMLの文法に合うように不足し ているタグを付加する (S 2004) 。
図 24に示した文書データを上述した条件で 200バイ トごとに分割した 文書デ一夕例を図 29に示す。 図 29に示すように、 図 24に示す文書デ一夕 2400は 2つのページ 2600、 2601に分割される。 図中 2602に示 すようにページ 2600には図 24に示す B〇DYタグの内容からタグを除 いた部分 2401を 200バイトに分割した先頭のデ一夕 2602が、 図中 2 403に示すようにページ 260 1には図 24に示す B 0 D Yタグの内容か ら夕グを除いた部分 240 1を 200バイ トに分割した 2番目のデータ 26 03が記述されている。
次に、 文書デ一夕分割部 1914は、 分割した各ページ 2600、 2601 を文書データ特徴抽出部 115に送る。 そして、 文書データ特徴抽出部 1 15 は、分割された各ページ 2600, 2601の特徴を抽出する(S 2005)。 ここでも、 文書データ特徴抽出部 1 15は、 各ページ 2600、 2601の B 0 D Yタグの内容から夕グを除いたデータの先頭から 8バイ トの文字列を各 ページの特徴として抽出する。 例えば、 図 26の 2600、 2601の各ぺ一 ジの特徴は、 それそれ "〇〇〇〇" 270 1、 "X X X©" 2702となる。 次に、 文書データ特徴抽出部 115は、 分割された各ページと抽出した各べ —ジの特徴を文書デ一夕移動リンク付加部 1916に送る。 そして文書デ一夕 移動リンク付加部 1916は、 分割された各ページ 2600、 260 1の他の ページへのリンク情報にこの特徴 2 7 0 1 , 2 7 0 2を付加する(S 2 0 0 6 ) c 図 3 0に、 図 2 9の 2 6 0 0のページにリンク情報を付加した例を示す。 図 3 0からわかるように、 文書データ 2 7 0 0には、 ページ 2 6 0 0の特徴であ る "〇〇〇〇" 2 7 0 1に加え、 ページ 2 6 0 1へのリンクを示すリンクタグ 2 7 0 3が記述されている。 また、 リンクタグ 2 7◦ 3の中には、 ページ 2 6 0 1の特徴である " X X X ©" 2 7 0 2が記述されている。
次に、 文書データ移動リンク付加部 1 1 7は、 他のページへのリンク情報が 付加された各ページを文書デ一夕分割変更リンク付加部 1 9 1 7に送る。 そし て文書データ分割変更リンク付加部 1 9 1 7は、 上述した処理と同様に、 分割 された各ページに分割の大きさを指定するリンク情報を付加する (S 2 0 0 7 )。
図 3 1に、 図 3 0に示したページに分割の大きさを指定するリンク 2 8 0 1、
2 8 0 2を付加した文書データ例 2 8 0 0を示す。 文書データ 2 8 0 0は、 図
3 0に示す文書デ一夕 2 7 0 0に、 分割の大きさを指定するリンク 2 8 0 1、 2 8 0 2が付与されている。 また、 リンク 2 8 0 1には、 分割の大きさを示す 記述 2 8 0 3と、 リンク 2 8 0 1の内容を示す "分割を小さく" 2 8 0 5とい う記述がなされている。 また、 リンク 2 8 0 2には、 分割の大きさを示す記述 2 8 0 4と、 リンク 2 8 0 2の内容を示す "分割を大きく" 2 8 0 6という記 述がなされている。
次に、 文書データ分割変更リンク付加部 1 9 1 7は、 分割の大きさを指定す るリンク情報が付加された各ページを文書データ送信部 1 1 7に送る。 そして、 文書データ送信部 1 1 7は、 新たに分割された文書デ一夕の先頭のページを端 末装置 1 2 0に送信する ( S 2 0 0 8 ) 。 一方、 端末装置 1 2 0は、 サーバ装 置 1 9 1 0から送信された分割された先頭のページの文書データ 2 8 0 0を、 文書デ一夕受信部 1 2 3により受信する。
文書デ一夕受信部 1 2 3は、 受信した文書データ 2 8 0 0を文書データ表示 部 1 2 4に送る。 そして、 文書データ表示部 1 2 4は、 受信した文書データ 2 8 0 0を解析し、 ュ一ザに対して表示する。
図 3 2に、 図 3 1に示したページを文書データ表示部 1 2 4で表示した表示 例を示す。 文書データ表示部 1 2 4に表示されるページ 2 9 0 0には、 自身の 内容を示す部分 2 9 0 1と、 自身の特徴を示すテキスト 2 9 0 2に加えて、 ぺ —ジ 2 6 0 1ヘリンク付けされたテキスト 2 9 0 3およびページ 2 6 0 2へ リンク付けされたテキスト 2 9 0 3が表示されている。 さらに、 ページ 2 9 0 0には、 文書デ一夕の分割の変更を小さくするように指示するテキスト 2 9 0 5と、 文書データの分割の変更を大きくするように指示するテキスト 2 9 0 6 が表示されている。
そして、 ユーザは、 ページ 2 9 0 0を見て、 所望のページを表示させるテキ ストを指示したり、 所望の分割をするテキストを指示したりして、 所望の文書 デ一夕を取得する。
以上説明したように、 実施の形態 3によれば、 分割の変更を指示する分割変 更リンク情報に、 分割方法の内容を記述することができる。 これにより、 文書 データを閲覧するユーザが、 分割変更リンク情報の記述から分割方法を知るこ とができる。この結果、ユーザは適切に文書デ一夕の分割を行うことができる。
(実施の形態 4 )
本発明の実施の形態 4は、 文書データを蓄積および管理するサーバ機能を持 つ装置と、 文書デ一夕を分割し、 分割した文書デ一夕の特徴を抽出し、 そして 抽出した特徴を分割した文書デ一夕に他のページへのリンク情報として付加 する文書データ編集機能を持つ装置とを、 分けて具備したものである。
以下、 本発明の実施の形態 4にかかる文書データ処理システムについて説明 する。 まず、 実施の形態 4にかかる文書デ一夕処理システムの構成について図 3 3を用いて説明する。 図 3 3は、 実施の形態 4にかかる文書データ処理シス テムの構成を示すブロック図である。 なお、 既に説明した部分と同一の部分に は同一の符番を付与する。
図 3 3において、 中継装置 3 0 1 0、 サーバ装置 3 0 2 0、 端末装置 1 2 0 は、 ィン夕一ネヅトなどのネヅトワーク 1 3 0に接続されている。
中継装置 3 0 1 0には、 端末装置 1 2 0から送られてきた文書デ一夕の要求 を受信する文書データ要求受信部 3 0 1 1が設けられている。文書データ要求 受信部 3 0 1 1は、 受信した文書データの要求を、 中継装置 3 0 1 0に設けら れた文書デ一夕要求送信部 3 0 1 2に送信する。 そして、 文書デ一夕要求送信 部 3 0 1 2は、 受信した文書データの要求をサーバ装置 3 0 2 0に転送する。 また、 中継装置 3 0 1 0には、 サーバ装置 3 0 2 0から送られてきた文書デ 一夕を受信する文書データ受信部 3 0 1 3が設けられている。文書デ一夕受信 部 3 0 1 3は、 受信した文書デ一夕を文書データ分割部 1 1 4に送る。
また、 中継装置 3 0 1 0には、 文書データ分割部 1 1 4、 文書データ特徴抽 出部 1 1 5、 文書デ一夕移動リンク付加部 1 1 6、 文書データ送信部 1 1 7が 設けられている。 文書データ分割部 1 1 4、 文書データ特徴抽出部 1 1 5、 文 書データ移動リンク付加部 1 1 6、 および文書デ一夕送信部 1 1 7については、 実施の形態 1で説明したので詳細な説明を省く。
一方、 サーバ装置 3 0 2 0には、 中継装置 3 0 1 0あるいは端末装置 1 2 0 から送られてきた、 文書デ一夕の要求を受信する文書データ要求受信部 3 0 2 1が設けられている。文書データ要求受信部 3 0 2 1は、 受信した文書デ一夕 の要求をサーバ装置 3 0 2 0に設けられた文書デ一夕取得部 3 0 2 2に送る。 文書データ取得部 3 0 2 2は、 受信した文書デ一夕の要求に対応する文書デ —夕をデ一夕ベース 1 1 3から取得し、 サーバ装置 3 0 2 0に設けられた文書 デ一夕送信部 3 0 2 4に送る。 また、 データベース 1 1 3については、 既に説 明したので、 説明を省略する。
文書デ一夕送信部 3 0 2 4は、 文書データ取得部 3 0 2 2から送られてきた 文書データを中継装置 3 0 1 0あるいは端末装置 1 2 0に送信する。
また、 端末装置 1 2 0については、 既に説明したものと同様の構成を採る。 端末装置 1 2 0は、 ユーザの操作に従い、 中継装置 3 0 1 0に対して文書デ一 夕の要求を送信し、 要求した文書デ一夕を受信して、 その文書データを表示す ることが可能になっている。
図 3 4は、 中継装置 3 0 1 0をコンピュータにより実現した場合のハ一ドウ エア構成を示す図である。
C P U 2 0 0がメモリ 2 0 1に格納されたプログラムを実行することによ り、 文書データ分割部 1 1 4、 文書データ抽出部 1 1 5、 および文書データ移 動リンク付加部 1 1 6の機能をする。 また、 C P U 2 0 0がメモリ 2 0 1に格 納されたプログラムを実行し、 ネヅトワークイン夕一フェース 2 0 2を使用す ることで、 文書データ要求受信部 3 0 1 1、 文書データ要求送信部 3 0 1 2、 文書データ受信部 3 0 1 3、 および文書データ送信部 1 1 7としての機能をす る。
実施の形態 4にかかる文書デ一夕処理システムは、 ュ一ザが端末装置 1 2 0 の入力部 1 2 1から例えば U R L等の識別子を指示することにより中継装置 3 0 1 0に対して文書デ一夕の要求をするものである。 そして、 中継装置 3 0 1 0が端末装置 1 2 0から送られてきた要求に対応した文書データをサーバ 装置 3 0 2 0から得て、 この文書データに所定の処理を施して端末装置 1 2 0 に送信するものである。
以下、 実施の形態 4にかかる文書データ処理システムの動作について、 図 3 5、 図 3 6のフローチャートを用いて説明する。 図 3 5は中継装置 3 0 1 0の 動作のフローチャートであり、 図 3 6はサーバ装置 3 0 2 0の動作のフローチ ヤートである。
まず、 中継装置 3 0 1 0は、 端末装置 1 2 0から送られてきた文書デ一夕の 要求を文書データ要求受信部 3 0 1 1によって受信し (S 3 2 0 1 ) 、 受信し た要求を文書データ要求送信部 3 0 1 2によってサーバ装置 3 0 2 0に転送 する (S 3 2 0 2 ) 。
これに対し、 サーバ装置 3 0 2 0は、 中継装置 3 0 1 0から送信された文書 デ一夕の要求を文書デ一夕要求受信部 3 0 2 1によって受信し(S 3 3 0 1 )、 文書データ取得部 3 0 2 2が要求されている文書データをデータペース 1 1 3から取得する (S 3 3 0 2 ) 。 文書データ取得部 3 0 2 2がデータベース 3 0 2 3から取得した文書データの例を図 7に示す。
次に、 文書データ取得部 3 0 2 2は、 取得した文書デ一夕を文書データ送信 部 3 0 2 4に送る。 そして、 文書デ一夕送信部 3 0 2 4は、 文書データを中継 装置 3 0 1 0に送信する (S 3 3 0 3 ) 。
これに対し、 中継装置 3 0 1 0は、 サーバ装置 3 0 2 0より送信された文書 デ一夕を文書データ受信部 3 0 1 3によって受信し (S 3 2 0 3 ) 、 文書デー 夕受信部 3 0 1 3が受信した文書データを文書デ一夕分割部 1 1 4に送る。 そ して、 文書データ分割部 1 1 4が文書デ一夕を分割する (S 3 2 0 4 ) 。 文書 データ分割部 1 1 4は文書デ一夕の分割を、 実施の形態 1と同様に、 例えば見 出しタグである H 1タグを区切りにして行う。 そして、 文書データ分割部 1 1 4は、 分割した各ページが H T M Lの文法に合うように、 各ページに不足して いるタグを付加する (S 3 2 0 5 ) 。 図 7に示した文書デ一夕を分割した例を 図 8に示す。
次に、 文書デ一夕分割部 1 1 4は、 分割した各ページを文書データ特徴抽出 部 1 1 5に送る。 そして、 文書データ特徴抽出部 1 1 5は、 分割された各べ一 ジの特徴を抽出する (S 3 2 0 6 ) 。例えば、 見出しタグである H 1タグの内 容を各ページの特徴として抽出すると、 図 8の各ページ 5 0 0〜5 0 2の特徴 は、 それぞれ "国土"、 "気候"、 "人口" となる。
次に、 文書デ一夕特徴抽出部 1 1 5は、 分割された各ページと抽出した各べ ージの特徴を、 文書データ移動リンク付加部 1 1 6に送る。 そして、 文書デ一 夕移動リンク付加部 1 1 6は、 分割された各ページに他のページへのリンク情 報を付加する (S 3 2 0 7 ) 。 図 9に、 図 8のぺ一ジ 5 0 0にリンク情報を付 加した例を示す。
次に、 文書データ移動リンク付加部 1 1 6は、 他のページへのリンク情報が 付加された各ページを文書データ送信部 1 1 7に送る。 そして、 文書デ一夕送 信部 1 1 7は分割された文書データの先頭のページを端末装置 1 2 0に送信 する (S 3 2 0 8 ) 。
これに対し、 端末装置 1 2 0は、 中継装置 3 0 1 0から送信された分割され たページを、 文書デ一夕受信部 1 2 3により受信する。 次に、 文書データ受信 部 1 2 3は、 受信したページを文書データ表示部 1 2 4に送る。 そして、 文書 データ表示部 1 2 4は、 受信したページを解析し、 ユーザに対して表示する。 図 1 1に、 図 9に示したページを文書データ表示部 1 2 4で表示した表示例 を示す。
次に、 ユーザが端末装置 1 2 0の入力部 1 2 1より他のページへのリンクを 選択することによつて他のページの文書デ一夕を要求すると、 文書データ要求 送信部 1 2 2は中継装置 3 0 1 0に対して他のページの要求を送信する。 ここ ではユーザが "気候" というリンクを選択してページの要求を行ったとする。 中継装置 3 0 1 0は、 その要求を文書データ要求受信部 3 0 1 1によって受 信し (S 3 2 0 1 ) 、 受信した要求を文書デ一夕要求送信部 3 0 1 2によって サーバ装置 3 0 2 0に転送する ( S 3 2 0 2 ) 。 サーバ装置 3 0 2 0は、 中継 装置 3 0 1 0から送信された要求を文書データ要求受信部 3 0 2 1によって 受信し (S 3 3 0 1 ) 、 文書デ一夕取得部 3 0 2 2が要求されている文書デ一 夕をデータペース 1 1 3から取得する (S 3 3 0 2 ) 。
次に、 文書データ取得部 3 0 2 2は、 取得した文書デ一夕を文書デ一夕送信 部 3 0 2 4に送り、 文書デ一夕送信部 3 0 2 4は文書データを中継装置 3 0 1 0に送信する (S 3 3 0 3 ) 。
中継装置 3 0 1 0は、 サーバ装置 3 0 2 0より送信された文書データを文書 データ受信部 3 0 1 3によって受信し (S 3 2 0 3 ) 、 受信した文書デ一夕を 文書データ分割部 1 1 4により分割する (S 3 2 0 4 ) 。 文書データ分割部 1 1 4は、 上述した方法と同様に、 文書デ一夕の分割を見出しタグである H 1夕 グを区切りにして行う。 そして、 文書データ分割部 1 1 4は、 分割した各べ一 ジが H T M Lの文法に合うように不足しているタグを付加する(S 3 2 0 5 )。 図 8に分割した文書データ例を示す。 次に、 文書デ一夕分割部 1 1 4は、 分割した各ページを文書データ特徴抽出 部 1 1 5に送る。 そして、 文書デ一夕特徴抽出部 1 1 5は、 各ページの特徴を 抽出する( S 3 2 0 6 )。文書データ特徴抽出部 1 1 5は、各ページの特徴を、 上述した方法と同様に、 見出しタグである H 1タグの内容を各ページの特徴と して抽出する。 図 8の各ページ 5 0 0〜5 0 2の特徴は、 それそれ "国土"、 "気候"、 "人口" となる。
次に、 文書データ特徴抽出部 1 1 5は、 分割された各ページと抽出した各べ ージの特徴を、 文書デ一夕移動リンク付加部 1 1 6に送る。 そして、 文書デー 夕移動リンク付加部 1 1 6は、 分割された各ページに他のページへのリンク情 報を付加する (S 3 2 0 7 ) 。 図 1 2に、 図 8のべ一ジ 5 0 1にリンク情幸 Sを 付加した例を示す。
次に、 文書デ一夕移動リンク付加部 1 1 6は、 他のページへのリンク情報が 付加された各ページを文書データ送信部 1 1 7に送る。 そして、 文書デ一夕送 信部 1 1 7は、 端末装置 1 2 0から要求された分割されたページを、 端末装置 1 2 0に送信する (S 3 2 0 8 ) 。
端末装置 1 2 0は、 中継装置 3 0 1 0から送信された分割されたページを、 文書データ受信部 1 2 3により受信する。
文書データ受信部 1 2 3は、 受信したページを文書デ一夕表示部 1 2 4に送 り、 文書データ表示部 1 2 4がユーザに対して受信したページを表示する。 図 1 3に、 図 1 2に示したページを文書デ一夕表示部 1 2 4で表示した表示 例を示す。
以上説明したように、 実施の形態 4によれば、 文書デ一夕を蓄積および管理 するサーバ機能を持つサーバ装置 3 0 2 0と、 文書データを分割し、 分割した 文書デ一夕の特徴を抽出し、 そして抽出した特徴を分割した文書データに他の ページへのリンク情報として付加する文書デ一夕編集機能を持つ中継装置 3 0 1 0とを、 分けることができる。
(実施の形態 5 ) 本発明の実施の形態 5は、 入力した文書データを分割し、 分割した文書デー 夕の特徴を抽出し、 そして抽出した特徴を分割した文書デ一夕に他のページへ のリンク情報として付カ卩し出力する文書データ処理装置に関するものである。 以下、 実施の形態 5にかかる文書データ処理装置の構成について、 図 3 7を 用いて説明する。 図 3 7は、 実施の形態 5にかかる文書データ処理装置のプロ ック図である。 なお、 既に説明した部分と同一の部分には同一の符番を付与す る。
文書データ処理装置 3 4 0 0には、 他の装置から送られてきた文書データの 入力を受け付ける文書データ入力部 3 4 0 1が設けられている。文書データ入 力部 3 4 0 1は、 入力した文書データを文書データ処理装置に設けられた文書 デ一夕分割部 1 1 4に送る。
また、 文書データ処理装置 3 4 0 0には、 文書データ分割部 1 1 4、 文書デ 一夕特徴抽出部 1 1 5、 および文書デ一夕移動リンク付加部 1 1 6が設けられ ている。 文書デ一夕分割部 1 1 4、 文書データ特徴抽出部 1 1 5、 および文書 データ移動リンク付加部 1 1 6については、 実施の形態 1で説明したので詳細 な説明を省く。
また、 文書データ処理装置 3 4 0 0には、 文書データ移動リンク付加部 1 1 6から出力された文書デ一夕を他の装置に出力する文書デ一夕出力部 3 4 0 5が設けられている。
図 3 8は、 文書データ処理装置 3 4 0 0をコンピュータにより実現した場合 のハードゥエァ構成を示す図である。
C P U 2 0 0がメモリ 2 0 1に格納されたプログラムを実行することによ り、 文書データ分割部 1 1 4、 文書データ抽出部 1 1 5、 および文書デ一夕移 動リンク付加部 1 1 6の機能をする。 また、 C P U 2 0 0がメモリ 2 0 1に格 納されたプログラムを実行し、 入出力インターフェース 3 5 0 1を使用するこ とで、 文書デ一夕入力部 3 4 0 1および文書データ出力部 3 4 0 5としての機 能をする。 以下、 実施の形態 5にかかる文書データ処理装置 3 4 0 0の動作について、 図 3 9のフローチャートを用いて説明する。 図 3 9は文書データ処理装置 3 4 0 0の動作のフローチャートである。
まず、 文書データ処理装置 3 4 0 0は、 他の装置から送られてきた文書デ一 夕入力部 3 4 0 1によって文書デ一夕の入力を受け付ける (S 3 6 0 1 ) 。 図 7に、 文書データ入力部 3 4 0 1が入力を受け付けた文書データの例を示す。 次に、 文書データ入力部 3 4 0 1は、 入力した文書データを文書デ一夕分割 部 1 1 4に送る。 文書データ分割部 1 1 4は、 入力を受け付けた文書データを 分割する (S 3 6 0 2 ) 。 文書データ分割部 1 1 4は、 文書データの分割を、 例えば見出しタグである H 1タグを区切りにして行い、 分割された各ページが H T M Lの文法に合うように不足しているタグを付加する (S 3 6 0 3 ) 。 図 7に示した文書データを分割した例を図 8に示す。
次に、 分割データ分割部 1 1 4は、 分割した各ページを文書デ一夕特徴抽出 部 1 1 5に送る。 そして、 文書デ一夕特徴抽出部 1 1 5は、 各ページの特徴を 抽出する ( S 3 6 0 4 ) 。 例えば、 見出し夕グである H 1夕グの内容を各ぺー ジの特徴として抽出すると、 図 8の各ページ 5 0 0〜 5 0 2の特徴は、 それぞ れ "国土"、 "気候"、 "人口" となる。
次に、 文書デ一夕特徴抽出部 1 1 5は、 分割された各ページと抽出した各べ ージの特徴を、 文書デ一夕移動リンク付加部 1 1 6に送る。 そして、 文書デ一 夕移動リンク付加部 1 1 6は分割された各ページに他のページへのリンク情 報を付加する (S 3 6 0 5 ) 。 図 9に、 図 8のページ 5 0 0にリンク情報を付 加した例を示す。 また、 図 1 0に要求された文書データと分割された各ページ との関係を図示する。
次に、 文書データ移動リンク付加部 1 1 6は、 他のページへのリンク情報が 付加された各ページを文書データ出力部 3 4 0 5に送る。 そして、 文書データ 出力部は、 分割された文書データの先頭のページを、 他の装置に対して出力す る (S 3 6 0 6 ) 。 以上説明したように、 実施の形態 5によれば、 他の装置から送られてきた文 書デ一夕を分割し、 分割した文書データの特徴を抽出し、 そして抽出した特徴 を分割した文書データに他のページへのリンク情報として付加し、 他の装置に 対して出力できる。
(実施の形態 6 )
本発明の実施の形態 6は、 文書データの提供を受ける端末装置に文書デ一夕 を格納するキャッシュ部を設け、 分割されたページがキャッシュ部に存在する 場合に、 このページへのリンク情報の記述形態を変化させるものである。 以下、 実施の形態 6にかかる文書データ処理システムについて添付図面を用 いて詳細に説明する。 まず、 実施の形態 6にかかる文書データ処理システムの 構成について図 4 0を用いて説明する。 図 4 0は、 実施の形態 6にかかる文書 データ処理システムの構成を示すブロック図である。 なお、 既に説明した部分 と同一の部分には同一の符番を付与する。
サーバ装置 1 1 0、 端末装置 3 7 2 0は、 インターネヅトなどのネヅトヮ一 ク 1 3 0に接続されている。
サーバ装置 1 1 0の構成については、 実施の形態 1と同様の構成なので説明 を省略する。
端末装置 3 7 2 0は、 例えばパーソナルコンピュータ等の汎用マシンを用い て実現される。 端末装置 3 7 2 0には、 入力部 1 2 1と、 文書データ要求送信 部 1 2 2が設けられている。
また、 端末装置 3 7 2 0には、 サーバ装置 1 1 0から送られてきた文書デー 夕を受信する文書データ受信部 3 7 2 3が設けられている。文書データ受信部 3 7 2 3は、 受信した文書デ一夕を端末装置 3 7 2 0に設けられたキャッシュ 部 3 7 2 4および文書データ解析部 3 7 2 5に送る。
キャッシュ部 3 7 2 4は、 受信した文書データを保存する記憶手段である。 文書データ解析部 3 7 2 5は、 受信した文書データを解析し、 文書データの リンク情報などを得る。 そして、 文書データ解析部 3 7 2 5は、 解析結果を端 末装置 3 7 2 0に設けられた文書デ一夕表示部 3 7 2 7およびキャッシュ確 認部 3 7 2 6に送る。
キヤヅシュ確認部 3 7 2 6は、 文書デ一夕解析部 3 7 2 5が得たリンク情報 に対応する文書データがキャッシュ部 3 7 2 4にあるかどうかを確認する。 そ して、 キャッシュ確認部 3 7 2 6は、 この確認結果を文書デ一夕表示部 3 7 2 7に送 1§ 3 ·©。
また、 文書デ一夕表示部 3 7 2 7は、 文書データ解析部 3 7 2 5から送られ て来た文書デ一夕を、 キャッシュ確認部 3 7 2 6の確認結果に従って表示する。 図 4 1は、 端末装置 3 7 2 0をコンピュータにより実現した場合のハードウ エア構成を示す図である。
コンピュータを用いた端末装置 3 7 2 0は、 C P U 2 1 0がメモリ 2 1 1に 格納されたプログラムを実行し、 ネヅ卜ワークインターフェース 2 1 5及び入 出力イン夕一フェース 2 1 3を使用することで、 文書データ要求送信部 1 2 2、 文書データ受信部 3 7 2 3、 文書データ角牟析部 3 7 2 5、 およびキャッシュ確 認部 3 7 2 6の機能を実現する。 また、 C P U 2 1 0がメモリ 2 1 1に格納さ れたプログラムを実行し表示部 2 1 4を使用することで、 文書データ表示部 3 7 2 7の機能を実現する。
以下、 端末装置 3 7 2 0の動作について、 図 4 2のフローチャートを用いて 説明する。
まず、 ユーザが端末装置 3 7 2 0の入力部 1 2 1から例えば U R L等の識別 子を指示することにより、 サーバ装置 1 1 0のデータべ一ス 1 1 3に格納され た例えば H T M L等の構造記述言語で記述された文書データを要求する。次に、 文書データ要求送信部 1 2 2は、 入力された要求をサーバ装置 1 1 0に対して 送信する (S 3 9 0 1 ) 。
これに対し、 サーバ装置 1 1 0は端末装置 3 7 2 0から送られてきた要求を 文書データ要求受信部 1 1 1によって受信し、 文書デ一夕取得部 1 1 2が要求 されている文書デ一夕をデ一夕ベース 1 1 3より取得する。 そして、 文書デ一夕分割部 1 1 4が取得した文書デ一夕を分割する。 次に、 文書データ特徴抽出部 1 1 5が分割した文書データの各ページの特徴を抽出 する。 次に、 文書データ移動リンク付加部 1 1 7は、 分割された各ページに、 抽出された他のページの特徴をリンク情報として付加し、 文書デ一夕送信部 1 1 7に送る。 そして、 文書データ送信部 1 1 7がこのリンク情報が付加された 文書デ一夕を端末装置 3 7 2 0に送る。
文書データ送信部 1 1 7が送信する文書データの例を図 4 3に示す。 図 4 3 からわかるように、 文書デ一夕 4 3 0 0には、 他のページへのリンクを示すリ ンク情報であるリンクタグ 4 3 0 1 a、 4 3 0 1 bが記述されている。 また、 リンクタグ 4 3 0 1 a, 4 3 0 1 bの中には、他のページの特徴である "気候" 4 3 0 2 a, "人口" 4 3 0 2 bが記述されている。
次に、端末装置 3 7 2 0は、サーバ装置 1 1 0から送信された文書デ一夕を、 文書データ受信部 3 7 2 3により受信する (S 3 9 0 2 ) 。
文書データ受信部 3 7 2 3は、 受信した文書デ一夕を、 キャッシュ部 3 7 2 4に送り、 文書デ一夕の識別子と対応付けて保存する (S 3 9 0 3 ) と共に、 文書データ解析部 3 7 2 5に送る。
文書データ解析部 3 7 2 5は、 送られてきた文書デ一夕を解析し (S 3 9 0 4 ) 、 文書デ一夕内に他の文書データへのリンクがあるか否かを判断する (S 3 9 0 5 ) o
そして、 文書データ解析部 3 7 2 5は、 S 3 9 0 5において、 文書デ一夕内 に他の文書デ一夕へのリンク情報があると判断した場合には、 リンクされてい る他の文書データの識別子をキャッシュ確認部 3 7 2 6に送る。
次に、 キャッシュ確認部 3 7 2 6は、 送られてきた識別子に対応する文書デ —夕がキャッシュ部 3 7 2 4に存在するかどうかを確認する (S 3 9 0 6、 S 3 9 0 7 ) 。
そして、 S 3 9 0 7において、 キヤヅシュ確認部 3 7 2 6がキヤヅシュ部 3 7 2 4にリンク情報に対応する文書デ一夕が存在すると判断した場合は、 その 識別子を文書デ一夕表示部 3 7 2 7に通知する ( S 3 9 0 8 ) 。
次に、 文書データ表示部 3 7 2 7は、 文書データ解析部 3 7 2 5から送られ た文書デ一夕とキャッシュ確認部 3 7 2 6から送られた確認の結果に従い、 リ ンク情報に記述されている他ページの内容を示す文字列を大きく表示する (S 3 9 0 9 ) o
一方、 S 3 9 0 7において、 キヤヅシュ確認部 3 7 2 6がキヤヅシュ部 3 7 2 4にリンク情報に対応する文書データが存在しない判断した場合は、 その文 書デ一夕に対応する識別子を文書デ一夕表示部 3 7 2 7に通知する。
そして、 文書デ一夕表示部 3 7 2 7は、 文書デ一夕解析部 3 7 2 5から送ら れた文書デ一夕とキャッシュ確認部 3 7 2 6から送られた確認の結果に従い、 リンク情報に記述されている他ページの内容を示す文字列を普通の大きさで 表示する (S 3 9 1 0 ) 。
図 4 4に、 図 4 3に示したページを端末装置 3 7 2 0の文書データ表示部 3 7 2 7に表示したページを示す。
文書デ一夕表示部 3 7 2 7に表示されるページ 4 1 0 2には、 自身の内容を 示す部分 4 1 0 4と、 自身の特徴を示すテキスト 4 1 0 3に加えて、 他のぺ一 ジヘリンク付けされたテキスト 4 1 0 0と、 4 1 0 1とが表示される。 図から わかるように、 テキスト 4 1 0 0は通常の大きさに表示されたテキスト 4 1 0 1より大きく表示されている。
つまり、 テキスト 4 1 0 0にリンクされている文書デ一夕はキャッシュ部 3 7 2 4に存在し、 テキスト 4 1 0 1にリンクされている文書データはキヤヅシ ュ部 3 7 2 4に存在しないということを示している。
以上説明したように実施の形態 6によれば、 分割されたページがキヤッシュ 部 3 7 2 4に存在する場合にキヤヅシュ部 3 7 2 4に存在するページへのリ ンク情報の記述形態を変化させることができる。 これにより、 文書データを閲 覧するユーザは、 リンク情報の記述形態の違いから、 リンクされている他のぺ —ジがキャッシュ部 3 7 2 4に存在するかどうか判断できる。 この結果、 ュ一 ザがキャッシュ部 3724に蓄積されている他のページを選択して表示させ ることができる。 よって、 ユーザは、 文書デ一夕を容易に閲覧できる。
また、 実施の形態 6では、 キャッシュ部 3724に存在するページへのリン クを示すテキストを、 キャッシュ部 3724に存在しないページへのリンクを 示すテキストよりも大きくするようにできる。 これにより、 ユーザは、 リンク を示すテキストから、 視覚的にキャッシュ部 3724に存在するページを認識 できる。
なお、 実施の形態 6では、 キヤヅシュ部 3724に存在するページへのリン クを示すテキストをキャッシュ部 3724に存在しないページへのリンクを 示すテキストよりも大きくしたが、 キャッシュ部 3724に存在するページへ のリンクを示すテキストの長さをキャッシュ部 3724に存在しないページ へのリンクを示すテキストよりも長くしても良い。 また、 キヤヅシュ部 372 4に存在するページへのリンクを示すテキストの色や濃淡を変えるようにし ても良い。 また、 キャッシュ部 3724に存在するページへのリンクを示すテ キストに網掛けをしても良い。
なお、 実施の形態 6では、 リンクを示すテキストとしてリンク先のページの 内容を示すテキストを用いたが、 リンクを示すテキストとしてリンク先のぺー ジの内容を示すテキストを用いない形態であっても良い。
なお、 実施の形態 1から実施の形態 6では、 デ一夕べ一ス 113に分割され ていない文書データが蓄積されていて文書デ一夕分割部 1 14で分割する形 態で説明したが、 データベース 1 13に予め所定の大きさに分割された文書デ 一夕を蓄積しておく形態であっても良い。
本明細書は、 2001年 3月 23日出願の特願 2001— 84803及び 2 002年 3月 6日出願の特願 2002— 61 132に基づく。 この内容はすべ てここに含めておく。 産業上の利用可能性 以上のように本発明によれば、 ユーザが携帯電話等の資源の限られた端末装 置からサーバ装置あるいは中継装置に文書データを要求した場合に、 サーバ装 置あるいは中継装置が要求された文書データを分割し、 分割した各ページに、 他のページのリンクを示すテキストとして他のページから抽出した見出しな どの特徴を付加することができる。 これにより、 ユーザがリンク付けされた他 のページの特徴を元に他のページへの移動の必要性を判断することができる。 この結果、 ュ一ザが、 文書データの閲覧を快適にできるという有利な結果が得 れる o
また、 本発明によれば、 ユーザが携帯電話等の資源の限られた端末装置から サーバ装置あるいは中継装置に文書デ一夕を要求した場合に、 サーバ装置ある いは中継装置が要求された文書データを分割し、 分割した各ページに他のぺ一 ジのリンクを示すテキストとして他のページから抽出した見出しなどの特徴 特徴を各ページのデータ量に応じて変化させて付加することができる。 これに より、 ユーザがリンク付けされた他のページのデ一夕量に関する情報を元に他 のページへの移動の必要性を判断することができる。 この結果、 ュ一ザが文書 データの閲覧を快適にするという有利な結果が得られる。
また、 本発明によれば、 ユーザが携帯電話等の資源の限られた端末装置から サーバ装置あるいは中継装置に文書デ一夕を要求した場合に、 サーバ装置ある いは中継装置が要求された文書データを分割し、 分割した各ページに分割の大 きさを指定するためのリンクを付加することができる。 これにより、 ュ一ザが 分割の大きさを指定することができ、 ユーザの文書データの閲覧を快適にする という有利な結果が得られる。
また、 本発明によれば、 端末装置がサーバ装置あるいは中継装置から文書デ —夕を取得した場合に、 取得した文書データをキャッシュに保存すると共に取 得した文書デ一夕にリンクされている他の文書データがキヤッシュに存在す るかどうかを確認し、他の文書データがキャッシュに存在する場合は他の文書 デ一夕へのリンクを示すテキストの表示を変化させることができる。 これによ り、 ユーザがリンク先の文書デ一夕を閲覧する場合に、 リンクを示すテキス 1、 から、 サーバ装置あるいは中継装置から文書データを取得する必要があるかど うかを知ることができる。 この結果、 ユーザが文書データの閲覧を快適にでき るという有利な結果が得られる。

Claims

1 . 1つの文書データを分割した複数の分割文書データの夫々から前記分割 文書デ一夕の特徴を表す情報を抽出する特徴抽出部と、 ある前記分割文書デ一 夕に他の前記分割文書データへのリンクを示すリンク情報を付加すると共に 前記リンク倩報に前記特徴抽出部が抽出した前記他の分割文書データの特徴 を付加するリンク付加部と、 を具備したことを特徴とした文書データ処理装置
2 . 前記分割文書データの特徴を表す情報は、 前記分割文書デ一夕の見出し であることを特徴とした請求項 1記載の文書データ処理装置。
3 . 前記分割文書データの特徴を表す情報は、 前記分割文書データの先頭の 語句であることを特徴とした請求項 1記載の文書データ処理装置。
4 . 前記分割文書データの特徴を表す情報は、 前記分割文書データの内容に 最も多く記載されている文字列であることを特徴とした請求項 1記載の文書 デ一夕処理装置。
5 . 1つの文書データを分割した複数の分割文書デ一夕における夫々のデー 夕量を確認するデータ量確認部と、 ある前記分割文書デ一夕に他の前記分割文 書デ一夕へのリンクを示すリンク情報を付加すると共に前記リンク情報に前 記他の文書データを示す文字列を前記データ量確認部が確認した前記他の分 割文書デ一夕のデータ量に応じて変化させて付加するリンク付加部と、 を具備 したことを特徴とした文書デ一夕処理装置。
6 . 前記リンク付加部は、 前記分割文書データのデータ量に応じて前記文字 列の長さを変化させることを特徴とした請求項 5記載の文書デ一夕処理装置。
7 . 前記リンク付加部は、 前記分割文書デ一夕のデータ量に応じて前記文字 列の色を変化させることを特徴とした請求項 5記載の文書データ処理装置。
8 . 前記リンク付加部は、 前記分割文書データのデータ量に応じて前記文字 列のフォントの大きさを変化させることを特徴とした請求項 5記載の文書デ 一夕処理装置。
9 . 文書データを複数の分割文書データに分割する分割部と、 ある前記分割 文書データに他の前記分割文書データへのリンクを示すリンク情報を付加す ると共に前記リンク情報に前記他の分割文書データを示す文字列を付加する リンク付加部と、 前記分割部に対して前記文書データを所定の大きさで再分割 することを指示する分割リンク情報を付加すると共に前記分割リンク情報に 前記文書データを分割する前記所定の大きさを示す文字列を付加する分割リ ンク付加部と、 を具備したことを特徴とする文書デ一夕処理装置。
1 0 . 端末装置からネットワーク経由で文書データの要求を受け取る要求受 信部と、 前記要求に対応する文書データを分割した複数の分割文書データの 夫々から前記分割文書デ一夕の特徴を表す情報を抽出する特徴抽出部と、 ある 前記分割文書デ一夕に他の前記分割文書データへのリンクを示すリンク情報 を付加すると共に前記リンク情報に前記特徴抽出部が抽出した前記他の分割 文書デ一夕の特徴を付加するリンク付加部と、 前記リンク情報が付加されたリ ンク付き文書データを前記端末装置に送信する送信部と、 を具備したことを特 徴とするサーバ装置。
1 1 . 端末装置からネットワーク経由で文書デ一夕の要求を受け取る要求受 信部と、 前記要求に対応する文書データを分割した複数の分割文書データの 夫々におけるデ一夕量を確認するデータ量確認部と、 ある前記分割文書デ一夕 に他の前記分割文書データへのリンクを示すリンク情報を付加すると共に前 記リンク情報に前記他の文書デ一夕を示す文字列を前記データ量確認部が確 認した前記他の分割文書デ一夕のデータ量に応じて変化させて付加するリン ク付加部と、 前記リンク情報が付加されたリンク付き文書データを前記端末装 置に送信する送信部と、 を具備したことを特徴とするサーバ装置。
1 2 . 端末装置からネットワーク経由で文書データの要求を受け取る要求受 信部と、 前記要求に対応する文書データを分割した複数の分割文書データに他 の前記分割文書データへのリンクを示すリンク情報を付加すると共に前記リ ンク情報に前記他の分割文書データを示す文字列を付加するリンク付加部と、 前記分割部に対して前記文書データを所定の大きさで再分割することを指示 する分割リンク情報を付加すると共に前記分割リンク情報に前記文書データ を分割する前記所定の大きさを示す文字列を付加する分割リンク付加部と、 前 記リンク情報および前記分割リンクが付加されたリンク付き文書データを前 記端末装置に送信する送信部と、 を具備したことを特徴とするサーバ装置。
1 3 . ユーザからの文書データの要求を受け付ける入力部と、 請求項 1 0記 載のサーバ装置に対してネットワーク経由で前記要求を送信する要求送信部 と、 前記サーバ装置から送信されてきた前記要求に対応する前記リンク付き文 書データを受信する受信部と、 受信した前記リンク付き文書データを解析し、 前記リンク付き文書データの内容と共に前記リンク情報に付加された前記特 徴を表示する表示部と、 を具備したことを特徴とした端末装置。
1 4 . ユーザからの文書データの要求を受け付ける入力部と、 請求項 1 1記 載のサーバ装置に対してネットワーク経由で前記要求を送信する要求送信部 と、 前記サーバ装置から送信されてきた前記要求に対応するリンク付き文書デ 一夕を受信する受信部と、 前記リンク付き文書デ一夕の内容と共に前記リンク 情報に付加された特徴を前記データ量に応じて変化させて表示する表示部と、 を具備したことを特徴とした端末装置。
1 5. ユーザからの文書データの要求を受け付ける入力部と、 請求項 1 2記 載のサーバ装置に対してネットワーク経由で前記要求を送信する要求送信部 と、 前記サーバ装置から送信されてきた前記要求に対応するリンク付き文書デ —夕を受信する受信部と、 前記リンク付き文書データの内容と共に前記リンク 情報に付加された前記他の分割文書データを示す文字列および前記分割リン ク情報に付与された前記所定の大きさを示す文字列を表示する表示部と、 を具 備したことを特徴とした端末装置。
1 6 . ひとつの文書デ一夕を複数に分割した分割文書デ一夕を作成し、 ある前 記分割文書データに他の前記分割文書データへのリンクを示すリンク情報に 前記他の分割文書データを示す文字列を付加したリンク付き文書データを送 信するサーバ装置に前記文書データの要求を送信する要求送信部と、 前記サ一 バ装置から送信された前記要求に対応する前記リンク付き文書データを受信 する受信部と、 前記送信された前記リンク付き文書デ一夕を保持するキヤッシ ュ部と、 前記送信されたリンク付き文書データにリンクする前記リンク先分割 文書デー夕が前記キヤッシュ部に存在するかどうかを確認するキャッシュ確 認部と、 前記キヤッシュ部に存在する前記リンク先分割文書デ一夕への前記リ ンク情報に付加された前記文字列と前記キャッシュ部に存在しない前記リン ク先分割文書データへの前記リンク情報に付加された前記文字列とを変えて 表示する文書データ表示部と、 を具備したことを特徴とした端末装置。
1 7 . 前記文書データ表示部は、 前記キヤッシュ部に存在する前記リンク先 分割文書データへの前記リンク情報に付加された前記文字列と前記キヤッシ ュ部に存在しない前記リンク先分割文書データへの前記リンク情報に付加さ れた前記文字列との色を変えて表示することを特徴とした請求項 1 6に記載 の端末装置。
1 8 . 前記文書データ表示部は、 前記キヤッシュ部に存在する前記リンク先分 割文書データへの前記リンク情報に付加された前記文字列と前記キヤッシュ 部に存在しない前記リンク先分割文書データへの前記リンク情報に付加され た前記文字列との長さを変えて表示することを特徴とした請求項 1 6に記載 の端末装置。
1 9 . 前記文書データ表示部は、 前記キヤッシュ部に存在する前記リンク先 分割文書データへの前記リンク情報に付加された前記文字列と前記キヤッシ ュ部に存在しない前記リンク先分割文書デ一夕への前記リンク情報に付加さ れた前記文字列とのフォントの大きさを変えて表示することを特徴とした請 求項 1 6に記載の端末装置。
2 0 . 請求項 1 0記載のサーバ装置と、 請求項 1 3記載の端末装置と、 を具 備したことを特徴とする文書データ処理システム。
2 1 . 請求項 1 1記載のサーバ装置と、 請求項 1 4記載の端末装置と、 を具 備したことを特徴とする文書データ処理システム。
2 2 . 請求項 1 2記載のサーバ装置と、 請求項 1 5記載の端末装置と、 を具 備したことを特徴とする文書データ処理システム。
2 3 . 1つの文書データを分割した複数の分割文書デ一夕の夫々から前記分 割文書データの特徴を表す情報を抽出し、 ある前記分割文書データに他の前記 分割文書デ一夕へのリンクを示すリンク情報を付加し、 前記リンク情報に前記 他の分割文書デ一夕の特徴を付加することを特徴とした文書デ一夕処理方法。
2 4 . 1つの文書データを分割した複数の分割文書データにおける夫々のデ 一夕量を確認し、 ある前記分割文書データに他の前記分割文書データへのリン クを示すリンク情報を付加し、 前記リンク情報に前記他の文書データを示す文 字列を前記他の分割文書データの前記データ量に応じて変化させて付加する ことを特徴とした文書データ処理方法。
2 5 . 文書データを複数の分割文書データに分割し、 ある前記分割文書デ一 夕に他の前記分割文書データへのリンクを示すリンク情報を付加し、 前記他の 分割文書データを示す文字列を付加し、 他の前記分割文書データへのリンクを 示すリンク情報を付加し、 前記分割部に対して前記文書デ一夕を所定の大きさ で再分割することを指示する分割リンク情報を付加し、 前記分割リンク情報に 前記文書データを分割する前記所定の大きさを示す文字列を付加することを 特徴とする文書デー夕処理方法。
2 6 . 文書データを送信する際に前記文書データを複数に分割した分割文書デ 一夕を作成し、 ある前記分割文書デ一夕に他の前記分割文書データへのリンク を示すリンク情報を付加すると共に前記リンク情報に前記他の分割文書デー 夕を示す文字列を付加して送信するサーバ装置に対し、 前記文書データの要求 を送信し、 前記サーバ装置から送信された前記要求に対応する前記分割文書デ 一夕を受信し、 前記送信された分割文書データにリンクする前記他の分割文書 データのうちキヤッシュ部に存在する前記他の分割文書データへの前記リン ク情報に付加された前記文字列と前記キヤッシュ部に存在しない前記他の分 割文書データへの前記リンク情報に付加された前記文字列とを変えて表示す ることを特徴とした文書データ処理方法。
2 7 . コンピュータに、 1つの文書デ一夕を分割した複数の分割文書データ の夫々から前記分割文書データの特徴を表す情報を抽出させ、 ある前記分割文 書デ一夕に他の前記分割文書データへのリンクを示すリンク情報を付加させ、 前記リンク情報に前記他の分割文書デ一夕の特徴を付加させることを特徴と したプログラム。
2 8 . コンピュータに、 1つの文書データを分割した複数の分割文書データ における夫々のデータ量を確認させ、 ある前記分割文書データに他の前記分割 文書デ一夕へのリンクを示すリンク情報を付加させ、 前記リンク情報に前記他 の文書デ一夕を示す文字列を前記他の分割文書データの前記データ量に応じ て変化させて付加させることを特徴としたプログラム。
2 9 . コンピュータに、 文書デ一夕を複数の分割文書データに分割させ、 あ る前記分割文書データに他の前記分割文書データへのリンクを示すリンク情 報を付加させ、 前記リンク情報に前記他の分割文書データを示す文字列を付加 させ、 他の前記分割文書データへのリンクを示すリンク情報を付加させ、 前記 分割部に対して前記文書データを所定の大きさで再分割することを指示する 分割リンク情報を付加させ、前記分割リンク情報に前記文書データを分割する 前記所定の大きさを示す文字列を付加させることを特徴とするプログラム。
3 0 . コンピュータに、 文書デ一夕を送信する際に前記文書デ一夕を複数に分 割した分割文書データを作成し、 ある前記分割文書データに他の前記分割文書 データへのリンクを示すリンク情報を付加すると共に前記リンク情報に前記 他の分割文書データを示す文字列を付加して送信するサーバ装置に対し前記 文書データの要求を送信させ、 前記送信された分割文書データにリンクする前 記他の分割文書データのうちキヤッシュ部に存在する前記他の分割文書デ一 夕への前記リンク情報に付加された前記文字列と前記キャッシュ部に存在し ない前記他の分割文書デ一夕への前記リンク情報に付加された前記文字列と を変えて表示させることを特徴としたプログラム。
PCT/JP2002/002396 2001-03-23 2002-03-14 Dispositif de traitement de donnees documentaires, dispositif serveur, dispositif terminal et systeme de traitement de documents WO2002077866A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP02705164A EP1372088A1 (en) 2001-03-23 2002-03-14 Document data processing device, server device, terminal device, and document processing system

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2001084803 2001-03-23
JP2001-084803 2001-03-23
JP2002-061132 2002-03-06
JP2002061132A JP2002351736A (ja) 2001-03-23 2002-03-06 文書データ処理装置、サーバ装置、端末装置、及び文書データ処理システム

Publications (1)

Publication Number Publication Date
WO2002077866A1 true WO2002077866A1 (fr) 2002-10-03

Family

ID=26611900

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2002/002396 WO2002077866A1 (fr) 2001-03-23 2002-03-14 Dispositif de traitement de donnees documentaires, dispositif serveur, dispositif terminal et systeme de traitement de documents

Country Status (6)

Country Link
US (1) US20030079183A1 (ja)
EP (1) EP1372088A1 (ja)
JP (1) JP2002351736A (ja)
KR (1) KR20030003767A (ja)
CN (1) CN1462401A (ja)
WO (1) WO2002077866A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004086846A (ja) * 2002-06-27 2004-03-18 Oki Electric Ind Co Ltd 情報区分装置、方法及びプログラム、並びに、情報区分プログラムを記録した記録媒体
US7366981B2 (en) * 2002-10-04 2008-04-29 Fuji Xerox Co., Ltd. Image forming device and method
JP3935856B2 (ja) 2003-03-28 2007-06-27 インターナショナル・ビジネス・マシーンズ・コーポレーション レイアウトの定められた文書のダイジェストを作成するための情報処理装置、サーバ、方法及びプログラム
JP4014160B2 (ja) * 2003-05-30 2007-11-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、プログラム、及び記録媒体
US9094805B2 (en) * 2003-06-25 2015-07-28 Oracle International Corporation Mobile messaging concierge
JP4340483B2 (ja) * 2003-06-27 2009-10-07 富士通株式会社 複合コンテンツの配信方法および配信システム
WO2006123429A1 (ja) * 2005-05-20 2006-11-23 Fujitsu Limited 情報検索方法、装置、プログラム、該プログラムを記録した記録媒体
JP4811069B2 (ja) * 2005-10-24 2011-11-09 大日本印刷株式会社 情報提示装置、情報提示方法、及び情報提示処理プログラム
JP4928117B2 (ja) * 2005-11-10 2012-05-09 キヤノン株式会社 画像処理装置、画像管理方法、文書管理装置、文書管理方法、コンピュータプログラム及びコンピュータ読み取り可能な記憶媒体
JP4771915B2 (ja) 2006-11-15 2011-09-14 京セラミタ株式会社 Htmlテキストを変換する装置、方法、およびプログラム
JP4865581B2 (ja) * 2007-02-08 2012-02-01 株式会社エヌ・ティ・ティ・ドコモ コンテンツ流通管理装置及びコンテンツ流通システム
JP4935396B2 (ja) * 2007-02-09 2012-05-23 日本電気株式会社 Webコンテンツ提供装置、Webコンテンツ提供方法およびプログラム
JP4700637B2 (ja) * 2007-02-28 2011-06-15 関西電力株式会社 Web文書分割方法、システム及びプログラム
CN101866256A (zh) * 2009-04-16 2010-10-20 鸿富锦精密工业(深圳)有限公司 电子设备系统及电子设备用户操作界面显示方法
JP5530217B2 (ja) * 2010-02-24 2014-06-25 富士フイルム株式会社 文書閲覧システム及びドキュメント変換サーバ
US9001390B1 (en) * 2011-10-06 2015-04-07 Uri Zernik Device, system and method for identifying sections of documents
US8504827B1 (en) * 2013-02-27 2013-08-06 WebFilings LLC Document server and client device document viewer and editor
US10417338B2 (en) 2014-09-02 2019-09-17 Hewlett-Packard Development Company, L.P. External resource identification
CN111291152A (zh) * 2018-12-07 2020-06-16 北大方正集团有限公司 案例文书的推荐方法、装置、设备及存储介质
CN109815243B (zh) * 2019-02-18 2020-03-03 北京仁和汇智信息技术有限公司 一种文档界面化修改时的结构化存储方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143498A (ja) * 1996-11-08 1998-05-29 Nippon Telegr & Teleph Corp <Ntt> リンク付与機能を持つページ分割通信中継装置
JPH10143403A (ja) * 1996-11-12 1998-05-29 Fujitsu Ltd 情報管理装置および情報管理プログラム記憶媒体
EP0949571A2 (en) * 1998-04-07 1999-10-13 Xerox Corporation Document re-authoring systems and methods for providing device-independent access to the world wide web
JP2000276471A (ja) * 1999-03-23 2000-10-06 Seiko Epson Corp リンク先情報の概要提示方法およびリンク先情報の概要提示装置ならびにリンク先情報の概要提示処理プログラムを記録した記録媒体
JP2001056778A (ja) * 1999-08-18 2001-02-27 Sharp Corp 情報取得装置及びその制御方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6266683B1 (en) * 1997-07-24 2001-07-24 The Chase Manhattan Bank Computerized document management system
US6037935A (en) * 1998-04-28 2000-03-14 International Business Machines Corporation Web page exploration indicator and method
US6769096B1 (en) * 1998-06-24 2004-07-27 Microsoft Corporation System and method for updating a table of contents in a frameset
US6754873B1 (en) * 1999-09-20 2004-06-22 Google Inc. Techniques for finding related hyperlinked documents using link-based analysis
US6839702B1 (en) * 1999-12-15 2005-01-04 Google Inc. Systems and methods for highlighting search results
US6848075B1 (en) * 2000-02-10 2005-01-25 International Business Machines Corporation Internet web browser with memory enhanced hyperlink display
US20040054973A1 (en) * 2000-10-02 2004-03-18 Akio Yamamoto Method and apparatus for transforming contents on the web
US6874019B2 (en) * 2001-03-08 2005-03-29 International Business Machines Corporation Predictive caching and highlighting of web pages

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143498A (ja) * 1996-11-08 1998-05-29 Nippon Telegr & Teleph Corp <Ntt> リンク付与機能を持つページ分割通信中継装置
JPH10143403A (ja) * 1996-11-12 1998-05-29 Fujitsu Ltd 情報管理装置および情報管理プログラム記憶媒体
EP0949571A2 (en) * 1998-04-07 1999-10-13 Xerox Corporation Document re-authoring systems and methods for providing device-independent access to the world wide web
JP2000276471A (ja) * 1999-03-23 2000-10-06 Seiko Epson Corp リンク先情報の概要提示方法およびリンク先情報の概要提示装置ならびにリンク先情報の概要提示処理プログラムを記録した記録媒体
JP2001056778A (ja) * 1999-08-18 2001-02-27 Sharp Corp 情報取得装置及びその制御方法

Also Published As

Publication number Publication date
CN1462401A (zh) 2003-12-17
US20030079183A1 (en) 2003-04-24
KR20030003767A (ko) 2003-01-10
JP2002351736A (ja) 2002-12-06
EP1372088A1 (en) 2003-12-17

Similar Documents

Publication Publication Date Title
WO2002077866A1 (fr) Dispositif de traitement de donnees documentaires, dispositif serveur, dispositif terminal et systeme de traitement de documents
US6535896B2 (en) Systems, methods and computer program products for tailoring web page content in hypertext markup language format for display within pervasive computing devices using extensible markup language tools
US9866612B2 (en) Server-based browser system
US20020129006A1 (en) System and method for modifying a document format
JP2002055997A (ja) 中古車情報検索装置及び中古車情報検索方法
CN101233510A (zh) 处理并基于无线网络将搜索结果发送到移动设备
JP2003131930A (ja) コンテンツ変換処理装置、スタイルシート自動選択方法、およびそのプログラム
CN1235315A (zh) 使用合成请求加速超文本页导航的方法和装置
Schilit et al. m-links: An infrastructure for very small internet devices
JP2000122958A (ja) サ―バによる文書の提供方法及び媒体
JP2001344169A (ja) ネットワークシステム、サーバ、ウェブサーバ、ウェブページ、データ処理方法、記憶媒体及びプログラム伝送装置
KR100855997B1 (ko) 전자 문서의 구성 가능한 변환 방법
JP2001292270A (ja) 通信端末装置
KR20030041432A (ko) 비피씨 정보단말을 위한 엑스엠엘 기반 웹 페이지 제공방법 및 그 시스템
US7085807B2 (en) System and method for providing links to available services over a local network by a thin portal service configured to access imaging data stored in a personal imaging repository
US20030149745A1 (en) Method and apparatus for accessing information from a network data source
US20030163517A1 (en) Method and apparatus for decreasing bandwidth for wireless data interchange
JP2001229106A (ja) コンテンツ変換システム
US8806326B1 (en) User preference based content linking
JP2003178086A (ja) リクエストデータを基にした情報提供システム及び方法
EP1102178A2 (en) Contents server that supplies contents described in structural description language to client over network
Kurz et al. FACADE-a framework for context-aware content adaptation and delivery
KR100351478B1 (ko) 웹 브라우저의 개인기호 설정 및 사용방법
JPH11191082A (ja) サービス中継装置
JPH11345244A (ja) 類似情報抽出表示方法とシステム

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ OM PH PL PT RO RU SD SE SG SI SK SL TJ TM TN TR TT TZ UA UG US UZ VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

WWE Wipo information: entry into national phase

Ref document number: 10275983

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 1020027015905

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 2002705164

Country of ref document: EP

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 028014456

Country of ref document: CN

WWP Wipo information: published in national office

Ref document number: 1020027015905

Country of ref document: KR

WWP Wipo information: published in national office

Ref document number: 2002705164

Country of ref document: EP

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

WWR Wipo information: refused in national office

Ref document number: 1020027015905

Country of ref document: KR

WWW Wipo information: withdrawn in national office

Ref document number: 2002705164

Country of ref document: EP