WO2002103554A1

WO2002103554A1 - Procede de traitement de donnees, programme de traitement de donnees et appareil de traitement de donnees

Info

Publication number: WO2002103554A1
Application number: PCT/JP2002/005880
Authority: WO
Inventors: Yuji Sawada
Original assignee: Sharp Kabushiki Kaisha
Priority date: 2001-06-14
Filing date: 2002-06-12
Publication date: 2002-12-27
Also published as: JP4990302B2; KR20040011537A; JP2009134741A; EP1770547A2; EP1396793A1; EP1770548A3; US20050165835A1; JP4794127B2; EP1770548A2; EP1770547B1; DE60224271T2; EP1396793B1; DE60224271D1; JPWO2002103554A1; EP1396793A4; EP1770547A3; KR100556647B1; ATE382169T1

Description

明細書

データ処理方法、データ処理プログラム、およびデータ処理装置技術分野

本発明は、データ処理方法、データ処理プログラム、データ処理装置、構造化データ、構造化データを記録したコンピュータ読取可能な記録媒体、および送信装置に関し、特に、 P皆層構造を有する電子データを処理することのできるデータ処理方法、データ処理プログラム、データ処理装置、構造化データ、構造化データを記録したコンピュータ読取可能な記録媒体、およぴ送信装置に関する。背景技術

文書記述言語の定義に従って所定の処理を実行させるための構造化された電子データであって、階層構造を有する構造化文書を記録するためのデータ形式として、 SGML (Standard Generalized Markup Language：準一般化マーク付け言語）や XML (Extensible Markup Language) などが知られている。特に XMLは、インターネットで交換する電子文書や電子データなどで近年盛んに使用されている。

XML形式の電子データを扱う処理方法として、 DOM (Document Object Model) 形式と SAX (Simple API for XML) 形式とが存在する。

DOM形式とは、対象とする電子データを全て読込み、電子データ内の全要素の階層構造を把握してから、電子データの各要素にアクセスする処理方法である。例えば、図 1 6のような階層構造をもつ電子データがある場合、いったん電子データ全体を読込み、全要素の階層構造を解析する。図 1 6は、電子データの階層構造のみを示し、本文、内容は省略している。そして、図 1 6の階層構造をもつ電子データから、図 1 7のような木構造（ツリー構造）を作成した後、各要素 (TITLE, AUTHOR など）にアクセスする。よって、 D0M形式の電子データの処理方法は、電子データの階層構造を把握した後に処理することになるため、任意の要素にアクセスしやすいという特徴がある。

これに対し、 SAX形式は、電子データを先頭から順に読込みながら、読込んだ要素のみ構劍军析し、処理していく形式の処理方法である。そのため、電子データ全体の解析処理を待たずに、順次処理していくことができ、処理速度としても、メモリの容量としても、オーバーへッドが少ないというメリットがある。

以上のように、 D0M形式おょぴ SAX形式ともにそれぞれのメリットがあるが、反面、次のようなデメリットがそれぞれにある。

すなわち、 D0M形式の場合、電子データ内の一部のデータだけを処理したい場合であっても、木構造を生成するために、電子データ全体の構造解析をしなくてはならず、処理に無駄が生じる。また、電子データのサイズが大きくなると、木構造を作成するための処理時間、および木構造を記憶しておくためのメモリ使用量が大きくなるという欠点があった。

一方 SAX形式の場合、電子データの先頭から順に処理することを前提にしたァクセス形式であるため、電子データの内容を先頭から順に処理せず、任意の要素を任意の順番に扱う場合には、無駄な読込処理、および構造解析処理が入るという欠点が存在する。また、電子データの後半の要素を処理した時であっても、電子データの先頭から読込み、構造解析をしないといけないため、処理時間として無駄が生じていた。 -

—方、 D0M形式や SAX形式ではなく、取出したい要素のみを、 P皆層構造を解析することなく取出す処理方法もある。しかしながら、取出したい領域が、どの要素の下に含まれるかによつて、その要素の意味が変わったり、表示する位置ゃサィズ、属性などが変わってしまう場合があるため、この方法では取出した要素に対して適切な処理ができない。例えば、図 1 8のような、階層構造をもつ HTML (Extensible HyperText Markup Language) 文書の例を考える。図 1 8において、領域 7 1の先頭部分は、く html>、く body bgcolor="yellow">、 <p>に挟まれている。このうち、く body bgcolor="yellow"〉は、このタグで挟まれた領域が本文データであることを示すと共に、本文の背景を黄色にすることを意味しており、このタグがあるかないかにより、本文の背景が黄色になるか、白色（省略時のデフオルト値）になるか変わってしまう。したがって、領域 7 1だけをファイルから読込んで表示処理を行なおうとしても、本文の背景が黄色であることを知ることができず、正しい表示処理ができない。

このように、一般に、 P皆層構造をもつ電子データに対しては、処理したい領域のみを読込んで処理しょうとしても、処理する領域以外に書かれた制御情報（タグゃ属性等）を知ることができないため、正しく処理できないという問題があつた。

そこで、本発明は、このような問題を解決することのできるデータ処理方法、データ処理プログラム、データ処理装置、構造化データ、構造化データを記録したコンピュータ読取可能な記録媒体、および送信装置を提供することを目的としている。発明の開示

本発明においては、上述の課題を解決するために、以下に示されるデータ処理方法、データ処理プログラム、データ処理装置、構造化データ、構造化データを記録したコンピュータ読取可能な記録媒体、および送信装置が提供される。

( 1 ) 階層構造を有する電子データと、電子データを複数のブロックに分割して処理するためのブロック補助データとからなる構造化データを処理するデータ処理方法であって、電子データから所望の電子データが含まれるプロックを読込むステップと、読込まれたプロックのプロック補助データを用いて所望の電子データの階層構造を解析するステップと、解析された結果を用いて所定の処理をするステップとを備える、データ処理方法。

( 2 ) ( 1 ) に記載されたデータ処理方法であって、電子データは表示用の文書データであり、所定の処理は、読込んだブロックの表示レイアウトを計算し表示する処理であることを特徴とする、データ処理方法。

( 3 ) ( 1 ) に記載されたデータ処理方法であって、電子データに対するブロック補助データが存在しない場合、電子データの処理をする前に、電子データに対するブロック補助データを作成するステップをさらに備えることを特徴とする、データ処理方法。

( 4 ) ( 1 ) に記載されたデータ処理方法であって、複数に分割された電子データのブロックは、ほぼ等しい大きさであることを特徴とする、データ処理方法。

( 5 ) ( 1 ) に記載されたデータ処理方法であって、ブロック捕助データは、複数に分割された電子データの各ブロックの位置情報と、ブロックの開始位置と終了位置とにおける P皆層情報とを含むことを特徴とする、データ処理方法。

( 6 ) ( 1 ) に記載されたデータ処理方法であって、電子データに、電子データ内の任意の位置にジャンプするリンク機能が含まれる場合、プロック補助データは、リンク先の位置情報を含むことを特徴とする、データ処理方法。

( 7 ) 階層構造を有する電子データを複数のブロックに分解し、分割された各プ口ックごとに所定の処理を実行させるための構造化データを生成するためのデータ処理方法であって、電子データを所定のブロックサイズに分割する際の、各ブ口ック境界における境界候捕を抽出する抽出ステップと、抽出された境界候捕に基づいて、ブロックの分割位置を決定する決定ステップと、決定された各プロックの先頭位置と終了位置とにおける階層構造の特徴を示す情報を取得する取得ステツプと、決定ステップで決定された各プロックの分割位置の位置情報と、取得された位置情報に対応する階層構造の特徴と示す情報とを含むブロック補助データを生成し、プロック補助データを電子データに追加して構造化データを生成する生成ステップとを備える、データ処理方法。

( 8 ) ( 7 ) に記載されたデータ処理方法であって、抽出ステップは、表示たときに行頭から表示される箇所から境界候補を抽出することを特徴とする、データ処理方法。

( 9 ) ( 7 ) に記載されたデータ処理方法であって、抽出ステップは、電子データの構造を記録している制御コードの前後とその付近とから境界候捕を抽出することを特徴とする、データ処理方法。

( 1 0 ) ( 7 ) に記載されたデータ処理方法であって、プロックサイズは、電子データを処理する装置の処理能力と、装.置の画面に表示される文字数と、表示される文字数を決定する要因との少なくとも 1つに応じて決められることを特徴とする、データ処理方法。

( 1 1 ) サーバより階層構造を有する電子データを受取り、電子データに対して所定の処理をするデータ処理方法において、サーバに対して所定の処理をしたい電子データ名を送信する送信ステップと、サーバより電子データを複数のプ口ックに分割して処理するためのブロック補助データを受信する受信ステツプと、電子データのうち、所定の処理をしたい電子データを含むブロックの送信をサ^"バに要求し、ブロックのデータを受信する受信ステップと、受信したプロックと、ブロックのプロック補助データとを用いて、プロックの階層構造を解析し、その結果を用いて所定の処理をする再生ステップとを備える、データ処理方法。

( 1 2 ) ( 1 1 ) に記載されたデータ処理方法であって、サーバよりプロック補助データを受信するステップにおいて、プロック捕助デ―タが存在しない場合には、プロック捕助データを作成した後、サーバより受信することを特徴とする、データ処理方法。

( 1 3 ) 階層構造を有する電子データと、電子データを複数のブロックに分割して処理するためのプロック補助データとを対として備える構造化データに対して、所定の文書記述言語の定義に従って所定の処理を実行させるためのデータ処理プログラムであって、プロック補助データに基づいて、電子データのプロックデータを読込む読込みステップと、読込まれたプロックデータと、ブロック.補助データとに基づいて、プロックデータに含まれる階層構造を解析する解析ステップと、解析結果と、文書記述言語の定義とに基づいて、プロックデータに対して所定の処理を実行させる寒行ステップとをコンピュータに実行させる、データ処理プログラム。

( 1 4 ) 階層構造を有する電子データを複数のブロックに分割し、分割された各プロックごとに所定の処理を実行させるための構造化データを生成するためのデータ処理プログラムであって、電子データを所定のブロックサイズに分割する際の、各プロック境界における境界侯補を抽出する抽出ステップと、境界候補に基づいて、ブロックの分割位置を決定する決定ステップと、決定された各ブロックの先頭位置と終了位置とにおける階層構造の特徴を示す情報を取得する取得ステップと、決定ステップで決定された各ブロックの分割情報の位置情報と、取得された位置情報に対応する階層構造の特徴を示す情報とを含むプロック補助データを生成し、ブロック補助データを電子データに追加して構造化データを生成する生成ステップとをコンビユ^ "タに実行させる、データ処理プログラム。

( 1 5 ) サーバより階層構造を有する電子データを受取り、電子データに対して所定の処理をするためのデータ処理プログラムであって、サーバに対して所定の処理をしたい電子データ名を送信する送信ステップと、サーバより電子データを複数のプロックに分割して処理するためのプロック補助データを受信する受信ステツプと、電子データのうち、所定の処理をしたい電子データを含むブロックの送信をサーバに要求し、プロックのデータを受信する受信ステップと、受信したブロックと、ブロックのブロック捕助データとを用いて、プロックの階層構造を解析し、その結果を用いて所定の処理をする再生ステップとをコンピュータに実行させる、データ処理プログラム。

( 1 6 ) 階層構造を有する電子データを処理するデータ処理装置であって、電子データには、電子データを複数のプロックに分割して処理するための捕助情報であるブロック補助データが付随し、電子データのうち、処理をしたいデータが含まれるブロックと、ブロック補助データとを読込む入力部と、ブロック補助データを用いて、読込んだ前記プロックの階層構造を解析するデータ構造解析部と、データ構造解析部の結果を用いて、所定の処理をする処理部を備える、データ処

( 1 7 ) ( 1 6 ) に記載されたデータ処理装置であって、電子データは表示用の文書ータであり、処理部は、データ構造解析部によって解析されたプロックの階層構造を用いて、読込んだプロックの表示レイアウトを計算するレイアウト計算部と、レイァゥト計算部によって求めた表示レイァゥトに基づいて表示する表示部とをさらに備える、データ処理装置。

( 1 8 ) サーバより階層構造を有する電子データを受取り、電子データに対して所定の処理をするデータ処理装置であって、電子データには、電子データを複数のプロックに分割して処理するための補助情報であるプロック補助データが付随し、電子データのうち、所定の処理をしたい電子データが含まれるプロックをサーバに伝え、プロックのデータと、ブロック補助デ^"タとをサーバより受信する送受信部と、受信したブロックと、ブロック補助データとを用いて、受信したプ口ックの階層構造を解析するデータ構造解析部と、データ構造解析部の結果を用いて、所定の処理をする処理部とを備える、データ処理装置。

( 1 9 ) ( 1 6 ) または（1 8 ) に記載されたデータ処理装置であって、携帯型の端末であることを特徴とするデタ処理装置。

( 2 0 ) 文書記述言語の定義に従って記述された電子データと、電子データを複数のブロックに分割—して処理するためのブロック捕助データとを対として備えたことを特徴とする、構造化データ。

(21) 文書記述言語の定義に従って所定の処理を実行させるための電子データと、電子データを複数のプロックに分割し、分割された各ブロックごとに所定の処理を実行させるためのブロック補助データとを対として備えたことを特徴とする、構造化データ。

(22) (20) または（21) に記載された構造化データであって、複数に分割された電子データのブロックは、ほぼ等しい大きさであることを特徴とする、構造化データ。

(23) (20) または（21) に記載された構造化データであって、ブロック補助データは、少なくとも各プロックの位置情報と、ブロックの開始位置と終了位置とにおける階層情報とを有することを特徴とする、構造化データ。

(24) (20) または（21) に記載された構造化データであって、プロック補助データは、ブロックの分割箇所を、電子データの構造を記録している制御コードの前後とその付近とから選ぶことを特徴とする、構造化データ。

(25) (20) または（21) に記載された構造データであって、プロック補助データは、プロックの分割箇所を、表示したときに行頭から表示される箇所に限定することを特徴とする、構造化データ。

(26) (20) または（21) に記載された構造化データであって、電子データに、電子データ内の任意の位置にジャンプするリンク機能が含まれる場合、ブロック補助データは、リンク先の位置情報を含むことを特徴とする、構造化データ。

(27) 文書記述言語の定義に従って記述された電子データと、電子データを複数のブロックに分割して処理するためのブロック補助データとを対として備えたことを特徴とする構造化データを記録した、コンピュータ読取可能な記録媒体。

(28) (13) 〜（15) のいずれかに記載されたデータ処理プログラムを送信する送信部を備えることを特徴とする、送信装置。

(29) (20) または（21) に記載された階層化データを送信する送信部を備えることを特徴とする、送信装置。図面の簡単な説明

第 1図は、本宪明の第 1の実施の形態におけるデータ処理装置 1 0 0のプロック図である。

第 2図は、本癸明の第 1の実施の形態における表示装置を、具体例として携帯機器で実現した場合の概観図を示す図である。

第 3図は、本実施の形態におけるブロック補助データの具体的な概略を示す図である。

第 4図は、電子データを複数のプロックに分割した様子を具体的に示す図である。

第 5図は、図 4に示される電子データに対して設定されるプロック捕助データの具体例を示す図である。

第 6図は、本発明の第 1の実施の形態におけるデータ処理装置 1 0 0の処理を示すフローチヤ一トである。

第 7図は、 1ブロック分のデータとブロック補助データとから作成したデータの具体例を示す図である。

第 8図は、完全には階層構造を有しない電子データの具体例を示す図である。第 9図は、本発明の第 2の実施の形態におけるデータ処理装置 2 0 0のプロック図である。

第 1 0図は、本努明の第 2の実施の形態におけるデータ処理装置 2 0 0の処理を示すフローチャートである。

第 1 1図は、第 2の実施の形態において、ブロック補助データを作成する際の処理を示すフーチャートである。

第 1 2八図〜第1 2 C図は、行の途中でブロック分割するデータの具体例と表示の具体例とを示す図である。

第 1 3図は、本発明の第 3の実施の形態におけるデータ処理装置のブロック図である。

第 1 4図は、第 3の実施の形態において、ブロック補助データを作成する際の処理を示すフローチャートである。第 1 5図は、本発明の第 3の実施の形態におけるデータ処理装置の処理を示すフローチヤ一トである。

第 1 6図は、 P皆層構造をもつ電子データの具体例を示す図である。

第 1 7図は、階層構造をもつ電子データから取出した木構造を説明するための図である。

第 1 8図は、階層構造をもつ電子データの具体例を示す図である。発明を実施するための最良の形態

本発明をより詳細に説明するために、添付の図面を用いてこれを説明する。第 1図は、第 1の実施の形態におけるデータ処理装置 1 0 0が表示装置である場合のデータ処理装置 1 0 0のブロック図の一例を示す図である。

図 1を参照して、サーバ 1 1 0は、ユーザからの要求を受信し、データベースに記録された電子データを送信する。ネットワーク 1 1 4は、サーバ 1 1 0とュ一ザのパーソナルコンピュータ (以下、パソコンと称する) 1 1 5とを接続する。記録媒体 1 1 1は、パソコン 1 1 5から電子データを取出してデタ処理装置 1 0 0に電子データを供給する。

なお、上述のパソコン 1 1 5を、コンビュエンスストァゃ駅構内等に設置された電子データ受信装置（図示せず）に替えて、この電子データ受信装置から電子データを取出し、記録媒体 1 1 1に記録する方式としてもよい。この場合、電子データ受信装置から電子データを取出して記録媒体 1 1 1に記録する際に、課金することが可能である。また、サーバ 1 1 0から送信される電子データを、パソコン 1 1 5を介することなく、データ処理装置 1 0 0が受信して記録媒体 1 1 1 に記録する構成であってもよい。

さらに図 1を参照して、電子データ 1 0 1は、記録媒体 1 1 1の中に記録された電子データであり、ブロック補助データ 1 0 2は、記録媒体 1 1 1に記録され、電子データ 1 0 1に付随するデータである。

上述の電子データ 1 0 1は、文書記述言語の定義に従って所定の処理を実行させるための構造化された電子データであつて、階層構造を有する構造化文書を記録するためのデータ形式である SGMLや XMLなどを用いて記録されている。プロック補助データ 1 0 2は、上述の構造化された電子データである電子データ 1 0 1を複数のプロックに分割し、分割された各プロックごとに所定の処理を実行させるデータであり、電子データ 1 0 1と対になっている。

さらに図 1を参照して、入力部 1 0 3は、電子データ 1 0 1およびブロック補助データ 1 0 2を読込む。データ構造解析部 1 0 4は、電子データ 1 0 1とプロック捕助データ 1 0 2とからデータの階層構造を解析する。処理部 1 0 5は、データ構造解析部 1 0 4で解析した階層構造に基づき、所定の処理を行なう。制御部 1 0 9は、入力部 1 0 3、データ構造解析部 1 0 4、および処理部 1 0 5の各処理部を制御する。

処理部 1 0 5は、対象とする電子データの内容、および処理内容によって構成が異なるが、データ処理装置 1 0 0が、例えばインターネットで交換する電子文書や電子データ、単行本、教科書、雑誌、小説、および論文のような文章などの表示を行なう表示装置である場合には、図 1に示すように、データ構翻?析部 1 0 4の解析結果に基づいて、文章の表示レイァゥトを計算するレイァゥト計算部 1 0 6と、求めた表示レイアウトに基づいて文章を表示する表示部 1 0 8と、スクロールなどのユーザからの指示を処理するユーザ指示処理部 1 0 7とから構成される。

また、電子データが音声である場合は、処理部 1 0 5は、読上装置に変更され、また、表示部 1 0 8には音声再生部が使用され、レイアウト計算部 1 0 6は、読む部分と読まない部分とを判定したり、強調して読む箇所とそうでない箇所とを判定したり、また各読上げの間隔（ま）を取ったりする部分に変更される。この、電子データが音声である場合、電子データの階層構造に応じて、音声の属性を変えて読上げるようにしてもよい。さらに、電子データが音声である場合、データ処理装置 1 0 0には、シナリオ解釈部、音声 ¾力部、および、再生順を管理するために各要素の同期をとる同期部が必要になる。

図 2に、上述のデータ処理装置 1 0 0を携帯型機器で実現した場合の具体例を示す。

図 2において、表示部 1 0 8は、レイアウト計算部 1 0 6で計算した表示レイアウトに基づき表示を行ない、ディスプレイなどから構成される。また、記録媒体 1 1 1は、図 1に示したように、パソコン 1 1 5や電子データ受信装置によつて、サーバ 1 1 0、およびネットワ^ "ク 1 1 4を介して文書データベースから取出された、処理対象の電子データ 1 0 1と、プロック補助データ 1 0 2とが記録された記録媒体である。この記録媒体 1 1 1を本体のデータ処理装置 1 0 0に揷入することで、表示装置であるデータ処理装置 2 0 0内に設けられた入力部 1 0 3を通してこの 2つのデータが読込まれる。さらに十字キー 1 1 2は、ユーザが文書のスクロール指示や表示させた、書籍や文書を選択する場合などに用いられる。また、ペン 1 1 3は、電子データにリンク機能が含まれるとき、リンク先にジャンプするために使われる。また、表示装置であるデータ処理装置 1 0 0から求められた確認事項に変更するためにも使用される。

なお、記録媒体 1 1 1のように、記録媒体に電子データ 1 0 1やブロック補助データ 1 0 2を記録するものではなく、データ処理装置 1 0 0の内部に記録する領域を設けて、そこに記憶するようにしてもよい。また、ネットワーク 1 1 4上のサーバ 1 1 0、あるいはデータベースにこの 2つのデータを記録し、ダウン口ードしながら処理するようにしてもよい。

次に、プロック補助データについて説明する。 ³ プロック補助データは、一般に、図 3に示すように、電子データフアイノレ名 1、ブロック情報 2、およぴリンク先情報 3の 3つの領域から構成される。

電子データファイル名 1は、このプロック補助データが、どの電子データに対応するものかを記録するために用意された領域である。ブロック補助データを、電子データ内、もしくは電子データに連結して記録する場合は、電子データファィル名 1の領域は、省略してもよい。

また、処理する電子データによっては、リンク先情報 3の領域は存在しないことがある。

以降、この 3領域の書式について、文書記述言語の定義に従って記述され、階層構造を有する電子データの具体例として XHTML文書を用いて説明する。図 1 8 に示される XHTML文書を、図 4に示されるように、 4つのブロック（プロック 1 0、ブロック 1 1、ブロック 1 2、ブロック 1 3 ) に分割する場合を考える。このとき、この XHTML文書に対するブロック補助データは、図 5に示されるようになる。

図 5を参照して、プロック補助データの領域 2 0は電子データフアイ/レ名 1の領域であり、図 4の XHTML文書のファイル名が記録される。

ブロック捕助データの領域 2 1〜 3 7は、プロック情報 2の領域である。

領域 2 1はプロック数を記録する領域であり、 4つのプロックに分割する場合には 4が記録される。

領域 2 2〜2 5、 2 6〜2 9、 3 0〜3 3、 3 4〜 3 7は、それぞれプロック 1 0， 1 1， 1 2 , 1 3に対するブロック情報の領域である。一般に、 n個のブロックに分割する場合、領域 2 2〜 2 5のプロック情報の構造が n回繰返し記録される。

領域 2 2， 2 6 , 3 0 , 3 4にはそれぞれのプロックの開始位置が、領域 2 3 , 2 7 , 3 1， 3 5にはそれぞれのプロックの終了位置が、ファイル先頭からのバィト数の形で記録される。したがって、ブロック 1 1に属するデータを取出したい場合は、領域 2 6と領域 2 7とのプロック情報の値を調べ、ファイルの先頭から数えて 2 1 2バイト目から 4 2 3バイト目を読込めばよい。

領域 2 4 , 2 8， 3 2 , 3 6には、各プロックの開始位置において、終了されていない開始タグを記録する。領域 2 4のブロック情報は、プロック 1 0の開始位置において終了されていない開始タグを記録する領域であるが、ブロック 1 0 はファイルの先頭から始まっているため、領域 2 4に記録する制御コードは存在しない。プロック 1 1の開始位置ではく html>が閉じられていないため、領域 2 8

'一、

にはく html>を記録する。また、ブロック 1 2の開始位置のように、複数のタグ

(く html>、く body bgcolor yellow"〉、 <p> ) が閉じられていない場合は、 <html><body bgcolor= yellow Xp>のように、出現順に連結して領域 3 2にブロック情報を記録する。なお、く body>タグのように属性（bgcolor yellow") をもつ場合は、属性を付けたまま記録する。プロック 1 3も同様にして、 <htmlXbody bgcolor ' yellow"〉と領域 3 6にプロック情報を記録する。

領域 2 5 , 2 9， 3 3 , 3 7には、各ブロックの終了位置において閉じられていないタグの終了タグを記録する。ブロック 1 0の終了位置においては、く htnil〉タグが終了されていないため、領域 2 5にはブロック情報く /html〉を記録する。また、ブロック 1 1の終了位置においては、く html>、く body bgcolor^yellow'^, く _P>タグが閉じられていないため、出現順とは逆の順番で、上記の終了タグをく /_PX/body〉</html〉と連結してプロック情報を領域 2 9に記録する。同様にして、ブロック 1 2に対してはブロック情報く/ bodyX/html〉を記録する。ブロック 1 3 の終了位置では全てのタグが閉じられているので、領域 3 7には何も記録しない。領域 3 8〜 4 1は、リンク先情報 3の領域であり、図 1 8の XHTML文書のうち、リンク先として指定されたラベル位置を記録する。

ここで、 XHTML文書のリンクについて簡単に説明する。 XHTML文書では、 <a〉タグによって他のファイルやファイルの一部へリンクをはることができる。例えば、図 4のリンク先情報 3， 4は、同一ファイルの一部へのリンクがはられた例である。この例で、リンク先情報 3の〈a〉タグで囲まれた文字列" BBBがクリックされると、 href 属性で指定されたラベル〃 SUMMARY"が設定されている場所、つまり、く a〉の name属性に" SUMMARY〃が設定されているリンク先情報 4に表示位置をジャンプさせる。

図 5において、領域 3 8〜4 1には、リンク先のラベルの位置情報、つまり〈a〉タグの narae属性により設定されているラベルの位置情報を記録する。図 4の XHTML文書の場合、 name属性をもつく a>タグは 1つし力存在しないため、領域 3 8には 1を記録し、領域 3 9〜 4 1の組合わせを 1回だけ記録する。

—般的に、 name属性をもつ <a>タグが n個ある場合は、領域 3 9〜4 1の構造のリンク先情報が n回繰返される。領域 3 9にはく a>タグの name属性に記録されたラベル名を、領域 4 0， 4 1にはく a>タグに挟まれた文字列の開始位置および終了位置をファイル先頭からのパイト数で記録する。

なお、ブロックの大きさは、装置の処理能力から決定される。すなわち、ブロックの大きさが大きいほど 1ブロックあたりの処理量が増えるため、処理時間が増大し、使用するメモリ容量やリソース容量も増大する。そのため、プロックの大きさは、装置の処理能力に応じて決定されることが望ましい。装置の処理能力を決定する要因として、装置に搭載されている C P U (Central Processing Unit) の処理能力、メモリ容量、およびリソース容量等が挙げられる。

一方、ブロックの大きさは、画面に表示される文字数やそれを決定する要因によっても決定される。例えば、電子書籍等の文章を表示する装置においては、 1 画面分の表示をした後、ユーザによるページ移動の指示があるまで待機するように設計されていることが多い。この場合、画面に表示される文字数に対してプロックの大きさを極端に大きく設定した場合には、本実施の形態における処理方法ではプロックを 1つの単位として読込むため、画面に表示しない不杲なデータも読込まれることになり、無駄が生じてしまうとになる。したがって、画面に表示される文字数に基づき、ブロックの大きさが決定されることが望ましい。なお、画面に表示される文字数は、表示装置の備える画面の大きさおよび解像度、表示する文字のフォント数、行間や字間の大きさ、および余白の大きさ等によって変わるため、これらの要因によってプロックの大きさを変えるようにしてもよい。このブロック補助データは、対象とする電子データの種類によって構成および書式が若干異なる。一般に ML形式で書かれた電子データの場合、図 3のリンク先情報 3を除き、電子データファイル名 1、ブロック情報 2の 2領域は存在し、書式も同じになる。リンク先情報 3は、 XHTML文書の機能であるリンク機能のための情報であるため、 XHTML文書などの電子書籍以外の電子データに対レては存在しないこともある。し力し、他のブロック内のデータを参照しながら処理を進めるような電子データや、ユーザの動作に応じて他プロック内のデータを表示させたり、もしくは再生させたりする機能をもつような電子データの場合は、ァクセスしゃすくするために、そのデータがどこにあるかをこのリンク先情報 3に記録しておくとよい。

また、適用可能な電子データは XML形式に限らない。一般に階層構造をもつ構造化文書に対して適用可能であり、具体的には、プロック情報 2の開始終了位置制御コードに、ブロックの開始 Z終了位置での階層構造がわかるように、それぞれの書式で記録しておけばよ、。

次に、この電子データとブロック補助データとによるデータ処理装置 1 0 0の動作について、表示装置を例に挙げて説明していく。図 6に表示装置でのフローチヤ一トを示す。

図 6を参照して、まず、ユーザ指示処理部 1 0 7を通じ、ユーザから表示したい電子データが指定され（ステップ S 1 0 1 ) 、の電子データに対して用意されたブロック補助データを入力部 1 0 3より読込む（ステップ S 1 0 2 ) 。

次に、ステップ S 1 0 2で読込んだブロック補助データのうち、各ブロックの開始 Z終了位置と、画面に表示しようとしている領域のファイル先頭からの位置とを元に、どのプロックを読込むかを判断し（ステップ S 1 0 3 ) 、必要なブロックのみを入力部 1 0 3より読込む（ステップ S 1 0 4 ).。

そして、ステップ S 1 0 2で読込んだプロック補助データの内容を参照し、読込んだプロックの開始 Z終了位置における制御コードを調べる。そして、開始位置制御コード、ブロックデータ、終了位置制御コードの順に連結し、階層構造を解析し、木構造を作成する（ステップ S 1 0 5 ) 。

例えば、図 4のブロック 1 2を読込んだ場合には、図 5のブロック補助データの領域 3 2と領域 3 3とにあるブロック情報を前後に連結した、図 7のようなデータを作成し、階層構造を解析する。図 7において、領域 5 1のデータが領域 3 2のブロック情報に記録された制御コード、領域 5 2のデータがステップ S 1 0 4で読込んだプロック 1 2のデータ、およぴ領域 5 3が領域 3 3に記録された制御コードである。なお、図 7のように、必要ならば、先頭に領域 5 0のデータのような、 L宣言と文書型宣言とを付けてもよい。このステップ S 1 0 5の処理はデータ構造解析部 1 0 4で行なわれる。

次にレイァゥト計算部 1 6 0により、ステップ S 1 0 5で作成した 1プロック分の木構造を元に、表示画面内でのレイアウトを計算する（ステップ S 1 0 6 ) 。この結果、表示部 1 0 8がもつ表示画面全体めレイァゥトが決まれば（ステップ S 1 0 7 ) 、ステップ S 1 0 8に移り、表示部 1 0 8に表示する。

一方、ステップ S 1 0 7において、まだ表示画面のうちレイアウトが決まっていない領域があればステップ S 1 0 4に戻り、次のブロックを読込み、木構造を作成して（ステップ S 1 0 5 ) 、 1つ前のプロックに対して求めたレイアウト画面の続きから、現在のブロックのレイアウト処理を行なう（ステップ S 1 0 6 ) 。続くステップ S 1 0 7， S I 0 8の処理は、先に説明した処理と同様の処理を行なう。

ステップ S 1 0 8で表示部 1 0 8に表示した後は、ステップ S 1 0 9に移り、ユーザからの指示を待つ。ユーザからの指示があるまでステップ S 1 0 9で待機する。

ここで、ユーザから表示処理の終了が指示された場合、表示処理を終了する。ステップ S 1 0 9において、ユーザから次ページ、あるいは前ページのスクロール指示があった場合、ステップ S 1 1 1に移り、ユーザから受けたスクロール指示の結果、次に表示する内容が現在のプロックと同じかどうかを判断する。もし同じならば、ステップ S 1 0 6に移り、先に作成した木構造を元にレイアウト処理をし、以下先に説明した処理と同様にして、ステップ S 1 0 7以降の処理を続ける。

また、ステップ S 1 1 1の判断の結果、現在と異なるブロックと判断された場合は、ステップ S 1 0 4に移り、表示に必要なプロックを読込み、以下先に説明した処理と同様にして、ステップ S 1 0 5以降の処理を続ける。

一方、ステップ S 1 0 9において、リンクジャンプなどにより、他の領域へ飛ぶように指示された場合、ステップ S 1 1 0に移り、移動先が他ファイルへの移動か自ファイル内への移動かを調べる。例えば、 XHTML文書では、 href属性をもつく 3>タグで挟まれた文字列がクリックされると、 href 属性の値から、他ファィノレへのリンク力、自ファイル内へのリンクがが判断される。その結果、自フアイノレ内へのリンクであった場合、ステップ S 1 1 1に移り、リンク先が現在のプロックと同じかどうか判断する。この時、プロック補助データに記録されたリンク先情報 3を参照して、リンク先がどのブロックに含まれるかを調べる。例えば、図 5の例の場合、領域 3 8〜 4 1のプロック情報を参照し、 <a>の href属性で指定されたリンク先のラベルが、ファイル内のどの位置にあるかを調べる。その後、領域 2 1 - 3 7のプロック情報を参照して、その位置がどのプロックに含まれるかを調べることでリンク先のブロックを調べる。

求められたリンク先のプロックが現在のプロックと同じであれば、ステップ S 1 0 6に移り、以降、先に説明した処理と同様の処理を行なう。

一方、リンク先のブロックが現在のブロックと別のプロックであれば、ステツプ S 1 0 4に移り、そのブロックを読込み、以降、先に説明した処理と同様の処理を行なう。

また、ステップ S 1 1 0の判断の結果、リンク先が他のファイルであった場合は、ステップ S I 0 2に移り、リンク先のファイルに対して用意されたブロック補助データを読込み、以降、先に説明した処理と同様の処理を行なう。

上記のようにプロック補助データを用いて処理することで、電子データの一部のみのデータを読込んで処理することができるため、高速かつ低メモリでの処理ができる。

なお、本実施の形態では、所々で XHTML文書を例に挙げながら説明したが、以上の説明から明らかなように XHTML文書の表示装置に対象を限定するものではない。 XHTML文書のようなリンク機能をもち、階層構造を有する電子データの表示装置に対しては、図 3のプロック補助データ、および図 6のフローチャートが適用可能である。また、リンク機能をもたない電子データの場合も、図 3のリンク先情報 3と図 6のステップ S 1 1 0とを省略することで適用可能である。例えば、日本電子出版協会が標準化を進めている JepaX (JEPA電子出版交換フォーマツト）、日本電子プックコミツティーが提案しているネットワーク電子プックフォ一マツト（Network Electronic Book Format) など、 XMLなどにより記録された階層構造を有する電子データであれば、図 6と同様にして処理ができる。

また、本発明は、ブロック捕助データを用意することにより、階層構造をもつ電子データの一部分のみを読出して処理できることに特徴がある。そのため、図 1のプロック図において、処理部 1 0 5を処理装置固有の処理に替えることで、表示装置に限らず、他の処理装置に対しても本発明を適用できる。この時、図 6 のフローチャートにおいては、ステップ S 1 0 6〜S 1 0 8の処理が、処理装置固有の処理に替わる。例えば、文章の読上げ装置の場合、電子データのうち読上げる個所と読上げない個所とを判断するステップや、個所に応じて読上げる音質や強度を設定するステツプゃ、音声再生するステツプなどの処理に置換えられる。一方、本実施の形態においては、 XML などのように階層構造を有する電子データを対象に説明をしてきたが、 HTML文書のように、完全には階層構造を有しない電子データに対しても適用可能である。

例えば、 HTML文書にはく basefont>という基準フォントのサイズを指定するタグがある。図 8の領域 7 2に示されるように指定すると、それ以降の文章の階層構造に関係なく、次のく basefont〉タグの指定が来るまで、基準フォントのサイズが 3 (size="3"で指定）に設定される。例えば、領域 7 2に示されるく basefont〉は、く P〉タグやく u〉タグなどに挟まれているが、く p>やく u〉の終了タグが現れても設定が持続されるため、階層構造が崩れてしまっている。このように、階層構造を無視して効果が持続されるようなタグが存在する場合には、このタグを含むプロックの終了位置制御コードにそのタグの終了タグも記録し、次ブロック以降にも、開始位置制御コードにそのタグを、終了位置制御コードにそのタグの終了タグを追加しておくことにより、別のブロックのみを処理する場合でも、そのタグの効果がそのブロックにかかっていることを知ることができる。そのため、図 6と同様な処理が可能となる。

(第 2の実施の形態）

次に、本発明の第 2の実施の形態について説明する

図 9は、本発明の第 2の実施の形態に係るデータ処理装置 2 0 0のブロック図の一例である。

図 9を参照して、電子データ 2 0 1は、本データ処理装置 2 0 0で処理される電子データである。プロック補助デ^ "タ 2 0 2は、電子データ 2 0 1に付随するブロック補助データである。

入力部 2 0 3は、電子データ 2 0 1とプロック補助データ 2 0 2とを読込む。データ構造解析部 2 0 4は、電子データ 2 0 1とプロック補助データ 2 0 2と力らデータの階層構造を解析する。プロック補助データ作成部 2 0 5は、プロック捕助データ 2 0 2が存在しない場合に電子データ 2 0 1からプロック捕助データを作成する。処理部 2 0 6は、データ構造解析部 2 0 4で解析した階層構造に基づき所定の処理を行なう。制御部 2 1 0は、入力部 2 0 3、デタ構造解析部 2 0 4、プロック捕助データ作成部 2 0 5、および処理部 2 0 6の各処理部を制御する。電子データ 2 0 1とブロック捕助データ 2 0 2とは、第 1の実施の形態と同様に記録媒体 1 1 1に記録され、データ処理装置 2 0 0に読込まれる。

上述の処理部 2 0 6は、対象とする電子データの内容、および処理内容によつて構成が異なるが、このデータ処理装置 2 0 0が文章などの表示を行なう表示装置である場合には、図 9に示すように、データ構造解析部 2 0 4の解析結果に基づいて、文章の表示レイアウトを計算するレイアウト計算部 2 0 7と、計算した表示レイァゥトに基づいて表示する表示部 2 0 9と、スクロールなどのユーザからの指示を処理するユーザ指示処理部 2 0 8とから構成される。

図 1 0に処理装置 2 0 0での処理のフローチャートを示す。

図 1 0を参照して、まず、ユーザより、キーボード、マウス、およびペン等を使用して、処理する電子デ^ "タが指定されると（ステップ S 2 0 1 ) 、ユーザ指示処理部 2 0 8を通じステップ S 2 0 2により、その電子データに対するプロック補助データが存在するかどうかが判断される。もし、存在していれば、上述の第 1の実施の形態と同様の処理となり、図 6のステップ S 1 0 2以降の処理が行なわれる。

もし、ステップ S 2 0 2において対応するブロック補助データが存在しないと剌断されれば、ステップ S 2 0 3によりブロック補助データが作成され、引続き図 6のステップ S 1 0 2以降の処理が行なわれる。ステップ S 1 0 2以降の処理は、第 1の実施の形態で説明した処理と同じであるため、ここでの説明を繰返さない。

次に、ステップ S 2 0 3の処理について、詳しく説明する。

プロック補助データ作成部 2 0 5では、入力部 2 0 2より入力した電子データを複数のプロックに分割し、それぞれのブロックの開始 Z終了位置での制御コ一ドを調べ、図 3に示したブロック補助データを作成する。

この、ステップ S 2 0 3での処理のフローチヤ一トを図 1 1に示す。

図 1 1を参照して、まず、ブロックサイズの目標値 Tを設定する（ステップ S 3 0 1 ) 。先述の如く、適切なプロックサイズは、処置装置の処理能力や、画面に表示される文字数およびそれを決定する要因に基づいて決定されることが望ましい。そのため、これらのパラメータに基づきブロックサイズの目標値 Tを設定する。なお、目標値 Tの設定には、処理装置が予め備えるデフォルト値、もしくはユーザにより指定された値を用いてもよい。

図 5に示されるプロック補助データは、プロックサイズの目標値を 2 0 0バイトに設定して作成されたものである。ここで、設定するプロックサイズを目標値としたのは、一般に、ブロック分割できる個所に制限があるためである。詳しくはステップ S 3 0 3の説明で述べる。さて、ステップ S 3 0 1によりプロックサイズの目標値 Tが設定されると、ステツプ S 3 0 2に移り、ファイル先頭から Τバイト目を挟んだ Xバイトの領域を、ブロック境界の探索範囲に設定する。 Xの値は、例えば、プロックサイズの目標値 Τの半分に設定する。そして、ステップ S 3 0 3において、その探索範囲内における境界候補を抽出する。

境界候補は、対象とする電子データの種類によって変わるが、例えば、電子データが XML文書である場合は、区切る個所はタグやコメント、および文字列の途中ではなく、タグの直前か直後かで区切る。例えば、〃く div

いうデータ列がある場合、 "く div

しくは直後、または "く/ div の直前か直後かにブロックの境界を設定する。タグの途中で区切らないのは、 "く div

と、タグ名ゃ属 '性名、属性値が途中で切れてしまう可能性があるためであり、文字列要素" abcdef"の途中で区切らないのは、タグで挟まれた文字列や文章が、それ自身で 1つの意味のある文字列や文章を形成している場合が多く、意味のある文字列や文章を途中で分断することは避けた方が望しいためである。

さらに、データ処理装置 2 0 0が XHTML文書のような電子書籍を表示する表示装置である場合は、上記の制限に加え、改行タグの直後や、段落の先頭など、行頭から表示が始まる個所を境界候捕とすることが望ましい。例えば、図 1 2 Aに具体例が示される XHTML文書を、行の途中で 2つのブロック 6 0， 6 1に区切つた場合を考える。この時、 XHTML文書の先頭から表示した場合の表示例を図 1 2 Bに示す。

プロック 6 0が行の途中で終わる場合、ブロック 6 1は行の途中（3行目の 7 文字目以降）からレイアウトされることになる。一方、ユーザ等により、ブロック 6 1の先頭から表示するよう指示された場合、プロック 6 1のみを読込んでレィアウト計算がされるため、図 1 2 Cのようにプロック 6 1は行の先端から表示される。そのため、ユーザによって、ブロック 6 1から 6 0へ、文章とは逆方向にスクローノレ指示がされると、図 1 2 Bと図 1 2 Cのようにプロック 6 1の表示開始位置が異なるため、プロック切替わり時に表示が乱れてしまう。

これに対し、プロックの分割位置を行頭から表示が始まる個所に限定しておくと、直前のブロックのレイアウト結果によることなく、常に行頭からレイアウトすることになるため、このような問題が生じない。よって、 XHTML文書のような電子書籍の場合は、プロックの境界候捕を、タグの直前もしくは直後であり、し力も表示が常に行頭となる個所から抽出する。 '

次に、ステップ S 3 0 3により抽出された境界候捕の数により、ズテツプ S 3 0 4により条件が分岐される。

もし境界候補が見つからなければ、ステップ S 3 0 2に移り、探索範囲をファィノレの下方にずらして、先に述べたのと同様にしてステップ S 3 0 2以降の処理をする。

一方、境界候捕が存在していれば、ステップ S 3 0 2で設定した探索範囲の中心に一番近い候補を選び、境界に設定する（ステップ S 3 0 5 ) 。そして、ステップ S 3 0 6により、ブロックの開始/終了位置の、ファイル先頭からの位置および階層関係を調べ、プロック情報 2に記録する 1プロック分の情報を取得する。そしてこのブロックの終端がファイルの終端かどうかを調べ（ステップ S 3 0 8 ) 、終端でなければステップ S 3 0 2に移り、次のプロックの調査を続ける。一方、ファイルの終端と一致すれば、ステップ S 3 0 8により、 S 3 0 1から S 3 0 7で調べたプロック情報と電子データのファイル名とをブロック捕助データに記録する。この時、もし必要ならばリンク先情報も調査し、ブロック捕助データに記録するようにする。ステップ S 3 0 8が終わると、ブロック捕助データ作成処理が終了する。

なお、本実施の形態は、プロック補助データ作成部 2 0 5がデータ処理装置 2 0 0内にある場合について説明したが、プロック補助データ作成部 2 0 5を第 1 の実施の形態で説明したサーバ 1 1 0に備え、そこでプロック補助データを作成することも可能である。

この場合の処理の流れは本実施の形態で説明した通りである。また、ブロック補助データ作成部 2 0 5の機能を実現するハードウェアまたはソフトウェアを汎用のパーソナルコンピュータ（図示せず）に組込むことにより、一般的な文書記述言語で記述されたコンテンツを本願特有のデータ構造を備えるコンテンツに変換させることができる。このようにして生成されたコンテンツを図 1のサーバ 1 1 0にアップロードして、サーバ 1 1 0からユーザのパソコン 1 1 5にダウン口ードさせることができる。このような構成により、データ処理装置 1 0 0に表示させるコンテンツを作成し販売するシステムを構築することができる。このようなシステムは、データ処理装置 1 0 0が電子ブックビューァの場合には、汎用の文書記述言語で記述された電子ブックコンテンツをデータ処理装置 1 0 0専用のデータ構造に変換して提供する場合に有効である。

また、本実施の形態では所々で表示装置を例に挙げて説明したが、以上の説明力ら明らかなように、本発明は、プロック補助データを作成して処理することによって、階層構造をもつ電子データの一部分のみを読出して処理できることに特徴がある。そのため、図 9のブロック図において、処理部 2 0 6を処理装置固有の処理部に替えることで、表示装置に限らず、一般のデータ処理装置に対しても本発明を適用できる。

(第 3の実施の形態）

次に、本筅明の第 3の実施の形態について説明する。

図 1 3は、本発明の第 3の実施の形態に係るデータ処理装置のプロック図の一例である。説明のため、データ表示装置を例に挙げて説明する。 - 図 1 3に示すように、本実施の形態におけるデータ表示装置は、文書 D B (データベース） 3 0 1、サーバ処理部 3 0 2、およびクライアント処理部 3 0 4の大きく 3つに分かれ、サーバ処理装置 3 0 2とクライアント処理部 3 0 4とはネットワーク回線 3 0 3により接続されている。

文書 D B 3 0 1には処理する電子データおよびそれに付随するプロック補助データが格納されている。

サーバ処理部 3 0 2は、文書 D B 3 0 1から電子データとブロック補助データとを読込む入力部 3 0 5と、電子データに対するプロック補助データが存在しないときにブロック補助データを作成し文書 D B 3 0 1に記録するプロック補助データ作成部 3 0 6と、クライアント処理部 3 0 4からの要求を受付けると共に、指定されたデータをクライアント処理部 3 0 4に送信する送受信部 3 0 7とから構成される。

クライアント処理部 3 0 4は、処理する電子データやスクロール指示などのュ一ザからの指示を処理するユーザ指示処理部 3 0 9と、ユーザ指示処理部 3 0 9 で解析したユーザからの指示内容などをサーバ処理部 3 0 2に送信すると共に、サーバ処理部 3 0 2から送られてきたデータを受信する送受信部 3 0 8と、サーバ処理部 3 0 2から送られてきた電子データの階層構造を解析するデータ構造解析部 3 1 0と、データ構造解析部 3 1 0で解析された階層構造を用いて、電子データの表示レイアウトを計算するレイアウト計算部 3 1 1と、レイアウト計算部 3 1 1によって計算したレイァゥトに基づき表示する表示部 3 1 2とから構成される。なお、レイアウト計算部 3 1 1によって表示レイアウトを計算した結果、表示部 3 1 2の途中までし力表示レイアウトが定まらなかった場合、送受信部 3 0 8を通じて、必要なデータを送信するようにサーバ処理部 3 0 2に要求を出す場合もある。

次に、図 1 4、図 1 5を使って、本実施の形態のデータ表示装置における処理の流れを説明する。

図 1 4を参照して、まず、ユーザから処理したい電子データが指定されると、サーバ処理部 3 0 2に処理したい電子データのフアイノレ名が送られる（ステップ S 3 0 1 ) 。サーバ処理部 3 0 2では、その電子データに対するブロック補助データが文書 D B 3 0 1内に存在するかどうかを調べ（ステップ S 3 0 2 ) 、存在していなければステップ S 3 0 3に移り、ブロック捕助データを作成し、ステツプ S 3 0 4に移る。ステップ S 3 0 3での処理は、図 1 1を用いて説明した処理と同様であるため、ここでの説明は繰返さない。一方、ステップ S 3 0 2でプロック捕助データが存在していた場合は、何もせずステップ S 3 0 ⁴に移る。

そしてステップ S 3 0 4において、ブロック補助データがクライアント処理部 3 0 4に送られ、クライアント処理部 3 0 4で受信される（ステップ S 3 0 5 )。なお、このうちステップ S 3 0 1において、表示部 3 1 2の画面サイズやメモリ量などからブロック分割する際のサイズの目標値を、電子データのファイル名と共に伝え、サーバ処理部 3 0 2はそのブロックサイズを元に、ブロック補助デ' ータを作成するようにしてもよい。このように構成することで、クライアント処理部 3 0 4の処理能力に応じたブロック分割が可能となり、最終的にユーザの使い勝手の向上につながる。次に、図 1 5を参照して、クライアント処理部 3 0 4は、ブロック捕助データを受信すると.、受取ったプロック補助データを解析し、各ブロックの開始/"終了位置と、画面に表示しょうとしている領域のファイル先頭からの位置を元に、どのプロックを読込みかを判断し、読込みたいプロックをサーバ処理部 3 0 2に伝える（ステップ S 3 0 6 ) 。

サーバ処理部 3 0 2はその要求を受付けると、指定されたブロックを文書 D B 3 0 1から読込み、クライアント処理部 3 0 4に返す（ステップ S 3 0 7 ) 。クライアント処理部 3 0 4は、受取ったブロックデータとプロック捕助データの内容とから、先に述べたステップ S 1 0 5と同様の処理を行ない、以降ステップ S 1 0 6力ら、先に述べたステップ S 1 0 5と同様の処理を行なう（ステップ S 3 0 9〜ステップ S 3 1 4 ) 。

このようにすることで、処理する電子データがサーバ上にある場合でも、階層構造を考慮しながら電子データの一部分のみを読込んで処理ができるため、電子データ全体を読込んで処理する場合に比べ、高速に処理ができ、使用するメモリも少なくて済む。また電子データの一部のみを処理する場合には、ネットワーク上でやり取りするデータ量を減らすことも可能である。

なお、本実施の形態においては、ブロック補助データ作成部 3 0 6がサーバ処理部 3 0 2内にある場合について説明したが、ブロック補助データ作成部 3 0 6 を文書 D B 3 0 1、あるいはクライアント処理部 3 0 4に備え、ブロック捕助データを文書 D B 3 0 1、あるいはクライアント処理部 3 0 4で作成することも可 H¾ C?ある。

また、上記の説明ではデータ表示装置を例に挙げて説明したが、以上の説明から明らかなように、本発明はブロック捕助データを用いて処理することによって、階層構造をもつ電子データの一部分のみを受信して処理できることに特徴がある。そのため図 1 3のブロック図において、レイアウト計算部 3 1 1および表示部 3 1 2を処理装置固有の処理部に替えることで、表示装置に限らず、一般のデータ処理装置に対しても本発明を適用できる。

また、上述の第' 1〜 3の実施の形態における処理の一部または全部を、コンビユータによる処理に適した命令の順番付けられた列からなるもの（プログラム）として提供することも可能である。さらに、これらのプログラムは、そのプログラムのインスト一ノレ、実行、プログラムの流通のために、そのプログラムを記録したコンピュータ読取可能な記録媒体として提供することも可能である。

また、上述のプログラムまたは第 1〜 3の実施の形態におけるデータ構造を備えるコンテンツデータを、ネットワークを介してサーバ装置からクライアント装置に送信して提供することも可能である。その場合は、例えば、図 1のサーバ 1 1 0にプログラムまたはコンテンッデータを送信する送信部を備えることにより実現可能である。

本実施の形態におけるデータベース処理装置が、以上のように構成されていることで、階層構造をもつ電子データであっても、電子データに対して用意したプロック補助データを用いて、階層構造を考慮しながら、電子データの一部分のみを読込んで処理ができる。そのため、電子データ全体を読込んで処理する場合に比べ、高速に処理ができ、使用するメモリも少なくて済む。また、プロック補助データにリンク先の位置情報を用意することで、 XHTML文書のリンク機能のように任意のブロックに移動する場合であっても、高速に移動ができる。

また、第 2の実施の形態におけるデータ処理装置では、ブロック補助データをもたない電子データであっても、いったんブロック補助データを作成した後に処理するようにしたので、プロック補助データをもたない電子データに対しても、同様に高速かつ低メモリ使用量で処理ができる。

さらに本実施の形態におけるデータ処理装置は、ブロックの大きさをほぼ均等な大きさに分割するので、ユーザからのスクロール指示によって前後のプロックに表示を移動する場合であっても、ほぼ同じ処理時間で表示される。そのため、ユーザにあまり違和感を感じさせないというメリットがある。また、サイズが極端に大きいプロックが存在すると、処理装置によっては、作業用メモリが不足して正常に動作しない可能性があるが、大きさがほぼ均等となっているため、そのような問題も生じにくくなる。

また、第 3の実施形態におけるデータ処理装置では、電子データおよびプロック補助データがネットワーク接続されたサーバ上にある場合でも、階層構造を考盧しながら、電子データの一部分のみを読込んで処理ができる。そのため、電子データ全体をサ一バからダウンロードして処理する場合に比べ、高速に処理ができ、使用するメモリも少なくて済む。

なお、今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味おょぴ範囲内でのすべての変更が含まれることが意図される。産業上の利用可能性

以上のように、この発明によれば、階層構造をもつ電子データを、高速にかつ低メモリで処理することができるので、本発明は、データ処理方法、データ処理プログラムおよびデータ処理装置に有利に適用することができる。

Claims

請求の範囲

1 · 階層構造を有する電子データと、前記電子データを複数のプロックに分割して処理するためのプロック補助データとカらなる構造化データを処理するデータ · 処理方法であって、

前記電子データから所望の電子データが含まれるブロックを読込むステップと、前記読込まれたプロックのプロック補助データを用いて前記所望の電子データの階層構造を解析するステップと、 '

前記解析された結果を用いて所定の処理をするステップとを備える、データ処理方法。

2 . 前記電子データは表示用の電子データであり、前記所定の処理は、前記読込んだブロックの表示レイアウトを計算し表示する処理であることを特徴とする、請求の範囲の第 1項に記載のデータ処理方法。

3 . 前記電子データに対するプロック捕助データが存在しない場合、前記電子デタの処理をする前に、前記電子データに対するブロック補助データを作成するステップをさらに備えることを特徴とする、請求の範囲の第 1項に記載のデータ処理方法。

4. 前記複数に分割された電子データのプロックは、ほぼ等しい大きさであることを特徴とする、請求の範囲の第 1項に記載のデータ処理方法。

5 . 前記プロック捕助データは、前記複数に分割された電子データの各プロックの位置情報と、前記プロックの開始位置と終了位置とにおける階層情報とを含むことを特徴とする、請求の範囲の第 1項に記載のデータ処理方法。

6 . 前記電子データに、前記電子データ内の任意の位置にジャンプするリンク機能が含まれる場合、前記ブロック補助データは、前記リンク先の位置情報を含むことを特徴とする、請求の範囲の第 1項に記載のデータ処理方法。

7 . 階層構造を有する電子データを複数のプロックに分解し、前記分割された各ブロックごとに所定の処理を実行させるための構造化データを生成するためのデータ処理方法であって、

前記電子データを所定のプロックサイズに分割する際の、各プロック境界における境界侯捕を抽出する抽出ステップと、

前記抽出された境界候捕に基づいて、前記プロックの分割位置を決定する決定ステップと、

前記決定された各プロックの先頭位置と終了位置とにおける前記階層構造の特徴を示す情報を取得する取得ステップと、

前記決定ステップで決定された各プロックの分割位置の位置情報と、前記取得された前記位置情報に対応する前記階層構造の特徴と示す情報とを含むプロック補助データを生成し、前記プロック補助データを前記電子データに追加して前記構造化データを生成する生成ステップとを備える、データ処理方法。

8 . 前記抽出ステップは、表示したときに行頭から表示される箇所から前記境界候補を抽出することを特徴とする、請求の範囲の第 7項に記載のデータ処理方法。 9 . 前記抽出ステップは、前記電子データの構造を記録している制御コードの前後とその付近とから前記境界候補を抽出することを特徴とする、請求の範囲の第 7項に記載のデータ処理方法。

1 0 . 前記プロックサイズは、前記電子データを処理する装置の処理能力と、前記装置の画面に表示される文字数と、前記表示される文字数を決定する要因との少なくとも 1つに応じて決められることを特徴とする、請求の範囲の第 7項に記載のデータ処理方法。

1 1 . サーバより階層構造を有する電子データを受取り、前記電子データに対して所定の処理をするデータ処理方法において、

前記サーバに対して前記所定の処理をしたい電子データ名を送信する送信ステップと、

前記サーバより前記電子データを複数のプロックに分割して処理するためのブロック補助データを受信する受信ステップと、

前記電子データのうち、前記所定の処理をしたい前記電子データを含むプロックの送信を前記サーバに要求し、前記プロックのデータを受信する受信ステップと、

前記受信したプロックと、前記プロックの前記プロック捕助データとを用いて、前記プロックの階層構造を解析し、その結果を用いて前記所定の処理をする再生ステップとを備える、データ処理方法。

1 2 . 前記サーバより前記ブロック補助データを受信するステップにおいて、前記プロック補助データが存在しない場合には、前記プロック補助データを作成した後、前記サーバより受信することを特徴とする、請求の範囲の第 1 1項に記載のデータ処理方法。

1 3 . P皆層構造を有する電子データと、前記電子データを複数のブロックに分割して処理するためのプロック捕助データとを対として備える構造化デ^ "タに対して、所定の文書記述言語の定義に従って所定の処理を実行させるためのデータ処理プログラムであって、

前記ブロック補助データに基づいて、前記電子データのプロックデータを読込む読込みステップと、

前記読込まれたプロックデータと、前記プロック補助データとに基づいて、前記プロックデータに含まれる階層構造を解析する解析ステップと、

前記解析結果と、前記文書記述言語の定義とに基づいて、前記ブロックデータに対して前記所定の処理を実行させる実行ステップ.と.をコンピュータに実行させる、データ処理プログラム。

1 4. P皆層構造を有する電子データを複数のブロックに分割し、前記分割された各ブロックごとに所定の処理を実行させるための構造化データを生成するためのデータ処理プログラムであって、

前記電子データを所定のプロックサイズに分割する際の、各プロック境界における境界候補を抽出する抽出ステップと、 '

前記抽出された境界候補に基づいて、前記プロックの分割位置を決定する決定前記決定された各プロックの先頭位置と終了位置とにおける前記階層構造の特徴を示す情報を取得する取得ステツプと、

前記決定ステップで決定された各プロックの分割情報の位置情報と、前記取得された前記位置情報に対応する前記階層構造の特徴を示す情報とを含むプロック補助データを生成し、前記プロック捕助データを前記電子データに追加して前記構造化データを生成する生成ステップとをコンピュータに実行させる、データ処理プログラム。

1 5 . サーバより階層構造を有する電子データを受取り、前記電子データに対して所定の処理をするためのデータ処理プログラムであって、

前記サーバより前記電子データを複数のプロックに分割して処理するためのプロック捕助データを受信する受信ステップと

前記受信したプロックと、前記プロックの前記プロック捕助データとを用いて、前記プロックの階層構造を解析し、その結果を用いて前記所定の処理をする再生ステップとをコンピュータに実行させる、データ処理プログラム。

1 6 . 階層構造を有する電子データを処理するデータ処理装置であって、

前記電子データには、前記電子データを複数のプロックに分割して処理するための捕助情報であるプロック補助データが付随し、

前記電子データのうち、処理をしたいデータが含まれるブロックと、前記プロック補助データとを読込む入力部と、

前記プロック補助データを用いて、前記読込んだ前記プロックの階層構造を解析するデータ構造解析部と、

前記データ構造解析部の結果を用いて、所定の処理をする処理部を備える、データ処理装置。

1 7 . 前記電子データは表示用の文書データであり、前記処理部は、：

前記データ構造解析部によつて解析された前記プロックの階層構造を用いて、前記読込んだブロックの表示レイアウトを計算するレイァゥト計算部と、 .

前記レイァゥト計算部によって求めた前記表示レイァゥトに基づいて表示する表示部とをさらに備える、請求の範囲の第 1 6項に記載のデータ処理装置。

1 8 . サーバより階層構造を有する電子データを受取り、前記電子データに対して所定の処理をするデータ処理装置であって、前記電子データには、 '前記電子データを複数のプロックに分割して処理するための補助情報であるプロック補助データが付随し、

前記電子データのうち、前記所定の処理をしたい電子データが含まれるプロックを前記サーバに伝え、前記プロックのデータと、前記ブロック補助データとを前記サーバより受信する送受信部と、

前記受信した前記プロックと、前記ブロック補助データとを用いて、前記受信した前記プロックの階層構造を解析するデータ構造解析部と、

前記データ構造解析部の結果を用いて、前記所定の処理をする処理部とを備える、データ処理装置。

1 9 . 携帯型の端末であることを特徴とする、請求の範囲の第 1 6項または第 1 8項に記載のデータ処理装置。

2 0 . 文書記述言語の定義に従って記述された電子データと、前記電子データを複数のブロックに分割して処理するためのブロック補助データとを対として備えたことを特徴とする、構造化データ。

2 1 . 文書記述言語の定義に従って所定の処理を実行させるための電子データと、前記電子データを複数のプロックに分割し、前記分割された各プロックごとに前記所定の処理を実行させるためのプロック補助データとを対として備えたことを特徴とする、構造化データ。

2 2. 前記複数に分割された電子データのブロックは、ほぼ等しい大きさであることを特徴とする、請求の範囲の第 2 0項または第 2 1項に記載の構造化データ。

2 3 . 前記ブロック補助データは、.少なくとも前記各ブロックの位置情報と、前記ブロックの開始位置と終了位置とにおける階層情報とを有することを特徴とする、請求の範囲の第 2 0項または第 2 1項に記載の構造化データ。

2 4. 前記ブロック補助データは、前記ブロックの分割箇所を、前記電子データの構造を記録している制御コードの前後とその付近とから選ぶことを特徴とする、請求の範囲の第 2 0項または第 2 1項に記載の構造化データ。

2 5 , 前記ブロック捕助データは、前記ブロックの分割箇所を、表示したときに行頭から表示される箇所に限定することを特徴とする、請求の範囲の第 2 0項または第 2 1項に記載の構造化データ。

2 6 . 前記電子データに、前記電子データ内の任意の位置にジャンプするリンク機能が含まれる場合、前記プロック補助データは、前記リンク先の位置情報を含むことを特徴とする、請求の範囲の第 2 0項または第 2 1項に記載の構造化データ。

2 .7，文書記述言語の定義に従って記述された電子データと、前記電子データを複数のブロックに分割して処理するためのブロック補助データとを対として備えたことを特徴とする構造化データを記録した、コンピュータ読取可能な記録媒体。

2 8 . 請求の範囲の第 1 3項〜第 1 5項のいずれかに記載のデータ処理プログラムを送信する送信部を備えることを特徴とする、送信装置。

2 9 . 請求の範囲の第 2 0項または第 2 1項に記載の階層化データを送信する送信部を備えることを特徴とする、送信装置。