JP2005196638A - 構造化文書処理装置及び構造化文書処理方法ならびにそのプログラム - Google Patents
構造化文書処理装置及び構造化文書処理方法ならびにそのプログラム Download PDFInfo
- Publication number
- JP2005196638A JP2005196638A JP2004004133A JP2004004133A JP2005196638A JP 2005196638 A JP2005196638 A JP 2005196638A JP 2004004133 A JP2004004133 A JP 2004004133A JP 2004004133 A JP2004004133 A JP 2004004133A JP 2005196638 A JP2005196638 A JP 2005196638A
- Authority
- JP
- Japan
- Prior art keywords
- node
- structured document
- tree structure
- predetermined
- processing apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
【課題】 符号化データを用いて、構造化文書の木構造における所定の部分に含まれるノードのノード内容情報をより早く出力する構造化文書処理装置を提供する。
【解決手段】 構造化文書で表される木構造が所定の部分ごとに区分けされ、それぞれの前記所定の部分に部分識別番号が割当てられ、前記所定の部分ごとに当該所定の部分に含まれる各ノードに対して昇順にノード識別番号が割当てられている前記構造化文書の符号化データを処理する構造化文書処理装置であって、前記木構造のうちの1つのノードの指定を受け付ける指定受付手段と、前記指定されたノードを含む所定の部分と同じ所定の部分に含まれるノードのうちのいずれか1つまたは複数または全てのノードを出力するノード情報出力手段とを備える。
【選択図】 図1
【解決手段】 構造化文書で表される木構造が所定の部分ごとに区分けされ、それぞれの前記所定の部分に部分識別番号が割当てられ、前記所定の部分ごとに当該所定の部分に含まれる各ノードに対して昇順にノード識別番号が割当てられている前記構造化文書の符号化データを処理する構造化文書処理装置であって、前記木構造のうちの1つのノードの指定を受け付ける指定受付手段と、前記指定されたノードを含む所定の部分と同じ所定の部分に含まれるノードのうちのいずれか1つまたは複数または全てのノードを出力するノード情報出力手段とを備える。
【選択図】 図1
Description
本発明は、構造化文書の符号化や当該符号化された構造化文書を処理して構造化文書を出力する構造化文書処理装置及び構造化文書処理方法ならびにそのプログラムに関する。
従来、XML文書などの構造化文書を符号化する場合、符号化装置は、まず構造化文書が表す木構造を解読し、その木構造の各ノードにノードIDなどのノード識別番号を付与して前記構造化文書の符号化データを生成している。なお、代表的な符号化の手法としてMillauと呼ばれる符号化手法が存在する(非特許文献1参照)。
Marc Girardot、外1名、"Millau: an encoding format for efficient representation and exchange of XML over the Web"、Computer Networks: The International Journal of Computer and Telecommunications Networking、Netherlands、North-Holland Publishing Co.、June 2000、Volume33,Issue1-6、p.747-p.765、
Marc Girardot、外1名、"Millau: an encoding format for efficient representation and exchange of XML over the Web"、Computer Networks: The International Journal of Computer and Telecommunications Networking、Netherlands、North-Holland Publishing Co.、June 2000、Volume33,Issue1-6、p.747-p.765、
しかしながら、従来の符号化手法で生成された構造化文書の符号化データを用いて、構造化文書を出力する処理においては、構造化文書に含まれる各ノードの位置関係を、符号化データに格納されているノード位置情報(例えば、親ノードや子ノードや兄弟のノードのノードID)に基づいて解析していたので、前記木構造における、ある部分木などの所定の部分の全てのノードのノード内容情報を出力する場合には、その所定の部分に含まれるノードの位置関係を解読するのに時間がかかり、その分、出力にも時間がかかっていた。
そこでこの発明は、構造化文書の木構造における所定の部分に含まれるノードのノード内容情報をより早く出力することができる符号化データを生成し、また当該符号化データを用いて、構造化文書の木構造における所定の部分に含まれるノードのノード内容情報を、従来に比べてより早く出力する、構造化文書処理装置及び構造化文書処理方法ならびにそのプログラムを提供することを目的としている。
本発明は、上述の課題を解決すべくなされたもので、構造化文書で表される木構造が所定の部分ごとに区分けされ、それぞれの前記所定の部分に部分識別番号が割当てられ、前記所定の部分ごとに当該所定の部分に含まれる各ノードに対して昇順にノード識別番号が割当てられている前記構造化文書の符号化データを処理する構造化文書処理装置であって、前記木構造のうちの1つのノードの指定を受け付ける指定受付手段と、前記指定されたノードを含む所定の部分と同じ所定の部分に含まれるノードのうちのいずれか1つまたは複数または全てのノードのノード内容情報を出力するノード情報出力手段とを備えることを特徴とする構造化文書処理装置である。
本発明によれば、構造化文書の木構造における所定の部分に含まれるノードのノード内容情報を、ノード識別番号を用いることにより、ノードの位置関係を解析しなくても出力でき、これにより、より早くノード内容情報を出力することができる。
本発明によれば、構造化文書の木構造における所定の部分に含まれるノードのノード内容情報を、ノード識別番号を用いることにより、ノードの位置関係を解析しなくても出力でき、これにより、より早くノード内容情報を出力することができる。
また本発明は、前記所定の部分が、前記木構造における階層であることを特徴とする。これにより、指定されたノードと同一の階層のノードを、ノードの位置関係を解析しなくても出力できる。
また本発明は、前記所定の部分が、前記木構造における部分木であることを特徴とする。これにより、指定されたノードと同一の部分木のノードを、ノードの位置関係を解析しなくても出力できる。
また本発明は、構造化文書を符号化する構造化文書処理装置であって、前記符号化時に、前記構造化文書を読み込んで解析し、当該構造化文書の木構造を検出する木構造解析手段と、前記木構造に含まれる各ノードを前記木構造における所定の部分ごとに区分けし、それぞれの所定の部分に部分識別番号を割当てる木構造区分け手段と、前記所定の部分に含まれるノードごとに、ノード識別番号を昇順に割り振るノード識別番号割り振り手段とを備えることを特徴とする構造化文書処理装置である。
本発明によれば、構造化文書の木構造における所定の部分に含まれるノードのノード内容情報を、ノード識別番号を用いることにより、ノードの位置関係を解析しなくても出力でき、これにより、より早くノード内容情報を出力することができる符号化データを生成することができる。
本発明によれば、構造化文書の木構造における所定の部分に含まれるノードのノード内容情報を、ノード識別番号を用いることにより、ノードの位置関係を解析しなくても出力でき、これにより、より早くノード内容情報を出力することができる符号化データを生成することができる。
また本発明は、前記ノード識別番号の一部に前記部分番号を含むことを特徴とする。これにより、ノード識別番号を確認すれば、そのノードを含む所定の部分を解析できる符号化データを生成することができる。
また本発明は、前記所定の部分が、前記木構造における階層であることを特徴とする。これにより、指定されたノードと同一の階層のノードを、ノードの位置関係を解析しなくても出力できる符号化データを生成することができる。
また本発明は、前記所定の部分が、前記木構造における部分木であることを特徴とする。これにより、指定されたノードと同一の部分木のノードを、ノードの位置関係を解析しなくても出力できる符号化データを生成することができる。
また本発明は、構造化文書で表される木構造が所定の部分ごとに区分けされ、それぞれの前記所定の部分に部分識別番号が割当てられ、前記所定の部分ごとに当該所定の部分に含まれる各ノードに対して昇順にノード識別番号が割当てられている前記構造化文書の符号化データを処理する構造化文書処理装置の構造化文書処理方法であって、前記木構造のうちの1つのノードの指定を受け付ける指定受付過程と、前記指定されたノードを含む所定の部分と同じ所定の部分に含まれるノードのうちのいずれか1つまたは複数または全てのノードのノード内容情報を出力するノード情報出力過程とを有することを特徴とする構造化文書処理方法である。
また本発明は、構造化文書を符号化する構造化文書処理装置の構造化文書処理方法であって、前記符号化時に、前記構造化文書を読み込んで解析し、当該構造化文書の木構造を検出する木構造解析過程と、前記木構造に含まれる各ノードを前記木構造における所定の部分ごとに区分けし、それぞれの所定の部分に部分識別番号を割当てる木構造区分け過程と、前記所定の部分に含まれるノードごとに、ノード識別番号を昇順に割り振るノード識別番号割り振り過程とを有することを特徴とする構造化文書処理方法である。
また本発明は、構造化文書で表される木構造が所定の部分ごとに区分けされ、それぞれの前記所定の部分に部分識別番号が割当てられ、前記所定の部分ごとに当該所定の部分に含まれる各ノードに対して昇順にノード識別番号が割当てられている前記構造化文書の符号化データを処理する構造化文書処理装置の構造化文書処理方法であって、前記木構造のうちの1つのノードの指定を受け付ける指定受付処理と、前記指定されたノードを含む所定の部分と同じ所定の部分に含まれるノードのうちのいずれか1つまたは複数または全てのノードのノード内容情報を出力するノード情報出力処理とをコンピュータに実行させるプログラムである。
また本発明は、構造化文書を符号化する構造化文書処理装置のコンピュータに実行させるプログラムであって、前記符号化時に、前記構造化文書を読み込んで解析し、当該構造化文書の木構造を検出する木構造解析処理と、前記木構造に含まれる各ノードを前記木構造における所定の部分ごとに区分けし、それぞれの所定の部分に部分識別番号を割当てる木構造区分け処理と、前記所定の部分に含まれるノードごとに、ノード識別番号を昇順に割り振るノード識別番号割り振り処理とをコンピュータに実行させるプログラムである。
以下、本発明の一実施形態による構造化文書処理装置を図面を参照して説明する。
図1は同実施形態の構造化文書処理装置の構成を示す図である。この図において、符号1は構造化文書処理装置である。そしてこの構造化文書符号化装置1において、符号11はXMLやHTMLなどで記述された構造化文書が符号化された符号化データを記憶する符号化データ記憶部である。また12は構造化文書の出力の指示を受け付ける指示受付部(指定受付手段)である。また13は符号化データ記憶部11に記録されている符号化データに基づいて、構造化文書の内容を出力する構造化文書出力処理部(ノード情報出力手段)である。また14はXMLやHTMLなどで記述された構造化文書が記録された構造化文書記憶部、また15は構造化文書を符号化して符号化データを生成する符号化データ生成部(木構造解析手段、木構造区分け手段、ノード識別番号割り振り手段)である。
図1は同実施形態の構造化文書処理装置の構成を示す図である。この図において、符号1は構造化文書処理装置である。そしてこの構造化文書符号化装置1において、符号11はXMLやHTMLなどで記述された構造化文書が符号化された符号化データを記憶する符号化データ記憶部である。また12は構造化文書の出力の指示を受け付ける指示受付部(指定受付手段)である。また13は符号化データ記憶部11に記録されている符号化データに基づいて、構造化文書の内容を出力する構造化文書出力処理部(ノード情報出力手段)である。また14はXMLやHTMLなどで記述された構造化文書が記録された構造化文書記憶部、また15は構造化文書を符号化して符号化データを生成する符号化データ生成部(木構造解析手段、木構造区分け手段、ノード識別番号割り振り手段)である。
そして、この構造化文書処理装置1では、予め符号化データ生成部15が構造化文書記憶部14に記録されている構造化文書を符号化して、符号化データを生成し、符号化データ記憶部11に格納しておく。そして、その符号化データの利用時に、指示受付部12や構造化文書出力部13が後述の処理を行ない、構造化文書の一部を、例えば構造化文書処理装置1が備える表示部などに出力する。
図2は符号化データの構造の例を示す図である。この図は符号化データにおける1つのノードに対応するデータを示している。この図が示すように、符号化データには1つのノードに対して、少なくともノードID(ノード識別番号)が記録される領域(Node ID)と、ノード位置情報が記録される領域(Tree Structure)と、ノード内容情報を示すIDが記録される領域(Data Structure)とを保持しており、それぞれの領域に情報が記録される。ここで、ノード位置情報は、親ノード(Parent)のノードIDや、子ノードのノードIDや、兄弟ノードのノードIDである。なお、子ノードのノードIDには第1子ノード(First Chile)のノードIDが記録される。また兄弟ノードのノードIDには、次の兄弟ノード(Next Sibling)のノードIDが記録される。そして、図2に示した符号化データを生成する際に、符号化データ生成部15が、ノードIDを後述する処理により割り振る。
図3は第1のノードの割り振り方法を示す図である。次に、図3を用いてノードIDの割り振りの第1の例について説明する。
図3が示すように、符号化データ生成部15は、まず、構造化文書を構造化文書記憶部14から読み取ると、その構造化文書の木構造を解析する。次に、構造化文書の木構造を階層(所定の部分)ごとに区分けして、それぞれの階層に階層番号(部分識別番号)を割当てる。例えば、ルートのノードの階層を階層1、次の階層を階層2、その次の階層を階層3と、順に階層番号を割当てる。次に符号化データ生成部15は、上位から順に階層を選択していき、選択した階層に含まれる各ノードについて、表示部に出力される順に、連続した番号を割り振り、その割り振った番号をノードIDとする。また、符号化データ生成部15は、2つの各階層の各ノードIDが連続するようにノードIDを割り振る。また符号化データ生成部15は、全てのノードにノードIDを割り振ると、階層番号とその階層に含まれるノードのうち一番若い番号のノードIDを対応付けて記憶した階層情報対応表を作成する。そして、階層情報対応表が格納された符号化データを生成する。
図3が示すように、符号化データ生成部15は、まず、構造化文書を構造化文書記憶部14から読み取ると、その構造化文書の木構造を解析する。次に、構造化文書の木構造を階層(所定の部分)ごとに区分けして、それぞれの階層に階層番号(部分識別番号)を割当てる。例えば、ルートのノードの階層を階層1、次の階層を階層2、その次の階層を階層3と、順に階層番号を割当てる。次に符号化データ生成部15は、上位から順に階層を選択していき、選択した階層に含まれる各ノードについて、表示部に出力される順に、連続した番号を割り振り、その割り振った番号をノードIDとする。また、符号化データ生成部15は、2つの各階層の各ノードIDが連続するようにノードIDを割り振る。また符号化データ生成部15は、全てのノードにノードIDを割り振ると、階層番号とその階層に含まれるノードのうち一番若い番号のノードIDを対応付けて記憶した階層情報対応表を作成する。そして、階層情報対応表が格納された符号化データを生成する。
次に、図3のように各ノードのノードIDが割り振られた符号化データを用いて、ノードのノード内容情報を出力する処理について説明する。
まず、指示受付部12が構造化文書の内容の出力指示を受け付けると、指示受付部12は構造化文書出力処理部13に構造化文書の内容を出力する指示を行なう。この時、指定受付部12は例えば、ノードIDの指定を受け付け、当該部ノードIDを構造化文書出力処理部13に通知する。すると、構造化文書出力処理部13は、符号化データ記憶部11に記録されている符号化データから階層情報対応表を読み取る。そして構造化文書出力処理部13は、指示受付部12から受け付けたノードIDに対応付けられて記録されている階層番号の次の階層の階層番号に対応付けられて記録されているノードIDを階層情報対応表から読み取る。そして、構造化文書出力処理部13は指示受付部12から受け付けたノードIDの番号から、前記階層情報対応表から読み取ったノードIDより前の番号までを、出力するノードのノードIDと特定し、その特定したノードIDを保持するノードのノード内容情報を符号化データから読み取り、出力する。これにより指定されたノードと同じ階層にあるノードの内容が表示部に描画される。
まず、指示受付部12が構造化文書の内容の出力指示を受け付けると、指示受付部12は構造化文書出力処理部13に構造化文書の内容を出力する指示を行なう。この時、指定受付部12は例えば、ノードIDの指定を受け付け、当該部ノードIDを構造化文書出力処理部13に通知する。すると、構造化文書出力処理部13は、符号化データ記憶部11に記録されている符号化データから階層情報対応表を読み取る。そして構造化文書出力処理部13は、指示受付部12から受け付けたノードIDに対応付けられて記録されている階層番号の次の階層の階層番号に対応付けられて記録されているノードIDを階層情報対応表から読み取る。そして、構造化文書出力処理部13は指示受付部12から受け付けたノードIDの番号から、前記階層情報対応表から読み取ったノードIDより前の番号までを、出力するノードのノードIDと特定し、その特定したノードIDを保持するノードのノード内容情報を符号化データから読み取り、出力する。これにより指定されたノードと同じ階層にあるノードの内容が表示部に描画される。
ここで、上述のような階層ごとにノードIDを割当てる方法では、階層情報対応表を作成したが、例えば、ノードIDに階層番号を保持させることによって階層情報対応表を作成せずに済むようにしても良い。例えば、階層1の階層番号を01、階層2の階層番号を02・・・とし、ノードIDを4桁にして当該4桁のうち上2桁を階層番号、下2桁をノード番号とした場合、図3におけるノード1のノードIDは0101となる。また図3におけるノード2は0202、ノード3は0203、ノード4は0204、またノード50305となる。このようなノードIDの割り振り方にした場合、たとえば指示受付部12が受け付けたノードが0202であった場合、ノードIDの4桁のうち上2桁が同一の番号を示すノードIDを特定すれば、それが同階層のノードと特定できる。そしてこのようなノードIDが割り振られた構造化文書の符号化データを用いて、ノード内容情報を出力する場合には、構造化文書出力処理部13は、指示受付部12が指定を受け付けた4桁のノードIDの上2桁が同一のノードIDを特定し、その特定したノードIDを保持するノードのノード内容情報を符号化データから読み取り、出力する。
図4は第2のノードの割り振り方法を示す図である。図4を用いて、ノードIDの割り振りの第2の例について説明する。
図4が示すように、符号化データ生成部15は、まず、構造化文書を構造化文書記憶部14から読み取ると、その構造化文書の木構造を解析する。次に、構造化文書の木構造を所定の部分木(所定の部分)ごとに区分けして、それぞれの部分木に部分木番号(部分識別番号)を割当てる。なお部分木の区分けは予め指定された節のノードなどに基づいて部分木の区分けを行なう。次に符号化データ生成部15は、部分木番号の順に部分木を選択していき、選択した部分木に含まれる各ノードについて、表示部に出力される順に、ノードIDを割り振る。この時符号化データ生成部15は、4桁のノードIDを割り振る。ここでこの4桁のノードIDの上2桁は部分木番号であり、ノードIDの下2桁は当該ノードの符号化データ内でのオフセット(符号化データ内でのノードのデータを取得する先頭のアドレス)である。そして符号化データ生成部15は、全てのノードにノードIDを割り振り、符号化データを生成する。
図4が示すように、符号化データ生成部15は、まず、構造化文書を構造化文書記憶部14から読み取ると、その構造化文書の木構造を解析する。次に、構造化文書の木構造を所定の部分木(所定の部分)ごとに区分けして、それぞれの部分木に部分木番号(部分識別番号)を割当てる。なお部分木の区分けは予め指定された節のノードなどに基づいて部分木の区分けを行なう。次に符号化データ生成部15は、部分木番号の順に部分木を選択していき、選択した部分木に含まれる各ノードについて、表示部に出力される順に、ノードIDを割り振る。この時符号化データ生成部15は、4桁のノードIDを割り振る。ここでこの4桁のノードIDの上2桁は部分木番号であり、ノードIDの下2桁は当該ノードの符号化データ内でのオフセット(符号化データ内でのノードのデータを取得する先頭のアドレス)である。そして符号化データ生成部15は、全てのノードにノードIDを割り振り、符号化データを生成する。
次に、図4のように各ノードのノードIDが割り振られた符号化データを用いて、ノード内容情報を出力する処理について説明する。
まず、指示受付部12が構造化文書の内容の出力指示を受け付けると、指示受付部12は構造化文書出力処理部13に構造化文書の内容を出力する指示を行なう。この時、指定受付部12は例えば、ノードIDを受け付け、当該部ノードIDを構造化文書出力処理部13に通知する。次に構造化文書出力処理部13は、指示受付部12から受け付けたノードIDの4桁の番号のうち上2桁の番号を読み取り、その2桁の番号と同じ番号を上2桁とする他のノードのノードIDを符号化データから読み取り、出力するノードのノードIDと特定する。そして、その特定したノードIDを保持する各ノードのノード内容情報を符号化データから読み取り、構造化文書の内容を出力する。これにより指定されたノードと同じ部分木にあるノードの内容が表示部に描画される。
まず、指示受付部12が構造化文書の内容の出力指示を受け付けると、指示受付部12は構造化文書出力処理部13に構造化文書の内容を出力する指示を行なう。この時、指定受付部12は例えば、ノードIDを受け付け、当該部ノードIDを構造化文書出力処理部13に通知する。次に構造化文書出力処理部13は、指示受付部12から受け付けたノードIDの4桁の番号のうち上2桁の番号を読み取り、その2桁の番号と同じ番号を上2桁とする他のノードのノードIDを符号化データから読み取り、出力するノードのノードIDと特定する。そして、その特定したノードIDを保持する各ノードのノード内容情報を符号化データから読み取り、構造化文書の内容を出力する。これにより指定されたノードと同じ部分木にあるノードの内容が表示部に描画される。
次に、ノードIDの割り振りの第3の例について説明する。
この第3の例は上述の第1の例と第2の例を組み合わせたノードIDの割り振り方法である。
まず、構造化文書を構造化文書記憶部14から読み取ると、その構造化文書の木構造を解析する。次に、構造化文書の木構造の階層ごとの区分けと、所定の部分木ごとの区分けを行なう。そして、それぞれの階層に階層番号を割当て、それぞれの部分木に部分木番号を割当てる。次に符号化データ生成部15は、ノードについて、表示部に出力される順に、ノードIDを割り振る。この時符号化データ生成部15は、6桁のノードIDを割り振る。ここでこの6桁のノードIDの上2桁は部分木番号であり、中2桁は階層番号であり、またノードIDの下2桁は当該ノードの符号化データ内でのオフセット(符号化データ内でのノードのデータを取得する先頭のアドレス)である。例えば、部分木番号が01で階層番号01のルートノードのノードIDは010101となる。そして符号化データ生成部15は、全てのノードにノードIDを割り振る。
この第3の例は上述の第1の例と第2の例を組み合わせたノードIDの割り振り方法である。
まず、構造化文書を構造化文書記憶部14から読み取ると、その構造化文書の木構造を解析する。次に、構造化文書の木構造の階層ごとの区分けと、所定の部分木ごとの区分けを行なう。そして、それぞれの階層に階層番号を割当て、それぞれの部分木に部分木番号を割当てる。次に符号化データ生成部15は、ノードについて、表示部に出力される順に、ノードIDを割り振る。この時符号化データ生成部15は、6桁のノードIDを割り振る。ここでこの6桁のノードIDの上2桁は部分木番号であり、中2桁は階層番号であり、またノードIDの下2桁は当該ノードの符号化データ内でのオフセット(符号化データ内でのノードのデータを取得する先頭のアドレス)である。例えば、部分木番号が01で階層番号01のルートノードのノードIDは010101となる。そして符号化データ生成部15は、全てのノードにノードIDを割り振る。
次に、第3のノードIDの割り振り方法により生成された符号化データを用いて、ノード内容情報を出力する処理について説明する。
まず、指示受付部12が構造化文書の内容の出力指示を受け付けると、指示受付部12は構造化文書出力処理部13に構造化文書の内容を出力する指示を行なう。この時、指定受付部12は例えば、ノードIDを受け付け、当該部ノードIDを構造化文書出力処理部13に通知する。次に構造化文書出力処理部13は、指示受付部12から受け付けたノードIDの6桁の番号のうち上2桁の番号を読み取り、その上2桁の番号と同じ番号を上2桁とする他のノードのノードIDを符号化データから読み取り、出力するノードのノードIDと特定する。また構造化文書出力処理部13は、指示受付部12から受け付けたノードIDの6桁の番号のうち中2桁の番号を読み取り、その中2桁の番号と同じ番号を中2桁とする他のノードのノードIDを符号化データから読み取り、出力するノードのノードIDと特定する。そして、構造化文書出力処理部13は特定したノードIDを保持するノードのノード内容情報を読み取り、出力する。これにより指定されたノードと同じ部分木にあるノードの内容と、前記指定されたノードと同じ階層にあるノードの内容とが表示部に描画される。
まず、指示受付部12が構造化文書の内容の出力指示を受け付けると、指示受付部12は構造化文書出力処理部13に構造化文書の内容を出力する指示を行なう。この時、指定受付部12は例えば、ノードIDを受け付け、当該部ノードIDを構造化文書出力処理部13に通知する。次に構造化文書出力処理部13は、指示受付部12から受け付けたノードIDの6桁の番号のうち上2桁の番号を読み取り、その上2桁の番号と同じ番号を上2桁とする他のノードのノードIDを符号化データから読み取り、出力するノードのノードIDと特定する。また構造化文書出力処理部13は、指示受付部12から受け付けたノードIDの6桁の番号のうち中2桁の番号を読み取り、その中2桁の番号と同じ番号を中2桁とする他のノードのノードIDを符号化データから読み取り、出力するノードのノードIDと特定する。そして、構造化文書出力処理部13は特定したノードIDを保持するノードのノード内容情報を読み取り、出力する。これにより指定されたノードと同じ部分木にあるノードの内容と、前記指定されたノードと同じ階層にあるノードの内容とが表示部に描画される。
なお、上述の構造化文書符号化装置は内部に、コンピュータシステムを有している。そして、上述した処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
1 構造化文書処理装置、11 符号化データ記憶部、12 指示受付部、13 構造化文書出力処理部、14 構造化文書記憶部、15 符号化データ生成部
Claims (11)
- 構造化文書で表される木構造が所定の部分ごとに区分けされ、それぞれの前記所定の部分に部分識別番号が割当てられ、前記所定の部分ごとに当該所定の部分に含まれる各ノードに対して昇順にノード識別番号が割当てられている前記構造化文書の符号化データを処理する構造化文書処理装置であって、
前記木構造のうちの1つのノードの指定を受け付ける指定受付手段と、
前記指定されたノードを含む所定の部分と同じ所定の部分に含まれるノードのうちのいずれか1つまたは複数または全てのノードのノード内容情報を出力するノード情報出力手段と、
を備えることを特徴とする構造化文書処理装置。 - 前記所定の部分は、前記木構造における階層であることを特徴とする請求項1に記載の構造化文書処理装置。
- 前記所定の部分は、前記木構造における部分木であることを特徴とする請求項1または請求項2に記載の構造化文書処理装置。
- 構造化文書を符号化する構造化文書処理装置であって、
前記符号化時に、
前記構造化文書を読み込んで解析し、当該構造化文書の木構造を検出する木構造解析手段と、
前記木構造に含まれる各ノードを前記木構造における所定の部分ごとに区分けし、それぞれの所定の部分に部分識別番号を割当てる木構造区分け手段と、
前記所定の部分に含まれるノードごとに、ノード識別番号を昇順に割り振るノード識別番号割り振り手段と、
を備えることを特徴とする構造化文書処理装置。 - 前記ノード識別番号の一部に前記部分番号を含む
ことを特徴とする請求項4に記載の構造化文書処理装置。 - 前記所定の部分は、前記木構造における階層であることを特徴とする請求項4または請求項5に記載の構造化文書処理装置。
- 前記所定の部分は、前記木構造における部分木であることを特徴とする請求項4から請求項6のいずれかに記載の構造化文書処理装置。
- 構造化文書で表される木構造が所定の部分ごとに区分けされ、それぞれの前記所定の部分に部分識別番号が割当てられ、前記所定の部分ごとに当該所定の部分に含まれる各ノードに対して昇順にノード識別番号が割当てられている前記構造化文書の符号化データを処理する構造化文書処理装置の構造化文書処理方法であって、
前記木構造のうちの1つのノードの指定を受け付ける指定受付過程と、
前記指定されたノードを含む所定の部分と同じ所定の部分に含まれるノードのうちのいずれか1つまたは複数または全てのノードのノード内容情報を出力するノード情報出力過程と、
を有することを特徴とする構造化文書処理方法。 - 構造化文書を符号化する構造化文書処理装置の構造化文書処理方法であって、
前記符号化時に、
前記構造化文書を読み込んで解析し、当該構造化文書の木構造を検出する木構造解析過程と、
前記木構造に含まれる各ノードを前記木構造における所定の部分ごとに区分けし、それぞれの所定の部分に部分識別番号を割当てる木構造区分け過程と、
前記所定の部分に含まれるノードごとに、ノード識別番号を昇順に割り振るノード識別番号割り振り過程と、
を有することを特徴とする構造化文書処理方法。 - 構造化文書で表される木構造が所定の部分ごとに区分けされ、それぞれの前記所定の部分に部分識別番号が割当てられ、前記所定の部分ごとに当該所定の部分に含まれる各ノードに対して昇順にノード識別番号が割当てられている前記構造化文書の符号化データを処理する構造化文書処理装置の構造化文書処理方法であって、
前記木構造のうちの1つのノードの指定を受け付ける指定受付処理と、
前記指定されたノードを含む所定の部分と同じ所定の部分に含まれるノードのうちのいずれか1つまたは複数または全てのノードのノード内容情報を出力するノード情報出力処理と、
をコンピュータに実行させるプログラム。 - 構造化文書を符号化する構造化文書処理装置のコンピュータに実行させるプログラムであって、
前記符号化時に、
前記構造化文書を読み込んで解析し、当該構造化文書の木構造を検出する木構造解析処理と、
前記木構造に含まれる各ノードを前記木構造における所定の部分ごとに区分けし、それぞれの所定の部分に部分識別番号を割当てる木構造区分け処理と、
前記所定の部分に含まれるノードごとに、ノード識別番号を昇順に割り振るノード識別番号割り振り処理と、
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004004133A JP2005196638A (ja) | 2004-01-09 | 2004-01-09 | 構造化文書処理装置及び構造化文書処理方法ならびにそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004004133A JP2005196638A (ja) | 2004-01-09 | 2004-01-09 | 構造化文書処理装置及び構造化文書処理方法ならびにそのプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005196638A true JP2005196638A (ja) | 2005-07-21 |
Family
ID=34818835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004004133A Withdrawn JP2005196638A (ja) | 2004-01-09 | 2004-01-09 | 構造化文書処理装置及び構造化文書処理方法ならびにそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005196638A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009205382A (ja) * | 2008-02-27 | 2009-09-10 | Ricoh Co Ltd | 情報処理装置、情報処理方法、プログラムおよび記録媒体 |
-
2004
- 2004-01-09 JP JP2004004133A patent/JP2005196638A/ja not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009205382A (ja) * | 2008-02-27 | 2009-09-10 | Ricoh Co Ltd | 情報処理装置、情報処理方法、プログラムおよび記録媒体 |
US8601362B2 (en) | 2008-02-27 | 2013-12-03 | Ricoh Company, Ltd. | Information processing apparatus, information processing method, and computer-readable recording medium storing an information processing program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005141650A (ja) | 構造化文書符号化装置及び構造化文書符号化方法ならびにそのプログラム | |
JP7072645B2 (ja) | メディアファイルを生成する方法、メディアファイルを処理する方法、装置、プログラム、およびコンピュータ可読記憶媒体 | |
JP4898615B2 (ja) | 情報処理装置および符号化方法 | |
JP2005538436A (ja) | 構造化された文章、特にxml文章の符号化/復号化のための方法及び装置 | |
US7831903B2 (en) | Method and device for coding and decoding structured documents | |
TW460865B (en) | Signal processing on information files so as to obtain characteristic point information sequences | |
US20090045987A1 (en) | Method and apparatus for encoding/decoding metadata | |
JP5936303B2 (ja) | マルチメディアデータを符号化する方法および復号化する方法および符号化する装置および復号化する装置 | |
JP5670859B2 (ja) | 記述方法、exiデコーダおよびプログラム | |
JP2011146036A (ja) | 情報処理装置及びその制御方法並びにプログラム | |
CN112287642A (zh) | 树形结构自增数据节点id及其路径链二进制编码方法 | |
JP2005196638A (ja) | 構造化文書処理装置及び構造化文書処理方法ならびにそのプログラム | |
JP4898224B2 (ja) | 構造化されたドキュメントのエンコーディング方法 | |
KR101044870B1 (ko) | 경로 코드를 이용한 xml 문서의 부호화 및 복호화 방법과 장치 | |
US7797346B2 (en) | Method for improving the functionality of the binary representation of MPEG-7 and other XML based content descriptions | |
KR100983835B1 (ko) | 기록 매체, 데이터 기록 장치 및 방법, 데이터 재생 장치 및 방법 | |
CN1768480B (zh) | 编码装置和方法、解码装置和方法 | |
CN116301813A (zh) | 低代码平台开发方法及系统 | |
US7617237B2 (en) | Encoding device, encoding method, decoding device, decoding method, program and machine readable recording medium containing the program | |
CN104683810B (zh) | 一种基于特征分析的动态解码方法和装置 | |
JP2005202842A (ja) | 構造化文書処理装置及び構造化文書処理方法ならびにそのプログラム | |
JP4273960B2 (ja) | 構造化文書処理装置及び構造化文書処理方法ならびにそのプログラム | |
JP4334545B2 (ja) | 記憶装置およびコンピュータ読取り可能な記録媒体 | |
JP2009128945A (ja) | データ処理装置及び方法並びにプログラム | |
CN101539927B (zh) | 一种实现光盘映像文件处理的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070403 |