JP4411994B2 - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP4411994B2
JP4411994B2 JP2004032145A JP2004032145A JP4411994B2 JP 4411994 B2 JP4411994 B2 JP 4411994B2 JP 2004032145 A JP2004032145 A JP 2004032145A JP 2004032145 A JP2004032145 A JP 2004032145A JP 4411994 B2 JP4411994 B2 JP 4411994B2
Authority
JP
Japan
Prior art keywords
information
search
data
specific element
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004032145A
Other languages
English (en)
Other versions
JP2005222465A (ja
Inventor
直子 佐藤
雅紀 佐竹
芳幸 内藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2004032145A priority Critical patent/JP4411994B2/ja
Publication of JP2005222465A publication Critical patent/JP2005222465A/ja
Application granted granted Critical
Publication of JP4411994B2 publication Critical patent/JP4411994B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、複数の要素が階層的に記述された構造化情報を処理する情報処理装置に関する。
装置/アプリケーション間のデータ交換フォーマットとして相互接続性や健読性等の理由からXML(Extensible Markup Language)が多く利用されている(例えば、特許文献1および特許文献2参照)。XMLは、様々なデータを仮想的な木構造状に配置し、個々のデータとそれらの関連を表現することが可能である。
このような意味的に構造化されたXMLデータに対して要素データやその属性の取得/追加等の操作をする際、アプリケーションが「DOMライブラリ」を利用することが一般的である。DOM(Document Object Model)とは、XMLデータのあらゆる要素をノードとしてとらえ、ノードのツリー(DOMツリー)として展開するものである。
また目的とする要素データや属性等を検索する手段として、XMLデータの構造から検索を行う「XPathライブラリ」を利用することも一般的である。XPath(XML Path Language)とは、XML文書のDOMツリーにおいて、起点となるノードから出発して目的のノードに至るまでの経路を表現するものである。
特開2002−297569号公報 特開2002−108850号公報
XMLは様々な装置において利用されている。装置によっては少ないメモリ量での動作を強いられている場合があり、そのため、上述したXMLの木構造状のデータのうち不要となった要素データや属性データを消去することによりメモリ領域を開放するなどして、使用メモリ量を削減することが望ましい。もちろん、開放される領域のデータをハードディスク等へ退避することも考えられる。
しかし、上述したXPathライブラリを利用したデータの検索においては、対象とするデータ構造を踏まえた検索を行うため、一部分の要素データや属性データの開放によって、常に正しい検索結果が得られなくなってしまう。そのため、不要データ解放をする際、木構造の形状(枝/節データの有無)に依存する処理(例えばXPath検索など)に影響を与え無いように削除するデータを選択する必要がある。
そこで、本発明は、階層構造の形状に依存した処理を考慮して不要情報を削除することを目的とする。
上記目的を達成するために、本発明の好適な態様である情報処理装置は、複数の要素による階層構造を含む構造化情報が記憶された記憶部と、前記複数の要素に含まれる特定要素を検索するために前記階層構造内における特定要素までの経路を示した検索情報に基づいて、前記記憶された構造化情報のうちの前記経路を特定するために必要な情報を識別する識別部と、前記識別された必要な情報を残して、前記記憶された構造化情報のうちの削除を要求された情報を前記記憶部から削除する削除処理部とを有することを特徴とする。
この構成によれば、経路を特定するために必要な情報が残されるため、検索処理に利用される検索経路を確保しつつ不要情報を削除することができる。
また、上記目的を達成するために、本発明の好適な態様である情報処理装置は、複数の要素による階層構造を含む構造化情報が記憶された記憶部と、前記複数の要素に含まれる特定要素を検索するための検索情報に基づいて、その特定要素のデータとその特定要素の検索情報とを対応付けた対応情報を生成する対応情報生成部と、削除を要求された特定要素のうちの前記対応情報が生成された特定要素を前記記憶部から削除する削除処理部と、を有することを特徴とする。
この構成によれば、情報の削除の結果、検索情報によって特定要素の検索ができない場合でも、対応情報に基づいて、その特定要素に対応するデータを参照することが可能になる。つまり、検索処理の結果として必要なデータを確保しつつ不要情報を削除することができる。
また、上記目的を達成するために、本発明の好適な態様である情報処理装置は、複数の要素による階層構造を含む構造化情報が記憶された記憶部と、前記複数の要素に含まれる特定要素を検索するための検索情報を解析する解析部と、前記記憶された構造化情報のうちの削除を要求された情報を前記記憶部から削除する削除処理部と、前記削除される前に解析が行われた削除前検索情報、および、前記削除された後の削除後構造化情報に基づいて、削除前検索情報に対応した特定要素を削除後構造化情報内で検索するための削除後検索情報を生成する検索情報再構成部と、を有することを特徴とする。
この構成によれば、情報の削除の結果、削除前検索情報によって特定要素の検索ができない場合でも、削除後検索情報に基づいて特定要素を検索することができる。つまり、新たな検索情報によって特定要素の検索を可能にしつつ不要情報を削除することができる。
また、上記目的を達成するために、本発明の好適な態様である情報処理装置は、複数の要素による階層構造を含む構造化情報が記憶された記憶部と、前記記憶された構造化情報のうちの削除を要求された情報を前記記憶部から削除し、削除した情報を補助記憶部へ退避する退避処理部と、前記複数の要素に含まれる特定要素を検索するための検索情報に基づいて、前記検索情報から特定要素を検索するために必要な対象情報を識別する対象情報識別部と、前記対象情報が前記補助記憶部へ退避されている場合に、前記補助記憶部から前記対象情報を取得する対象情報取得部と、前記取得された対象情報を利用して前記検索情報から特定要素を検索する検索処理部と、を有することを特徴とする。
この構成によれば、特定要素を検索するために必要な対象情報を補助記憶部から取得することができるため、特定要素の検索を可能にしつつ記憶部から不要情報を削除することができる。
上記目的を達成するために、本発明の好適な態様である情報処理方法は、複数の要素による階層構造を含む構造化情報が記憶された記憶部から情報を削除するために情報処理装置が実行する情報処理方法であって、前記複数の要素に含まれる特定要素を検索するために前記階層構造内における特定要素までの経路を示した検索情報に基づいて、前記記憶された構造化情報のうちの前記経路を特定するために必要な情報を識別し、前記識別された必要な情報を残して、前記記憶された構造化情報のうちの削除を要求された情報を前記記憶部から削除する、ことを特徴とする。
望ましくは、前記検索情報に基づいて、その検索情報によって検索される特定要素に対応したデータを検索し、検索したデータのデータ量が所定量より小さいか否かを判断し、前記データ量が所定量より小さいと判断された場合に、そのデータとその検索情報とを対応付けた対応情報を生成し、削除を要求された特定要素のうちの前記対応情報が生成された特定要素を前記記憶部から削除し、前記データ量が所定量より小さくないと判断された場合に、前記識別された必要な情報を残して、前記記憶された構造化情報のうちの削除を要求された情報を前記記憶部から削除する、ことを特徴とする。望ましくは、前記削除を要求された情報が検索情報による検索結果として返されるオブジェクトか否かを判断し、検索結果として返されるオブジェクトでないと判断された場合に、削除を要求された情報を前記記憶部から削除し、前記削除される前の削除前検索情報、および、前記削除された後の削除後構造化情報に基づいて、削除前検索情報に対応した特定要素を削除後構造化情報内で検索するための削除後検索情報を生成する、ことを特徴とする。
また、上記目的を達成するために、本発明の好適な態様である情報処理方法は、複数の要素による階層構造を含む構造化情報が記憶された記憶部から情報を削除するために情報処理装置が実行する情報処理方法であって、前記記憶された構造化情報のうちの削除を要求された情報を前記記憶部から削除して削除した情報を補助記憶部へ退避し、前記複数の要素に含まれる特定要素を検索するための検索情報に基づいて、前記検索情報から特定要素を検索するために必要な対象情報を識別し、前記対象情報が前記補助記憶部へ退避されている場合に、前記補助記憶部から前記対象情報を取得する、ことを特徴とする。
本発明により、階層構造の形状に依存した処理に利用される情報を確保しつつ不要情報を削除することができる。
以下、本発明の好適な実施形態を図面に基づいて説明する。
図1は、本発明の好適な実施形態を説明するための図であり、図1には、本発明に係る情報処理装置の構成図が示されている。
情報処理装置100は、操作部101、第1記憶部102、入出力部103、CPU105、ネットワークI/F106、ROM107を含んでおり、これらは内部バス108で互いに接続されている。また、入出力部103には第2記憶部104が接続されている。ROM107内には、情報処理装置100で利用される複数のプログラムが記憶されており、CPU105はROM107に記憶されたプログラムに従って動作する。
ROM107には、情報処理装置100をXMLプロセッサとして機能させるXML文書解析処理プログラム、XML文書を扱う上位XMLアプリケーションとして機能させるアプリケーションプログラムが記憶されている。さらに、DOMツリー作成処理を実行するプログラム、DOMインターフェースを実現するためのプログラムも記憶されている。これらプログラムによって実現される処理については後に、図2から図5を利用して説明する。
第1記憶部102は例えばRAMにより構成され、作成されたDOMツリー等を記憶する。入出力部103は各種データを入出力するためのインターフェースである。入出力部103には第2記憶部104が接続されている。第2記憶部104には、例えばハードディスク装置等が利用される。なお、操作部101は、ユーザから操作を受け付けるユーザインターフェースとして機能し、ネットワークI/F106は、情報処理装置100が図示しないネットワークに接続された際に、ネットワークを介して情報の授受を行う通信インターフェースとして機能する。
図2は、図1の情報処理装置100で実行される処理を説明するための図である。図2には、図1のROM107内に記憶されたプログラムによって実現される機能が示されている。つまり、XMLプロセッサ(XMLパーサ)202、上位XMLアプリケーション204、DOMインターフェース206が示されている。
上位XMLアプリケーション204は、XML文書208を利用するアプリケーションであり、XML文書208に関するDOMツリー作成指示と共にXML文書208をDOMインターフェース206経由でXMLプロセッサ202に提供する。テキスト形式で記述されたXML文書208はXMLプロセッサ202によって解析され、解析結果としてXML文書208の各要素をノードとする木構造で表現したオブジェクト(DOMツリー210)が作成される。上位XMLアプリケーション204は、DOMインターフェース206経由で、作成されたDOMツリー210を参照し又は操作することができる。
図3は、XML文書の一例を示したものである。XML文書208はテキスト形式で記述されており、要素の始まりを示す開始タグ“< >”と終了を示す終了タグ“</ >”により複数の要素が階層的に表現されている。図3において、要素procは、タグ302を開始タグ、タグ304を終了タグとして記述されており、また、要素setは、タグ306を開始タグ、タグ308を終了タグとして記述されている。XML文書208では、複数の要素が入れ子構造で記述されて要素間の包含関係が表現される。つまり、より外側の要素を上位の要素とする階層構造で表現される。
図4は、図3のXML文書208を解析した結果に対応する木構造のオブジェクト(DOMツリー210)を示している。XMLプロセッサ(図2の符号202)は、XML文書(図3の符号208)を文頭から順に読み込み、開始タグおよび、終了タグを次々に検出して、XML文書208の各要素の階層構造を解析し、解析結果に基づいて図4に示すDOMツリー210を作成する。
図4では、XML文書208で最も外側の要素procが最上位のノードとして配置され、そして、要素procの直下に要素setと要素modeのノードが並列的に配置される。さらに、要素setの直下に3つの要素prmのノードが並列的に配置される。なお、各要素のノードの直下には、その要素の属性ノードや名前空間(Namespace)も配置される。また、3つの要素prmには、図3に示すように、それぞれテキスト(name1,name2,name3)が含まれており、DOMツリー210には、これらテキストに対応するテキストノードも反映されている。
XML文書の要素、属性、名前空間およびテキストは、図4に示すような木構造(階層構造)で表現できる。XML文書では、この構造を利用したXPath(XML Path Language)と呼ばれる検索式が利用される。
図5は、XPathを説明するための図である。XPathは、XML文書のDOMツリー(図4の符号210参照)において、起点となるノードから出発して目的のノードに至るまでの経路を表現するものである。図5に示すXPath(/proc/set/prm[@id=“1”])の意味は次のとおりである。
つまり、ルートノード(図4における要素procの親ノードに相当)の子ノードであるproc要素の子ノードであるset要素の、さらにその子ノードのprm要素のうち、id属性が指定されたノードが指定されている。このXPath式において検索の為に必要な情報は、ルートノードの子ノードであるproc要素、その子ノードのset要素、さらにその子ノードのprm要素でid属性をもつノードとなる。本実施形態では、XPath式とその式に対応する検索の為に必要な情報とを対応づけた検索式管理テーブルが作成され、第1記憶部(図1の符号102)に記憶される。
図6は、本実施形態の情報処理装置において実行される処理の詳細を説明するためのフローチャートである。以下、図1および図2に記載した部分にはそれぞれの図で付した符号を利用して、図6のフローチャートを説明する。
まず、XMLプロセッサ202は、上位XMLアプリケーション204の指示を受け、XML文書208を取得するする(S601)。XMLプロセッサ202は、取得したXML文書208の中にXPath式(検索式)が含まれるか否かを調べて、XPath式が抽出された場合そのXPath式を解析する(S602)。そして、XMLプロセッサ202は、XPath式の評価(検索実行)の為に必要な情報(図5参照)を解析し(S603)、解析した検索式と必要な情報とを対応づけた検索式管理テーブル(図5参照)を第1記憶部102に格納する(S604)。XML文書の中にXPath式が複数含まれる場合、XMLプロセッサ202は、S602〜S604の各ステップを繰り返し、全てのXPath式を抽出して必要な情報と対応づけして第1記憶部102に格納する。
次に、XMLプロセッサ202は、取得したXML文書208の先頭から構造解析処理を実行する(S605)。この構造解析処理では、図3を利用して説明したように、開始タグや終了タグが順に検出される。なお、XML文書208が複数存在してもよく、さらに、XPath式が記述されているXML文書208と、そのXPath式によって参照されるデータを含むXML文書208が別文書であってもよい。
そして、XMLプロセッサ202は、解析結果に基づいて木構造のオブジェクト(DOMツリー210)を作成し(S606)、作成したDOMツリー210を第1記憶部102に格納する(S607)。格納されたDOMツリー210は、上位XMLアプリケーション204によって参照される。
S608〜S612には、本実施形態の特徴的処理の一つであるDOMツリー210の削除処理が示されている。つまり、使用メモリ量削減等の為に上位XMLアプリケーション204の指示により、格納されたDOMツリー210を部分的に削除する処理を行う。XMLプロセッサ202は、上位XMLアプリケーション204から削除要求があるか否かを判断し(S608)、削除要求がない場合には、S605からS607の処理を実行して、DOMツリー210の作成を継続する。一方、削除要求があった場合、記憶している検索式管理テーブルを参照し、削除しようとするノードがXPath式の検索対象か否かを判断する(S609)。検索対象のノードとは、検索式の結果として返されるオブジェクトに含まれるノードや、検索式による計算の為に必要なノードである。また、検索対象か否かの判定は、記憶されているすべてのXPath式について行われる。検索対象のノードの場合、XMLプロセッサ202は、検索式管理テーブルの必要情報と削除対象ノードを比較して不要な部分を削除する(S610)。
ここで、図4のDOMツリー210に関して、図5の検索式管理テーブルが存在する場合を例として、削除可能な不要な部分について説明する。図4のDOMツリー210に対して、領域A内のノードの削除、つまり、要素setのノードおよび二つの要素prmのノードの削除(これらに付随するノードも含まれる)が要求されたとする。ところが、削除対象のノードのうち要素prm(その属性がid=1)のノードは、図5に示す検索式(XPath式)の検索対象ノードとなっている。そこで、XMLプロセッサ202は、検索式管理テーブルの必要情報と削除対象ノードを比較して、削除対象ノードのうち必要情報以外のノードを不要な部分と判断する。つまり、図4における、「B」が付されたノードを不要な部分と判断して削除する。これらのノードが削除されても、XPath式の検索対象ノードである要素prm(その属性がid=1)のノードまでの経路が確保される。すなわち、「B」のノードが削除されても、要素setのノードからの経路が確保され、XPath式による参照状態が保たれる。
図6に戻り、S609で検索対象ノードでないと判断された場合には、その削除指定ノードを削除する(S611)。そして、XML文書208の終わりまで解析処理が実行されたか否かを判断し(S612)、終了していない場合にはS605に戻り、S605以降の処理を再び実行する。一方、S612でXML文書208の終わりまで解析処理が終了したと判断された場合には、解析結果である木構造(DOMツリー210)が上位XMLアプリケーション204に渡されて本フローが終了する。
図7は、DOMツリー削除処理の他の例を説明するための図であり、図6のS608〜S612に換えて実行される処理のフローチャートである。
XPath式の検索結果として返されるオブジェクト、つまり、XPath式で特定される要素に対応したデータの種類には、ノード集合、ブール値、数値、文字列などが挙げられる。これらの内容によっては、比較的少ないデータ量のオブジェクトがXPath式の検索結果として返される場合がある。例えば、図8に示すように、検索式による検索結果としてブール値(True)や数値(5)のようにデータ量の少ないオブジェクトが対応する場合がある。このように、比較的少ないデータ量のオブジェクトの場合には、検索式と検索結果であるオブジェクトを直接対応づけて記憶しておき、検索式の実行時には結果として記憶しているオブジェクト(データ)を返すことにより、処理効率も上がり、より多くの情報を削減できる。以下、図7に戻りその処理について説明する。
S608(図6参照)において、DOMツリー210の一部を削除する指示を受取ると、XMLプロセッサ202は、削除しようとするノードがXPath式の検索対象か否かを判断し(S701)、検索対象である場合、その検索結果となるオブジェクトが所定量以下であるか否かを判断する(S702)。S702では、例えば、検索結果がブール値や数値の場合にはこれらのデータ量が小さいため常に所定量以下と判断し、検索結果がノード集合ならNノード以下であるか否かを判断し、検索結果が文字列ならN文字以下であるか否かを判断する。検索結果がNバイト以下か否かを判断してもよい。
S702で所定量以下であると判断された場合はその検索式を実行し(S703)、検索結果と検索式を対応づけて第1記憶部102に記憶する(S704)。そして、削除を指定されたノードを削除する。S704で検索結果と検索式が対応づけられているため、検索対象のノードが削除されても検索結果であるオブジェクトの参照が可能になる。
なお、S702で、オブジェクトが所定量以下ではないと判断された場合には、検索式管理テーブルの必要な情報と削除対象ノードを比較して不要な部分のみを削除する(S706)。つまり、図6におけるS610と同じ処理を実行する。
図9は、DOMツリー削除処理のさらに他の例を説明するための図であり、図6のS608〜S612に換えて実行される処理のフローチャートである。検索対象のノードとは、検索式の結果として返されるオブジェクトに含まれるノードや、検索式による計算の為に必要なノードである。そこで、検索式による計算の為だけに必要なノードに対して削除要求があった場合には、そのノードを削除し、削除後のツリートポロジーを反映させた検索式を再作成し、削除後に検索式を実行する際には、再作成した検索式を用いて検索を実行する。これにより、さらに多くの情報を削減できる。
S608(図6参照)において、DOMツリー210の一部を削除する指示を受取ると、XMLプロセッサ202は、削除しようとするノードがXPath式の検索対象か否かを判断する(S901)。検索対象である場合、削除ノードが検索式の結果として返されるオブジェクト(直接参照)か否かを判断する(S902)。直接参照でない場合、指定ノードの削除後も検索式が同じ結果を導き出せるような式を再作成し(S903)、元の検索式と再作成した検索式を対応づけて第1記憶部102に記憶する(S904)。そして指定のノードを削除する(S905)。
図10は、検索式と再作成した検索式を対応させた管理テーブルを説明するための図である。検索式(/proc/set/prm[2])は、ルートノードの子ノードのproc要素の子ノードのset要素の子ノードの2番目のprm要素を示すXPath式であり、図4のDを検索する検索式に相当する。ここで、検索対象だが直接参照ではない図4のCの削除が指定された場合、つまり、set要素の子ノードの1番目のprm要素が指定され削除されると、削除後、元の2番目のprm要素(図4のD)が1番目のprm要素となる。そこで、検索式を(/proc/set/prm[1])と再作成することでCの削除後も同じDを検索することが可能になる。
図9に戻り、S902で直接参照と判断された場合には、検索式管理テーブルの必要な情報と削除対象ノードを比較して不要な部分のみを削除する(S906)。つまり、図6におけるS610と同じ処理を実行する。
図11は、本実施形態の情報処理装置において実行される、XML文書の解析および退避処理を説明するためのフローチャートである。
まず、XMLプロセッサ202は、上位XMLアプリケーション204の指示を受け、XML文書208を取得する(S1101)。XMLプロセッサ202は、取得したXML文書208を文書の最初から順次解析し(S1102)、XPath式(検索式)が含まれるか否かを調べ(S1103)、XPath式が抽出された場合、そのXPath式を解析する(S1104)。
そして、XMLプロセッサ202は、XPath式の評価(検索実行)の為に必要な情報(図5参照)を解析し(S1105)、解析した検索式と必要な情報を対応づけた対応データを検索式管理テーブルに格納する(S1106)。さらに、XMLプロセッサ202は、検索式の検索対象となっているノードがすでに解析済みか否かを判断し(S1107)、解析済みの場合、対象ノードが退避されているか否かを判断する(S1108)。対象ノードが退避済みの場合、退避されたノードの情報を第2記憶部104から取得して(S1109)、検索式を実行し(S1110)、検索式と実行結果を対応づけて管理テーブルに登録する(S1111)。
図12は、第2記憶部に退避されたノードが参照された場合、つまり、図11のS1108およびS1109において実行される処理を説明するためのフローチャートである。 まず、XPath式によるノードの参照指定を受け付け(S1201)、検索式の管理テーブルを参照する(S1202)。そして、検索対象ノードがすでに退避されているノードか否かを判別し(S1203)、退避されているノードの場合、検索実行に必要な情報を判別し(S1204)、必要情報のみを第2記憶部から取得する(S1205)。なお、S1203で退避されていないノードであると判断された場合、S1204およびS1205の処理は実行しない。
図11に戻り、S1103でXPath式が抽出されない場合、XML文書の解析結果に基づいてDOMツリーを作成し(S1112)、作成したDOMツリーを第1記憶部102に格納する(S1113)。そして、S1113で作成したノードが記憶されている検索式の検索対象であり、検索が実行されているか否かを判断し(S1114)、未実行の場合には、S1108の処理に移る。
S1115では、上位XMLアプリケーション204から削除要求があるか否かを判断し、削除要求があった場合、指定されたノードを第2記憶部104に退避する(S1116)。この際、例えば図13に示すように、退避するノード(退避ノード)とその退避先の所在(文書退避先)とを関連づけた退避文書管理テーブルを作成し保持しておく。そして、XML文書の終了まで達したか否かを判断し(S1117)、終了していない場合にはS1102に戻り、また、終了している場合には本フローを終了する。
図14は、第2記憶部にノードを退避させる場合、つまり、図11のS1116において実行される処理を説明するためのフローチャートである。S1115(図11)で削除指定があると、削除ノードのデータをテキスト形式のデータに変換し(S1401)、そのテキストを圧縮する(S1402)。そして圧縮したデータを第2記憶部に退避して退避文書管理テーブル(図13参照)を作成して第1記憶部内に格納する(S1403)。
図6を利用して説明した処理では、XML文書の解析処理前に検索式を抽出する必要があるが、図11から図14を利用して説明した処理、つまり、XML文書の解析および退避処理では、先に検索式を抽出する処理が不要となる。
以上、本発明の好適な実施形態を説明したが、上述した実施形態は、あらゆる点で単なる例示にすぎず、本発明の範囲を限定するものではない。
本発明に係る情報処理装置の構成図である。 情報処理装置で実行される処理を説明するための図である。 XML文書の一例を示した図である。 木構造のオブジェクトを示す図である。 XPathを説明するための図である。 本実施形態の情報処理装置において実行される処理の詳細を説明するためのフローチャートである。 DOMツリー削除処理の他の例を説明するための図である。 検索式による検索結果を説明するための図である。 DOMツリー削除処理のさらに他の例を説明するための図である。 検索式と再作成した検索式を対応させた管理テーブルを説明するための図である。 本実施形態の情報処理装置において実行される、XML文書の解析および退避処理を説明するためのフローチャートである。 第2記憶部に退避されたノードが参照された場合の処理を説明するための図である。 退避文書管理テーブルを説明するための図である。 第2記憶部にノードを退避させる場合の処理を説明するための図である。
符号の説明
100 情報処理装置、202 XMLプロセッサ、204 上位XMLアプリケーション、206 DOMインターフェース、208 XML文書、210 DOMツリー。

Claims (6)

  1. 複数の要素による階層構造を含む構造化情報が記憶された記憶部と、
    前記複数の要素に含まれる特定要素を検索するための検索情報に基づいて、その特定要素のデータとその特定要素を検索するための検索情報とを対応付けた対応情報を生成する対応情報生成部と、
    削除を要求された前記特定要素のうちの前記対応情報が生成された特定要素を前記記憶部から削除する削除処理部と、
    を有する、
    ことを特徴とする情報処理装置。
  2. 請求項1に記載の情報処理装置であって、
    前記対応情報生成部は、前記検索情報に基づいて、その検索情報によって検索される特定要素に対応したデータを検索し、検索したデータのデータ量が所定量より小さいか否かを判断し、
    前記データ量が所定量より小さいと判断された場合に、前記対応情報生成部は、そのデータとその検索情報とを対応付けた対応情報を生成し、前記削除処理部は、削除を要求された特定要素のうちの前記対応情報が生成された特定要素を前記記憶部から削除し、
    前記データ量が所定量より小さくないと判断された場合に、前記削除処理部は、前記検索情報に基づいて前記記憶された構造化情報のうち前記特定要素までの経路を特定するために必要な情報を残して、前記記憶された構造化情報のうちの削除を要求された情報を前記記憶部から削除する、
    ことを特徴とする情報処理装置。
  3. 請求項2に記載の情報処理装置であって、
    前記検索情報とその検索情報によって検索される特定要素に対応したデータとを対応付けた対応情報が生成されている場合に、当該検索情報に基づいた検索処理の結果としてその検索情報に対応付けられて記憶されたデータを返す検索処理部をさらに有する
    ことを特徴とする情報処理装置。
  4. 複数の要素による階層構造を含む構造化情報が記憶された記憶部から情報を削除するために、対応情報生成部と削除処理部を有する情報処理装置が実行する情報処理方法であって、
    前記対応情報生成部が、前記複数の要素に含まれる特定要素を検索するための検索情報に基づいて、その特定要素のデータとその特定要素を検索するための検索情報とを対応付けた対応情報を生成し、
    前記削除処理部が、削除を要求された前記特定要素のうちの前記対応情報が生成された特定要素を前記記憶部から削除する、
    ことを特徴とする情報処理方法。
  5. 請求項4に記載の情報処理方法であって、
    前記対応情報生成部が、前記検索情報に基づいて、その検索情報によって検索される特定要素に対応したデータを検索し、検索したデータのデータ量が所定量より小さいか否かを判断し、前記データ量が所定量より小さいと判断された場合に、そのデータとその検索情報とを対応付けた対応情報を生成し、
    前記削除処理部が、前記データ量が所定量より小さいと判断された場合に、削除を要求された特定要素のうちの前記対応情報が生成された特定要素を前記記憶部から削除し、前記データ量が所定量より小さくないと判断された場合に、前記検索情報に基づいて前記記憶された構造化情報のうち前記特定要素までの経路を特定するために必要な情報を残して、前記記憶された構造化情報のうちの削除を要求された情報を前記記憶部から削除する、
    ことを特徴とする情報処理方法。
  6. 請求項5に記載の情報処理方法であって、
    前記検索情報とその検索情報によって検索される特定要素に対応したデータとを対応付けた対応情報が生成されている場合に、前記情報処理装置が有する検索処理部が、当該検索情報に基づいた検索処理の結果としてその検索情報に対応付けられて記憶されたデータを返す、
    ことを特徴とする情報処理方法。
JP2004032145A 2004-02-09 2004-02-09 情報処理装置 Expired - Fee Related JP4411994B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004032145A JP4411994B2 (ja) 2004-02-09 2004-02-09 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004032145A JP4411994B2 (ja) 2004-02-09 2004-02-09 情報処理装置

Publications (2)

Publication Number Publication Date
JP2005222465A JP2005222465A (ja) 2005-08-18
JP4411994B2 true JP4411994B2 (ja) 2010-02-10

Family

ID=34998021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004032145A Expired - Fee Related JP4411994B2 (ja) 2004-02-09 2004-02-09 情報処理装置

Country Status (1)

Country Link
JP (1) JP4411994B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100902653B1 (ko) 2008-01-11 2009-06-15 숭실대학교산학협력단 효율적인 온톨로지 추론을 위한 검색 장치 및 방법
EP2804342A4 (en) * 2012-02-17 2014-11-19 Huawei Tech Co Ltd METHOD AND DEVICE FOR SUPPRESSING CONFIGURATION CONTROL IN COMMUNICATION EQUIPMENT

Also Published As

Publication number Publication date
JP2005222465A (ja) 2005-08-18

Similar Documents

Publication Publication Date Title
US7519903B2 (en) Converting a structured document using a hash value, and generating a new text element for a tree structure
JP4124261B2 (ja) 文書解析システム、文書解析方法、及びそのプログラム
KR100890966B1 (ko) 문서 처리 방법, 기록 매체 및 시스템
US8762834B2 (en) User interface for defining a text file transformation
JP2004234354A (ja) 構造パターン候補を生成する方法、システムおよびプログラム
KR100899616B1 (ko) 관계형 데이터베이스를 이용한 메타데이터 관리 방법 및시스템
JP4411994B2 (ja) 情報処理装置
JP2010282327A (ja) フォーマット変換システムおよびフォーマット変換方法並びにプログラム
KR101092363B1 (ko) 중한자동번역을 위한 한국어 연결어미 생성 방법 및 그 장치
JP3597940B2 (ja) Html文書本型整形方法及びその装置
JP4439497B2 (ja) 検索処理装置及びプログラム
JP4490930B2 (ja) 構造化文書検索装置および構造化文書検索方法
JP2009211599A (ja) マッピング定義作成システムおよびマッピング定義作成プログラム
JP4649339B2 (ja) XPath処理装置、XPath処理方法、XPath処理プログラム、および、記憶媒体
JP2004348341A (ja) 構造化文書処理システム、構造化文書処理方法及びプログラム
JP2011053891A (ja) 通信データのリレーショナルデータベース保存方法およびリレーショナルデータベース保存プログラム
JP4207992B2 (ja) 構造化文書処理システム及び構造化文書処理方法
JP5206675B2 (ja) 構造化文書変換装置
JPWO2005101210A1 (ja) データ解析装置およびデータ解析プログラム
JP4134824B2 (ja) 情報処理装置及びプログラム
JP2013175053A (ja) Xml文書検索装置及びプログラム
JP2006155593A (ja) 文書解析システム、及び文書適応システム
JP7371989B1 (ja) 検索サーバー、検索システム、及び検索プログラム
JP2012073706A (ja) 構造化文書格納装置、構造化文書格納方法及び構造化文書格納プログラム
JP2014081905A (ja) データを検索するための論理式の作成を補助するグラフィカルインターフェースを提供する装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081202

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090303

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091027

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091109

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131127

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees