JP2008084128A - 構造化文書の要素指定装置、要素指定方法及び要素指定プログラム - Google Patents

構造化文書の要素指定装置、要素指定方法及び要素指定プログラム Download PDF

Info

Publication number
JP2008084128A
JP2008084128A JP2006265025A JP2006265025A JP2008084128A JP 2008084128 A JP2008084128 A JP 2008084128A JP 2006265025 A JP2006265025 A JP 2006265025A JP 2006265025 A JP2006265025 A JP 2006265025A JP 2008084128 A JP2008084128 A JP 2008084128A
Authority
JP
Japan
Prior art keywords
structured document
designation
information
unit
path expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006265025A
Other languages
English (en)
Inventor
Daisuke Nagasawa
大介 永澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006265025A priority Critical patent/JP2008084128A/ja
Priority to US11/896,207 priority patent/US20080091695A1/en
Publication of JP2008084128A publication Critical patent/JP2008084128A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/81Indexing, e.g. XML tags; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying
    • G06F16/835Query processing
    • G06F16/8365Query optimisation

Abstract

【課題】構造化文書データに含まれる要素を指定するために行う設定の負担を軽減する。
【解決手段】階層化された論理構造を用いて要素を保持する構造化文書に対して要素を特定するパス式と、該パス式により特定された要素に対して指定/指定解除を定義する指定情報とが対応付けられたフィルタデータを格納する格納部と、フィルタデータのパス式に基づいて、構造化文書からパス式に合致する要素を取得する取得部と、パス式と対応付けられていた記述子を取得する指定取得部と、取得した前記指定情報から、要素を指定するか指定解除するか判定する要素判定部と、判定された要素に指定又は指定解除を行う指定部と、を備える。
【選択図】 図5

Description

この発明は、階層化された論理構造を用いて要素が格納された構造化文書から、条件に一致した要素を指定する構造化文書の要素指定装置、要素指定方法及び要素指定プログラムに関するものである。
構造化文書は、所定の記号を用いて構造化された要素を内包し、構造により各要素の論理的な関係(文書論理構造)を保持する文書である。構造化文書を記述するメタ言語の例として、SGML(Standard Generalized Mark-up Language)や、W3C(World Wide Web Consortium)で定められ、近年急速に普及が進んでいるXML(eXtensible Markup Language)がある。
そして、構造化文書を管理するために構造化文書データベースが使用されている。この構造化文書データベースは、構造化文書が保持する要素の論理的な関係を表す情報を管理する。そして、利用者が構造化文書の構造を検索条件として設定した場合、この情報を検索時に使用することで、精度の高い検索を実現する。
そして、検索条件として構造が設定された場合に高速に検索を行うために、構造化文書管理データベースが、構造化文書の各階層又は要素に対して予め索引を生成しておき、検索時に当該索引を利用する技術がある。
例えば、特許文献1には、構造化データ検索装置が索引データ記憶部を備えている。この索引データ記憶部は、テキストデータと、当該テキストデータを含む構造化文書中の各要素を示したオブジェクトIDとを対応付けて記憶している。
ところで、構造化文書は、通常の文書特比べて、複雑な構造を保持することができる。また、索引情報を生成するためには、通常は、あらかじめ検索時に使用すると考えられる要素等のみを対象に索引情報を生成する。
つまり、索引を設定するために、索引として設定される要素を、構造を用いて要素単位で明示的に指定する必要がある。このような構造を用いて要素単位で明示的に指定する場合、一般的にはスキーマ言語やアドレッシング言語を使用する。
特開2005−190163号公報
しかしながら、構造化文書は文書毎に構造が異なることが多い。例えば、XMLは、文書の論理構造や構成要素の名前を自由に定義する事が可能なので、文書毎に構造が大きく異なることも多い。
そして、これら構造化文書に対して、従来のスキーマ言語を用いて、索引情報の生成対象となる要素を指定するためには、利用者が、当該構造化文書毎の構造を予め知り、索引生成する対象となる要素を記述する必要があるため、利用者に対する負担が大きいという問題があった。
本発明は、上記に鑑みてなされたものであって、要素を指定する際の利用者の負担を軽減することができる構造化文書の要素指定装置、要素指定方法及び要素指定プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、構造化文書の要素指定装置であって、階層化された論理構造を用いて要素を保持する構造化文書に対して要素を特定する構造パス式と、該構造パス式により特定された要素に対して指定/指定解除を定義する指定情報とが対応付けられた要素指定対応情報を格納する格納部と、前記要素指定対応情報の前記構造パス式に基づいて、前記構造化文書から前記構造パス式に合致する要素を取得する取得部と、前記要素の取得に用いた前記構造パス式と対応付けられていた前記指定情報を前記要素指定対応情報から取得する指定取得部と、取得した前記指定情報から、前記要素を指定するか指定解除するかを判定する要素判定部と、判定された要素に対して、判定に従って指定又は指定解除を行う指定部と、を備えることを特徴とする。
また、本発明は、構造化文書の要素指定方法であって、階層化された論理構造を用いて要素を保持する構造化文書に対して要素を特定する構造パス式と、該構造パス式により特定された要素に対して指定/指定解除を定義する指定情報とが対応付けられた要素指定対応情報を取得する対応情報取得ステップと、取得した前記要素指定対応情報の前記構造パス式に基づいて、前記構造化文書から前記構造パス式に合致する要素を取得する取得ステップと、前記要素の取得に用いた前記構造パス式と対応付けられていた前記指定情報を前記要素指定対応情報から取得する指定取得ステップと、取得した前記指定情報から、前記要素を指定するか指定解除するかを判定する要素判定ステップと、判定された要素に対して、判定に従って指定又は指定解除を行う指定ステップと、を有することを特徴とする。
また、本発明は、構造化文書に含まれる要素を指定する要素指定プログラムであって、構造化文書に含まれる要素を指定する要素指定プログラムであって、階層化された論理構造を用いて要素を保持する構造化文書に対して要素を特定する構造パス式と、該構造パス式により特定された要素に対して指定/指定解除を定義する指定情報とが対応付けられた要素指定対応情報を取得する対応情報取得ステップと、取得した前記要素指定対応情報の前記構造パス式に基づいて、前記構造化文書から前記構造パス式に合致する要素を取得する取得ステップと、前記要素の取得に用いた前記構造パス式と対応付けられていた前記指定情報を前記要素指定対応情報から取得する指定取得ステップと、取得した前記指定情報から、前記要素を指定するか指定解除するかを判定する要素判定ステップと、判定された要素に対して、判定に従って指定又は指定解除を行う指定ステップと、をコンピュータに実行させる。
本発明によれば、要素指定対応情報を用いて構造化文書が保持する要素の指定と指定解除を行うことで、構造パス式のみで要素を指定するより柔軟性が向上するので、要素を指定するために行われる利用者の設定の負担が軽減されるという効果を奏する。
以下に添付図面を参照して、この発明にかかる構造化文書の要素指定装置、要素指定方法及び要素指定プログラムの最良な実施の形態を詳細に説明する。後述する実施形態においては、構造化文書の要素指定装置を構造化文書管理装置に適用した例について説明する。なお、構造化文書の要素指定装置は、構造化文書管理装置以外の様々な装置に対して適用することができる。
(第1の実施の形態)
図1は、第1の実施の形態にかかる構造化文書管理装置100の構成を示すブロック図である。本図に示すように、構造化文書管理装置100は、入出力処理部101と、検索処理部102と、フィルタ処理部103と、検索索引生成部104と、データ格納処理部105と、データ削除処理部106と、構造テンプレート格納部107と、索引格納部108と、構造化文書データ格納部109とを備える。
また、構造化文書データは、どのような形式のものでも良いが、例えば、SGML、XML、そのサブセットであるXHTML(eXtensible HyperText Markup Language)形式等記述された文書データがある。また、本実施の形態は、構造化文書管理装置100がXML形式で記述された構造化文書に対して処理を行った例について説明する。
図2は、構造化文書管理装置100の処理対象となる構造化文書データの例を示した図である。図2で示した構造化文書データは、XML形式で記述されている。このXML形式で記述された構造化文書データは、対になったタグにより要素を形成している。この対になったタグを開始タグと終了タグとする。また、内部にタグを含んでいない要素を、データ要素とする。
そして、構造化文書データは、これらの複数の要素により、入れ子の構造をなしている。図2においては、要素“bib”は要素“book"を含み、要素“book”は、“title”、“author”等を含んでいる。また、要素“title”の直下にデータ要素を含んでいる。このデータ要素の実体データは“How to live in Japan"となる。
また、XML形式では、図2で示す例では要素“author”が2つの要素“author”を含むように、要素の内部に同じ要素を複数並べる事ができる。また、XML形式では、直下に要素を持たない要素を記述することもできる。図2で示す例では、要素“rates”が該当する。
図1に戻り、入出力処理部101は、処理要求受付部111と、要求処理部112と、フィルタ決定部113と、結果処理部114とを備え、構造化文書管理装置100に対して入出力されるデータを処理する。
処理要求受付部111は、外部から構造化文書管理装置100に対して、入力された要求や情報を受け付ける。例えば、処理要求受付部111は、利用者からの検索要求、管理対象となる構造化文書データ又はフィルタデータの入力を受け付ける。
また、フィルタデータは、構造化文書データが保持する要素を指定するためのルールが記載されているものであり、詳細については後述する。
要求処理部112は、入力された構造化文書データを、木構造と実体データに分解する処理を行う。
図3は、図2に示した構造化文書データを分解した木構造の概念を示した説明図である。図3で示された円形は要素とし、方形はデータ要素とし、要素及びデータ要素間を結ぶリンクはアークとする。
フィルタ決定部113は、フィルタ格納部115を備え、フィルタデータが入力された場合、フィルタ格納部115にフィルタデータを格納し、当該フィルタデータから構造化文書データの要素を指定するためのルールを、部分木処理部122に出力する。フィルタ格納部115は、構造化文書データに対してフィルタリングを行うためのフィルタデータを格納する。
図4は、フィルタ格納部115に格納されたフィルタデータのデータ構造の例を示した図である。このフィルタデータの各行には、構造化文書データの要素の指定/指定解除を行うためのルールが記述子として格納されている。各ルールは、図4に示すようにルール番号と、記述子と、構造パス式と、索引種類とが対応付けられている。本実施の形態にかかる構造化文書管理装置100では、これらルールを用いて、構造化文書データの要素を指定する。なお、詳細な処理手順については後述する。なお、フィルタデータは、換言すれば要素指定対応情報に相当する。
また、図4に示すパス式では、要素間の記号“/"は、要素の直下の要素を示し、要素間の記号“//”は、要素以下の全ての要素を示している。このように要素間の記号を使い分けることで、要素の指定が容易となり、利用者の負担を軽減させることができる。
図4に示すフィルタデータは、利用者が『abstractタグ以下と、numbersタグ以下を除いて語彙索引を設定し、numbersタグ以下のratesタグを除く全ての要素に数値索引を設定したい』と考えた場合に記述されたフィルタデータとする。
ルール番号は、当該ルールを適用するための順序を保持する。また、記述子は、当該ルールが、フィルタとして通すか否かを保持する。記述子が“PASS”であればフィルタとして通す、結果として要素が指定される。また、記述子が“REJECT”であればフィルタとして通さない、結果として要素の指定が解除される。索引種類は、検索索引のタイプを示している。索引種類が“lex”であれば、文字列として索引生成され、索引種類が“num”であれば、数値として索引生成される。
図1に戻り、結果処理部114は、構造化文書管理装置100において行った処理の結果を出力する。例えば、結果処理部114は、利用者からの要求に応じて行われた検索処理部102が行った検索結果を、利用者に対して出力する。
検索処理部102は、利用者からの検索要求を受け付けた場合に、構造テンプレート格納部107又は構造化文書データ格納部109に対して検索を行う。また、検索対象の索引を索引格納部108が保持している場合、当該索引を利用して検索を行う。
フィルタ処理部103は、構造パス式処理部121と、部分木処理部122とを備えている。
構造パス式処理部121は、構造化文書データ格納部109に格納されていた構造化文書データ又は構造テンプレート格納部に格納されていた構造テンプレートを取得し、構造化文書データ等から木構造と実体データに分解し、部分木処理部122に出力する。
部分木処理部122は、取得部123と、指定取得部124と、要素判定部125と、指定部126と、を備え、構造化文書データの木構造と実体データから、フィルタデータに記述されたルールに基づいて構造化文書データの要素を指定する処理を行う。
取得部123は、フィルタ決定部113から入力されたルールに記述されたパス式に基づいて、入力された構造化文書データの木構造から、パス式に合致する部分木を取得する。
なお、既に前回行われた処理により、指定された要素を保持する中間結果の部分木が生成されている場合、取得部123はこの中間結果の部分木と、取得した部分木とを比較する。そして、取得部123は、今回取得した部分木のうち中間結果の部分木に含まれない要素で構成される第1の分割部分木と、取得した部分木のうち中間結果の部分木に含まれる要素で構成される第2の部分木とを取得する。
指定取得部124は、取得部123の部分木の取得に用いたパス式と対応付けられた記述子を取得する。なお、この記述子は、フィルタ決定部113から入力される。
要素判定部125は、指定取得部124が取得した記述子が“PASS”か“REJECT”であるか判定する。“PASS”であれば、取得した部分木に含まれる要素が指定の対象となり、“REJECT”であれば、取得した部分木に含まれる要素が指定解除の対象となる。
指定部126は、判定された部分木に含まれる要素に対して指定又は指定解除を行う。本実施の形態では、指定部126は、判定結果が“PASS”であれば、前回までに行われた中間結果の部分木に対して、第1の分割部分木と結合処理を行う。また、指定部126は、判定結果が“REJECT”であれば、前回までに行われた中間結果の部分木から、第2の分割部分木の削除処理を行う。なお、結合又は削除の対象となる部分木の各要素には、今回の処理で用いたパス式と対応付けられていた索引種類と、当該要素を示すパス情報が付加されている。この付加されたパス情報は、当該要素を識別する識別情報としても用いられる。
確認部127は、フィルタデータの各ルールを適用する度に、結合又は削除した後の部分木に矛盾があるか否か確認を行う。
また、確認部127は、フィルタデータの全てのルールを適用した後に、最終的に得られた部分木が、各索引処理部に出力するために適切なものであるか確認する。例えば、確認部127は、当該部分木が“Valid”であるかを判別する処理を行う。また、確認部127は、各要素に付加された索引種類と実体データに矛盾がないか確認する。なお、“Valid”とは、well-formed(整形式)なXML形式の条件を満たすとともに、個別のDTDにも適合していることをいう。
また、確認部127が“Valid”であるか判別するのは、データベースシステムとその索引の種類によっては、例えば「特定の索引を設定する要素は、全てルート要素から辿れなければならない」「数値の索引を設定する要素には、数字以外のデータは含まれてはならない」「属性値については索引を設定できない」などの制限が存在する場合があるためである。
確認部127が、上述した確認処理を行うことで、部分木に適切な要素が含まれている場合に限り、索引が生成される。このため、生成された索引の信頼性が向上する。そして、この確認で問題が無ければ、検索索引生成部104に出力される。
検索索引生成部104は、語彙索引生成部141と数値索引生成部142とを備える。検索索引生成部104が、索引を生成することで、構造化文書データが保持する要素の検索を高速化することができる。
語彙索引生成部141は、構造化文書データのうち、フィルタ処理部10で索引種類“lex”が付加された要素に対して索引を生成し、生成した索引を語彙索引格納部131に格納する。
数値索引生成部142は、構造化文書データのうち、フィルタ処理部10で索引種類“num”が付加された要素に対して索引を生成し、生成した索引を数値索引格納部132に格納する。
データ格納処理部105は、入力された構造化文書データを構造化文書データ格納部109に格納し、当該構造化文書データから利用者が利用する部分木が抽出されていた場合には当該部分木を構造テンプレート格納部107に格納する。
データ削除処理部106は、利用者からの要求により構造化文書データ格納部109に格納された構造化文書データの削除、又は構造テンプレート格納部107に格納された部分木データの削除を行う。
構造テンプレート格納部107は、構造テンプレートデータを格納している。構造テンプレートデータは、入力された構造化文書データから、利用者が利用する必要な部分木のみ抽出した構造データとする。
索引格納部108は、語彙索引格納部131と、数値索引格納部132とを備え、構造化文書データに対して生成された索引を格納している。
語彙索引格納部131は、フィルタ処理部103から入力された部分木に含まれる要素のうち、索引種類“lex”が付加された要素に対して語彙索引を生成し、語彙索引格納部131に格納する。また、語彙索引格納部131は、この語彙索引を生成するために、当該要素に付加されたパス情報を利用する。
数値索引格納部132は、フィルタ処理部103から入力された部分木に含まれる要素のうち、索引種類“num”が付加された要素に対して数値索引を生成し、数値索引格納部132に格納する。また、数値索引格納部132は、この数値索引を生成するために、当該要素に付加されたパス情報を利用する。
構造化文書データ格納部109は、構造化文書データを格納している。なお、格納手法については、周知の手法を問わず、あらゆる手法を用いても良い。
次に、図1に示す構造化文書管理装置100の入力された構造化文書データに対する索引を生成するまでの処理手順について説明する。図5は、構造化文書管理装置100の入力された構造化文書データに対する索引を生成するまでの処理手順を示すフローチャートである。なお、索引を生成するための要素を指定するフィルタデータは、すでにフィルタ格納部115に格納されているものとする。
まず、要求処理部112は、入力された構造化文書データを分解して、当該構造化文書データの木構造と実体化データを取得する(ステップS501)。なお、取得した構造化文書データの木構造と実体データは、フィルタ処理部103に出力する。
次に、フィルタ決定部113は、フィルタ格納部115に格納されているフィルタデータのうち最初のルールを、フィルタ処理部103に出力する(ステップS502)。
そして、取得部123は、構造化文書データの木構造を検索し、入力されたルールに示されたパス式の条件に合致する部分木を取得する(ステップS503)。
次に、取得部123は、中間結果の部分木があれば、取得した部分木と比較して、分割部分木を取得する(ステップS504)。つまり、取得部123は、今回取得した部分木のうち中間結果の部分木に含まれない要素で構成される第1の分割部分木と、取得した部分木のうち中間結果の部分木に含まれる要素で構成される第2の部分木とを取得する。なお、中間結果の部分木がない場合、取得した部分木全てが第1の分割部分木となり、第2の分割部分木は存在しないことになる。
そして、指定取得部124は、入力されたルールに示された記述子を取得する(ステップS505)。次に、要素判定部125が、取得した記述子が“PASS”であるか否か判定する(ステップS506)。
そして、要素判定部125が、取得した記述子が“PASS”だと判定した場合(ステップS506:Yes)、指定部126は、中間結果の部分木に第1の分割部分木を結合し、新たな中間結果の部分木を取得する(ステップS507)。
そして、要素判定部125が、取得した記述子が“REJECT”だと判定した場合(ステップS506:No)、指定部126は、中間結果の部分木から第2の分割部分木を削除して、新たな中間結果の部分木を取得する(ステップS508)。なお、中間結果の部分木がない場合、特に処理を行わない。
次に、取得部123は、入力されたパス式で文書データの木構造を全て検索したか判断する(ステップS509)。全ての木構造を検索していないと判断した場合(ステップS509:No)、再び取得部123は、木構造の検索を行う(ステップS503)。
また、全ての木構造を検索したと判断した場合(ステップS509:Yes)、確認部127が、中間結果である部分木の整合性の確認処理を行う(ステップS510)。確認処理に成功した場合、特に処理を行わない。確認処理に失敗した場合、異常状態とみなして、利用者に対してその旨を通知する等の処理を行う。
次に、フィルタ決定部113が、フィルタデータに含まれる全てのルールを出力したか判定する(ステップS511)。全てのルールを出力していないと判定した場合(ステップS511:No)、フィルタ決定部113は、次のルールを、フィルタ処理部103に出力する(ステップS512)。
そして、フィルタ決定部113が、フィルタデータに含まれる全てのルールを出力したと判定した場合(ステップS511:Yes)、確認部127は、部分木に対する最終確認処理を行う(ステップS513)。確認処理に成功した場合及び失敗した場合の処理はステップS510で説明した場合と同様とする。
次に、語彙索引生成部141は、取得した部分木のうち索引種類が“lex”の要素を用いて索引を生成し、生成した索引を語彙索引格納部131に格納する(ステップS514)。
そして、数値索引生成部142は、取得した部分木のうち索引種類が“num”の要素を用いて索引を生成し、生成した索引を数値索引格納部132に格納する(ステップS515)。
上述した処理手順では、入力された構造化文書データに対して索引を付加する処理について説明した。しかしながら、索引を生成する場合、既に構造化文書データ格納部109に格納される構造化文書等に対して索引を生成する場合も考えられ、この場合についても同様の処理を行うことで索引を生成することができる。
次に、フィルタデータの各ルールに従って要素が結合/削除される部分木について説明する。なお、ルール毎に行われる処理は、図5に示したので説明を省略する。
図6は、図4で示したフィルタデータのルール番号‘1’のルールを、図3で示した構造化文書データに適用した後の中間結果の部分木の概念を示した図である。この図4のフィルタデータに記述されたルール番号‘1’のパス式(XPath式)「//text()」は、「ルート要素以下の全てのデータ要素」を意味している。また、ルール番号‘1’では、パス式に合致した部分木に付加される索引種類は“lex”である。そこで、部分木処理部122は、図6に示すように、ルート要素以下の全てのデータ要素に“lex”が付加された部分木を取得する。また、当該ルールの記述子が“PASS”でまだ中間結果の部分木が保持されていないので、この部分木が中間結果の部分木となる。なお、パス式に合致する部分木に含まれる各要素は、(図示しないが)パス情報が付加されている。なお、以下の図についても同様にパス式に合致する部分木に含まれる各要素にはパス情報が付加されているものとする。
さらに、図3で示した構造化文書データの木構造に対して、図5で示したフィルタデータの各ルールを適用していく。次に、部分木処理部122は、ルール番号‘2’のルールを、図3に示した構造化文書データの木構造に対して適用する。パス式が「/bib/book/abstract/Text()」なので、要素“bib"の直下の要素“book"の直下の要素“abstract”の直下のデータ要素が、部分木となる。また、ルール番号‘2’のルールの記述子“REJECT”と索引種別“lex”より、図6で示した中間結果の部分木から、索引種別“lex“のデータ要素を削除した部分木が、中間結果の部分木となる。
同様に、ルール番号‘3’のルールを、図3に示した構造化文書データの木構造に対して適用する。パス式が「//numbers//text()」で、記述子が“REJECT”で、索引種別“lex”なので、部分木処理部122は、ルール番号‘2’のルールを適用した後の中間結果の部分木から、要素“numbers"以下で、索引種別が“lex”の全てのデータ要素を削除する。
図7は、図4に示すフィルタデータのうちルール番号‘3’までのルールを適用した後の中間結果の部分木の概念を示した図である。図7に示すデータ要素801はルール番号‘2’のルールの適用時に索引種別“lex”による指定が解除され、データ要素802〜805は、ルール番号'3'のルールの適用時に索引種別“lex”による指定が解除されていることとなる。
次に、ルール番号‘4’のルールを、図3に示した構造化文書データの木構造に対して適用する。パス式が「//numbers//text()」で、記述子が“PASS”で、索引種別“num”なので、部分木処理部122は、ルール番号‘3’のルールを適用した後の中間結果の部分木と、“numbers”以下の全てのデータ要素に索引種別“num”が指定された部分木とを結合する。
図8は、図4に示すフィルタデータのうちルール番号‘4’までのルールを適用した後の中間結果の部分木の概念を示した図である。図8に示すデータ要素901〜904は、ルール番号‘4’のルールの適用時に索引種別“num”で指定がなされたこととなる。
次に、ルール番号‘5’のルールを、図3に示した構造化文書データの木構造に対して適用する。パス式が「//rates/text()」で、記述子が“REJECT”で、索引種別“num”なので、部分木処理部122は、ルール番号‘4’のルールを適用した後の中間結果の部分木に対して、要素“rates”の直下で索引種別が“num”のデータ要素が削除される。これによりフィルタデータの全てのルールの適用が終了した。
図9は、図4に示すフィルタデータの全てのルールを適用した後の部分木の概念を示した図である。図9に示した部分木は、フィルタデータの記述時に利用者が考えた『abstractタグ以下と、numbersタグ以下を除いて語彙索引を設定し、numbersタグ以下のratesタグを除く全ての要素に数値索引を設定したい』という条件を満たしていることが確認できる。なお、データ要素の上部に記述された“lex”はデータ要素が語彙で索引を生成されることを示している。また、“num”はデータ要素が数値で索引を生成されることを示している。
そして、フィルタ処理部103の処理が終了した後、最終的に生成された部分木と実体データの情報が、検索索引生成部104に出力される。最終的に生成された部分木が図9で示した部分木の場合、語彙索引生成部141は、要素“first”、要素“last”、要素“publisher”、要素“title”の直下のデータ要素に対して語彙索引を付加し、語彙索引格納部131に格納する。そして、数値索引生成部142は、要素“year”、要素“price”、要素“pages”の直下のデータ要素に対して数値索引を付加し、数値索引格納部132に格納する。
このように、本実施の形態にかかる構造化文書管理装置100においては、フィルタデータに記述されたルールを、構造化文書データの木構造に対して適用し、取得した部分木と記述子を用いて、中間結果の部分木に含まれる要素の指定の増減を行うこととした。
これに対し、従来は、記述子や順序を設定することができなかった。このため、従来の手法で、要素を指定するためには、パス式(例えば、XPath式)のみで記載していた。
図10が、図4で示した本実施の形態のフィルタデータと同等の要素を抽出可能な、従来のフィルタデータのデータ構造を示した図である。図10に示すように、図4と比べてパス式記述量が2行多いのが確認できる。また、さらに複雑な構造を備える構造化文書データから、要素を抽出する場合に、さらにパス式記述量に違いがでると考えられる。このように、本実施の形態においては、利用者のパス記述量の負担を軽減できる。
また、従来のフィルタデータでは、複雑な条件をパス式として定義する場合、利用者が当該フィルタデータを参照しても、当該フィルタデータの内容を理解するのが難しくなるという問題があった。これに対し、本実施の形態においては、従来のパス式と、記述子により要素の指定/指定解除の組み合わせで、要素を指定している。これにより、フィルタリングの条件の記述量が減少し、フィルタデータの参照時に、フィルタデータの内容を理解するのが容易となった。さらに、パス式と記述子とを組み合わせたルールの使用順序が定義されているので、要素指定するための条件の記述がさらに容易となる。
本実施の形態では、構造化文書管理装置100が備える構造化文書のデータベースとして索引のタイプを語彙索引及び数値索引の2種類に対して設定した場合について説明した。しかしながら、索引のタイプを制限するものではなく、例えば文書間のリンクを保持するためのリンク索引など、様々な索引のタイプ毎に索引を設定しても良い。
また、本実施の形態で説明したデータ要素は構造化文書データの構成する要素の一つとする。そして、本実施の形態は、検索索引を生成するためにデータ要素を指定するものに限るものではなく、タグ等の構造要素や属性に対して指定を行っても良い。
このようにフィルタに対して“PASS”と“REJECT”を組み合わせて要素を指定することで、要素毎に明示的に指定する必要が無くなり、柔軟に対応することが可能となった。特に、上述したルールが定義されたフィルタを、構造の異なる構造化文書データに対して適用する場合、さらに利用者の負担を軽減できるという効果が期待できる。
また、利用者が要素を指定する際の要求をフィルタデータに対して適切にルールとして定義した場合、当該ルールは上述したように柔軟性が高いため、構造が異なる複数の構造化文書や、構造が不明な構造化文書に対して、当該構造化文書データに含まれている要素に対して適切に指定できる可能性がある。
また、要素を指定する際の柔軟に対応できるので、構造化文書の構造が変更された場合に、変更に合わせてスキーマを再定義することが軽減される。またこれらを組み合わせで要素を指定するので、フィルタのもつルールの肥大化を抑止することができる。
(第2の実施の形態)
第1の実施の形態では、XML形式の構造化文書データを一つ登録する例について説明した。第2の実施形態においては、XHTML形式の構造化文書データを、複数登録する場合について説明する。
なお、第2の実施の形態にかかる構造化文書管理装置の構成は、第1の実施の形態にかかる構造化文書管理装置100の構成と同じなので、同一の符号を付加し、説明を省略する。
図11は、本実施の形態における構造化文書管理装置100の処理対象となるXHTML形式の第1の構造化文書データの例を示した図である。図12は、図11で示した第1の構造化文書データを分解した木構造の概念を示した説明図である。
図13は、構造化文書管理装置100の処理対象となるXHTML形式の第2の構造化文書データの例を示した図である。図14は、図13で示した第2の構造化文書データを分解した木構造の概念を示した説明図である。
これら第1の構造化文書データ及び第2の構造化文書データは、同じ名称のタグで示された要素を保持している。しかし、第1の構造化文書データと、第2の構造化文書データとでは、同じ名称のタグでも出現頻度や構造が異なる。例えば、図12に示した第1の構造化文書データの木構造では、要素“a”1201は、要素“body”の直下にのみ配置されている。これに対し、図14に示した第2の構造化文書データの木構造では、要素“a”1401〜1403は、要素“body”の直下のみならず、要素“body”直下の要素“p”の直下、又は要素“body”直下の要素“div”の直下にも配置されている。
ところで、従来の手法では、構造が異なる構造化文書に対して、索引を生成するために要素を指定する場合、要素を指定するために膨大な数のパス式の記述が必要な可能性がある。また、索引を生成する時に全ての要素を絶対パスで指定すると、要素の配置の全てのパターンを考慮して、パス式を記述する必要があり、利用者の負担が大きくなる。しかし、本実施の形態では、索引の生成対象となる要素の配置に規則性があるならば、この規則に従ってフィルタデータにルールを記述することで、全てのパターンを記述する必要が無くなる。また、規則性を相対パスで表現できるならば、相対パスで表現することで、利用者のパス式を記述する負担を軽減させることができる。
例えば、これら構造化文書データに含まれる要素の中に、検索時に検索条件として使用されない要素が含まれている場合がある。例えば、装飾タグ(HTMLでよく用いられる)で示された要素が該当する。装飾タグの例としては、“br”タグがある。この“br”タグは、改行を表現するための装飾タグであり、配下に子の要素を保持しない。また、“p”タグも改行を表現するための装飾タグである。このような装飾タグで示された要素は、索引のみならず構造としても保持する必要が無い場合もある。また、これら装飾タグで示された要素を考慮して、絶対パスで要素を指定する場合、様々な態様を考慮する必要がある。これに対し、相対パスで要素を指定する場合、パス式にこれら装飾タグの要素を考慮せずとも、所望する要素を指定できることが多くなる。
他の例としては、一般的にHTML形式の構造化文書データでは、“title”タグで示された要素の実体データは、当該文書の表題や題名を格納している場合が多い。また、“a”タグで示された要素は、リンク情報を保持する事が多い。これらのタグで示された要素は、検索時に条件として使用されることが多い。このため、これらのタグについては索引を生成したいという要望が多い。しかしながら、“a”タグ等は、構造化文書データ中で記述される階層の自由度が大きいため、これら全ての階層を考慮すると、従来の手法では、さまざまなパス式を記述する必要があった。しかしながら、パス式に相対パスで記述し、記述子“PASS”と“REJECT”を組み合わせることで、これら要素を容易に指定することができる。
図15は、フィルタ格納部115に格納されたフィルタデータのデータ構造の例を示した図である。図15に示すフィルタデータは、図4で示したフィルタデータと同様の構成を備えている。このフィルタデータは、上述した構造化文書データに対して、『文書の持つ“title”タグ直下のデータ要素と、“body”タグ以下で“p"タグ以下ではない“a”タグ直下の全てのデータ要素に対して索引を生成する』することを目的として定義したフィルタとする。
図16は、図12に示した第1の構造化文書データの木構造に対して、図15に示したフィルタデータの全てのルールを適用した後の部分木の概念を示した図である。図16に示すようにデータ要素1601、1602に索引種類“lex”が付加されていることが確認できる。
図17は、図14に示した第2の構造化文書データの木構造に対して、図15に示したフィルタデータの全てのルールを適用した後の部分木の概念を示した図である。図17に示すようにデータ要素1701〜1703に索引種類“lex”が付加されていることが確認できる。
このように、図16及び図17に示したルール適用した後の部分木は、フィルタデータの目的である『文書の持つ“title”タグ直下のデータ要素と、“body”タグ以下で“p"タグ以下ではない“a”タグ直下の全てのデータ要素に対して索引を生成する』を満足していることが確認できる。
例えば、従来においては要素を指定するときに「Aを除く全て」を指定する場合、‘A’以外の全ての条件をパス式で記述する必要があった。しかし、本実施の形態においては、このような条件をルールとして設定できるので、記述の負担が軽減すると共に、フィルタデータを参照するだけで、フィルタデータの記述者の意図を容易に把握できることになる。
また、従来のフィルタデータでは、構造化文書データに含まれる要素をパス式のみで指定しているので、構造化文書データ毎に構造に違いがある場合、構造化文書データ毎にパス式のパターンを全て列挙する必要があった。しかし、本実施の形態で説明したように、異なる構造の構造化文書データ毎に、異なるパス式を定義する必要が無く、利用者の負担を軽減させることができる。
図18は、上述した実施の形態にかかる構造化文書管理装置100のハードウェア構成を示す図である。構造化文書管理装置100は、ハードウェア構成として、構造化文書管理装置100における構造化文書の要素指定プログラムなどが格納されているROM1802と、ROM1802内のプログラムに従って構造化文書管理装置100の各部を制御するCPU1801と、構造化文書管理装置100の制御に必要な種々のデータを記憶するRAM1803と、ネットワークに接続して通信を行う通信I/F1804と、構造化文書管理装置100で処理した結果を表示する表示部1805と、利用者が処理の要求などを入力するための入力I/F1806と、各部を接続するバス1807を備えている。また、構造化文書管理装置100は、上述した構成を備えた、一般的なコンピュータに適用することができる。
上述した実施の形態にかかる構造化文書管理装置100で実行される構造化文書の要素指定プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
この場合には、構造化文書の要素指定プログラムは、構造化文書管理装置100において上記記録媒体から読み出して実行することにより主記憶装置上にロードされ、上記ソフトウェア構成で説明した各部が主記憶装置上に生成されるようになっている。
また、上述した実施の形態にかかる構造化文書管理装置100で実行される構造化文書の要素指定プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、上述した実施の形態にかかる構造化文書管理装置100で実行される構造化文書の要素指定プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
また、本実施形態の構造化文書の要素指定プログラムを、ROM等に予め組み込んで提供するように構成してもよい。
本実施の形態の構造化文書管理装置100で実行される構造化文書の要素指定プログラムは、上述した各部を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記記憶媒体から構造化文書の要素指定プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、上記各部が主記憶装置上に生成されるようになっている。
以上のように、本発明にかかる構造化文書の要素指定装置、要素指定方法及び要素指定プログラムは、構造化文書データに対して索引を生成する際に、当該構造化文書データに含まれる要素を指定する技術として有用である。
第1の実施の形態にかかる構造化文書管理装置の構成を示すブロック図である。 構造化文書データの例を示した図である。 構造化文書データを分解した木構造の概念を示した説明図である。 第1の実施の形態にかかる構造化文書管理装置のフィルタ格納部に格納されたフィルタデータのデータ構造の例を示した図である。 構造化文書管理装置の入力された構造化文書データに対する索引を生成するまでの処理手順を示すフローチャートである。 図4で示したフィルタデータのルール番号‘1’のルールを、図3で示した構造化文書データに適用した後の中間結果の部分木の概念を示した図である。 フィルタデータのうちルール番号‘3’までのルールを適用した後の中間結果の部分木の概念を示した図である。 フィルタデータのうちルール番号‘4’までのルールを適用した後の中間結果の部分木の概念を示した図である。 フィルタデータの全てのルールを適用した後の部分木の概念を示した図である。 従来のフィルタデータのデータ構造を示した図である。 第2の実施の形態における構造化文書管理装置の処理対象となるXHTML形式の第1の構造化文書データの例を示した図である。 第1の構造化文書データを分解した木構造の概念を示した説明図である。 第2の実施の形態における構造化文書管理装置の処理対象となるXHTML形式の第2の構造化文書データの例を示した図である。 第2の構造化文書データを分解した木構造の概念を示した説明図である。 第2の実施の形態における構造化文書管理装置のフィルタ格納部に格納されたフィルタデータのデータ構造の例を示した図である。 図12に示した第1の構造化文書データの木構造に対して、図15に示したフィルタデータの全てのルールを適用した後の部分木の概念を示した図である。 図14に示した第2の構造化文書データの木構造に対して、図15に示したフィルタデータの全てのルールを適用した後の部分木の概念を示した図である。 構造化文書管理装置のハードウェア構成を示す図である。
符号の説明
100 構造化文書管理装置
101 入出力処理部
102 検索処理部
103 フィルタ部
104 検索索引生成部
105 データ格納処理部
106 データ削除処理部
107 構造テンプレート格納部
108 索引格納部
109 構造化文書データ格納部
111 処理要求受付部
112 要求処理部
113 フィルタ決定部
114 結果処理部
115 フィルタ格納部
121 構造パス式処理部
122 部分木処理部
123 取得部
124 指定取得部
125 要素判定部
126 指定部
127 確認部
131 語彙索引格納部
132 数値索引格納部
141 語彙索引生成部
142 数値索引生成部
801〜805、901〜904、1601、1602、1701〜1703 データ要素
1201、1401〜1403 要素“a”
1801 CPU
1802 ROM
1803 RAM
1804 通信I/F
1805 表示部

Claims (15)

  1. 階層化された論理構造を用いて要素を保持する構造化文書に対して要素を特定する構造パス式と、該構造パス式により特定された要素に対して指定/指定解除を定義する指定情報とが対応付けられた要素指定対応情報を格納する格納部と、
    前記要素指定対応情報の前記構造パス式に基づいて、前記構造化文書から前記構造パス式に合致する要素を取得する取得部と、
    前記要素の取得に用いた前記構造パス式と対応付けられていた前記指定情報を前記要素指定対応情報から取得する指定取得部と、
    取得した前記指定情報から、前記要素を指定するか指定解除するかを判定する要素判定部と、
    判定された要素に対して、判定に従って指定又は指定解除を行う指定部と、
    を備えることを特徴とする構造化文書の要素指定装置。
  2. 前記記憶部は、前記要素指定対応情報にて、前記構造パス式毎に順位付けがなされており、
    前記順位に従い、当該順位の前記構造パス式を用いて前記取得部と、前記指定取得部と、前記要素判定部と、前記指定部との処理を繰り返すこと、
    を特徴とする請求項1に記載の構造化文書の要素指定装置。
  3. 前記指定部は、指定が行われた前記要素に対して、要素を識別する識別情報を付加することを特徴とする請求項1又は2に記載の構造化文書の要素指定装置。
  4. 前記指定部は、指定が行われた前記要素に対して、前記構造化文書における前記要素の位置を示すパス情報を、前記識別情報として付加することを特徴とする請求項3に記載の構造化文書の要素指定装置。
  5. 前記識別情報が付加された前記要素に格納された実体情報と、前記識別情報とを対応付けた検索索引を生成する検索索引生成部を、さらに備えたことを特徴とする請求項3又は4に記載の構造化文書の要素指定装置。
  6. 生成された前記検索索引を使用して、前記構造化文書に格納された要素を検索する検索処理部を、さらに備えたことを特徴とする請求項5に記載の構造化文書の要素指定装置。
  7. 前記記憶部は、前記要素指定対応情報において、前記要素の実体情報に対する種別を設定する索引種別情報を、さらに対応付けて記憶し、
    前記指定部は、指定すると判定された前記要素に対して、当該要素を特定するために使用された前記構造パス式と対応付けられた索引種別情報をさらに指定すること、
    を特徴とする請求項1乃至6のいずれか一つに記載の構造化文書の要素指定装置。
  8. 前記要素の実体情報に対して、設定された索引種別情報が適切であるか否か確認する確認部を、さらに備えたことを特徴とする請求項7に記載の構造化文書の要素指定装置。
  9. 前記要素毎に設定された索引種別情報毎に、前記要素に格納された実体情報を検索するための検索索引を生成する検索索引生成部を、さらに備えたことを特量とする請求項7又は8に記載の構造化文書の要素指定装置。
  10. 前記要素指定対応情報の入力を受け付ける受付部をさらに備え、
    前記受付部は、入力を受け付けた前記要素指定対応情報を、前記格納部に出力すること、
    を特徴とする請求項1乃至9のいずれか一つに記載の構造化文書の要素指定装置。
  11. 前記取得部は、前記要素指定対応情報の前記構造パス式に基づいて、前記構造化文書から、前記構造パス式と一致する一つ又は複数の要素からなる構造化情報を取得し、
    前記要素判定部は、取得した前記指定情報から、前記構造化情報を指定するか指定解除するか判定し、
    前記指定部は、前回指定又は指定解除が行われた結果取得した中間構造化情報に対して、判定された前記構造化情報の結合又は削除を行い、この結果取得した前記構造化情報に含まれる各要素に対して指定が行われたと処理すること、
    を特徴とする請求項1乃至10のいずれか一つに記載の構造化文書の要素指定装置。
  12. 前記格納部は、前記要素指定対応情報において、前記構造パス式を相対パスで記述可能であること、
    を特徴とする請求項1乃至11のいずれか一つに記載の構造化文書の要素指定装置。
  13. 要素指定の対象となった構造化文書データを格納する構造化文書格納部と、
    指定された要素を含む構造化文書データを、前記構造化文書格納部に格納する処理を行う格納処理部と、をさらに備えることを特徴とする請求項1乃至12のいずれか一つに記載の構造化文書の要素指定装置。
  14. 階層化された論理構造を用いて要素を保持する構造化文書に対して要素を特定する構造パス式と、該構造パス式により特定された要素に対して指定/指定解除を定義する指定情報とが対応付けられた要素指定対応情報を取得する対応情報取得ステップと、
    取得した前記要素指定対応情報の前記構造パス式に基づいて、前記構造化文書から前記構造パス式に合致する要素を取得する取得ステップと、
    前記要素の取得に用いた前記構造パス式と対応付けられていた前記指定情報を前記要素指定対応情報から取得する指定取得ステップと、
    取得した前記指定情報から、前記要素を指定するか指定解除するかを判定する要素判定ステップと、
    判定された要素に対して、判定に従って指定又は指定解除を行う指定ステップと、
    を有することを特徴とする構造化文書の要素指定方法。
  15. 構造化文書に含まれる要素を指定する要素指定プログラムであって、
    階層化された論理構造を用いて要素を保持する構造化文書に対して要素を特定する構造パス式と、該構造パス式により特定された要素に対して指定/指定解除を定義する指定情報とが対応付けられた要素指定対応情報を取得する対応情報取得ステップと、
    取得した前記要素指定対応情報の前記構造パス式に基づいて、前記構造化文書から前記構造パス式に合致する要素を取得する取得ステップと、
    前記要素の取得に用いた前記構造パス式と対応付けられていた前記指定情報を前記要素指定対応情報から取得する指定取得ステップと、
    取得した前記指定情報から、前記要素を指定するか指定解除するかを判定する要素判定ステップと、
    判定された要素に対して、判定に従って指定又は指定解除を行う指定ステップと、
    をコンピュータに実行させる構造化文書の要素指定プログラム。
JP2006265025A 2006-09-28 2006-09-28 構造化文書の要素指定装置、要素指定方法及び要素指定プログラム Pending JP2008084128A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006265025A JP2008084128A (ja) 2006-09-28 2006-09-28 構造化文書の要素指定装置、要素指定方法及び要素指定プログラム
US11/896,207 US20080091695A1 (en) 2006-09-28 2007-08-30 Apparatus, method and computer program product for assigning element of structured-text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006265025A JP2008084128A (ja) 2006-09-28 2006-09-28 構造化文書の要素指定装置、要素指定方法及び要素指定プログラム

Publications (1)

Publication Number Publication Date
JP2008084128A true JP2008084128A (ja) 2008-04-10

Family

ID=39304249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006265025A Pending JP2008084128A (ja) 2006-09-28 2006-09-28 構造化文書の要素指定装置、要素指定方法及び要素指定プログラム

Country Status (2)

Country Link
US (1) US20080091695A1 (ja)
JP (1) JP2008084128A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9218418B2 (en) 2009-06-15 2015-12-22 Nec Corporation Search expression generation system

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8478764B2 (en) * 2007-11-09 2013-07-02 Vantrix Corporation Method and apparatus for concurrent filtering of multiple components of streaming data
US8019709B2 (en) * 2007-11-09 2011-09-13 Vantrix Corporation Method and system for rule-based content filtering

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9218418B2 (en) 2009-06-15 2015-12-22 Nec Corporation Search expression generation system

Also Published As

Publication number Publication date
US20080091695A1 (en) 2008-04-17

Similar Documents

Publication Publication Date Title
US6931590B2 (en) Method and system for managing documents
US7143344B2 (en) Transformation stylesheet editor
JP4141556B2 (ja) 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体
US7197510B2 (en) Method, system and program for generating structure pattern candidates
US10657323B2 (en) Method of preparing documents in markup languages
Fawcett et al. Beginning XML
US7664773B2 (en) Structured data storage method, structured data storage apparatus, and retrieval method
US20030101416A1 (en) Creating XML documents
US20040153968A1 (en) Method and system for user customizable asset metadata generation in a web-based asset management system
CN101271390A (zh) 修改xml数据结构的软件、系统和方法
US8595215B2 (en) Apparatus, method, and computer program product for processing query
US20130124969A1 (en) Xml editor within a wysiwyg application
JP2005190163A (ja) 構造化データ検索方法、構造化データ検索装置およびプログラム
JP5063877B2 (ja) 情報処理装置およびコンピュータプログラム
US20210004526A1 (en) Document Viewer Aligning PDF and XML
JP2008084128A (ja) 構造化文書の要素指定装置、要素指定方法及び要素指定プログラム
JP2006127229A (ja) 構造化文書検索システム、構造化文書検索方法及びプログラム
US10073821B2 (en) Representation of multiple markup language files that differ in structure and content in one file for the production of new markup language files
JP2006127235A (ja) 構造化文書管理システム、構造化文書管理方法及びプログラム
JP5712496B2 (ja) アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置
US11036729B2 (en) Document creation support system
JP2013218627A (ja) 構造化文書からの情報抽出方法、装置、及びプログラム
JP6753190B2 (ja) 文書検索装置及びプログラム
JP6647954B2 (ja) 設計書の入出力装置、設計書の入出力システム及び設計書の入出力方法
Eito-Brun XML-based Content Management: Integration, Methodologies and Tools

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080527

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080728

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081007