JP4145144B2 - 構造化文書をいくつかの部分に分割する方法 - Google Patents

構造化文書をいくつかの部分に分割する方法 Download PDF

Info

Publication number
JP4145144B2
JP4145144B2 JP2002551735A JP2002551735A JP4145144B2 JP 4145144 B2 JP4145144 B2 JP 4145144B2 JP 2002551735 A JP2002551735 A JP 2002551735A JP 2002551735 A JP2002551735 A JP 2002551735A JP 4145144 B2 JP4145144 B2 JP 4145144B2
Authority
JP
Japan
Prior art keywords
information
document
sub
structured
main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002551735A
Other languages
English (en)
Other versions
JP2004524606A (ja
Inventor
クロード セーラ
セドリ チィエノ
Original Assignee
エクスプウェイ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エクスプウェイ filed Critical エクスプウェイ
Publication of JP2004524606A publication Critical patent/JP2004524606A/ja
Application granted granted Critical
Publication of JP4145144B2 publication Critical patent/JP4145144B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は、構造化文書をいくつかの部分に分割することを可能にする方法に関する。
本発明は、これらに限定しないが、特に、構造化されたマルチメディア文書、デジタルまたはビデオ画像または画像シーケンス、映画またはビデオ番組の処理、送信、記憶、および読み取りに適用され、より一般的には、データ送信ネットワークで相互接続された処理装置間、または処理装置と記憶装置間、あるいは文書がビデオ番組である場合には処理装置とテレビジョンなどの再生装置間における上記文書の転送に適用される。
このような方法で処理され、送信される文書は、ある構造に統合された複数の異なるタイプのデータを含むことがますます多くなっている。構造化文書とは、それぞれがタイプと属性に関連付けられ、主として階層的な関係で相互接続された一結びのデータセットである。そのような文書には、特に文書を構成する各種の情報サブセットを区別するのに役立つ、Standard Generalized Markup Language(SGML)、Hypertext Markup Language(HTML)、あるいはExtensible Markup Language(XML)などのマークアップ言語を使用する。これに対して、「線形」文書では、文書の内容情報は、レイアウト情報およびタイプ情報と混在している。
構造化文書は、文書中の異なる情報セットを区別するマーカを含む。SGML、XML、あるいはHTMLフォーマットではこのマーカは「タグ」と呼ばれ、「<XXXX>」と「</XXXX>」の形態を有し、最初のマーカは「XXXX」と呼ばれる情報のセットの開始を示し、2番目のマーカはそのセットの終わりを示す。情報のセットは、それ自体が複数のより低レベルの情報セットで構成することができる。したがって、構造化文書は、ツリー型または階層的な構造スキーマを呈し、各ノードは、情報のセットを表し、より低レベルの情報セット群を包含する情報セットを表すより高い階層レベルのノードに接続される。そのようなツリー構造で分岐の終端に位置するノードは、所定タイプのデータを含む情報セットを表し、その情報セット自体は、情報のサブセットに分解するのに適さない。
このように、構造化文書は、テキストまたはバイナリのデータ形態で表された区分マーカを含み、このマーカは、そのマーカによって定義される他の情報サブセットをそれ自体が含むことのできる情報のセットまたはサブセットを定義する。
構造化文書は、文書中の各情報セット中の情報のタイプとともに規則の形で構造を定義する構造スキーマに関連付けられる。スキーマは、入れ子になった情報セット構造のグループによって構成され、それらのグループは恐らくは順序付けされたシーケンス、代替要素からなるグループ、あるいは順序付けられた、または順序付けられていない必須要素のグループである。
現在、構造化文書を送信する際には、初めに文書を圧縮して送信データの容量を最小にする。そのような圧縮処理で最良の効率を得られるように、文書の受信者があらかじめ文書の構造スキーマを知っており、その構造スキーマを使用してどの情報セットを受け取るのかを常に決定できることを前提として、文書を構成するデータも圧縮する。したがって、送信される文書の構造は、その文書の受信者が文書の受信と復号に使用しようとする構造スキーマと正確に一致することが必須となる。というのは、そうでない場合には、受信者が送信されたデータのタイプを判定できず、したがってデータを復号し、元の文書を再構築することができないからである。
不都合なことに、送信向けの構造化文書は容量が増大する傾向にある。例えば、上記のような方法で映画やテレビ番組の完全な記述を送信またはブロードキャストする提案がなされている。
この状況では、文書の送信中に送信エラーが発生した場合、文書の受信側はもはやどのサブセットが送信されているのか判定できなくなり、この場合には文書全体を再送することが必要となる。さらに、映画シーケンスを送信し、それを同時に画面に表示することが求められる場合は、シーケンスの各種の要素を送信する継続時間を遵守することが必要となる可能性がある。シーケンスの送信の開始時に接続されていなかった受信者がシーケンスの最後を受信し、表示することができるように、シーケンスのある要素は、数回送信することができなくてはならない。
また、文書の一部を別の部分に置き換え、それら2つの部分が同じ構造スキーマを有することも必要となる場合がある。
文書全体を再送する解決法では、送信する必要がある情報の容量が著しく増大することになる。したがって、文書を別々に送信される複数の部分に分割できることが望ましい。この送信法は、文書の一部だけを送信するには適さないことになる。
本発明の目的は、上記の欠点を克服することである。この目的は、構造スキーマによって定義される階層構造を呈する構造化文書を分割する方法を提供することによって達成され、文書は、情報サブセットを含む主要な情報セットを組み合わせ、情報サブセットの少なくとも一部はより低い階層レベルの情報サブセットを含むことができ、各情報サブセットは個々の情報タイプに関連付けられる。
本発明によれば、この方法は、
文書を、個々に処理することが可能な部分、すなわち主要部分および少なくとも1つの副次部分に分割するステップであって、主要部分は少なくとも主要な情報セットを含み、副次部分は主要な情報セットから削除された情報サブセットを含み、各副次部分は主要部分または別の副次部分に結合されるステップと、
より高いレベルの情報セットから削除された各情報サブセットの情報タイプに所定の値を割り当てるステップと
を含む。
このように、各部分をそれ自体で理解することができ、選択された区分方法に関係なく復号することができる。また、そのような一部分を送信し、送信が失敗した場合、文書の残りの部分はなお有効であり、正確に送信されなかった部分だけを再送すればよく、文書全体を再送する必要はない。さらに、各部分がそれ自体で有効であり解釈することができるので、ある部分を復号できるようにするために主要部分と副次部分をその部分よりアップストリームにする必要もない。これらの性質により、送信される文書を時間の進行とともに豊かにし、修正することができる。
有利には、文書は、各部分に挿入されるヘッダを含み、このヘッダは、その文書が完全か否かをその値で指示するフラグを含む。
本発明の特徴によれば、各部分は、文書の階層構造におけるその部分の位置を示す情報を含むヘッダを有する。
文書の階層構造における副次部分の位置に関するこの情報は、その構造中のパスを有利に記述し、文書における副次部分の位置を定義する。
このパスは、文書の主要な情報セットに対して絶対的な形で定義することができる。このパスはまた、最も最近に送信された副次部分の位置に対して相対的に定義することもできる。
あるいは、所定の値に割り当てられた各情報タイプの後に、その情報タイプに関連付けられた情報のサブセットを含む副次部分への参照を続け、文書の階層構造中の副次部分の位置に関するこの情報は、その副次部分の参照となる。
この方法は、構造中の同じ位置に関連付けられた複数の文書部分を送信することも含むことができる。そのような状況では、最も最近送信された部分が、それと同じ位置に関連付けられた1つ前の部分に置き換わる。
各部分のヘッダが、構造中の同じ位置に関連付けられたある部分との関係で各部分を処理する方法を指定する情報を含むための提供もなすことができる。
この構造化文書は、例えばSGML、XML、またはHTMLタイプである。
以下で、本発明の好ましい実施形態について、添付図面を参照し、非限定的な例として説明する。
図1に、3つの低レベルノードに区分されたルートノード1を含むツリー構造を示し、第1のノード1.1はより低いレベルのノードに区分されておらず、第2のノード1.2は2つのノード1.2.1および1.2.2を備え、第3のノード1.3は単一のノード1.3.1を備える。第2のノード1.2の2つのノード1.2.1および1.2.2は、それぞれ、より低いレベルの2つのノード1.2.1.1および1.2.2.1と、1つのノード1.2.2.2に結合されている。
この構造は構造化文書Dを表し、構造化文書Dは、この文書の符号化および表示フォーマットを定義するある数のパラメータが定義されたヘッダHと、文書を構成する情報および情報セットを含む本体Bとからなる。
本発明によれば、構造化文書は、複数の別個の部分P1、P2、P3、すなわち主要部分P1と、主要部に結合される副次部分P2およびP3(図2)として送信することができる。この送信は、個別に送信する各部分を適切な方法で圧縮してから行うことが好ましい。文書の各部分は、圧縮されていてもいなくとも、ヘッダH、H2、H3と本体B1、B2、B3からなる。
図3に示すように、文書の本体Bは、データヘッダDHと、それぞれが文書の情報サブセットの情報を含む1つまたは複数のデータ本体DBからなる。データヘッダDHは、詳細には続くデータセットを定義することができる数を示すことにより文書の復号時にあいまい性を解消することを可能にするフィールドK、および/またはデータ本体DBの発生回数Nを含むフィールドを有することができる。
使用するフォーマットに応じて、各データ本体DBは、そのデータ本体が含む情報のタイプを指定するフィールドT、情報の長さをビット数またはバイト数として示すフィールドL、情報サブセットの属性を含むフィールドA、および情報サブセットの値または内容を含むフィールドValを備えることができる。
文書はツリー構造の形で構造化されるので、フィールドValはそれ自体で、データヘッダフィールドDHと、データ本体DBを含む1つまたは複数のフィールドを含むことができる。
これに関して、図1に示す構造スキーマから、この文書に含まれる情報は、分岐の終端に位置するノード1.1、1.2.1.1、1.2.2.1、1.2.2.2、および1.3.1と、この文書のすべてのノードによって表されるサブセットの属性フィールドAとに保持されることが見て取れる。
本発明によれば、このような文書の一部分を送信することが求められる場合に、その部分がすでに圧縮されているかどうかに関係なく、送信されていないか、または文書から削除されたデータ本体DB中の情報のタイプを含むフィールドTは、その後に続く情報サブセットが送信されないことを示す所定の値を受け取る。情報タイプについてのこの所定の特定の値は、例えば、文書が圧縮形態であるときにはゼロに等しくなるように選択され、他のタイプの情報は非ゼロの値を有する。
送信された文書にこの所定の値が現れる場合、通常はこの情報タイプに続く長さフィールドLとフィールドAおよびValは送信データ中に現れない。この結果、この所定の値に等しい情報タイプの後に、文書中の次のデータセットのヘッダDHか、または文書の終わりを示すフラグが続く。
受信する文書が完全に送信されるのか、または一部が送信されるのかを文書の受信者に通知するために、文書が完全に送信されるか否かを指定するパラメータを文書ヘッダHに追加する提供を行うことができる。
部分P1、P2、およびP3は、1回または複数回個別に送信することができる。このために各部分はヘッダH、H2、H3を有し、このヘッダは、最初に文書が完全でないことを示すパラメータを含み、その後に完全な文書のツリー構造における送信部分の位置の定義が続く。
このようにして、時間の経過とともに構造化文書を豊かにし、変更することができる。
副次部分のヘッダに現れる位置の定義により、送信される副次部分を受信する処理装置は、文書の構造中における各受信部分の位置を判定し、したがってそれを復号することができるので、主要部分P1は送信する必要がないことに留意されたい。また、文書は、主要部分がペイロードデータを含まないような方法で区分することができ、副次部分と文書構造中におけるそれら副次部分の位置から文書全体を再構成することができる。
また、部分P1、P2、P3のヘッダH、H2、H3は、構造中で同じ位置に関連付けられたすでに送信済みの部分に対するその部分の処理モードを指定する情報を含むことができ、例えば、送信部分が、同じ位置に関連付けられたすでに送信された部分に置き換わる、あるいは受信した文書にその部分がすでに現れている場合にはその部分を考慮すべきでない、あるいは、同じ位置に関連付けられたすでに送信された部分とその部分を併合するかどうかなどを指定する。
図4に示すように、この位置の定義は、ルートノードRまで遡るより高いノードすべての名前を含むことができ、これらのノードは恐らくはより高いノードに対する順序番号に関連付けられる。例えば、ルートノードに結合された第1ノードの第3ノードの第1ノードの第1ノード(図4ではルートノードRからの矢印の連続で識別する)は、次のように参照することができる。
c/a[last]/b(1)/d
この表記は、タイプ「d」のノードがタイプ「b」の第1ノードに接続され、そのノードがタイプ「a」の最後のノードに接続され、そのノードが、直接ルートノードRに接続されたタイプ「c」のノードに接続されることを意味する。
そして文書のこの他の部分は、上述の(ルートノードRに対する)絶対的な定義法を使用するか、または有利には相対的な定義法を使用して送信することができる。したがって、例えば、1つ前のノードのすぐ上の同じノードに接続された第3のノードは、次のように参照することができる。
../e[2]
この表記は、表記「../」によって参照される1つ高いレベルの同じノードに接続された、タイプ「e」であるはずの第2のノードを参照していることを表す。この第2の方法は、第1の方法よりも簡潔であることが理解されよう。
あるいは、文書の送信部分P2、P3の位置は、単にその文書部分への参照によって定義してもよく、この参照は、すでに文書のP1の主要部分の中で、例えば続く情報サブセットが送信されないことを指定する所定の値に続いて送信されている。
送信する文書、または文書の部分P1、P2、P3は、あらかじめ圧縮することが好ましい。このために、特定の文書部分は内容情報を含む必要がないものとして、各文書部分で構造情報と内容情報を区別すると好都合である。したがって、図2および図3の例では、構造情報は、値フィールドを構造化しない場合、すなわち値フィールドを構造化された情報のサブセットに区分することができない場合には、値フィールドValを除くすべてのフィールドによって構成される。図2の例では、区分できないフィールドは、文書ツリー構造の分岐の下端に位置する情報サブセット1.1、1.2.1.1、1.2.2.1、1.2.2.2、および1.3.1のフィールドValである。
圧縮処理自体は、圧縮する文書部分を順次読み取ること、構造情報を処理するために適切な圧縮アルゴリズムを適用すること、および文書部分を読み取っている際に区分不可能なフィールドValが現れたときに、その情報タイプに合わせて適合された圧縮アルゴリズムを適用することからなる。圧縮された文書または文書部分では、構造情報と内容情報は、元の圧縮されていない文書と同じ順序で現れることに留意されたい。
Zipなどの統計的な圧縮アルゴリズムを適用することも可能である。
ツリー構造の図であり、各ノードは、通常は単一のエンティティとして送信される構造化文書中の情報のセットまたはサブセットを表す。 本発明によって各部分を個別に送信することが可能な複数の部分に区分された図1の構造化文書の図である。 構造化文書に含まれる情報の構造をより詳細に示す図である。 構造の一部分の位置を定義する方法を説明する別のツリー構造の図であり、この部分は構造の残りの部分とは別個に送信される。

Claims (21)

  1. 構造スキーマによって定義される階層構造を有する少なくとも1つのXMLフォーマットの構造化文書を処理する方法であって、
    前記構造化文書は、情報サブセットを含む構造化された主要な情報セットを含み、前記情報サブセットの少なくとも1つは構造化されてより低い階層レベルの情報サブセットを含み、前記各情報サブセットはより高レベルの情報セット中で個々の情報タイプに関連付けられ、前記各情報タイプに対応する構造は、前記構造スキーマによって定義されるものであり、
    前記処理方法は、
    前記構造化文書を、個々に処理することが可能な構造化された部分、即ち、主要部分および少なくとも1つの副次部分に分割するステップであって、前記主要部分は少なくとも主要な情報セットを含み、前記副次部分は前記主要な情報セットから削除された情報サブセットを含んでいて、前記各副次部分が前記主要部分又は別の副次部分に結合される分割ステップと、
    少なくとも1つの情報サブセットが削除された各情報セット中で、前記削除された各情報サブセットの情報タイプに所定の値を割り当てる割当ステップと、
    少なくとも1つの副次部分からなる送信データを連続的に送信するステップであって、時間の経過とともに少なくとも1つの副次部分を変更する少なくとも1つの変更ステップを含み、前記変更ステップは、予めセットされた時間に対応する間、予め定義された少なくとも1つの規則に従って構造中の同じ位置に関連付けられた複数の副次部分を送信するステップである送信ステップと、
    を含むことを特徴とする方法。
  2. 前記変更ステップの間、最も最近送信された副次部分が、前記構造中の同じ位置に関連付けられた、以前に送信された副次部分に置き換わる請求項1に記載の方法。
  3. 受信者が前記送信データを受信するステップと、前記受信者が少なくともいくつかの受信した副次部分を読み取るステップとを更に含み、
    前記読み取りステップは、時間の経過とともに、少なくとも1つの予め定義された規則に従って構造中の同じ位置に関連付けられた複数の副次部分を更新する少なくとも1つの更新ステップを含む請求項1に記載の方法。
  4. 前記更新ステップの間、最も最近受信された副次部分が、前記構造中の同じ位置に関連付けられた、以前に送信された副次部分に置き換わる請求項3に記載の方法。
  5. 前記構造化文書は、削除された各文書部分に挿入されるヘッダを含み、前記ヘッダは、その文書が完全であるか否かをその値が指定するフラグを含む請求項1に記載の方法。
  6. 前記構造化文書から削除された各部分は、それの文書の階層構造における位置を指定する情報を含むヘッダを有する請求項1に記載の方法。
  7. 前記構造化文書の階層構造における前記副次部分の位置に関する情報は、前記文書中における副次部分の位置を定義する前記構造中のパスを指定する請求項6に記載の方法。
  8. 前記パスは、前記文書の主要な情報セットに対して絶対的な方法で定義される請求項7に記載の方法。
  9. 主要な文書から削除された各副次部分は、前記文書の主要部分とは別個に送信され、前記パスは、最も最近送信された副次部分の位置に関連して相対的な方法で定義される請求項7に記載の方法。
  10. 前記情報セット中に現れる、所定の値に割り当てられた各情報タイプの後に、前記情報セットから削除された情報サブセットを含む副次部分への参照が続き、文書の階層構造中における副次部分の位置に関する前記情報は、前記副次部分の参照である請求項6に記載の方法。
  11. 送信された各副次部分のヘッダは、前記副次部分に適用される処理モードを、前記構造中の同じ位置に関連付けられた既に送信された副次部分との関係で指定する情報を含む請求項1に記載の方法。
  12. 前記送信データは主要部分を含み、前記送信ステップは、時間の経過とともに主要部分を変更する少なくとも1つの変更ステップを含み、前記変更ステップは、予めセットされた時間に対応する間、予め定義された少なくとも1つの規則に従って前記構造中の同じ位置に関連付けられた複数の主要部分を送信することからなる請求項1に記載の方法。
  13. 前記主要部分および前記主要部分から削除された副次部分は、圧縮され、次いで別個に送信される請求項12に記載の方法。
  14. 前記文書は電話通信網によって受信者に送信され、前記受信者は予め前記文書の構造スキーマを知っている請求項1に記載の方法。
  15. 前記文書は、主要部分がペイロードデータを含まないような方法で区分され、副次部分と文書構造中におけるそれら副次部分の位置から文書全体を再構築する請求項1に記載の方法。
  16. 構造スキーマによって定義される階層構造を有する少なくとも1つのXMLフォーマットの構造化文書を処理する方法であって、
    前記構造化文書は、情報サブセットを含む構造化された主要な情報セットを含み、前記情報サブセットの少なくとも1つは構造化されてより低い階層レベルの情報サブセットを含み、前記各情報サブセットはより高レベルの情報セット中で個々の情報タイプに関連付けられ、前記各情報タイプに対応する構造は、前記構造スキーマによって定義され、また、前記構造化文書は、個々に処理することが可能な構造化された部分、即ち、主要部分および少なくとも1つの副次部分に分割され、前記主要部分は少なくとも主要な情報セットを含み、前記副次部分は前記主要な情報セットから削除された情報サブセットを含んでいて、前記各副次部分が前記主要部分又は別の副次部分に結合され、また、前記構造化文書は、少なくとも1つの情報サブセットが削除された各情報セットを含んでいて、各削除された情報サブセットの、所定の割り当てられた値を有する情報タイプを含み、
    前記処理方法は、受信者が少なくとも1つの副次部分から成る前記送信データを受信するステップと、前記受信者が少なくともいくつかの受信した副次部分を読み取るステップとを含み、
    前記読み取りステップは、時間の経過とともに、少なくとも1つの予め定義された規則に従って構造中の同じ位置に関連付けられた複数の副次部分を更新する少なくとも1つの更新ステップを含むことを特徴とする方法。
  17. 前記更新ステップの間、最も最近受信された副次部分が、構造中の同じ位置に関連付けられた、以前に送信された副次部分に置き換わる請求項16に記載の方法。
  18. 前記読み取られた副次部分のヘッダは、前記構造中の同じ位置に関連付けられた既に受信された前記副次部分との関係で、前記副次部分に適用する処理モードを指定する情報を含む請求項16に記載の方法。
  19. 前記構造化文書の構造スキーマは受信者に知られている請求項16に記載の方法。
  20. 前記構造化文書は、主要部分がペイロードデータを含まないような方法で区分され、副次部分と文書構造中におけるそれら副次部分の位置から文書全体を再構築する請求項16に記載の方法。
  21. 前記送信データが主要部分を含み、前記読み取りステップは、時間の経過とともに、少なくとも1つの予め定義された規則に従って構造中の同じ位置に関連付けられた複数の主要部分を更新する少なくとも1つの更新ステップを含む請求項16に記載の方法。
JP2002551735A 2000-12-18 2001-12-14 構造化文書をいくつかの部分に分割する方法 Expired - Fee Related JP4145144B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0016507A FR2818409B1 (fr) 2000-12-18 2000-12-18 Procede pour diviser des documents structures en plusieurs parties
PCT/FR2001/004008 WO2002050708A1 (fr) 2000-12-18 2001-12-14 Procede pour diviser des documents structures en plusieurs parties

Publications (2)

Publication Number Publication Date
JP2004524606A JP2004524606A (ja) 2004-08-12
JP4145144B2 true JP4145144B2 (ja) 2008-09-03

Family

ID=8857802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002551735A Expired - Fee Related JP4145144B2 (ja) 2000-12-18 2001-12-14 構造化文書をいくつかの部分に分割する方法

Country Status (6)

Country Link
US (2) US7275060B2 (ja)
EP (1) EP1344151A1 (ja)
JP (1) JP4145144B2 (ja)
AU (1) AU2002219311A1 (ja)
FR (1) FR2818409B1 (ja)
WO (1) WO2002050708A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3944014B2 (ja) * 2002-07-09 2007-07-11 株式会社東芝 文書編集方法、文書編集システム及び文書処理プログラム
US7838430B2 (en) * 2003-10-28 2010-11-23 Applied Materials, Inc. Plasma control using dual cathode frequency mixing
US7464330B2 (en) * 2003-12-09 2008-12-09 Microsoft Corporation Context-free document portions with alternate formats
US8661332B2 (en) * 2004-04-30 2014-02-25 Microsoft Corporation Method and apparatus for document processing
US7418652B2 (en) * 2004-04-30 2008-08-26 Microsoft Corporation Method and apparatus for interleaving parts of a document
US7549118B2 (en) * 2004-04-30 2009-06-16 Microsoft Corporation Methods and systems for defining documents with selectable and/or sequenceable parts
US7383500B2 (en) 2004-04-30 2008-06-03 Microsoft Corporation Methods and systems for building packages that contain pre-paginated documents
US7359902B2 (en) * 2004-04-30 2008-04-15 Microsoft Corporation Method and apparatus for maintaining relationships between parts in a package
US8363232B2 (en) * 2004-05-03 2013-01-29 Microsoft Corporation Strategies for simultaneous peripheral operations on-line using hierarchically structured job information
US7580948B2 (en) * 2004-05-03 2009-08-25 Microsoft Corporation Spooling strategies using structured job information
US7519899B2 (en) 2004-05-03 2009-04-14 Microsoft Corporation Planar mapping of graphical elements
US8243317B2 (en) * 2004-05-03 2012-08-14 Microsoft Corporation Hierarchical arrangement for spooling job data
US7755786B2 (en) 2004-05-03 2010-07-13 Microsoft Corporation Systems and methods for support of various processing capabilities
US7617450B2 (en) 2004-09-30 2009-11-10 Microsoft Corporation Method, system, and computer-readable medium for creating, inserting, and reusing document parts in an electronic document
US7584111B2 (en) * 2004-11-19 2009-09-01 Microsoft Corporation Time polynomial Arrow-Debreu market equilibrium
US7617451B2 (en) * 2004-12-20 2009-11-10 Microsoft Corporation Structuring data for word processing documents
US20060136816A1 (en) * 2004-12-20 2006-06-22 Microsoft Corporation File formats, methods, and computer program products for representing documents
US7617229B2 (en) * 2004-12-20 2009-11-10 Microsoft Corporation Management and use of data in a computer-generated document
US7770180B2 (en) * 2004-12-21 2010-08-03 Microsoft Corporation Exposing embedded data in a computer-generated document
US7752632B2 (en) * 2004-12-21 2010-07-06 Microsoft Corporation Method and system for exposing nested data in a computer-generated document in a transparent manner
US8111694B2 (en) 2005-03-23 2012-02-07 Nokia Corporation Implicit signaling for split-toi for service guide
US20060277452A1 (en) * 2005-06-03 2006-12-07 Microsoft Corporation Structuring data for presentation documents
US20070022128A1 (en) * 2005-06-03 2007-01-25 Microsoft Corporation Structuring data for spreadsheet documents
US8176414B1 (en) * 2005-09-30 2012-05-08 Google Inc. Document division method and system
WO2007038844A1 (en) * 2005-10-06 2007-04-12 Smart Internet Technology Crc Pty Ltd Methods and systems for facilitating access to a schema
JP5570202B2 (ja) * 2009-12-16 2014-08-13 キヤノン株式会社 構造化文書解析装置、構造化文書解析方法、及びコンピュータプログラム
JP5480034B2 (ja) 2010-06-24 2014-04-23 インターナショナル・ビジネス・マシーンズ・コーポレーション 構造化文書の木構造を分割するための方法、プログラムおよびシステム

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5142689A (en) * 1982-09-27 1992-08-25 Siemens Nixdort Informationssysteme Ag Process for the preparation of the connection of one of several data processor devices to a centrally synchronized multiple line system
JPH08255155A (ja) * 1995-03-16 1996-10-01 Fuji Xerox Co Ltd 全文登録語検索装置および方法
JP3724847B2 (ja) * 1995-06-05 2005-12-07 株式会社日立製作所 構造化文書差分抽出方法および装置
WO1997034240A1 (en) * 1996-03-15 1997-09-18 University Of Massachusetts Compact tree for storage and retrieval of structured hypermedia documents
US6061697A (en) * 1996-09-11 2000-05-09 Fujitsu Limited SGML type document managing apparatus and managing method
JPH10143403A (ja) * 1996-11-12 1998-05-29 Fujitsu Ltd 情報管理装置および情報管理プログラム記憶媒体
EP0956673A4 (en) * 1996-12-20 2005-04-06 Financial Services Technology METHOD AND SYSTEM FOR PROCESSING ELECTRONIC DOCUMENTS
JPH1185750A (ja) * 1997-07-08 1999-03-30 Hitachi Ltd 構造化文書処理方法および装置および構造化文書処理プログラムを記録したコンピュータ読み取り可能な記録媒体
US6119123A (en) * 1997-12-02 2000-09-12 U.S. Philips Corporation Apparatus and method for optimizing keyframe and blob retrieval and storage
EP0928070A3 (en) * 1997-12-29 2000-11-08 Phone.Com Inc. Compression of documents with markup language that preserves syntactical structure
JP4404480B2 (ja) * 1998-01-07 2010-01-27 マイクロソフト コーポレーション 低ビット・レート伝送チャネルを通じてデータ・コンテンツを配信するシステム。
JP3657424B2 (ja) * 1998-03-20 2005-06-08 松下電器産業株式会社 番組情報を放送するセンター装置と端末装置
US6304578B1 (en) * 1998-05-01 2001-10-16 Lucent Technologies Inc. Packet routing and queuing at the headend of shared data channel
JP2000083059A (ja) * 1998-07-06 2000-03-21 Jisedai Joho Hoso System Kenkyusho:Kk インデックス情報配信方法,インデックス情報配信装置,検索装置およびそれらの装置の各手段としてコンピュ―タを機能させるためのプログラムを記録したコンピュ―タ読み取り可能な記録媒体
JP3460597B2 (ja) * 1998-09-22 2003-10-27 日本電気株式会社 複合文書管理システム及び複合文書の構造管理方法ならびに複合文書構造管理プログラムを格納した記録媒体
JP4003854B2 (ja) * 1998-09-28 2007-11-07 富士通株式会社 データ圧縮装置及び復元装置並びにその方法
CA2255047A1 (en) * 1998-11-30 2000-05-30 Ibm Canada Limited-Ibm Canada Limitee Comparison of hierarchical structures and merging of differences
JP4141556B2 (ja) * 1998-12-18 2008-08-27 株式会社日立製作所 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体
US6377957B1 (en) * 1998-12-29 2002-04-23 Sun Microsystems, Inc. Propogating updates efficiently in hierarchically structured date
US6311187B1 (en) * 1998-12-29 2001-10-30 Sun Microsystems, Inc. Propogating updates efficiently in hierarchically structured data under a push model
US6635089B1 (en) * 1999-01-13 2003-10-21 International Business Machines Corporation Method for producing composite XML document object model trees using dynamic data retrievals
JP2000224257A (ja) * 1999-01-29 2000-08-11 Jisedai Joho Hoso System Kenkyusho:Kk 送信装置および受信装置
TW428146B (en) * 1999-05-05 2001-04-01 Inventec Corp Data file updating method by increment
US6671853B1 (en) * 1999-07-15 2003-12-30 International Business Machines Corporation Method and system for selectively streaming markup language documents
US6996770B1 (en) * 1999-07-26 2006-02-07 Microsoft Corporation Methods and systems for preparing extensible markup language (XML) documents and for responding to XML requests
US6966027B1 (en) * 1999-10-04 2005-11-15 Koninklijke Philips Electronics N.V. Method and apparatus for streaming XML content
GB2363217B (en) * 2000-06-06 2002-05-08 Oracle Corp Data file processing
US6826726B2 (en) * 2000-08-18 2004-11-30 Vaultus Mobile Technologies, Inc. Remote document updating system using XML and DOM
US6850948B1 (en) * 2000-10-30 2005-02-01 Koninklijke Philips Electronics N.V. Method and apparatus for compressing textual documents

Also Published As

Publication number Publication date
FR2818409A1 (fr) 2002-06-21
WO2002050708A1 (fr) 2002-06-27
US20040054669A1 (en) 2004-03-18
US7275060B2 (en) 2007-09-25
JP2004524606A (ja) 2004-08-12
FR2818409B1 (fr) 2003-03-14
EP1344151A1 (fr) 2003-09-17
US20070277096A1 (en) 2007-11-29
AU2002219311A1 (en) 2002-07-01

Similar Documents

Publication Publication Date Title
JP4145144B2 (ja) 構造化文書をいくつかの部分に分割する方法
RU2285354C2 (ru) Бинарный формат для экземпляров mpeg-7
US7231394B2 (en) Incremental bottom-up construction of data documents
JP5039018B2 (ja) デコーダにより受け取ってデコーディングするためのxmlベースのコンテンツ記述のバイナリ表現機能を改善する方法
US7870483B2 (en) Encoding and distribution of schema for multimedia content descriptions
CN1748426B (zh) 在流系统中发送和接收字体信息的方法
JP2009501991A (ja) 構造化文書を圧縮および解凍するための方法および装置
JP3865694B2 (ja) 構造化文書の木構造におけるパスの符号化および復号化方法
CN100470535C (zh) 用于从mpeg-4文本表示创建mpeg-4中间格式的方法及系统
CN101427571B (zh) 从mpeg-4中间格式创建mpeg-4文本表示的方法
US7797346B2 (en) Method for improving the functionality of the binary representation of MPEG-7 and other XML based content descriptions
US7627586B2 (en) Method for encoding a structured document
JP2004246908A (ja) 構造化データの送信装置
JP2005276193A (ja) Dibrデータのためのスキーマ及びスタイルシート
JP2004246907A (ja) 構造化データの送信装置
JP2004234677A (ja) 構造化データの送信装置
JP2004234679A (ja) 構造化データの送信装置
JP2004234674A (ja) 構造化データの送信装置
JP2004234676A (ja) 構造化データの送信装置
JP2004240982A (ja) 構造化データの送信装置
JP2004240983A (ja) 構造化データの送信装置
JP2004240984A (ja) 構造化データの送信装置
JP2004234675A (ja) 構造化データの送信装置
JP2004234669A (ja) 構造化データの送信装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060731

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20061027

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20061115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070302

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070918

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080222

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080403

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080528

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080617

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110627

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120627

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130627

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees