JP3865694B2 - 構造化文書の木構造におけるパスの符号化および復号化方法 - Google Patents
構造化文書の木構造におけるパスの符号化および復号化方法 Download PDFInfo
- Publication number
- JP3865694B2 JP3865694B2 JP2002561718A JP2002561718A JP3865694B2 JP 3865694 B2 JP3865694 B2 JP 3865694B2 JP 2002561718 A JP2002561718 A JP 2002561718A JP 2002561718 A JP2002561718 A JP 2002561718A JP 3865694 B2 JP3865694 B2 JP 3865694B2
- Authority
- JP
- Japan
- Prior art keywords
- segment
- code
- node
- path
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000006870 function Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/74—Browsing; Visualisation therefor
- G06F16/748—Hypervideo
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9027—Trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
- G06F16/94—Hypermedia
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
上記符号化方法は、
考慮されるノードに直接帰属されると思われる全ノードによって表される、情報要素の名前と型からなる組のリストを、構造スキーマにおいて上記考慮される各ノードに関連付けさせ、2進コードを各情報要素の名前と型の組に関連付けさせる前段階と、
符号化されるパスセグメント毎に、セグメントの宛先ノードの名前−型の組に関連付けされた2進ノードコードを決定し、該ノードコードをパスコードに挿入するステップを含むパス符号化段階とを含むことを特徴とする符号化方法を供することで実現される。
各セグメントは、セグメントの宛先ノードによって表される情報要素に対して、情報要素の名前と型からなる名前−型の組に関連付けされた少なくとも1つの2進ノードコードによってパスコードにおいて定義され、
上記復号化方法は、
考慮されるノードに直接帰属されると思われる全ノードによって表される、情報要素の名前と型からなる情報要素の名前−型の組のリストを、構造スキーマにおいて考慮された各ノードに関連付け、各情報要素の名前−型の組に対応する2進コードを関連付ける前段階と、
セグメントコードの宛先ノードの名前−型の組を表すノードコードを、復号化されるセグメントのパスコード毎に設けられる、宛先ノードの名前−型の組のリストを用いて復号化するパスコード復号化段階とを含むことを特徴とする復号化方法に関する。
Claims (18)
- 文書の構造スキーマによって定義された構造化文書の階層構造におけるパスの符号化方法であって、パスは、パスの開始ノードとパスの終了ノードとをつなぐ一連のセグメントによって定義され、各セグメントはソースノードと宛先ノードとをつなぎ、各ノードは文書内の情報要素を表し、各情報要素は名前を有し、かつ、構造スキーマにおける少なくとも1つの情報型に関連付けされている上記パスの符号化方法において、
上記パスの符号化方法は、
上記文書の構造スキーマにしたがって考慮されるノードに直接帰属する全宛先ノードを該宛先ノードが表す情報要素の名前と型との組合せに基づいて参照するリストを、上記考慮される各ノードに関連付けさせるとともに、上記情報要素の名前と型との組合せ毎に2進コードをそれぞれ関連付けさせる前段階と、
符号化されるパスセグメント毎に、セグメントの宛先ノードの名前と型との組合せに関連付けされた上記2進コード(12)を決定し、該2進コードを上記パスを示すパスコードに挿入するステップを含むパス符号化段階とを含むことを特徴とするパスの符号化方法。 - 上記パス符号化段階は、符号化されるパスセグメント毎に、セグメントの宛先ノードの2進位置コード(13)を決定するステップと、セグメントのソースノードに直接帰属すると考えられる他のノードに対して、上記セグメントの宛先ノードの位置を定義するステップをさらに含むことを特徴とする請求項1に記載のパスの符号化方法。
- 上記パス符号化段階は、一連のセグメントコード(11)を含むパスコード(10)を生成するステップをさらに含み、各セグメントコードはセグメントの宛先ノードに対する2進コード(12)と、セグメントの宛先ノードに対する2進位置コード(13)とを含むことを特徴とする請求項1または2に記載のパスの符号化方法。
- 上記パス符号化段階は、一連のセグメントコード(11)および一連のセグメントコードにおいて参照される全ノードの位置を示す一連の2進位置コード(13)を含むパスコード(10)を生成するステップをさらに含み、各セグメントコードはセグメントの宛先ノードに対する2進コード(12)を含むことを特徴とする請求項1または2に記載のパスの符号化方法。
- 上記前段階は、考慮されるノードに直接帰属するノードの最大数を判断して、ノードの2進位置コード(13)の大きさを判断するステップをさらに含むことを特徴とする請求項1から4のいずれか1項に記載のパスの符号化方法。
- 文書構造の情報要素のうち少なくとも1つは、属性を有し、上記符号化されるパスは宛先要素としての属性を有し、上記符号化段階は、各セグメントコード(11)に、セグメント型コード(14)を挿入して、セグメントの宛先ノードが属性か、または情報要素であるかを示すステップをさらに含むことを特徴とする請求項1から5のいずれか1項に記載のパスの符号化方法。
- 上記符号化段階は、パスコード(10)にパスコードの終点(14’)を挿入するステップをさらに含むことを特徴とする請求項1から6のいずれか1項に記載のパスの符号化方法。
- 上記パスコードの終点(14’)は、所定の値を有する、セグメント型コード(14)であることを特徴とする請求項7に記載のパスの符号化方法。
- 各セグメントのソースノードは、文書の構造スキーマにおける宛先ノードよりも上位の階層レベルに位置付けされ、上記符号化段階は、所定の値を有する少なくとも1つのセグメント型コード(14)をパスコードに挿入して、次のセグメントの符号化されるソースノードがその前のセグメントの符号化される宛先ノードであることを示すステップをさらに含むことを特徴とする請求項6から8のいずれか1項に記載のパスの符号化方法。
- 上記符号化段階は、コードをパスコード(10)に挿入し、符号化されたパスが文書のルートノードから始まる絶対パスか、または文書の構造スキーマの任意のノードから始まる相対パスであるかを示すステップをさらに含むことを特徴とする請求項1から9のいずれか1項に記載のパスの符号化方法。
- 文書の構造スキーマによって定義された、階層構造を持つ文書構造におけるパスコード(10)の復号化方法であって、上記パスコードは、パスの開始ノードとパスの終了ノードとをつなぐ一連のセグメントをそれぞれ符号化した一連のセグメントコード(11)を含み、各セグメントはソースノードと、次のセグメントのソースノードを成す宛先ノードとをつなぎ、各ノードは文書の情報要素を表し、各情報要素は名前を有し、かつ、構造スキーマにおける少なくとも1つの情報型に関連付けされている上記パスコードの復号化方法において、
各セグメントは、セグメントの宛先ノードが表す情報要素の名前と型との組合せに関連付けされた少なくとも1つの2進コード(12)を含むセグメントコードによってパスコード(10)において定義され、
上記パスコードの復号化方法は、
上記文書の構造スキーマにしたがって考慮されるノードに直接帰属する全宛先ノードを該宛先ノードが表す情報要素の名前と型との組合せに基づいて参照するリストを、上記考慮される各ノードに関連付けさせるとともに、上記情報要素の名前と型との組合せ毎に2進コードをそれぞれ関連付けさせる前段階と、
復号化されるパスコードのセグメントコード毎に、上記名前と型との組合せのリストを用いて、上記セグメントコードが関連付けされた宛先ノードの名前と型との組合せに基づき、上記2進コード(12)を復号化するパスコード復号化段階とを含むことを特徴とするパスコードの復号化方法。 - 復号化されるパスコード(10)に含まれる各セグメントは、上記文書の構造スキーマにしたがって、当該セグメントのソースノードに直接つながる他のノードに対して宛先ノードの位置コード(13)をさらに含み、上記復号化段階は、セグメント毎に、セグメントのソースノードに直接帰属する宛先ノードの最大数を用いて、セグメントの宛先ノードの2進位置コード(13)を復号化するステップをさらに含むことを特徴とする請求項11に記載のパスコードの復号化方法。
- セグメントの宛先ノードの上記2進コード(12)の復号化は、2進コードのビット数を判断するステップと、上記セグメントのソースノードに関連付けされている名前と型との組合せのリストにおいてこのコードを検索するステップとを含むことを特徴とする請求項11または12に記載のパスコードの復号化方法。
- セグメントの宛先ノードの2進位置コード(13)の復号化は、上記文書の構造スキーマにしたがってセグメントのソースノードに直接帰属するノードの最大数を用いて、該2進位置コードのビット数を判断するステップを含むことを特徴とする請求項11から13のいずれか1項に記載のパスコードの復号化方法。
- 各セグメントコード(11)は、セグメント型コード(14)を含み、上記パス復号化段階はセグメント毎に行われるセグメント型コードの復号化をさらに含むことを特徴とする請求項11から14のいずれか1項に記載のパスコードの復号化方法。
- パスコード(10)における各セグメントコード(11)のセグメント型コード(14)は、セグメントの宛先ノードが情報要素か、またはセグメントのソースノードの属性であるかを判断するのに用いられることを特徴とする請求項15に記載のパスコードの復号化方法。
- 上記復号化方法は、第1の所定値を有するセグメント型コード(14’)によって示す、パスコードの終点を判断するステップを含むことを特徴とする請求項15または16記載のパスコードの復号化方法。
- セグメント型コード(14)が第2の所定値を有する場合、パスコード(10)において復号化される次のセグメントコード(11)は、復号化されるその前のセグメントのソースノードと同じ宛先ノードを有することを特徴とする請求項15または17記載のパスコードの復号化方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0101243A FR2820228B1 (fr) | 2001-01-30 | 2001-01-30 | Procede de codage et de decodage d'un chemin dans l'arborescence d'un document structure |
PCT/FR2002/000360 WO2002061616A1 (fr) | 2001-01-30 | 2002-01-30 | Procede de codage et de decodage d'un chemin dans l'arborescence d'un document structure |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004536481A JP2004536481A (ja) | 2004-12-02 |
JP3865694B2 true JP3865694B2 (ja) | 2007-01-10 |
Family
ID=8859407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002561718A Expired - Fee Related JP3865694B2 (ja) | 2001-01-30 | 2002-01-30 | 構造化文書の木構造におけるパスの符号化および復号化方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20040107402A1 (ja) |
EP (1) | EP1358583B1 (ja) |
JP (1) | JP3865694B2 (ja) |
AT (1) | ATE390670T1 (ja) |
DE (1) | DE60225785T2 (ja) |
ES (1) | ES2300429T3 (ja) |
FR (1) | FR2820228B1 (ja) |
WO (1) | WO2002061616A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2437123C (en) * | 2001-02-05 | 2007-05-29 | Expway | Method and system for compressing structured descriptions of documents |
US7080318B2 (en) * | 2001-02-28 | 2006-07-18 | Koninklijke Philips Electronics N.V. | Schema, syntactic analysis method and method of generating a bit stream based on a schema |
DE50212603D1 (de) * | 2001-06-25 | 2008-09-18 | Siemens Ag | Verfahren zum schnellen suchen von elementen oder attributen oder zur schnellen filterung von fragmenten in binären repräsentationen von strukturierten dokumenten |
GB0304782D0 (en) * | 2003-03-03 | 2003-04-09 | Percy Richard | System and method using alphanumeric codes for the identification, description, classification and encoding of information |
DE102004043269A1 (de) * | 2004-09-07 | 2006-03-23 | Siemens Ag | Verfahren zur Codierung eines XML-basierten Dokuments |
US7721085B1 (en) * | 2004-09-21 | 2010-05-18 | Hewlett-Packard Development Company, L.P. | Encryption of hierarchically structured information |
US8111694B2 (en) | 2005-03-23 | 2012-02-07 | Nokia Corporation | Implicit signaling for split-toi for service guide |
US7805424B2 (en) * | 2006-04-12 | 2010-09-28 | Microsoft Corporation | Querying nested documents embedded in compound XML documents |
US7886223B2 (en) * | 2006-11-17 | 2011-02-08 | International Business Machines Corporation | Generating a statistical tree for encoding/decoding an XML document |
US10452716B2 (en) * | 2008-06-07 | 2019-10-22 | International Business Machines Corporation | Optimizing complex path endpoint resolution |
US7925643B2 (en) * | 2008-06-08 | 2011-04-12 | International Business Machines Corporation | Encoding and decoding of XML document using statistical tree representing XSD defining XML document |
FR2943441A1 (fr) * | 2009-03-18 | 2010-09-24 | Canon Kk | Procede de codage ou decodage d'un document structure a l'aide d'un schema xml, dispositif et structure de donnees associes |
US20130080474A1 (en) * | 2011-09-27 | 2013-03-28 | Bin Zhang | Accelerating recursive queries |
US8645428B2 (en) * | 2011-12-08 | 2014-02-04 | Xerox Corporation | Arithmetic node encoding for tree structures |
US10489493B2 (en) * | 2012-09-13 | 2019-11-26 | Oracle International Corporation | Metadata reuse for validation against decentralized schemas |
US9063916B2 (en) | 2013-02-27 | 2015-06-23 | Oracle International Corporation | Compact encoding of node locations |
US20150100544A1 (en) * | 2013-10-04 | 2015-04-09 | Alcatel-Lucent Usa Inc. | Methods and systems for determining hierarchical community decomposition |
CN105095237B (zh) | 2014-04-30 | 2018-07-17 | 国际商业机器公司 | 用于生成非关系数据库的模式的方法和设备 |
US11423060B2 (en) * | 2018-10-04 | 2022-08-23 | Oracle International Corporation | Storing and versioning hierarchical data in a binary format |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0523269A1 (de) * | 1991-07-18 | 1993-01-20 | International Business Machines Corporation | Computersystem zur Datenverwaltung |
AU2585797A (en) * | 1996-03-15 | 1997-10-01 | University Of Massachusetts | Compact tree for storage and retrieval of structured hypermedia documents |
US6345126B1 (en) * | 1998-01-29 | 2002-02-05 | Xerox Corporation | Method for transmitting data using an embedded bit stream produced in a hierarchical table-lookup vector quantizer |
US6704320B1 (en) * | 1999-03-24 | 2004-03-09 | Lucent Technologies Inc. | Dynamic algorithm for determining a shortest path tree between network nodes |
US6966027B1 (en) * | 1999-10-04 | 2005-11-15 | Koninklijke Philips Electronics N.V. | Method and apparatus for streaming XML content |
US6883137B1 (en) * | 2000-04-17 | 2005-04-19 | International Business Machines Corporation | System and method for schema-driven compression of extensible mark-up language (XML) documents |
CN1401188B (zh) * | 2000-10-17 | 2011-06-08 | 皇家菲利浦电子有限公司 | Mpeg-7样品的二进制格式 |
US6912538B2 (en) * | 2000-10-20 | 2005-06-28 | Kevin Stapel | System and method for dynamic generation of structured documents |
CA2437123C (en) * | 2001-02-05 | 2007-05-29 | Expway | Method and system for compressing structured descriptions of documents |
-
2001
- 2001-01-30 FR FR0101243A patent/FR2820228B1/fr not_active Expired - Fee Related
-
2002
- 2002-01-30 EP EP02701352A patent/EP1358583B1/fr not_active Expired - Lifetime
- 2002-01-30 JP JP2002561718A patent/JP3865694B2/ja not_active Expired - Fee Related
- 2002-01-30 ES ES02701352T patent/ES2300429T3/es not_active Expired - Lifetime
- 2002-01-30 US US10/470,250 patent/US20040107402A1/en not_active Abandoned
- 2002-01-30 WO PCT/FR2002/000360 patent/WO2002061616A1/fr active IP Right Grant
- 2002-01-30 AT AT02701352T patent/ATE390670T1/de not_active IP Right Cessation
- 2002-01-30 DE DE60225785T patent/DE60225785T2/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
FR2820228B1 (fr) | 2004-03-12 |
US20040107402A1 (en) | 2004-06-03 |
EP1358583B1 (fr) | 2008-03-26 |
ES2300429T3 (es) | 2008-06-16 |
ATE390670T1 (de) | 2008-04-15 |
DE60225785D1 (de) | 2008-05-08 |
JP2004536481A (ja) | 2004-12-02 |
DE60225785T2 (de) | 2009-04-09 |
EP1358583A1 (fr) | 2003-11-05 |
FR2820228A1 (fr) | 2002-08-02 |
WO2002061616A1 (fr) | 2002-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3865694B2 (ja) | 構造化文書の木構造におけるパスの符号化および復号化方法 | |
US7043686B1 (en) | Data compression apparatus, database system, data communication system, data compression method, storage medium and program transmission apparatus | |
US8533172B2 (en) | Method and device for coding and decoding information | |
US6825781B2 (en) | Method and system for compressing structured descriptions of documents | |
RU2285354C2 (ru) | Бинарный формат для экземпляров mpeg-7 | |
JP4197320B2 (ja) | 構造化された文章、特にxml文章の符号化/復号化のための方法及び装置 | |
US8914718B2 (en) | Coding a structured document as a bitstream by storing in memory a reference to an entry in a coding dictionary | |
JP4145144B2 (ja) | 構造化文書をいくつかの部分に分割する方法 | |
US8341129B2 (en) | Methods of coding and decoding a structured document, and the corresponding devices | |
US8346737B2 (en) | Encoding of hierarchically organized data for efficient storage and processing | |
US20030177341A1 (en) | Schema, syntactic analysis method and method of generating a bit stream based on a schema | |
AU2002253002A1 (en) | Method and system for compressing structured descriptions of documents | |
JP4653381B2 (ja) | 構造化文書の圧縮/解凍方法 | |
US20080148141A1 (en) | Method For Encoding an Xml Document, Decoding Method, Encoding and Decoding Method, Encoding Device, Decoding Device and Encoding and Decoding Device | |
US20120150828A1 (en) | Method and apparatus for decoding encoded structured data from a bit-stream | |
US20090138491A1 (en) | Composite Tree Data Type | |
CN111666575B (zh) | 基于词元编码的文本无载体信息隐藏方法 | |
US20060064424A1 (en) | Method for the creation of a bit stream from an indexing tree | |
US7797346B2 (en) | Method for improving the functionality of the binary representation of MPEG-7 and other XML based content descriptions | |
US20100115397A1 (en) | Method and device for document coding and method and device for document decoding | |
JP2006519422A (ja) | 構造化されたドキュメントのエンコーディング方法 | |
JP4821287B2 (ja) | 構造化文書の符号化方法、符号化装置、符号化プログラム、復号装置及び符号化された構造化文書のデータ構造 | |
US7617237B2 (en) | Encoding device, encoding method, decoding device, decoding method, program and machine readable recording medium containing the program | |
KR100968083B1 (ko) | 구조화된 문서들, 특히 xml 문서들을인코딩/디코딩하기 위한 방법 및 장치 | |
JP2007516514A (ja) | 構造化文書の圧縮および解凍方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051108 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20060123 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20060130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060508 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061003 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101013 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111013 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121013 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131013 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |