JP2007148751A - 構造化文書の符号化方法、符号化装置、符号化プログラム、復号装置及び符号化された構造化文書のデータ構造 - Google Patents
構造化文書の符号化方法、符号化装置、符号化プログラム、復号装置及び符号化された構造化文書のデータ構造 Download PDFInfo
- Publication number
- JP2007148751A JP2007148751A JP2005341895A JP2005341895A JP2007148751A JP 2007148751 A JP2007148751 A JP 2007148751A JP 2005341895 A JP2005341895 A JP 2005341895A JP 2005341895 A JP2005341895 A JP 2005341895A JP 2007148751 A JP2007148751 A JP 2007148751A
- Authority
- JP
- Japan
- Prior art keywords
- node
- data
- record
- structured document
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】構造化文書の符号化方法は、構造化文書を木構造で表したときの各ノードに対応し、対応するノードのノード位置、ノード種別、ノード名及びノードのデータ保存位置を示す符号語を含む固定長のレコードを生成する第1のステップと、ノードがデータを有する場合、対応するレコードのデータ保存位置が示すデータテーブルの位置に、ノードのデータを設定する第2のステップとを備えている。
【選択図】図4
Description
構造化文書の符号化方法であって、構造化文書を木構造で表したときの各ノードに対応し、対応するノードのノード位置、ノード種別、ノード名及びノードのデータ保存位置を示す符号語を含む固定長のレコードを生成する第1のステップと、ノードがデータを有する場合、対応するレコードのデータ保存位置が示すデータテーブルの位置に、ノードのデータを設定する第2のステップとを有することを特徴とする。
ノード位置は、ノードの階層と、構造化文書で1つ前に出現するノードに対応するレコードを示すポインタと、1つ後に出現するノードに対応するレコードを示すポインタで表されることも好ましい。
レコードは、ノードが有するデータの、データ型を示す符号語も含んでいることも好ましい。
レコードに含まれるノード種別、ノード名及びデータ型に使用する符号語は、符号化テーブルで規定され、構造化文書で使用されている要素及び属性から符号化テーブルを作成するステップを、第1のステップの前に有することも好ましい。
コンピュータに前記符号化方法を実行させることを特徴とする。
構造化文書の符号化装置であって、構造化文書を木構造で表した場合におけるノードの、ノード種別及びノード名の符号語を示す符号化テーブルと、構造化文書の各ノードに対応し、対応するノードのノード位置、ノード種別、ノード名及びノードのデータ保存位置を示す符号語を含む固定長のレコードを、符号化テーブルに基づき生成する手段と、ノードがデータを有する場合、対応するレコードのデータ保存位置が示すデータテーブルの位置に、ノードのデータを設定する手段とを有することを特徴とする。
コンピュータに読み込まれる構造化文書の符号化データのデータ構造であって、構造化文書を木構造で表した場合におけるノードの、ノード種別及びノード名の符号語を示す符号化テーブルと、ノードに対応して設けられ、対応するノードの、木構造でのノード位置、ノード種別、ノード名及びノードのデータ保存位置を示す符号語を含む固定長のレコードと、レコードのデータ保存位置によりポイントされ、該レコードに対応するノードが有するデータを保持するデータテーブルとを有することを特徴とする。
前記符号化データから構造化文書の復号を行うことを特徴とする。
Claims (8)
- 構造化文書の符号化方法であって、
構造化文書を木構造で表したときの各ノードに対応し、対応するノードのノード位置、ノード種別、ノード名及びノードのデータ保存位置を示す符号語を含む固定長のレコードを生成する第1のステップと、
ノードがデータを有する場合、対応するレコードのデータ保存位置が示すデータテーブルの位置に、ノードのデータを設定する第2のステップと、
を有することを特徴とする符号化方法。 - ノード位置は、ノードの階層と、構造化文書で1つ前に出現するノードに対応するレコードを示すポインタと、1つ後に出現するノードに対応するレコードを示すポインタで表されること、
を特徴とする請求項1に記載の方法。 - レコードは、ノードが有するデータの、データ型を示す符号語も含んでいること、
を特徴とする請求項1又は2に記載の符号化方法。 - レコードに含まれるノード種別、ノード名及びデータ型に使用する符号語は、符号化テーブルで規定され、
構造化文書で使用されている要素及び属性から符号化テーブルを作成するステップを、第1のステップの前に有すること、
を特徴とする請求項3に記載の符号化方法 - コンピュータに構造化文書の符号化を実行させるプログラムであって、
構造化文書を木構造で表したときの各ノードに対応し、対応するノードのノード位置、ノード種別、ノード名及びノードのデータ保存位置を示す符号語を含む固定長のレコードを生成する第1のステップと、
ノードがデータを有する場合、対応するレコードのデータ保存位置が示すデータテーブルの位置に、ノードのデータを設定する第2のステップと、
をコンピュータに実行させることを特徴とするプログラム。 - 構造化文書の符号化装置であって、
構造化文書を木構造で表した場合におけるノードの、ノード種別及びノード名の符号語を示す符号化テーブルと、
構造化文書の各ノードに対応し、対応するノードのノード位置、ノード種別、ノード名及びノードのデータ保存位置を示す符号語を含む固定長のレコードを、符号化テーブルに基づき生成する手段と、
ノードがデータを有する場合、対応するレコードのデータ保存位置が示すデータテーブルの位置に、ノードのデータを設定する手段と、
を有することを特徴とする符号化装置。 - コンピュータに読み込まれる構造化文書の符号化データのデータ構造であって、
構造化文書を木構造で表した場合におけるノードの、ノード種別及びノード名の符号語を示す符号化テーブルと、
ノードに対応して設けられ、対応するノードの、木構造でのノード位置、ノード種別、ノード名及びノードのデータ保存位置を示す符号語を含む固定長のレコードと、
レコードのデータ保存位置によりポイントされ、該レコードに対応するノードが有するデータを保持するデータテーブルと、
を有することを特徴とするデータ構造。 - 請求項7に記載の符号化データから構造化文書の復号を行うこと、
を特徴とする復号装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005341895A JP4821287B2 (ja) | 2005-11-28 | 2005-11-28 | 構造化文書の符号化方法、符号化装置、符号化プログラム、復号装置及び符号化された構造化文書のデータ構造 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005341895A JP4821287B2 (ja) | 2005-11-28 | 2005-11-28 | 構造化文書の符号化方法、符号化装置、符号化プログラム、復号装置及び符号化された構造化文書のデータ構造 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007148751A true JP2007148751A (ja) | 2007-06-14 |
JP4821287B2 JP4821287B2 (ja) | 2011-11-24 |
Family
ID=38210105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005341895A Expired - Fee Related JP4821287B2 (ja) | 2005-11-28 | 2005-11-28 | 構造化文書の符号化方法、符号化装置、符号化プログラム、復号装置及び符号化された構造化文書のデータ構造 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4821287B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009009439A (ja) * | 2007-06-29 | 2009-01-15 | Mitsubishi Electric Corp | Xml文書変換装置及びその方法、xml文書復元装置及びその方法、xml文書処理装置 |
JP2009205406A (ja) * | 2008-02-27 | 2009-09-10 | Sony Corp | ファイル構造解析装置、ファイル構造解析方法およびプログラム |
JP2010113461A (ja) * | 2008-11-05 | 2010-05-20 | Ntt Docomo Inc | 情報端末、データ復元方法及びデータバックアップ方法 |
JP2020098583A (ja) * | 2017-03-15 | 2020-06-25 | センシェア アーゲー | データベースにおけるトライデータ構造の有効使用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01263742A (ja) * | 1988-04-14 | 1989-10-20 | Nec Corp | コマンド履歴参照装置 |
JPH06195398A (ja) * | 1992-12-22 | 1994-07-15 | Taisei Corp | Cadシステム |
JP2003271668A (ja) * | 2002-03-15 | 2003-09-26 | Toshiba Corp | 構造化データ管理プログラム及び方法並びに装置 |
JP2004178084A (ja) * | 2002-11-25 | 2004-06-24 | Systems Engineering Constructions Co Ltd | Xmlデータの格納方法及び格納装置、並びにプログラムおよびプログラムを記録した記録媒体 |
-
2005
- 2005-11-28 JP JP2005341895A patent/JP4821287B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01263742A (ja) * | 1988-04-14 | 1989-10-20 | Nec Corp | コマンド履歴参照装置 |
JPH06195398A (ja) * | 1992-12-22 | 1994-07-15 | Taisei Corp | Cadシステム |
JP2003271668A (ja) * | 2002-03-15 | 2003-09-26 | Toshiba Corp | 構造化データ管理プログラム及び方法並びに装置 |
JP2004178084A (ja) * | 2002-11-25 | 2004-06-24 | Systems Engineering Constructions Co Ltd | Xmlデータの格納方法及び格納装置、並びにプログラムおよびプログラムを記録した記録媒体 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009009439A (ja) * | 2007-06-29 | 2009-01-15 | Mitsubishi Electric Corp | Xml文書変換装置及びその方法、xml文書復元装置及びその方法、xml文書処理装置 |
JP2009205406A (ja) * | 2008-02-27 | 2009-09-10 | Sony Corp | ファイル構造解析装置、ファイル構造解析方法およびプログラム |
JP4513876B2 (ja) * | 2008-02-27 | 2010-07-28 | ソニー株式会社 | ファイル構造解析装置、ファイル構造解析方法およびプログラム |
US8370325B2 (en) | 2008-02-27 | 2013-02-05 | Sony Corporation | File structure analyzing apparatus, file structure analyzing method, and program |
JP2010113461A (ja) * | 2008-11-05 | 2010-05-20 | Ntt Docomo Inc | 情報端末、データ復元方法及びデータバックアップ方法 |
JP2020098583A (ja) * | 2017-03-15 | 2020-06-25 | センシェア アーゲー | データベースにおけるトライデータ構造の有効使用 |
US11275740B2 (en) | 2017-03-15 | 2022-03-15 | Censhare Gmbh | Efficient use of trie data structure in databases |
US11347741B2 (en) | 2017-03-15 | 2022-05-31 | Censhare Gmbh | Efficient use of TRIE data structure in databases |
JP7198192B2 (ja) | 2017-03-15 | 2022-12-28 | センシェア ゲーエムベーハー | データベースにおけるトライデータ構造の有効使用 |
US11899667B2 (en) | 2017-03-15 | 2024-02-13 | Censhare Gmbh | Efficient use of trie data structure in databases |
Also Published As
Publication number | Publication date |
---|---|
JP4821287B2 (ja) | 2011-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7519903B2 (en) | Converting a structured document using a hash value, and generating a new text element for a tree structure | |
JP3272014B2 (ja) | 階層構造データ処理情報を含むデータ処理辞書を作成する方法及び装置 | |
US10122380B2 (en) | Compression of javascript object notation data using structure information | |
KR100461019B1 (ko) | 소형 화면 단말기를 위한 웹 컨텐츠 변환 시스템 및 방법 | |
US8346737B2 (en) | Encoding of hierarchically organized data for efficient storage and processing | |
JP4653381B2 (ja) | 構造化文書の圧縮/解凍方法 | |
CA2438176A1 (en) | Xml-based multi-format business services design pattern | |
US9378126B2 (en) | Decompression apparatus and decompression method | |
US8117217B2 (en) | Information processing apparatus and encoding method | |
JP2001217720A (ja) | データ圧縮装置、データベースシステム、データ通信システム、データ圧縮方法、記憶媒体及びプログラム伝送装置 | |
US20070112810A1 (en) | Method for compressing markup languages files, by replacing a long word with a shorter word | |
US20090254882A1 (en) | Methods and devices for iterative binary coding and decoding of xml type documents | |
EP1519279B1 (en) | Document transformation system | |
JP2011146036A (ja) | 情報処理装置及びその制御方法並びにプログラム | |
CN108664546B (zh) | Xml数据结构转换方法和装置 | |
JP4821287B2 (ja) | 構造化文書の符号化方法、符号化装置、符号化プログラム、復号装置及び符号化された構造化文書のデータ構造 | |
US20080313291A1 (en) | Method and apparatus for encoding data | |
CN110308907B (zh) | 数据转换方法、装置、存储介质及电子设备 | |
CN113127776A (zh) | 面包屑路径生成方法、装置及终端设备 | |
JPH10261969A (ja) | データ圧縮方法および装置 | |
US20110320927A1 (en) | Methods and Apparatus Utilizing XooML: Cross (X) Tool Markup Language | |
CN106802922A (zh) | 一种基于对象的溯源存储系统及方法 | |
KR101396090B1 (ko) | Xml 문서변환장치 및 방법과, 그를 이용한 xml문서처리시스템 | |
CN112069775A (zh) | 数据的转换方法及装置、存储介质、电子装置 | |
Shaamood | Encoding JSON by using Base 64 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080814 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101214 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110809 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110822 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4821287 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140916 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |