JP4261299B2 - データ圧縮装置、データ復元装置およびデータ管理装置 - Google Patents
データ圧縮装置、データ復元装置およびデータ管理装置 Download PDFInfo
- Publication number
- JP4261299B2 JP4261299B2 JP2003328428A JP2003328428A JP4261299B2 JP 4261299 B2 JP4261299 B2 JP 4261299B2 JP 2003328428 A JP2003328428 A JP 2003328428A JP 2003328428 A JP2003328428 A JP 2003328428A JP 4261299 B2 JP4261299 B2 JP 4261299B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- template
- vertices
- vertex
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Description
ここで、非特許文献2に開示されている圧縮方法について説明する。この圧縮方法ではまず、要素開始記号や空要素記号をそれぞれ「#1」、「#2」のような短い要素名で置換し、要素終了記号を「/」で置換する。また、テキスト情報は「C」で置換する。
以上の圧縮方法を分離したXML文書10に適用すると、分離後のデータ構造12、要素名情報13およびテキスト情報14はそれぞれ図21、図22、図23のように表現される。
X=“#1 #2 C / #3”,Y=”#4C /”,
Z=“/ #5”,W=“#6 C/”,V=“/ #7 / /”のように設定すると、図21に示したデータ構造12は“X Y Y Y Z W W V”のように表せる。これは一部の文書構造をあらわすテンプレートとして、Y,Wを複数回利用している。このように、テンプレートが繰り返し利用でき、元の文書を少ないテンプレートで表現することができれば、元のXML文書を表す情報量が少なくて済むから圧縮が可能になる。
このデータ圧縮装置は、テンプレート蓄積手段に蓄積されているテンプレートが頂点間の参照情報が共有可能な構成を有するので、テンプレート数を記憶するための記憶容量が少なくて済むようになる。
このデータ圧縮装置も、テンプレート蓄積手段に蓄積されているテンプレートが頂点間の参照情報が共有可能な構成を有するので、テンプレート数を記憶するための記憶容量が少なくて済むようになる。
このようなテンプレートを有すると、1つのテンプレートを反転させて適用することができるから、テンプレート数を少なくすることができる。
このテンプレートは、各頂点間の参照情報を有しなくてもよいので、記憶容量が少なくて済む。
このテンプレートは、テンプレートを定義するのに他のテンプレートの定義を利用できるため、テンプレートを表現するのに必要な記憶容量を削減することができる。
共用テンプレートは、複数の入力データに共用されるから、テンプレート数を少なくすることができるようになる。
このようなデータ復元装置によれば、圧縮された相互参照関係データをテンプレート蓄積手段に蓄積されたテンプレートを用いて圧縮前の元の相互参照関係データを復元することができる。
このデータ管理装置は、利用頻度に応じて、第1のデータ蓄積手段と第2のデータ蓄積手段との間でデータを移動させることができ、データを圧縮済みまたは非圧縮の状態に適宜変えて蓄積することができる。したがって、利用頻度の高いデータの利用速度が高いまま維持されるため、高速化が可能となる。
データ圧縮装置の実施の形態
(第1の実施の形態)
図1は本実施の形態に係るデータ圧縮装置101の構成を示すブロック図である。図1に示すように、データ圧縮装置101はテンプレート蓄積手段102、分離手段103、テンプレート一致箇所検出手段104およびテンプレート置換手段105を有している。このデータ圧縮装置101は、入力データ106から、第1の出力データ107と第2の出力データ108を出力するようになっている。
また、一般的なグラフ構造によって表現されるデータとは、XML文書のような根付順序木に限定されず、例えば閉路を有するような、より一般的な無向・有向グラフのことをいう。
テンプレート蓄積手段102は、圧縮に先立ちあらかじめテンプレートとテンプレート実体を蓄積している。このとき、テンプレート蓄積手段102は、テンプレートやテンプレート実体として、例えば、あらかじめ高い頻度で適用されることが分かっている高頻度のものを蓄積している。このようなテンプレートとテンプレート実体としては、それぞれ例えば、図4(a),図4(b)にそれぞれ示すテンプレート1003とテンプレート実体1020とがある。
そして、テンプレート一致箇所検出手段104は、このようなテンプレート一致箇所情報1505をテンプレート置換手段105に伝達(入力)する。
テンプレートを用いて元の相互参照関係データ900を置換する置換手順は、図10に示すとおりで、また、置換した結果は図5に示す相互参照関係データ1100のようになる。この相互参照関係データ1100は圧縮済みの相互参照関係データ(以下「圧縮済み参照データ」ともいう)である。
選択した一致箇所はMiとする。
ステップ3では、テンプレート実体を1つ作成し、実体ID=iとする。このテンプレート実体をOiとし,以下の処理を行う。
利用テンプレートID、反転フラグMiの利用、テンプレートID、反転フラグよりそれぞれ複製する。
実体情報をMiの頂点対応情報より複製する。
実体接続情報は実体情報に記述された対応関係より、元の参照をそのまま代入する。
次に、ステップ4に進んでi=i+1を計算する、
続くステップ5では、作成済のテンプレート実体を1つずつ選択し、以下の処理を繰り返す。選択したテンプレート実体をOiとする。
次に、ステップ6に進み、実体接続情報に記述された参照の接続先頂点が他のテンプレート実体に含まれる場合はテンプレート実体IDとテンプレートの頂点の組に置換する。
また、各テンプレート実体の実体接続情報には、他のテンプレート実体や頂点との接続関係を示す情報が設定されている。各テンプレート実体が適用しているテンプレートは第1のテンプレート1011であるが、第1のテンプレート1011は外部と接続できる参照を4つ保持していることがその接続情報1013に記述されている。
また、本実施の形態では、反転フラグは各テンプレート実体に1つずつ用意しているが相互参照関係データ全体で1つとしてもよいし、また両方を設定してもよい。
処理開始後ステップ11で、パターン蓄積手段に蓄積されたパターンから、頂点の数が多い順に1つずつ選択し、以下の処理を繰り返す。
選択したパターンをPjとする。
次にステップ12に進んで、反転フラグの値を偽、真のそれぞれに対し、以下を繰り返す。
続くステップ13では、相互参照関係データに含まれる頂点から、選択したパターンPの頂点の数と一致する頂点を選択する組み合わせをX1,X2,Xmとし、その中から1つずつ選択して、以下を繰り返す。
選択した組み合わせをXkとする。
次に、ステップ14に進み、Xkに含まれる頂点はすべて置換済みマークが無いか否かを判断し、無ければステップ15に進み、そうでなければ処理を終了する。ステップ15に進むと、XkがPjと同型か否かを判断し、同型であればステップ16に進み、そうでなければ処理を終了する。ステップ16に進むと、Xkを一致箇所として登録し、Xkに含まれる頂点は置換済みとしてマークする。
図6(a)に示すような連続する複数の兄弟参照を有する相互参照関係データ1204を圧縮する場合について説明する。データ圧縮装置101によれば、この相互参照関係データ1204は、図6(a)に示す連続兄弟参照部1200を図6(b)に示す第2のテンプレート1201を用いて圧縮する。図6(b)に示す第2のテンプレート1201はテンプレートID1202と、接続情報1203を有するが、第1のテンプレート1101とは異なり、パターン情報を有していない。この第2のテンプレート1201は、相互参照関係データ1204のような連続兄弟参照部を有する相互参照関係データを圧縮するために設けた連続兄弟参照用テンプレートである。
このような相互参照関係データ1204を圧縮するには、少なくとも、連続兄弟参照部1200を構成する頂点の個数と、第1の頂点の外部への参照がわかればよいので、第2のテンプレート1201における接続情報1203には、連続兄弟参照部を構成する頂点の個数Nと、テンプレートの親参照pが設定されている。なお、テンプレートID1202は“2”を有している。
図7において、相互参照関係データ1300には、テンプレート実体として、テンプレート実体1318,1323,1329の3つが存在し、実体ID1317,実体ID1322,実体ID1328は、それぞれ“1”,“2”,“3”の値を有している。各テンプレート実体は、すべて利用テンプレートID1326,1334,1333を有していて、いずれも“2”が設定されている(これは、第2のテンプレート1201を用いて圧縮したことを意味している)。なお、本実施の形態では、反転フラグを用いないため各テンプレート実体1318,1323,1329には反転フラグが設けられていない。
以上のように相互参照関係データ1204は第2のテンプレート1201を用いて圧縮可能である。その圧縮に用いる第2のテンプレート1201はパターン情報を有していないため、第2のテンプレート1201を記憶するのに必要な記憶容量が少なくて済む。そのため、各テンプレート蓄積手段102のメモリ使用量を削減することが可能である。
次に、データ復元装置1801について、図12を用いて説明する。図12は本実施の形態に係るデータ復元装置1801の構成を示すブロック図である。このデータ復元装置1801は、図5に示すような圧縮後の相互参照関係データ(圧縮済み参照データ)1100と、図3(b)に示す型と値を有する複数の頂点からなる頂点群のデータとから、それぞれが型と値を有する複数の頂点と、頂点間の参照情報とを有する元の入力データを復元する。データ復元装置1801は、テンプレート蓄積手段1802と、合成手段1803と、テンプレート展開手段1804とを有している。
テンプレート展開手段1804は第1の入力データ1806として与えられた圧縮後の相互参照関係データをテンプレート蓄積手段1802に蓄積されたテンプレートを用いて展開する。その展開は、例えば上述した図13に示した復元手順で行うことができる。テンプレート展開手段1804により復元された相互参照関係データは、図3に示す相互参照関係データ900のようになる。
以上のような手順により、それぞれが型と値を有する元の複数の頂点と、頂点間の参照情報からなる入力データを復元することが可能である。
復元手順は以下のとおりである。
図13において、開始後のステップ21で、圧縮済みの相互参照関係データに含まれるすべてのテンプレート実体をX1,X2,Xnとし、すべてについて以下を行う。
選択したテンプレート実体をXiとする。
次にステップ22に進み、テンプレート実体Xiが利用するテンプレートが持つ頂点間の参照情報を複製し、テンプレート実体Xiの実体情報に記述される頂点のIDを割り振る。
次いでステップ23に進み、テンプレート実体Xiの実体接続情報に記述された頂点が他のテンプレート実体Xmに含まれる頂点の場合、テンプレート実体Xmに記述される頂点IDで置換する。
本発明によるデータ圧縮装置により、相互参照関係データを圧縮すると、その圧縮後のデータへのアクセス速度の若干の低下が見込まれる。そのため、データの利用頻度を観測しておいて、その時々で利用頻度の高いものは非圧縮とし、いったん圧縮した相互参照関係データについても、利用頻度が高くなれば非圧縮の状態に戻し、逆に利用頻度が低くなれば再度圧縮する、といった方法でデータ管理を行うことが好ましい。このようなデータ管理を行うデータ管理装置を設ければ、装置全体の高速化と省メモリ化を両立させることも可能である。
本実施の形態におけるデータ管理装置2000は、内部に蓄積するデータを一意に識別するための識別IDを各データに割り振っている。データ指定2009は、そのための識別IDを外部から入力する手段である。
データ管理装置2000の場合、データは第1、第2いずれかのデータ蓄積手段2001、2004に保存されているが、初期状態では、第1データ蓄積手段2001、第2のデータ蓄積手段2004のいずれにデータを蓄積しておいてもよい。以下の説明では、すべて第2のデータ蓄積手段2004に蓄積しておくことを想定している。
制御手段2005は、データ指定2009により、外部から識別IDが入力されると、それを受けて利用頻度観測手段2006に指示を入力する。利用頻度観測手段2006は制御手段2005の指示を受けて、該当するデータが第1のデータ蓄積手段2001と第2のデータ蓄積手段2004のいずれに蓄積されているか、および、両手段の間でのデータの移動があるか否かを通知する情報を制御手段2005に入力する。
そして、制御手段2005は利用頻度観測手段2006からの上述した返答に基づき、第1のデータ蓄積手段2001または第2のデータ蓄積手段2004を制御して、記憶しているデータを出力させ、選択手段2008により、いずれかから得たデータをデータ管理装置2000の外部に出力する。
本発明によれば、図15に示すようなテンプレートをテンプレート蓄積手段に格納することもできる。図15は第3のテンプレート2100を示す図である。図15に示す第3のテンプレート2100のパターン情報2103において、エリア2104,2105における頂点間の参照情報は、図4(c)に示す第1のテンプレート1011のパターン情報に一致することが分かる。したがって、テンプレートやテンプレート実体を拡張し、内部に適用されたテンプレートの数や、テンプレート内部の各テンプレートを一意に識別できるID等を記述する情報を付加することにより、テンプレート内部のパターン情報に対しても、前述までのテンプレートを適用することが可能になる。
テンプレート内部のパターン情報にも、テンプレートの適用を可能とするための親テンプレート2300と親テンプレート実体2320の構成例をそれぞれ図17(a),(b)に示す。親テンプレート2300と親テンプレート実体2320は、図4に示す第1の実施の形態で用いたテンプレート1003及びテンプレート実体1020に対し、前者に内部テンプレート情報2301を追加し、後者に内部テンプレート実体接続情報2302及び内部テンプレート実体情報2303を追加している。
このように構成した親テンプレート2200を相互参照関係データに適用すれば、テンプレートを定義するのに他のテンプレートの定義を利用できるため、図15に示すような第3のテンプレート2100に比べて、テンプレートの情報量を削減することが可能である。
21,31…データ構造
101…データ圧縮装置
102,1802…テンプレート蓄積手段
103…分離手段
104…テンプレート一致箇所検出手段
105…テンプレート置換手段
106…入力データ、107…第1の出力データ
108…第2の出力データ
900,1100…相互参照関係データ
1204、1300…相互参照関係データ
901…頂点、950…テーブル
1003…テンプレート
1020,1124、1133…テンプレート実体
1140,1323,1329…テンプレート実体
1011…第1のテンプレート
1201…第2のテンプレート
1501…一致箇所
1505…テンプレート一致箇所情報
1801,2003…データ復元装置
1803…合成手段
1804…テンプレート展開手段
2000…データ管理装置
2001…第1のデータ蓄積手段
2002…データ圧縮装置
2004…第2のデータ蓄積手段
2005…制御手段、2006…利用頻度観測手段
2008…選択手段、2100…第3のテンプレート
2200、2300…親テンプレート
2320…親テンプレート実体
Claims (8)
- 型と値をそれぞれ有する複数の頂点と、該頂点間の参照情報とを有する入力データを、前記頂点間の参照情報を有する相互参照関係データと、前記型と値を有する複数の頂点からなる頂点群とに分離し、その分離された前記頂点群のデータを出力する分離手段と、
特定のパターンを有する前記頂点間の参照情報を、前記頂点間の参照情報が共有可能なテンプレートとして蓄積するテンプレート蓄積手段と、
前記分離手段により分離された前記相互参照関係データから、前記テンプレート蓄積手段に蓄積されているテンプレートと一致する箇所を検出するテンプレート一致箇所検出手段と、
前記分離手段により分離された相互参照関係データのうち、前記テンプレート一致箇所検出手段により検出された一致箇所を前記テンプレートで前記頂点間の参照情報を参照可能な状態に置換し、その置換された相互参照関係データを出力するテンプレート置換手段とを有することを特徴とするデータ圧縮装置。 - それぞれの値を有し、該各値が属性情報として型を有することが可能な複数の頂点と、該頂点間の参照情報とを有する入力データを、前記頂点間の参照情報を有する相互参照関係データと、前記値を有する複数の頂点からなる頂点群とに分離し、その分離された前記頂点群のデータを出力する分離手段と、
特定のパターンを有する前記頂点間の参照情報を、前記頂点間の参照情報が共有可能なテンプレートとして蓄積するテンプレート蓄積手段と、
前記分離手段により分離された前記相互参照関係データから、前記テンプレート蓄積手段に蓄積されているテンプレートと一致する箇所を検出するテンプレート一致箇所検出手段と、
前記分離手段により分離された相互参照関係データのうち、前記テンプレート一致箇所検出手段により検出された一致箇所を前記テンプレートで前記頂点間の参照情報を参照可能な状態に置換し、その置換された相互参照関係データを出力するテンプレート置換手段とを有することを特徴とするデータ圧縮装置。 - 前記テンプレートが、前記頂点間の参照情報の一部または全部の参照方向を反転可能なことを特徴とする請求項1または2記載のデータ圧縮装置。
- 第1から第NまでのN個の頂点を有し、前記第1の頂点と第2の頂点以外の連続番号を有する前記頂点は相互に参照し、前記第1の頂点が前記第2の頂点を参照し、かつ外部への参照を保持し、前記第Nの頂点が第N−1の頂点を参照し、前記第2から第Nまでの各頂点が、外部への参照を保持しないか、またはすべて同数の参照を保持する連続兄弟参照部を有する前記相互参照関係データに適用するための接続情報を有する連続兄弟参照用テンプレートが、前記テンプレート蓄積手段に蓄積されていることを特徴とする請求項1〜3のいずれか一項記載のデータ圧縮装置。
- 前記頂点間の参照情報に、前記テンプレートを適用可能な親テンプレートが前記テンプレート蓄積手段に蓄積されていることを特徴とする請求項1〜4のいずれか一項記載のデータ圧縮装置。
- 複数の前記入力データに共用可能な共用テンプレートが前記テンプレート蓄積手段に蓄積されていることを特徴とする請求項1〜5のいずれか一項記載のデータ圧縮装置。
- 特定のパターンを有する複数の頂点間の参照情報を、前記頂点間の参照情報が共有可能なテンプレートとして蓄積するテンプレート蓄積手段と、
前記テンプレートにより置換され、圧縮された相互参照関係データを第1の入力データとして入力し、前記相互参照関係データから、前記テンプレートを用いて圧縮前の元の相互参照関係データを復元する展開手段と、
型と値をそれぞれ有する複数の前記頂点からなる頂点群のデータを第2の入力データとして入力し、前記頂点群のデータを前記展開手段により復元された前記相互参照関係データと合成したデータを出力する合成手段とを有することを特徴とするデータ復元装置。 - 圧縮可能なデータを蓄積する第1のデータ蓄積手段と、
請求項1〜6のいずれか一項記載のデータ圧縮装置により圧縮されたデータを蓄積する第2のデータ蓄積手段と、
前記第1のデータ蓄積手段及び第2のデータ蓄積手段に蓄積されたそれぞれのデータの利用頻度を観測し、該観測された利用頻度に応じて移動要求を出力する利用頻度観測手段と、
該利用頻度観測手段からの移動要求にしたがい、前記利用頻度が高い高頻度データを請求項7記載のデータ復元装置により復元して前記第1のデータ蓄積手段へ格納し、前記利用頻度が前記高頻度データよりも低いデータを前記データ圧縮装置により圧縮して前記第2のデータ蓄積手段へ格納するようにして、データを移動させるための制御を行う制御手段と、
前記第1のデータ蓄積手段と第2のデータ蓄積手段のいずれかから、前記制御手段の指示に応じてデータを取得して出力する選択手段とを有することを特徴とするデータ管理装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003328428A JP4261299B2 (ja) | 2003-09-19 | 2003-09-19 | データ圧縮装置、データ復元装置およびデータ管理装置 |
US10/935,584 US7774387B2 (en) | 2003-09-19 | 2004-09-08 | Data compressor, data decompressor, and data management system |
EP04021354A EP1517449A3 (en) | 2003-09-19 | 2004-09-08 | Compression of XML documents |
CNB2004100787884A CN100354861C (zh) | 2003-09-19 | 2004-09-17 | 数据压缩器和数据解压缩器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003328428A JP4261299B2 (ja) | 2003-09-19 | 2003-09-19 | データ圧縮装置、データ復元装置およびデータ管理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005094652A JP2005094652A (ja) | 2005-04-07 |
JP4261299B2 true JP4261299B2 (ja) | 2009-04-30 |
Family
ID=34191395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003328428A Expired - Fee Related JP4261299B2 (ja) | 2003-09-19 | 2003-09-19 | データ圧縮装置、データ復元装置およびデータ管理装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7774387B2 (ja) |
EP (1) | EP1517449A3 (ja) |
JP (1) | JP4261299B2 (ja) |
CN (1) | CN100354861C (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060085737A1 (en) * | 2004-10-18 | 2006-04-20 | Nokia Corporation | Adaptive compression scheme |
US20070005625A1 (en) * | 2005-07-01 | 2007-01-04 | Nec Laboratories America, Inc. | Storage architecture for embedded systems |
FR2907568B1 (fr) * | 2006-10-23 | 2008-12-26 | Canon Kk | Procede et dispositif de generation de motifs mixtes de reference a partir d'un document ecrit en langage de balisage et procedes et dispositifs de codage et de decodage associes. |
US7836396B2 (en) * | 2007-01-05 | 2010-11-16 | International Business Machines Corporation | Automatically collecting and compressing style attributes within a web document |
JP4756003B2 (ja) * | 2007-03-01 | 2011-08-24 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | データ圧縮転送装置、データ圧縮転送システム、データ圧縮転送方法、およびデータ圧縮転送プログラム |
FR2914759B1 (fr) | 2007-04-03 | 2009-06-05 | Canon Kk | Procede et dispositif de codage d'un document hierarchise |
US7746250B2 (en) * | 2008-01-31 | 2010-06-29 | Microsoft Corporation | Message encoding/decoding using templated parameters |
CN101499065B (zh) | 2008-02-01 | 2011-11-02 | 华为技术有限公司 | 基于fa的表项压缩方法及装置、表项匹配方法及装置 |
GB2463920B (en) * | 2008-09-30 | 2012-08-22 | Cambridge Broadband Networks Ltd | Improved data compression |
WO2011014179A1 (en) * | 2009-07-31 | 2011-02-03 | Hewlett-Packard Development Company, L.P. | Compression of xml data |
CN102053990A (zh) * | 2009-10-30 | 2011-05-11 | 国际商业机器公司 | 结构化文档的处理方法和设备 |
US20120084635A1 (en) * | 2010-09-30 | 2012-04-05 | Microsoft Corporation | Parameterized template compression for binary xml |
CN102447604B (zh) * | 2010-09-30 | 2016-01-27 | 迈普通信技术股份有限公司 | 路由表信息存储方法以及路由设备 |
CN107193642A (zh) * | 2016-03-14 | 2017-09-22 | 阿里巴巴集团控股有限公司 | 任务数据压缩切换方法、宜压缩程度评价方法及相关装置 |
CN106934066B (zh) * | 2017-03-31 | 2024-06-18 | 联想(北京)有限公司 | 一种元数据处理方法、装置和存储设备 |
US20240185019A1 (en) * | 2022-12-05 | 2024-06-06 | United Parcel Service Of America, Inc. | Security scheme for identification tags |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09130616A (ja) | 1995-10-27 | 1997-05-16 | Matsushita Electric Ind Co Ltd | 画像圧縮方法 |
US6349372B1 (en) | 1999-05-19 | 2002-02-19 | International Business Machines Corporation | Virtual uncompressed cache for compressed main memory |
JP3368883B2 (ja) * | 2000-02-04 | 2003-01-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ圧縮装置、データベースシステム、データ通信システム、データ圧縮方法、記憶媒体及びプログラム伝送装置 |
JP2001251617A (ja) | 2000-03-06 | 2001-09-14 | Japan Science & Technology Corp | 自己相似性を利用した平均値伝送符号化・復号化方法及びその装置 |
JP2001282516A (ja) | 2000-03-30 | 2001-10-12 | Digital Electronics Corp | ユーザーインターフェース装置、および、そのプログラムが記録された記録媒体 |
US6874141B1 (en) * | 2000-06-29 | 2005-03-29 | Microsoft Corporation | Method of compiling schema mapping |
US6941511B1 (en) * | 2000-08-31 | 2005-09-06 | International Business Machines Corporation | High-performance extensible document transformation |
JP4774145B2 (ja) | 2000-11-24 | 2011-09-14 | 富士通株式会社 | 構造化文書圧縮装置および構造化文書復元装置並びに構造化文書処理システム |
US7047382B2 (en) * | 2000-11-29 | 2006-05-16 | Quickshift, Inc. | System and method for managing compression and decompression and decompression of system memory in a computer system |
US7194683B2 (en) * | 2001-03-02 | 2007-03-20 | International Business Machines Corporation | Representing and managing dynamic data content for web documents |
JP2003044459A (ja) | 2001-08-02 | 2003-02-14 | Hitachi Software Eng Co Ltd | 構造化データに対するデータ圧縮方法およびデータ交換方法 |
US7669120B2 (en) | 2002-06-21 | 2010-02-23 | Microsoft Corporation | Method and system for encoding a mark-up language document |
-
2003
- 2003-09-19 JP JP2003328428A patent/JP4261299B2/ja not_active Expired - Fee Related
-
2004
- 2004-09-08 US US10/935,584 patent/US7774387B2/en not_active Expired - Fee Related
- 2004-09-08 EP EP04021354A patent/EP1517449A3/en not_active Withdrawn
- 2004-09-17 CN CNB2004100787884A patent/CN100354861C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP1517449A3 (en) | 2005-08-10 |
US20050102304A1 (en) | 2005-05-12 |
EP1517449A2 (en) | 2005-03-23 |
US7774387B2 (en) | 2010-08-10 |
CN1598811A (zh) | 2005-03-23 |
CN100354861C (zh) | 2007-12-12 |
JP2005094652A (ja) | 2005-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4261299B2 (ja) | データ圧縮装置、データ復元装置およびデータ管理装置 | |
Ferragina et al. | Structuring labeled trees for optimal succinctness, and beyond | |
JP3973557B2 (ja) | 構造化された文書を圧縮/伸長する方法 | |
Gueniche et al. | Compact prediction tree: A lossless model for accurate sequence prediction | |
Policriti et al. | LZ77 computation based on the run-length encoded BWT | |
US7912818B2 (en) | Web graph compression through scalable pattern mining | |
CN102112986B (zh) | 对基于列的数据编码的结构的高效的大规模处理 | |
JP3278297B2 (ja) | データ圧縮方法及びデータ復元方法並びにデータ圧縮装置及びデータ復元装置 | |
US20070255748A1 (en) | Method of structuring and compressing labeled trees of arbitrary degree and shape | |
JP5241738B2 (ja) | 表からツリー構造データを構築する方法及び装置 | |
CN104040899B (zh) | 生成符号的代码字母表以便为与程序一起使用的字生成代码字 | |
JP6467937B2 (ja) | 文書処理プログラム、情報処理装置および文書処理方法 | |
EP1990737A1 (en) | Document transformation system | |
JP2018524886A (ja) | 基本データシーブを用いて無損失削減されたデータに対する多次元検索、コンテンツ連想的な取出し、ならびにキーワードベースの検索および取出しの実行 | |
Pibiri et al. | Dynamic elias-fano representation | |
Policriti et al. | From LZ77 to the run-length encoded burrows-wheeler transform, and back | |
Nishimoto et al. | An optimal-time RLBWT construction in BWT-runs bounded space | |
WO2014097359A1 (ja) | 圧縮プログラム、圧縮方法、圧縮装置およびシステム | |
JP5194856B2 (ja) | コンパクトな決定図を用いた効率的インデックス付け | |
KR100500245B1 (ko) | 객체 지향 프로그램이 기록된 저장 매체 | |
Brisaboa et al. | Using Compressed Suffix-Arrays for a compact representation of temporal-graphs | |
JP4394964B2 (ja) | データ圧縮装置、データ復元装置、テンプレート生成装置およびデータ圧縮システム | |
Oswald et al. | An efficient text compression algorithm-data mining perspective | |
JPWO2008102474A1 (ja) | パターンマッチング方法及びプログラム | |
KR20080026772A (ko) | Lempel-Ziv 압축 방법의 복원 속도를 보완한압축 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060411 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090203 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090205 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120220 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120220 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140220 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |