JP4756003B2 - データ圧縮転送装置、データ圧縮転送システム、データ圧縮転送方法、およびデータ圧縮転送プログラム - Google Patents

データ圧縮転送装置、データ圧縮転送システム、データ圧縮転送方法、およびデータ圧縮転送プログラム Download PDF

Info

Publication number
JP4756003B2
JP4756003B2 JP2007051546A JP2007051546A JP4756003B2 JP 4756003 B2 JP4756003 B2 JP 4756003B2 JP 2007051546 A JP2007051546 A JP 2007051546A JP 2007051546 A JP2007051546 A JP 2007051546A JP 4756003 B2 JP4756003 B2 JP 4756003B2
Authority
JP
Japan
Prior art keywords
data
compression
size
code
binary data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007051546A
Other languages
English (en)
Other versions
JP2008219264A (ja
Inventor
弘 柴田
律人 富水
陽一 田口
智明 小川
将史 新夕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Communications Corp
Original Assignee
NTT Communications Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Communications Corp filed Critical NTT Communications Corp
Priority to JP2007051546A priority Critical patent/JP4756003B2/ja
Publication of JP2008219264A publication Critical patent/JP2008219264A/ja
Application granted granted Critical
Publication of JP4756003B2 publication Critical patent/JP4756003B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、データを転送する際の転送効率の向上を図るための技術に関する。
通信インフラとして衛星回線を用いることにより、広範囲で災害に対する耐環境性の高い情報通信が可能となり、災害情報や環境情報を監視するサービスへの適用が検討されている。災害や環境を監視するシステムとしては、多種多様で膨大な数のセンサを用いることが想定され、例えば、各種のセンサと、センサが測定して得た情報(センサ情報)を受信して衛星回線を介して転送するゲートウェイ装置(GW装置)と、GW装置から受信したセンサ情報を管理するサーバ装置とを備えることが考えられる。
このようなシステムにおいては、各センサから送られるデータは、アナログ数値型、論理値型、2次元ベクトル型、3次元ベクトル型、複数のサンプリング測定値の平均値、最大値、最大変化量など、出力形式が様々である。このような様々な形式のデータをGW装置とサーバ装置間で送受信するためには、データの取り扱いを容易化でき、新規のデータ構造にも対応可能な拡張性の高いフォーマットである、XML形式などのタグ付きフォーマットを用いることが求められる。
ファイルを圧縮するアルゴリズムやソフトウェア(圧縮ツール)は多数存在し、XMLファイルに特化した圧縮技術も存在するが、これらはファイルサイズがある程度大きくなければ圧縮の効果がなく、また巨大なファイルだと圧縮に相当の時間を要する。その圧縮効率は、非特許文献1のグラフに示されるように、XMLデータサイズで100KB(Kilo-Byte)程度ある場合に約30%に圧縮できるというレベルである。
インターネット,<http://www-06.ibm.com/jp/developerworks/xml/020705/j_x-matters19.html/>
上記のようにセンサ情報をサーバ装置で一元管理するシステムにおいては、その緊急性からセンサ情報をタイムリーかつ効率的に収集する必要がある。
1つ1つのセンサ情報が少量で、かつ膨大な数のセンサ情報を、衛星回線を用いた固定長スロットにのせて効率的に伝送するためには、サイズの小さいXMLファイルをいかにして圧縮し、圧縮後のデータをいかにして固定長スロットに配分するかが重要となる。
従来の圧縮技術では、100KB程度のXMLファイルでさえ30%程度にしか圧縮できず、100−数KB程度の小サイズのセンサ情報(センサのID,種別、測定値等を格納したシンプルなもの)のXMLファイルであれば、さらに圧縮率が低下してしまう。また、センサ情報をある程度まとめて圧縮することが考えられるが、巨大なファイルは圧縮に時間を要する。例えば10分の1といった高圧縮率を達成するには、数MB程度のサイズが必要である。1秒あたり1KBしか処理できないので、約17分間のデータを蓄積する必要があり、これではセンサ情報をタイムリーに収集するという目的を果たせない。
衛星回線の観測局に約100個のセンサを取り付け、各センサが1分に1回データを発信し、1つのセンサ情報のXMLデータが上述したようなシンプルなもので600バイト程度である環境下では、観測局配下の全センサを合計すると1秒当り約1KB(100×1/60×600Byte)のデータが発生する。
一方、衛星回線では、全国に配置された数千台のGW装置が利用できるよう、その帯域を細かく分割する必要があるため、衛星回線の帯域は1Kbps程度となる。そのため、GW装置は、1秒間に発生する1KB程度のXMLファイルを約10分の1に圧縮して、1Kbpsの衛星回線で送信する必要がある。
また、スロットサイズよりも大きなサイズのデータを、スロットサイズに合わせて分割して送信すると、受信側では分割した全てのデータを回収するまでデータを処理することができない。衛星回線は常時通信可能ではなく、各GW装置に対して通信時間が割り当てられており、GW装置が1つのデータを送信してから次のデータを送信するまでに数10分間空くことがあることを想定すると、分割したデータのそれぞれが1つの完成したデータとして成立していて、受信側であ即時に読み込んで処理できる必要がある。
本発明は、上記に鑑みてなされたものであり、その課題は、小サイズのタグ付きフォーマットのデータを約10分の1に圧縮することにある。
本発明の別の課題は、分割したデータのそれぞれを完成したデータとして成立させることにある。
第1の本発明に係るデータ圧縮転送装置は、タグ付きフォーマットのデータを格納しておく格納手段と、前記データのタグに用いられるキーワードとそれに対応する符号とを関連付けた辞書を記憶しておく記憶手段と、前記格納手段から前記データを読み出して、当該データにおけるキーワードを前記辞書に基づいて符号に変換し、変換後のデータに開始タグ記号及び終了タグ記号並びに改行コードが不要なデータ構造を定義する情報構造定義ルールを適用して開始タグ記号、終了タグ記号、改行コードを削除してバイナリデータとするデータ変換手段と、前記バイナリデータをサーバ装置へネットワークを介して送信する送信手段と、バイナリデータを圧縮する圧縮ツール及びその圧縮率を記憶しておく記憶手段と、前記バイナリデータのサイズが前記ネットワークのスロットのサイズよりも大きい場合、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも小さいときには前記バイナリデータを前記圧縮ツールによって圧縮し、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも大きいときには、当該バイナリデータの元のデータについて、関連するデータが離れないように定められた分割位置に開始タグ記号或いは終了タグ記号を挿入してデータを分割する分割手段と、当該分割後のデータについて前記データ変換手段および前記分割手段による処理を繰り返させる繰返手段と、を有し、前記送信手段は、前記繰返手段によって処理されたバイナリデータを送信することを特徴とする。
本発明にあっては、データのタグに用いられるキーワードを符号に変換するという1段階目の圧縮をした後、更に情報構造定義ルールを適用して開始タグ記号、終了タグ記号、改行コードを削除するという2段階目の圧縮をすることで、高い圧縮率を実現している。
ここで、情報構造定義ルールとは、記号及びコードが不要なデータ構造を定義するものをいう。例えば、各情報をサイズで特定すると共に、その情報およびサイズを関連付けた上で情報全体を階層構造化して把握することによって、タグ記号や改行コード等のコードを不要にできるものが該当する。
本発明にあっては、バイナリデータを圧縮ツールを用いて圧縮してもネットワークのスロットサイズよりも小さくならず、データを分割する必要がある場合に、関連するデータが離れないように定められた分割位置に開始タグ記号或いは終了タグ記号を挿入することで、各々の分割されたデータが1つのタグ付きフォーマットのデータとして成立するようにしている。
第2の本発明に係るデータ圧縮転送システムは、ネットワークを介して相互に通信可能なデータ圧縮転送装置とサーバ装置とを備えたデータ圧縮転送システムであって、前記データ圧縮転送装置は、タグ付きフォーマットデータを格納しておく第1格納手段と、前記データのタグに用いられるキーワードと対応する符号とを関連付けた辞書を記憶しておく第1記憶手段と、前記第1格納手段から前記データを読み出し、当該データにおけるキーワードを前記辞書に基づいて符号に変換し、変換後のデータに開始タグ記号及び終了タグ記号並びに改行コードが不要なデータ構造を定義する情報構造定義ルールを適用し開始タグ記号、終了タグ記号、改行コードを削除してバイナリデータとするデータ変換手段と、前記バイナリデータをサーバ装置へネットワークを介して送信する送信手段と、バイナリデータを圧縮する圧縮ツール及びその圧縮率を記憶しておく記憶手段と、前記バイナリデータのサイズが前記ネットワークのスロットのサイズよりも大きい場合、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも小さいときには前記バイナリデータを前記圧縮ツールによって圧縮し、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも大きいときには、当該バイナリデータの元のデータについて、関連するデータが離れないように定められた分割位置に開始タグ記号或いは終了タグ記号を挿入してデータを分割する分割手段と、当該分割後のデータについて前記データ変換手段および前記分割手段による処理を繰り返させる繰返手段と、を有し、前記送信手段は、前記繰返手段によって処理されたバイナリデータを送信し、前記サーバ装置は、前記データのタグに用いられるキーワードとそれに対応する符号とを関連付けた辞書を記憶しておく第2記憶手段と、前記データ圧縮転送装置からバイナリデータを受信して第2格納手段に格納させる受信手段と、前記第2格納手段から前記バイナリデータを読み出し、当該バイナリデータに情報構造定義ルールを適用して開始タグ記号、終了タグ記号、改行コードを挿入し、当該データにおける符号を前記辞書に基づいてキーワードに変換することで元のデータを復元する復元手段と、を有することを特徴とする。
本発明にあっては、上記のデータ圧縮転送装置で圧縮されたバイナリデータをサーバ装置で収集し、このバイナリデータに情報構造定義ルールを適用して開始タグ記号、終了タグ記号、改行コードを挿入し、当該データにおける符号を辞書に基づいてキーワードに変換することで元のデータを復元する。
第3の本発明に係るデータ圧縮転送システムは、前記サーバ装置が、前記データからキーワードを抽出し、キーワード毎に出現回数を記録手段に記録すると共に、出現回数の多いものから順位を付け、上位64位までのキーワードを1バイトの符号で表現すると共に、65位以下のキーワードを2バイトの符号で表現することにより前記辞書を作成する辞書作成手段を有することを特徴とする。
本発明にあっては、出現回数が多いキーワードから順位を付け、上位64位までのキーワードを1バイトの符号で表現し、65位以下のキーワードを2バイトの符号で表現する。これによって、出現頻度の高いキーワードから順に符号を割り当てることができ、新たなキーワードが追加された場合にも、それに対応する符号を自動的に辞書に登録することができる。
第4の本発明に係るデータ圧縮転送システムは、前記サーバ装置が、前記辞書作成手段によって追加・変更したキーワードおよびそれに対応する符号を用いて前記データのキーワードを符号に変換する変換手段と、当該変換後のデータと当該変換に用いたキーワードおよび符号とを一まとめにして前記データ圧縮転送装置へ送信する送信手段と、を有し、前記データ圧縮転送装置は、前記サーバ装置から受信した前記キーワードおよび符号を用いて前記辞書を更新する更新手段と、前記サーバ装置から受信したデータを更新後の辞書を用いて復元する復元手段と、を有することを特徴とする。
本発明にあっては、サーバ装置により、追加・変更したキーワードおよびそれに対応する符号を用いて変換した後のデータと、そのキーワードおよび符号とを一まとめにしてデータ圧縮転送装置に送信し、データ圧縮転送装置において、受信したキーワードおよび符号を用いて辞書を更新することで、最新の辞書をサーバ装置と共有できる。また、データ圧縮転送装置において、サーバ装置から受信したデータを更新後の辞書を用いて復元することで、制御コマンドや通信スケジュール等の様々な情報を利用することができる。
第5の本発明に係るデータ圧縮転送方法は、データ圧縮転送装置により、タグ付きフォーマットのデータを格納手段に格納しておくステップと、前記格納手段から前記データを読み出して、前記データのタグに用いられるキーワードとそれに対応する符号とを関連付けた辞書に基づいて、当該データにおけるキーワードを符号に変換し、変換後のデータに開始タグ記号及び終了タグ記号並びに改行コードが不要なデータ構造を定義する情報構造定義ルールを適用し開始タグ記号、終了タグ記号、改行コードを削除してバイナリデータとするデータ変換ステップと、バイナリデータを圧縮する圧縮ツール及びその圧縮率を記憶しておく記憶ステップと、前記バイナリデータのサイズがネットワークのスロットのサイズよりも大きい場合、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも小さいときには前記バイナリデータを前記圧縮ツールによって圧縮し、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも大きいときには、当該バイナリデータの元のデータについて、関連するデータが離れないように定められた分割位置に開始タグ記号或いは終了タグ記号を挿入してデータを分割する分割ステップと、当該分割後のデータについて前記データ変換ステップおよび前記分割ステップによる処理を繰り返させる繰返ステップと、前記バイナリデータをサーバ装置へネットワークを介して送信する送信ステップと、を有することを特徴とする。
第6の本発明に係るデータ圧縮転送プログラムは、データ圧縮転送装置に対して、タグ付きフォーマットのデータを格納手段に格納させるステップと、前記格納手段から前記データを読み出して、前記データのタグに用いられるキーワードとそれに対応する符号とを関連付けた辞書に基づいて、当該データにおけるキーワードを符号に変換し、変換後のデータに開始タグ記号及び終了タグ記号並びに改行コードが不要なデータ構造を定義する情報構造定義ルールを適用して開始タグ記号、終了タグ記号、改行コードを削除してバイナリデータとするデータ変換ステップと、バイナリデータを圧縮する圧縮ツール及びその圧縮率を記憶しておく記憶ステップと、前記バイナリデータのサイズがネットワークのスロットのサイズよりも大きい場合、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも小さいときには前記バイナリデータを前記圧縮ツールによって圧縮し、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも大きいときには、当該バイナリデータの元のデータについて、関連するデータが離れないように定められた分割位置に開始タグ記号或いは終了タグ記号を挿入してデータを分割する分割ステップと、当該分割後のデータについて前記データ変換ステップおよび前記分割ステップによる処理を繰り返させる繰返ステップと、前記バイナリデータをサーバ装置へネットワークを介して送信するステップと、を実行させること特徴とする。
第1の本発明によれば、1KB程度の小サイズのタグ付きフォーマットのデータを約10分の1に圧縮することができる。
第2の本発明によれば、分割したデータのそれぞれを1つの完成したデータとして成立させることができる。
図1は、本実施の形態におけるデータ圧縮転送システムの構成を示すブロック図である。同図に示すように、本システムは、センサ装置1に対して通信可能なデータ圧縮転送装置2と、データ圧縮転送装置2に対してネットワークを介して通信可能なサーバ装置3とを備える。このネットワークの例として、ここでは衛星回線4を用いる。
センサ装置1は、多種多様なセンサ1a,1b,1c…が100個程度取り付けられており、各センサがタグ付きフォーマットのデータを1分間に1回発信する。一例として、ここではXMLフォーマットのデータを扱う。
データ圧縮転送装置2は、センサ装置1からのデータをネットワークを介して受信するセンサ接続部21、受信したデータにおけるキーワードを符号化すると共に、タグ記号を削除してバイナリデータに変換するデータ変換部22、キーワードの符号変換に用いる辞書23、辞書23を管理する辞書管理部24、変換後のバイナリデータを圧縮ツールを用いて更に圧縮するバイナリデータ圧縮部25、符号化・バイナリ化され圧縮されたデータを衛星回線4のスロットに詰め込むスロット作成部26、作成されたスロットによりデータを衛星回線4を介してサーバ装置3へ送信し、或いはサーバ装置3からデータを受信するデータ送受信部27、サーバ装置3から受信した圧縮データを辞書23を用いて復元する圧縮データ復元部28、復元されたデータによって示される制御コマンド等の処理を行う制御コマンド処理部29を有する。
データ圧縮転送装置2は、専用の装置としてもよいし、汎用コンピュータを用いて構成し、各部の処理をプログラムによって実行させることとしてもよい。データ圧縮転送装置2は、各部の処理を実行するための演算処理装置や記憶装置等を備え、各部での処理においては、必要な情報を記憶装置から読み出すとともに、処理後の情報を記憶装置に記憶させる。
本システムを災害や環境を監視するシステムに適用する場合には、データ圧縮転送装置2は、全国数千箇所に設置され得るゲートウェイ装置として利用できるものである。この場合、各ゲートウェイ装置には1Kbps程度の衛星回線帯域が割り当てられる。
サーバ装置3は、圧縮されたバイナリデータをデータ圧縮転送装置2と送受信するデータ送受信部31、圧縮されたバイナリデータを復元するバイナリデータ復元部32、符号をキーワードに復元するための辞書33、辞書33を管理する辞書管理部34、バイナリデータの符号を辞書33を用いて対応するキーワードに復元する圧縮データ復元部35、データの生成・解析を行うデータ生成・解析部36、生成・解析したデータをデータ圧縮転送装置2へ送信するために圧縮するデータ圧縮部37、データにおけるキーワードと符号との対応関係を学習し、辞書33に登録する辞書作成部38を有する。
サーバ装置3についても、専用の装置としてもよいし、汎用コンピュータを用いて構成し、各部の処理をプログラムによって実行させることとしてもよい。サーバ装置3は、各部の処理を実行するための演算処理装置や記憶装置等を備え、各部の処理においては、必要な情報を記憶装置から読み出すとともに、処理後の情報を記憶装置に記憶させる。
次に、データ圧縮転送装置2における処理の流れについて図2のフローチャートを用いて説明する。
まず、センサ装置1において、各センサから取得した測定情報をデータ圧縮転送装置2へ送信する。この測定情報は、例えば図3(a)に示されるXMLフォーマットで記述されるものとする。
ステップ1(図2では「S1」と示す。以下同じ)で、データ圧縮転送装置2は、センサ接続部21を通じてセンサ装置1からXMLデータを受信し、記憶装置に記憶させる。
ステップ2で、データ変換部22により、辞書23を用いてXMLデータに含まれるキーワードを符号化し、更に情報構造定義ルールのデータ構造を適用し開始タグ記号、終了タグ記号、改行コードを削除することによりバイナリデータに変換する。
情報構造定義ルールとは、記号やコードを不要にするデータ構造を定義するものであり、例えば各情報をサイズで特定すると共に、その情報およびサイズを関連付けた上で情報全体を階層構造化することによってタグ記号や改行コード等を不要にできるものである。情報構造定義ルールには、例えばASN.1ルールやEBML(Extensible Binary Meta-Language)等がある。ここでは、一例としてASN.1ルールを用いるものとし、上記のステップ2では、ASN.1エンコードルールを適用してXMLデータをバイナリデータに変換するものとする。
そして、ステップ2での符号化処理を行うため、辞書23では、図4に示すように、XMLのタグに用いられるキーワードと、それに対応する16進コードの符号とを変換リスト上に関連付けておく。符号は1バイト又は2バイトとし、辞書23の変換リストは、サーバ装置3における辞書33のものと同一とする。
データ変換部22は、図3(a)に示されるようなXMLデータに対し、タグに用いられているキーワードが辞書23のリストに存在するか否かをチェックし、存在する場合には、そのキーワードを対応する符号に置き換える。図3(a)の例では、XMLデータの最初に出現する「?xml version="1.0" encoding="UTF-8"?」というキーワードを、図4の変換リストの中から探し出し、それに対応する「80」という符号に置き換える。
その他のキーワードも同様に符号に置き換えることにより、図3(b)のようなキーワードを全て符号に置き換えたXMLデータとする。なお、同図において、「&」は16進を示すものとする。以上の符号化処理により、382バイトのデータが163バイトに変換され、その圧縮率は約40%になる。
データ変換部22は、さらに、符号化後のXMLデータを、XML構造からASN.1エンコードルールに基づいたデータ構造に変換し、開始タグ記号、終了タグ記号、改行コードを削除する。参考までに、図5にASN.1エンコードルールに基づくデータ構造の変換例を示す。図5(a)に示すようなXMLデータを、このルールでは図5(b)に示すように、タグ符号と、タグ内のデータサイズ(Length)と、データ(data)の3組で表す。タグ符号は1バイト又は2バイトで表し、データサイズも1バイト又は2バイトで表す。データサイズはASN.1エンコード後のデータのサイズである。
ASN.1エンコードの具体例を図6に示す。図6(a)のような符号化後のXMLデータを、ASN.1エンコードルールに基づいて変換すると図6(b)のようなバイナリデータとなる。同図(a)において、開始タグ記号は「< >」で示され、終了タグ記号は「</ >」で示されており、同図(b)ではこれらが省略されている。また、同図(a)において改行されている部分には図示しない改行コードが挿入されており、これも同図(b)においては省略されている。
この変換では、例えば図6(a)における一行目のタグ「<&80>」は、図6(b)における1バイト目の「&80」と2バイト目の「&18」になる。ここで「&80」はタグ文字に対応する符号コードであり、「&18」は10進数の24に相当し、ASN.1で変換した後のデータサイズが24バイトであることを意味する。同図に示すように163バイトのXMLデータを変換した後は、計26バイトのデータとなる。このように、符号化・バイナリ化したデータを、ここではバイナリデータと呼ぶものとする。
なお、符号と符号でないものとを識別するために、最上位ビットを両者を見分けるフラグとして使用する。ここでは最上位ビットが0であれば、後続はバイナリ化していない文字列やタグ文字以外のデータ部分の文字列であると判定する。最上位ビットが1であれば、可読文字ではないため、符号であると判定する。このとき、残りの7ビットで符号を表現すると、128通りしか対応するキーワードを扱えなくなるので、2バイトでも符号を表現可能とする。そのため、上位2ビット目をLength部が1バイトか2バイトかを見分けるフラグとして使用する。具体的には、1バイト符号と2バイト符号との識別は、図7に示すように1バイト目の上位2ビットが"10"か"11"かで行う。その結果、1バイトで表現された符号は上位が"10"で始まる計64個であり、2バイトで表現された符号は上位が"11"で始まる計16384個となる。識別アルゴリズムの詳細については図8に示す。図8では、Length部の後がdataであるのなら必ず文字となることから、当該部分が文字であれば1ビット目が1になることはなく、よって1ビット目が1であるものはタグ符号として認識して良いし、またタグ符号の後には必ずLength部が来るのでLength部の位置も確定することを前提としている。
続いて、XMLデータの分割処理について説明する。
図2のステップ1において、センサが行う測定内容、送信間隔等の例を示す表を図9に、その測定のタイミングを図10に示す。図9、図10に示すように、各センサは、1つの測定対象データに対して、10msec単位のサンプリング周期で複数回の測定を行い、その平均値、最大値、最小値、変化量平均値、変化量最大値、変化量最小値、ゼロクロス数を計測する。これらの計測値は、センサ内部の記憶装置に記録される。この処理を数秒間隔の測定タイミングで行うものとする。これにより、数秒間隔でセンサに上記計測結果が逐次記録されていく。さらに、測定タイミングよりも長い時間間隔で送信間隔を設定するものとし、送信間隔おきに各センサに記録されている各測定値を纏めてセンサ装置1に送信する。センサ装置1は、この受信した各測定値をXML形式で表現したうえでデータ圧縮転送装置2へ送信する。
センサ装置1が作成するXMLデータの例を図11に示す。このXMLデータでは、関連するデータが離れないように分割位置が定められている。具体的には、センサ装置1は、一まとまりの測定値(average, maximum, minimun, zero_cross等)の後尾に分割可能目印として「<EOF/>」タグを追加する。また、送信間隔の間に蓄積された測定結果を示すデータの開始部分に「<Split>」を挿入し、その終了部分に「</Split>」を挿入する。これら「<EOF/>」、「<Split>」、「</Split>」はXMLデータを分割するための特殊なタグである。
なお、ここでは各センサが上記の高度な処理を行うとしたが、センサを1回の測定毎に測定値を通知するだけの機能を備えたものとし、センサ装置1が上記の計算機能や蓄積機能を備えることとしてもよい。
続いて、図2のステップ3において、データ圧縮転送装置2のスロット作成部26は、符号化・バイナリ化後のバイナリデータのサイズと衛星回線4のスロットのサイズとを比較し、前者の方が後者より小さい場合にはステップ9へ進んでバイナリデータをスロットへ詰め込む。一方、前者の方が後者より大きい場合には、ステップ4へ進む。
ステップ4において、スロット作成部26は、バイナリデータのサイズに圧縮ツールによる圧縮率を乗じた値とスロットのサイズとを比較する。この圧縮ツールは、例えばGZIPに代表される圧縮用のソフトウェアであり、バイナリデータ圧縮部25によって記憶装置に記憶・管理される。その圧縮率については、80%−90%の値になると想定し、ユーザによって事前に登録されるものとする。そして、比較の結果、バイナリデータのサイズに圧縮率を乗じた値がスロットのサイズよりも小さい場合には、ステップ5へ進んで、バイナリデータを圧縮ツールによって圧縮した後、ステップ6へ進む。一方、バイナリデータのサイズに圧縮率を乗じた値がスロットのサイズよりも大きい場合には、ステップ7,8へ進んで、当該バイナリデータの元のXMLデータについて分割の処理を行う。
ステップ6では、スロット作成部26は、圧縮後のバイナリデータとスロットのサイズとを比較し、前者の方が小さい場合にはステップ9へ進んでバイナリデータをスロットへ詰め込む。一方、前者の方が大きい場合には、ステップ7,8へ進んで、当該バイナリデータの元のXMLデータについて分割の処理を行う。
ステップ8では、スロット作成部26は、バイナリデータの元のXMLデータについて、関連するデータが離れないように定められた分割位置に開始タグ記号或いは終了タグ記号を挿入してデータを分割する。そして、上記ステップ1〜9の処理を繰り返させる。
詳細に説明すると、図12(a)に示すように元のXMLデータのサイズが1165バイトであり、符号化・バイナリ化によって100バイトになったとする。ここで、予め登録した圧縮ツールの圧縮率が80%とすると、圧縮後のデータの予測サイズは80バイトであり、スロットのサイズが70バイトであるとすると、分割すべき元のデータサイズは、非圧縮のデータサイズ×スロットサイズ/(圧縮率×バイナリデータサイズ)による算出式で求められ、元のXMLデータを分割によって1165×70/80=1019バイト以下にする必要があると算出できる。
図12(a)のXMLデータは、分割目印である「<EOF/>」が、543バイト目と824バイト目にある。サイズが1019バイトを超えない最大となる目印位置で分割することで、なるべく分割数を減らすようにする観点から、ここでは824バイト目で分割する。この後、分割したXMLデータの前半部分の後段に、XMLデータの「</Split>」以降に表示される終了タグを示す「</GetRes>」「</KVPTransac>」「</Frame>」を付与する。その結果、前半部分の分割データは図12(b)のようになる。また、分割したデータの後半部分に対しては、その前段にXMLデータの「<Split>」以前に表示される開始タグを付与する。その結果、後半部分の分割データは図12(c)のようになる。
なお、圧縮ツールの圧縮率については、前述したように事前に登録しておく他、随時更新してもよい。随時更新する手法としては、バイナリデータ圧縮部25が圧縮率情報として古い値(ここではαとおく)を記憶装置に保持しておき、バイナリデータのサイズ×α≦スロットサイズとなる場合であって実際に圧縮をした結果、バイナリデータのサイズ×α>スロットサイズとなったときに、このαの値を実際の圧縮率の値に更新する。その後、図2のステップ7以降において更新後の圧縮率を用いて分割処理を行うようにする。
サーバ装置3では、データ送受信部31により、データ圧縮転送装置2から送られてきた圧縮されたバイナリデータを受信して記憶装置に一旦記憶させた後、バイナリデータ復元部32により、復元ツールを用いてバイナリデータを復元する。そして、圧縮データ復元部35により、このバイナリデータにASN.1デコードルールを適用して開始タグ記号、終了タグ記号、改行コードを挿入した後、当該データにおける符号を辞書33の変換リストに基づいてキーワードに変換することで、元のデータを復元する。
次に、辞書の学習機能について説明する。これは、サーバ装置3の辞書作成部38が持つ機能である。前提として、図7を用いて説明したように、タグに用いられるキーワードを1バイト又は2バイトの符号で表すものとする。1バイトで表現できる数は64個までであるので、学習の主な処理は、どのキーワードを1バイトで表現し、どのキーワードを2バイトで表現するかを決定することにある。
サーバ装置3では、圧縮されているデータについてはバイナリデータ復元部32及び圧縮データ復元部35により復元してから辞書作成部38へ伝送し、非圧縮のものはそのまま辞書作成部38へ伝送する。すなわち、辞書作成部38には、もとのXMLデータが伝送される。なお、圧縮データ復元部35は、受け取ったデータが圧縮データか非圧縮データかをデータの所定位置のフラグで判別するものとする。
辞書作成部38は、受け取ったデータからキーワードを抽出し、キーワード毎に出現回数を記憶装置に一旦記憶する。そして、出現回数の多いものから順位を付け、上位64位までのキーワードを1バイトの符号で表現すると共に、65位以下のキーワードを2バイトの符号で表現し、これらのキーワードと符号とを対応付けることにより辞書33を作成する。
例えば、図13に示すように、抽出した特定のキーワードについて、24時間毎に出現回数を記録し、現在から24時間以内の出願回数、及びそれ以前に24時間毎に発生した出現の回数を計数し、それぞれに重み付けを行った上で総和を求めることで評価値とする。図13では、出現回数が現在から順に3,2,3,4,4であり、その重みを順に1.0,0.8,0.4,0.2,0.1としたときの評価値が6.0になることを示す。この評価値の高いものから順位を付け、上位64位までを1バイトで表現することとし、65位以下は2バイトで表現する。
図14は、キーワード、その出現回数、符号の対応関係を纏めた変換リストの例を示す。同図では、キーワード「attribData xsi:type="java:java.lang.String"」が64位であり1バイト符号が割り当てられており、キーワード「MagnetSensorAttribute」が65位であり2バイト符号が割り当てられている。そして、同図に示す出現回数が計数された段階で学習を行うと、キーワード「attribData xsi:type="java:java.lang.String"」の評価値は、5×1.0+5×0.8+5×0.6+20×0.4+20×0.2=24であり、キーワード「MagnetSensorAttribute」の評価値は、10×1.0+10×0.8+10×0.6+5×0.4+5×0.2=27となる。この結果、「attribData xsi:type="java:java.lang.String"」は65位となるので2バイト符号である「&C000」に対応付け、一方「MagnetSensorAttribute」は64位となるので1バイト符号である「&BF」に対応付ける。以上の処理によって、両キーワードは順位が逆転することとなり、辞書作成部38は、この情報で辞書33の変換リストを更新する。
また、図14に示すように、新規のキーワード「AAABBBCCCDDD」が出現した場合には、登録後の符号の数が64(1バイト分)+16384(2バイト分)個に達していなければ、最後尾の符号を割り当てる。同図の例では「&C002」を割り当てた状態を示す。なお、登録数が64に満たない場合には、1バイト符号への割り当てを行う。このような評価値の算出を例えば24時間毎に実施する。また、新規のタグを当初から圧縮したい場合には、その符号を変換リストに予め手動で登録してもよい。
辞書作成部38は、この変換リストの変更結果および新規割り当て結果を、辞書管理部34に通知し、辞書管理部34が、キーワードと符号との対応関係を管理する。また、辞書管理部34は、データ送受信部31を介して最新の変換リストを全てのデータ圧縮転送装置2へ通知し、各データ圧縮転送装置2では受け取った変換リストで自己の辞書23を更新する。これにより、各データ圧縮転送装置2とサーバ装置3とで同一の辞書を用いることができる。なお、辞書管理部34は、新たに更新された辞書だけでなく、更新前の辞書についても削除せずに保持しておくようにしてもよい。
次に、サーバ装置3からデータ圧縮転送装置2に対してデータを送信する処理について具体的に説明する。
サーバ装置3のデータ圧縮部37は、辞書作成部38によって辞書33に追加・変更されたキーワードと符号との対応関係を示す変換リストを用いて、データ圧縮転送装置2での圧縮手法と同様にしてXMLデータのキーワードを符号に変換する。そして、データ送受信部31により、変換後のデータと、変換に用いたキーワードおよび符号とを1つに纏めてデータ圧縮転送装置2へ送信する。
サーバ装置3がデータ圧縮転送装置2及びその配下のセンサ装置1に対する制御コマンドを配信する場合には、データ圧縮部37は、制御コマンドについてもセンサ情報と同様にXML形式で表現すると共に、辞書33を用いてキーワードを符号に変換する。そして、データ圧縮部37は、このとき参照したキーワードおよび符号をデータの後尾に付与して一まとめにして、データ送受信部31へ送信する。
サーバ装置3での上記送信処理においては、送信するデータにASN.1エンコードルールのデータ構造を適用してバイナリ化し、圧縮ツールを用いて圧縮したものを用いるものとする。
図15(a)は、このとき適用したキーワードの符号変換の例を示すデータであり、同図(b)は一まとめにしたデータの構造例を示す。図15(a)に示すようにデータはXML形式であり、同図(b)に示すように、XMLタグ「<XMLbody>」と「</XMLbody>」の間に圧縮した制御コマンドを挿入し、XMLタグ「<KeywordRule>」と「</KeywordRule>」の間に参照した変換リスト或いは前回送信した辞書内容との差分を挿入する。図15(c)は、「<KeywordRule>」と「</KeywordRule>」の間に挿入された辞書情報の具体例を示す。
図1において、サーバ装置3のデータ送受信部31がデータを送信すると、データ圧縮転送装置2のデータ送受信部27がこれを受信して記憶装置に一旦記憶させる。そして、受信したデータを圧縮データ復元部28に伝送する。圧縮データ復元部28は、まずデータが圧縮ツールで圧縮されたものである場合には、復元ツールを用いて復元する。そして、図15(C)に示すデータのうち「<KeywordRule>」と「</KeywordRule>」の間に挿入された情報を辞書管理部24へ伝送する。
辞書管理部24は、受け取ったデータに示される「<record>」タグ内に記述された「<key>」タグ内に示される符号と、「<char>」タグ内に示されるキーワードの文字列とを抽出して辞書23に記録する。この処理によって、辞書23の変換リストを更新する。
辞書の更新処理が終了した後、圧縮データ復元部28は、辞書23を参照して、受け取ったデータの「<XMLbody>」と「</XMLbody>」の間に挿入されたデータを元のXMLデータに復元する。図16(C)に圧縮された制御コマンドの例を、図16(d)に復元された制御コマンドの例をそれぞれ示す。なお、図16(a)は復元対象のデータの構造例を示す図であり、図16(b)はその辞書部分の情報を示す図である。
したがって、本実施の形態によれば、データ圧縮転送装置2において、データのタグに用いられるキーワードを符号に変換するという1段階目の圧縮をした後、更にASN.1エンコードルールのデータ構造を適用して開始タグ記号、終了タグ記号、改行コードを削除するという2段階目の圧縮をすることで、高い圧縮率を実現することができる。これを衛星回線を使った災害情報や環境情報を監視するシステムに適用することによって、全国数千箇所にゲートウェイ装置を設置し、各ゲートウェイ装置に多種多様なセンサを100個程度取り付け、各ゲートウェイ装置に割り当てられた衛星回線帯域が1kbps程度であっても、センサ情報のようなサイズが小さいタグ付きフォーマットのデータを1/10程度に圧縮することが可能となる。
本実施の形態によれば、データ圧縮転送装置2において、データを分割する必要がある場合に、関連するデータが離れないように定められた分割位置に開始タグ記号と終了タグ記号を挿入することで、各々の分割されたデータを1つの完成されたデータとして成立させることができ、受信側では全ての分割されたデータを回収しなくともデータを処理することができる。
本実施の形態によれば、サーバ装置3の辞書作成部38により、キーワード毎に出現回数が多いものから順位を付け、上位64位までのキーワードを1バイトの符号で表現し、65位以下のキーワードを2バイトの符号で表現する。これによって、出現頻度の高いキーワードから順に符号を割り当てることができ、新たなキーワードが追加された場合に、それに対応する符号を自動的に辞書に登録することができる。
本実施の形態によれば、サーバ装置3により、追加・変更したキーワード及び符号を用いて変換した後のデータと、そのキーワード及び符号とを一まとめにしてデータ圧縮転送装置2に送信し、データ圧縮転送装置2において、受信したキーワードおよび符号を用いて辞書を更新することで、データ圧縮転送装置2ではサーバ装置3のものと同一の最新の辞書を用いることができる。また、データ圧縮転送装置2において、サーバ装置3から受信したデータを更新後の辞書を用いて復元することで、制御コマンドや通信スケジュール等の様々な情報を利用することができる。
特に、制御コマンドを送信するタイミングで、その辞書に用いるキーワードおよび符号を一まとめにして送信することで、通信回数を低減できると共に、制御コマンドを圧縮/復元する際の不一致を回避することができる。
一実施の形態におけるデータ圧縮転送システムの構成を示すブロック図である。 データ圧縮転送装置における処理の流れを示すフローチャートである。 同図(a)は符号化前のXMLデータの例を示し、同図(b)はXMLデータのキーワードを辞書を用いて符号化したデータの例を示す。 XMLのタグに用いるキーワードと符号とを関連付けた変換リストの例を示す図である。 XML構造をASN.1エンコードルールに基づいたデータ構造に変換する変換例を示す図である。 同図(a)は符号化後のXMLデータの例を示し、同図(b)は符号化後のXMLデータにASN.1エンコードルールを適用して更に圧縮したデータの例を示す。 1バイト符号と2バイト符号を識別するためのフラグを示す図である。 1バイト符号と2バイト符号を識別するためのアルゴリズムを示す図である。 センサによる測定内容、送信間隔等を示す表である。 センサによる測定のタイミングを示す図である。 センサが測定した値をXML形式で表現したデータの例を示す図である。 XMLデータを分割する例を示す図であり、同図(a)は分割前、同図(b),(c)は分割後のXMLデータを示す。 辞書学習における評価値の算出例を示す図である。 辞書に用いるキーワード、出現回数、符号の対応関係を纏めた変換リストの例を示す図である。 同図(a)は、サーバ装置から送信するデータについてのキーワードの符号変換の例、同図(b)は一まとめにしたデータの構造例、同図(c)は一まとめにしたデータのうちの辞書情報部分の例を示す。 同図(a)は復元対象のデータの構造例、同図(b)はその辞書部分の例、同図(C)は圧縮された制御コマンドの例、同図(d)は復元された制御コマンドの例をそれぞれ示す図である。
符号の説明
1…センサ装置
1a,1b,1c…センサ
2…データ圧縮転送装置
3…サーバ装置
4…衛星回線
21…センサ接続部
22…データ変換部
23…辞書
24…辞書管理部
25…バイナリデータ圧縮部
26…スロット作成部
27…データ送受信部
28…圧縮データ復元部
29…制御コマンド処理部
31…データ送受信部
32…バイナリデータ復元部
33…辞書
34…辞書管理部
35…圧縮データ復元部
36…データ生成・解析部
37…データ圧縮部
38…辞書作成部

Claims (6)

  1. タグ付きフォーマットのデータを格納しておく格納手段と、
    前記データのタグに用いられるキーワードとそれに対応する符号とを関連付けた辞書を記憶しておく記憶手段と、
    前記格納手段から前記データを読み出して、当該データにおけるキーワードを前記辞書に基づいて符号に変換し、変換後のデータに開始タグ記号及び終了タグ記号並びに改行コードが不要なデータ構造を定義する情報構造定義ルールを適用して開始タグ記号、終了タグ記号、改行コードを削除してバイナリデータとするデータ変換手段と、
    前記バイナリデータをサーバ装置へネットワークを介して送信する送信手段と、
    バイナリデータを圧縮する圧縮ツール及びその圧縮率を記憶しておく記憶手段と、
    前記バイナリデータのサイズが前記ネットワークのスロットのサイズよりも大きい場合、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも小さいときには前記バイナリデータを前記圧縮ツールによって圧縮し、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも大きいときには、当該バイナリデータの元のデータについて、関連するデータが離れないように定められた分割位置に開始タグ記号或いは終了タグ記号を挿入してデータを分割する分割手段と、
    当該分割後のデータについて前記データ変換手段および前記分割手段による処理を繰り返させる繰返手段と、を有し、
    前記送信手段は、前記繰返手段によって処理されたバイナリデータを送信すること
    を特徴とするデータ圧縮転送装置。
  2. ネットワークを介して相互に通信可能なデータ圧縮転送装置とサーバ装置とを備えたデータ圧縮転送システムであって、
    前記データ圧縮転送装置は、
    タグ付きフォーマットデータを格納しておく第1格納手段と、
    前記データのタグに用いられるキーワードと対応する符号とを関連付けた辞書を記憶しておく第1記憶手段と、
    前記第1格納手段から前記データを読み出し、当該データにおけるキーワードを前記辞書に基づいて符号に変換し、変換後のデータに開始タグ記号及び終了タグ記号並びに改行コードが不要なデータ構造を定義する情報構造定義ルールを適用し開始タグ記号、終了タグ記号、改行コードを削除してバイナリデータとするデータ変換手段と、
    前記バイナリデータをサーバ装置へネットワークを介して送信する送信手段と、
    バイナリデータを圧縮する圧縮ツール及びその圧縮率を記憶しておく記憶手段と、
    前記バイナリデータのサイズが前記ネットワークのスロットのサイズよりも大きい場合、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも小さいときには前記バイナリデータを前記圧縮ツールによって圧縮し、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも大きいときには、当該バイナリデータの元のデータについて、関連するデータが離れないように定められた分割位置に開始タグ記号或いは終了タグ記号を挿入してデータを分割する分割手段と、
    当該分割後のデータについて前記データ変換手段および前記分割手段による処理を繰り返させる繰返手段と、を有し、
    前記送信手段は、前記繰返手段によって処理されたバイナリデータを送信し
    前記サーバ装置は、
    前記データのタグに用いられるキーワードとそれに対応する符号とを関連付けた辞書を記憶しておく第2記憶手段と、
    前記データ圧縮転送装置からバイナリデータを受信して第2格納手段に格納させる受信手段と、
    前記第2格納手段から前記バイナリデータを読み出し、当該バイナリデータに情報構造定義ルールを適用して開始タグ記号、終了タグ記号、改行コードを挿入し、当該データにおける符号を前記辞書に基づいてキーワードに変換することで元のデータを復元する復元手段と、
    を有することを特徴とするデータ圧縮転送システム。
  3. 前記サーバ装置は、
    前記データからキーワードを抽出し、キーワード毎に出現回数を記録手段に記録すると共に、出現回数の多いものから順位を付け、上位64位までのキーワードを1バイトの符号で表現すると共に、65位以下のキーワードを2バイトの符号で表現することにより前記辞書を作成する辞書作成手段を有することを特徴とする請求項2記載のデータ圧縮転送システム。
  4. 前記サーバ装置は、
    前記辞書作成手段によって追加・変更したキーワードおよびそれに対応する符号を用いて前記データのキーワードを符号に変換する変換手段と、
    当該変換後のデータと当該変換に用いたキーワードおよび符号とを一まとめにして前記データ圧縮転送装置へ送信する送信手段と、を有し、
    前記データ圧縮転送装置は、
    前記サーバ装置から受信した前記キーワードおよび符号を用いて前記辞書を更新する更新手段と、
    前記サーバ装置から受信したデータを更新後の辞書を用いて復元する復元手段と、
    を有することを特徴とする請求項3記載のデータ圧縮転送システム。
  5. データ圧縮転送装置により、
    タグ付きフォーマットのデータを格納手段に格納しておくステップと、
    前記格納手段から前記データを読み出して、前記データのタグに用いられるキーワードとそれに対応する符号とを関連付けた辞書に基づいて、当該データにおけるキーワードを符号に変換し、変換後のデータに開始タグ記号及び終了タグ記号並びに改行コードが不要なデータ構造を定義する情報構造定義ルールを適用し開始タグ記号、終了タグ記号、改行コードを削除してバイナリデータとするデータ変換ステップと、
    バイナリデータを圧縮する圧縮ツール及びその圧縮率を記憶しておく記憶ステップと、
    前記バイナリデータのサイズがネットワークのスロットのサイズよりも大きい場合、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも小さいときには前記バイナリデータを前記圧縮ツールによって圧縮し、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも大きいときには、当該バイナリデータの元のデータについて、関連するデータが離れないように定められた分割位置に開始タグ記号或いは終了タグ記号を挿入してデータを分割する分割ステップと、
    当該分割後のデータについて前記データ変換ステップおよび前記分割ステップによる処理を繰り返させる繰返ステップと、
    前記バイナリデータをサーバ装置へネットワークを介して送信する送信ステップと、
    を有することを特徴とするデータ圧縮転送方法。
  6. データ圧縮転送装置に対して、
    タグ付きフォーマットのデータを格納手段に格納させるステップと、
    前記格納手段から前記データを読み出して、前記データのタグに用いられるキーワードとそれに対応する符号とを関連付けた辞書に基づいて、当該データにおけるキーワードを符号に変換し、変換後のデータに開始タグ記号及び終了タグ記号並びに改行コードが不要なデータ構造を定義する情報構造定義ルールを適用して開始タグ記号、終了タグ記号、改行コードを削除してバイナリデータとするデータ変換ステップと、
    バイナリデータを圧縮する圧縮ツール及びその圧縮率を記憶しておく記憶ステップと、
    前記バイナリデータのサイズがネットワークのスロットのサイズよりも大きい場合、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも小さいときには前記バイナリデータを前記圧縮ツールによって圧縮し、前記バイナリデータのサイズに前記圧縮率を乗じた値が前記スロットのサイズよりも大きいときには、当該バイナリデータの元のデータについて、関連するデータが離れないように定められた分割位置に開始タグ記号或いは終了タグ記号を挿入してデータを分割する分割ステップと、
    当該分割後のデータについて前記データ変換ステップおよび前記分割ステップによる処理を繰り返させる繰返ステップと、
    前記バイナリデータをサーバ装置へネットワークを介して送信するステップと、
    を実行させること特徴とするデータ圧縮転送プログラム。
JP2007051546A 2007-03-01 2007-03-01 データ圧縮転送装置、データ圧縮転送システム、データ圧縮転送方法、およびデータ圧縮転送プログラム Active JP4756003B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007051546A JP4756003B2 (ja) 2007-03-01 2007-03-01 データ圧縮転送装置、データ圧縮転送システム、データ圧縮転送方法、およびデータ圧縮転送プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007051546A JP4756003B2 (ja) 2007-03-01 2007-03-01 データ圧縮転送装置、データ圧縮転送システム、データ圧縮転送方法、およびデータ圧縮転送プログラム

Publications (2)

Publication Number Publication Date
JP2008219264A JP2008219264A (ja) 2008-09-18
JP4756003B2 true JP4756003B2 (ja) 2011-08-24

Family

ID=39838812

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007051546A Active JP4756003B2 (ja) 2007-03-01 2007-03-01 データ圧縮転送装置、データ圧縮転送システム、データ圧縮転送方法、およびデータ圧縮転送プログラム

Country Status (1)

Country Link
JP (1) JP4756003B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101654571B1 (ko) 2010-07-21 2016-09-06 삼성전자주식회사 데이터 전송 장치 및 방법
EP2807819A4 (en) * 2012-01-23 2015-08-05 Fourthwall Media Inc SYSTEMS AND METHOD FOR USER EVENT DATA REDUCTION
JP6540306B2 (ja) * 2015-07-13 2019-07-10 富士通株式会社 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法および復号化装置
CN111782660A (zh) * 2020-07-17 2020-10-16 支付宝(杭州)信息技术有限公司 基于键值存储的数据压缩的方法和系统
CN117195005B (zh) * 2023-11-03 2024-01-26 山东四季车网络科技有限公司 基于智慧洗车的信息数据管理系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61232724A (ja) * 1985-04-08 1986-10-17 Nippon Denki Off Syst Kk 文字コ−ドデ−タの圧縮方式
JPH06202845A (ja) * 1993-01-05 1994-07-22 Nec Corp 伝送データ圧縮方法および装置
JP2001067348A (ja) * 1999-06-21 2001-03-16 Fujitsu Ltd 構造化文書の圧縮方法および圧縮装置並びに構造化文書圧縮プログラムを記録したコンピュータ読取可能な記録媒体
JP4774145B2 (ja) * 2000-11-24 2011-09-14 富士通株式会社 構造化文書圧縮装置および構造化文書復元装置並びに構造化文書処理システム
JP4163870B2 (ja) * 2001-12-28 2008-10-08 富士通株式会社 構造化文書変換装置
JP2004258773A (ja) * 2003-02-24 2004-09-16 Mitsubishi Electric Corp 文書圧縮装置及び文書復元装置
JP2005018672A (ja) * 2003-06-30 2005-01-20 Hitachi Ltd 構造化文書の圧縮方法
JP4261299B2 (ja) * 2003-09-19 2009-04-30 株式会社エヌ・ティ・ティ・ドコモ データ圧縮装置、データ復元装置およびデータ管理装置
JP4394964B2 (ja) * 2004-01-13 2010-01-06 株式会社エヌ・ティ・ティ・ドコモ データ圧縮装置、データ復元装置、テンプレート生成装置およびデータ圧縮システム
JP4548184B2 (ja) * 2005-03-31 2010-09-22 富士通株式会社 圧縮規則生成方法、圧縮通信装置及びプログラム

Also Published As

Publication number Publication date
JP2008219264A (ja) 2008-09-18

Similar Documents

Publication Publication Date Title
CN1968254B (zh) 确定是否要压缩通过网络传送的数据的方法和系统
US7043686B1 (en) Data compression apparatus, database system, data communication system, data compression method, storage medium and program transmission apparatus
CN101277117B (zh) 增量和连续的数据压缩方法和设备
JP5187532B2 (ja) データ収集システム、データ収集方法、およびデータ収集プログラム
US10469101B2 (en) Log collection device, log generation device, and log collection method
JP4756003B2 (ja) データ圧縮転送装置、データ圧縮転送システム、データ圧縮転送方法、およびデータ圧縮転送プログラム
US11748335B2 (en) Maintaining consistency of data between computing nodes of a distributed computer architecture
CN103379140B (zh) 一种日志处理规则同步方法及相关设备和系统
CN113312325B (zh) 轨迹数据传输方法、装置、设备及存储介质
US20130198272A1 (en) Operation log storage system, device, and program
CN101178709A (zh) 日志记录系统和方法
CN102571966A (zh) 一种大型xml文件的网络传输方法
CN113094346A (zh) 基于时间序列的大数据编解码方法及装置
CN107623728B (zh) 基于产品接口控制文件的fc-ae-asm数据通用解析方法
EP1990737B1 (en) Document transformation system
CN113810489A (zh) 一种工业互联网控制系统及方法
JP2007520112A (ja) Xmlファイルのための迅速にクエリ可能なデータ圧縮フォーマット
US20140013007A1 (en) Access log management method
JP4261299B2 (ja) データ圧縮装置、データ復元装置およびデータ管理装置
CN114614829A (zh) 卫星数据帧的处理方法、装置、电子设备和可读存储介质
CN117221354A (zh) 多源异构数据实时采集、存储与分析方法及系统
CN111866520A (zh) 编解码方法、编解码设备以及通信系统
JP4205603B2 (ja) 可変長マルチフォーマット変換装置及び方法並びにこれを用いたファイル転送システム
Bedekar et al. Energy Conserving Techniques of Data Mining for Wireless Sensor Networks—A Review
JP4451722B2 (ja) データベースサーバ及びデータベースシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110524

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110530

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4756003

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250