JP2007286672A - データ圧縮/復元システム、データ圧縮装置、データ復元装置、及びプログラム - Google Patents

データ圧縮/復元システム、データ圧縮装置、データ復元装置、及びプログラム Download PDF

Info

Publication number
JP2007286672A
JP2007286672A JP2006109876A JP2006109876A JP2007286672A JP 2007286672 A JP2007286672 A JP 2007286672A JP 2006109876 A JP2006109876 A JP 2006109876A JP 2006109876 A JP2006109876 A JP 2006109876A JP 2007286672 A JP2007286672 A JP 2007286672A
Authority
JP
Japan
Prior art keywords
data
compression
computer
receiving
decompression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006109876A
Other languages
English (en)
Other versions
JP4446102B2 (ja
Inventor
Hideki Kirihara
英樹 桐原
Akihiro Yamauchi
昭宏 山内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JFE Steel Corp
Exa Corp
Original Assignee
JFE Steel Corp
Exa Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JFE Steel Corp, Exa Corp filed Critical JFE Steel Corp
Priority to JP2006109876A priority Critical patent/JP4446102B2/ja
Publication of JP2007286672A publication Critical patent/JP2007286672A/ja
Application granted granted Critical
Publication of JP4446102B2 publication Critical patent/JP4446102B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】文字コード体系の異なるコンピュータ間でランレングス法により圧縮処理されたデータを伝送する場合に、当該コンピュータを利用する処理全体の効率化を図ること。
【解決手段】送信側コンピュータ10と、受信側コンピュータ20とから構成されるデータ圧縮/復元システムであって、送信側コンピュータ10に、送信されるデータをランレングス法により圧縮する圧縮処理部12と、圧縮されたデータを受信側コンピュータ20に向けて送信する送信部16とを備えている。受信側コンピュータ20に、送信されたデータを受信する受信部22と、受信されたデータのデータ形式を、受信側コンピュータ20で認識可能なデータ形式に変換する文字コード変換処理部24と、データ形式が変換されたデータのうち、ランレングス法により圧縮された箇所を復元する復元処理部26とを備える。
【選択図】図1

Description

本発明は、異なる文字コードを用いるコンピュータ間でのデータ伝送に適用されるデータ圧縮/復元システム、データ圧縮装置、データ復元装置、及びプログラムに関する。
近年、ローカル・エリア・ネットワーク(LAN:Local Area Network)およびインターネット(Internet)等の発達により、ネットワークを介してコンピュータを接続し、データを伝送することが一般的なものとなっている。そして、伝送するデータの容量は、システム化およびネットワーク化の進展により増加の一途をたどっている。
ネットワークを介して大量のデータを伝送する場合には、ネットワークの負荷低減、及びデータ伝送に要する時間の短縮のために、通常、データを圧縮処理する技術が用いられる。
この種の、データ圧縮処理方法として、同一文字が連続している場合、その出現回数を示す数字を併記して全体量を減らすランレングス符号化(run-length coding)と言われる方法がある。この方法によれば、例えば図8に示すように、「AAAAAA」という文字列を「Aが6つある」という意味の「A6」という符号で、「BBBB」という文字列を「Bが4つある」という意味の「B4」という符号で置き換えることにより、意味を保ったまま10文字を4文字にすることができ、容量を2/5に圧縮することが可能となる。ここでは、このような圧縮処理方法を、「ランレングス法によるモノキャラクターフィールド圧縮」と称する。
また、その他のデータ圧縮処理方法として、ファイルのレコード前後間の重複部分を圧縮する方法がある。これは、現在処理している一つ前のレコードと比較して、同一部分があればこれを圧縮処理するものである。例えば図9に示すように、1件目のレコードが「ABCDEF|AAAAAA|DBCD」であり、2件目のレコードが「ABCDEF|BBBBBBB|HIJK」である場合、2件目のレコードにある「ABCDEF」は、1件目のレコードと同一部分であるので、2件目のレコードにある「ABCDEF」の部分を、例えば「A〜F」のような圧縮データに置き換える。なお、1件目のレコードにある「AAAAAA」、及び2件目のレコードにある「BBBBBB」は上述したように「A6」、及び「B6」とそれぞれ置き換えられることにより圧縮される。「A〜F」のような圧縮データに置き換えられた部分を、元の状態に戻す場合には、一つ前の重複しているレコード部分、すなわち「ABCDEF」をコピーし、このコピーされた「ABCDEF」と置き換える。
このような圧縮方法を、ここでは「ランレングス法によるコピーフィールド圧縮」と称し、この圧縮もまたランレングス法に含まれるものと解釈する。尚、単に「ランレングス法」という場合には、モノキャラクターフィールド圧縮、及びコピーフィールド圧縮を総称するものとする。
圧縮処理されたデータは、伝送後、受信側コンピュータでの処理に利用できるようにするため、圧縮処理されていない元のデータに復元する必要がある。この処理は一般に、「解凍」、「展開」、「伸張」、「減圧」又は「抽出」等と呼ばれている。すなわち、圧縮データをネットワークを介して伝送する場合には、圧縮−伝送−復元という処理手順を踏む(特許文献1参照)。この一連の処理は、文字コード体系の同じコンピュータ間でデータを伝送する場合に適用される。
一方、文字コード体系の異なるコンピュータ間でデータを伝送する場合には、上記の一連の処理に加え、送信側コンピュータのデータ形式を、受信側コンピュータで認識可能なデータ形式に変換する文字コード変換処理が必要となる。その処理方法には、圧縮データの送信前、又は受信後にデータ形式を受信側コンピュータで認識可能な文字コードに変換処理する技術(特許文献2)、文字コード変換処理機能を有するコンピュータをネットワークに接続し、当該コンピュータを介してデータ伝送を行う技術(特許文献3)がある。
以上のように、文字コード体系の異なるコンピュータ間で大量のデータを伝送する場合には、図8に示すように、圧縮―伝送―復元―文字コード変換という処理手順(処理手順1)を踏むか、又は図10に示すように、文字コード変換―圧縮―伝送―復元という処理手順(処理手順2)を踏んで行われている。
図11は、処理手順1を実現する装置構成例を示す機能ブロック図であり、送信側コンピュータ50には、送信されるデータが格納されたデータベース52と、データベース52に格納されたデータを圧縮処理する圧縮処理部54と、圧縮処理部54によって圧縮処理されたデータを受信側コンピュータ60に向けて送信する送信部56とが備えられている。そして、受信側コンピュータ60には、送信部56から送信されたデータを受信する受信部62と、受信部62によって受信されたデータを復元処理する復元処理部64と、復元処理部64によって復元処理されたデータを、受信側コンピュータ60で認識可能な文字コードに変換する文字コード変換処理部66と、文字コード変換処理部66によって文字コードが変換されたデータを格納するデータベース68とが備えられている。
また、図12は、処理手順2を実現する装置構成例を示す機能ブロック図であり、図11では受信側コンピュータ60に備えられていた文字コード変換処理部66が、送信側コンピュータ50のデータベース52と圧縮処理部54との間に備えられている。
特公平4−53328号公報(発明の詳細な説明) 特許第2604507号公報([0012]、図1、[0003]〜[0010]、図3) 特許第3670303号公報(請求項1)
しかしながら、特許文献2の技術では、送信側コンピュータ50において圧縮データを作成処理する前に、または受信側コンピュータ60において圧縮データを復元処理した後に、全てのデータが文字コード変換処理される。したがって、大量のデータを伝送する場合には、文字コード変換処理を行うコンピュータの負荷が増加し、当該コンピュータのその後の処理または他の処理の遅延を招くこととなる。
一方、特許文献3の技術では、ネットワークを介して、送信側コンピュータ50と文字コード変換処理を行うコンピュータ、及び文字コード変換処理を行うコンピュータと受信側コンピュータ60の間で二度に亘ってデータが伝送される。しかも、当該文献の記載からは、これらのコンピュータ間で伝送されるデータは、圧縮処理されていないと推認される。
したがって、大量のデータを伝送する場合にはネットワークの負荷が増大し、当該ネットワークを利用してデータを伝送する全てのコンピュータの処理の遅延を招くことになる。また、仮に、伝送するデータが圧縮処理されているものであったとしても、二度に亘るデータ伝送によるネットワークの負荷増大は免れえず、程度の差こそあれ、圧縮処理されていないデータを伝送する場合と同様の結果を招くこととなる。
本発明はこのような事情に鑑みてなされたものであり、文字コード体系の異なるコンピュータ間でランレングス法により圧縮処理されたデータを伝送する場合に、文字コード変換処理を行うコンピュータの負荷を軽減することにより当該コンピュータにおけるその後の処理の遅延を防止し、もって、当該コンピュータを利用する処理全体の効率化を図ることが可能なデータ圧縮/復元システム、データ圧縮装置、データ復元装置、及びプログラムを提供することを目的とする。
上記の目的を達成するために、本発明では、以下のような手段を講じる。
すなわち、請求項1の発明は、送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムであって、送信側コンピュータに、送信されるデータをランレングス法により圧縮する圧縮手段と、圧縮手段により圧縮されたデータを受信側コンピュータに向けて送信する送信手段とを備えている。また、受信側コンピュータに、送信手段により送信されたデータを受信する受信手段と、受信手段によって受信されたデータのデータ形式を、受信側コンピュータで認識可能なデータ形式に変換する変換手段と、変換手段によってデータ形式が変換されたデータのうち、ランレングス法により圧縮された箇所を復元する復元手段とを備えている。
請求項2の発明は、請求項1の発明のデータ圧縮/復元システムにおいて、送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、圧縮手段は、連続するレコードのうち、最初のレコード以外のレコードに含まれる同一部分を圧縮する。そして、受信側コンピュータに更に、変換手段によってデータ形式が変換されたデータのうち、同一部分に対応する部分を、最初のレコードにおいて変換された同一部分に対応する部分のコピーで上書きする上書手段を備える。
請求項3の発明は、送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムに適用され、送信側コンピュータに備えられるデータ圧縮装置であって、送信されるデータをランレングス法により圧縮する圧縮手段と、圧縮手段により圧縮されたデータを受信側コンピュータに向けて送信する送信手段とを備えている。そして、送信されたデータは、受信側コンピュータによって、受信され、受信側コンピュータで認識可能なデータ形式に変換され、しかる後に、ランレングス法により圧縮された箇所が復元される。
請求項4の発明は、請求項3の発明のデータ圧縮装置において、送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、圧縮手段は、連続するレコードのうち、最初のレコード以外のレコードに含まれる同一部分を圧縮する。そして、送信されたデータは、データ形式が変換されたデータのうち、同一部分に対応する部分が、最初のレコードにおいて変換された同一部分に対応する部分のコピーで上書きされる。
請求項5の発明は、送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムに適用され、受信側コンピュータに備えられるデータ復元装置であって、送信側コンピュータによって、ランレングス法により圧縮され、しかる後に受信側コンピュータに向けて送信されたデータを受信する受信手段と、受信手段によって受信されたデータのデータ形式を、受信側コンピュータで認識可能なデータ形式に変換する変換手段と、変換手段によってデータ形式が変換されたデータのうち、ランレングス法により圧縮された箇所を復元する復元手段とを備えている。
請求項6の発明は、請求項5の発明のデータ復元装置において、送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、受信手段によって受信されるデータは、連続するレコードのうち、最初のレコード以外のレコードに含まれる同一部分が圧縮されている。そして、変換手段によってデータ形式が変換されたデータのうち、同一部分に対応する部分を、最初のレコードにおいて変換された同一部分に対応する部分のコピーで上書きする上書手段を更に備えている。
請求項7の発明は、送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムであって、送信側コンピュータに、送信されるデータをランレングス法により圧縮する圧縮手段と、圧縮手段により圧縮されたデータのデータ形式を、受信側コンピュータで認識可能なデータ形式に変換する変換手段と、データ形式が変換されたデータを、受信側コンピュータに向けて送信する送信手段とを備えている。そして、受信側コンピュータに、送信手段により送信されたデータを受信する受信手段と、受信手段によって受信されたデータのうち、ランレングス法により圧縮された箇所を復元する復元手段とを備えている。
請求項8の発明は、請求項7の発明のデータ圧縮/復元システムにおいて、送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、圧縮手段は、連続するレコードのうち、最初のレコード以外のレコードに含まれる同一部分を圧縮する。そして、受信側コンピュータに更に、変換手段によってデータ形式が変換された後に受信手段によって受信されたデータのうち、同一部分に対応する部分を、最初のレコードにおいて変換された同一部分に対応する部分のコピーで上書きする上書手段を備えている。
請求項9の発明は、送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムに適用され、送信側コンピュータに備えられるデータ圧縮装置であって、送信されるデータをランレングス法により圧縮する圧縮手段と、圧縮手段により圧縮されたデータのデータ形式を、受信側コンピュータで認識可能なデータ形式に変換する変換手段と、データ形式が変換されたデータを、受信側コンピュータに向けて送信する送信手段とを備えている。そして、送信されたデータが、受信側コンピュータによって、受信され、ランレングス法により圧縮された箇所が復元される。
請求項10の発明は、請求項9の発明のデータ圧縮装置において、送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、圧縮手段は、連続するレコードのうち、最初のレコード以外のレコードに含まれる同一部分を圧縮し、送信されたデータは、データ形式が変換されたデータのうち、同一部分に対応する部分が、最初のレコードにおいて変換された同一部分に対応する部分のコピーで上書きされる。
請求項11の発明は、送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムに適用され、受信側コンピュータに備えられるデータ復元装置であって、送信側コンピュータによって、ランレングス法により圧縮され、圧縮されたデータのデータ形式が、受信側コンピュータで認識可能なデータ形式に変換され、しかる後に受信側コンピュータに向けて送信されたデータを受信する受信手段と、受信手段によって受信されたデータのうち、ランレングス法により圧縮された箇所を復元する復元手段とを備えている。
請求項12の発明は、請求項11の発明のデータ復元装置において、送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、受信手段によって受信されるデータは、連続するレコードのうち、最初のレコード以外のレコードに含まれる同一部分が圧縮されている。そして、受信手段によって受信されたデータのうち、同一部分に対応する部分を、最初のレコードにおいて変換された同一部分に対応する部分のコピーで上書きする上書手段を更に備えている。
請求項13の発明は、送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムに適用されるデータ圧縮/復元プログラムであって、送信されるデータをランレングス法により圧縮する機能、圧縮されたデータを受信側コンピュータに向けて送信する機能を送信側コンピュータに実現させるためのデータ圧縮プログラムと、送信されたデータを受信する機能、受信されたデータのデータ形式を、受信側コンピュータで認識可能なデータ形式に変換する機能、データ形式が変換されたデータのうち、ランレングス法により圧縮された箇所を復元する機能を受信側コンピュータに実現させるためのデータ復元プログラムとからなる。
請求項14の発明は、請求項13の発明のデータ圧縮/復元プログラムにおいて、データ圧縮プログラムは、送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、連続するレコードのうち、最初のレコード以外のレコードに含まれる同一部分を圧縮する機能を更に送信側コンピュータに実現させる。また、データ復元プログラムは、データ形式が変換されたデータのうち、同一部分に対応する部分を、最初のレコードにおいて変換された同一部分に対応する部分のコピーで上書きする機能を更に受信側コンピュータに実現させる。
請求項15の発明は、送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムに適用されるデータ圧縮/復元プログラムであって、送信されるデータをランレングス法により圧縮する機能、圧縮されたデータのデータ形式を、受信側コンピュータで認識可能なデータ形式に変換する機能、データ形式が変換されたデータを、受信側コンピュータに向けて送信する機能を送信側コンピュータに実現させるためのデータ圧縮プログラムと、送信されたデータを受信する機能、受信されたデータのうち、ランレングス法により圧縮された箇所を復元する機能を受信側コンピュータに実現させるためのデータ復元プログラムとからなる。
請求項16の発明は、請求項15の発明のデータ圧縮/復元プログラムにおいて、データ圧縮プログラムは、送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、連続するレコードのうち、最初のレコード以外のレコードに含まれる同一部分を圧縮する機能を更に送信側コンピュータに実現させる。また、データ復元プログラムは、データ形式が変換された後に受信されたデータのうち、同一部分に対応する部分を、最初のレコードにおいて変換された同一部分に対応する部分のコピーで上書きする機能を更に受信側コンピュータに実現させる。
請求項17の発明は、請求項13乃至16のうち何れか1項の発明のデータ圧縮/復元プログラムにおけるデータ圧縮プログラムである。
請求項18の発明は、請求項13乃至16のうち何れか1項の発明のデータ圧縮/復元プログラムにおけるデータ復元プログラムである。
本発明によれば、文字コード体系の異なるコンピュータ間でランレングス法により圧縮処理されたデータを伝送する場合に、文字コード変換処理を行うコンピュータの負荷を軽減することにより当該コンピュータにおけるその後の処理の遅延を防止することができる。
以上により、当該コンピュータを利用する処理全体の効率化を図ることが可能なデータ圧縮/復元システム、データ圧縮装置、データ復元装置、及びプログラムを実現することができる。
以下に、本発明を実施するための最良の形態について図面を参照しながら説明する。
(第1の実施の形態)
図1は、第1の実施の形態に係るデータ圧縮/復元システムの構成例を示す機能ブロック図である。
すなわち、本実施の形態に係るデータ圧縮/復元システムは、データ圧縮プログラムがインストールされ、データ圧縮装置として動作する送信側コンピュータ10と、データ復元プログラムがインストールされ、データ復元装置として動作する受信側コンピュータ20とから構成されるデータ圧縮/復元システムである。
送信側コンピュータ10は、送信されるデータを格納する、ハードディスク等のハードウェアからなるデータベース12を備えている。また、データ圧縮プログラムによって、送信されるデータをデータベース12より取り出し、取り出したデータをランレングス法により圧縮する圧縮処理部14と、圧縮処理部14により圧縮されたデータを受信側コンピュータ20に向けて送信する送信部16とが構築されている。
なお、圧縮処理部14は、図2に示すように、送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、上記圧縮に加えて、連続するレコードのうち、最初のレコード以外のレコードに含まれる同一部分を圧縮する。図2の場合、送信されるデータが2つのレコードからなり、連続している1件目のレコードと、2件目のレコードとに同一部分「ABCDEF」が含まれているので、最初のレコード以外のレコードである2件目のレコードに含まれる同一部分「ABCDEF」を「A〜F」のように圧縮する。
また、受信側コンピュータ20には、データ復元プログラムによって、送信部16により送信されたデータを受信する受信部22と、受信部22によって受信されたデータのデータ形式を、受信側コンピュータ20で認識可能なデータ形式に変換する文字コード変換処理部24と、文字コード変換処理部24によってデータ形式が変換されたデータのうち、ランレングス法により圧縮された箇所を復元する復元処理部26と、コピー処理部28とが構築されている。また、復元処理部26あるいはそれに加えてコピー処理部28によって復元されたデータを格納する、ハードディスク等のハードウェアからなるデータベース30を備えている。
コピー処理部28は、送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合に、圧縮処理部14によって、連続するレコードのうち、最初のレコード以外のレコードに含まれる同一部分が圧縮された場合には、文字コード変換処理部24によってデータ形式が変換されたデータのうち、同一部分に対応する部分を、最初のレコードにおいて変換された同一部分に対応する部分のコピーで上書きする。例えば、圧縮処理部14によって、図2に示す「A〜F」のような圧縮がなされた場合には、文字コード変換処理部24によってデータ形式が変換されたデータのうち、図9に示す2件目のレコードの「A〜F」に対応する部分である「あ〜か」の部分を、1件目のレコードにおいて変換された同一部分に対応する部分「あいうえおか」のコピーで上書きする。
上述したデータ圧縮プログラム及びデータ復元プログラムは、ネットワークを介して送信側コンピュータ10及び受信側コンピュータ20に配信されるのに限らず、例えば磁気ディスク(フロッピー(登録商標)ディスク、ハ一ドディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記録媒体に格納して頒布することもできる。また、この記録媒体に格納されるプログラムは、送信側コンピュータ10及び受信側コンピュータ20に実行させる実行プログラムのみならずテーブルやデータ構造も含みうるプログラムを、送信側コンピュータ10及び受信側コンピュータ20内に構成させる設定プログラムをも含む。
次に、以上のように構成した本実施の形態に係るデータ圧縮/復元システムの動作について図3に示すフローチャートを用いて説明する。
すなわち、本実施の形態に係るデータ圧縮/復元システムによって、送信側コンピュータ10から受信側コンピュータ20へデータを伝送する場合、まず、送信側コンピュータ10において、送信されるデータが圧縮処理部14によってデータベース12から取り出される(S1)。
この取り出されたデータは、例えば図2に示すように、「ABCDEF|AAAAAA|DBCD」からなる1件目のレコードと、「ABCDEF|BBBB|HIJK」からなる2件目のレコードとからなるものとする。
この取り出したデータは、圧縮処理部14によってランレングス法により圧縮される。すなわち、1件目のレコードにおける「AAAAAA」は「A6」に、2件目のレコードにおける「BBBB」は「B4」に変更されることによってそれぞれ圧縮される。
また、図2の場合、送信されるデータが2つのレコードからなり、1件目のレコードと、2件目のレコードとに同一部分「ABCDEF」が含まれているので、2件目のレコードに含まれる同一部分「ABCDEF」が「A〜F」に変更されることによって圧縮される(S2)。なお、このようなレコードが存在しない場合には、「ABCDEF」を「A〜F」にするような圧縮はなされず、図4に示すような圧縮データとなる。
このように圧縮処理部14によって圧縮されたデータは、送信部16によって受信側コンピュータ20に向けて送信される(S3)。
このように送信されたデータは、受信側コンピュータ20の受信部22によって受信される(S4)。
更に、受信部22によって受信されたデータは、文字コード変換処理部24によって、データのデータ形式が、受信側コンピュータ20で認識可能なデータ形式に変換される(S5)。例えば、図2に示すように、受信部22によって受信されたデータのうち、1件目のレコード「ABCDEF|A6|DBCD」は、受信側コンピュータ20で認識可能なデータ形式である「あいうえおか|あ6|えいうえ」に変換され、2件目のレコード「A〜F|B4|HIJK」は、受信側コンピュータ20で認識可能なデータ形式である「あ〜か|い4|くけこさ」に変換される。
次に、文字コード変換処理部24によってデータ形式が変換されたデータのうち、ランレングス法により圧縮された箇所が、復元処理部26によって復元される(S6)。例えば、図2に示すように、1件目のレコードのうち、ランレングス法により圧縮された箇所「あ6」が「ああああああ」に、2件目のレコードのうち、ランレングス法により圧縮された箇所「い4」が「いいいい」にそれぞれ復元される。
更に、文字コード変換処理部24によってデータ形式が変換されたデータのうち、送信されたデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合に、圧縮処理部14によって、連続するレコードのうち、最初のレコード以外のレコードに含まれる同一部分が圧縮された場合には、コピー処理部28によって、同一部分に対応する部分が、最初のレコードにおいて変換された同一部分に対応する部分のコピーで上書きされる(S7)。例えば、図2に示すように、圧縮処理部14によって、2件目のレコードにつぃて「A〜F」のような圧縮がなされた場合には、文字コード変換処理部24によってデータ形式が変換されたデータのうち、2件目のレコードの「A〜F」に対応する部分である「あ〜か」の部分が、1件目のレコードにおいて変換された同一部分に対応する部分「あいうえおか」のコピーで上書きされる。
復元処理部26によってなされるステップS6の処理と、コピー処理部28によってなされるステップS7の処理とは、順序を交換することも可能である。なお、「ABCDEF」を「A〜F」にするような圧縮が圧縮処理部14でなされなかった場合には、図4に示すように、復元処理部26によってなされるステップS6の処理のみが行われる。
このような一連の処理によって、送信側コンピュータ10から送信されたデータが、受信側コンピュータ20で認識されるようになる。このデータは、データベース30に格納される(S8)。
上述したように、本実施の形態に係るデータ圧縮/復元システムにおいては、上記のような作用により、文字コード体系の異なるコンピュータ間でランレングス法により圧縮処理されたデータを伝送する場合、受信側コンピュータ20では、受信した圧縮データを、受信側コンピュータ20で認識可能な文字コードに変換処理し、次いで復元又は更に上書き処理するので、復元又は更に上書きした後に文字コード変換処理を行う従来技術に比べて、文字コード変換の処理量を低減することができ、もって、受信側コンピュータ20の負荷を低減することができる。
この定量的な効果を示すために、レコード長6000バイトの7万件のデータ(圧縮前のファイルサイズ:420MB,圧縮後のファイルサイズ:35MB)を対象として、従来技術と、本実施の形態に係るデータ圧縮/復元システムとで、全体の処理に要する時間を比較したところ、従来技術では40〜50秒を要していたところが、本実施の形態に係るデータ圧縮/復元システムでは8〜12秒しか要さず、おおよそ3〜6倍の処理速度になるという結果が得られた。
以上のように、本実施の形態に係るデータ圧縮/復元システムでは、全体の処理に要する時間を従来技術と比べておおよそ1/6〜1/3に抑えることができ、受信側コンピュータ20の負荷を大幅に低減することができ、もって、受信側コンピュータ20でなされるその後の処理の遅延を防止することができるのみならず、データ圧縮/復元システム全体の処理効率の向上を図ることが可能となる。
(第2の実施の形態)
本発明の第2の実施の形態に係るデータ圧縮/復元システムは、第1の実施の形態に係るデータ圧縮/復元システムの変形例である。したがって、ここでは、同一部分については同一符号を付して重複説明を避け、異なる点について説明する。
図5は、第2の実施の形態に係るデータ圧縮/復元システムの構成例を示す機能ブロック図である。
すなわち、本実施の形態に係るデータ圧縮/復元システムは、第1の実施の形態に係るデータ圧縮/復元システムでは、受信側コンピュータ20に備えられていた文字コード変換処理部24を、送信側コンピュータ10の、圧縮処理部14と、送信部16との間に備えた構成をしている。
したがって、図6及び図7に示すように、送信側コンピュータ10の送信部16からは、文字コード変換処理部24によって、受信側コンピュータ20で認識可能な文字コードに変換された圧縮データが受信側コンピュータ20に送信される。
なお、図6は、「AAAAAA」を「A6」とするようなランレングス法による圧縮に加えて、送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合、圧縮処理部14によって、連続するレコードのうち、最初のレコード以外のレコードに含まれる同一部分が圧縮された場合におけるデータ処理の流れを示す図である。
一方、図7は、送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれておらず、「AAAAAA」を「A6」とするようなランレングス法による圧縮のみがなされる場合におけるデータ処理の流れを示す図である。
本実施の形態に係るデータ圧縮/復元システムのように、第1の実施の形態に係るデータ圧縮/復元システムにおいて受信側コンピュータ20に備えられていた文字コード変換処理部24を、送信側コンピュータ10の圧縮処理部14と送信部16との間に備えた構成とすることによって、文字コード体系の異なるコンピュータ間でランレングス法により圧縮処理されたデータを伝送する場合、送信側コンピュータ10では、圧縮処理されたデータを、受信側コンピュータ20で認識可能な文字コードに変換処理するので、圧縮処理前に文字コード変換処理を行う従来技術に比べて、文字コード変換の処理量を低減することができ、もって、送信側コンピュータ10の負荷を低減することができる。
この定量的な効果を示すために、レコード長6000バイトの7万件のデータ(圧縮前のファイルサイズ:420MB,圧縮後のファイルサイズ:35MB)を対象として、従来技術と、本実施の形態に係るデータ圧縮/復元システムとで、全体の処理に要する時間を比較したところ、従来技術では40〜50秒を要していたところが、本実施の形態に係るデータ圧縮/復元システムでは8〜12秒しか要さず、おおよそ3〜6倍の処理速度になるという結果が得られた。
以上のように、本実施の形態に係るデータ圧縮/復元システムでは、全体の処理に要する時間を従来技術と比べておおよそ1/6〜1/3に抑えることができ、送信側コンピュータ10の負荷を大幅に低減することができ、もって、送信側コンピュータ10でなされるその後の処理の遅延を防止することができるのみならず、データ圧縮/復元システム全体の処理効率の向上を図ることが可能となる。
以上、本発明を実施するための最良の形態について、添付図面を参照しながら説明したが、本発明はかかる構成に限定されない。特許請求の範囲の発明された技術的思想の範疇において、当業者であれば、各種の変更例及び修正例に想到し得るものであり、それら変更例及び修正例についても本発明の技術的範囲に属するものと了解される。
第1の実施の形態に係るデータ圧縮/復元システムの構成例を示す機能ブロック図。 第1の実施の形態に係るデータ圧縮/復元システムにおける圧縮処理、伝送処理、文字コード変換処理、及び復元処理の一例を示す図。 第1の実施の形態に係るデータ圧縮/復元システムの動作を示すフローチャート。 第1の実施の形態に係るデータ圧縮/復元システムにおける圧縮処理、伝送処理、文字コード変換処理、及び復元処理の別の例を示す図。 第2の実施の形態に係るデータ圧縮/復元システムの構成例を示す機能ブロック図。 第2の実施の形態に係るデータ圧縮/復元システムにおける圧縮処理、文字コード変換処理、伝送処理、及び復元処理の一例を示す図。 第2の実施の形態に係るデータ圧縮/復元システムにおける圧縮処理、文字コード変換処理、伝送処理、及び復元処理の別の例を示す図。 従来技術におけるデータ圧縮/復元システムにおける圧縮処理、伝送処理、復元処理、及び文字コード変換処理の一例を示す図(処理手順1)。 1件目のレコードと2件目のレコードとに同一部分が含まれるデータの例を示す図。 従来技術におけるデータ圧縮/復元システムにおける文字コード変換処理、圧縮処理、伝送処理、及び復元処理の一例を示す図(処理手順2)。 従来技術における処理手順1を実現する装置構成例を示す機能ブロック図。 従来技術における処理手順2を実現する装置構成例を示す機能ブロック図。
符号の説明
10…送信側コンピュータ、12…データベース、14…圧縮処理部、16…送信部、20…受信側コンピュータ、22…受信部、24…文字コード変換処理部、26…復元処理部、28…コピー処理部、30…データベース、50…送信側コンピュータ、52…データベース、54…圧縮処理部、56…送信部、60…受信側コンピュータ、62…受信部、64…復元処理部、66…文字コード変換処理部、68…データベース

Claims (18)

  1. 送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムであって、
    前記送信側コンピュータに、
    送信されるデータをランレングス法により圧縮する圧縮手段と、
    前記圧縮手段により圧縮されたデータを前記受信側コンピュータに向けて送信する送信手段とを備え、
    前記受信側コンピュータに、
    前記送信手段により送信されたデータを受信する受信手段と、
    前記受信手段によって受信されたデータのデータ形式を、前記受信側コンピュータで認識可能なデータ形式に変換する変換手段と、
    前記変換手段によってデータ形式が変換されたデータのうち、前記ランレングス法により圧縮された箇所を復元する復元手段とを備えたデータ圧縮/復元システム。
  2. 請求項1に記載のデータ圧縮/復元システムにおいて、
    前記送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、前記圧縮手段は、前記連続するレコードのうち、最初のレコード以外のレコードに含まれる前記同一部分を圧縮し、
    前記受信側コンピュータに更に、
    前記変換手段によってデータ形式が変換されたデータのうち、前記同一部分に対応する部分を、前記最初のレコードにおいて変換された前記同一部分に対応する部分のコピーで上書きする上書手段を備えたデータ圧縮/復元システム。
  3. 送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムに適用され、前記送信側コンピュータに備えられるデータ圧縮装置であって、
    送信されるデータをランレングス法により圧縮する圧縮手段と、
    前記圧縮手段により圧縮されたデータを前記受信側コンピュータに向けて送信する送信手段とを備え、
    前記送信されたデータが、受信側コンピュータによって、受信され、前記受信側コンピュータで認識可能なデータ形式に変換され、しかる後に、前記ランレングス法により圧縮された箇所が復元されるようにしたデータ圧縮装置。
  4. 請求項3に記載のデータ圧縮装置において、
    前記送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、前記圧縮手段は、前記連続するレコードのうち、最初のレコード以外のレコードに含まれる前記同一部分を圧縮し、
    前記送信されたデータは、前記データ形式が変換されたデータのうち、前記同一部分に対応する部分が、前記最初のレコードにおいて変換された前記同一部分に対応する部分のコピーで上書きされるデータ圧縮装置。
  5. 送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムに適用され、前記受信側コンピュータに備えられるデータ復元装置であって、
    前記送信側コンピュータによって、ランレングス法により圧縮され、しかる後に前記受信側コンピュータに向けて送信されたデータを受信する受信手段と、
    前記受信手段によって受信されたデータのデータ形式を、前記受信側コンピュータで認識可能なデータ形式に変換する変換手段と、
    前記変換手段によってデータ形式が変換されたデータのうち、前記ランレングス法により圧縮された箇所を復元する復元手段とを備えたデータ復元装置。
  6. 請求項5に記載のデータ復元装置において、
    前記送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、前記受信手段によって受信されるデータは、前記連続するレコードのうち、最初のレコード以外のレコードに含まれる前記同一部分が圧縮されており、
    前記変換手段によってデータ形式が変換されたデータのうち、前記同一部分に対応する部分を、前記最初のレコードにおいて変換された前記同一部分に対応する部分のコピーで上書きする上書手段を更に備えたデータ復元装置。
  7. 送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムであって、
    前記送信側コンピュータに、
    送信されるデータをランレングス法により圧縮する圧縮手段と、
    前記圧縮手段により圧縮されたデータのデータ形式を、前記受信側コンピュータで認識可能なデータ形式に変換する変換手段と、
    前記データ形式が変換されたデータを、前記受信側コンピュータに向けて送信する送信手段とを備え、
    前記受信側コンピュータに、
    前記送信手段により送信されたデータを受信する受信手段と、
    前記受信手段によって受信されたデータのうち、前記ランレングス法により圧縮された箇所を復元する復元手段とを備えたデータ圧縮/復元システム。
  8. 請求項7に記載のデータ圧縮/復元システムにおいて、
    前記送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、前記圧縮手段は、前記連続するレコードのうち、最初のレコード以外のレコードに含まれる前記同一部分を圧縮し、
    前記受信側コンピュータに更に、
    前記変換手段によってデータ形式が変換された後に前記受信手段によって受信されたデータのうち、前記同一部分に対応する部分を、前記最初のレコードにおいて変換された前記同一部分に対応する部分のコピーで上書きする上書手段を備えたデータ圧縮/復元システム。
  9. 送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムに適用され、前記送信側コンピュータに備えられるデータ圧縮装置であって、
    送信されるデータをランレングス法により圧縮する圧縮手段と、
    前記圧縮手段により圧縮されたデータのデータ形式を、前記受信側コンピュータで認識可能なデータ形式に変換する変換手段と、
    前記データ形式が変換されたデータを、前記受信側コンピュータに向けて送信する送信手段とを備え、
    前記送信されたデータが、前記受信側コンピュータによって、受信され、前記ランレングス法により圧縮された箇所が復元されるようにしたデータ圧縮装置。
  10. 請求項9に記載のデータ圧縮装置において、
    前記送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、前記圧縮手段は、前記連続するレコードのうち、最初のレコード以外のレコードに含まれる前記同一部分を圧縮し、
    前記送信されたデータは、前記データ形式が変換されたデータのうち、前記同一部分に対応する部分が、前記最初のレコードにおいて変換された前記同一部分に対応する部分のコピーで上書きされるデータ圧縮装置。
  11. 送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムに適用され、前記受信側コンピュータに備えられるデータ復元装置であって、
    前記送信側コンピュータによって、ランレングス法により圧縮され、前記圧縮されたデータのデータ形式が、前記受信側コンピュータで認識可能なデータ形式に変換され、しかる後に前記受信側コンピュータに向けて送信されたデータを受信する受信手段と、
    前記受信手段によって受信されたデータのうち、前記ランレングス法により圧縮された箇所を復元する復元手段とを備えたデータ復元装置。
  12. 請求項11に記載のデータ復元装置において、
    前記送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、前記受信手段によって受信されるデータは、前記連続するレコードのうち、最初のレコード以外のレコードに含まれる前記同一部分が圧縮されており、
    前記受信手段によって受信されたデータのうち、前記同一部分に対応する部分を、前記最初のレコードにおいて変換された前記同一部分に対応する部分のコピーで上書きする上書手段を更に備えたデータ復元装置。
  13. 送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムに適用されるデータ圧縮/復元プログラムであって、
    送信されるデータをランレングス法により圧縮する機能、
    前記圧縮されたデータを前記受信側コンピュータに向けて送信する機能
    を前記送信側コンピュータに実現させるためのデータ圧縮プログラムと、
    前記送信されたデータを受信する機能、
    前記受信されたデータのデータ形式を、前記受信側コンピュータで認識可能なデータ形式に変換する機能、
    前記データ形式が変換されたデータのうち、前記ランレングス法により圧縮された箇所を復元する機能
    を前記受信側コンピュータに実現させるためのデータ復元プログラムと
    からなるデータ圧縮/復元プログラム。
  14. 請求項13に記載のデータ圧縮/復元プログラムにおいて、
    前記データ圧縮プログラムは、
    前記送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、前記連続するレコードのうち、最初のレコード以外のレコードに含まれる前記同一部分を圧縮する機能を更に前記送信側コンピュータに実現させ、
    前記データ復元プログラムは、
    前記データ形式が変換されたデータのうち、前記同一部分に対応する部分を、前記最初のレコードにおいて変換された前記同一部分に対応する部分のコピーで上書きする機能を更に前記受信側コンピュータに実現させるデータ圧縮/復元プログラム。
  15. 送信側コンピュータと、受信側コンピュータとから構成されるデータ圧縮/復元システムに適用されるデータ圧縮/復元プログラムであって、
    送信されるデータをランレングス法により圧縮する機能、
    前記圧縮されたデータのデータ形式を、前記受信側コンピュータで認識可能なデータ形式に変換する機能、
    前記データ形式が変換されたデータを、前記受信側コンピュータに向けて送信する機能
    を前記送信側コンピュータに実現させるためのデータ圧縮プログラムと、
    前記送信されたデータを受信する機能、
    前記受信されたデータのうち、前記ランレングス法により圧縮された箇所を復元する機能
    を前記受信側コンピュータに実現させるためのデータ復元プログラムと
    からなるデータ圧縮/復元プログラム。
  16. 請求項15に記載のデータ圧縮/復元プログラムにおいて、
    前記データ圧縮プログラムは、
    前記送信されるデータが複数のレコードからなり、少なくとも2つの連続するレコードに同一部分が含まれている場合には、前記連続するレコードのうち、最初のレコード以外のレコードに含まれる前記同一部分を圧縮する機能を更に前記送信側コンピュータに実現させ、
    前記データ復元プログラムは、
    前記データ形式が変換された後に受信されたデータのうち、前記同一部分に対応する部分を、前記最初のレコードにおいて変換された前記同一部分に対応する部分のコピーで上書きする機能を更に前記受信側コンピュータに実現させるデータ圧縮/復元プログラム。
  17. 請求項13乃至16のうち何れか1項に記載のデータ圧縮/復元プログラムにおけるデータ圧縮プログラム。
  18. 請求項13乃至16のうち何れか1項に記載のデータ圧縮/復元プログラムにおけるデータ復元プログラム。
JP2006109876A 2006-04-12 2006-04-12 データ圧縮/復元システム、データ圧縮装置、データ復元装置、及びプログラム Active JP4446102B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006109876A JP4446102B2 (ja) 2006-04-12 2006-04-12 データ圧縮/復元システム、データ圧縮装置、データ復元装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006109876A JP4446102B2 (ja) 2006-04-12 2006-04-12 データ圧縮/復元システム、データ圧縮装置、データ復元装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2007286672A true JP2007286672A (ja) 2007-11-01
JP4446102B2 JP4446102B2 (ja) 2010-04-07

Family

ID=38758416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006109876A Active JP4446102B2 (ja) 2006-04-12 2006-04-12 データ圧縮/復元システム、データ圧縮装置、データ復元装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP4446102B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015035207A (ja) * 2013-07-08 2015-02-19 株式会社エクサ 圧縮データ処理プログラム、圧縮データ編集プログラム
CN105282554A (zh) * 2014-07-07 2016-01-27 富士通株式会社 解码方法及解码装置
JP2016134751A (ja) * 2015-01-19 2016-07-25 富士通株式会社 プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015035207A (ja) * 2013-07-08 2015-02-19 株式会社エクサ 圧縮データ処理プログラム、圧縮データ編集プログラム
CN105282554A (zh) * 2014-07-07 2016-01-27 富士通株式会社 解码方法及解码装置
JP2016019113A (ja) * 2014-07-07 2016-02-01 富士通株式会社 伸長方法、伸長プログラムおよび伸長装置
JP2016134751A (ja) * 2015-01-19 2016-07-25 富士通株式会社 プログラム
CN105808513A (zh) * 2015-01-19 2016-07-27 富士通株式会社 转换装置和转换方法

Also Published As

Publication number Publication date
JP4446102B2 (ja) 2010-04-07

Similar Documents

Publication Publication Date Title
US7924183B2 (en) Method and system for reducing required storage during decompression of a compressed file
JP3025301B2 (ja) データ予備圧縮装置及びデータ予備圧縮システム及びデータ圧縮比改善方法
US5953503A (en) Compression protocol with multiple preset dictionaries
KR101074010B1 (ko) 블록 단위 데이터 압축 및 복원 방법 및 그 장치
JP2005521280A5 (ja)
JP6045123B2 (ja) エンコーダ、デコーダ及び方法
JP5809313B2 (ja) 浮動小数点方式を用いたデータ圧縮/復元方法及び装置
US8164490B2 (en) Data compression/decompression method and computer readable storage medium storing compression/decompression program
CN102821275B (zh) 数据压缩方法及装置、数据解压缩方法及装置
US9923577B1 (en) Hybrid software-hardware implementation of lossless data compression and decompression
US20040059834A1 (en) Efficient exchange of text based protocol language information
JP4446102B2 (ja) データ圧縮/復元システム、データ圧縮装置、データ復元装置、及びプログラム
US8677123B1 (en) Method for accelerating security and management operations on data segments
US20110258163A1 (en) Dynamically created two-stage self extracting archives
CN114614829A (zh) 卫星数据帧的处理方法、装置、电子设备和可读存储介质
US6748520B1 (en) System and method for compressing and decompressing a binary code image
KR101166910B1 (ko) 압축된 정수 데이터 저장 및 전송 시스템
US20100321218A1 (en) Lossless content encoding
JPH09223052A (ja) 電子メール装置
Leelavathi et al. High-Capacity Reversible Data Hiding Using Lossless LZW Compression
CN1656688B (zh) 在压缩之前处理数字数据
Bassiouni et al. Enhancing arithmetic and tree-based coding
KR101400124B1 (ko) 가변 길이 정보 메시지의 최적화 장치 및 방법
Aris Text Data Compression Software Design Using Arithmetic Coding Method
CN115834575A (zh) 一种日志上报方法、系统、设备及计算机可读存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091208

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20091225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091225

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20091225

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130129

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4446102

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250