JP2007272740A - 展開装置、圧縮通信システム及び圧縮通信方法 - Google Patents

展開装置、圧縮通信システム及び圧縮通信方法 Download PDF

Info

Publication number
JP2007272740A
JP2007272740A JP2006099885A JP2006099885A JP2007272740A JP 2007272740 A JP2007272740 A JP 2007272740A JP 2006099885 A JP2006099885 A JP 2006099885A JP 2006099885 A JP2006099885 A JP 2006099885A JP 2007272740 A JP2007272740 A JP 2007272740A
Authority
JP
Japan
Prior art keywords
data
compression
decompression
expansion
compressed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006099885A
Other languages
English (en)
Inventor
Akito Okura
昭人 大倉
Takeshi Igarashi
健 五十嵐
Kenichi Yamazaki
憲一 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2006099885A priority Critical patent/JP2007272740A/ja
Publication of JP2007272740A publication Critical patent/JP2007272740A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】「テキスト」「値」「コメント」を効率良く圧縮することにより、HTMLデータを効率的に圧縮する展開装置、圧縮通信システム及び圧縮通信方法を提供する。
【解決手段】通信端末は、データを圧縮する圧縮装置と共通の符号化ルールを有する展開装置11を備える。展開装置11は、共通の符号化ルールを用いて、キャッシュデータから展開に必要な情報である展開辞書を作成し、圧縮装置から圧縮されたHTMLデータを受信した場合、展開辞書を用いて、当該圧縮データ中の符号を展開する展開部112を備える。
【選択図】図3

Description

本発明は、展開装置、圧縮通信システム及び圧縮通信方法に関する。
通信技術の発達により、様々なネットワークを通じてWebサイトにアクセスすることが可能になっている。このWebサイトは主にHTML(XHTML、XML等も含む、以下同じ。)形式により記述される。
HTMLのようなファイル形式の問題は、その性質上、通常のテキストファイルに比べてデータサイズが大きくなってしまうことである。光ファイバのような高速・大容量な通信回線が利用できる場合にはデータサイズはあまり問題にならないが、携帯電話無線システムのような比較的低速で帯域の狭い回線を利用する場合にはデータサイズはできるだけ少ないほうが望ましい。このため、様々なデータの圧縮方法が開示されている(例えば、特許文献1参照。)。
特開2005−124165号公報
図19にHTMLファイルの例を示す。HTMLファイルでは、そのデータが、文書の意味や構造を表す「要素」「属性」と、実際のファイルの内容を表す「テキスト」「値」、そして「コメント」とに大別される。HTMLでは要素、属性の種類や値の形式などが厳密に定められており、サイト設計者は自分の意図をうまく反映させるようにそれらを組み合わせていく。
HTMLのデータ圧縮について考えると、「要素」「属性」は非常に効率よく圧縮できる。「要素」「属性」は種類が規格により厳密に定まっているため、予め通信端末とWebサーバが共通の「辞書」を用意しておくことができるからである。例えば<html>は“01”、<body>は“02”といった対応を一致させておけばよい。また「要素」「属性」はHTMLファイル内で繰り返し同じ符号が使用される場合が多いため圧縮効果はさらに高まる。
一方、「テキスト」「値」「コメント」の圧縮は「要素」「属性」のように効率的に行うことは困難である。「テキスト」「値」「コメント」はユーザが任意に設定するデータであり、予め「辞書」を用意して符号化することはできない。またスライド辞書圧縮技術のように、予め辞書を用意しなくても、データ中の繰返し表現を効率よく圧縮する方式も存在するが、「テキスト」「値」「コメント」は各項目が任意のデータ形式・内容を持つため、繰返しデータの符号化による圧縮効果も低くなる。
そこで、本発明は、「テキスト」「値」「コメント」を効率良く圧縮することにより、HTMLデータを効率的に圧縮する展開装置、圧縮通信システム及び圧縮通信方法を提供することを目的とする。
上記目的を達成するため、本発明の第1の特徴は、データを圧縮する圧縮装置と共通の符号化ルールを有する展開装置であって、共通の符号化ルールを用いて、キャッシュデータから展開に必要な情報である展開辞書を作成し、圧縮装置から圧縮されたHTMLデータを受信した場合、展開辞書を用いて、当該圧縮データ中の符号を展開する展開部を備える展開装置であることを要旨とする。
第1の特徴に係る展開装置によると、「テキスト」「値」「コメント」を効率良く圧縮することにより、HTMLデータを効率的に圧縮することができる。
又、第1の特徴に係る展開装置は、圧縮装置へのHTMLデータの送信要求に、キャッシュデータに関する情報を付加する通信データ作成部を更に備えてもよい。
この展開装置によると、圧縮装置にデータ符号化の有無の判断材料となる情報を提供することができる。
又、第1の特徴に係る展開装置において、展開部は、キャッシュデータに対し、展開辞書だけでは、圧縮データを完全に展開できない場合、圧縮装置から必要なデータを追加で取得してもよい。
この展開装置によると、データが展開できない場合に、必要なデータの追加取得が可能になる。
第1の特徴に係る展開装置は、圧縮装置が圧縮データに付加したデータ内容検証用の符号を利用して、展開部が展開したデータの検証を行う検証部と、検証部がデータの不一致を発見した場合、圧縮装置に対する不一致データの取得要求を作成する通信データ作成部とを更に備えてもよい。
この展開装置によると、展開後のデータが基のデータと一致しているかどうかの検証が可能になり、データの不一致が発生した場合に、追加データの取得が可能になる。
本発明の第2の特徴は、データを圧縮する圧縮装置と、圧縮装置と共通の符号化ルールを有し、データを展開する展開装置とを備え、展開装置は、共通の符号化ルールを用いて、キャッシュデータから展開に必要な情報である展開辞書を作成し、圧縮装置から圧縮されたHTMLデータを受信した場合、展開辞書を用いて、当該圧縮データ中の符号を展開する圧縮通信システムであることを要旨とする。
第2の特徴に係る圧縮通信システムによると、「テキスト」「値」「コメント」を効率良く圧縮することにより、HTMLデータを効率的に圧縮することができる。
又、第2の特徴に係る圧縮通信システムにおいて、展開装置は、圧縮装置へのHTMLデータの送信要求に、キャッシュデータに関する情報を付加し、圧縮装置は、キャッシュデータに関する情報に応じて、データの符号化の可否を決定してもよい。
この圧縮通信システムによると、圧縮装置が共通符号化ルールを用いてデータを圧縮する際に、展開装置が展開可能なデータは符号化し、展開装置が展開できないようなデータは符号化しないで送信することが可能になる。
又、第2の特徴に係る圧縮通信システムにおいて、展開装置は、キャッシュデータに対し、展開辞書だけでは、圧縮データを完全に展開できない場合、圧縮装置から必要なデータを追加で取得してもよい。
この圧縮通信システムによると、展開装置が圧縮データの展開が出来ない場合であっても、必要な情報を圧縮装置から取得することにより、データの展開が可能になる。
又、第2の特徴に係る圧縮通信システムにおいて、圧縮装置は、データ内容検証用の符号を圧縮データに付加し、展開装置は、データ内容検証用の符号を利用して、展開したデータの検証を行い、データの不一致を発見した場合、圧縮装置に対する不一致データの取得要求を作成してもよい。
この圧縮システムによると、元のデータと展開データが一致しているかどうかの検証が可能になり、検証の結果データの不一致が発生した場合でも、展開装置が必要なデータを圧縮装置から取得することが可能になる。
本発明の第3の特徴は、圧縮装置と、圧縮装置と共通の符号化ルールを有する展開装置とを備える圧縮通信システムにおける圧縮通信方法であって、展開装置が、共通の符号化ルールを用いて、キャッシュデータから展開に必要な情報である展開辞書を作成するステップと、圧縮装置が、HTMLデータを圧縮するステップと、展開装置が、圧縮装置から圧縮されたHTMLデータを受信した場合、展開辞書を用いて、当該圧縮データ中の符号を展開するステップとを含む圧縮通信方法であることを要旨とする。
第3の特徴に係る圧縮通信システムによると、「テキスト」「値」「コメント」を効率良く圧縮することにより、HTMLデータを効率的に圧縮することができる。
本発明によると、「テキスト」「値」「コメント」を効率良く圧縮することにより、HTMLデータを効率的に圧縮する展開装置、圧縮通信システム及び圧縮通信方法を提供することができる。
次に、図面を参照して、本発明の実施の形態を説明する。以下の図面の記載において、同一又は類似の部分には、同一又は類似の符号を付している。ただし、図面は模式的なものであることに留意すべきである。
日常的に特定のサイトに訪れている場合、多くのブラウザはそのキャッシュデータを保持している。図1は、Webサーバが保持する最新データ20aと、キャッシュデータ11aとの比較例である。この場合、更新された場所は日付の1箇所のみであり、他の部分については変更がない。この例はあくまで単純な例であるが、一般にホームページが更新されるとき、ページ全体では大きな変更がなく、コンテンツの一部が置換・変更されるだけのケースが多い。
本発明は、この特性に着目し、キャッシュデータを利用してHTMLデータを圧縮する。
<第1の実施形態>
(圧縮通信システム)
第1の実施形態にかかる圧縮通信システムは、Webサーバ側の圧縮装置と、通信端末側の展開装置によりHTMLファイルの圧縮及び展開を行う。
第1の実施形態に係る圧縮装置20は、図2に示すように、通信部201と、圧縮部202と、通信データ作成部203とを備える。
通信部201は、データの送受信を行う。
圧縮部202は、HTMLデータを受信した場合、データの圧縮を行う。この圧縮には、通信端末側の展開装置と共通の符号化ルールが用いられる。圧縮データは、通信データ作成部203を経由して通信部201から送信される。
通信データ作成部203は、送信するデータの作成、修正等を行う。例えば、通信端末内のブラウザからWebへの通信要求といった圧縮を必要としないデータは、通信データ作成部203でヘッダなどを修正した後、通信部201から送信される。
尚、圧縮装置20は、通信部201、圧縮部202、通信データ作成部203をCPU内に備える構成とし、これらをソフトウェアモジュールとして実現しても構わない。更に、圧縮装置20は、通信処理、圧縮処理、通信データ作成処理などをCPUに実行させるための制御プログラムを保存する記録媒体を備えてもよい。この記録媒体としては、例えば、RAM、ハードディスク、フレキシブルディスク、コンパクトディスク、ICチップ、カセットテープなどが挙げられる。このようなプログラムを保持した記録媒体によれば、プログラムの保存、運搬、販売などを容易に行うことができる。
第1の実施形態に係る展開装置11は、図3に示すように、通信部111と、展開部112と、キャッシュデータ保持部113と、通信データ作成部114とを備える。
通信部111は、データの送受信を行う。
展開部112は、圧縮されたHTMLデータを受信した場合、データの展開を行う。このとき、展開部112は、圧縮装置20と共通の符号化ルールを用いてキャッシュデータから展開辞書を作成し、圧縮データ中の符号を展開する。展開データは、通信データ作成部114を経由して通信部111から送信される。
キャッシュデータ保持部113は、キャッシュデータを保持する。
通信データ作成部114は、送信するデータの作成、修正等を行う。例えば、ブラウザからWebへの通信要求といった展開を必要としないデータは、通信データ作成部114でヘッダなどを修正した後、通信部111から送信される。
尚、展開装置21は、通信部111、展開部112、通信データ作成部114をCPU内に備える構成とし、これらをソフトウェアモジュールとして実現しても構わない。更に、展開装置21は、通信処理、展開処理、通信データ作成処理などをCPUに実行させるための制御プログラムを保存する記録媒体を備えてもよい。この記録媒体としては、例えば、RAM、ハードディスク、フレキシブルディスク、コンパクトディスク、ICチップ、カセットテープなどが挙げられる。このようなプログラムを保持した記録媒体によれば、プログラムの保存、運搬、販売などを容易に行うことができる。
(圧縮通信方法)
次に、第1の実施形態に係る圧縮通信方法について、図4を用いて説明する。
図4では、Webサーバ30側の圧縮装置20と、通信端末10側の展開装置11によりHTMLファイルの圧縮及び展開を行う。一般に圧縮装置20と展開装置11は無線区間のように帯域が狭い区間を挟んで設置すると効率がよい。尚、図4に示すブラウザ12は一般的なブラウザを示し、Webサーバ30はHTML情報を保持しているネットワーク上のサーバを意味する。
まず、ステップS101において、圧縮装置20と展開装置11は、HTMLデータの圧縮に利用する共通の符号化ルールについて事前に情報交換を行う。符号化ルールとは、例えば圧縮に利用するハッシュ関数の情報のことである。尚、このルール交換は通信ごとに行ってもよいし、より長い周期で行ってもよい。あらかじめ出荷時に静的に設定しておくことも考えられる。
次に、ステップS102において、ブラウザ12はホームページを表示するため、Webサーバ30に向けてHTML要求を送信する。そして、ステップS103において、展開装置11は上記HTML要求を取り込み、圧縮装置20へと転送する。
次に、ステップS104において、展開装置11は上記HTML要求の転送後、キャッシュデータを参照し、圧縮情報を復元する鍵となる「展開辞書」の作成を行う。具体的には、ステップS101で交換した符号化ルールをキャッシュデータに対し適用することにより行う。ここでいう符号化ルールとは、ハッシュ関数のようにある一定の入力に対して常に同じ結果を返す機能のあるものをいう。圧縮装置20と展開装置11でこの同じ符号化ルールの演算を行うことになるため、例えば同じ文字列に対しては同じ圧縮用の符号が算出される。
又、ステップS105において、圧縮装置20は、HTML要求をWebサーバ30に転送する。
次に、ステップS106において、Webサーバ30は圧縮装置20にHTMLデータを送信する。この時点ではHTMLデータは圧縮されていない。
次に、ステップS107において、圧縮装置20は、HTMLデータに対し圧縮処理を行う。具体的には、ステップS101において交換した符号化ルールに基づきHTMLデータに対し圧縮を行う。
次に、ステップS108において、圧縮装置20は、圧縮済みHTMLデータを展開装置11に送信する。
次に、ステップS109において、展開装置11は圧縮済みHTMLデータの展開を行う。この展開には、ステップS104で作成した展開辞書を利用する。
次に、ステップS110において、展開装置11は展開済みデータをブラウザ12に送信する。そして、ステップS111において、ブラウザ12は、ホームページを画面に表示する。
図5に、第1の実施形態における圧縮装置20における最新データ20aから圧縮データ20bへの符号化と、展開装置11におけるキャッシュデータ11aから展開辞書11bへの符号化の様子を示す。
最新データ20aとキャッシュデータ11aでは「株価上昇」「明日は晴れ」というテキストの位置に変化が生じているが、共通の符号化ルールを利用しているため、圧縮装置20、展開装置11双方においてそれぞれ「株価上昇」は“28”に、「明日は晴れ」は“9C”に符号化される。つまり圧縮装置20の作成した圧縮データ20bを、展開装置11は展開することが可能である。
(作用及び効果)
第1の実施形態に係る圧縮通信システム及び圧縮通信方法によると、圧縮装置20と展開装置11は、共通の符号化ルールを持つことにより、「テキスト」「値」「コメント」を効率的に圧縮することができる。具体的には、圧縮装置20は、「テキスト「値」「コメント」に共通の符号化ルールを適用し、例えば「おはよう」という「テキスト」を“03”へ符号化する。一方、展開装置11は、キャッシュデータに同様の符号化を施すことで、展開用の辞書を作成する。つまりキャッシュデータ中の「おはよう」というデータは展開辞書において“03”と対応付けられるため、圧縮データ中の“03”を「おはよう」へと展開することができる。又、この方式は単に「テキスト」「値」「コメント」といった単位ごとに符号化するだけではなく、「属性」「要素」を含めまとまった単位を圧縮する際にも利用できる。このようにキャッシュデータの情報を有効に利用することにより、HTMLファイルを効率的に圧縮することができる。
又、第1の実施形態に係る圧縮装置20は、展開装置11と共通の符号化ルールを用い、符号化ルールを適用した圧縮を行う。このため、第1の実施形態に係る圧縮装置20によると、共通符号化ルールに基づく圧縮が可能になる。
又、第1の実施形態に係る展開装置11は、圧縮装置20と共通の符号化ルールを用い、キャッシュデータに対し符号化ルールを適用して展開に必要な情報である展開辞書を作成し、圧縮データを展開辞書により展開する。このため、第1の実施形態に係る展開装置11によると、共通符号化ルールに基づく圧縮データの展開が可能になる。
<第2の実施形態>
第1の実施形態では、共通の符号化ルールに基づく符号化だけでは、データが展開できない場合がある。例えば圧縮装置が「おはよう」を“03”と符号化しても、キャッシュデータに「おはよう」というデータがない場合は“03”を展開することができない。そこで、第2の実施形態では、HTML要求を行うとき、展開装置は、キャッシュデータに関する情報を付加して転送する。
(圧縮通信システム)
第2の実施形態に係る圧縮装置20は、通信部201と、圧縮部202と、通信データ作成部203と、符号データ保持部204とを備える。
通信部201、通信データ作成部203は、第1の実施形態における機能と同等である。
圧縮部202は、HTMLデータの圧縮の際に符号データ保持部204を通じて符号データを確認する。そして、圧縮部202は、展開装置11から送信されたキャッシュデータに関する情報に応じて、データの符号化の可否を決定する。
符号データ保持部204は、符号データを保持する。符号データの具体例を図7に示す。符号データは、オリジナルデータ、圧縮符号、作成時間の項目を有する表になっている。キャッシュデータに関する情報として、キャッシュデータの取得日時「2006/01/07」が送られた場合、その日付よりも以前の符号はキャッシュデータに含まれている可能性が高いため符号化されるが、その日付よりも新しい符号は符号化されない。
第2の実施形態に係る展開装置11は、図3に示すように、通信部111と、展開部112と、キャッシュデータ保持部113と、通信データ作成部114とを備える。
通信部111、展開部112、キャッシュデータ保持部113は、第1の実施形態における機能と同等である。
通信データ作成部114は、圧縮装置20にキャッシュデータに関する情報を伝えるため、例えばブラウザからWebサーバへ送られるHTTP Getメッセージのヘッダ情報に、そのキャッシュデータの取得時間等を追記する。
(圧縮通信方法)
次に、第2の実施形態に係る圧縮通信方法の基本的な動作は図4と同様である。しかし、図4のステップS103のHTML要求を行うとき、展開装置11は、キャッシュデータに関する情報を付加して転送する。例えばキャッシュデータの取得時間等である。
圧縮装置20は、装置内に符号データを保持しており、その符号データには、例えばどの符号がどの時点で作成されたかが記録されている。そのため、図4のステップS107の圧縮時に、展開装置11が付加したキャッシュデータに関する情報からどの符号が有効かを判断し、有効ではない符号を生成するデータについては圧縮せずに送信する。
図8は、第2の実施形態における圧縮装置20における最新データ20aから圧縮データ20bへの符号化と、展開装置11におけるキャッシュデータ11aから展開辞書11bへの符号化の様子を示す。
最新データ20aのうち「2006/01/10」については、キャッシュデータ11aに存在しないと判断し、圧縮データ20bにおいて符号化されていない様子がわかる。
(作用及び効果)
第2の実施形態に係る圧縮通信システム及び圧縮通信方法によると、圧縮装置20が、圧縮に用いる符号に関する情報を保持し、展開装置11の要求に応じて、符号化の適否を変更させる。このため、圧縮装置20が共通符号化ルールを用いてデータを圧縮する際に、展開装置11が展開可能なデータは符号化し、展開装置が展開できないようなデータは符号化しないで送信することができる。
又、第2の実施形態に係る圧縮装置20は、圧縮に用いる符号に関する情報を保持し、展開装置の要求に応じて符号化の適否を変更させる。このため、第2の実施形態に係る圧縮装置20によると、展開装置11の要求に応じて、データの符号化の有無を判断した圧縮が可能になる。
又、第2の実施形態に係る展開装置11は、圧縮装置20に、符号化の適否を変更させるための要求を送信する。このため、第2の実施形態に係る展開装置11によると、圧縮装置20にデータ符号化の有無の判断材料となる情報を提供することができる。
<第3の実施形態>
第2の実施形態において、圧縮装置はすべての展開装置に対し、符号化の適否を完全に判断することは難しく、展開装置が展開できない符号化をしてデータを圧縮してしまう場合も考えられる。そこで、第3の実施形態では、展開装置が圧縮装置から必要なデータの追加取得を行う場合について説明する。
(圧縮通信システム)
第3の実施形態に係る圧縮装置20は、図6に示すように、通信部201と、圧縮部202と、通信データ作成部203と、符号データ保持部204とを備える。
通信部201、圧縮部202、符号データ保持部204は、第2の実施形態における機能と同等である。
通信データ作成部203は、展開装置11から展開不能な符号に関するデータ要求を受けると、符号データを参照してデータを作成し、展開装置11に送信する。
第3の実施形態に係る展開装置11は、図3に示すように、通信部111と、展開部112と、キャッシュデータ保持部113と、通信データ作成部114とを備える。
通信部111、キャッシュデータ保持部113は、第1の実施形態と同等の機能である。
展開部112は、展開できない符号を発見すると、通信データ作成部114に通知し、通信データ作成部114はその展開不能な符号のデータを圧縮装置20から取得するためのメッセージを作成する。
(圧縮通信方法)
次に、第3の実施形態に係る圧縮通信方法について、図9を用いて説明する。この処理シーケンスのうち、ステップS201〜211は、図4のステップS101〜111における処理と同等である。
ステップS212において、展開装置11は、展開辞書11bに対応するデータがない場合、その不足分を圧縮装置20から取得する。つまり、展開辞書11bはキャッシュデータから作成されるため完全に最新の情報は含んでおらず、圧縮装置20により圧縮されてHTMLデータを十分に復元できない場合があるためである。
次に、ステップS213において、圧縮装置20は不足データを展開装置11に送信する。
次に、ステップS214において、展開装置11は不足データをブラウザ12に送信する。
次に、ステップS215において、ブラウザ12は画面を更新する。
図10は、第3の実施形態における圧縮装置20における最新データ20aから圧縮データ20bへの符号化と、展開装置11におけるキャッシュデータ11aから展開辞書11bへの符号化の様子を示す。
最新データ20aの「2006/01/10」が“79”に符号化されているが、展開辞書11bに“79”に対応した符号はない。そのため展開装置はデータを完全に復元することが出来ず、圧縮データ20bに対し“79”対応する符号のデータ送信を要求する。
(作用及び効果)
第3の実施形態に係る圧縮通信システム及び圧縮通信方法によると、展開装置11が、キャッシュデータに対し圧縮装置20と共通の符号化ルールにより作成した展開に必要な情報だけでは、圧縮データを完全に展開できない場合に、圧縮装置20から必要なデータの追加取得を行う。このため、展開装置11が圧縮データの展開が出来ない場合であっても、必要な情報を圧縮装置20から取得することにより、データの展開が可能になる。
又、第3の実施形態に係る圧縮装置20は、展開装置11からデータの追加取得要求があった場合に、必要なデータを送信する。このため、第3の実施形態に係る圧縮装置20によると、展開装置11に必要なデータを送信することが可能になる。
又、第3の実施形態に係る展開装置11は、キャッシュデータに対し圧縮装置20と共通の符号化ルールにより作成した展開に必要な情報だけでは、圧縮データを完全に展開できない場合に、圧縮装置20から必要なデータの追加取得を行う。このため、第3の実施形態に係る展開装置によると、データが展開できない場合に、必要なデータの追加取得が可能になる。
<第4の実施形態>
第1〜第3の実施形態において、共通符号化ルールにより符号化された符号を、展開装置がすべて展開できた場合であっても、その内容が正確でない場合が生じる。例えば圧縮装置が「おはよう」を“03”と符号化しても、展開装置がキャッシュデータを符号化した結果、符号の競合が発生した場合、「USA」というデータが“03”と対応付けられる場合もある。そこで、第4の実施形態では、圧縮装置はデータ内容検証用の符号を圧縮データに付加し、展開装置はデータ展開後、データ内容検証用符号を用いてデータ内容の検証を行う。
(圧縮通信システム)
第4の実施形態に係る圧縮装置20は、図11に示すように、通信部201と、圧縮部202と、通信データ作成部203と、符号データ保持部204と、検証符号作成部205とを備える。
通信部201、圧縮部202、符号データ保持部204は、第2の実施形態と同等である。
検証符号作成部205は、通信部201からデータを受け取り、展開装置11による検証用の符号を作成する。
通信データ作成部203は、圧縮部202が作成した圧縮データ20bと、検証符号作成部205が作成した符号を利用して通信データを作成する。
第4の実施形態に係る展開装置は、図12に示すように、通信部111と、展開部112と、キャッシュデータ保持部113と、通信データ作成部114と、検証部115とを備える。
通信部111、通信データ作成部114、キャッシュデータ保持部113は、第1の実施形態と同等である。
展開部112は、データの展開が完了すると、検証部115にそのデータを渡し、検証部115は、圧縮装置20が付加した検証符号を利用して展開部112が展開したデータの検証を行う。
(圧縮通信方法)
次に、第4の実施形態に係る圧縮通信方法について、図13を用いて説明する。この処理シーケンスのうち、ステップS301〜306、S308、S310〜311は、図4におけるステップS101〜106、S108、S110〜111の処理と同等である。
ステップS307において、圧縮装置20は、データの圧縮に加え、展開装置11が展開後のデータが元のデータと一致しているかを確認するための検証符号を付加する。
又、ステップS309において、展開装置11は、データの展開に加え、圧縮装置20が付加した検証符号を用いて、元のデータと展開データが一致したかの検証を行う。
図14は、第4の実施形態における圧縮装置20における最新データ20aから圧縮データ20bへの符号化と、展開装置11におけるキャッシュデータ11aから展開辞書11bへの符号化の様子を示す。この場合、最新データ20aとキャッシュデータ11aは内容が等しいため、圧縮データ20bは展開辞書11bにより正しく展開されるはずである。
図15は、圧縮装置20による検証符号の付加例である。検証符号の付加によりデータサイズが増加してしまうため、検証符号の付加はある程度まとまった範囲に対して行う。この検証符号は圧縮・検証符号データ20cとして送信するデータ内に記録される。
(作用及び効果)
第4の実施形態に係る圧縮通信システム及び圧縮通信方法によると、圧縮装置20はデータ内容検証用の符号を圧縮データに付加し、展開装置11はデータ展開後、データ内容検証用符号を用いてデータ内容の検証を行う。このため、元のデータと展開データが一致しているかどうかの検証が可能になる。
又、第4の実施形態に係る圧縮装置20は、データ内容検証用の符号を圧縮データに付加する。このため、第4の実施形態に係る圧縮装置20によると、展開装置11においてデータ内容の検証が可能になる。
又、第4の実施形態に係る展開装置11は、データ展開後、データ内容検証用符号を用いてデータ内容の検証を行う。このため、第4の実施形態に係る展開装置11によると、展開後のデータが元のデータと一致しているかどうかの検証が可能になる。
<第5の実施形態>
第4の実施形態において、データの検証によりデータの不一致が生じる場合は、不足したデータを追加取得しなければならない。そこで、第5の実施形態では、展開装置による展開データの検証の結果、データ内容に相違があるときは、圧縮装置から必要なデータの追加取得を行う。
(圧縮通信システム)
第5の実施形態に係る圧縮装置は、図11に示すように、通信部201と、圧縮部202と、通信データ作成部203と、符号データ保持部204と、検証符号作成部205とを備える。
通信部201、圧縮部202、符号データ保持部204、検証符号作成部205は、第4の実施形態における機能と同等である。
通信データ作成部203は、展開装置11から不一致データの取得要求を受けると、符号データを参照して送信データを作成する。
第5の実施形態に係る展開装置11は、図12に示すように、通信部111と、展開部112と、キャッシュデータ保持部113と、通信データ作成部114と、検証部115とを備える。
通信部111、展開部112、キャッシュデータ保持部113は、第4の実施形態における機能と同等である。
検証部115がデータ不一致を発見すると、通信データ作成部114は圧縮装置20に対する不一致データの取得要求を作成する。
(圧縮通信方法)
次に、第5の実施形態に係る圧縮通信方法について、図16を用いて説明する。この処理シーケンスのうち、ステップS401〜411は、図13のステップS301〜311の処理と同等である。
ステップS412おいて、展開装置11は、圧縮装置20に対し検証の結果一致しないデータの要求を行う。
次に、ステップS413において、圧縮装置20は、所定のデータを送信する。
次に、ステップS414において、展開装置11は不一致データをブラウザ12に送信する。
次に、ステップS415において、ブラウザ12は画面を更新する。
図17は、第5の実施形態における圧縮装置20における最新データ20aから圧縮データ20bへの符号化と、展開装置11におけるキャッシュデータ11aから展開辞書11bへの符号化の様子を示す。この例では、「2006/01/07」というデータに対する符号と、「2006/01/10」というデータに対する符号がともに“54”となり符号の競合が発生している。つまり検証符号を付加しないと、展開装置11は圧縮データ20bを展開できるものの、元のデータと異なった情報を取得することになってしまう。第5の実施形態に係る展開装置11は、検証符号を用いてもとのデータと展開データの一致不一致の検証を行うため、この例のような場合でも不一致を検出することができる。さらに不一致が発生したデータについては圧縮装置20からデータの取得を行うため、展開装置11は正しいデータを復元することができる。
(作用及び効果)
第5の実施形態に係る圧縮通信システム及び圧縮通信方法によると、展開装置11による展開データの検証の結果、データ内容に相違があるときは、圧縮装置20から必要なデータの追加取得を行う。このため、検証の結果データの不一致が発生した場合でも、展開装置11が必要なデータを圧縮装置から取得することが可能になる。
又、第5の実施形態に係る圧縮装置20は、展開装置11からの追加データ要求に対し必要なデータを送信する。このため、第5の実施形態に係る圧縮装置20によると、展開装置11による追加データの要求に対し、適切なデータの返信が可能になる。
又、第5の実施形態に係る展開装置11は、展開データの検証の結果、データ内容に相違があるときは、圧縮装置20から必要なデータの追加取得を行う。このため、第5の実施形態に係る展開装置11によると、データの不一致が発生した場合に、追加データの取得が可能になる。
<その他の実施形態>
本発明は上記の実施形態によって記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施形態、実施例及び運用技術が明らかとなろう。
例えば、第1〜第5の実施形態は、「テキスト」「値」「コメント」といった要素単位で符号化を行っているが、図18に示すようにより広い範囲に対して符号化を行うことも可能である。
ホームページが更新されるとき、更新される内容は主にテキストなどの情報部分であり、レイアウトなどはあまり変更されない。またHTMLファイルでは「要素」「属性」の性質が明確に決まっているため、レイアウトに関する部分はある程度広範囲で符号化を行い、テキストなど変更の頻度が高いと予想されるものは「テキスト」「値」といった単位で符号化を行うことも可能である。
又、逆に、1つの「テキスト」「値」「コメント」が長い場合は、句読点にはさまれる区間など一定の範囲ごとに符号化を行ってもよい。
又、第1〜第5の実施形態は、HTMLファイルをブラウザ12が読み込む際の圧縮通信システムに関する例であるが、XML形式のデータファイルの交換にも利用できる。近年営業員が社外から本社の業務サーバにアクセスしファイルを取得することは日常的に行われている。一般にこの場合、営業員の所持するパソコンには古いデータが残されており、この古いデータをキャッシュとして利用することにより、本発明の効果を利用することができる。
XMLでは「要素」「属性」を任意に設定することができるため、HTMLのように「要素」「属性」について予め完全な辞書情報を用意することはできないが、本発明による符号化ルールを「要素」「属性」にも適用することにより、通信端末・サーバで共通の符号を作成することができる。
また、第1〜第5の実施形態では、展開装置を端末内に設置した場合の例を示しているが、端末を独立した端末として設置してもよい。例えば、1つの展開装置を複数の通信端末によって利用することも考えられる。
このように、本発明はここでは記載していない様々な実施形態等を含むことは勿論である。従って、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。
第1〜第5の実施形態に係る最新データとキャッシュデータの例である。 第1の実施形態に係る圧縮装置の構成ブロック図である。 第1〜第3の実施形態に係る展開装置の構成ブロック図である。 第1の実施形態に係る圧縮通信方法を示すシーケンス図である。 第1の実施形態に係る最新データから圧縮データへの符号化と、キャッシュデータから展開辞書への符号化の例である。 第2及び第3の実施形態に係る圧縮装置の構成ブロック図である。 第2の実施形態に係る圧縮装置の保持する符号データの例である。 第2の実施形態に係る最新データから圧縮データへの符号化と、キャッシュデータから展開辞書への符号化の例である。 第3の実施形態に係る圧縮通信方法を示すシーケンス図である。 第3の実施形態に係る最新データから圧縮データへの符号化と、キャッシュデータから展開辞書への符号化の例である。 第4及び第5の実施形態に係る圧縮装置の構成ブロック図である。 第4及び第5の実施形態に係る展開装置の構成ブロック図である。 第4の実施形態に係る圧縮通信方法を示すシーケンス図である。 第4の実施形態に係る最新データから圧縮データへの符号化と、キャッシュデータから展開辞書への符号化の例である。 第4の実施形態に係る圧縮装置によるデータ圧縮と検証符号の作成例である。 第5の実施形態に係る圧縮通信方法を示すシーケンス図である。 第5の実施形態に係る最新データから圧縮データへの符号化と、キャッシュデータから展開辞書への符号化の例である。 その他の実施形態に係る最新データから圧縮データへの符号化と、キャッシュデータから展開辞書への符号化の例である。 従来のHTMLファイルの例である。
符号の説明
10…通信端末
11…展開装置
11a…キャッシュデータ
11b…展開辞書
12…ブラウザ
20…圧縮装置
20a…最新データ
20b…圧縮データ
20c…圧縮・検証符号データ
21…展開装置
30…Webサーバ
111…通信部
112…展開部
113…キャッシュデータ保持部
114…通信データ作成部
115…検証部
201…通信部
202…圧縮部
203…通信データ作成部
204…符号データ保持部
205…検証符号作成部

Claims (9)

  1. データを圧縮する圧縮装置と共通の符号化ルールを有する展開装置であって、
    前記共通の符号化ルールを用いて、キャッシュデータから展開に必要な情報である展開辞書を作成し、前記圧縮装置から圧縮されたHTMLデータを受信した場合、前記展開辞書を用いて、当該圧縮データ中の符号を展開する展開部を備えることを特徴とする展開装置。
  2. 前記圧縮装置へのHTMLデータの送信要求に、キャッシュデータに関する情報を付加する通信データ作成部を更に備えることを特徴とする請求項1に記載の展開装置。
  3. 前記展開部は、前記キャッシュデータに対し、前記展開辞書だけでは、前記圧縮データを完全に展開できない場合、前記圧縮装置から必要なデータを追加で取得することを特徴とする請求項1又は2に記載の展開装置。
  4. 前記圧縮装置が前記圧縮データに付加したデータ内容検証用の符号を利用して、前記展開部が展開したデータの検証を行う検証部と、
    前記検証部がデータの不一致を発見した場合、前記圧縮装置に対する不一致データの取得要求を作成する通信データ作成部とを更に備えることを特徴とする請求項1〜3のいずれか1項に記載の展開装置。
  5. データを圧縮する圧縮装置と、
    該圧縮装置と共通の符号化ルールを有し、前記データを展開する展開装置とを備え、
    前記展開装置は、前記共通の符号化ルールを用いて、キャッシュデータから展開に必要な情報である展開辞書を作成し、前記圧縮装置から圧縮されたHTMLデータを受信した場合、前記展開辞書を用いて、当該圧縮データ中の符号を展開することを特徴とする圧縮通信システム。
  6. 前記展開装置は、前記圧縮装置へのHTMLデータの送信要求に、キャッシュデータに関する情報を付加し、
    前記圧縮装置は、前記キャッシュデータに関する情報に応じて、データの符号化の可否を決定することを特徴とする請求項5に記載の圧縮通信システム。
  7. 前記展開装置は、前記キャッシュデータに対し、前記展開辞書だけでは、前記圧縮データを完全に展開できない場合、前記圧縮装置から必要なデータを追加で取得することを特徴とする請求項5又は6に記載の圧縮通信システム。
  8. 前記圧縮装置は、データ内容検証用の符号を圧縮データに付加し、
    前記展開装置は、前記データ内容検証用の符号を利用して、前記展開したデータの検証を行い、データの不一致を発見した場合、前記圧縮装置に対する不一致データの取得要求を作成することを特徴とする請求項5〜7のいずれか1項に記載の圧縮通信システム。
  9. 圧縮装置と、該圧縮装置と共通の符号化ルールを有する展開装置とを備える圧縮通信システムにおける圧縮通信方法であって、
    前記展開装置が、前記共通の符号化ルールを用いて、キャッシュデータから展開に必要な情報である展開辞書を作成するステップと、
    前記圧縮装置が、HTMLデータを圧縮するステップと、
    前記展開装置が、前記圧縮装置から前記圧縮されたHTMLデータを受信した場合、前記展開辞書を用いて、当該圧縮データ中の符号を展開するステップと
    を含むことを特徴とする圧縮通信方法。
JP2006099885A 2006-03-31 2006-03-31 展開装置、圧縮通信システム及び圧縮通信方法 Pending JP2007272740A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006099885A JP2007272740A (ja) 2006-03-31 2006-03-31 展開装置、圧縮通信システム及び圧縮通信方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006099885A JP2007272740A (ja) 2006-03-31 2006-03-31 展開装置、圧縮通信システム及び圧縮通信方法

Publications (1)

Publication Number Publication Date
JP2007272740A true JP2007272740A (ja) 2007-10-18

Family

ID=38675459

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006099885A Pending JP2007272740A (ja) 2006-03-31 2006-03-31 展開装置、圧縮通信システム及び圧縮通信方法

Country Status (1)

Country Link
JP (1) JP2007272740A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015052967A1 (ja) * 2013-10-08 2015-04-16 ソニー株式会社 サーバ装置、クライアント装置、情報処理方法および記録媒体
WO2019022207A1 (ja) * 2017-07-28 2019-01-31 日本電気株式会社 イベント監視システム、端末装置、監視サーバ、イベント監視方法および記録媒体

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015052967A1 (ja) * 2013-10-08 2015-04-16 ソニー株式会社 サーバ装置、クライアント装置、情報処理方法および記録媒体
CN105593831A (zh) * 2013-10-08 2016-05-18 索尼公司 服务器装置、客户端装置、信息处理方法和记录介质
JPWO2015052967A1 (ja) * 2013-10-08 2017-03-09 ソニー株式会社 サーバ装置、クライアント装置、情報処理方法および記録媒体
US10282403B2 (en) 2013-10-08 2019-05-07 Sony Corporation Server device, client device, information processing method, and recording medium
WO2019022207A1 (ja) * 2017-07-28 2019-01-31 日本電気株式会社 イベント監視システム、端末装置、監視サーバ、イベント監視方法および記録媒体

Similar Documents

Publication Publication Date Title
CN100557574C (zh) 使用二进制比较优化文件复制
CN104185845B (zh) 用于提供网页的二进制表示的系统和方法
RU2419846C2 (ru) Кодирование данных языка разметки
JP4373721B2 (ja) マークアップ言語文書を符号化するための方法およびシステム
US20140033010A1 (en) Method and system for dynamic assembly of form fragments
CN103428243A (zh) 动态网页静态存储的实现方法、设备和系统
CN1997963A (zh) 访问pos终端的系统、下载和更新应用的方法以及使用这种系统执行电子操作的方法
US7747942B2 (en) System and method for obtaining a markup language template through reversing engineering
CN102023998B (zh) 用于处理网页以便在手持设备上显示的方法和装置
US20060035587A1 (en) Information equipment remote operating system, and information equipment
US20150067037A1 (en) Communication apparatus and communication method
CN105589959A (zh) 表单处理方法和表单系统
JP2004302799A (ja) コンピュータシステム、コンピュータプログラム、コンピュータ間の通信方法、構造化文書の符号化方法、符号化された構造化文書の復号方法
US8954400B2 (en) Method, system and program product for managing structured data
JP2007272740A (ja) 展開装置、圧縮通信システム及び圧縮通信方法
CN103139298B (zh) 一种传输网络数据的方法和装置
US20030016387A1 (en) Information processing apparatus and method for processing externally transmitted data, and information processing program
JP2007041983A (ja) 申請書作成プログラムおよび申請書作成装置
JP4577101B2 (ja) 情報コード、情報コード読取装置及び情報コード読取装置のデータ更新システム
JP4364827B2 (ja) 帳票処理システム
JP4676136B2 (ja) 文書構造検査方法および装置
KR101396090B1 (ko) Xml 문서변환장치 및 방법과, 그를 이용한 xml문서처리시스템
JPWO2005101210A1 (ja) データ解析装置およびデータ解析プログラム
JP2005107635A (ja) 電子フォーム入力システム、方法、プログラムおよび媒体
JP2004258773A (ja) 文書圧縮装置及び文書復元装置