JP2004102430A - Processor and method for processing structured document file, program, and storage medium - Google Patents

Processor and method for processing structured document file, program, and storage medium Download PDF

Info

Publication number
JP2004102430A
JP2004102430A JP2002260251A JP2002260251A JP2004102430A JP 2004102430 A JP2004102430 A JP 2004102430A JP 2002260251 A JP2002260251 A JP 2002260251A JP 2002260251 A JP2002260251 A JP 2002260251A JP 2004102430 A JP2004102430 A JP 2004102430A
Authority
JP
Japan
Prior art keywords
character string
file
type
replacement
structured document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002260251A
Other languages
Japanese (ja)
Inventor
Tsuyoshi Kato
加藤 剛志
Norihiro Ishikawa
石川 憲洋
Hidetoshi Ueno
上野 英俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2002260251A priority Critical patent/JP2004102430A/en
Publication of JP2004102430A publication Critical patent/JP2004102430A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide technique for surely compressing a structured document file expressed according to a structured document specification. <P>SOLUTION: This structured document file processor detects an identifier from a model file, detects an identified character string from the structured document file, compresses the file by substituting respective data for expressing the character strings constituting a character string group in a relation of complete consistency in a set constituted of the character strings which the detected identifier has, and name character strings included in the identified character string, out of the data constituting the model file in which the identifier is detected and the structured document file where the identified character string is detected, with a data expressing one character string having a length enough to identify a model in the model file and the structured document file, and stores the compressed file. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
この発明は、構造化文書仕様に従って表現される構造化文書ファイルを圧縮する技術に関する。
【0002】
【従来の技術】
文書を表す文書データを構造的に表現するための構造化文書仕様として、XML(eXtensible Markup Language)がある。このXMLでは、文書を要素という単位で扱う。要素は、この要素の名称を表す文字列を内包した識別子と、当該識別子により囲まれた、この要素の内容を表す文字列とで表される。そして、この要素名は、文書作成者によって自由に設定されるようになっている。またこの要素に対して属性が定められた場合には、その属性名も同様に、文書作成者によって自由に設定されるようになっている。従って、文書作成者は、要素名や、属性名に、その情報内容や用途などを明確に表す名称を使用することができる。
しかしながら、この名称が長い文字列で構成されている場合、この要素の名称を表す文字列を内包した識別子のデータサイズが大きくなり、ひいてはこの文書を表すXML文書データファイルのサイズが大きくなる。そこで、このような問題を解決するための技術として、文書データファイル中に表れる要素名や属性名をそれぞれ一意に識別可能な識別番号に変換し、その変換情報をテーブルに格納するとともに、文書のデータの構造について、各要素間の関係、属性などを識別番号を用いて表現する技術がある(例えば、特許文献1参照)。この技術によれば、XML文書データファイルのサイズが減少し得る。
【0003】
【特許文献】
特開2001−5745号公報(第3―6頁)
【0004】
【発明が解決しようとする課題】
しかし、XML文書データファイル中で、同一の要素名や属性名が繰り返し用いられる頻度が少ない場合、上述のテーブルのサイズによっては、このXML文書データファイルのサイズが大きくなり、元のXML文書ファイルのサイズよりも減少しない可能性がある。
【0005】
そこで、本発明は、以上説明した事情に鑑みてなされたものであり、構造化文書仕様に従って表現される文書データファイルを確実に圧縮する技術を提供する。
【0006】
【課題を解決するための手段】
上記課題を解決するために、本発明は、型を識別するための文字列を有する識別子と該型の内容とが対応付けられて記述される型ファイルから、識別子を検出する第1の検出手段と、名称、内容および型を持つ要素であって、内容を表す内容文字列と、該内容文字列が文書において占める領域を示すとともに名称を表す名称文字列を内包する、型を識別するための識別文字列とで表される要素、を有する構造化文書を表す構造化文書ファイルから識別文字列を検出する第2の検出手段と、前記第1の検出手段により識別子が検出された型ファイルと前記第2の検出手段により識別文字列が検出された構造化文書ファイルとを構成するデータのうち、前記第1の検出手段により検出された識別子が有している文字列と、前記第2の検出手段により検出された識別文字列が内包している名称文字列とから構成される集合において完全一致の関係にある文字列群を構成する文字列を表すデータの各々について、該型ファイル及び該構造化文書ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する置換手段と、前記置換手段によりデータが置換されたファイルを記憶する記憶手段とを有する構造化文書ファイル処理装置を提供する。
【0007】
この構造化文書ファイル処理装置によれば、前記型ファイルから識別子を検出し、前記構造化文書ファイルから識別文字列を検出し、識別子が検出された型ファイルと識別文字列が検出された構造化文書ファイルとを構成するデータのうち、検出された識別子が有している文字列と、検出された識別文字列が内包している名称文字列とから構成される集合において完全一致の関係にある文字列群を構成する文字列を表すデータの各々について、該型ファイル及び該構造化文書ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換することにより、当該ファイルを圧縮し、圧縮されたファイルを記憶する。
【0008】
また本発明は、型を識別するための文字列を有する識別子と該型の内容とが対応付けられて記述される型ファイルを用いて、名称、内容および型を持つ要素であって、内容を表す内容文字列と、該内容文字列が文書において占める領域を示すとともに名称を表す名称文字列を内包する、型を識別するための識別文字列とで表される要素、を有する構造化文書を表す構造化文書ファイルを作成する機能を有する通信装置との間でファイルの送受信を行う装置であって、前記型ファイルを取得する第1の取得手段と、前記第1の取得手段で取得された前記型ファイルから、識別子を検出する第1の検出手段と、前記第1の検出手段により検出された識別子が有している文字列を表すデータについて、該型ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する第1の圧縮置換手段と、前記第1の圧縮置換手段で置換される前の前記文字列を表すデータと、置換された後の前記文字列を表すデータとの対応関係を記憶する対応関係記憶手段と、前記第1の圧縮置換手段で置換された前記型ファイルを、前記通信装置に送信する第1の送信手段と、前記通信装置で型ファイルを用いて作成され、前記名称文字列を表すデータに、前記第1の圧縮置換手段で置換された後の前記文字列を表すデータが用いられている第1の構造化文書ファイルを受信する受信手段と、前記受信手段で受信した第1の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶手段に記憶された対応関係に従って、前記第1の圧縮置換手段で置換される前の文字列に置換する復元置換手段と、前記復元置換手段で置換された第1の構造化文書ファイルと、前記型ファイルとを用いて作成された第2の構造化文書ファイルを取得する第2の取得手段と、前記第2の取得手段で取得された前記第2の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶手段に記憶された対応関係に従って、前記第1の圧縮置換手段で置換された後の前記文字列を表すデータに置換する第2の圧縮置換手段と、前記第2の圧縮置換手段で置換された前記第2の構造化文書ファイルを前記通信装置に送信する第2の送信手段とを備えることを特徴とする構造化文書ファイル処理装置を提供する。
【0009】
この構造化文書ファイル処理装置によれば、前記型ファイルを用いて前記構造化文書ファイルを作成する機能を有する通信装置との間でファイルの送受信を行う装置であって、前記型ファイルを取得し、取得された前記型ファイルから識別子を検出し、検出された識別子が有している文字列を表すデータについて、該型ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換することにより、当該ファイルを圧縮する。また、置換される前の前記文字列を表すデータと置換された後の前記文字列を表すデータとの対応関係を記憶し、圧縮された前記型ファイルを前記通信装置に送信する。そして、前記通信装置で前記型ファイルを用いて作成され、前記名称文字列を表すデータに、置換された後の前記文字列を表すデータが用いられている第1の構造化文書ファイルを受信し、受信した第1の構造化文書ファイルの有する前記名称文字列を表すデータを、記憶されている対応関係に従って、置換される前の文字列に置換することにより、当該第1の構造化文書ファイルを復元する。そして、復元された第1の構造化文書ファイルと、前記型ファイルとを用いて作成された第2の構造化文書ファイルを取得し、取得された前記第2の構造化文書ファイルの有する前記名称文字列を表すデータを、記憶されている対応関係に従って、置換された後の前記文字列表すデータに置換することにより、当該ファイルを圧縮し、圧縮された前記第2の構造化文書ファイルを前記通信装置に送信する。
【0010】
また本発明は、通信装置との間でファイルの送受信を行うことが可能な装置であって、型を識別するための文字列を有する識別子と該型の内容とが対応付けられて記述される型ファイル及び/又は名称、内容および型を持つ要素であって、内容を表す内容文字列と、該内容文字列が文書において占める領域を示すとともに名称を表す名称文字列を内包する、型を識別するための識別文字列とで表される要素、を有する構造化文書を表す構造化文書ファイルを取得する第1の取得手段と、前記型ファイルに対する置換方式を、第1の置換方式又は第2の置換方式のいずれかに決定する置換方式決定手段と、前記第1の取得手段で取得された前記型ファイルから、識別子を検出する第1の検出手段と、前記置換方式決定手段により決定された置換方式が第1の置換方式である場合に、前記構造化文書ファイルから識別文字列を検出する第2の検出手段と、前記第1の検出手段により識別子が検出された型ファイルと前記第2の検出手段により識別文字列が検出された構造化文書ファイルとを構成するデータのうち、前記第1の検出手段により検出された識別子が有している文字列と、前記第2の検出手段により検出された識別文字列が内包している名称文字列とから構成される集合において完全一致の関係にある文字列群を構成する文字列を表すデータの各々について、該型ファイル及び該構造化文書ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する第1の圧縮置換手段と、前記第1の圧縮置換手段で置換された前記ファイルを前記通信装置に送信する第1の送信手段と、前記置換方式決定手段により決定された置換方式が第2の置換方式である場合に、前記第1の検出手段により検出された識別子が有している文字列を表すデータについて、該型ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する第2の圧縮置換手段と、前記第2の圧縮置換手段で置換される前の前記文字列を表すデータと、置換された後の前記文字列を表すデータとの対応関係を記憶する対応関係記憶手段と、前記第2の圧縮置換手段で置換された前記型ファイルを、前記通信装置に送信する第2の送信手段と、前記通信装置で前記型ファイルを用いて作成され、前記名称文字列を表すデータに、前記第3の圧縮置換手段で置換された後の前記文字列を表すデータが用いられている第1の構造化文書ファイルを受信する第2の受信手段と、前記第2の受信手段で受信した第1の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶手段に記憶された対応関係に従って、前記第2の圧縮置換手段で置換される前の文字列に置換する復元置換手段と、前記復元置換手段で置換された第1の構造化文書ファイルと前記型ファイルとを用いて作成された第2の構造化文書ファイルを取得する第2の取得手段と、前記第2の取得手段で取得された前記第2の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶手段に記憶された対応関係に従って、前記第1の圧縮置換手段で置換された後の前記文字列を表すデータに置換する第2の圧縮置換手段と、前記第2の圧縮置換手段で置換された前記第2の構造化文書ファイルを前記通信装置に送信する第3の送信手段とを備えることを特徴とする構造化文書ファイル処理装置を提供する。
【0011】
この構造化文書ファイル処理装置によれば、通信装置との間でファイルの送受信を行うことが可能な装置であって、前記型ファイル及び/又は前記構造化文書ファイルを取得し、前記型ファイルに対する置換方式を、第1の置換方式又は第2の置換方式のいずれかに決定し、取得された前記型ファイルから識別子を検出する。そして、決定された置換方式が第1の置換方式である場合に、前記構造化文書ファイルから識別文字列を検出し、識別子が検出された型ファイルと識別文字列が検出された構造化文書ファイルとを構成するデータのうち、検出された識別子が有している文字列と、検出された識別文字列が内包している名称文字列とから構成される集合において完全一致の関係にある文字列群を構成する文字列を表すデータの各々について、該型ファイル及び該構造化文書ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換することにより、当該ファイルを圧縮し、圧縮された当該ファイルを前記通信装置に送信する。また、決定された置換方式が第2の置換方式である場合に、前記型ファイルから検出された識別子が有している文字列を表すデータについて、該型ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換することにより、当該ファイルを圧縮する。また、置換される前の前記文字列を表すデータと、置換された後の前記文字列を表すデータとの対応関係を記憶し、圧縮された前記型ファイルを、前記通信装置に送信する。そして、前記通信装置で前記型ファイルを用いて作成され、前記名称文字列を表すデータに、置換された後の前記文字列を表すデータが用いられている第1の構造化文書ファイルを受信し、受信した第1の構造化文書ファイルの有する前記名称文字列を表すデータを、記憶されている対応関係に従って、置換される前の文字列に置換することにより、当該ファイルを復元する。次いで、復元された第1の構造化文書ファイルと前記型ファイルとを用いて作成された第2の構造化文書ファイルを取得する。そして、取得された前記第2の構造化文書ファイルの有する前記名称文字列を表すデータを、記憶されている対応関係に従って、置換された後の前記文字列表すデータに置換することにより、当該ファイルを圧縮し、圧縮された前記第2の構造化文書ファイルを前記通信装置に送信する。
【0012】
また本発明は、型を識別するための文字列を有する識別子と該型の内容とが対応付けられて記述される型ファイルから、識別子を検出する第1の検出ステップと、名称、内容および型を持つ要素であって、内容を表す内容文字列と、該内容文字列が文書において占める領域を示すとともに名称を表す名称文字列を内包する、型を識別するための識別文字列とで表される要素、を有する構造化文書を表す構造化文書ファイルから識別文字列を検出する第2の検出ステップと、前記第1の検出ステップにより識別子が検出された型ファイルと前記第2の検出ステップにより識別文字列が検出された構造化文書ファイルとを構成するデータのうち、前記第1の検出ステップにより検出された識別子が有している文字列と、前記第2の検出ステップにより検出された識別文字列が内包している名称文字列とから構成される集合において完全一致の関係にある文字列群を構成する文字列を表すデータの各々について、該型ファイル及び該構造化文書ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する置換ステップと、前記置換ステップによりデータが置換されたファイルを記憶する記憶ステップとを備えることを特徴とする構造化文書ファイル処理方法を提供する。
【0013】
この構造化文書ファイル処理方法によれば、前記型ファイルから識別子を検出し、前記構造化文書ファイルから識別文字列を検出し、識別子が検出された型ファイルと識別文字列が検出された構造化文書ファイルとを構成するデータのうち、検出された識別子が有している文字列と、検出された識別文字列が内包している名称文字列とから構成される集合において完全一致の関係にある文字列群を構成する文字列を表すデータの各々について、該型ファイル及び該構造化文書ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換することにより、当該ファイルを圧縮し、圧縮されたファイルを記憶する。
【0014】
また本発明は、型を識別するための文字列を有する識別子と該型の内容とが対応付けられて記述される型ファイルを用いて、名称、内容および型を持つ要素であって、内容を表す内容文字列と、該内容文字列が文書において占める領域を示すとともに名称を表す名称文字列を内包する、型を識別するための識別文字列とで表される要素、を有する構造化文書を表す構造化文書ファイルを作成する機能を有する通信装置との間でファイルの送受信を行う装置において用いられる方法であって、前記型ファイルを取得する第1の取得ステップと、前記第1の取得ステップで取得された前記型ファイルから、識別子を検出する第1の検出ステップと、前記第1の検出ステップにより検出された識別子が有している文字列を表すデータについて、該型ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する第1の圧縮置換ステップと、前記第1の圧縮置換ステップで置換される前の前記文字列を表すデータと、置換された後の前記文字列を表すデータとの対応関係を記憶する対応関係記憶ステップと、前記第1の圧縮置換ステップで置換された前記型ファイルを、前記通信装置に送信する第1の送信ステップと、前記通信装置で型ファイルを用いて作成され、前記名称文字列を表すデータに、前記第1の圧縮置換ステップで置換された後の前記文字列を表すデータが用いられている第1の構造化文書ファイルを受信する受信ステップと、前記受信ステップで受信した第1の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶手段に記憶された対応関係に従って、前記第1の圧縮置換ステップで置換される前の文字列に置換する復元置換ステップと、前記復元置換ステップで置換された第1の構造化文書ファイルと、前記型ファイルとを用いて作成された第2の構造化文書ファイルを取得する第2の取得ステップと、前記第2の取得ステップで取得された前記第2の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶ステップで記憶された対応関係に従って、前記第1の圧縮置換ステップで置換された後の前記文字列を表すデータに置換する第2の圧縮置換ステップと、前記第2の圧縮置換ステップで置換された前記第2の構造化文書ファイルを前記通信装置に送信する第2の送信ステップとを備えることを特徴とする構造化文書ファイル処理方法を提供する。
【0015】
この構造化文書ファイル処理方法によれば、前記型ファイルを用いて前記構造化文書ファイルを作成する機能を有する通信装置との間でファイルの送受信を行う装置であって、前記型ファイルを取得し、取得された前記型ファイルから識別子を検出し、検出された識別子が有している文字列を表すデータについて、該型ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換することにより、当該ファイルを圧縮する。また、置換される前の前記文字列を表すデータと置換された後の前記文字列を表すデータとの対応関係を記憶し、圧縮された前記型ファイルを前記通信装置に送信する。そして、前記通信装置で前記型ファイルを用いて作成され、前記名称文字列を表すデータに、置換された後の前記文字列を表すデータが用いられている第1の構造化文書ファイルを受信し、受信した第1の構造化文書ファイルの有する前記名称文字列を表すデータを、記憶されている対応関係に従って、置換される前の文字列に置換することにより、当該第1の構造化文書ファイルを復元する。そして、復元された第1の構造化文書ファイルと、前記型ファイルとを用いて作成された第2の構造化文書ファイルを取得し、取得された前記第2の構造化文書ファイルの有する前記名称文字列を表すデータを、記憶されている対応関係に従って、置換された後の前記文字列表すデータに置換することにより、当該ファイルを圧縮し、圧縮された前記第2の構造化文書ファイルを前記通信装置に送信する。
【0016】
また本発明は、コンピュータに、型を識別するための文字列を有する識別子と該型の内容とが対応付けられて記述される型ファイルから、識別子を検出する第1の検出ステップと、名称、内容および型を持つ要素であって、内容を表す内容文字列と、該内容文字列が文書において占める領域を示すとともに名称を表す名称文字列を内包する、型を識別するための識別文字列とで表される要素、を有する構造化文書を表す構造化文書ファイルから識別文字列を検出する第2の検出ステップと、前記第1の検出ステップにより識別子が検出された型ファイルと前記第2の検出ステップにより識別文字列が検出された構造化文書ファイルとを構成するデータのうち、前記第1の検出ステップにより検出された識別子が有している文字列と、前記第2の検出ステップにより検出された識別文字列が内包している名称文字列とから構成される集合において完全一致の関係にある文字列群を構成する文字列を表すデータの各々について、該型ファイル及び該構造化文書ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する置換ステップと、前記置換ステップによりデータが置換されたファイルを記憶する記憶ステップとを実行させるための構造化文書ファイル処理プログラムを提供する。
【0017】
この構造化文書ファイル処理プログラムによれば、前記型ファイルから識別子を検出し、前記構造化文書ファイルから識別文字列を検出し、識別子が検出された型ファイルと識別文字列が検出された構造化文書ファイルとを構成するデータのうち、検出された識別子が有している文字列と、検出された識別文字列が内包している名称文字列とから構成される集合において完全一致の関係にある文字列群を構成する文字列を表すデータの各々について、該型ファイル及び該構造化文書ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換することにより、当該ファイルを圧縮し、圧縮されたファイルを記憶する。
【0018】
また本発明は、型を識別するための文字列を有する識別子と該型の内容とが対応付けられて記述される型ファイルを用いて、名称、内容および型を持つ要素であって、内容を表す内容文字列と、該内容文字列が文書において占める領域を示すとともに名称を表す名称文字列を内包する、型を識別するための識別文字列とで表される要素、を有する構造化文書を表す構造化文書ファイルを作成する機能を有する通信装置との間でファイルの送受信を行うコンピュータに、前記型ファイルを取得する第1の取得ステップと、
前記第1の取得ステップで取得された前記型ファイルから、識別子を検出する第1の検出ステップと、前記第1の検出ステップにより検出された識別子が有している文字列を表すデータについて、該型ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する第1の圧縮置換ステップと、前記第1の圧縮置換ステップで置換される前の前記文字列を表すデータと、置換された後の前記文字列を表すデータとの対応関係を記憶する対応関係記憶ステップと、前記第1の圧縮置換ステップで置換された前記型ファイルを、前記通信装置に送信する第1の送信ステップと、前記通信装置で型ファイルを用いて作成され、前記名称文字列を表すデータに、前記第1の圧縮置換ステップで置換された後の前記文字列を表すデータが用いられている第1の構造化文書ファイルを受信する受信ステップと、前記受信ステップで受信した第1の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶ステップに記憶された対応関係に従って、前記第1の圧縮置換ステップで置換される前の文字列に置換する復元置換ステップと、前記復元置換ステップで置換された第1の構造化文書ファイルと、前記型ファイルとを用いて作成された第2の構造化文書ファイルを取得する第2の取得ステップと、前記第2の取得ステップで取得された前記第2の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶ステップで記憶された対応関係に従って、前記第1の圧縮置換ステップで置換された後の前記文字列を表すデータに置換する第2の圧縮置換ステップと、前記第2の圧縮置換ステップで置換された前記第2の構造化文書ファイルを前記通信装置に送信する第2の送信ステップとを実行させるための構造化文書ファイル処理プログラムを提供する。
【0019】
この構造化文書ファイル処理プログラムによれば、前記型ファイルを用いて前記構造化文書ファイルを作成する機能を有する通信装置との間でファイルの送受信を行う装置であって、前記型ファイルを取得し、取得された前記型ファイルから識別子を検出し、検出された識別子が有している文字列を表すデータについて、該型ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換することにより、当該ファイルを圧縮する。また、置換される前の前記文字列を表すデータと置換された後の前記文字列を表すデータとの対応関係を記憶し、圧縮された前記型ファイルを前記通信装置に送信する。そして、前記通信装置で前記型ファイルを用いて作成され、前記名称文字列を表すデータに、置換された後の前記文字列を表すデータが用いられている第1の構造化文書ファイルを受信し、受信した第1の構造化文書ファイルの有する前記名称文字列を表すデータを、記憶されている対応関係に従って、置換される前の文字列に置換することにより、当該第1の構造化文書ファイルを復元する。そして、復元された第1の構造化文書ファイルと、前記型ファイルとを用いて作成された第2の構造化文書ファイルを取得し、取得された前記第2の構造化文書ファイルの有する前記名称文字列を表すデータを、記憶されている対応関係に従って、置換された後の前記文字列表すデータに置換することにより、当該ファイルを圧縮し、圧縮された前記第2の構造化文書ファイルを前記通信装置に送信する。
【0020】
また本発明は、上述のプログラムを記憶した記憶媒体を提供する。
【0021】
【発明の実施の形態】
以下、図面を参照して本発明の実施形態について説明する。なお、各図において共通する部分には、同一の符号が付されている。
[1.第1実施形態]
(1)構成
本実施形態においては、構造化文書の内容を表す構造化文書データとして、XML文書データを用いる。なお、XML文書データは、主に、ファイルの形態で取り扱われるため、以下の説明では、ファイルの形態のXML文書データをXMLファイルという。また、XMLファイルは、文書をどう表示させるかを定義するXSLファイルなどの定義ファイル(型ファイル)とともに用いられることが一般的である。そこで、XMLファイルとともにXSLファイルを用いる場合について説明する。
<通信システムの構成>
図1は、この発明の第1実施形態に係る通信システムTの構成を例示するブロック図である。ユーザ10が通信端末1を操作することにより、XMLファイルと、当該XMLファイルの文書をどう表示させるかを定義するXSLファイルと(以下、このXMLファイルとこのXSLファイルとを合わせてXMLファイル群という)を、仲介サーバ装置3を介して通信端末2へ送信する。通信端末2は、送信されたXMLファイル群を受信する。ユーザ20は、この通信端末2を操作する。
なお、この通信システムTには、本来、多数の通信端末、サーバが存在しうるが、図面が煩雑になることを防ぐために、2台の通信端末1、2と、1台の仲介サーバ装置3のみを図示している。
【0022】
通信端末1は、通信機能を有するコンピュータ装置であり、仲介サーバ装置3を介して通信端末2とデータ通信を行う機能を有している。当該通信端末1には、社員リストデータであるXMLファイル(図3参照)や、XSLファイル(図4参照)が格納されている。そして、通信端末1は、これらのXMLファイル群を、仲介サーバ装置3を介して通信端末2へ送信する機能を有している。なお、社員リストデータとは、社員の情報として、社員氏名や、社員番号、所属部署などの情報が社員番号毎に記憶されているものである。
【0023】
仲介サーバ装置3は、通信端末1と通信端末2とのデータ通信を中継する機能を有している。また、通信端末1から送信されたXMLファイル群を圧縮する機能と、圧縮されたこれらのファイルを通信端末2へ宛てて送信する機能を有している。なお、詳細な構成については後述する。
【0024】
通信端末2は、通信端末1と同様に通信機能を有するコンピュータ装置であり、仲介サーバ装置3を介して通信端末1とデータ通信を行う機能を有している。また、XMLファイル群に従って、情報を表示部に表示する機能を有している。当該機能について、具体的に、図4〜7を参照しながら説明する。図4〜6は、それぞれのファイルの内容を示した図であり、図7は、ファイルの内容に従って表示部に表示される画面例を示した図である。
操作部にて図4に示されるようなXMLファイルの表示指示がなされると、符号F3に示されるように、当該XMLファイル中に参照することが指定されているXSLファイル名を有するXSLファイル(図5参照)を読み出す。そして、当該XMLファイル及びXSLファイルとを用いて、図6に示されるようなHTML形式のファイルを生成する。そして、当該HTML形式のファイルに従って、図7に示されるように、文書を表示部に表示する。
【0025】
<仲介サーバ装置3の構成>
図2は、図1に示された仲介サーバ装置3のハードウェア構成を示すブロック図である。
ROM31には、仲介サーバ装置3の装置各部の基本制御を司るプログラムが格納されている。また、RAM32は、CPU30のワークエリアとして用いられ、CPU30により実行される各種のプログラムやデータを一時的に格納する。
【0026】
HD(Hard Disk)33には、仲介サーバ装置3のオペレーティングシステムなどが格納される。また、通信端末1から受信したXMLファイル群を圧縮する機能をCPU30に実現させるためのプログラムや、圧縮されたこれらのファイルを通信端末2へ送信する機能をCPU30に実現させるためのプログラムが格納されている。
【0027】
通信インタフェース34は、当該仲介サーバ装置3と通信端末1,2との間で行われる通信を制御する。また、CPU30は、ROM31やHD33などに格納されている各種プログラムを実行することにより、バス36を介して接続されている装置各部を制御する。
【0028】
次に、CPU30が各種のプログラムを実行することにより、仲介サーバ装置3に実現される機能について説明する。
図3は、仲介サーバ装置3において実現される機能を例示するブロック図である。1点鎖線の中に示した部分が上述の機能を示しており、これらの機能は、図2に示したROM31、HD33に記憶されているプログラムをCPU30が実行することによって実現される。
【0029】
データ受信機能300は、XMLファイル群を受信する。
データ圧縮処理機能301は、データ受信機能300によって受信されたXMLファイル群について、これらのファイルに共通して用いられる要素名や属性名を、短い文字列に置換することにより、XMLファイル群の圧縮処理を行う。
圧縮データ送信機能302は、データ圧縮処理機能301によって圧縮されたXMLファイル群を送信する。
【0030】
(2)動作
次に本実施形態の動作について説明する。図8は、XMLファイル群を圧縮する処理の流れを示すフローチャートである。
なお、仲介サーバ装置3の図示しない電源が投入され、CPU30によってROM31に格納されたプログラムが実行された後、HD33に格納されたオペレーションシステムが実行され、ユーザ(管理者)によって指示が入力されることによりHD33に格納されたプログラムが実行され、「(1)構成」で述べた機能が実現される。通信端末1、2においても、同様に、それぞれ図示しない電源が投入され、ユーザ10、20によってそれぞれ指示が入力されることにより、「(1)構成」で述べた機能が実現される。
まず、ユーザ10が通信端末1の操作部において操作を行い、圧縮したいXMLファイル群を選択し、通信端末2の通信アドレスを指定すると、通信端末1の制御部は当該XMLファイル群と通信アドレスとを仲介サーバ装置3へ送信する(ステップS10)。仲介サーバ装置3のCPU30は、通信インタフェース34を介して当該XMLファイル群と、通信アドレスとを受信する(ステップS11)と、これらを一時的にRAM32に格納する。そして、このXMLファイル群に対して以下の圧縮処理を開始する。
まず、XMLファイル群中に用いられる要素名及び属性名を全て抽出する。具体的には、‘<’及び‘>’で囲まれた非定型の文字列を抽出する。例えば、図4の要素名Y1、Y2、Y3、属性名Z1に示されるような文字列を抽出する。そして、抽出された各要素名、属性名に対し、これらがこのXMLファイル群内において一意に識別可能となるように、それぞれ数字を割り当てる。そして、CPU30は、このXMLファイル群について、要素名及び属性名を、それぞれ割り当てられた数字に置換し、新たなXMLファイル(図9参照)及びXSLファイル(図10参照)を生成し、RAM32に格納させる(ステップS12)。なお、図9,10に示す例では、要素名Y1について‘研究開発部門社員名簿録’を‘1’に置換し、要素名Y2について‘社員’を‘2’に置換し、要素名Y3について‘社員番号’を‘3’に置換し、属性名Z1について‘雇用’を‘91’に置換している。
以上のようにして、仲介サーバ装置3は、XMLファイルと、当該XMLファイルと関連付けされているXSLファイルにおいて共通して使用されている要素名や属性名を、短い文字列に置換することにより、XMLファイル群の圧縮処理を行う。
その後、CPU30は、圧縮後のXMLファイル群を、RAM32に一時的に格納した通信アドレスを用いて、通信端末2へと送信する(ステップS13)。
【0031】
通信端末2の制御部は、XMLファイル群を受信し(ステップS14)、これを記憶部に格納する。その後、ユーザ20が、操作部にて当該XMLファイルの表示を指示すると、制御部は、当該XMLファイルを記憶部から読み出す。更に、このXMLファイルに関連付けられているXSLファイルを読み出す。具体的には、図9の符号F3に示されるように、当該XMLファイル中に参照することが指定されているXSLファイル名を有するXSLファイル(図10参照)を読み出す。制御部は、以上のようにして読み出したXMLファイル群を用いて、図6に示されるようなHTML形式のファイルを生成し、図7に示されるような文書を表示部に表示する。
【0032】
以上のようにして、XMLファイル群に対して圧縮処理を行うことにより、データ量を格段に低減させることができるとともに、圧縮処理を行っていないXMLファイル群を用いて表示される文書情報(図7参照)となんら変わらない情報を表示することができる。従って、圧縮処理を施されたXMLファイル群に対して復元処理を施さなくても良く、また、要素名や属性名を何に置換したかを示す情報をこれらのファイルとともに送信する必要がなく、当該ファイルの取回しが容易になる。
【0033】
なお、XMLファイルには、更に、DTDといわれる定義ファイルが関連付けられたり、又は、XSLファイルの代わりにXSLTファイルなどの他の表示定義ファイルが関連付けられたりする。そこで、これらのファイルの任意の組合せにおいて、上述と同様の圧縮処理を行っても良い。
【0034】
また、通信システムTに仲介サーバ装置3を備えない構成であっても良い。このような構成において、通信端末1に上述のXMLファイル群圧縮機能や、当該圧縮XMLファイル群送信機能を備えるようにすれば良い。
【0035】
[2.第2実施形態]
(1)構成
図11は、この発明の第1実施形態に係る通信システムT′の構成を例示するブロック図である。通信システムT′においては、WSDL(Web Service Description Language)ファイルと、XMLファイルとを別個に、通信端末1′及び通信端末2′とが仲介サーバ装置3′を介して送受信し合う。なお、WSDLファイルとは、XMLファイルの提供(サービス)や、インタフェースについて定義する定義ファイル(型ファイル)のことであり、具体的には、XMLファイルで用いられる要素名、属性名の意味定義や、処理形態、表記方式などが定義されている。
なお、この通信システムT′には、本来、多数の通信端末、サーバが存在しうるが、図面が煩雑になることを防ぐために、2台の通信端末1′、2′と、1台の仲介サーバ装置3′のみを図示している。また、本実施形態の説明において、上記第1実施形態と共通する部分については説明を省略する。
【0036】
通信端末1′は、社員リストデータである、上述の第1形態と同様のXMLファイル(図4参照)や、当該XMLファイルに関連するWSDLファイル(図19参照)が格納されている。そして、通信端末2′からの要求に応じて、このWSDLファイルを通信端末2′に宛てて送信する機能や、通信端末2′からのサービス要求に応じて、XMLファイルの検索を行い、検索の結果に応じたXMLファイルを生成し、これを通信端末2′に宛てて送信するサービス応答機能を有する。
【0037】
通信端末2′は、通信端末1′へWSDLファイルの要求を行うサービス定義要求機能や、通信端末1′から送信されたWSDLファイルに従って、通信端末1′にサービス要求を行うXMLファイルを作成する機能や、当該XMLファイルを通信端末1′に宛てて送信する機能を有する。
【0038】
<仲介サーバ装置3′の構成>
図12は、本実施形態に係る仲介サーバ装置3′のハードウェア構成を示すブロック図である。
本実施形態に係る仲介サーバ装置3′について、上述の第1実施形態の仲介サーバ装置3と構成が異なる点は以下の通りである。HD33′には、通信端末1から受信したWSDLファイルを圧縮する機能をCPU30′に実現させるためのプログラムや、XMLファイルを圧縮したり、復元したりする機能をCPU30′に実現させるためのプログラムや、圧縮されたこれらのファイルを通信端末2′へ送信する機能をCPU30′に実現させるためのプログラムが格納されている。
また、HD33′には、WSDLファイルを圧縮する際に用いられる対応テーブル33a′(図13参照)と、置換テーブル33b′(図14参照)とが格納されている。
この対応テーブル33a′は、圧縮を行ったファイルのファイル名と、置換ルールIDとを対応付けて記憶しており、置換テーブル33b′は、置換ルールID毎に、置換前の要素名、属性名と、それらの各々と対応する置換後の数字とをそれぞれ記憶している。
【0039】
次に、CPU30′が各種のプログラムを実行することにより、仲介サーバ装置3′に実現される機能について説明する。
図15は、仲介サーバ装置3′において実現される機能を例示するブロック図である。1点鎖線の中に示した部分が上述の機能を示しており、これらの機能は、図12に示したROM31′、HD33′に記憶されているプログラムをCPU30′が実行することによって実現される。
【0040】
データ受信機能300′は、XMLファイルや、当該XMLファイルの定義ファイルであるWSDLファイルを受信(取得)する。
データ圧縮処理機能301′は、WSDLファイルに用いられる要素名、属性名を短い文字列に置換することにより、当該ファイルの圧縮を行う。また、前記WSDLファイルに対応するXMLファイルを、置換情報参照機能305′からの通知内容に基づいて圧縮する処理を行う。
置換情報作成機能303′は、WSDLファイルの圧縮処理の際、どのWSDLファイルに対してどのような圧縮を行ったのかという情報を対応テーブル33a′に記憶させ、どの要素名、属性名を、何の文字列に置換したか、即ち、置換前の要素名、属性名と、置換後の要素名、属性名との対応関係を置換テーブ33b′に記憶させる。
置換情報格納機能304′は、上述の対応テーブル33a′と、置換テーブ33b′と(以下、置換情報という)を格納している。
圧縮データ送信機能302′は、データ圧縮処理機能301′によって圧縮された圧縮されたWSDLファイルやXMLファイルを送信する。
データ復元処理機能307′は、圧縮データ受信機能308′によって受信された圧縮XMLファイルを、置換情報参照機能305′からの通知内容に基づいて復元する処理を行う。
置換情報参照機能305′は、圧縮XMLファイルの復元処理の際、当該ファイルに用いられる置換後の要素名や属性名について、置換情報格納機能304′によって格納されている置換情報を参照することにより、置換前の要素名や、属性名を得て、これをデータ復元処理機能307′に通知する。また、前記WSDLファイルに対応するXMLファイルの圧縮処理の際には、当該ファイルに用いられている要素名、属性名を、置換情報格納機能304′によって格納されている置換情報を参照することにより、置換後の文字列を得て、これをデータ圧縮処理機能301′に通知する。
データ送信機能306′は、データ復元処理機能307′によって復元されたXMLファイルを送信する。
圧縮データ受信機能308′は、圧縮されたXMLファイルを受信する。
【0041】
(2)動作
次に本実施形態の動作について説明する。図16〜18は、WSDLファイル、XMLファイルを圧縮する処理の流れを示すフローチャートである。
なお、本動作においては、通信端末1′と通信端末2′と仲介サーバ装置3′を介して通信を行う際には、互いの通信アドレスを指定することが必要となるが、説明が煩雑となるため、その説明を省略する。
図16に示されるように、ユーザ20が通信端末2′の操作部にて、社員リストデータの検索を行うため、通信端末1′へ、当該検索に係るWSDLファイルの要求を行うと(サービス定義要求)(ステップS20)、仲介サーバ装置3′を介して当該要求が通信端末2′へ送信される。通信端末1′は、当該要求を受信すると、当該要求に該当するWSDLファイルを仲介サーバ装置3′へ送信する(ステップS21)。図19に示されように、このWSDLファイルには、社員リストデータを検索するための手続きや、その検索条件、また検索結果を返すための手続きや、その検索結果に関する定義情報が含まれている。具体的には、検索条件として、社員氏名又は所属部署が指定されると、当該社員氏名又は所属部署に該当する社員番号を検索結果として出力することが定義されている。
【0042】
仲介サーバ装置3′のCPU30′は、当該WSDLファイルを受信すると(ステップS22)、これを一時的にRAM32′に格納する。そして、このWSDLファイルに対して以下の圧縮処理を開始する。
まず、WSDLファイル中に用いられる要素名及び属性名を全て抽出する。そして、抽出された各要素名、属性名に対し、これらがこのWSDLファイル内において一意に識別可能となるように、それぞれ数字を割り当てる。そして、CPU30′は、各要素名、属性名と、これらにそれぞれ割り当てた数字との対応関係に、置換ルールIDを割り当て、当該レコードを置換テーブル33b′(図14参照)に格納する。また、このWSDLファイルのファイル名と、この置換ルールIDとを対応付けて、対応テーブル33a′(図13参照)に格納する。それと同時に、当該WSDLファイルにおいて用いられる要素名、属性名を、それぞれ割り当てられた数字に置換して、新たなWSDLファイル(以下、圧縮WSDLファイルという)を生成し、これをRAM32′に格納する(ステップS23)。なお、本実施形態においては、図20に示されるように、要素名‘社員リスト検索’を‘10’に置換し、要素名‘検索条件’を‘20’に置換し、要素名‘検索条件’を‘60’に置換している。
以上のようにして、仲介サーバ装置3′は、WSDLファイルにおいて使用されている要素名や属性名を、短い文字列に置換することにより、WSDLファイルの圧縮処理を行う。
その後、CPU30′は、圧縮WSDLファイルを、通信端末2′へと送信する(ステップS24)。
【0043】
一方、通信端末2′は、圧縮WSDLファイルを受信する(ステップS25)。そして、図17に示されるように、ユーザ20は、この圧縮WSDLファイルを用いて、図21に示されるようなXMLファイルを作成する(ステップS30)。同図においては、検索条件として、社員氏名に‘山田太郎’を指定している。また、同図に示されるように、このXMLファイルにおいて用いられる要素名、属性名は、上述の圧縮処理で置換された数字となっている。
その後、ユーザ20は、操作部にて操作を行い、当該XMLファイルを仲介サーバ装置3′へ送信する(サービス要求)(ステップS31)。
【0044】
仲介サーバ装置3′のCPU30′は、当該XMLファイルを受信すると(ステップS32)、これを一時的にRAM32′に格納する。
そして、このXMLファイルに対応するWSDLファイルに、どのような圧縮処理がなされたかという情報を読み出し、この情報に基づいて、XMLファイルを復元する処理を行う。具体的には、図21の符号F2に示されるように、このXMLファイルにおいて指定されているWSDLファイル名に基づいて、対応テーブル33a′(図13参照)を参照し、該当する置換ルールIDを読み出す。そして、読み出した置換ルールIDに基づいて、置換テーブル33b′(図14参照)を参照し、置換後の数字から、置換前の文字列との対応関係を読み出す。例えば、要素名‘20’に対応する要素名‘検索条件’や、要素名‘60’に対応する要素名‘検索結果’などを読み出し、図21に示されるXMLファイルから、図22に示されるようなXMLファイルを生成する。
以上のようにして、XMLファイル中に用いられる要素名、属性名を、元の文字列に復元して、新たなXMLファイル(以下、復元XMLファイルという)を生成する(ステップS33)。そして、この復元XMLファイルを通信端末1′へ送信する(ステップS34)。
【0045】
通信端末1′は、復元XMLファイルを受信すると(ステップS35)、次に、図18に示されるように、この復元XMLファイルに対応するWSDLファイルに従うとともに、復元XMLファイルに指示される検索条件に従って、社員リストデータの検索を行い(ステップS40)、該当するデータを抽出する(ステップS41)。そして、このデータに基づいて、XMLファイルを生成し(ステップS42)、これを仲介サーバ装置3′へ送信する(サービス応答)(ステップS43)。なお、生成したXMLファイルは、例えば、図23に示されるものであり、上述の検索条件に該当する社員番号が‘00001’と、‘00002’であることを示している。
【0046】
仲介サーバ装置3′のCPU30′は、当該XMLファイルを受信すると(ステップS44)、これを一時的にRAM32′に格納する。このようにして、仲介サーバ装置3′は、上述の復元XMLファイル及びこのXMLファイルに対応するWSDLファイルを用いて作成されたXMLファイルを取得する。
次いで、CPU30′は、HD33′に格納されている対応テーブル33a′及び置換テーブル33b′を参照して、上述の圧縮処理と同様に、当該XMLファイル中に用いられている要素名、及び属性名を数字に置換し、図24に示されるような新たなXMLファイル(以下、圧縮XMLファイルという)を生成する(ステップS45)。そして、この圧縮XMLファイルを、通信端末2′へ送信する(ステップS46)。
【0047】
通信端末2′は、圧縮XMLファイルを受信する(ステップS47)。その結果、ユーザ20は、社員氏名が‘山田太郎’である社員の社員番号が、‘00001’と‘00002’とであるという検索結果を得ることができる。
【0048】
以上のように、XMLファイルと、当該XMLファイルに対応付けられているWSDLファイルにおいて、要素名、属性名が共通して使用されることに着目して、XMLファイル、WSDLファイルに対して上述のような圧縮・復元処理を施すことにより、当該ファイルのサイズを確実に減少させることができる。ひいては通信システムT′における通信処理の負担を軽減することができる。また、通信端末1′,2′については、本発明に係る特別な機能を備えない構成としているため、これらの通信端末に、XMLファイル及びこのXMLファイルに対応するファイルを処理可能な既存の通信端末を用いることができる。
【0049】
なお、上述の第1実施形態と同様に、XMLファイルにXSLファイルが対応付けされている場合、XMLファイル及びXSLファイルに共通して用いられる要素名、属性名を数字に置換して、XMLファイル及びXSLファイルの圧縮を行うようにしても良い。
【0050】
また、通信システムT′に仲介サーバ装置3′を備えない構成あっても良い。このような構成において、通信端末1′に上述のWSDLファイルやXMLファイルを圧縮する機能、WSDLファイルやXMLファイルを受信(取得)する機能、WSDLファイルやXMLファイルを送信する機能、XMLファイルを復元する機能、XMLファイル及びこのXMLファイルに対応するWSDLファイルファイルを用いて、新たなXMLファイルを生成(取得)する機能、新たに生成されたXMLファイルを送信する機能を有するようにすれば良い。
【0051】
また、図16において、ステップS20の通信端末2′から通信端末1′に対するWSDLファイルの要求がなくても、通信端末1′から通信端末2′へWSDLファイルを送信する構成であっても良い。
【0052】
[3.変形例]
以上、本発明の実施形態について説明したが、本発明はその主要な特徴から逸脱することなく他の様々な形態で実施することが可能である。上述した各実施形態は、本発明の一態様を例示したものに過ぎず、本発明の範囲は、特許請求の範囲に示す通りであって、また、特許請求の範囲の均等範囲に属する変形や変更は、全て本発明の範囲内のものである。なお、変形例としては、例えば、以下のようなものが考えられる。
【0053】
(1)変形例1
上述の各実施形態において、図3に示した上述の第1実施形態に係る仲介サーバ装置3の機能と、図15に示した上述の第2実施形態に係る仲介サーバ装置3′の機能とを組み合わせた機能を有する仲介サーバ装置を用いても良い。この場合、以下の2つの構成が考えられる。
▲1▼ファイルの拡張子により処理方式を決定する
仲介サーバ装置4は、上述の仲介サーバ装置3とほぼ同様の構成をしており、これと異なる点は、以下の通りである。
図示しないHDには、図示しない通信端末から受信したXMLファイルや、定義ファイルを受信し、この定義ファイルの拡張子から、これらのファイルをどのような処理方式で圧縮するのかを決定し、その決定に従って、上述の第1実施形態に係る圧縮する機能を図示しないCPUに実現させるためのプログラムや、その決定に従って、上述の第2実施形態に係る圧縮・復元する機能をCPUに実現させるためのプログラムや、圧縮されたファイル又は復元されたファイルを図示しない他の通信端末に送信する機能をCPUに実現させるためのプログラムなどが格納されている。
また、このHDには、受信した定義ファイルの拡張子から、受信したファイルをどのような圧縮方式で圧縮するのかを決定する際に、使用される処理方式選択テーブル(図27参照)を格納している。図27には、定義ファイルの拡張子がDTD又はXSLであれば、方式1(上述の第1実施形態に係る圧縮方式)によってファイルの圧縮を行うことが示されており、定義ファイルの拡張子がWSDLであれば、方式2(上述の第2実施形態に係る圧縮・復元方式)によってファイルの圧縮を行うことが示されている。
次に、図25に示されるような、仲介サーバ装置4において実現される機能について説明する。なお、以下の説明において、上述の第1実施形態に係る仲介サーバ装置3の機能及び上述の第2実施形態に係る仲介サーバ装置3′と異なる点のみ説明する。
データ受信機能400は、XMLファイルや、その定義ファイルを受信(取得)する。そして、受信した定義ファイルの拡張子を処理方式選択機能409に供給する。また、受信したXMLファイルや、定義ファイルをデータ圧縮機能401に供給する。
処理方式選択情報格納機能410は、上述の処理方式選択テーブルを格納している。
処理方式選択機能409は、データ受信機能400によって供給された拡張子に基づいて、処理方式選択情報格納機能410によって格納されている処理方式選択テーブルを参照して、当該拡張子に対応する処理方式を選択し、これをデータ圧縮機能401に供給する。
データ圧縮処理機能401は、データ受信機能400によって供給された定義ファイル、XMLファイルを、処理方式選択機能409によって供給された処理方式に応じて、圧縮する処理を行う。例えば、処理方式選択機能409によって供給される処理方式が、方式1であれば、上述の第1実施形態における圧縮処理を行い、方式2であれば、上述の第2実施形態における圧縮処理を行う。
以上のような仲介サーバ装置4を用いることにより、通信端末からXMLファイル及びXSLファイル、DTDファイルが送信された場合には、当該ファイルに対して上述の第1実施形態に係る圧縮処理が行われ、通信端末からWSDLファイルが送信された場合には、当該ファイルに対して上述の第2実施形態に係る圧縮処理が行われる。
【0054】
▲2▼XMLファイルや、その定義ファイルを送信する通信端末が、仲介サーバ装置に処理方式の通知を行う
XMLファイルや、その定義ファイルを送信する通信端末は、これらのファイルを送信する前又は送信すると同時に、これらのファイルを上述の第1実施形態又は第2実施形態のいずれかの処理方式によって圧縮又は復元するのかを指定する情報(以下、処理方式情報という)を仲介サーバ装置5に送信する。この処理方式情報には、例えば、定義ファイル名と、当該ファイル名を有する定義ファイルに対する処理方式とが含まれている。また、処理方式には、上述の第1実施形態に係る処理方式を指定する場合には「処理方式1」が、上述の第2実施形態に係る処理方式を指定する場合には「処理方式2」が、指定される。
仲介サーバ装置5は、上述の仲介サーバ装置3とほぼ同様の構成をしており、これと異なる点は、以下の通りである。
図示しないHDには、図示しない通信端末から受信したXMLファイルや、定義ファイルや、処理方式情報を受信し、この処理方式情報に従って、上述の第1実施形態に係る圧縮する機能を図示しないCPUに実現させるためのプログラムや、この処理方式情報に従って、上述の第2実施形態に係る圧縮・復元する機能をCPUに実現させるためのプログラムや、圧縮されたファイル又は復元されたファイルを図示しない他の通信端末に送信する機能をCPUに実現させるためのプログラムなどが格納されている。
また、このHDには、処理方法対応テーブルが記憶されている。この処理方法対応テーブルには、図28に示されるように、上述の通信端末から受信した処理方式情報に含まれる定義ファイルのファイル名と、処理方式とが対応付けられて記憶される。同図には、ファイル名がa.dtdの定義ファイルに対して、方式1(上述の第1実施形態に係る圧縮方式)による圧縮処理を行い、ファイル名がb.wsdlの定義ファイルに対して、方式1(上述の第1実施形態に係る圧縮方式)による圧縮処理を行うことが示されている。
次に、図26に示されるような、仲介サーバ装置5において実現される機能について説明する。なお、以下の説明において、上述の第1実施形態に係る仲介サーバ装置3の機能及び上述の第2実施形態に係る仲介サーバ装置3′と異なる点のみ説明する。
データ受信機能500は、XMLファイルや、その定義ファイルを受信(取得)する。
処理方式情報受信機能509は、処理方式情報を受信し、当該情報に基づいて、データ圧縮処理機能501に処理方式を供給する。また、処理方式と定義ファイルとの対応関係を処理方式対応情報格納機能510に供給する。
処理方式対応情報格納機能510は、処理方式情報受信機能509によって通知される上述の対応関係を、上述の処理方式対応テーブルに格納する。
データ圧縮処理機能501は、データ受信機能500によって供給された定義ファイル、XMLファイルを、処理方式情報受信機能509によって供給された処理方式に応じて、圧縮する処理を行う。例えば、処理方式情報受信機能509によって供給される処理方式が、方式1であれば、上述の第1実施形態における圧縮処理を行い、方式2であれば、上述の第2実施形態における圧縮処理を行う。
以上のような仲介サーバ装置4を用いることにより、通信端末からXMLファイル及びXSLファイル、DTDファイルが送信された場合には、当該ファイルに対して上述の第1実施形態に係る圧縮処理が行われ、通信端末からWSDLファイルが送信された場合には、当該ファイルに対して上述の第2実施形態に係る圧縮処理が行われる。
【0055】
上述の▲1▼、▲2▼の構成によれば、上述の第1実施形態に係る圧縮処理と、上述の第2実施形態に係る圧縮・復元処理とを、1つの仲介サーバ装置4又は仲介サーバ装置5によって行うことができる。
【0056】
(2)変形例2
上述の各実施形態、各変形例における各通信システムにおいて、インターネットや、移動パケット通信網などの通信網を介して通信が行われるようにしても良い。また、通信システムにおけるファイルの送受信は、FTPやHTTPのプロトコル、プッシュプロトコルなどの様々な通信方法を用いて行っても良い。また、電子メールに添付してXMLファイル、XSLファイル、WSDLファイルを送受信するようにしても良い。
【0057】
(3)変形例3
上述の各実施形態、各変形例において、XMLファイル、XSLファイル、WSDLファイルにおいて用いられる要素名や、属性名を、上述のように数字に置換するのではなく、文字数の少ない文字列や、文字と数字の組合わせなど、その他の短い文字列に置換すれば良い。
【0058】
(4)変形例4
通信端末1,2,1′,2′は、通信機能を有するコンピュータであれば、サーバ、クライアント端末、PCパーソナルコンピュータ、PDAや、携帯電話機などであっても良い。
【0059】
(5)変形例5
上述の各実施形態、各変形例に係るプログラムは、HDに格納されるとしたが、ROMに格納されていても良い。また、仲介サーバ装置3、3′、4、5に、図示しない着脱可能な記憶媒体を備え、この記憶媒体に、当該プログラムを記憶させるようにしても良い。
【0060】
(6)変形例6
構造化文書データとして、XMLファイル以外のSGML(Standard Generalized Markup Language)ファイルなどのファイルであっても良い。また、要素名に定型の文字列が使用されるHTML(Hyper Text Markup Language)ファイルなどのファイルを用いても良い。
【0061】
(7)変形例7
上述の各実施形態の説明で用いたXMLファイル、XSLファイル、WSDLファイルの情報内容は、上述のものに限らず、様々なものであっても良い。
【0062】
【発明の効果】
以上説明したように本発明によれば、構造化文書仕様に従って表現されたデータファイルを確実に圧縮することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る通信システムの構成を例示するブロック図である。
【図2】同実施形態に係る仲介サーバ装置のハードウェア構成を例示するブロック図である。
【図3】同実施形態に係る仲介サーバ装置において実現される機能を例示するブロック図である。
【図4】同実施形態に係るXMLファイルに示される内容を示す図である。
【図5】同実施形態に係るXSLファイルに示される内容を示す図である。
【図6】同実施形態に係るHTML形式のファイルに示される内容を示す図である。
【図7】同実施形態に係るHTML形式のファイルの内容に従って表示部に表示される画面例を示す図である。
【図8】同実施形態に係るXMLファイル群を圧縮する処理の流れを示すフローチャートである。
【図9】同実施形態に係る圧縮処理を施されたXMLファイルに示される内容を示す図である。
【図10】同実施形態に係る圧縮処理を施されたXSLファイルに示される内容を示す図である。
【図11】本発明の他の実施形態に係る通信システムの構成を例示するブロック図である。
【図12】同実施形態に係る仲介サーバ装置のハードウェア構成を例示するブロック図である。
【図13】同実施形態に係る対応テーブルに示される内容を示す図である。
【図14】同実施形態に係る置換テーブルに示される内容を示す図である。
【図15】同実施形態に係る仲介サーバ装置において実現される機能を例示するブロック図である。
【図16】同実施形態に係るWSDLファイル、XMLファイルを圧縮する処理の流れの一部を示すフローチャートである。
【図17】同実施形態に係るWSDLファイル、XMLファイルを圧縮する処理の流れの一部を示すフローチャートである。
【図18】同実施形態に係るWSDLファイル、XMLファイルを圧縮する処理の流れの一部を示すフローチャートである。
【図19】同実施形態に係るWSDLファイルに示される内容を示す図である。
【図20】同実施形態に係る圧縮処理を施されたWSDLファイルに示される内容を示す図である。
【図21】同実施形態に係る圧縮処理を施されたXMLファイルに示される内容を示す図である。
【図22】同実施形態に係るXMLファイルに示される内容を示す図である。
【図23】同実施形態に係るXMLファイルに示される内容を示す図である。
【図24】同実施形態に係る圧縮処理を施されたXMLファイルに示される内容を示す図である。
【図25】本発明の他の実施形態に係る仲介サーバ装置において実現される機能を例示するブロック図である。
【図26】本発明の他の実施形態に係る仲介サーバ装置において実現される機能を例示するブロック図である。
【図27】本発明の他の実施形態に係る処理方式選択テーブルに示される内容を示す図である。
【図28】本発明の他の実施形態に係る処理方法対応テーブルに示される内容を示す図である。
【符号の説明】
T・・・通信システム、1・・・通信端末、2・・・通信端末、3・・・仲介サーバ装置、30・・・CPU、31・・・ROM、32・・・RAM、33・・・HD、34・・・通信インタフェース、36・・・バス、T′・・・通信システム、1′・・・通信端末、2′・・・通信端末、3′・・・仲介サーバ装置、30′・・・CPU、31′・・・ROM、32′・・・RAM、33′・・・HD、33a′・・・対応テーブル、33b′・・・置換テーブル、34′・・・通信インタフェース、36′・・・バス、4・・・仲介サーバ装置、5・・・仲介サーバ装置。
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a technique for compressing a structured document file expressed according to a structured document specification.
[0002]
[Prior art]
XML (extensible Markup Language) is a structured document specification for structurally expressing document data representing a document. In XML, a document is handled in units of elements. The element is represented by an identifier including a character string representing the name of the element, and a character string surrounded by the identifier and representing the content of the element. This element name is freely set by the document creator. When an attribute is defined for this element, the attribute name is also freely set by the document creator. Therefore, the document creator can use, for the element name and the attribute name, a name that clearly indicates the information content, the purpose, and the like.
However, when the name is formed of a long character string, the data size of the identifier including the character string representing the name of the element increases, and the size of the XML document data file representing the document also increases. Therefore, as a technique for solving such a problem, element names and attribute names appearing in a document data file are converted into identification numbers that can be uniquely identified, and the conversion information is stored in a table, and the document information is stored in a table. Regarding the data structure, there is a technology that expresses the relationship, attribute, and the like between elements using an identification number (for example, see Patent Document 1). According to this technique, the size of the XML document data file can be reduced.
[0003]
[Patent Document]
JP-A-2001-5745 (pages 3-6)
[0004]
[Problems to be solved by the invention]
However, if the same element name and attribute name are not repeatedly used in the XML document data file, the size of the XML document data file becomes large depending on the size of the above-described table, and the size of the original XML document file becomes large. May not decrease below size.
[0005]
Accordingly, the present invention has been made in view of the circumstances described above, and provides a technique for reliably compressing a document data file expressed according to a structured document specification.
[0006]
[Means for Solving the Problems]
In order to solve the above problem, the present invention provides a first detecting means for detecting an identifier from a type file in which an identifier having a character string for identifying a type is described in association with the contents of the type. And an element having a name, a content and a type, for identifying a type, including a content character string representing the content and a name character string indicating a region occupied by the content character string in the document and representing the name. Second detection means for detecting an identification character string from a structured document file representing a structured document having an element represented by an identification character string; and a type file whose identifier is detected by the first detection means. The data included in the structured document file in which the identification character string has been detected by the second detection means, and the character string included in the identifier detected by the first detection means, By detection means The type file and the structured document for each of the data representing the character strings constituting the character string group having a perfect match in the set composed of the detected identification character string and the name character string included therein A structured document file comprising: replacement means for replacing data representing one character string having a length necessary and sufficient for identifying a type in a file; and storage means for storing a file whose data has been replaced by the replacement means. A processing device is provided.
[0007]
According to this structured document file processing apparatus, an identifier is detected from the type file, an identification character string is detected from the structured document file, and the type file in which the identifier is detected and the structured file in which the identification character string is detected are detected. In the data that constitutes the document file, there is a perfect match in the set consisting of the character string of the detected identifier and the name character string contained in the detected identification character string. By replacing each of the data representing the character strings constituting the character string group with data representing one character string having a length necessary and sufficient to identify the type in the type file and the structured document file, The file is compressed, and the compressed file is stored.
[0008]
The present invention also provides an element having a name, a content and a type by using a type file in which an identifier having a character string for identifying a type and the content of the type are described in association with each other. A structured document having a content character string to be represented and an element represented by an identification character string for identifying a type, which includes a name character string indicating a name and indicating an area occupied by the content character string in the document. A device for transmitting and receiving a file to and from a communication device having a function of creating a structured document file to be represented, wherein the first acquisition unit acquires the type file and the first acquisition unit acquires the type file. First detection means for detecting an identifier from the type file; and data necessary for identifying a type in the type file for data representing a character string possessed by the identifier detected by the first detection means. First compression replacement means for replacing with data representing one character string having a length, data representing the character string before replacement by the first compression replacement means, and the character after replacement A correspondence storage unit that stores a correspondence relationship with data representing a column; a first transmission unit that transmits the type file replaced by the first compression replacement unit to the communication device; Receiving a first structured document file created using a type file and using the data representing the character string after replacement by the first compression replacement means in the data representing the name character string; Receiving means, and data representing the name character string included in the first structured document file received by the receiving means, according to the correspondence stored in the correspondence storage means, by the first compression replacement means. Be replaced A second structured document file created using the first structured document file replaced by the restoring and replacing unit, and a second structured document file created using the type file. And the data representing the name character string possessed by the second structured document file acquired by the second acquisition means, according to the correspondence stored in the correspondence storage means. A second compression replacement unit that replaces the data representing the character string after replacement by the compression replacement unit, and the second structured document file that is replaced by the second compression replacement unit. And a second transmitting means for transmitting the structured document file to the structured document file processing apparatus.
[0009]
According to the structured document file processing device, the structured document file processing device is a device that transmits and receives a file to and from a communication device having a function of creating the structured document file using the type file. Detecting an identifier from the obtained type file, and for data representing a character string possessed by the detected identifier, one character string having a sufficient length necessary to identify the type in the type file. The file is compressed by replacing it with the data that it represents. In addition, a correspondence between data representing the character string before replacement and data representing the character string after replacement is stored, and the compressed type file is transmitted to the communication device. And receiving a first structured document file created by the communication device using the type file and using the data representing the character string after replacement in the data representing the name character string. By replacing the data representing the name character string of the received first structured document file with the character string before replacement according to the stored correspondence, the first structured document file To restore. Then, a second structured document file created using the restored first structured document file and the type file is acquired, and the name of the acquired second structured document file is acquired. By replacing the data representing the character string with the replaced data representing the character string in accordance with the stored correspondence, the file is compressed, and the compressed second structured document file is compressed. Send to communication device.
[0010]
The present invention is also an apparatus capable of transmitting and receiving a file to and from a communication apparatus, wherein an identifier having a character string for identifying a type is described in association with the contents of the type. A type file and / or an element having a name, content and type, identifying a content character string representing the content and a type character string indicating a region occupied by the content character string in the document and including a name character string representing the name A first acquisition unit for acquiring a structured document file representing a structured document having an element represented by an identification character string for performing a first substitution method or a second substitution method for the type file. A replacement method determining means for determining one of the replacement methods, a first detecting means for detecting an identifier from the type file acquired by the first acquiring means, and a replacement method determining means for determining the identifier. Replace When the expression is the first replacement method, a second detecting means for detecting an identification character string from the structured document file, a type file whose identifier is detected by the first detecting means, and the second file. Among the data constituting the structured document file in which the identification character string has been detected by the detection means, the character string of the identifier detected by the first detection means and the character string detected by the second detection means The type file and the structured document file for each of the data representing the character strings constituting the character string group having a perfect match in the set composed of the identified character string and the name character string contained therein A first compression / replacement means for replacing with a data representing one character string having a length necessary and sufficient for identifying a type in the communication device; And a character string included in the identifier detected by the first detection means when the replacement method determined by the replacement method determination means is the second replacement method. Is replaced by data representing one character string having a sufficient length to identify the type in the type file, and the second compression and replacement unit replaces the data. Data representing the previous character string, correspondence storage means for storing a correspondence relationship between the data representing the character string after replacement, and the type file replaced by the second compression replacement means, A second transmission unit for transmitting to the communication device, and the character created by the communication device using the type file and replaced with the data representing the name character string after being replaced by the third compression replacement unit The data representing the column Second receiving means for receiving the first structured document file used, and data representing the name character string of the first structured document file received by the second receiving means, A restoring / substituting unit that substitutes a character string before being replaced by the second compression / substituting unit in accordance with the correspondence stored in the relationship storing unit; and a first structured document file replaced by the restoring / substituting unit. Second acquisition means for acquiring a second structured document file created using the type file, and the name character of the second structured document file acquired by the second acquisition means A second compression replacement unit that replaces data representing a string with data representing the character string after replacement by the first compression replacement unit according to the correspondence stored in the correspondence storage unit; Second pressure Providing a structured document file processing apparatus, characterized in that it comprises a third transmission means for transmitting the second structured document file which is substituted with a substituent means to the communication device.
[0011]
According to this structured document file processing device, the structured document file processing device is a device capable of transmitting and receiving a file to and from a communication device, and acquires the type file and / or the structured document file, and The replacement method is determined to be either the first replacement method or the second replacement method, and an identifier is detected from the obtained type file. When the determined replacement method is the first replacement method, the identification character string is detected from the structured document file, and the type file in which the identifier is detected and the structured document file in which the identification character string is detected. Character strings that have a perfect match in the set consisting of the character string that the detected identifier has and the name character string that the detected identification string contains By replacing each of the data representing the character strings constituting the group with data representing one character string having a length sufficient and sufficient to identify the type in the type file and the structured document file, And transmits the compressed file to the communication device. In the case where the determined replacement method is the second replacement method, the data representing the character string possessed by the identifier detected from the type file is necessary and sufficient to identify the type in the type file. The file is compressed by replacing it with data representing one character string having a length. In addition, a correspondence relationship between data representing the character string before replacement and data representing the character string after replacement is stored, and the compressed type file is transmitted to the communication device. And receiving a first structured document file created by the communication device using the type file and using the data representing the character string after replacement in the data representing the name character string. By restoring the data representing the name character string included in the received first structured document file to the character string before the replacement according to the stored correspondence, the file is restored. Next, a second structured document file created using the restored first structured document file and the type file is acquired. Then, by replacing the data representing the name character string possessed by the acquired second structured document file with the data representing the character string after the replacement according to the stored correspondence relationship, And transmits the compressed second structured document file to the communication device.
[0012]
According to the present invention, a first detection step of detecting an identifier from a type file in which an identifier having a character string for identifying a type and the content of the type are described in association with each other; An element having a content character string representing the content, and an identification character string for identifying a type, which includes a name character string indicating a region occupied by the content character string in the document and indicating a name. A second detection step of detecting an identification character string from a structured document file representing a structured document having the following elements: a type file whose identifier is detected by the first detection step; and a second detection step. In the data constituting the structured document file in which the identification character string is detected, a character string included in the identifier detected in the first detection step and a character string included in the second detection step. The type file and the structuring are performed for each of the data representing the character strings constituting the character string group having a perfect match in the set composed of the detected identification character string and the name character string included therein. A replacement step of replacing with a data representing one character string having a sufficient length to identify the type in the document file; and a storage step of storing a file in which the data has been replaced by the replacement step. And a structured document file processing method.
[0013]
According to this structured document file processing method, an identifier is detected from the type file, an identification character string is detected from the structured document file, and the type file in which the identifier is detected and the structured file in which the identification character string is detected are detected. In the data that constitutes the document file, there is a perfect match in the set consisting of the character string of the detected identifier and the name character string contained in the detected identification character string. By replacing each of the data representing the character strings constituting the character string group with data representing one character string having a length necessary and sufficient to identify the type in the type file and the structured document file, The file is compressed, and the compressed file is stored.
[0014]
The present invention also provides an element having a name, a content and a type by using a type file in which an identifier having a character string for identifying a type and the content of the type are described in association with each other. A structured document having a content character string to be represented and an element represented by an identification character string for identifying a type, which includes a name character string indicating a name and indicating an area occupied by the content character string in the document. A method for transmitting and receiving a file to and from a communication device having a function of creating a structured document file to be represented, comprising: a first obtaining step of obtaining the type file; and a first obtaining step of obtaining the type file. A first detection step of detecting an identifier from the type file obtained in the step, and data representing a character string possessed by the identifier detected by the first detection step. A first compression / replacement step of replacing with a data representing one character string having a length necessary and sufficient to identify a type in a file, and representing the character string before being replaced in the first compression / replacement step A correspondence storing step of storing a correspondence between data and data representing the character string after the replacement, and a step of transmitting the type file replaced in the first compression replacement step to the communication device. 1 transmission step, and using the data representing the character string after being replaced in the first compression replacement step, as the data created using the type file in the communication device and representing the name character string. A receiving step of receiving a first structured document file, and data representing the name character string of the first structured document file received in the receiving step are stored in the correspondence description. A restoring replacement step of replacing a character string before replacement in the first compression replacement step in accordance with the correspondence stored in the means, a first structured document file replaced in the restoration replacement step, A second acquisition step of acquiring a second structured document file created using a type file, and the name character string of the second structured document file acquired in the second acquisition step A second compression replacement step of replacing data representing the character string with data representing the character string replaced in the first compression replacement step in accordance with the correspondence stored in the correspondence storage step; A second transmission step of transmitting the second structured document file replaced in the second compression replacement step to the communication device. Provide a processing method.
[0015]
According to this structured document file processing method, an apparatus for transmitting / receiving a file to / from a communication device having a function of creating the structured document file using the type file, and acquiring the type file Detecting an identifier from the obtained type file, and for data representing a character string possessed by the detected identifier, one character string having a sufficient length necessary to identify the type in the type file. The file is compressed by replacing it with the data that it represents. In addition, a correspondence between data representing the character string before replacement and data representing the character string after replacement is stored, and the compressed type file is transmitted to the communication device. And receiving a first structured document file created by the communication device using the type file and using the data representing the character string after replacement in the data representing the name character string. By replacing the data representing the name character string of the received first structured document file with the character string before replacement according to the stored correspondence, the first structured document file To restore. Then, a second structured document file created using the restored first structured document file and the type file is acquired, and the name of the acquired second structured document file is acquired. By replacing the data representing the character string with the replaced data representing the character string in accordance with the stored correspondence, the file is compressed, and the compressed second structured document file is compressed. Send to communication device.
[0016]
The present invention also provides a computer with a first detection step of detecting an identifier from a type file in which an identifier having a character string for identifying a type and the content of the type are described in association with each other; An element having a content and a type, a content character string representing the content, and an identification character string for identifying a type, including a name character string indicating a region occupied by the content character string in the document and indicating a name. A second detection step of detecting an identification character string from a structured document file representing a structured document having an element represented by: a type file whose identifier is detected by the first detection step; The data included in the structured document file in which the identification character string is detected in the detection step, the character string included in the identifier detected in the first detection step; For each of the data representing the character strings constituting the character string group having a perfect match in the set composed of the identification character string detected by the detection step and the name character string contained therein, the type file and the In the structured document file, a replacement step of replacing with a data representing one character string having a length necessary and sufficient to identify a type, and a storage step of storing a file in which the data is replaced by the replacement step are executed. For providing a structured document file processing program.
[0017]
According to the structured document file processing program, an identifier is detected from the type file, an identification character string is detected from the structured document file, and the type file in which the identifier is detected and the structured file in which the identification character string is detected are detected. In the data that constitutes the document file, there is a perfect match in the set consisting of the character string of the detected identifier and the name character string contained in the detected identification character string. By replacing each of the data representing the character strings constituting the character string group with data representing one character string having a length necessary and sufficient to identify the type in the type file and the structured document file, The file is compressed, and the compressed file is stored.
[0018]
The present invention also provides an element having a name, a content and a type by using a type file in which an identifier having a character string for identifying a type and the content of the type are described in association with each other. A structured document having a content character string to be represented and an element represented by an identification character string for identifying a type, which includes a name character string indicating a name and indicating an area occupied by the content character string in the document. A first acquisition step of acquiring the type file by a computer that transmits and receives the file to and from a communication device having a function of creating a structured document file to be represented;
From the type file obtained in the first obtaining step, a first detection step of detecting an identifier, and data representing a character string held by the identifier detected by the first detection step, A first compression replacement step of replacing the character string with data representing one character string having a length necessary and sufficient to identify the type in the type file; and the character string before replacement in the first compression replacement step. A correspondence storing step of storing a correspondence between the data representing the character string and the data representing the replaced character string; and transmitting the type file replaced in the first compression replacement step to the communication device. A first transmission step, and the character string created by the communication device using a type file and replaced with data representing the name character string in the first compression replacement step Receiving a first structured document file in which data representing the first structured document file is used, and storing the data representing the name character string of the first structured document file received in the receiving step in the correspondence relationship storing step , A restoration replacement step of replacing a character string before replacement in the first compression replacement step, a first structured document file replaced in the restoration replacement step, A second acquisition step of acquiring a second structured document file created using the file and the name character string of the second structured document file acquired in the second acquisition step. Data representing the character string after being replaced in the first compression replacement step in accordance with the correspondence stored in the correspondence storage step A structured document for executing a second compression replacement step of replacing and a second transmission step of transmitting the second structured document file replaced in the second compression replacement step to the communication device. Provide a file processing program.
[0019]
According to this structured document file processing program, an apparatus for transmitting and receiving a file to and from a communication device having a function of creating the structured document file using the type file, Detecting an identifier from the obtained type file, and for data representing a character string possessed by the detected identifier, one character string having a sufficient length necessary to identify the type in the type file. The file is compressed by replacing it with the data that it represents. In addition, a correspondence between data representing the character string before replacement and data representing the character string after replacement is stored, and the compressed type file is transmitted to the communication device. And receiving a first structured document file created by the communication device using the type file and using the data representing the character string after replacement in the data representing the name character string. By replacing the data representing the name character string of the received first structured document file with the character string before replacement according to the stored correspondence, the first structured document file To restore. Then, a second structured document file created using the restored first structured document file and the type file is acquired, and the name of the acquired second structured document file is acquired. By replacing the data representing the character string with the replaced data representing the character string in accordance with the stored correspondence, the file is compressed, and the compressed second structured document file is compressed. Send to communication device.
[0020]
The present invention also provides a storage medium storing the above-mentioned program.
[0021]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings. Note that the same reference numerals are given to common parts in each drawing.
[1. First Embodiment]
(1) Configuration
In the present embodiment, XML document data is used as structured document data representing the contents of the structured document. Since XML document data is mainly handled in the form of a file, in the following description, XML document data in the form of a file is referred to as an XML file. The XML file is generally used together with a definition file (type file) such as an XSL file that defines how to display a document. Therefore, a case where an XSL file is used together with an XML file will be described.
<Communication system configuration>
FIG. 1 is a block diagram illustrating the configuration of a communication system T according to the first embodiment of the present invention. When the user 10 operates the communication terminal 1, an XML file and an XSL file defining how to display a document of the XML file (hereinafter, the XML file and the XSL file are collectively referred to as an XML file group) ) Is transmitted to the communication terminal 2 via the mediation server device 3. The communication terminal 2 receives the transmitted XML file group. The user 20 operates the communication terminal 2.
Although the communication system T may originally include a large number of communication terminals and servers, in order to prevent the drawing from becoming complicated, two communication terminals 1 and 2 and one intermediate server device 3 are used. Only one is shown.
[0022]
The communication terminal 1 is a computer device having a communication function, and has a function of performing data communication with the communication terminal 2 via the mediation server device 3. The communication terminal 1 stores an XML file (see FIG. 3) and XSL file (see FIG. 4) which are employee list data. The communication terminal 1 has a function of transmitting these XML files to the communication terminal 2 via the mediation server device 3. The employee list data is data in which information such as an employee name, an employee number, and a department to which the employee belongs is stored for each employee number.
[0023]
The mediation server device 3 has a function of relaying data communication between the communication terminal 1 and the communication terminal 2. In addition, it has a function of compressing the XML file group transmitted from the communication terminal 1 and a function of transmitting these compressed files to the communication terminal 2. The detailed configuration will be described later.
[0024]
The communication terminal 2 is a computer device having a communication function similarly to the communication terminal 1, and has a function of performing data communication with the communication terminal 1 via the mediation server device 3. Further, it has a function of displaying information on the display unit according to the XML file group. The function will be specifically described with reference to FIGS. 4 to 6 are diagrams showing the contents of each file, and FIG. 7 is a diagram showing an example of a screen displayed on the display unit according to the contents of the file.
When an instruction to display the XML file as shown in FIG. 4 is made on the operation unit, as shown by reference numeral F3, the XSL file having the XSL file name designated to be referred to in the XML file ( (See FIG. 5). Then, an HTML format file as shown in FIG. 6 is generated using the XML file and the XSL file. Then, according to the file in the HTML format, the document is displayed on the display unit as shown in FIG.
[0025]
<Configuration of Mediation Server Device 3>
FIG. 2 is a block diagram showing a hardware configuration of the mediation server device 3 shown in FIG.
The ROM 31 stores a program for performing basic control of each unit of the mediation server device 3. The RAM 32 is used as a work area of the CPU 30, and temporarily stores various programs and data executed by the CPU 30.
[0026]
The HD (Hard Disk) 33 stores an operating system of the mediation server device 3 and the like. In addition, a program for causing the CPU 30 to realize a function of compressing the XML file group received from the communication terminal 1 and a program for causing the CPU 30 to realize a function of transmitting these compressed files to the communication terminal 2 are stored. ing.
[0027]
The communication interface 34 controls communication performed between the mediation server device 3 and the communication terminals 1 and 2. Further, the CPU 30 controls various units connected to the apparatus via the bus 36 by executing various programs stored in the ROM 31, the HD 33, and the like.
[0028]
Next, functions realized in the mediation server device 3 by the CPU 30 executing various programs will be described.
FIG. 3 is a block diagram illustrating functions realized in the mediation server device 3. The portions indicated by the dashed lines indicate the above-mentioned functions, and these functions are realized by the CPU 30 executing the programs stored in the ROM 31 and the HD 33 shown in FIG.
[0029]
The data receiving function 300 receives an XML file group.
The data compression processing function 301 compresses the XML file group received by the data reception function 300 by replacing element names and attribute names commonly used in these files with a short character string. Perform processing.
The compressed data transmission function 302 transmits the XML file group compressed by the data compression processing function 301.
[0030]
(2) Operation
Next, the operation of the present embodiment will be described. FIG. 8 is a flowchart showing a flow of a process of compressing the XML file group.
After the power supply (not shown) of the mediation server device 3 is turned on, the program stored in the ROM 31 is executed by the CPU 30, the operation system stored in the HD 33 is executed, and an instruction is input by the user (administrator). As a result, the program stored in the HD 33 is executed, and the function described in “(1) Configuration” is realized. Similarly, in the communication terminals 1 and 2, the functions described in “(1) Configuration” are realized by turning on the power supply (not shown) and inputting the respective instructions by the users 10 and 20.
First, when the user 10 operates the operation unit of the communication terminal 1, selects an XML file group to be compressed, and specifies the communication address of the communication terminal 2, the control unit of the communication terminal 1 transmits the XML file group and the communication address. Is transmitted to the mediation server device 3 (step S10). When receiving the XML file group and the communication address via the communication interface 34 (step S11), the CPU 30 of the mediation server device 3 temporarily stores them in the RAM 32. Then, the following compression processing is started for the XML file group.
First, all the element names and attribute names used in the XML file group are extracted. Specifically, an atypical character string surrounded by '<' and '>' is extracted. For example, character strings such as those shown in element names Y1, Y2, Y3 and attribute name Z1 in FIG. 4 are extracted. A number is assigned to each of the extracted element names and attribute names so that they can be uniquely identified in this XML file group. Then, the CPU 30 replaces the element names and the attribute names with the respectively assigned numbers in the XML file group, generates new XML files (see FIG. 9) and XSL files (see FIG. 10), and stores them in the RAM 32. It is stored (step S12). In the examples shown in FIGS. 9 and 10, the “R & D department employee directory” is replaced with “1” for the element name Y1, “Employee” is replaced with “2” for the element name Y2, and the element name Y3 is replaced. 'Employee number' is replaced with '3' and 'employment' is replaced with '91' for attribute name Z1.
As described above, the mediation server device 3 replaces the element names and attribute names commonly used in the XML file and the XSL file associated with the XML file with a short character string, The XML file group is compressed.
Thereafter, the CPU 30 transmits the compressed XML file group to the communication terminal 2 using the communication address temporarily stored in the RAM 32 (Step S13).
[0031]
The control unit of the communication terminal 2 receives the XML file group (Step S14), and stores this in the storage unit. Thereafter, when the user 20 instructs the operation unit to display the XML file, the control unit reads the XML file from the storage unit. Further, an XSL file associated with the XML file is read. Specifically, as indicated by reference numeral F3 in FIG. 9, an XSL file having an XSL file name designated to be referred to in the XML file (see FIG. 10) is read. The control unit generates an HTML format file as shown in FIG. 6 using the XML file group read as described above, and displays a document as shown in FIG. 7 on the display unit.
[0032]
By performing the compression processing on the XML file group as described above, the data amount can be significantly reduced, and the document information displayed using the XML file group that has not been subjected to the compression processing (FIG. 7) can be displayed. Therefore, it is not necessary to perform the decompression processing on the XML file group that has been subjected to the compression processing, and it is not necessary to transmit information indicating what element names and attribute names have been replaced with these files together. The file can be easily handled.
[0033]
Note that a definition file called DTD is further associated with the XML file, or another display definition file such as an XSLT file is associated with the XSL file. Therefore, the same compression processing as described above may be performed on any combination of these files.
[0034]
Further, the communication system T may not include the mediation server device 3. In such a configuration, the communication terminal 1 may be provided with the above-described XML file group compression function and the compressed XML file group transmission function.
[0035]
[2. Second Embodiment]
(1) Configuration
FIG. 11 is a block diagram illustrating the configuration of the communication system T ′ according to the first embodiment of the present invention. In the communication system T ′, a communication terminal 1 ′ and a communication terminal 2 ′ transmit and receive a WSDL (Web Service Description Language) file and an XML file separately via the mediation server device 3 ′. Note that the WSDL file is a definition file (type file) that defines an XML file provision (service) and an interface. Specifically, the WSDL file defines the meaning of element names and attribute names used in the XML file, , Processing form, notation system, etc. are defined.
Although the communication system T 'may originally include many communication terminals and servers, in order to prevent the drawing from being complicated, two communication terminals 1' and 2 'and one intermediate Only the server device 3 'is shown. In the description of the present embodiment, the description of the same parts as those in the first embodiment will be omitted.
[0036]
The communication terminal 1 'stores an XML file (see FIG. 4) similar to the first embodiment, which is employee list data, and a WSDL file (see FIG. 19) related to the XML file. The WSDL file is transmitted to the communication terminal 2 'in response to a request from the communication terminal 2', and the XML file is searched in response to a service request from the communication terminal 2 '. It has a service response function of generating an XML file according to the result and transmitting it to the communication terminal 2 '.
[0037]
The communication terminal 2 'has a service definition request function for requesting the communication terminal 1' for a WSDL file, and a function for creating an XML file for requesting a service to the communication terminal 1 'according to the WSDL file transmitted from the communication terminal 1'. And a function of transmitting the XML file to the communication terminal 1 '.
[0038]
<Configuration of Mediation Server Device 3 ′>
FIG. 12 is a block diagram illustrating a hardware configuration of the mediation server device 3 ′ according to the present embodiment.
The configuration of the mediation server device 3 ′ according to the present embodiment is different from that of the mediation server device 3 according to the first embodiment described above in the following point. The HD 33 ′ includes a program for realizing the function of compressing the WSDL file received from the communication terminal 1 by the CPU 30 ′, a program for realizing the function of compressing and restoring the XML file by the CPU 30 ′, A program for causing the CPU 30 'to realize a function of transmitting these compressed files to the communication terminal 2' is stored.
The HD 33 'stores a correspondence table 33a' (see FIG. 13) and a replacement table 33b '(see FIG. 14) used when compressing the WSDL file.
The correspondence table 33a 'stores the file name of the compressed file and the replacement rule ID in association with each other. The replacement table 33b' stores the element name and the attribute name before replacement for each replacement rule ID. And the numbers after replacement corresponding to each of them.
[0039]
Next, a description will be given of functions realized in the mediation server device 3 'when the CPU 30' executes various programs.
FIG. 15 is a block diagram illustrating functions realized in the mediation server device 3 '. The portions indicated by the dashed lines indicate the above-mentioned functions, and these functions are realized by the CPU 30 'executing the programs stored in the ROM 31' and the HD 33 'shown in FIG. .
[0040]
The data receiving function 300 'receives (acquires) an XML file and a WSDL file which is a definition file of the XML file.
The data compression processing function 301 'compresses the WSDL file by replacing the element names and attribute names used in the file with short character strings. Further, a process of compressing the XML file corresponding to the WSDL file based on the notification content from the replacement information reference function 305 'is performed.
The replacement information creating function 303 'stores information on which WSDL file and what kind of compression was performed in the correspondence table 33a' at the time of the WSDL file compression processing, and stores what element name and attribute name Is stored in the replacement table 33b '. That is, the correspondence between the element name and the attribute name before the replacement and the element name and the attribute name after the replacement.
The replacement information storage function 304 'stores the correspondence table 33a' and the replacement table 33b '(hereinafter referred to as replacement information).
The compressed data transmission function 302 'transmits the compressed WSDL file or XML file compressed by the data compression processing function 301'.
The data decompression processing function 307 'performs a process of decompressing the compressed XML file received by the compressed data reception function 308' based on the notification content from the replacement information reference function 305 '.
The replacement information reference function 305 'refers to the replacement information stored by the replacement information storage function 304' for the replaced element names and attribute names used in the compressed XML file at the time of restoring the compressed XML file. , The element name and attribute name before replacement are obtained, and this is notified to the data restoration processing function 307 '. In the compression processing of the XML file corresponding to the WSDL file, the element name and the attribute name used in the file are referred to by referring to the replacement information stored by the replacement information storage function 304 '. , And obtains the replaced character string, and notifies the data compression processing function 301 'of this.
The data transmission function 306 'transmits the XML file restored by the data restoration processing function 307'.
The compressed data receiving function 308 'receives the compressed XML file.
[0041]
(2) Operation
Next, the operation of the present embodiment will be described. FIGS. 16 to 18 are flowcharts showing the flow of processing for compressing a WSDL file and an XML file.
In this operation, when performing communication via the communication terminal 1 ′, the communication terminal 2 ′, and the mediation server device 3 ′, it is necessary to specify each other's communication addresses, but the description is complicated. Therefore, the description is omitted.
As shown in FIG. 16, when the user 20 requests the communication terminal 1 ′ for the WSDL file related to the search in order to search the employee list data at the operation unit of the communication terminal 2 ′ (service definition). Request) (step S20), the request is transmitted to the communication terminal 2 'via the mediation server device 3'. Upon receiving the request, the communication terminal 1 'transmits a WSDL file corresponding to the request to the mediation server device 3' (step S21). As shown in FIG. 19, the WSDL file includes a procedure for searching for employee list data, a search condition thereof, a procedure for returning a search result, and definition information on the search result. . Specifically, it is defined that when an employee name or department is specified as a search condition, an employee number corresponding to the employee name or department is output as a search result.
[0042]
Upon receiving the WSDL file (step S22), the CPU 30 'of the mediation server device 3' temporarily stores it in the RAM 32 '. Then, the following compression processing is started for the WSDL file.
First, all the element names and attribute names used in the WSDL file are extracted. A number is assigned to each of the extracted element names and attribute names so that they can be uniquely identified in the WSDL file. Then, the CPU 30 'assigns a replacement rule ID to the correspondence between each element name and attribute name and the number assigned to each of them, and stores the record in the replacement table 33b' (see FIG. 14). In addition, the file name of the WSDL file and the replacement rule ID are associated with each other and stored in the correspondence table 33a '(see FIG. 13). At the same time, a new WSDL file (hereinafter, referred to as a compressed WSDL file) is generated by replacing the element names and attribute names used in the WSDL file with the respectively assigned numbers, and storing the new WSDL file in the RAM 32 ′ ( Step S23). In the present embodiment, as shown in FIG. 20, the element name “employee list search” is replaced with “10”, the element name “search condition” is replaced with “20”, and the element name “search condition” is replaced. 'Has been replaced with' 60 '.
As described above, the mediation server device 3 'performs a WSDL file compression process by replacing element names and attribute names used in the WSDL file with short character strings.
Thereafter, the CPU 30 'transmits the compressed WSDL file to the communication terminal 2' (Step S24).
[0043]
On the other hand, the communication terminal 2 'receives the compressed WSDL file (Step S25). Then, as shown in FIG. 17, the user 20 creates an XML file as shown in FIG. 21 using the compressed WSDL file (step S30). In the figure, "Taro Yamada" is specified as the employee name as the search condition. Also, as shown in the figure, the element names and attribute names used in this XML file are the numbers replaced in the above-described compression processing.
Thereafter, the user 20 operates the operation unit and transmits the XML file to the mediation server device 3 '(service request) (step S31).
[0044]
Upon receiving the XML file (step S32), the CPU 30 'of the mediation server device 3' temporarily stores the XML file in the RAM 32 '.
Then, information indicating what kind of compression processing has been performed on the WSDL file corresponding to the XML file is read, and processing for restoring the XML file is performed based on this information. Specifically, as shown by reference numeral F2 in FIG. 21, based on the WSDL file name specified in the XML file, the corresponding table 33a '(see FIG. 13) is referred to, and the corresponding replacement rule ID is set. read out. Then, based on the read replacement rule ID, referring to the replacement table 33b '(see FIG. 14), the correspondence relationship with the character string before replacement is read from the replaced number. For example, the element name “search condition” corresponding to the element name “20” and the element name “search result” corresponding to the element name “60” are read, and the XML file shown in FIG. 21 is read from the XML file shown in FIG. Such an XML file is generated.
As described above, the element names and attribute names used in the XML file are restored to the original character strings, and a new XML file (hereinafter, referred to as a restored XML file) is generated (step S33). Then, the restored XML file is transmitted to the communication terminal 1 '(step S34).
[0045]
Upon receiving the restored XML file (step S35), the communication terminal 1 'follows the WSDL file corresponding to the restored XML file and the retrieval condition indicated in the restored XML file, as shown in FIG. Then, the employee list data is searched (step S40), and the corresponding data is extracted (step S41). Then, an XML file is generated based on this data (step S42), and transmitted to the mediation server device 3 '(service response) (step S43). The generated XML file is, for example, as shown in FIG. 23, and indicates that the employee numbers corresponding to the above search conditions are “00001” and “00002”.
[0046]
Upon receiving the XML file (step S44), the CPU 30 'of the mediation server device 3' temporarily stores it in the RAM 32 '. In this way, the mediation server device 3 'obtains the restored XML file and the XML file created using the WSDL file corresponding to the XML file.
Next, the CPU 30 ′ refers to the correspondence table 33 a ′ and the replacement table 33 b ′ stored in the HD 33 ′, and executes the element name and the attribute name used in the XML file in the same manner as in the above-described compression processing. Is replaced with a number, and a new XML file as shown in FIG. 24 (hereinafter, referred to as a compressed XML file) is generated (step S45). Then, the compressed XML file is transmitted to the communication terminal 2 '(step S46).
[0047]
The communication terminal 2 'receives the compressed XML file (Step S47). As a result, the user 20 can obtain a search result indicating that the employee numbers of the employee whose employee name is “Taro Yamada” are “00001” and “00002”.
[0048]
As described above, focusing on the fact that the element name and the attribute name are commonly used in the XML file and the WSDL file associated with the XML file, the XML file and the WSDL file are described above. By performing such compression / decompression processing, the size of the file can be surely reduced. As a result, the load of communication processing in the communication system T 'can be reduced. Since the communication terminals 1 'and 2' are not provided with the special function according to the present invention, the communication terminals 1 'and 2' are provided with the existing communication which can process the XML file and the file corresponding to the XML file. A terminal can be used.
[0049]
As in the first embodiment, when an XML file is associated with an XSL file, element names and attribute names commonly used in the XML file and the XSL file are replaced with numerals, and the XML file is replaced with an XML file. And compression of the XSL file.
[0050]
Further, the communication system T 'may not include the mediation server device 3'. In such a configuration, the function of compressing the WSDL file or the XML file, the function of receiving (acquiring) the WSDL file or the XML file, the function of transmitting the WSDL file or the XML file, the function of restoring the XML file, A function of generating (acquiring) a new XML file by using an XML file and a WSDL file file corresponding to the XML file, and a function of transmitting a newly generated XML file.
[0051]
Also, in FIG. 16, even if there is no request for the WSDL file from the communication terminal 2 'to the communication terminal 1' in step S20, the configuration may be such that the WSDL file is transmitted from the communication terminal 1 'to the communication terminal 2'.
[0052]
[3. Modification]
As described above, the embodiments of the present invention have been described, but the present invention can be embodied in various other forms without departing from the main features. Each of the above-described embodiments is merely an example of one aspect of the present invention, and the scope of the present invention is as shown in the claims, and further includes modifications and alterations that fall within the equivalent scope of the claims. All changes are within the scope of the invention. Note that, for example, the following modifications can be considered.
[0053]
(1) Modification 1
In each of the above embodiments, the function of the mediation server device 3 according to the first embodiment shown in FIG. 3 and the function of the mediation server device 3 ′ according to the second embodiment shown in FIG. A mediation server device having a combined function may be used. In this case, the following two configurations are conceivable.
(1) Determine the processing method according to the file extension
The mediation server device 4 has substantially the same configuration as the mediation server device 3 described above, and the differences are as follows.
The HD (not shown) receives an XML file or a definition file received from a communication terminal (not shown), determines a processing method for compressing these files from the extension of the definition file, and determines the file. And a program for causing a CPU (not shown) to realize the function of compressing according to the first embodiment, and a program for causing the CPU to realize the function of compressing and restoring according to the second embodiment according to the determination. Also, a program for causing the CPU to realize a function of transmitting a compressed file or a restored file to another communication terminal (not shown) is stored.
Further, in the HD, a processing method selection table (see FIG. 27) used to determine the compression method of the received file based on the extension of the received definition file is stored. ing. FIG. 27 shows that if the extension of the definition file is DTD or XSL, the file is compressed by the method 1 (the compression method according to the above-described first embodiment). Is WSDL, the compression of the file is performed by the method 2 (the compression / decompression method according to the above-described second embodiment).
Next, functions realized in the mediation server device 4 as shown in FIG. 25 will be described. In the following description, only the functions of the intermediary server device 3 according to the above-described first embodiment and the differences from the intermediary server device 3 ′ according to the above-described second embodiment will be described.
The data receiving function 400 receives (acquires) an XML file and its definition file. Then, the extension of the received definition file is supplied to the processing method selection function 409. Further, the received XML file and definition file are supplied to the data compression function 401.
The processing method selection information storage function 410 stores the above-described processing method selection table.
The processing method selection function 409 refers to the processing method selection table stored by the processing method selection information storage function 410 based on the extension supplied by the data reception function 400, and refers to the processing method corresponding to the extension. And supplies it to the data compression function 401.
The data compression function 401 compresses the definition file and the XML file supplied by the data reception function 400 according to the processing method supplied by the processing method selection function 409. For example, if the processing method supplied by the processing method selection function 409 is the method 1, the compression processing in the first embodiment is performed, and if the processing method is the method 2, the compression processing in the second embodiment is performed. .
By using the above-described mediation server device 4, when an XML file, an XSL file, and a DTD file are transmitted from a communication terminal, the compression processing according to the first embodiment is performed on the file. When a WSDL file is transmitted from a communication terminal, the compression process according to the second embodiment is performed on the file.
[0054]
(2) The communication terminal that transmits the XML file and its definition file notifies the mediation server device of the processing method.
The communication terminal that transmits the XML file or its definition file compresses or compresses these files by any of the processing methods of the above-described first and second embodiments before or while transmitting these files. Information (hereinafter, referred to as processing method information) that specifies whether or not to restore is transmitted to the mediation server device 5. The processing method information includes, for example, a definition file name and a processing method for the definition file having the file name. The processing method is “processing method 1” when the processing method according to the first embodiment is specified, and “processing method 2” when the processing method according to the second embodiment is specified. Is specified.
The mediation server device 5 has substantially the same configuration as the mediation server device 3 described above, and the differences are as follows.
The HD (not shown) receives the XML file, the definition file, and the processing method information received from the communication terminal (not shown), and in accordance with the processing method information, compresses the function according to the first embodiment to the CPU (not shown). In accordance with the program for realizing, the program for realizing the function of compressing / decompressing according to the above-described second embodiment to the CPU according to the processing method information, another program (not shown) for displaying the compressed file or the decompressed file. A program for causing the CPU to realize a function of transmitting to the communication terminal is stored.
Further, the HD stores a processing method correspondence table. As shown in FIG. 28, the processing method correspondence table stores the file name of the definition file included in the processing method information received from the communication terminal and the processing method in association with each other. In the figure, the file name is a. The compression process is performed on the definition file of dtd by the method 1 (the compression method according to the above-described first embodiment) and the file name is b. It is shown that compression processing by the method 1 (the compression method according to the above-described first embodiment) is performed on the definition file of wsdl.
Next, functions realized in the mediation server device 5 as shown in FIG. 26 will be described. In the following description, only the functions of the intermediary server device 3 according to the above-described first embodiment and the differences from the intermediary server device 3 ′ according to the above-described second embodiment will be described.
The data receiving function 500 receives (acquires) an XML file and its definition file.
The processing method information receiving function 509 receives the processing method information and supplies the processing method to the data compression processing function 501 based on the information. Further, the correspondence between the processing method and the definition file is supplied to the processing method correspondence information storage function 510.
The processing method correspondence information storage function 510 stores the above correspondence notified by the processing method information reception function 509 in the processing method correspondence table.
The data compression processing function 501 performs a process of compressing the definition file and the XML file supplied by the data reception function 500 according to the processing method supplied by the processing method information reception function 509. For example, if the processing method supplied by the processing method information receiving function 509 is the method 1, the compression processing in the first embodiment is performed. If the processing method is the method 2, the compression processing in the second embodiment is performed. Do.
By using the above-described mediation server device 4, when an XML file, an XSL file, and a DTD file are transmitted from a communication terminal, the compression processing according to the first embodiment is performed on the file. When a WSDL file is transmitted from a communication terminal, the compression process according to the second embodiment is performed on the file.
[0055]
According to the above-described configurations (1) and (2), the compression processing according to the first embodiment and the compression / decompression processing according to the second embodiment can be performed by one mediation server device 4 or mediation. This can be performed by the server device 5.
[0056]
(2) Modification 2
In each of the communication systems in the above-described embodiments and modifications, communication may be performed via a communication network such as the Internet or a mobile packet communication network. The transmission and reception of files in the communication system may be performed using various communication methods such as an FTP or HTTP protocol, a push protocol, and the like. Further, an XML file, an XSL file, and a WSDL file may be transmitted and received by attaching to an electronic mail.
[0057]
(3) Modification 3
In each of the above-described embodiments and modified examples, element names and attribute names used in XML files, XSL files, and WSDL files are not replaced with numbers as described above. It can be replaced with another short character string, such as a combination of a character and a number.
[0058]
(4) Modification 4
The communication terminals 1, 2, 1 ', and 2' may be a server, a client terminal, a PC personal computer, a PDA, a mobile phone, or the like as long as the computer has a communication function.
[0059]
(5) Modification 5
Although the program according to each of the above-described embodiments and the modifications is stored in the HD, it may be stored in the ROM. The mediation server devices 3, 3 ', 4, and 5 may include a removable storage medium (not shown), and the storage medium may store the program.
[0060]
(6) Modification 6
The structured document data may be a file other than an XML file, such as an SGML (Standard Generalized Markup Language) file. Further, a file such as an HTML (Hyper Text Markup Language) file in which a fixed character string is used for the element name may be used.
[0061]
(7) Modification 7
The information contents of the XML file, the XSL file, and the WSDL file used in the description of each of the above embodiments are not limited to those described above, and may be various.
[0062]
【The invention's effect】
As described above, according to the present invention, a data file represented according to a structured document specification can be reliably compressed.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration of a communication system according to an embodiment of the present invention.
FIG. 2 is a block diagram illustrating a hardware configuration of the mediation server device according to the embodiment;
FIG. 3 is a block diagram illustrating functions realized in the mediation server device according to the embodiment;
FIG. 4 is a diagram showing contents shown in an XML file according to the embodiment;
FIG. 5 is a diagram showing contents shown in an XSL file according to the embodiment.
FIG. 6 is a diagram showing contents shown in an HTML format file according to the embodiment;
FIG. 7 is a view showing an example of a screen displayed on the display unit according to the contents of an HTML file according to the embodiment.
FIG. 8 is a flowchart showing a flow of processing for compressing the XML file group according to the embodiment.
FIG. 9 is a diagram showing contents shown in an XML file that has been subjected to compression processing according to the embodiment;
FIG. 10 is a diagram showing the content shown in the XSL file that has been subjected to the compression processing according to the embodiment;
FIG. 11 is a block diagram illustrating a configuration of a communication system according to another embodiment of the present invention.
FIG. 12 is a block diagram illustrating a hardware configuration of the mediation server device according to the embodiment;
FIG. 13 is a diagram showing contents shown in a correspondence table according to the embodiment.
FIG. 14 is a diagram showing contents shown in a replacement table according to the embodiment.
FIG. 15 is a block diagram illustrating functions realized in the mediation server device according to the embodiment;
FIG. 16 is a flowchart showing a part of the flow of a process for compressing a WSDL file and an XML file according to the embodiment;
FIG. 17 is a flowchart showing a part of the flow of processing for compressing a WSDL file and an XML file according to the embodiment;
FIG. 18 is a flowchart showing a part of the flow of processing for compressing a WSDL file and an XML file according to the embodiment.
FIG. 19 is a diagram showing the contents shown in the WSDL file according to the embodiment.
FIG. 20 is a diagram showing the contents shown in the WSDL file that has been subjected to the compression processing according to the embodiment;
FIG. 21 is a diagram showing the content shown in the XML file subjected to the compression processing according to the embodiment.
FIG. 22 is a diagram showing the contents shown in the XML file according to the embodiment.
FIG. 23 is a diagram showing the content shown in the XML file according to the embodiment.
FIG. 24 is a diagram showing contents shown in an XML file that has been subjected to compression processing according to the embodiment.
FIG. 25 is a block diagram illustrating functions realized in a mediation server device according to another embodiment of the present invention.
FIG. 26 is a block diagram illustrating functions realized in a mediation server device according to another embodiment of the present invention.
FIG. 27 is a diagram showing contents shown in a processing method selection table according to another embodiment of the present invention.
FIG. 28 is a diagram showing contents shown in a processing method correspondence table according to another embodiment of the present invention.
[Explanation of symbols]
T: communication system, 1: communication terminal, 2: communication terminal, 3: mediation server device, 30: CPU, 31: ROM, 32: RAM, 33,. HD, 34 communication interface, 36 bus, T 'communication system, 1' communication terminal, 2 'communication terminal, 3' relay server device, 30 CPU, 31 'ROM, 32' RAM, 33 'HD, 33a' correspondence table, 33b 'replacement table, 34' communication interface , 36 '... bus, 4 ... mediation server device, 5 ... mediation server device.

Claims (10)

型を識別するための文字列を有する識別子と該型の内容とが対応付けられて記述される型ファイルから、識別子を検出する第1の検出手段と、
名称、内容および型を持つ要素であって、内容を表す内容文字列と、該内容文字列が文書において占める領域を示すとともに名称を表す名称文字列を内包する、型を識別するための識別文字列とで表される要素、を有する構造化文書を表す構造化文書ファイルから識別文字列を検出する第2の検出手段と、
前記第1の検出手段により識別子が検出された型ファイルと前記第2の検出手段により識別文字列が検出された構造化文書ファイルとを構成するデータのうち、前記第1の検出手段により検出された識別子が有している文字列と、前記第2の検出手段により検出された識別文字列が内包している名称文字列とから構成される集合において完全一致の関係にある文字列群を構成する文字列を表すデータの各々について、該型ファイル及び該構造化文書ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する置換手段と、
前記置換手段によりデータが置換されたファイルを記憶する記憶手段とを有する構造化文書ファイル処理装置。
First detection means for detecting an identifier from a type file in which an identifier having a character string for identifying the type and the content of the type are described in association with each other;
An element having a name, a content, and a type, an identification character for identifying a type, which includes a content character string representing the content and a name character string indicating a region occupied by the content character string in the document and representing the name. Second detecting means for detecting an identification character string from a structured document file representing a structured document having an element represented by
Among the data constituting the type file whose identifier is detected by the first detecting means and the structured document file whose identification character string is detected by the second detecting means, the data detected by the first detecting means A character string group having a perfect match in a set composed of a character string included in the identified identifier and a name character string included in the identification character string detected by the second detection unit. Replacement means for replacing each of the data representing the character strings to be replaced with data representing one character string having a length necessary and sufficient for identifying the type in the type file and the structured document file;
A structured document file processing apparatus comprising: a storage unit that stores a file whose data has been replaced by the replacement unit.
前記記憶手段に記憶された前記ファイルを前記通信装置に送信する送信手段を備えることを特徴とする請求項1に記載の構造化文書ファイル処理装置。2. The structured document file processing device according to claim 1, further comprising a transmission unit that transmits the file stored in the storage unit to the communication device. 型を識別するための文字列を有する識別子と該型の内容とが対応付けられて記述される型ファイルを用いて、名称、内容および型を持つ要素であって、内容を表す内容文字列と、該内容文字列が文書において占める領域を示すとともに名称を表す名称文字列を内包する、型を識別するための識別文字列とで表される要素、を有する構造化文書を表す構造化文書ファイルを作成する機能を有する通信装置との間でファイルの送受信を行う装置であって、
前記型ファイルを取得する第1の取得手段と、
前記第1の取得手段で取得された前記型ファイルから、識別子を検出する第1の検出手段と、
前記第1の検出手段により検出された識別子が有している文字列を表すデータについて、該型ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する第1の圧縮置換手段と、
前記第1の圧縮置換手段で置換される前の前記文字列を表すデータと、置換された後の前記文字列を表すデータとの対応関係を記憶する対応関係記憶手段と、前記第1の圧縮置換手段で置換された前記型ファイルを、前記通信装置に送信する第1の送信手段と、
前記通信装置で型ファイルを用いて作成され、前記名称文字列を表すデータに、前記第1の圧縮置換手段で置換された後の前記文字列を表すデータが用いられている第1の構造化文書ファイルを受信する受信手段と、
前記受信手段で受信した第1の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶手段に記憶された対応関係に従って、前記第1の圧縮置換手段で置換される前の文字列に置換する復元置換手段と、
前記復元置換手段で置換された第1の構造化文書ファイルと、前記型ファイルとを用いて作成された第2の構造化文書ファイルを取得する第2の取得手段と、前記第2の取得手段で取得された前記第2の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶手段に記憶された対応関係に従って、前記第1の圧縮置換手段で置換された後の前記文字列を表すデータに置換する第2の圧縮置換手段と、
前記第2の圧縮置換手段で置換された前記第2の構造化文書ファイルを前記通信装置に送信する第2の送信手段とを備えることを特徴とする構造化文書ファイル処理装置。
Using a type file in which an identifier having a character string for identifying a type and the content of the type are described in association with each other, an element having a name, content, and type, and a content character string representing the content. A structured document file having an element represented by an identification character string for identifying a type, which includes a name character string indicating a region occupied by the content character string in the document and indicating a name. Device for transmitting and receiving files to and from a communication device having a function of creating a file,
First acquisition means for acquiring the type file;
First detection means for detecting an identifier from the type file acquired by the first acquisition means;
The data representing the character string possessed by the identifier detected by the first detection means is replaced with data representing one character string having a length sufficient and sufficient to identify the type in the type file. 1 compression replacement means;
A correspondence storage unit for storing a correspondence relationship between data representing the character string before replacement by the first compression replacement unit and data representing the character string after replacement; First transmitting means for transmitting the type file replaced by the replacing means to the communication device;
A first structuring method wherein data representing the character string created by the communication device using a type file and representing the name character string is used for the data representing the character string after replacement by the first compression / substitution means; Receiving means for receiving the document file;
The data representing the name character string of the first structured document file received by the receiving unit is replaced by the first compressed replacement unit according to the correspondence stored in the correspondence storage unit. Restoration replacement means for replacing with a character string;
Second acquisition means for acquiring a first structured document file replaced by the restoration / replacement means, and a second structured document file created using the type file; and the second acquisition means The data representing the name character string possessed by the second structured document file obtained in the above is replaced by the first compression replacement means in accordance with the correspondence stored in the correspondence storage means. Second compression replacement means for replacing the data with a data representing a character string;
A second transmission unit configured to transmit the second structured document file replaced by the second compression replacement unit to the communication device.
前記名称文字列は、非定型の文字列であることを特徴とする請求項1乃至請求項3のいずれに記載の構造化文書ファイル処理装置。4. The structured document file processing apparatus according to claim 1, wherein the name character string is an irregular character string. 通信装置との間でファイルの送受信を行うことが可能な装置であって、
型を識別するための文字列を有する識別子と該型の内容とが対応付けられて記述される型ファイル及び/又は名称、内容および型を持つ要素であって、内容を表す内容文字列と、該内容文字列が文書において占める領域を示すとともに名称を表す名称文字列を内包する、型を識別するための識別文字列とで表される要素、を有する構造化文書を表す構造化文書ファイルを取得する第1の取得手段と、前記型ファイルに対する置換方式を、第1の置換方式又は第2の置換方式のいずれかに決定する置換方式決定手段と、
前記第1の取得手段で取得された前記型ファイルから、識別子を検出する第1の検出手段と、
前記置換方式決定手段により決定された置換方式が第1の置換方式である場合に、前記構造化文書ファイルから識別文字列を検出する第2の検出手段と、
前記第1の検出手段により識別子が検出された型ファイルと前記第2の検出手段により識別文字列が検出された構造化文書ファイルとを構成するデータのうち、前記第1の検出手段により検出された識別子が有している文字列と、前記第2の検出手段により検出された識別文字列が内包している名称文字列とから構成される集合において完全一致の関係にある文字列群を構成する文字列を表すデータの各々について、該型ファイル及び該構造化文書ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する第1の圧縮置換手段と、
前記第1の圧縮置換手段で置換された前記ファイルを前記通信装置に送信する第1の送信手段と、
前記置換方式決定手段により決定された置換方式が第2の置換方式である場合に、前記第1の検出手段により検出された識別子が有している文字列を表すデータについて、該型ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する第2の圧縮置換手段と、
前記第2の圧縮置換手段で置換される前の前記文字列を表すデータと、置換された後の前記文字列を表すデータとの対応関係を記憶する対応関係記憶手段と、前記第2の圧縮置換手段で置換された前記型ファイルを、前記通信装置に送信する第2の送信手段と、
前記通信装置で前記型ファイルを用いて作成され、前記名称文字列を表すデータに、前記第3の圧縮置換手段で置換された後の前記文字列を表すデータが用いられている第1の構造化文書ファイルを受信する第2の受信手段と、
前記第2の受信手段で受信した第1の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶手段に記憶された対応関係に従って、前記第2の圧縮置換手段で置換される前の文字列に置換する復元置換手段と、
前記復元置換手段で置換された第1の構造化文書ファイルと前記型ファイルとを用いて作成された第2の構造化文書ファイルを取得する第2の取得手段と、
前記第2の取得手段で取得された前記第2の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶手段に記憶された対応関係に従って、前記第1の圧縮置換手段で置換された後の前記文字列を表すデータに置換する第2の圧縮置換手段と、
前記第2の圧縮置換手段で置換された前記第2の構造化文書ファイルを前記通信装置に送信する第3の送信手段とを備えることを特徴とする構造化文書ファイル処理装置。
A device capable of transmitting and receiving files to and from a communication device,
A type file in which an identifier having a character string for identifying the type is described in association with the content of the type, and / or an element having a name, content and type, and a content character string representing the content; A structured document file representing a structured document having an element represented by an identification character string for identifying a type, which includes a name character string indicating a region occupied by the content character string in the document and indicating a name. First acquisition means for acquiring, a replacement method determining means for determining a replacement method for the type file to be either the first replacement method or the second replacement method;
First detection means for detecting an identifier from the type file acquired by the first acquisition means;
A second detection unit for detecting an identification character string from the structured document file when the replacement system determined by the replacement system determination unit is the first replacement system;
Among the data constituting the type file whose identifier is detected by the first detecting means and the structured document file whose identification character string is detected by the second detecting means, the data detected by the first detecting means A character string group having a perfect match in a set composed of a character string included in the identified identifier and a name character string included in the identification character string detected by the second detection unit. First compression replacement means for replacing each of the data representing the character strings to be replaced with data representing one character string having a length necessary and sufficient for identifying the type in the type file and the structured document file;
First transmission means for transmitting the file replaced by the first compression replacement means to the communication device;
When the replacement method determined by the replacement method determination means is the second replacement method, data representing a character string included in the identifier detected by the first detection means is typed in the type file. A second compression replacement unit that performs replacement with data representing one character string having a length necessary and sufficient to identify
A correspondence storage unit for storing a correspondence relationship between data representing the character string before replacement by the second compression replacement unit and data representing the character string after replacement; Second transmitting means for transmitting the type file replaced by the replacing means to the communication device;
A first structure in which the communication device creates the data using the type file and uses the data representing the character string after being replaced by the third compression replacement unit as the data representing the name character string. Second receiving means for receiving a structured document file;
The data representing the name character string of the first structured document file received by the second receiving means is replaced by the second compression replacement means according to the correspondence stored in the correspondence storage means. Restoration replacement means for replacing with a character string before
Second acquisition means for acquiring a second structured document file created using the first structured document file replaced by the restoration replacement means and the type file;
The data representing the name character string included in the second structured document file acquired by the second acquisition unit is converted by the first compression replacement unit according to the correspondence stored in the correspondence storage unit. Second compression replacement means for replacing the character string after replacement with data representing the character string;
And a third transmission unit for transmitting the second structured document file replaced by the second compression replacement unit to the communication device.
型を識別するための文字列を有する識別子と該型の内容とが対応付けられて記述される型ファイルから、識別子を検出する第1の検出ステップと、
名称、内容および型を持つ要素であって、内容を表す内容文字列と、該内容文字列が文書において占める領域を示すとともに名称を表す名称文字列を内包する、型を識別するための識別文字列とで表される要素、を有する構造化文書を表す構造化文書ファイルから識別文字列を検出する第2の検出ステップと、
前記第1の検出ステップにより識別子が検出された型ファイルと前記第2の検出ステップにより識別文字列が検出された構造化文書ファイルとを構成するデータのうち、前記第1の検出ステップにより検出された識別子が有している文字列と、前記第2の検出ステップにより検出された識別文字列が内包している名称文字列とから構成される集合において完全一致の関係にある文字列群を構成する文字列を表すデータの各々について、該型ファイル及び該構造化文書ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する置換ステップと、
前記置換ステップによりデータが置換されたファイルを記憶する記憶ステップとを備えることを特徴とする構造化文書ファイル処理方法。
A first detection step of detecting an identifier from a type file in which an identifier having a character string for identifying the type and the contents of the type are described in association with each other;
An element having a name, a content, and a type, an identification character for identifying a type, which includes a content character string representing the content and a name character string indicating a region occupied by the content character string in the document and representing the name. A second detection step of detecting an identification character string from a structured document file representing a structured document having an element represented by
Among the data constituting the type file in which the identifier is detected in the first detection step and the structured document file in which the identification character string is detected in the second detection step, the data is detected by the first detection step. A character string group that has a perfect match in a set composed of a character string of the identified identifier and a name character string contained in the identification character string detected in the second detection step. Replacing each of the data representing the character strings to be performed with data representing one character string having a length sufficient and necessary to identify the type in the type file and the structured document file;
A storage step of storing a file whose data has been replaced by the replacement step.
型を識別するための文字列を有する識別子と該型の内容とが対応付けられて記述される型ファイルを用いて、名称、内容および型を持つ要素であって、内容を表す内容文字列と、該内容文字列が文書において占める領域を示すとともに名称を表す名称文字列を内包する、型を識別するための識別文字列とで表される要素、を有する構造化文書を表す構造化文書ファイルを作成する機能を有する通信装置との間でファイルの送受信を行う装置において用いられる方法であって、
前記型ファイルを取得する第1の取得ステップと、
前記第1の取得ステップで取得された前記型ファイルから、識別子を検出する第1の検出ステップと、
前記第1の検出ステップにより検出された識別子が有している文字列を表すデータについて、該型ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する第1の圧縮置換ステップと、
前記第1の圧縮置換ステップで置換される前の前記文字列を表すデータと、置換された後の前記文字列を表すデータとの対応関係を記憶する対応関係記憶ステップと、
前記第1の圧縮置換ステップで置換された前記型ファイルを、前記通信装置に送信する第1の送信ステップと、
前記通信装置で型ファイルを用いて作成され、前記名称文字列を表すデータに、前記第1の圧縮置換ステップで置換された後の前記文字列を表すデータが用いられている第1の構造化文書ファイルを受信する受信ステップと、
前記受信ステップで受信した第1の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶手段に記憶された対応関係に従って、前記第1の圧縮置換ステップで置換される前の文字列に置換する復元置換ステップと、
前記復元置換ステップで置換された第1の構造化文書ファイルと、前記型ファイルとを用いて作成された第2の構造化文書ファイルを取得する第2の取得ステップと、
前記第2の取得ステップで取得された前記第2の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶ステップで記憶された対応関係に従って、前記第1の圧縮置換ステップで置換された後の前記文字列を表すデータに置換する第2の圧縮置換ステップと、
前記第2の圧縮置換ステップで置換された前記第2の構造化文書ファイルを前記通信装置に送信する第2の送信ステップとを備えることを特徴とする構造化文書ファイル処理方法。
Using a type file in which an identifier having a character string for identifying a type and the content of the type are described in association with each other, an element having a name, content, and type, and a content character string representing the content. A structured document file having an element represented by an identification character string for identifying a type, which includes a name character string indicating a region occupied by the content character string in the document and indicating a name. A method used in an apparatus for transmitting and receiving a file to and from a communication apparatus having a function of creating a file,
A first obtaining step of obtaining the type file;
A first detection step of detecting an identifier from the type file acquired in the first acquisition step;
The data representing the character string possessed by the identifier detected by the first detection step is replaced with data representing one character string having a length sufficient and sufficient to identify the type in the type file. A compression replacement step of 1;
A correspondence storing step of storing a correspondence between data representing the character string before replacement in the first compression replacement step and data representing the character string after replacement;
A first transmission step of transmitting the type file replaced in the first compression replacement step to the communication device;
A first structuring method in which the communication device uses a type file, and the data representing the name character string is data representing the character string after replacement in the first compression replacement step. A receiving step of receiving a document file;
The data representing the name character string of the first structured document file received in the receiving step is replaced with the data before the replacement in the first compression replacement step in accordance with the correspondence stored in the correspondence storage means. A restoring replacement step for replacing with a character string;
A second acquisition step of acquiring a first structured document file replaced by the restoration / replacement step and a second structured document file created using the type file;
The data representing the name character string possessed by the second structured document file acquired in the second acquisition step is stored in the first compression replacement step in accordance with the correspondence stored in the correspondence storage step. A second compression replacement step of replacing the data with the data representing the character string after the replacement;
A second transmitting step of transmitting the second structured document file replaced in the second compression replacing step to the communication device.
コンピュータに、
型を識別するための文字列を有する識別子と該型の内容とが対応付けられて記述される型ファイルから、識別子を検出する第1の検出ステップと、
名称、内容および型を持つ要素であって、内容を表す内容文字列と、該内容文字列が文書において占める領域を示すとともに名称を表す名称文字列を内包する、型を識別するための識別文字列とで表される要素、を有する構造化文書を表す構造化文書ファイルから識別文字列を検出する第2の検出ステップと、
前記第1の検出ステップにより識別子が検出された型ファイルと前記第2の検出ステップにより識別文字列が検出された構造化文書ファイルとを構成するデータのうち、前記第1の検出ステップにより検出された識別子が有している文字列と、前記第2の検出ステップにより検出された識別文字列が内包している名称文字列とから構成される集合において完全一致の関係にある文字列群を構成する文字列を表すデータの各々について、該型ファイル及び該構造化文書ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する置換ステップと、
前記置換ステップによりデータが置換されたファイルを記憶する記憶ステップとを実行させるための構造化文書ファイル処理プログラム。
On the computer,
A first detection step of detecting an identifier from a type file in which an identifier having a character string for identifying the type and the contents of the type are described in association with each other;
An element having a name, a content, and a type, an identification character for identifying a type, which includes a content character string representing the content and a name character string indicating a region occupied by the content character string in the document and representing the name. A second detection step of detecting an identification character string from a structured document file representing a structured document having an element represented by
Among the data constituting the type file in which the identifier is detected in the first detection step and the structured document file in which the identification character string is detected in the second detection step, the data is detected by the first detection step. A character string group that has a perfect match in a set composed of a character string of the identified identifier and a name character string contained in the identification character string detected in the second detection step. Replacing each of the data representing the character strings to be performed with data representing one character string having a length sufficient and necessary to identify the type in the type file and the structured document file;
And a storage step of storing a file whose data has been replaced by the replacement step.
型を識別するための文字列を有する識別子と該型の内容とが対応付けられて記述される型ファイルを用いて、名称、内容および型を持つ要素であって、内容を表す内容文字列と、該内容文字列が文書において占める領域を示すとともに名称を表す名称文字列を内包する、型を識別するための識別文字列とで表される要素、を有する構造化文書を表す構造化文書ファイルを作成する機能を有する通信装置との間でファイルの送受信を行うコンピュータに、
前記型ファイルを取得する第1の取得ステップと、
前記第1の取得ステップで取得された前記型ファイルから、識別子を検出する第1の検出ステップと、
前記第1の検出ステップにより検出された識別子が有している文字列を表すデータについて、該型ファイルにおいて型を識別するに必要十分な長さを有する一つの文字列を表すデータで置換する第1の圧縮置換ステップと、
前記第1の圧縮置換ステップで置換される前の前記文字列を表すデータと、置換された後の前記文字列を表すデータとの対応関係を記憶する対応関係記憶ステップと、
前記第1の圧縮置換ステップで置換された前記型ファイルを、前記通信装置に送信する第1の送信ステップと、
前記通信装置で型ファイルを用いて作成され、前記名称文字列を表すデータに、前記第1の圧縮置換ステップで置換された後の前記文字列を表すデータが用いられている第1の構造化文書ファイルを受信する受信ステップと、
前記受信ステップで受信した第1の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶ステップに記憶された対応関係に従って、前記第1の圧縮置換ステップで置換される前の文字列に置換する復元置換ステップと、
前記復元置換ステップで置換された第1の構造化文書ファイルと、前記型ファイルとを用いて作成された第2の構造化文書ファイルを取得する第2の取得ステップと、
前記第2の取得ステップで取得された前記第2の構造化文書ファイルの有する前記名称文字列を表すデータを、前記対応関係記憶ステップで記憶された対応関係に従って、前記第1の圧縮置換ステップで置換された後の前記文字列を表すデータに置換する第2の圧縮置換ステップと、
前記第2の圧縮置換ステップで置換された前記第2の構造化文書ファイルを前記通信装置に送信する第2の送信ステップとを実行させるための構造化文書ファイル処理プログラム。
Using a type file in which an identifier having a character string for identifying a type and the content of the type are described in association with each other, an element having a name, content, and type, and a content character string representing the content. A structured document file having an element represented by an identification character string for identifying a type, which includes a name character string indicating a region occupied by the content character string in the document and indicating a name. A computer that sends and receives files to and from a communication device that has the function of creating
A first obtaining step of obtaining the type file;
A first detection step of detecting an identifier from the type file acquired in the first acquisition step;
The data representing the character string possessed by the identifier detected by the first detection step is replaced with data representing one character string having a length sufficient and sufficient to identify the type in the type file. A compression replacement step of 1;
A correspondence storing step of storing a correspondence between data representing the character string before replacement in the first compression replacement step and data representing the character string after replacement;
A first transmission step of transmitting the type file replaced in the first compression replacement step to the communication device;
A first structuring method in which the communication device uses a type file, and the data representing the name character string is data representing the character string after replacement in the first compression replacement step. A receiving step of receiving a document file;
According to the correspondence relation stored in the correspondence relation storage step, the data representing the name character string of the first structured document file received in the reception step is replaced with the data before the substitution in the first compression replacement step. A restoring replacement step for replacing with a character string;
A second acquisition step of acquiring a first structured document file replaced by the restoration / replacement step and a second structured document file created using the type file;
The data representing the name character string possessed by the second structured document file acquired in the second acquisition step is stored in the first compression replacement step in accordance with the correspondence stored in the correspondence storage step. A second compression replacement step of replacing the data with the data representing the character string after the replacement;
A second transmission step of transmitting the second structured document file replaced in the second compression replacement step to the communication device.
請求項8又は請求項9に記載のプログラムを記憶した記憶媒体。A storage medium storing the program according to claim 8.
JP2002260251A 2002-09-05 2002-09-05 Processor and method for processing structured document file, program, and storage medium Pending JP2004102430A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002260251A JP2004102430A (en) 2002-09-05 2002-09-05 Processor and method for processing structured document file, program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002260251A JP2004102430A (en) 2002-09-05 2002-09-05 Processor and method for processing structured document file, program, and storage medium

Publications (1)

Publication Number Publication Date
JP2004102430A true JP2004102430A (en) 2004-04-02

Family

ID=32261021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002260251A Pending JP2004102430A (en) 2002-09-05 2002-09-05 Processor and method for processing structured document file, program, and storage medium

Country Status (1)

Country Link
JP (1) JP2004102430A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006221656A (en) * 2005-02-11 2006-08-24 Fujitsu Ltd High-speed encoding method and system of data document
JP2006221654A (en) * 2005-02-11 2006-08-24 Fujitsu Ltd Method and system for reducing delimiter
US8185565B2 (en) 2007-11-16 2012-05-22 Canon Kabushiki Kaisha Information processing apparatus, control method, and storage medium
JP2013025744A (en) * 2011-07-26 2013-02-04 Nippon Telegr & Teleph Corp <Ntt> Log file collection system, server, log file collection method, log output method and program
CN107846381A (en) * 2016-09-18 2018-03-27 阿里巴巴集团控股有限公司 Network security processing method and equipment
US10803243B2 (en) 2018-04-02 2020-10-13 Fujitsu Limited Method, device, and medium for restoring text using index which associates coded text and positions thereof in text data

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006221656A (en) * 2005-02-11 2006-08-24 Fujitsu Ltd High-speed encoding method and system of data document
JP2006221654A (en) * 2005-02-11 2006-08-24 Fujitsu Ltd Method and system for reducing delimiter
US8185565B2 (en) 2007-11-16 2012-05-22 Canon Kabushiki Kaisha Information processing apparatus, control method, and storage medium
JP2013025744A (en) * 2011-07-26 2013-02-04 Nippon Telegr & Teleph Corp <Ntt> Log file collection system, server, log file collection method, log output method and program
CN107846381A (en) * 2016-09-18 2018-03-27 阿里巴巴集团控股有限公司 Network security processing method and equipment
US10803243B2 (en) 2018-04-02 2020-10-13 Fujitsu Limited Method, device, and medium for restoring text using index which associates coded text and positions thereof in text data

Similar Documents

Publication Publication Date Title
KR100317401B1 (en) Apparatus and method for printing related web pages
US20060114506A1 (en) Information processing apparatus, information processing method and print systems
US8463874B2 (en) Method and system of recording and reproducing web application operation
US20080201405A1 (en) Method and System for Generating a Graphical Display for a Remote Terminal Session
US10572546B2 (en) Information processing apparatus, document display method, document display system, and medium
JP2002288124A (en) Workstation system, computer device, data transfer method, data editing method, computer program creating method, computer program, and storage medium
JP2002108870A (en) System and method for processing information
JP2002163078A (en) Information processing device, printing system, information processing method, and printing method
JP4282312B2 (en) Web server, Web server having Java servlet function, and computer program
JP2004310371A (en) System, method, server for sharing file and client terminal for file sharing service, file sharing program and recording medium with program recorded
JP2006243929A (en) Terminal device management system, terminal device management method, and computer program
JP2010061542A (en) Communication terminal, communication method, signal processor, signal processing method and communication system
JP2004303218A (en) Information providing device and information display device
WO2023092580A1 (en) Page display method and apparatus, storage medium, and electronic device
JP2005242829A (en) Data processing device, data processing method, data processing program, and recording medium with data processing program recorded
JP2003280974A (en) Web server management method, program and recording medium
JP2002351625A (en) Print system and information processor
JP2004102430A (en) Processor and method for processing structured document file, program, and storage medium
JPH1115723A (en) Multimedia data supplying method and multimedia data server
JP2009110216A (en) Server device, client device, server based computing system, and program
JP2008035224A (en) Log information management system, log information management device, log information management method, log information management program, and storage medium
US8566723B2 (en) Menu bar providing method and information browsing screen configuration file creation program
JP3916219B2 (en) Link destination compression system
JP2001075890A (en) Document distribution system
JP2000076155A (en) Html document compression/expansion/display system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080624

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081224