JP2009501991A - 構造化文書を圧縮および解凍するための方法および装置 - Google Patents

構造化文書を圧縮および解凍するための方法および装置 Download PDF

Info

Publication number
JP2009501991A
JP2009501991A JP2008522102A JP2008522102A JP2009501991A JP 2009501991 A JP2009501991 A JP 2009501991A JP 2008522102 A JP2008522102 A JP 2008522102A JP 2008522102 A JP2008522102 A JP 2008522102A JP 2009501991 A JP2009501991 A JP 2009501991A
Authority
JP
Japan
Prior art keywords
type
value
attribute
original
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008522102A
Other languages
English (en)
Inventor
セドリック・ティエノ
フィリップ・ドゥ・クエト
ロビン・ブルジョン
Original Assignee
エクスプウェイ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エクスプウェイ filed Critical エクスプウェイ
Publication of JP2009501991A publication Critical patent/JP2009501991A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Document Processing Apparatus (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本発明は、互いに入れ子になっている要素を有してツリーのような構造を持つ構造化文書(DOC1)を圧縮する方法に関する。各要素は、他の要素を含む属性および値領域を有する。前記方法は、オリジナルタイプの属性の一部のみを有する簡易型タイプを定義するステップと、前記文書において、簡易型タイプの属性の属性値および有無についてのみがオリジナルタイプを持つ前要素に対して前記要素が異なっているとき、オリジナルタイプの各要素について、前記要素の中のタイプ識別子を簡易型タイプの識別子に置換するステップとを有する。

Description

本発明は、一般に、データの転送、記憶、検索および表示をするためのコンピュータシステムの分野に関するものである。特に、本発明は、多くの属性および/または部分要素を持つ多数の構造化要素を有する構造化文書を圧縮および解凍するための方法およびシステムに関するものである。
本発明は、特に、構造化マルチメディア文書、デジタルまたはビデオ画像または連続画像、映画またはビデオプログラムの取り扱い、転送、記憶および読取りに適用されるがこれに限定されず、一般に、データ伝送網によって相互接続されたプロセッサユニット間での前記文書の転送、またはプロセッサユニットと記憶ユニット間での前記文書の転送、正に、文書がデジタルまたはビデオ画像を有している場合、テレビセットのようなプロセッサユニットと再生ユニットとの間での前記文書の転送などに適用される。
構造として統合化された複数の異なった文書タイプを有する文書について、このような方法で取り扱いおよび伝送することは、ますます頻繁になっている。構造化文書は、タイプおよび属性にそれぞれ関連しているとともに、主に階層的な関係によって相互連結された1セットの情報要素である。そのような言語は、汎用マークアップ言語規約(SGML)、ハイパーテキストマークアップ言語(HTML)、または拡張マークアップ言語(XML)のようなマークアップ言語を使用し、特に、文書を構成する情報の様々な要素間を区別することに使用される。その一方、「直線的(linear)」文書では、文書の内容情報として配置情報とタイプ情報とが混ざっている。
また、構造化文書は、文書における異なった情報要素を分離するために「タグ」と呼ばれるマーカーを有している。SGML、XMLおよびHTMLの3つのタグは、フォーム「<XXXX>」および「</XXXX>」と、情報要素の始まりを示す第1タグ「XXXX」と、前記要素の終わりを示す第2タグ「/XXXX」とを持っている。情報要素は、それ自体が複数の属性と、「部分要素」と呼ばれる低レベル情報要素とで構成されている。したがって、構造化文書は、ツリーまたは階層構造を示し、各ノードが情報要素を表すとともに、高い階層レベルのノードに接続されている。前記高い階層レベルのノードは、情報要素を表すとともに低レベルの情報要素を有する。そのようなツリー構造の分岐の終端に位置するノードは、情報部分要素に分割されていない所定の非構造化タイプを有する情報要素を示している。
したがって、構造化文書は、分離マークか、または一般にテキスト形式で表されるタグを有している。前記タグは、タグによって分離された他の情報部分要素をそれ自身が有する情報要素または部分要素を定義する。
しかしながら、XMLのようなマークアップ言語は、冗長な言語であり、その結果、伝送および記憶について処理効率が悪くコストが高い。さらに、多くのソストウェアアプリケーションが非常に大きな構造化文書を作成する傾向にある。これは、特に、情景記述、技術、技術図面、回路図などのようなHTML文書およびデジタルグラフィカル文書を作成するソフトウェアアプリケーションの場合が該当する。グラフィカルアプリケーションによって作成された文書は、多くのポイント、ラインおよびカーブを示すグラフィックデータを有している。これらのグラフィック文書では、グラフィックオブジェクトが、二次元ベクトルと混合ベクトル/ラスタ・グラフィックオブジェクトとを示すSVG(スケーラブル・ベクトル・グラフィックス)のような言語を使用するグラフィカル構造化要素によって示されている。
構造化文書がデジタル通信網を介した記憶または伝送を予定としているので、構造化文書の大きさを削減する必要がある。
構造化文書の大きさを削減する既知の解決手段は、文書の圧縮処理を使用する。この点で、ISO/IEC 15938−1(MPEG−7−Moving Picture Expert Group)またはより最近のISO/IEC 23001−1が、XML構造化文書を符号化(圧縮化)するとともに、2進形式に復号化するための方法および2進形式を提案する。この規格は、特に、マルチメディアメタデータのような高度構造化データに対処するように設計されている。
しかしながら、いくつかの構造化要素は、通常、多数の必須または任意および/または部分要素を持っており、実際には文書の中でそれらの少数が存在している。そのような構造化要素が2進ストリームに圧縮されるとき、属性または要素の欠如を示す2進フラグに少なくとも符号化されるべき各属性または部分要素は、要素の中に存在しない。したがって、多数の属性または部分要素を持つ構造化文書の2進符号化は、効率的ではない。
本発明の一実施形態は、少数の属性または部分要素のみが異なる同一タイプの多数の要素を持つ多くの文書を判別することに基づき、MPEG−7を使用して2進符号化された構造化文書の大きさを削減する。
したがって、本発明の一実施形態は、相互に入れ子になっているとともに情報要素の構造を参照している要素タイプ識別子にそれぞれ関連付けられた構造化要素を有するツリーのような構造を持つ構造化文書を圧縮する圧縮方法を提供する。ここで、各要素は、要素のタイプにしたがって、名称および値によって定義された属性と、1つ以上の要素を有する値領域とを有する。
本発明の一実施形態によれば、前記圧縮方法は、文書の中のオリジナル要素タイプを有する各要素に対して、オリジナル要素タイプから得られるとともに前記オリジナル要素タイプの属性および値領域の一部のみを有する簡易型要素タイプを定義するステップと、
文書の中のオリジナル要素タイプを有する各要素について、文書の中でオリジナルタイプを持つ前要素に対して、簡易型タイプの属性および要素値領域のそれぞれの値または有無のみが異なるとき、要素のタイプ識別子を前記簡易型タイプの識別子に置換するステップと、要素から前記簡易型タイプに属しない前記属性および値領域を削除するステップとを有する。
本発明の一実施形態によれば、前記圧縮方法は、構造化文書から2進ストリームを出力する符号化するステップを有する。
本発明の一実施形態によれば、前記2進ストリームは、構造化文書の各要素について、
前記要素のタイプ識別子を示す2進数と、
前記属性または値領域が存在しているか否かを示す1ビットを、前記要素の任意的属性および値領域のそれぞれに含んでおり、前記要素の属性および前記要素の値領域それぞれの値を符号化した圧縮2進値とを有する。
本発明の一実施形態によれば、前記タイプを置換するステップは、前記符号化ステップの前に実行される。
本発明の一実施形態によれば、前記簡易型タイプは、前記文書中のオリジナルタイプの要素の中で値または有無が頻繁に変動している属性を有する。
本発明の一実施形態によれば、1つ以上の簡易型タイプが前記構造化文書の同一オリジナルタイプについて定義されており、前記簡易型タイプは様々な属性を持っている。
本発明の一実施形態によれば、前記圧縮方法は、オリジナルタイプに基づくとともに、オリジナルタイプの任意的属性を含む属性の任意的セットを有する導出タイプを定義するステップと、オリジナルタイプを持っている構造化文書の各要素のオリジナルタイプを前記導出タイプに置換するステップとを有する。
本発明の他の実施形態は、バイナリ・ストリームの方式の構造化文書を解凍するための解凍方法であって、前記構造化文書は、お互いに入れ子になっているとともに情報要素の構造を参照している要素タイプ識別子にそれぞれ関連付けられた情報要素を有して、ツリーのような構造を持っており、各要素は、名称および値によって定義された前記要素の属性のタイプと、1つ以上の要素を有する値領域とを有しているものを提供する。
本発明の一実施形態によれば、少なくとも1つの要素がオリジナルタイプから得られる簡易型タイプを持っているとともに、前記オリジナルタイプの属性および値領域の一部のみを有しており、前記属性および値領域の値がオリジナルタイプを持つ文書における前要素によって与えられる簡易型タイプのものでない。
本発明の一実施形態によれば、前記バイナリ・ストリームは、前記構造化文書の各要素についての2進符号化値を有し、
各要素の2進符号化値は、
前記要素のタイプ識別子を示す2進数と、
前記要素に属性または値領域が存在しているか否かを示す1ビットを、前記要素の任意的属性および値領域のそれぞれに含んでおり、前記要素の属性および前記要素の値領域それぞれの値を符号化した圧縮2進値とを有する。
本発明の一実施形態によれば、前記解凍方法は、2進数および値を要素タイプ識別子と属性名および属性値と要素値とに変換することによって前記バイナリ・ストリームを復号化するステップを有する。
本発明の一実施形態によれば、前記解凍方法は、前記文書中の簡易型タイプの識別子のそれぞれを対応するオリジナルタイプ識別子に置換するステップと、前記簡易型タイプに属しないオリジナルタイプを持つ前要素の属性および値を簡易型タイプの各要素の中に挿入するステップとを有する。
本発明の一実施形態によれば、前記置換するステップが前記復号化するステップの後で実行される。
本発明の一実施形態によれば、前記簡易型タイプは、前記文書におけるオリジナルタイプを持つ要素の中で有無または値が頻繁に変動している属性を有する。
本発明の一実施形態によれば、1つ以上の簡易型タイプが前記構造化文書の同一オリジナルタイプについて定義されており、前記簡易型タイプは様々な属性を持っている。
本発明の一実施形態によれば、少なくとも1つの要素がオリジナルタイプの任意的属性を含む属性の任意的セットを有する導出タイプに置換されたオリジナルタイプを持ち、文書を符号化した前記バイナリ・ストリームは、前記要素の中に任意的属性セットの1つ以上の属性が有るか否か示す1ビットを、導出タイプを持つ各要素について有する。
本発明の一実施形態によれば、前記解凍方法は、導出タイプ識別子を対応するオリジナルタイプ識別子に置換するステップを有する。
本発明の他の実施形態によれば、前記構造化文書は、お互いに入れ子になっているとともに情報要素の構造を参照している要素タイプ識別子にそれぞれ関連付けられた情報要素を有して、ツリーのような構造を持っており、各要素は、要素のタイプに応じて、名称および値によって定義された必須または任意の属性と、1つ以上の要素を有する任意の値領域とを有している、圧縮装置を提供する。
本発明の一実施形態によれば、前記構造化文書の中のオリジナルタイプから得られるとともに前記オリジナルタイプの属性および値領域の一部のみを有する簡易型タイプが定義され、
前記圧縮装置は、
オリジナルタイプを持つ前記文書において、簡易型タイプの属性および要素値領域の値のみについて、前記要素が前要素と異なっているとき、前記文書の中のオリジナルタイプを持つ各要素のタイプ識別子を簡易型タイプの識別子に置換し、簡易型タイプを持つ各要素から前記簡易型タイプに属しない前記属性および値領域を削除するように構成されている。
本発明の一実施形態によれば、前記圧縮装置は、2進ストリームを出力するように構成されている。
本発明の一実施形態によれば、前記2進ストリームは、構造化文書の各要素について、 前記要素のタイプ識別子を示す2進数と、
前記属性または値領域が存在しているか否かを示す1ビットを、前記要素の任意的属性および値領域のそれぞれに含んでおり、前記要素の属性および前記要素の値領域それぞれの値を符号化した圧縮2進値とを有する。
本発明の一実施形態によれば、前記圧縮装置は、前記構造化文書を符号化する前に、前記構造化文書においてオリジナルタイプを簡易型タイプに置換するように構成されている。
本発明の一実施形態によれば、前記簡易型タイプは、前記文書におけるオリジナルタイプを持つ要素の中で有無または値が頻繁に変動している属性を有する。
本発明の一実施形態によれば、1つ以上の簡易型タイプが前記構造化文書の同一オリジナルタイプについて定義されており、前記簡易型タイプは様々な属性を持っている。
本発明の一実施形態によれば、オリジナルタイプに基づくとともに、オリジナルタイプの任意的属性を含む属性の任意的セットを有する導出タイプが定義され、前記圧縮装置は、オリジナルタイプを持っている構造化文書の各要素のオリジナルタイプを前記導出タイプに置換するように構成されている。
本発明の他の実施形態によれば、バイナリ・ストリームの方式の構造化文書を解凍するための解凍装置を提供とともに、前記構造化文書は、お互いに入れ子になっているとともに情報要素の構造を参照している要素タイプ識別子にそれぞれ関連付けられた情報要素を有して、ツリーのような構造を持っており、各要素は、要素のタイプにしたがって名称および値によって定義された属性と、1つ以上の要素を有する値領域とによって構成されている。
本発明の一実施形態によれば、少なくとも1つの要素がオリジナルタイプから得られる簡易型タイプを持っているとともに、前記オリジナルタイプの属性および値領域の一部のみを有しており、前記属性および値領域の値がオリジナルタイプを持つ文書における前要素によって与えられる簡易型タイプのものでない。
本発明の一実施形態によれば、前記バイナリ・ストリームは、前記構造化文書の各要素についての2進符号化値を有し、各要素の2進符号化値は、
前記要素のタイプ識別子を示す2進数と、
前記要素に属性または値領域が存在しているか否かを示す1ビットを、前記要素の任意的属性および値領域のそれぞれに含んでおり、前記要素の属性および前記要素の値領域それぞれの値を符号化した圧縮2進値とを有する。
本発明の一実施形態によれば、前記解凍装置は、2進数および値を要素タイプ識別子と属性名および属性値と要素値とに変換することによって前記バイナリ・ストリームを復号化するように構成された復号器を有する。
本発明の一実施形態によれば、解凍装置は、前記文書中の簡易型タイプ識別子のそれぞれを対応するオリジナルタイプ識別子に置換し、簡易型タイプではないオリジナルタイプを持つ前要素の属性および値を、前記簡易型タイプ識別子を持つ各要素の中に挿入するように構成されている。
本発明の一実施形態によれば、前記解凍装置は、 バイナリ・ストリームを復号化した後に、簡易型タイプ識別子を対応するオリジナルタイプに置換するように構成されている。
本発明の一実施形態によれば、前記簡易型タイプは、前記文書中のオリジナルタイプの要素の中で有無または値が頻繁に変動している属性を有する。
本発明の一実施形態によれば、1つ以上の簡易型タイプが前記構造化文書の同一オリジナルタイプについて定義されており、前記簡易型タイプは様々な属性を持っている。
本発明の一実施形態によれば、少なくとも1つの要素がオリジナルタイプの任意的属性を含む属性の任意的セットを有する導出タイプに置換されたオリジナルタイプを持ち、文書を符号化した前記バイナリ・ストリームは、前記要素の中に任意的属性セットの1つ以上の属性が有るか否か示す1ビットを、導出タイプを持つ各要素について有する。
本発明の一実施形態によれば、前記解凍装置は、導出タイプ識別子を対応するオリジナルタイプ識別子に置換するように構成されている。
本発明のこれらおよび他の利点並びに特徴が添付の図面に関連づけられて以下にさらに詳細に説明されるが、本発明はこれに限定されるものではない。
図1は、ヘッダHDおよび主要素MELを有する構造化文書1を示す。主要素MELは、タイプ識別子Typeと、一組の属性Att.1, Att.2, ...Attnと、値Valとを有する。主要素MELの値は、「主要素の部分要素」と呼ばれる1つ以上の構造化文書4を有するものとすることができる。構造化文書4のぞれぞれは、タイプ識別子Typeと、一組の属性Att.1−Attnと、値Valとを有する。また、各要素4の値は、それ自身が1つ以上の構造化または非構造化部分要素を有することができる。非構造化要素は、文字列、整数、浮動小数点数…などの既知のフォーマットを持っている。各要素または部分要素は、その要素の構造を定義しているタイプに関連づけられている。構造化文書の要素の各タイプは、スキーマ(例えば、XML言語のXMLスキーマ)で定義されていることとすることができる。
構造化文書の構造化要素は、XML、またはHTMLおよびSVGなどのXMLから導出した言語による、下記の数1のような形式を持っている。
Figure 2009501991
ここで、「<type ..>」は、文書における要素の始まりを区切っている始端タグであり、
「type」は、構造化要素のタイプ識別子であり、
「</type>」は、文書における要素の終端を区切っている終了タグであり、
「atti-name=atti- value」は、要素の属性「i」の名称であるとともに、属性の値であり、
「value」は、構造化または非構造化部分要素を有するものとすることができる要素の値である。
下記は、タイプ「a」(HTMLアンカータイプ)のHTML要素の一実施形態である。
Figure 2009501991
HTMLアンカー要素は、以下の表1の30の任意的属性を有することとしてもよい。
Figure 2009501991
属性「id」および「href」のアンカー要素は、下記のようなISO-IEC 23001-1に従って符号化されている。
Figure 2009501991
ISO−IECの23001−1の適合のエンコーダによって生成されるバイナリ・ストリームでは、 構造化文書の各要素の符号化された値が構造化文書の中の要素の出現順序に対応した予定された順序で生じる。各要素は、要素のタイプを示すビットナンバー「a-num」で符号化されている。要素の各属性は、予定された順序で符号化されている。要素の必須の属性は、前記属性の値を表している圧縮された2進値で符号化されている。要素の任意的属性は、前記属性が存在しているか否かを示すビットとして符号化されており、前記属性の値を表す2進圧縮値が続いている。要素の値が任意的である場合、要素の値が存在するか否かを示すビットとして符号化されており、要素の符号化値が続いている。要素の値が構造化部分要素で構成されている場合、各部分要素は要素として符号化されている。そうでなければ、要素の値は、要素の値を表す2進圧縮値として符号化されている。
SVGは、XMLに基づく言語とは別のものである。SVGは、場面描写などの図形オブジェクトを表すように設計されている。また、この言語は、可能な属性を多数を持つ多くの要素タイプを有する。例えば、要素タイプ「多角形(polygon)」は、以下の表3に示す60の属性を有している。
Figure 2009501991
前記多角形のポイント座標のリストを与える「ポイント(points)」を除き、これらの全ての属性が任意的なものである。一般に、最も多くの頻度で使用される属性は、「id(ID)」および「fill(フィル)」である。多角形要素は、下記の数4のように ISO-IEC 23001-1に従って符号化された識別子「ID」およびポイント(必須)のリストを持っている。
Figure 2009501991
以上により、アンカーまたは多角形要素の符号化値は、欠如している任意的属性のそれぞれに対しての「0」の1ビットと、存在している任意的属性のそれぞれに対しての「1」の1ビットとを有して、存在している属性の値に続いている。したがって、多数の任意的属性を持っている要素の符号化は、圧縮比に関する条件において効率的でない。
本発明の一実施形態では、新規な簡易型の要素タイプが導入されている。「多角形」タイプ要素の実施形態では、新規な要素タイプ「同一多角形(samepolygon)」が導入されており、この新規な要素タイプは「多角形」タイプの必須の属性のみを持っており、すなわち「ポイント」、この要素タイプの属性(それらの値または存在に関して)の大部分が頻繁に変えられる、すなわち「id」。「多角形」要素の他の全ての属性値が文書において以前に出現した他の「多角形」要素によって特定されている。
第2「多角形」要素が、SVG文書において同一タイプであって「ポイント」および「id」属性を除き同一属性を持つ第1前要素の後に出現するとき、前記第2「多角形」要素は「同一多角形」タイプの要素に置換される。第2「多角形」要素の要素タイプを変えるとき、簡易型タイプではない全ての属性が取り除かれる(それらは同一タイプの前要素と同一の値を持っている)。したがって、第2「多角形」要素は、以下のように符号化される。
Figure 2009501991
同一方法で、タイプ「Samea」は1つの属性「href」のみで定義されている。第一アンカー要素に続く全てのアンカータイプの要素は、以下の方法で符号化された異なる「href」属性値のみを持っている。
Figure 2009501991
したがって、本発明の実施形態によれば、多数の属性を持っているいくつかの複合要素タイプが、または値および/または存在について異なる1つまたは2つの属性のみ持つ非常に頻繁に使用されるタイプが、文書において使用された属性とは異なる属性のみを持つ簡易型要素タイプに、構造化文書において置換されている。前記簡易型タイプの定義は、同一構造のスキーマに関連した構造化文書の統計的分析に基づいて行うことができる。
文書の多角形またはアンカー要素の大部分が値を持っているとき、「同一多角形」または「samea」タイプが必須の値領域で定義されることとしてもよい、ことに留意すべきである。この場合、「同一多角形」または「samea」タイプの符号化された要素は、値のような欠如/存在を示すビットを含まない。アナログ手法では、要素の値が要素タイプに関連する。文書の多角形またはアンカー要素値の大部分が一定タイプを持つ場合、「同一多角形」または「samea」タイプは、「同一多角形」または「samea」タイプの要素の値にタイプを負わせることとしてもよい。したがって、要素の符号化された値は、値の要素タイプを参照する2進数を含まない。
例えば、文書の要素が値または存在の異なる2つまたは3つの属性を持つ同じタイプであるとき、いくつかの簡易型要素タイプは、単一要素タイプから定義されることとしてもよい。したがって、上記実施形態では、タイプ「samepolygonfill」が、「id」、 「ポイント(point)」、「fill」の3つの属性を持つ要素を定義することに追加されることとしてもよい。タイプ「samepolygonfill」は、属性「fill」と「ポイント(point)」と「id」との値のみが前「多角形」要素とは異なる文書における要素のタイプ「多角形」に置換することができる。
図2は、本発明の一実施形態に係る圧縮装置を示している。圧縮装置は、符号化される構造化文書DOC1を受信する最適化機構OPTと、最適化された構造化文書を2進ストリームBDOCに変換する符号化装置ENCとを有する。最適化機構は、本発明の実施形態に従って、構造化文書DOClにおいて反復性のある属性値を持つ要素のタイプ「X」を簡易型タイプ「SameX」に置換するように構成されている。
図3は、本発明の一実施形態に係る解凍装置を示している。解凍装置は、2進ストリームBDOCを最適化された構造化文書に変換する復号器DEC を有している。構造化文書を読み込むまたは使用する手段が簡易型タイプ「SameX」を知得できない場合、複合器は、簡易型タイプをオリジナルタイプに変換するアダプタを有するとともに、先に属性値で定義された簡易型タイプを持つように要素に追加する。アダプタADPは、符号化装置ENCを通った文書と同様に、しかし、必ずしも同一ではない、構造化文書DOC2を出力する。
図4は、最適化機構OPTによって実行される処理ステップを示している。図4の処理ステップは、ステップS1〜S8を有している。ステップS1では、構造化文書がその文書の最後に達するまで要素について読み取られる(ステップS2)。ステップS3からS8は、文書の各要素について実行される。
ステップS3では、最適化機構OPTが現在の要素の要素タイプが1つの簡易型タイプを持つか否か判断する。読み取られた現在の要素のタイプが簡易型タイプを持たない場合、その現在の要素は結果文書(resulting document)として書かれる(ステップS6)。読み取られた現在の要素のタイプが1つ以上の簡易型タイプを持つ場合、最適化機構OPTは、記憶された文書において前要素が同一タイプを持っているか否かを判断する(ステップS4)。現在の要素と同一タイプの要素が記憶されていない場合、ステップS5で前記要素は記憶されるとともに、ステップS6で前記要素は結果文書として書かれる。ステップS4において、現在の要素が既に記憶された要素のタイプを持っている場合、ステップS7で、最適化機構は現在の要素のタイプが簡易型のタイプに置換できると判断する。換言すれば、ステップ7において、最適化機構は、簡易型タイプの属性を除き、現在の要素の属性値が記憶された要素の属性値と等しいか否か判断する。現在の要素のタイプが簡易型タイプに置換できる場合、前記要素は簡易型タイプ識別子を持つ結果文書として書かれる(ステップS8)。さらに、簡易型タイプでない要素の全ての属性が結果文書の中に書かれた要素から取り除かれる。そうでない場合、前記要素は、現在のタイプ識別子とともに、結果文書の中に、全く変更されずに書き込まれる(ステップS6)。
図5は、アダプタADPによって実行される処理ステップを示している。図5の処理ステップは、ステップS11〜S17を有している。ステップS11では、文書がその文書の最後に達するまで要素について読み取られる(ステップS12)。
ステップS13では、アダプタADPが読み取られた現在の要素の要素タイプが簡易型タイプを持つタイプであるか否か判断する。読み取られた現在の要素のタイプが1つ以上の簡易型タイプを持っている場合、アダプタADPは、ステップS14において現在の要素を記憶するとともに、ステップS15において結果文書の中に現在の文書を書き込む。そうでない場合、アダプタADPは、現在の要素のタイプが簡易型タイプであるか否か判断する(ステップS16)。現在の要素のタイプが簡易型タイプである場合、ステップS17において、現在の要素は、導出された簡易型タイプからオリジナルタイプに対応するタイプ識別子を持つ新しい要素に変換される。新しい要素は、現在の要素の属性を持つとともに、オリジナルタイプと同一の以前に記憶された要素の他の属性を持つ。
ステップS16において、現在の要素のタイプが簡易型タイプでない場合、ステップS15において、現在の要素は結果文書の中に書き込まれる。
最適化文書がオリジナル文書DOC1よりも小さいサイズにされて、最適化機構によって出力されることに留意すべきである。したがって、最適化文書は、2進ストリームに符号化されることなく、使用(記憶、転送、…)することができる。その結果、図2の圧縮装置では、符号化装置ENCは必要なものではなく、したがって、図3の解凍装置の復号器DECは必要なものではない。
さらに最適化文書は、ZLIBのような他の圧縮アルゴリズムを使用して圧縮されることとしてもよい。符号化装置ENCが文書DOC1について他の圧縮アルゴリズムを使用する場合、復号器は、オリジナル文章DOC1と同等の構造化文書DOC2を得るために、2進ストリームCDOCに対して逆アルゴリズムを適用する。
本発明の他の実施形態によれば、構造化文書は、まれな任意的属性のセット有する新しい属性タイプを定義することによって、および、新しい属性タイプを有する全ての属性の位置に新たな属性タイプを導入するように、まれな任意的属性を有する要素タイプを変更することによって、圧縮比の条件について最適化される。このように、「多角形」タイプの以下の実施形態のように、多数の属性を持つ文書の要素の大部分が符号化されることができる。
Figure 2009501991
まれな属性セットに属する属性が要素の中に存在している場合、符号化された要素は、最適化されておらず、まれな属性セットに属する属性の存在を示す追加ビットを有する。特に、この最適化は、簡易型タイプを持つ要素タイプに適用される。
上述の実施形態の見地から、本発明に係る方法および装置がいくつか変形されて実現できることが当業者にとって明確である。特に、本発明は、HTMLまたはSVGのようなXML言語または派生XML言語に限定されない。本発明は、より一般的に全ての構造化言語に適用される。
本発明は構造化要素の属性に限定されず、本発明はより一般的に構造化要素の部分要素に適用される。したがって、一定タイプのいくつかの要素が構造化文書において全て同じ値領域を持つ場合、固定値領域(タイプ「X」の前要素によって定義された)を持っている簡易型タイプ「sameX」は、要素の符号化を簡素化するために定義および使用されることができる。
また、要素のタイプを簡易型タイプに置換するステップは、構造化文書を符号化した2進ストリームで実行されることとしてもよく、あるいは符号化中または復号化中に実行されることとしてもよい。
解凍方法では、簡易型タイプを対応するオリジナルタイプに置換することは必要ではない。正に、復号化された構造化文書を使用するアプリケーションは、簡易型および導出型タイプ識別子を意味することとすることができる。
構造化文書のブロック図を示す。 本発明の一実施形態に係る構造化文書の圧縮装置のブロック図を示す。 本発明の一実施形態に係る構造化文書の解凍装置のブロック図を示す 図2の圧縮装置によって実行される最適化手順のフローチャートである。 図3の解凍装置によって実行される適応化手順のフローチャートである。
符号の説明
4 構造化文書

Claims (32)

  1. お互いに入れ子になっているとともに情報要素の構造を参照している要素タイプ識別子(Type)にそれぞれ関連付けられた構造要素(4)を有して、ツリーのような構造を持つ構造化文書(DOC1)を圧縮するための圧縮方法であって、
    各要素は、前記要素のタイプと、名称(atti名)および値(atti値)によって定義された属性(Att.1,Att.2,...Att.n)と、1つ以上の要素を有する値領域(Val)とによって構成されており、
    文書の中のオリジナル要素タイプを有する各要素に対して、オリジナル要素タイプから得られるとともに前記オリジナル要素タイプの属性および値領域の一部のみを有する簡易型要素タイプを定義するステップと、
    文書の中のオリジナル要素タイプを有する各要素について、文書の中でその要素がオリジナルタイプを持つ前要素に対して簡易型タイプの属性および要素値領域のそれぞれの値または有無のみが異なるとき、要素のタイプ識別子を前記簡易型タイプの識別子に置換するステップと、
    要素から前記簡易型タイプに属しない前記属性および値領域を削除するステップと
    を有することを特徴とする圧縮方法。
  2. 前記構造化文書からバイナリ・ストリーム(BDOC)を生成する符号化ステップを有する請求項1に記載の圧縮方法。
  3. 前記バイナリ・ストリーム(BDOC)は、前記構造化文書の各要素として、
    前記要素のタイプ識別子を示す2進数と、
    前記属性または値領域が存在しているか否かを示す1ビットを、前記要素の任意的属性および値領域のそれぞれに含んでおり、前記要素の属性および前記要素の値領域それぞれの値を符号化した圧縮2進値と
    を有する請求項2に記載の圧縮方法。
  4. 前記タイプを置換するステップは、前記符号化ステップの前に実行される請求項2または3に記載の圧縮方法。
  5. 前記簡易型タイプは、前記文書中のオリジナルタイプの要素の中で値または有無が頻繁に変動している属性を有する請求項1または4に記載の圧縮方法。
  6. 1つ以上の簡易型タイプが前記構造化文書の同一オリジナルタイプについて定義されており、
    前記簡易型タイプは様々な属性を持っている請求項1から5のいずれかに記載の圧縮方法。
  7. オリジナルタイプに基づくとともに、オリジナルタイプの任意的属性を含む属性の任意的セットを有する導出タイプを定義するステップと、
    オリジナルタイプを持っている構造化文書の各要素のオリジナルタイプを前記導出タイプに置換するステップとを有する請求項1から6のいずれかに記載の圧縮方法。
  8. バイナリ・ストリームの方式の構造化文書を解凍するための解凍方法であって、
    前記構造化文書(DOC1)は、お互いに入れ子になっているとともに情報要素の構造を参照している要素タイプ識別子(Type)にそれぞれ関連付けられた情報要素(4)を有して、ツリーのような構造を持っており、
    各要素は、名称(atti名)および値(atti値)によって定義された前記要素の属性(Att.1,Att.2,...Att.n)のタイプと、1つ以上の要素を有する値領域(Val)とによって構成されており、
    少なくとも1つの要素がオリジナルタイプから得られる簡易型タイプを持っているとともに、前記オリジナルタイプの属性および値領域の一部のみを有しており、
    前記属性および値領域の値がオリジナルタイプを持つ文書における前要素によって与えられる簡易型タイプのものでない、ことを特徴とする解凍方法。
  9. 前記バイナリ・ストリームは、前記構造化文書の各要素についての2進符号化値を有し、
    各要素の2進符号化値は、
    前記要素のタイプ識別子を示す2進数と、
    前記要素に属性または値領域が存在しているか否かを示す1ビットを、前記要素の任意的属性および値領域のそれぞれに含んでおり、前記要素の属性および前記要素の値領域それぞれの値を符号化した圧縮2進値と
    を有する請求項8に記載の解凍方法。
  10. 2進数および値を要素タイプ識別子と属性名および属性値と要素値とに変換することによって前記バイナリ・ストリームを復号化するステップを有する請求項8または9に記載の解凍方法。
  11. 前記文書中の簡易型タイプの識別子のそれぞれを対応するオリジナルタイプ識別子に置換するステップと、
    簡易型タイプではないオリジナルタイプを持つ前要素の属性および値を、簡易型タイプの各要素の中に挿入するステップと
    を有する請求項8から10のいずれかに記載の解凍方法。
  12. 前記置換するステップが前記復号化するステップの後で実行される請求項11に記載の解凍方法。
  13. 前記簡易型タイプは、前記文書におけるオリジナルタイプを持つ要素の中で有無または値が頻繁に変動している属性を有する請求項8から12のいずれかに記載の解凍方法。
  14. 別個の簡易型タイプが前記構造化文書の同一のオリジナルタイプに対して定義されており、
    前記簡易型タイプは、異なる属性を持っている請求項8から13のいずれかに記載の解凍方法。
  15. 少なくとも1つの要素がオリジナルタイプの任意的属性を含む属性の任意的セットを有する導出タイプに置換されたオリジナルタイプを持ち、
    文書を符号化した前記バイナリ・ストリームは、前記要素の中に任意的属性セットの1つ以上の属性が有るか否か示す1ビットを、導出タイプを持つ各要素について有する請求項8から14のいずれかに記載の解凍方法。
  16. 導出タイプ識別子を対応するオリジナルタイプ識別子に置換するステップを有する請求項15に記載の解凍方法。
  17. お互いに入れ子になっているとともに情報要素の構造を参照している要素タイプ識別子(Type)にそれぞれ関連付けられた情報要素(4)を有して、ツリーのような構造を持つ構造化文書(DOC1)を圧縮するための圧縮装置であって、
    各要素は、前記要素のタイプにしたがって、名称(atti名)および値(atti値)によって定義された必須のまたは任意の属性(Att.1,Att.2,...Att.n)と、1つ以上の要素を有する値領域(Val)とによって構成されており、
    前記構造化文書の中のオリジナルタイプから得られるとともに前記オリジナルタイプの属性および値領域の一部のみを有する簡易型要素タイプが定義され、
    オリジナルタイプを持つ前記文書において、簡易型タイプの属性および要素値領域の値のみについて、前記要素が前要素と異なっているとき、前記文書の中のオリジナルタイプを持つ各要素のタイプ識別子を簡易型タイプの識別子に置換し、
    簡易型タイプを持つ各要素から前記簡易型タイプに属しない前記属性および値領域を削除するように構成される圧縮装置。
  18. バイナリ・ストリーム(BDOC)を出力するように構成されている請求項17に記載の圧縮装置。
  19. 前記バイナリ・ストリームは、構造化文書の各要素について、
    前記要素のタイプ識別子を示す2進数と、
    前記属性または値領域が存在しているか否かを示す1ビットを、前記要素の任意的属性および値領域のそれぞれに含んでおり、前記要素の属性および前記要素の値領域それぞれの値を符号化した圧縮2進値と
    を有する請求項18に記載の圧縮装置。
  20. 前記構造化文書を符号化する前に、前記構造化文書においてオリジナルタイプを簡易型タイプに置換するように構成されている請求項18または19に記載の圧縮装置。
  21. 前記簡易型タイプは、前記文書中のオリジナルタイプを持つ要素の中で有無または値が頻繁に変動している属性を有する請求項17または20に記載の圧縮装置。
  22. 別個の簡易型タイプが前記構造化文書の同一のオリジナルタイプに対して定義されており、
    前記簡易型タイプは、異なる属性を持っている請求項17から21のいずれかに記載の圧縮装置。
  23. オリジナルタイプに基づくとともに、オリジナルタイプの任意的属性を含む属性の任意的セットを有する導出タイプが定義され、
    前記圧縮装置は、オリジナルタイプを持っている構造化文書の各要素のオリジナルタイプを前記導出タイプに置換するように構成されている請求項17から22のいずれかに記載の圧縮装置。
  24. バイナリ・ストリームの方式の構造化文書を解凍するための解凍装置であって、
    前記構造化文書(DOC1)は、お互いに入れ子になっているとともに情報要素の構造を参照している要素タイプ識別子(Type)にそれぞれ関連付けられた情報要素(4)を有して、ツリーのような構造を持っており、
    各要素は、要素のタイプにしたがって名称(atti名)および値(atti値)によって定義された前記要素の属性(Att.1,Att.2,...Att.n)と、1つ以上の要素を有する値領域(Val)とによって構成されており、
    少なくとも1つの要素がオリジナルタイプから得られる簡易型タイプを持っているとともに、前記オリジナルタイプの属性および値領域の一部のみを有しており、
    前記属性および値領域の値がオリジナルタイプを持つ文書における前要素によって与えられる簡易型タイプのものでない、ことを特徴とする解凍装置。
  25. 前記バイナリ・ストリームは、前記構造化文書の各要素についての2進符号化値を有し、
    各要素の2進符号化値は、
    前記要素のタイプ識別子を示す2進数と、
    前記要素に属性または値領域が存在しているか否かを示す1ビットを、前記要素の任意的属性および値領域のそれぞれに含んでおり、前記要素の属性および前記要素の値領域それぞれの値を符号化した圧縮2進値と
    を有する請求項24に記載の解凍装置。
  26. 2進数および値を要素タイプ識別子と属性名および属性値と要素値とに変換することによって前記バイナリ・ストリームを復号化するように構成された復号器(DEC)を有する請求項25に記載の解凍装置。
  27. 前記文書中の簡易型タイプ識別子のそれぞれを対応するオリジナルタイプ識別子に置換し、
    簡易型タイプではないオリジナルタイプを持つ前要素の属性および値を、前記簡易型タイプ識別子を持つ各要素の中に挿入するように構成された請求項24から26のいずれかに記載の解凍装置。
  28. バイナリ・ストリームを復号化した後に、簡易型タイプ識別子を対応するオリジナルタイプに置換するように構成されている請求項27に記載の解凍装置。
  29. 前記簡易型タイプは、前記文書中のオリジナルタイプの要素の中で有無または値が頻繁に変動している属性を有する請求項24から28のいずれかに記載の解凍装置。
  30. 別個の簡易型タイプが前記構造化文書の同一のオリジナルタイプに対して定義されており、
    前記簡易型タイプは、異なる属性を持っている請求項24から29のいずれかに記載の解凍装置。
  31. 少なくとも1つの要素がオリジナルタイプの任意的属性を含む属性の任意的セットを有する導出タイプに置換されたオリジナルタイプを持ち、
    文書を符号化した前記バイナリ・ストリームは、前記要素の中に任意的属性セットの1つ以上の属性が有るか否か示す1ビットを、導出タイプを持つ各要素について有する請求項24から30のいずれかに記載の解凍装置。
  32. 導出タイプ識別子を対応するオリジナルタイプ識別子に置換するように構成されている請求項31に記載の解凍装置。
JP2008522102A 2005-07-21 2006-07-20 構造化文書を圧縮および解凍するための方法および装置 Pending JP2009501991A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US70103005P 2005-07-21 2005-07-21
PCT/IB2006/003377 WO2007026258A2 (en) 2005-07-21 2006-07-20 Methods and devices for compressing and decompressing structured documents

Publications (1)

Publication Number Publication Date
JP2009501991A true JP2009501991A (ja) 2009-01-22

Family

ID=37809251

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008522102A Pending JP2009501991A (ja) 2005-07-21 2006-07-20 構造化文書を圧縮および解凍するための方法および装置

Country Status (7)

Country Link
US (1) US20080294980A1 (ja)
EP (1) EP1913697A2 (ja)
JP (1) JP2009501991A (ja)
KR (1) KR20080049019A (ja)
CN (1) CN101223699A (ja)
CA (1) CA2614602A1 (ja)
WO (1) WO2007026258A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009075887A (ja) * 2007-09-20 2009-04-09 Canon Inc 情報処理装置および符号化方法
JP2013089185A (ja) * 2011-10-21 2013-05-13 Toshiba Corp 記述方法、exiデコーダおよびプログラム
JP2013539570A (ja) * 2010-07-21 2013-10-24 サムスン エレクトロニクス カンパニー リミテッド データ送信装置及び方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008007905A1 (en) * 2006-07-12 2008-01-17 Lg Electronics Inc. Method and apparatus for encoding/decoding signal
WO2008048067A1 (en) * 2006-10-19 2008-04-24 Lg Electronics Inc. Encoding method and apparatus and decoding method and apparatus
US20080313201A1 (en) * 2007-06-12 2008-12-18 Christopher Mark Bishop System and method for compact representation of multiple markup data pages of electronic document data
JP4360428B2 (ja) * 2007-07-19 2009-11-11 ソニー株式会社 記録装置、記録方法、コンピュータプログラムおよび記録媒体
FR2924244B1 (fr) * 2007-11-22 2010-04-23 Canon Kk Procede et dispositif d'encodage et de decodage d'information
FR2929778B1 (fr) * 2008-04-07 2012-05-04 Canon Kk Procedes et dispositifs de codage et de decodage binaire iteratif pour documents de type xml.
US20110107201A1 (en) * 2009-10-29 2011-05-05 Microsoft Corporation Representing complex document structure via simpler structure through isomorphism
CN101877005B (zh) * 2010-04-15 2012-01-25 同济大学 一种基于文档模式的gml压缩方法
CN102054038B (zh) * 2010-12-30 2014-05-28 东莞宇龙通信科技有限公司 一种文件解压方法、装置及移动终端
CN105227634A (zh) * 2015-08-31 2016-01-06 徐州工程学院 一种基于居民健康档案的二进制数据压缩及加密方法
EP3343379B1 (en) * 2016-11-07 2023-05-10 KYOCERA Document Solutions Inc. Information processing device and information processing method
US10878859B2 (en) 2017-12-20 2020-12-29 Micron Technology, Inc. Utilizing write stream attributes in storage write commands
US11803325B2 (en) * 2018-03-27 2023-10-31 Micron Technology, Inc. Specifying media type in write commands
CN108763379B (zh) * 2018-05-18 2022-06-03 北京奇艺世纪科技有限公司 一种数据压缩方法、数据解压缩方法、装置及电子设备
CN112035706A (zh) * 2019-06-04 2020-12-04 上海哔哩哔哩科技有限公司 编码、解码方法、计算机设备及可读存储介质
CN112487249B (zh) * 2020-11-27 2024-03-01 郑朗 一种可扩展标记语言xml文档压缩、解压方法及装置
CN113282776B (zh) * 2021-07-12 2021-10-01 北京蔚领时代科技有限公司 用于图形引擎资源文件压缩的数据处理系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004096717A (ja) * 2002-06-17 2004-03-25 Lucent Technol Inc 無線通信システムにおけるプロトコル・メッセージの圧縮
JP2004518231A (ja) * 2001-02-05 2004-06-17 エクスプウェイ 文書の構造化された記述を圧縮するための方法
JP2004535034A (ja) * 2001-07-13 2004-11-18 フランス テレコム 階層化ツリーを圧縮する方法及び圧縮されたマルチメディア信号をデコーディングする方法
JP2005018672A (ja) * 2003-06-30 2005-01-20 Hitachi Ltd 構造化文書の圧縮方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004009617A1 (de) * 2004-02-27 2005-09-29 Siemens Ag Verfahren und Vorrichtung zur Codierung und Decodierung von strukturierten Dokumenten

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004518231A (ja) * 2001-02-05 2004-06-17 エクスプウェイ 文書の構造化された記述を圧縮するための方法
JP2004535034A (ja) * 2001-07-13 2004-11-18 フランス テレコム 階層化ツリーを圧縮する方法及び圧縮されたマルチメディア信号をデコーディングする方法
JP2004096717A (ja) * 2002-06-17 2004-03-25 Lucent Technol Inc 無線通信システムにおけるプロトコル・メッセージの圧縮
JP2005018672A (ja) * 2003-06-30 2005-01-20 Hitachi Ltd 構造化文書の圧縮方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009075887A (ja) * 2007-09-20 2009-04-09 Canon Inc 情報処理装置および符号化方法
JP2013539570A (ja) * 2010-07-21 2013-10-24 サムスン エレクトロニクス カンパニー リミテッド データ送信装置及び方法
US9753940B2 (en) 2010-07-21 2017-09-05 Samsung Electronics Co., Ltd. Apparatus and method for transmitting data
JP2013089185A (ja) * 2011-10-21 2013-05-13 Toshiba Corp 記述方法、exiデコーダおよびプログラム

Also Published As

Publication number Publication date
WO2007026258A3 (en) 2007-10-04
KR20080049019A (ko) 2008-06-03
US20080294980A1 (en) 2008-11-27
CA2614602A1 (en) 2007-03-08
EP1913697A2 (en) 2008-04-23
CN101223699A (zh) 2008-07-16
WO2007026258A2 (en) 2007-03-08

Similar Documents

Publication Publication Date Title
JP2009501991A (ja) 構造化文書を圧縮および解凍するための方法および装置
US7565452B2 (en) System for storing and rendering multimedia data
US7417570B2 (en) Lossless comparative compression and transmission method and system
EP1276324B1 (en) Method for compressing a hierarchical tree, corresponding signal and method for decoding a signal
US20060198438A1 (en) Scene description generating apparatus and method, scene description converting apparatus and method, scene description storing apparatus and method, scene description decoding apparatus and method, user interface system, recording medium, and transmission medium
JP4653381B2 (ja) 構造化文書の圧縮/解凍方法
JP2007226813A (ja) 構造化された文書を圧縮/伸長する方法
KR100695126B1 (ko) 그래픽 데이터 압축에 관한 메타표현을 이용한 입력파일생성 방법 및 시스템과, afx부호화 방법 및 장치
KR20020087482A (ko) 포맷 적응를 이용한 오브젝트 전송 방법
US8340443B2 (en) System and method for compressing compressed data
JP2004102926A (ja) 識別子生成方法、同一性判定方法、識別子送信方法、識別子生成装置、同一性判定装置および識別子送信装置
WO2004051863A1 (en) Automated method for lossless data compression and decompression of a binary string
JP2006517309A (ja) MPEG−4IntermediaFormatからMPEG−4TextualRepresentationを作成する効率的な手段
JP2006514354A (ja) MPEG−4Textual表現からMPEG−4IntermediaFormatを作成する効率的な手段
US10515092B2 (en) Structured record compression and retrieval
US7571152B2 (en) Method for compressing and decompressing structured documents
US9081755B2 (en) Method for processing a data tree structure
Reddy et al. A novel approach of lossless image compression using hashing and Huffman coding
JP2009543243A (ja) 構造化文書の圧縮のための方法と装置
Manimurugan et al. Improved Compression of XML Files for Fast Image Transmission
Rajendra 16 BIT UNICODE TEXT COMPRESSION
JP2005176355A (ja) グラフィックデータ圧縮に関するメタ表現を用いた入力ファイルの生成方法およびシステムと、afx符号化の方法および装置
JP2005276193A (ja) Dibrデータのためのスキーマ及びスタイルシート
Moreira et al. Addressing Image Compression Techniques on current Internet Technologies

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090710

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120316

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120321

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120821