JP4429329B2 - 符号化装置及びその制御方法、復号装置及びその制御方法、プログラム、記憶媒体 - Google Patents
符号化装置及びその制御方法、復号装置及びその制御方法、プログラム、記憶媒体 Download PDFInfo
- Publication number
- JP4429329B2 JP4429329B2 JP2007036808A JP2007036808A JP4429329B2 JP 4429329 B2 JP4429329 B2 JP 4429329B2 JP 2007036808 A JP2007036808 A JP 2007036808A JP 2007036808 A JP2007036808 A JP 2007036808A JP 4429329 B2 JP4429329 B2 JP 4429329B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- encoding
- schema
- structured document
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/149—Adaptation of the text data for streaming purposes, e.g. Efficient XML Interchange [EXI] format
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=41327&scopelist=PROGRAMME
http://www.iso.ch/iso/en/prods-services/popstds/mpeg.html
SVGは、Scalable Vector Graphicsの略称である。XHTMLは、Extensible HyperText Markup Languageの略称である。
構造化文書を符号化して符号化文書を生成する符号化装置であって、
前記構造化文書の文書構造を定義するスキーマ中の所定の要素で規定される一部のスキーマをボキャブラリとして、第1符号と対応付けて符号化テーブルに格納する格納手段と、
前記構造化文書の一部が、前記符号化テーブル中の前記一部のスキーマで定義される文書構造と一致するか否かを検証する検証手段と、
前記構造化文書に対して、前記文書構造と一致すると検証された前記構造化文書の一部に前記第1符号を割り当てるとともに、前記文書構造と一致すると検証された前記構造化文書の一部の変数値に対応する第2符号を割り当てることにより、前記構造化文書を符号化する符号化手段と、
を備え、
前記スキーマ中の前記所定の要素で規定される一部のスキーマは、複数の前記変数値のデータ型を定義する。
図5は本実施形態に係る情報処理装置を備えるシステムの概要を示した構成図である。同図において、本実施形態に係る情報処理装置としてのPC(パーソナルコンピュータ)101は、LAN102に接続されている。LAN102には、デジタルカメラ103、プリンタ104、ファイルサーバ105が接続されている。
図7は、図1に例示した、繰り返し同じ文書構造が出現するXMLデータについて、RELAX NGで記述したスキーマを示す図である。このスキーマは、符号化処理を行う前に、構造化文書の文書構造を基に事前に作成しておく必要がある。本実施形態に係る情報処理装置(PC101)は、このスキーマを基に、繰り返し出現する文書構造を含む構造化文書を符号化する。
次に、繰り返し同じ文書構造が出現する構造化文書において、その文書構造自体をPC101が符号化する手順について、図9を参照して説明する。図9は、文書構造の符号化処理の手順を示すフローチャートである。以下の処理は、本実施形態に係る情報処理装置としてのPC101が備える、CPU201の制御に基づいて実行される。
以上、本発明の実施形態例について詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様を取ることが可能である。具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
Claims (12)
- 構造化文書を符号化して符号化文書を生成する符号化装置であって、
前記構造化文書の文書構造を定義するスキーマ中の所定の要素で規定される一部のスキーマをボキャブラリとして、第1符号と対応付けて符号化テーブルに格納する格納手段と、
前記構造化文書の一部が、前記符号化テーブル中の前記一部のスキーマで定義される文書構造と一致するか否かを検証する検証手段と、
前記構造化文書に対して、前記文書構造と一致すると検証された前記構造化文書の一部に前記第1符号を割り当てるとともに、前記文書構造と一致すると検証された前記構造化文書の一部の変数値に対応する第2符号を割り当てることにより、前記構造化文書を符号化する符号化手段と、
を備え、
前記スキーマ中の前記所定の要素で規定される一部のスキーマは、複数の前記変数値のデータ型を定義する
ことを特徴とする符号化装置。 - 前記検証手段において、前記文書構造と一致する検証された前記構造化文書の一部に含まれる変数値を、前記第2符号と対応付けて前記符号化テーブルに追加する追加手段を更に備えることを特徴とする請求項1に記載の符号化装置。
- 前記格納手段は、前記構造化文書の文書構造を定義するスキーマ中の前記所定の要素で規定される一部のスキーマが、前記構造化文書で繰り返し出現するか否かを判断し、繰り返し出現すると判断された当該一部のスキーマをボキャブラリとして、前記第1符号と対応付けて符号化テーブルに格納することを特徴とする請求項1又は2に記載の符号化装置。
- 前記検証手段は、
前記一部のスキーマに基づいてDOMツリーを生成し、
前記DOMツリーの各ノードが、前記構造化文書に含まれる一部の文書構造と一致するか否かを順に検証する
ことを特徴とする請求項1乃至3のいずれか1項に記載の符号化装置。 - 前記符号化手段は、
前記構造化文書に対して、前記文書構造と一致すると検証された前記構造化文書の一部に前記第1符号を割り当て、前記文書構造と一致すると検証された前記構造化文書の一部に含まれる変数値に対応する前記第2符号を割り当て、前記文書構造と一致すると検証された前記構造化文書の一部の開始を示す第3符号を割り当て、前記文書構造と一致すると検証された前記構造化文書の一部の終了を示す第4符号を割り当てる
ことを特徴とする請求項1乃至4のいずれか1項に記載の符号化装置。 - 前記スキーマが定義する文書構造は階層構造で表現されることを特徴とする請求項1乃至5のいずれか1項に記載の符号化装置。
- 前記スキーマは、DTD、XML Schema、又は、RELAX NGに基づいて記述される
ことを特徴とする請求項1乃至6のいずれか1項に記載の符号化装置。 - 請求項1に記載の符号化装置により符号化された符号化文書を、前記符号化テーブルに基づき復号して構造化文書を生成することを特徴とする復号装置。
- 構造化文書を符号化して符号化文書を生成する符号化装置の制御方法であって、
格納手段が、前記構造化文書の文書構造を定義するスキーマ中の所定の要素で規定される一部のスキーマをボキャブラリとして、第1符号と対応付けて符号化テーブルに格納する格納工程と、
検証手段が、前記構造化文書の一部が、前記符号化テーブル中の前記一部のスキーマで定義される文書構造と一致するか否かを検証する検証工程と、
符号化手段が、前記構造化文書に対して、前記文書構造と一致すると検証された前記構造化文書の一部に前記第1符号を割り当てるとともに、前記文書構造と一致すると検証された前記構造化文書の一部の変数値に対応する第2符号を割り当てることにより、前記構造化文書を符号化する符号化工程と、
を備え、
前記スキーマ中の前記所定の要素で規定される一部のスキーマは、複数の前記変数値のデータ型を定義する
ことを特徴とする符号化装置の制御方法。 - 請求項9に記載の符号化装置の制御方法により符号化された符号化文書を、前記符号化テーブルに基づき復号して構造化文書を生成することを特徴とする復号装置の制御方法。
- コンピュータを、請求項1乃至7のいずれか1項に記載の符号化装置、又は、請求項8に記載の復号装置として機能させるためのプログラム。
- 請求項11に記載のプログラムを格納したコンピュータで読み取り可能な記憶媒体。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007036808A JP4429329B2 (ja) | 2007-02-16 | 2007-02-16 | 符号化装置及びその制御方法、復号装置及びその制御方法、プログラム、記憶媒体 |
US12/524,665 US8250465B2 (en) | 2007-02-16 | 2008-02-05 | Encoding/decoding apparatus, method and computer program |
EP08704534A EP2122492A1 (en) | 2007-02-16 | 2008-02-05 | Encoding/decoding apparatus, method and computer program |
CN2008800053410A CN101617307B (zh) | 2007-02-16 | 2008-02-05 | 编解码设备和方法 |
PCT/JP2008/052214 WO2008099793A1 (en) | 2007-02-16 | 2008-02-05 | Encoding/decoding apparatus, method and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007036808A JP4429329B2 (ja) | 2007-02-16 | 2007-02-16 | 符号化装置及びその制御方法、復号装置及びその制御方法、プログラム、記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008204000A JP2008204000A (ja) | 2008-09-04 |
JP4429329B2 true JP4429329B2 (ja) | 2010-03-10 |
Family
ID=39690025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007036808A Expired - Fee Related JP4429329B2 (ja) | 2007-02-16 | 2007-02-16 | 符号化装置及びその制御方法、復号装置及びその制御方法、プログラム、記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8250465B2 (ja) |
EP (1) | EP2122492A1 (ja) |
JP (1) | JP4429329B2 (ja) |
CN (1) | CN101617307B (ja) |
WO (1) | WO2008099793A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2936623B1 (fr) * | 2008-09-30 | 2011-03-04 | Canon Kk | Procede de codage d'un document structure et de decodage, dispositifs correspondants |
US9128912B2 (en) * | 2012-07-20 | 2015-09-08 | Fujitsu Limited | Efficient XML interchange schema document encoding |
JP2014086048A (ja) * | 2012-10-26 | 2014-05-12 | Toshiba Corp | 検証装置、検査方法およびプログラム |
US10311137B2 (en) * | 2015-03-05 | 2019-06-04 | Fujitsu Limited | Grammar generation for augmented datatypes for efficient extensible markup language interchange |
US10282400B2 (en) * | 2015-03-05 | 2019-05-07 | Fujitsu Limited | Grammar generation for simple datatypes |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3368883B2 (ja) * | 2000-02-04 | 2003-01-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ圧縮装置、データベースシステム、データ通信システム、データ圧縮方法、記憶媒体及びプログラム伝送装置 |
FR2820563B1 (fr) * | 2001-02-02 | 2003-05-16 | Expway | Procede de compression/decompression d'un document structure |
US7493603B2 (en) * | 2002-10-15 | 2009-02-17 | International Business Machines Corporation | Annotated automaton encoding of XML schema for high performance schema validation |
JP2005018672A (ja) * | 2003-06-30 | 2005-01-20 | Hitachi Ltd | 構造化文書の圧縮方法 |
JP4168946B2 (ja) | 2004-01-29 | 2008-10-22 | Kddi株式会社 | 文書データの符号化又は復号化方法及びそのプログラム |
US7437374B2 (en) * | 2004-02-10 | 2008-10-14 | International Business Machines Corporation | Efficient XML schema validation of XML fragments using annotated automaton encoding |
US7292160B1 (en) * | 2006-04-19 | 2007-11-06 | Microsoft Corporation | Context sensitive encoding and decoding |
US7933933B2 (en) * | 2007-07-30 | 2011-04-26 | Oracle International Corporation | Fast path loading of XML data |
US8145608B2 (en) * | 2008-04-28 | 2012-03-27 | Infosys Technologies Limited | Method and system for rapidly processing and transporting large XML files |
US8149148B1 (en) * | 2010-10-08 | 2012-04-03 | Microsoft Corporation | Local binary XML string compression |
-
2007
- 2007-02-16 JP JP2007036808A patent/JP4429329B2/ja not_active Expired - Fee Related
-
2008
- 2008-02-05 EP EP08704534A patent/EP2122492A1/en not_active Withdrawn
- 2008-02-05 US US12/524,665 patent/US8250465B2/en not_active Expired - Fee Related
- 2008-02-05 WO PCT/JP2008/052214 patent/WO2008099793A1/en active Application Filing
- 2008-02-05 CN CN2008800053410A patent/CN101617307B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101617307A (zh) | 2009-12-30 |
US8250465B2 (en) | 2012-08-21 |
CN101617307B (zh) | 2011-05-25 |
US20100107052A1 (en) | 2010-04-29 |
WO2008099793A1 (en) | 2008-08-21 |
EP2122492A1 (en) | 2009-11-25 |
JP2008204000A (ja) | 2008-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8954457B2 (en) | Method for processing a structured document to render, and corresponding processor | |
CA2831588C (en) | Cross-compiling swf to html using an intermediate format | |
JP5325920B2 (ja) | エンコーダコンパイラ、プログラムおよび通信機器 | |
JP2008508643A (ja) | マークアップ言語で記述された文書内にタグまたは属性を作成するための文書処理及び文書管理の手段と方法 | |
US7827481B1 (en) | Defining style values as objects | |
JP4429329B2 (ja) | 符号化装置及びその制御方法、復号装置及びその制御方法、プログラム、記憶媒体 | |
DK2972827T3 (en) | COLLABORATIVE EDITING | |
US8849726B2 (en) | Information processing apparatus and control method for the same | |
US7996364B2 (en) | Information processing apparatus and control method thereof, and document verification apparatus and control method thereof | |
JPWO2006051960A1 (ja) | 文書処理装置及び文書処理方法 | |
JPWO2006051954A1 (ja) | 文書処理装置及び文書処理方法 | |
JPWO2006051959A1 (ja) | 文書処理装置及び文書処理方法 | |
JPWO2006051955A1 (ja) | サーバ装置及び名前空間発行方法 | |
JP2010267092A (ja) | 情報処理装置、情報処理方法 | |
US20070143666A1 (en) | Architecture for arbitrary extensible markup language processing engine | |
JPWO2006051956A1 (ja) | サーバ装置及び検索方法 | |
Holman | What is XSLT | |
JP5201808B2 (ja) | 電子文書処理装置及び電子文書処理方法 | |
JP2018514843A (ja) | スタイルのための宣言型カスケード再順序付け | |
JP5206675B2 (ja) | 構造化文書変換装置 | |
US20090222447A1 (en) | Data processing apparatus and data processing method | |
JP2007532987A (ja) | マークアップ言語を用いたデータ及び文書の処理 | |
JPWO2006051957A1 (ja) | 文書処理装置及び文書処理方法 | |
JP4018528B2 (ja) | 文書処理装置、文書処理方法およびプログラム | |
JP2008536423A (ja) | ツリーデータ構造を処理する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090519 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20090519 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20090807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090814 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091013 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091215 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121225 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4429329 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131225 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |