JP2008204000A - 符号化装置及びその制御方法、復号装置及びその制御方法、プログラム、記憶媒体 - Google Patents
符号化装置及びその制御方法、復号装置及びその制御方法、プログラム、記憶媒体 Download PDFInfo
- Publication number
- JP2008204000A JP2008204000A JP2007036808A JP2007036808A JP2008204000A JP 2008204000 A JP2008204000 A JP 2008204000A JP 2007036808 A JP2007036808 A JP 2007036808A JP 2007036808 A JP2007036808 A JP 2007036808A JP 2008204000 A JP2008204000 A JP 2008204000A
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- code
- document
- structured document
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/149—Adaptation of the text data for streaming purposes, e.g. Efficient XML Interchange [EXI] format
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 構造化文書を符号化して符号化文書を生成する符号化装置であって、構造化文書の文書構造と、当該文書構造を符号化するための第1符号とを含む対応情報を記憶手段から読み出す読出手段と、前記対応情報に含まれる文書構造に基づいて、処理対象の構造化文書に含まれる部分の文法が妥当であるか否かを検証する妥当性検証手段と、前記妥当性検証手段において文法が妥当であると検証された部分について、前記第1符号を用いて前記構造化文書を符号化する符号化手段と、を備える。
【選択図】 図9
Description
http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=41327&scopelist=PROGRAMME
http://www.iso.ch/iso/en/prods-services/popstds/mpeg.html
SVGは、Scalable Vector Graphicsの略称である。XHTMLは、Extensible HyperText Markup Languageの略称である。
構造化文書を符号化して符号化文書を生成する符号化装置であって、
構造化文書の文書構造と、当該文書構造を符号化するための第1符号とを含む対応情報を記憶手段から読み出す読出手段と、
前記対応情報に含まれる文書構造に基づいて、処理対象の構造化文書に含まれる部分の文法が妥当であるか否かを検証する妥当性検証手段と、
前記妥当性検証手段において文法が妥当であると検証された部分について、前記第1符号を用いて前記構造化文書を符号化する符号化手段と、
を備える。
図5は本実施形態に係る情報処理装置を備えるシステムの概要を示した構成図である。同図において、本実施形態に係る情報処理装置としてのPC(パーソナルコンピュータ)101は、LAN102に接続されている。LAN102には、デジタルカメラ103、プリンタ104、ファイルサーバ105が接続されている。
図7は、図1に例示した、繰り返し同じ文書構造が出現するXMLデータについて、RELAX NGで記述したスキーマを示す図である。このスキーマは、符号化処理を行う前に、構造化文書の文書構造を基に事前に作成しておく必要がある。本実施形態に係る情報処理装置(PC101)は、このスキーマを基に、繰り返し出現する文書構造を含む構造化文書を符号化する。
次に、繰り返し同じ文書構造が出現する構造化文書において、その文書構造自体をPC101が符号化する手順について、図9を参照して説明する。図9は、文書構造の符号化処理の手順を示すフローチャートである。以下の処理は、本実施形態に係る情報処理装置としてのPC101が備える、CPU201の制御に基づいて実行される。
以上、本発明の実施形態例について詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様を取ることが可能である。具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
Claims (10)
- 構造化文書を符号化して符号化文書を生成する符号化装置であって、
構造化文書の文書構造と、当該文書構造を符号化するための第1符号とを含む対応情報を記憶手段から読み出す読出手段と、
前記対応情報に含まれる文書構造に基づいて、処理対象の構造化文書に含まれる部分の文法が妥当であるか否かを検証する妥当性検証手段と、
前記妥当性検証手段において文法が妥当であると検証された部分について、前記第1符号を用いて前記構造化文書を符号化する符号化手段と、
を備えることを特徴とする符号化装置。 - 前記読出手段は、更に、変数値を符号化するための第2符号と、前記妥当性検証手段において文法が妥当であると検証された部分の範囲を符号化するための第3符号と、を前記記憶手段から読み出し、
前記符号化手段は、前記妥当性検証手段において妥当であると検証された前記部分について、前記第1符号と、前記第2符号と、前記第3符号と、を用いて前記構造化文書を符号化する
ことを特徴とする請求項1に記載の符号化装置。 - 構造化文書の文書構造を示すスキーマ情報を解析し、当該文書構造に前記第1符号として符号を割り当て、当該文書構造と当該符号とを追加して前記対応情報を更新する更新手段を更に備える
ことを特徴とする請求項1又は2に記載の符号化装置。 - 前記スキーマ情報は、DTD、XML Schema、又は、RELAX NGに基づいて記述される
ことを特徴とする請求項3に記載の符号化装置。 - 請求項2に記載の符号化装置により符号化された符号化文書を復号して構造化文書を生成する復号装置であって、
前記対応情報を第2記憶手段から読み出す第2読出手段と、
前記対応情報により示される前記文書構造に基づいてDOMツリーを生成し、メモリ装置に記憶する記憶制御手段と、
処理対象の符号化文書を解析して復号処理を行う復号手段であって、前記第1符号を解析したことに応じて、前記第3符号により示される範囲について、前記第2符号により示される変数値を前記DOMツリーの対応するノードに割り当てる、復号手段と、
を備えることを特徴とする復号装置。 - 構造化文書を符号化して符号化文書を生成する符号化装置の制御方法であって、
読出手段が、構造化文書の文書構造と、当該文書構造を符号化するための第1符号とを含む対応情報を記憶手段から読み出す読出工程と、
妥当性検証手段が、前記対応情報に含まれる文書構造に基づいて、処理対象の構造化文書に含まれる部分の文法が妥当であるか否かを検証する妥当性検証工程と、
前記妥当性検証工程において文法が妥当であると検証された部分について、符号化手段が、前記第1符号を用いて前記構造化文書を符号化する符号化工程と、
を備えることを特徴とする符号化装置の制御方法。 - 前記読出工程においては、更に、変数値を符号化するための第2符号と、前記妥当性検証工程において文法が妥当であると検証された部分の範囲を符号化するための第3符号と、が前記記憶手段から読み出され、
前記符号化工程においては、前記妥当性検証工程において妥当であると検証された前記部分について、前記第1符号と、前記第2符号と、前記第3符号と、を用いて前記構造化文書が符号化される
ことを特徴とする請求項6に記載の符号化装置の制御方法。 - 請求項7に記載の符号化装置の制御方法により符号化された符号化文書を復号して構造化文書を生成する復号装置の制御方法であって、
第2読出手段が、前記対応情報を第2記憶手段から読み出す第2読出工程と、
記憶制御手段が、前記対応情報により示される前記文書構造に基づいてDOMツリーを生成し、メモリ装置に記憶する記憶制御工程と、
復号手段が処理対象の符号化文書を解析して復号処理を行う復号工程であって、前記第1符号を解析したことに応じて、前記第3符号により示される範囲について、前記第2符号により示される変数値を前記DOMツリーの対応するノードに割り当てる、復号工程と、
を備えることを特徴とする復号装置の制御方法。 - コンピュータを、請求項1乃至4のいずれか1項に記載の符号化装置、又は、請求項5に記載の復号装置として機能させるためのプログラム。
- 請求項9に記載のプログラムを格納したコンピュータで読み取り可能な記憶媒体。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007036808A JP4429329B2 (ja) | 2007-02-16 | 2007-02-16 | 符号化装置及びその制御方法、復号装置及びその制御方法、プログラム、記憶媒体 |
US12/524,665 US8250465B2 (en) | 2007-02-16 | 2008-02-05 | Encoding/decoding apparatus, method and computer program |
CN2008800053410A CN101617307B (zh) | 2007-02-16 | 2008-02-05 | 编解码设备和方法 |
PCT/JP2008/052214 WO2008099793A1 (en) | 2007-02-16 | 2008-02-05 | Encoding/decoding apparatus, method and computer program |
EP08704534A EP2122492A1 (en) | 2007-02-16 | 2008-02-05 | Encoding/decoding apparatus, method and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007036808A JP4429329B2 (ja) | 2007-02-16 | 2007-02-16 | 符号化装置及びその制御方法、復号装置及びその制御方法、プログラム、記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008204000A true JP2008204000A (ja) | 2008-09-04 |
JP4429329B2 JP4429329B2 (ja) | 2010-03-10 |
Family
ID=39690025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007036808A Expired - Fee Related JP4429329B2 (ja) | 2007-02-16 | 2007-02-16 | 符号化装置及びその制御方法、復号装置及びその制御方法、プログラム、記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8250465B2 (ja) |
EP (1) | EP2122492A1 (ja) |
JP (1) | JP4429329B2 (ja) |
CN (1) | CN101617307B (ja) |
WO (1) | WO2008099793A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014086048A (ja) * | 2012-10-26 | 2014-05-12 | Toshiba Corp | 検証装置、検査方法およびプログラム |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2936623B1 (fr) * | 2008-09-30 | 2011-03-04 | Canon Kk | Procede de codage d'un document structure et de decodage, dispositifs correspondants |
US9128912B2 (en) * | 2012-07-20 | 2015-09-08 | Fujitsu Limited | Efficient XML interchange schema document encoding |
US10311137B2 (en) * | 2015-03-05 | 2019-06-04 | Fujitsu Limited | Grammar generation for augmented datatypes for efficient extensible markup language interchange |
US10282400B2 (en) * | 2015-03-05 | 2019-05-07 | Fujitsu Limited | Grammar generation for simple datatypes |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001217720A (ja) * | 2000-02-04 | 2001-08-10 | Internatl Business Mach Corp <Ibm> | データ圧縮装置、データベースシステム、データ通信システム、データ圧縮方法、記憶媒体及びプログラム伝送装置 |
JP2004530188A (ja) * | 2001-02-02 | 2004-09-30 | エクスプウェイ | 構造化された文書を圧縮/伸長する方法 |
JP2005018672A (ja) * | 2003-06-30 | 2005-01-20 | Hitachi Ltd | 構造化文書の圧縮方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7493603B2 (en) * | 2002-10-15 | 2009-02-17 | International Business Machines Corporation | Annotated automaton encoding of XML schema for high performance schema validation |
JP4168946B2 (ja) | 2004-01-29 | 2008-10-22 | Kddi株式会社 | 文書データの符号化又は復号化方法及びそのプログラム |
US7437374B2 (en) * | 2004-02-10 | 2008-10-14 | International Business Machines Corporation | Efficient XML schema validation of XML fragments using annotated automaton encoding |
US7292160B1 (en) * | 2006-04-19 | 2007-11-06 | Microsoft Corporation | Context sensitive encoding and decoding |
US7933933B2 (en) * | 2007-07-30 | 2011-04-26 | Oracle International Corporation | Fast path loading of XML data |
US8145608B2 (en) * | 2008-04-28 | 2012-03-27 | Infosys Technologies Limited | Method and system for rapidly processing and transporting large XML files |
US8149148B1 (en) * | 2010-10-08 | 2012-04-03 | Microsoft Corporation | Local binary XML string compression |
-
2007
- 2007-02-16 JP JP2007036808A patent/JP4429329B2/ja not_active Expired - Fee Related
-
2008
- 2008-02-05 US US12/524,665 patent/US8250465B2/en not_active Expired - Fee Related
- 2008-02-05 WO PCT/JP2008/052214 patent/WO2008099793A1/en active Application Filing
- 2008-02-05 EP EP08704534A patent/EP2122492A1/en not_active Withdrawn
- 2008-02-05 CN CN2008800053410A patent/CN101617307B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001217720A (ja) * | 2000-02-04 | 2001-08-10 | Internatl Business Mach Corp <Ibm> | データ圧縮装置、データベースシステム、データ通信システム、データ圧縮方法、記憶媒体及びプログラム伝送装置 |
JP2004530188A (ja) * | 2001-02-02 | 2004-09-30 | エクスプウェイ | 構造化された文書を圧縮/伸長する方法 |
JP2005018672A (ja) * | 2003-06-30 | 2005-01-20 | Hitachi Ltd | 構造化文書の圧縮方法 |
Non-Patent Citations (1)
Title |
---|
小林亜令: "XML文書符号化方式"XEUS"の高圧縮化に関する一考察", 情報処理学会研究報告, vol. 2005-DPS-124,2005-GN-57, JPN6009064913, 21 September 2005 (2005-09-21), JP, pages 25 - 30, ISSN: 0001489087 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014086048A (ja) * | 2012-10-26 | 2014-05-12 | Toshiba Corp | 検証装置、検査方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2008099793A1 (en) | 2008-08-21 |
CN101617307A (zh) | 2009-12-30 |
US20100107052A1 (en) | 2010-04-29 |
EP2122492A1 (en) | 2009-11-25 |
JP4429329B2 (ja) | 2010-03-10 |
US8250465B2 (en) | 2012-08-21 |
CN101617307B (zh) | 2011-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8954457B2 (en) | Method for processing a structured document to render, and corresponding processor | |
KR101569765B1 (ko) | 중간 포맷을 이용한 swf와 html의 크로스-컴파일링 | |
US7191395B2 (en) | Method and system for stylesheet-centric editing | |
JP5325920B2 (ja) | エンコーダコンパイラ、プログラムおよび通信機器 | |
JP2008508643A (ja) | マークアップ言語で記述された文書内にタグまたは属性を作成するための文書処理及び文書管理の手段と方法 | |
DK2972827T3 (en) | COLLABORATIVE EDITING | |
JP4429329B2 (ja) | 符号化装置及びその制御方法、復号装置及びその制御方法、プログラム、記憶媒体 | |
US7996364B2 (en) | Information processing apparatus and control method thereof, and document verification apparatus and control method thereof | |
JPWO2006051960A1 (ja) | 文書処理装置及び文書処理方法 | |
JPWO2006051959A1 (ja) | 文書処理装置及び文書処理方法 | |
JP2010267092A (ja) | 情報処理装置、情報処理方法 | |
US8984397B2 (en) | Architecture for arbitrary extensible markup language processing engine | |
JP2007293621A (ja) | 文書生成装置及び文書生成方法 | |
Bellamy-Royds et al. | Using SVG with CSS3 and HTML5: vector graphics for web design | |
Holman | What is XSLT | |
JP5201808B2 (ja) | 電子文書処理装置及び電子文書処理方法 | |
US20090222447A1 (en) | Data processing apparatus and data processing method | |
JP5206675B2 (ja) | 構造化文書変換装置 | |
JP4018528B2 (ja) | 文書処理装置、文書処理方法およびプログラム | |
Quint et al. | Structured templates for authoring semantically rich documents | |
JP2004145736A (ja) | 文字認識装置および文字認識データ出力方法およびプログラムおよび記録媒体 | |
JP5356851B2 (ja) | マクロプログラムの構造化システム、マクロプログラムの構造化方法およびプログラム | |
US20050132270A1 (en) | Method, system, and computer program product for automatic code generation in an object oriented environment | |
JP4310401B2 (ja) | 知識コードの生成方法およびその装置 | |
JP2006103280A (ja) | 印刷装置、印刷装置の制御方法、制御プログラム及び記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090519 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20090519 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20090807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090814 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091013 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091215 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121225 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4429329 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131225 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |