JP4898615B2 - 情報処理装置および符号化方法 - Google Patents
情報処理装置および符号化方法 Download PDFInfo
- Publication number
- JP4898615B2 JP4898615B2 JP2007244443A JP2007244443A JP4898615B2 JP 4898615 B2 JP4898615 B2 JP 4898615B2 JP 2007244443 A JP2007244443 A JP 2007244443A JP 2007244443 A JP2007244443 A JP 2007244443A JP 4898615 B2 JP4898615 B2 JP 4898615B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- data
- hierarchy
- encoding
- data string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/221—Parsing markup language streams
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Description
Fast Infoset(ISO/IEC 24824−1)仕様書、ISO、2007年
つまり、テキストエンコーディングする場合、属性値や要素内容として記述するデータが、整数や小数など文字以外のデータであっても、文字としてエンコーディングしなければならなかった。数値を文字でエンコーディングした場合、バイナリ表現でエンコーディングするよりもデータサイズが大きくなり、処理にも時間を要する。そのため、上述のSVGのように、こうした独自の構造が文書データの大部分を占める場合には、サイズ縮小やパースの高速化などを実現することが困難であった。
本発明に係る情報処理装置の第1実施形態として、SVG形式のデータを処理するデータ符号化装置を例に以下に説明する。
図1は、第1実施形態のデータ符号化装置を構成するコンピュータ装置のブロック図である。なお、データ符号化装置はそれぞれ単一のコンピュータ装置で実現してもよいし、必要に応じた複数のコンピュータ装置に各機能を分散して実現するようにしてもよい。複数のコンピュータ装置で構成される場合は、互いに通信可能なようにLANなどを介して接続される。
・全体動作
図2は、SVG(Scalable Vector Graphics)形式のデータの一例を示す図である。SVG形式のデータにおいては、属性値に”M”や”c”といった描画コマンドや、”434.228”や”228.562”といった座標情報の組み合わせが記述される。
図4は、階層情報の指定を例示的に示す図である。階層情報は、各区切り文字に対する階層および識別子名から構成される。区切り文字は、データの境目となる文字で、ユーザが任意に指定可能である。ここでは、”M”、”c”、”,”を区切り文字とする。
図5は、図3のルール2の階層情報を構造情報に変換する詳細動作フローチャートである。
図9は、符号化処理の詳細動作フローチャートである。
最上位階層の場合は”00”、
中間階層の管理構造体は”01”、
リーフの管理構造体は”10”
にそれぞれ符号化される。続けて、
最上位階層の管理構造体は識別子名(name)、
中間階層の管理構造体は繰り返し数(iterate_num)、
リーフの管理構造体はiterate_numとデータ型(value_type)
が符号化される。
最上位階層に対して”00”、
name=”c”に対して”0011”、
リーフの階層に対して”10”、
iterate_num=6に対して”0110”、
value_type=”float”に対して”0000”
に符号化される。
第2実施形態では、属性値が2次元配列を示す場合の符号化について説明する。装置構成については第1実施形態と同様であるので説明は省略する。
SVGには、図13に示すようなアニメーション処理の記述がある。type属性は、アニメーション処理のタイプを示しており、translateの場合は移動処理であることを示す。このとき、移動する距離はvalues属性に記述されており、X方向の値とY方向の値を”,”区切りで、X,Yのペアを“;”区切りで示す。
・全体動作
第2実施形態に係る情報処理装置の動作を、第1実施形態と同様に図3に沿って説明する。ただし、図13のSVGデータを符号化する方法について説明する。
符号化は、第1実施形態と同様に、図9のフローチャートに沿って実行する。
最上位階層に対して”00”、
name=””に対して”1111”、
中間階層に対して“01”、
iterate_num=不定に対して14ビットのプレースホルダー、
リーフの階層に対して“10”、
iterate_num=2に対して”0010”、
value_type=”float”に対して”0000”
に符号化される。
第3実施形態では、属性値が列x行の2次元配列を示す場合の符号化について説明する。装置構成については第1実施形態と同様であるので説明は省略する。
SVGには、図17に示すような描画データの変換処理の記述がある。transform属性は、変換処理の内容を示しており、matrixは変換行列であることを示す。このとき、行列の各要素が”,”区切りで並べられている。
・全体動作
この場合、第2実施形態と同様に、列x行の2次元配列構造としておくことで効率的な処理が行える。第3実施形態に係る情報処理装置の動作を、第1実施形態と同様に図3に沿って説明する。ただし、図17のSVGデータを符号化する方法について説明する。
符号化は、第1実施形態と同様に、図9のフローチャートに沿って実行する。
最上位階層に対して”00”、
name=”matrix”に対して(第1実施形態と同様に変換テーブルを用意して)”0001”、
中間階層に対して“01”、
iterate_num=3に対して”0011”、
リーフの階層に対して“10”、
iterate_num=2に対して”0010”、
value_type=”float”に対して”0000”
に符号化される。なお、末尾には最後にバイト単位(8ビット単位)で終了するようにpadding”00”が付けられる。
第4実施形態では、構造化文書の子要素の符号化について説明する。装置構成については第1実施形態と同様であるので説明は省略する。
XMLによるメッセージング技術であるSOAPには、示すようなメソッド呼び出しをメッセージデータに変換した記述がある。
・全体動作
この場合も、第1実施形態と同様、配列構造として符号化することで、データサイズの縮小、受信処理の高速化が行える。ここでは、図21のような構造化文書の子要素に対する場合の実施形態について説明する。
符号化は、第1実施形態と同様に、図9のフローチャートに沿って実行する。
最上位階層に対して”00”、
name=”myMethod”に対して(第1実施形態と同様に変換テーブルを用意して)”0001”、
リーフの階層に対して“10”、
iterate_num=1に対して”0001”、
value_type=”int”に対して”0010”、
リーフの階層に対して“10”、
iterate_num=1に対して”0001”、
value_type=”float”に対して”0000”
に符号化される。なお、末尾には最後にバイト単位で終了するようにpadding”000000”が付けられる。
以上、本発明の実施形態について詳述したが、本発明は、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
101 CPU
102 ROM
103 RAM
104 外部記憶装置
105 入力インタフェース
106 モニタインタフェース
107 ネットワークインタフェース
108 システムバス
Claims (8)
- 所定の形式のデータ列を属性値として有する要素を含むファイルを入力するファイル入力手段と、
前記所定の形式のデータ列に含まれる1以上の区切り文字の各々に対して、該区切り文字に関連するデータの前記データ列における階層位置を示す階層情報を設定する階層情報設定手段と、
前記階層情報設定手段で設定された1以上の階層情報の相互の関係を定義する構造情報を生成する構造情報生成手段と、
前記ファイル入力手段により入力されたファイルから、前記所定の形式のデータ列の領域を指定する指定手段と、
前記指定手段により指定された領域から前記区切り文字を検出し、検出された区切り文字と前記構造情報とに基づいて、前記領域のデータ列を予め設定された構造化記述言語に基づき符号化する符号化手段と、
を備えることを特徴とする情報処理装置。 - 前記階層情報設定手段は、さらに、前記区切り文字に関連するデータのデータ型を設定するデータ型設定手段を備え、
前記符号化手段は、前記データ型設定手段により設定されたデータ型に基づいて前記領域のデータ列に含まれるデータを符号化することを特徴とする請求項1に記載の情報処理装置。 - 前記構造情報生成手段は、前記構造情報をN(Nは自然数)次元配列構造として生成することを特徴とする請求項1記載の情報処理装置。
- 前記構造情報は、予め設定された構造化記述言語に基づいて記述されており、
前記符号化手段は、前記構造情報を記述した構造化記述言語で、前記領域のデータ列に含まれるデータを符号化することを特徴とする請求項1に記載の情報処理装置。 - 前記構造情報生成手段は、さらに、前記構造情報を生成する際に同一構造が繰り返し現われる場合、該同一構造を1つの情報に集約する情報集約手段を備えることを特徴とする請求項1に記載の情報処理装置。
- 前記予め設定された構造化記述言語は、バイナリXMLであることを特徴とする請求項1に記載の情報処理装置。
- 所定の形式のデータ列を属性値として有する要素を含むファイルを入力するファイル入力工程と、
前記所定の形式のデータ列に含まれる1以上の区切り文字の各々に対して、該区切り文字に関連するデータの前記データ列における階層位置を示す階層情報を設定する階層情報設定工程と、
前記階層情報設定工程で設定された1以上の階層情報の相互の関係を定義する構造情報を生成する構造情報生成工程と、
前記ファイル入力工程により入力されたファイルから、前記所定の形式のデータ列の領域を指定する指定工程と、
前記指定工程により指定された領域から前記区切り文字を検出し、検出された区切り文字と前記構造情報とに基づいて、前記領域のデータ列を予め設定された構造化記述言語に基づき符号化する符号化工程と、
を備えることを特徴とする符号化方法。 - コンピュータに請求項7に記載の符号化方法を実行させる為のコンピュータプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007244443A JP4898615B2 (ja) | 2007-09-20 | 2007-09-20 | 情報処理装置および符号化方法 |
EP08163562A EP2040383A3 (en) | 2007-09-20 | 2008-09-03 | Information processing apparatus and encoding method |
US12/205,299 US8117217B2 (en) | 2007-09-20 | 2008-09-05 | Information processing apparatus and encoding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007244443A JP4898615B2 (ja) | 2007-09-20 | 2007-09-20 | 情報処理装置および符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009075887A JP2009075887A (ja) | 2009-04-09 |
JP4898615B2 true JP4898615B2 (ja) | 2012-03-21 |
Family
ID=40336658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007244443A Expired - Fee Related JP4898615B2 (ja) | 2007-09-20 | 2007-09-20 | 情報処理装置および符号化方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8117217B2 (ja) |
EP (1) | EP2040383A3 (ja) |
JP (1) | JP4898615B2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2929778B1 (fr) * | 2008-04-07 | 2012-05-04 | Canon Kk | Procedes et dispositifs de codage et de decodage binaire iteratif pour documents de type xml. |
US8566515B2 (en) * | 2009-01-12 | 2013-10-22 | Maxim Integrated Products, Inc. | Memory subsystem |
KR101643608B1 (ko) * | 2009-02-13 | 2016-07-29 | 삼성전자주식회사 | 리모트 ui 서비스 제공 방법 및 장치 |
JP5478936B2 (ja) * | 2009-05-13 | 2014-04-23 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
JP5671320B2 (ja) * | 2009-12-18 | 2015-02-18 | キヤノン株式会社 | 情報処理装置及びその制御方法並びにプログラム |
JP5166565B2 (ja) * | 2011-03-28 | 2013-03-21 | 株式会社東芝 | Exiエンコーダおよびプログラム |
US9087064B2 (en) * | 2011-10-27 | 2015-07-21 | International Business Machines Corporation | User-defined hierarchies in file system data sets |
TWI483131B (zh) * | 2013-04-30 | 2015-05-01 | Acer Inc | 編碼格式偵測方法、裝置及電腦程式產品 |
JP2015115652A (ja) | 2013-12-09 | 2015-06-22 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
CN103678713A (zh) * | 2013-12-31 | 2014-03-26 | 上海爱数软件有限公司 | VMware场景中恢复NTFS高级压缩文件的方法 |
US9870382B2 (en) | 2014-03-25 | 2018-01-16 | Sap Se | Data encoding and corresponding data structure |
CN105427353B (zh) * | 2015-11-12 | 2019-05-21 | 小米科技有限责任公司 | 可缩放矢量图形的压缩、绘制方法及装置 |
CN114554309B (zh) * | 2021-12-30 | 2024-07-12 | 北京北控工业环境科技有限公司 | 一种用于污水处理的边缘侧信号采集、传输的编码方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6374253B1 (en) * | 1998-12-30 | 2002-04-16 | Microsoft Corporation | System and method for generating hierarchical forward knowledge |
JP4774145B2 (ja) * | 2000-11-24 | 2011-09-14 | 富士通株式会社 | 構造化文書圧縮装置および構造化文書復元装置並びに構造化文書処理システム |
JP4136316B2 (ja) * | 2001-01-24 | 2008-08-20 | 富士通株式会社 | 文字列認識装置 |
US7134075B2 (en) * | 2001-04-26 | 2006-11-07 | International Business Machines Corporation | Conversion of documents between XML and processor efficient MXML in content based routing networks |
JP4394467B2 (ja) | 2004-01-29 | 2010-01-06 | 株式会社日立製作所 | ストレージシステム、サーバ装置及び先行コピーデータ生成方法 |
JP4134824B2 (ja) * | 2003-06-20 | 2008-08-20 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
US20050138542A1 (en) * | 2003-12-18 | 2005-06-23 | Roe Bryan Y. | Efficient small footprint XML parsing |
JP2005215950A (ja) | 2004-01-29 | 2005-08-11 | Kddi Corp | 符号化された文書データの検索方法及びそのプログラム |
JP4168946B2 (ja) * | 2004-01-29 | 2008-10-22 | Kddi株式会社 | 文書データの符号化又は復号化方法及びそのプログラム |
WO2005098665A1 (en) * | 2004-04-08 | 2005-10-20 | Justsystems Corporation | Apparatus for processing documents that use a mark up language |
JP2009501991A (ja) * | 2005-07-21 | 2009-01-22 | エクスプウェイ | 構造化文書を圧縮および解凍するための方法および装置 |
US7437373B2 (en) * | 2006-03-06 | 2008-10-14 | The Real Time Matrix Corporation | Method and system for correlating information |
US8392174B2 (en) * | 2006-08-07 | 2013-03-05 | International Characters, Inc. | Method and apparatus for lexical analysis using parallel bit streams |
-
2007
- 2007-09-20 JP JP2007244443A patent/JP4898615B2/ja not_active Expired - Fee Related
-
2008
- 2008-09-03 EP EP08163562A patent/EP2040383A3/en not_active Withdrawn
- 2008-09-05 US US12/205,299 patent/US8117217B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20090083315A1 (en) | 2009-03-26 |
JP2009075887A (ja) | 2009-04-09 |
EP2040383A3 (en) | 2012-10-24 |
US8117217B2 (en) | 2012-02-14 |
EP2040383A2 (en) | 2009-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4898615B2 (ja) | 情報処理装置および符号化方法 | |
US20230186665A1 (en) | Ink file searching method, apparatus, and program | |
JP5671320B2 (ja) | 情報処理装置及びその制御方法並びにプログラム | |
US7831908B2 (en) | Method and apparatus for layout of text and image documents | |
US7995842B2 (en) | System and method for binary persistence format for a recognition result lattice | |
US7724158B2 (en) | Object representing and processing method and apparatus | |
CN104283567A (zh) | 一种名称数据的压缩、解压缩方法及设备 | |
US20090254882A1 (en) | Methods and devices for iterative binary coding and decoding of xml type documents | |
CN108763546A (zh) | 一种数据格式的转换方法、装置、存储介质及终端 | |
US8381097B2 (en) | Determining optimal parameter for binary coding of a structured document | |
JP7035668B2 (ja) | 符号化装置、復号装置及びプログラム | |
JP4821287B2 (ja) | 構造化文書の符号化方法、符号化装置、符号化プログラム、復号装置及び符号化された構造化文書のデータ構造 | |
US8386922B2 (en) | Information processing apparatus and information processing method | |
JP6904426B2 (ja) | 擬似データ生成装置、その方法、およびプログラム | |
CN100430916C (zh) | 用于将转换应用到多部分文件的方法和系统 | |
JP2009093631A (ja) | 文書符号化装置、文書符号化方法 | |
CN111737388B (zh) | 一种地质图件数据存储处理方法 | |
CN115796127B (zh) | 位置编码方法、装置、电子设备及存储介质 | |
JP4018528B2 (ja) | 文書処理装置、文書処理方法およびプログラム | |
Isenburg | Compression and streaming of polygon meshes | |
JP6000026B2 (ja) | 印刷物を作成する方法 | |
CN103973311B (zh) | 一种对变长二值化描述子的快速编解码算法 | |
JP2013196205A (ja) | データモデル変換プログラム、データモデル変換方法およびデータモデル変換装置 | |
US11537625B1 (en) | Using structured data templates and invocation statements to dynamically define values for efficient data encoding | |
JP2009251688A (ja) | 構造化データ処理装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100615 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111125 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111226 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4898615 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150106 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |