JP5142638B2 - 文書変換装置、文書変換方法 - Google Patents
文書変換装置、文書変換方法 Download PDFInfo
- Publication number
- JP5142638B2 JP5142638B2 JP2007228283A JP2007228283A JP5142638B2 JP 5142638 B2 JP5142638 B2 JP 5142638B2 JP 2007228283 A JP2007228283 A JP 2007228283A JP 2007228283 A JP2007228283 A JP 2007228283A JP 5142638 B2 JP5142638 B2 JP 5142638B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- output
- conversion
- format
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/154—Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
前記出力形式としてバイナリ形式が指定されている場合には、前記構造化文書の形式を変換するために用いられるテンプレートから順次、前記構造化文書に対する処理命令を取得する取得手段と、
前記取得手段が取得した処理命令が、前記構造化文書中の一部を出力する命令である場合、該一部の出力形式が前記テンプレート内で指定されているか否かを判断する手段と、
前記一部の出力形式が前記テンプレート内で指定されている場合には、該出力形式に対して予め対応付けられているバイナリ変換を該一部に対して行い、該バイナリ変換の結果を、出力データを格納するためのファイルに書き込む書き込み手段と、
前記一部の出力形式が前記テンプレート内で指定されていない場合には、該一部を前記ファイルに書き込む手段と
を備えることを特徴とする。
前記文書変換装置が有する第1の判断手段が、構造化文書の出力形式としてバイナリ形式が指定されているか否かを判断する判断工程と、
前記文書変換装置が有する取得手段が、前記出力形式としてバイナリ形式が指定されている場合には、前記構造化文書の形式を変換するために用いられるテンプレートから順次、前記構造化文書に対する処理命令を取得する取得工程と、
前記文書変換装置が有する第2の判断手段が、前記取得工程で取得した処理命令が、前記構造化文書中の一部を出力する命令である場合、該一部の出力形式が前記テンプレート内で指定されているか否かを判断する工程と、
前記文書変換装置が有する第1の書き込み手段が、前記一部の出力形式が前記テンプレート内で指定されている場合には、該出力形式に対して予め対応付けられているバイナリ変換を該一部に対して行い、該バイナリ変換の結果を、出力データを格納するためのファイルに書き込む書き込み工程と、
前記文書変換装置が有する第2の書き込み手段が、前記一部の出力形式が前記テンプレート内で指定されていない場合には、該一部を前記ファイルに書き込む工程と
を備えることを特徴とする。
図1は、本実施形態に係る文書変換装置のハードウェア構成例を示すブロック図である。なお、図1には、以下の説明で主に用いる構成のみを記しており、文書変換装置の構成全てを記したものではない。従って、以下の説明は、図1に示した構成に限定したものではない。
1. 文書全体の識別子
E0 00 00 01 00 (16)
2. “root”要素の識別子
3C 03 72 6F 6F 74 (16) (属性なし、要素名が”root”)
3. “outputs”要素の識別子
6F 75 74 70 75 74 73 (16) (属性なし、要素名が”outputs”)
4. “output1”要素の識別子
3C 06 6F 75 74 70 75 74 31 (16)(属性なし、要素名が”output1”)
5. “output1”要素の要素内容の識別子
8C 09 (16)(short型アルゴリズムでバイナリ化、2バイト長)
6. “output1”要素の要素内容のバイナリ表現
30 39 (16) (“12345”のshort型表現)
7. “output1”要素のターミネータ
F0 (16)
8. “output2”要素の識別子
3C 06 6F 75 74 70 75 74 32 (16) (属性なし、要素名が”output2”)
9. “output2”要素の要素内容の識別子
8C 0E 01 (16)(int型アルゴリズムでバイナリ化、4バイト長)
10. “output2”要素の要素内容のバイナリ表現
07 5B CD 15 (16) (“123456789”のint型表現)
11. “output2”要素のターミネータ
F0 (16)
12. “output3”要素の識別子
7C 06 6F 75 74 70 75 74 33 (16)(属性あり、要素名が”output3”)
13. “value”属性の識別子
78 04 76 61 6C 75 65 (16)(属性名が”value”)
14. “value”属性の属性値の識別子
8C 1A 01 (16)(float型アルゴリズムでバイナリ化、4バイト長)
15. “value”属性の属性値のバイナリ表現
C2 ED 40 00 (16) (“-118.625”のfloat型表現)
16. “value”属性、”output3”要素、”output”要素、”root”要素のターミネータ
FF FF (16)
17. 文書全体のターミネータ
F0 (16)
図7Bは、上記の順番で書き出されたFast infoset形式の変換後ファイルの内容を記述した図である。図7Aは、図7Bに示した変換後ファイルの内容をテキスト表現で記述した結果を示す図である。
第1の実施形態では、データ出力処理において出力データ型取得部114が要素、属性などのノードのデータ型を、ステップS1010において、テンプレートの解析結果から取得した。これは、出力データ型取得部114が、テンプレート中の”bx:type”で指定されるデータ型の定義を検索することによって実現している。
第1の実施形態では、データ出力処理において出力データ型取得部114が要素、属性などのノードのデータ型を、ステップS1010において、テンプレートの解析結果から取得した。これは、出力データ型取得部114が、テンプレート中の”bx:type”で指定されるデータ型の定義を検索することによって実現している。
また、本発明の目的は、以下のようにすることによって達成されることはいうまでもない。即ち、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給する。係る記憶媒体は言うまでもなく、コンピュータ読み取り可能な記憶媒体である。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行する。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
Claims (7)
- 構造化文書の出力形式としてバイナリ形式が指定されているか否かを判断する判断手段と、
前記出力形式としてバイナリ形式が指定されている場合には、前記構造化文書の形式を変換するために用いられるテンプレートから順次、前記構造化文書に対する処理命令を取得する取得手段と、
前記取得手段が取得した処理命令が、前記構造化文書中の一部を出力する命令である場合、該一部の出力形式が前記テンプレート内で指定されているか否かを判断する手段と、
前記一部の出力形式が前記テンプレート内で指定されている場合には、該出力形式に対して予め対応付けられているバイナリ変換を該一部に対して行い、該バイナリ変換の結果を、出力データを格納するためのファイルに書き込む書き込み手段と、
前記一部の出力形式が前記テンプレート内で指定されていない場合には、該一部を前記ファイルに書き込む手段と
を備えることを特徴とする文書変換装置。 - 前記判断手段は、前記テンプレート内に記述されている前記構造化文書の出力形式を参照することで、前記構造化文書の出力形式としてバイナリ形式が指定されているか否かを判断することを特徴とする請求項1に記載の文書変換装置。
- 前記判断手段は、前記構造化文書の出力形式を変換した後の文書の構造を定義したスキーマ定義内に記述されている前記構造化文書の出力形式を参照することで、前記構造化文書の出力形式としてバイナリ形式が指定されているか否かを判断することを特徴とする請求項1に記載の文書変換装置。
- 前記書き込み手段は、複数種の出力形式と、該出力形式のデータをバイナリ表現する為のバイナリ変換の名称と、が登録されている一覧表の情報を保持しており、
該一覧表の情報を参照して、前記テンプレート内で指定されている前記一部の出力形式に対応するバイナリ変換の名称を特定し、該特定した名称を有するバイナリ変換を該一部に対して行い、該バイナリ変換の結果を前記ファイルに書き込むことを特徴とする請求項1乃至3の何れか1項に記載の文書変換装置。 - 前記判断手段は、前記取得手段が取得した処理命令が、前記構造化文書中の文字列を出力する命令であれば、該文字列の出力形式が前記テンプレート内で指定されているか否かを判断し、
前記書き込み手段は、前記文字列の出力形式が前記テンプレート内で指定されている場合には、該出力形式に対して予め対応付けられているバイナリ変換を該文字列に対して行い、該バイナリ変換の結果を前記ファイルに書き込み、
前記書き込む手段は、前記文字列の出力形式が前記テンプレート内で指定されていない場合には、該文字列を前記ファイルに書き込む
ことを特徴とする請求項1乃至4の何れか1項に記載の文書変換装置。 - 文書変換装置が行う文書変換方法であって、
前記文書変換装置が有する第1の判断手段が、構造化文書の出力形式としてバイナリ形式が指定されているか否かを判断する判断工程と、
前記文書変換装置が有する取得手段が、前記出力形式としてバイナリ形式が指定されている場合には、前記構造化文書の形式を変換するために用いられるテンプレートから順次、前記構造化文書に対する処理命令を取得する取得工程と、
前記文書変換装置が有する第2の判断手段が、前記取得工程で取得した処理命令が、前記構造化文書中の一部を出力する命令である場合、該一部の出力形式が前記テンプレート内で指定されているか否かを判断する工程と、
前記文書変換装置が有する第1の書き込み手段が、前記一部の出力形式が前記テンプレート内で指定されている場合には、該出力形式に対して予め対応付けられているバイナリ変換を該一部に対して行い、該バイナリ変換の結果を、出力データを格納するためのファイルに書き込む書き込み工程と、
前記文書変換装置が有する第2の書き込み手段が、前記一部の出力形式が前記テンプレート内で指定されていない場合には、該一部を前記ファイルに書き込む工程と
を備えることを特徴とする文書変換方法。 - コンピュータを、請求項1乃至5の何れか1項に記載の文書変換装置が有する各手段として機能させるためのコンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007228283A JP5142638B2 (ja) | 2007-09-03 | 2007-09-03 | 文書変換装置、文書変換方法 |
US12/199,546 US9110874B2 (en) | 2007-09-03 | 2008-08-27 | Document conversion apparatus and document conversion method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007228283A JP5142638B2 (ja) | 2007-09-03 | 2007-09-03 | 文書変換装置、文書変換方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2009059311A JP2009059311A (ja) | 2009-03-19 |
JP2009059311A5 JP2009059311A5 (ja) | 2010-08-05 |
JP5142638B2 true JP5142638B2 (ja) | 2013-02-13 |
Family
ID=40409414
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007228283A Expired - Fee Related JP5142638B2 (ja) | 2007-09-03 | 2007-09-03 | 文書変換装置、文書変換方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9110874B2 (ja) |
JP (1) | JP5142638B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5687219B2 (ja) * | 2012-01-20 | 2015-03-18 | 日本電信電話株式会社 | データ検索システム、データ検索方法及びデータ検索プログラム |
JP2013214237A (ja) * | 2012-04-03 | 2013-10-17 | Nippon Telegr & Teleph Corp <Ntt> | コンフィグレーションファイル解析装置、および、プログラム |
US10691655B2 (en) | 2016-10-20 | 2020-06-23 | Microsoft Technology Licensing, Llc | Generating tables based upon data extracted from tree-structured documents |
CN111679867B (zh) * | 2020-05-29 | 2024-02-27 | 中国航空工业集团公司西安航空计算技术研究所 | 一种嵌入式系统配置数据生成方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6209124B1 (en) * | 1999-08-30 | 2001-03-27 | Touchnet Information Systems, Inc. | Method of markup language accessing of host systems and data using a constructed intermediary |
US6772413B2 (en) * | 1999-12-21 | 2004-08-03 | Datapower Technology, Inc. | Method and apparatus of data exchange using runtime code generator and translator |
US7702995B2 (en) * | 2000-04-24 | 2010-04-20 | TVWorks, LLC. | Method and system for transforming content for execution on multiple platforms |
GB0011426D0 (en) * | 2000-05-11 | 2000-06-28 | Charteris Limited | A method for transforming documents written in different XML-based languages |
JP2004258773A (ja) | 2003-02-24 | 2004-09-16 | Mitsubishi Electric Corp | 文書圧縮装置及び文書復元装置 |
US7647415B1 (en) * | 2004-02-25 | 2010-01-12 | Sun Microsystems, Inc. | Dynamic web services stack |
US8037408B2 (en) * | 2005-12-22 | 2011-10-11 | Sap Ag | Systems and methods of validating templates |
US7774746B2 (en) * | 2006-04-19 | 2010-08-10 | Apple, Inc. | Generating a format translator |
-
2007
- 2007-09-03 JP JP2007228283A patent/JP5142638B2/ja not_active Expired - Fee Related
-
2008
- 2008-08-27 US US12/199,546 patent/US9110874B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US9110874B2 (en) | 2015-08-18 |
JP2009059311A (ja) | 2009-03-19 |
US20090063957A1 (en) | 2009-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5027411B2 (ja) | 文書のインスタンスを生成するための装置 | |
JP5325920B2 (ja) | エンコーダコンパイラ、プログラムおよび通信機器 | |
US20070150809A1 (en) | Division program, combination program and information processing method | |
US8397157B2 (en) | Context-free grammar | |
US20070055679A1 (en) | Data expansion method and data processing method for structured documents | |
JP2012128853A (ja) | Xmlドキュメントを処理するためのシステム及び方法 | |
JP5142638B2 (ja) | 文書変換装置、文書変換方法 | |
JP2005234837A (ja) | 構造化文書処理方法、構造化文書処理システム及びそのプログラム | |
US7111284B2 (en) | System and method for mapping structured document to structured data of program language and program for executing its method | |
WO2007081017A1 (ja) | 文書処理装置 | |
JP2005332146A (ja) | 動的コンテンツ作成プログラムの生成装置、動的コンテンツ作成プログラムを生成するためのプログラム、及び動的コンテンツ作成プログラムの生成方法 | |
JP2010250449A (ja) | 情報処理装置、情報処理方法 | |
US8255356B2 (en) | Apparatus and method of generating document | |
JP5201808B2 (ja) | 電子文書処理装置及び電子文書処理方法 | |
JP5570202B2 (ja) | 構造化文書解析装置、構造化文書解析方法、及びコンピュータプログラム | |
CN101151612A (zh) | 对文档进行随机访问的方法和系统 | |
JPWO2005101210A1 (ja) | データ解析装置およびデータ解析プログラム | |
JP6008456B2 (ja) | 装置及びプログラム | |
JP4408717B2 (ja) | 情報処理システム、蓄積装置、処理装置、蓄積方法、処理方法、ならびに、プログラム | |
JP2009080681A (ja) | プログラム構造解析方法及び装置 | |
JP4786695B2 (ja) | 構造化文書の構造変換装置 | |
JP4242701B2 (ja) | 格納検索装置、格納検索プログラム、および格納検索プログラム記録媒体 | |
JP4776972B2 (ja) | キャッシュ生成方法、装置、プログラム及び記録媒体 | |
JP3974606B2 (ja) | 構造化文書変換装置、構造化文書変換方法及びプログラム | |
JP4982154B2 (ja) | 構造化文書の構文解析方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100618 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120525 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121022 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121120 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151130 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5142638 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |