JP2006154952A - 構造化文書処理装置及び構造化文書処理方法、プログラム、記憶媒体 - Google Patents
構造化文書処理装置及び構造化文書処理方法、プログラム、記憶媒体 Download PDFInfo
- Publication number
- JP2006154952A JP2006154952A JP2004340802A JP2004340802A JP2006154952A JP 2006154952 A JP2006154952 A JP 2006154952A JP 2004340802 A JP2004340802 A JP 2004340802A JP 2004340802 A JP2004340802 A JP 2004340802A JP 2006154952 A JP2006154952 A JP 2006154952A
- Authority
- JP
- Japan
- Prior art keywords
- structured document
- information
- structured
- contents
- location information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/221—Parsing markup language streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
Abstract
【解決手段】第1構造化文書の第1ロケーション情報と第2構造化文書の第2ロケーション情報とを1対1に対応付けるロケーション情報対応付け部と、ロケーション情報対応付け部による対応付けと、抽出部が抽出した各情報とに基づいて、第2構造化文書から抽出された内容に、第1構造化文書から抽出された内容を組み込み、構造化文書の内容を再現するための情報を変換する変換部と、変換部により変換された構造化文書の内容を再現するための情報に基づいて、第3構造化文書を構築する構造構築部とを備える。
【選択図】 図1A
Description
前記入力された第1及び第2構造化文書のデータを読み込み、当該各構造化文書の内容を再現するための各情報を判別する判別手段と、
前記判別手段で判別した各情報にアクセスするための前記第1及び第2ロケーション情報を解析し、当該判別した各情報の特定部分を当該解析結果に基づいて指定する解析手段と、
前記解析手段により指定された特定部分に対応する情報と、当該特定部分に付加された構造化文書として再現するための情報と、を前記判別手段で判別した各情報から抽出する抽出手段と、
前記第1ロケーション情報と第2ロケーション情報とを1対1に対応付けるロケーション情報対応付け手段と、
前記ロケーション情報対応付け手段による対応付けと、前記抽出手段が抽出した各情報とに基づいて、前記第2構造化文書から抽出された内容に、前記第1構造化文書から抽出された内容を組み込み、前記構造化文書の内容を再現するための情報を変換する変換手段と、
前記変換手段により変換された前記構造化文書の内容を再現するための情報に基づいて、第3構造化文書を構築する構造構築手段とを備えることを特徴とする。
図1Aは、本発明の実施形態にかかる構造化文書処理装置の構成を示すブロック図である。図1Aにおいて、101は、構造化文書処理装置における解析変換処理部を示す。解析変換処理部101は、不図示のCPU等の制御ユニットの全体的な制御の下、解析変換処理を実行することが可能であり、処理結果を不図示のメモリに格納し、必要に応じてメモリからデータを読み出して処理を実行することが可能である。この解析変換処理部101の内部には、構造化文書(inputA.xml)102、構造化文書(outputB.xml)103やロケーションパスA、B(104、105)を入力処理するための入力部106、構造自動解析部107、ロケーションパス対応付け及びデータ変換処理部113、構造構築部114、出力部115が含まれる。
これが、すべてのロケーションパスで指定されたデータに関連する要素番号となる。
本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、上述の構造化文書処理装置に供給し、その装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。プログラムコードの格納は、クライアントコンピュータに限定されるものではなく、例えば、サーバとして機能するコンピュータに記憶されておくことも可能である。
Claims (10)
- 入力された第1及び第2構造化文書に対応する第1及び第2ロケーション情報に基づいて、変換処理を実行する構造化文書処理装置であって、
前記入力された第1及び第2構造化文書のデータを読み込み、当該各構造化文書の内容を再現するための各情報を判別する判別手段と、
前記判別手段で判別した各情報にアクセスするための前記第1及び第2ロケーション情報を解析し、当該判別した各情報の特定部分を当該解析結果に基づいて指定する解析手段と、
前記解析手段により指定された特定部分に対応する情報と、当該特定部分に付加された構造化文書として再現するための情報と、を前記判別手段で判別した各情報から抽出する抽出手段と、
前記第1ロケーション情報と第2ロケーション情報とを1対1に対応付けるロケーション情報対応付け手段と、
前記ロケーション情報対応付け手段による対応付けと、前記抽出手段が抽出した各情報とに基づいて、前記第2構造化文書から抽出された内容に、前記第1構造化文書から抽出された内容を組み込み、前記構造化文書の内容を再現するための情報を変換する変換手段と、
前記変換手段により変換された前記構造化文書の内容を再現するための情報に基づいて、第3構造化文書を構築する構造構築手段と
を備えることを特徴とする構造化文書処理装置。 - 前記判別手段は、前記入力された第1及び第2構造化文書のデータを読み込み、当該第1及び第2構造化文書に含まれるタグで記述されている内容を判別し、当該タグで記述されている内容ごとに前記入力された第1及び第2構造化文書の内容を分解することを特徴とする請求項1に記載の構造化文書処理装置。
- 前記抽出手段は、前記解析手段による指定に基づいて、前記第2構造化文書の内容に、前記第1構造化文書の内容を組み込むための情報を抽出することを特徴とする請求項1に記載の構造化文書処理装置。
- 前記構造構築手段による前記第3構造化文書は、前記第1及び第2構造化文書の内容が保持された構造化文書として構築されることを特徴とする請求項1に記載の構造化文書処理装置。
- 前記第1及び第2構造化文書、前記第1及び第2ロケーション情報をネットワークを介して受信する入力手段と、
前記構造構築手段が構築した前記第3構造化文書を前記ネットワークを介して配信する出力手段と
を更に備えることを特徴とする請求項1に記載の構造化文書処理装置。 - 入力された第1及び第2構造化文書に対応する第1及び第2ロケーション情報に基づいて、変換処理を実行する構造化文書処理方法であって、
前記入力された第1及び第2構造化文書のデータを読み込み、当該各構造化文書の内容を再現するための各情報を判別する判別工程と、
前記判別工程で判別した各情報にアクセスするための前記第1及び第2ロケーション情報を解析し、当該判別した各情報の特定部分を当該解析結果に基づいて指定する解析工程と、
前記解析工程により指定された特定部分に対応する情報と、当該特定部分に付加された構造化文書として再現するための情報と、を前記判別工程で判別した各情報から抽出する抽出工程と、
前記第1ロケーション情報と第2ロケーション情報とを1対1に対応付けるロケーション情報対応付け工程と、
前記ロケーション情報対応付け工程による対応付けと、前記抽出工程により抽出された各情報とに基づいて、前記第2構造化文書から抽出された内容に、前記第1構造化文書から抽出された内容を組み込み、前記構造化文書の内容を再現するための情報を変換する変換工程と、
前記変換工程により変換された前記構造化文書の内容を再現するための情報に基づいて、第3構造化文書を構築する構造構築工程と
を備えることを特徴とする構造化文書処理方法。 - 前記判別工程は、前記入力された第1及び第2構造化文書のデータを読み込み、当該第1及び第2構造化文書に含まれるタグで記述されている内容を判別し、当該タグで記述されている内容ごとに前記入力された第1及び第2構造化文書の内容を分解することを特徴とする請求項6に記載の構造化文書処理方法。
- 前記抽出工程は、前記解析工程による指定に基づいて、前記第2構造化文書の内容に、前記第1構造化文書の内容を組み込むための情報を抽出することを特徴とする請求項6に記載の構造化文書処理方法。
- 請求項6乃至8のいずれか1項に記載の構造化文書処理方法をコンピュータに実行させることを特徴とするプログラム。
- 請求項9に記載のプログラムを格納したことを特徴とするコンピュータ可読の記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004340802A JP4868733B2 (ja) | 2004-11-25 | 2004-11-25 | 構造化文書処理装置及び構造化文書処理方法、プログラム |
US11/285,533 US7900136B2 (en) | 2004-11-25 | 2005-11-21 | Structured document processing apparatus and structured document processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004340802A JP4868733B2 (ja) | 2004-11-25 | 2004-11-25 | 構造化文書処理装置及び構造化文書処理方法、プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006154952A true JP2006154952A (ja) | 2006-06-15 |
JP2006154952A5 JP2006154952A5 (ja) | 2008-01-10 |
JP4868733B2 JP4868733B2 (ja) | 2012-02-01 |
Family
ID=36462284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004340802A Expired - Fee Related JP4868733B2 (ja) | 2004-11-25 | 2004-11-25 | 構造化文書処理装置及び構造化文書処理方法、プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7900136B2 (ja) |
JP (1) | JP4868733B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013178650A (ja) * | 2012-02-28 | 2013-09-09 | Kyocera Document Solutions Inc | ソフトウェア開発用構造化データファイル作成装置 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9495356B2 (en) * | 2006-03-30 | 2016-11-15 | International Business Machines Corporation | Automated interactive visual mapping utility and method for validation and storage of XML data |
JP5735778B2 (ja) * | 2010-10-15 | 2015-06-17 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP5792942B2 (ja) * | 2010-10-15 | 2015-10-14 | キヤノン株式会社 | 情報処理装置、情報処理方法、及び、プログラム |
US8626799B2 (en) * | 2011-10-03 | 2014-01-07 | International Business Machines Corporation | Mapping data structures |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002183116A (ja) * | 2000-12-18 | 2002-06-28 | Toshiba Corp | 文書合成方法および文書合成装置 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6721727B2 (en) * | 1999-12-02 | 2004-04-13 | International Business Machines Corporation | XML documents stored as column data |
US6910182B2 (en) * | 2000-01-31 | 2005-06-21 | Xmlcities, Inc. | Method and apparatus for generating structured documents for various presentations and the uses thereof |
WO2002001401A1 (en) * | 2000-06-26 | 2002-01-03 | Onerealm Inc. | Method and apparatus for normalizing and converting structured content |
JP4657432B2 (ja) * | 2000-09-28 | 2011-03-23 | 富士通株式会社 | 階層構造の構造化文書を変換する装置 |
US7111234B2 (en) * | 2001-05-02 | 2006-09-19 | Microsoft Corporation | System and method for in-line editing of web-based documents |
CA2349469A1 (en) * | 2001-06-01 | 2002-12-01 | Ibm Canada Limited-Ibm Canada Limitee | A data instance transformation tool for transforming a source instance to a target instance |
US7222333B1 (en) * | 2001-10-15 | 2007-05-22 | Cisco Technology, Inc. | Techniques for generating software application build scripts based on tags in comments |
JP2003150586A (ja) * | 2001-11-12 | 2003-05-23 | Ntt Docomo Inc | 文書変換システム、文書変換方法及び文書変換プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US7281211B2 (en) * | 2001-12-21 | 2007-10-09 | Gxs, Inc. | Automated method, system, and software for transforming data between extensible markup language format and electronic data interchange format |
US7013306B1 (en) * | 2001-12-21 | 2006-03-14 | Unisys Corporation | XML input definition table for transforming XML data to internal format |
JP4068570B2 (ja) * | 2002-02-08 | 2008-03-26 | 富士通株式会社 | 文書配信装置、文書受信装置、文書配信方法、文書配信プログラム、文書配信システム |
US8032828B2 (en) * | 2002-03-04 | 2011-10-04 | Hewlett-Packard Development Company, L.P. | Method and system of document transformation between a source extensible markup language (XML) schema and a target XML schema |
JP3857663B2 (ja) | 2002-04-30 | 2006-12-13 | 株式会社東芝 | 構造化文書編集装置、構造化文書編集方法及びプログラム |
JP3788956B2 (ja) | 2002-06-28 | 2006-06-21 | 株式会社東芝 | 構造化文書表示方法、構造化文書表示装置及びプログラム |
US7069504B2 (en) * | 2002-09-19 | 2006-06-27 | International Business Machines Corporation | Conversion processing for XML to XML document transformation |
US20040088397A1 (en) * | 2002-11-05 | 2004-05-06 | Sidley Austin Brown & Wood Llp. | System and method for management of software applications |
KR100513736B1 (ko) * | 2002-12-05 | 2005-09-08 | 삼성전자주식회사 | 그래픽 데이터 압축에 관한 메타표현을 이용한 입력파일생성 방법 및 시스템 |
US6836778B2 (en) * | 2003-05-01 | 2004-12-28 | Oracle International Corporation | Techniques for changing XML content in a relational database |
US7296223B2 (en) * | 2003-06-27 | 2007-11-13 | Xerox Corporation | System and method for structured document authoring |
US7225411B1 (en) * | 2003-06-30 | 2007-05-29 | Tibco Software Inc. | Efficient transformation of information between a source schema and a target schema |
US7437374B2 (en) * | 2004-02-10 | 2008-10-14 | International Business Machines Corporation | Efficient XML schema validation of XML fragments using annotated automaton encoding |
-
2004
- 2004-11-25 JP JP2004340802A patent/JP4868733B2/ja not_active Expired - Fee Related
-
2005
- 2005-11-21 US US11/285,533 patent/US7900136B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002183116A (ja) * | 2000-12-18 | 2002-06-28 | Toshiba Corp | 文書合成方法および文書合成装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013178650A (ja) * | 2012-02-28 | 2013-09-09 | Kyocera Document Solutions Inc | ソフトウェア開発用構造化データファイル作成装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4868733B2 (ja) | 2012-02-01 |
US20060112327A1 (en) | 2006-05-25 |
US7900136B2 (en) | 2011-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101908162B1 (ko) | 통합 개발 환경에서의 라이브 브라우저 툴 제공 기법 | |
CN103608802B (zh) | 取回的文件和源文件之间的选择映射的方法和系统 | |
JP2007141123A (ja) | 異なるファイルの同一文字列のリンク | |
JP4860416B2 (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP2005339566A (ja) | コンテンツを開始テンプレートとターゲットテンプレートとの間でマップするための方法およびシステム | |
JP2007226452A (ja) | 構造化文書管理装置、構造化文書管理プログラムおよび構造化文書管理方法 | |
US20110202532A1 (en) | Information sharing system, information sharing method, and information sharing program | |
JP2006164269A (ja) | 検索結果のカスタマイゼーションのためのシステムおよび方法 | |
JP2007058623A (ja) | 構造化文書のデータ展開方法及びデータ処理方法 | |
JP6130315B2 (ja) | ファイル変換方法及びシステム | |
JP7081396B2 (ja) | 生成方法、生成プログラム、および生成装置 | |
JP2005234837A (ja) | 構造化文書処理方法、構造化文書処理システム及びそのプログラム | |
US7900136B2 (en) | Structured document processing apparatus and structured document processing method, and program | |
US20110087698A1 (en) | Search expression creating system, search expression creating method, search expression creating program, and recording medium | |
JP2006065467A (ja) | データ抽出定義情報生成装置およびデータ抽出定義情報生成方法 | |
JP5712496B2 (ja) | アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置 | |
JP2008102773A (ja) | データを共通のフォーマットに変換する方法 | |
JP2008097436A (ja) | 構造化文書構造自動解析および構造自動再構築装置 | |
JP6753190B2 (ja) | 文書検索装置及びプログラム | |
JP2007219579A (ja) | ドキュメント変換装置、およびプログラム | |
JP5193894B2 (ja) | データ編集装置、データ編集方法、およびプログラム | |
JP2004118599A (ja) | 情報開示プログラム | |
JP2008046850A (ja) | 文書種類判別装置及び文書種類判別プログラム | |
JP2010204863A (ja) | アノテーションプログラム、アノテーション装置及びアノテーション方法 | |
JPH11249941A (ja) | 整理用ファイル生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071114 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071114 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20071114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110405 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111111 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111115 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141125 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |