JP2005234837A - 構造化文書処理方法、構造化文書処理システム及びそのプログラム - Google Patents
構造化文書処理方法、構造化文書処理システム及びそのプログラム Download PDFInfo
- Publication number
- JP2005234837A JP2005234837A JP2004042289A JP2004042289A JP2005234837A JP 2005234837 A JP2005234837 A JP 2005234837A JP 2004042289 A JP2004042289 A JP 2004042289A JP 2004042289 A JP2004042289 A JP 2004042289A JP 2005234837 A JP2005234837 A JP 2005234837A
- Authority
- JP
- Japan
- Prior art keywords
- document
- holding unit
- structured document
- partial
- structured
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/84—Mapping; Conversion
- G06F16/88—Mark-up to mark-up conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/154—Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
Abstract
【解決手段】構造化文書(10)中の枝である特定タグの位置情報を位置情報保持部(12)に事前に取出しておき,これをもとに構造化文書(10)から要素,属性,要素内容という部分文書を抽出する。オリジナルの構造化文書から一部を抽出するだけなので,従来の木構造として取得する方法と比較して、CPU負荷を低減でき、メモリ使用量も少なくできる。又、抽出したものと文書変換用テンプレート(20)に直接当てはめて、他の構造化文書生成する。
【選択図】図1
Description
図1は、本発明の構造化文書処理システムの一実施の形態の構成図、図2は、図1の構造化文書の説明図、図3は、図1の位置情報の説明図、図4は、図1のシステムの動作説明図である。
図5は、本発明の第1の実施の形態のシステム構成図、図6は、図5の位置情報の第1の実施の形態の説明図、図7は、図5の位置情報の第2の実施の形態の説明図、図8は、図5の位置情報保持部の説明図である。
次に、本発明の第2の実施の形態を説明する。図11は、本発明の第2の実施の形態のシステム構成図、図12は、その編集処理フロー図、図13は、図12の編集後の保存処理フロー図である。
次に、本発明の第3の実施の形態として、製品情報を表わすXML文書に対して,型名による検索を行い,製品情報を検索結果として,Webブラウザ上に表示するユーザアプリケーションをとして示す。
前述の実施の形態では、構造化文書を、XML文書で説明したが、SGML, HTML等の他の形式の構造化文書に適用できる。同様に、変換される構造化文書も、HTMLに限らず、他の形式のものを利用できる。
2 変換モジュール
3 クライアント
10,101,111 構造化文書
12,104 位置保持部
20 変換テンプレート
100 構造化文書保持部
102 抽出部
103 部分文書管理部
105 部分文書保持部
108 ユーザアプリケーション
112 コピー部
130 処理部
408 変換部
410 テンプレート保持部
Claims (10)
- 構造化文書保持部に保持された構造化文書を処理する構造化文書処理方法において、
構造化文書中の木の位置情報を位置情報保持部に保持するステップと、
指示された前記構造化文書の部分文書を、前記保持した木の位置情報を使用して、抽出するステップとを有する
ことを特徴とする構造化文書処理方法。 - 前記抽出した部分文書を部分文書保持部に保持するステップと、
抽出する部分文書が前記部分文書保持部に保持されているかを判定するステップと、
前記抽出する部分文書が前記部分文書保持部に保持されている時は、前記部分文書保持部から前記部分文書を抽出し、前記抽出する部分文書が前記部分文書保持部に保持されていない時は、前記木の位置情報を使用して、前記構造化文書から前記部分文書を抽出するステップとを更に有する
ことを特徴とする請求項1の構造化文書処理方法。 - 前記部分文書保持部に、前記構造化文書中の編集された部分文書を保持するステップを更に有する
ことを特徴とする請求項2の構造化文書処理方法。 - 前記構造化文書保持部の前記構造化文書の編集が無かった部分をコピーし、前記部分文書保持部の編集された部分文書と合わせて、変更後の部分文書を生成するステップを更に有する
ことを特徴とする請求項3の構造化文書処理方法。 - 文書化構造変換用テンプレートに、前記抽出した部分文書を当てはめ、構造化文書の変換を行うステップを更に有する
ことを特徴とする請求項1の構造化文書処理方法。 - 前記抽出ステップは、前記位置保持部の位置情報に従い、特定のタグで囲われた領域、タグの属性、開始タグの終端と終了タグの先端に挟まれた領域の少なくとも1つを、前記部分文書として、抽出するステップからなる
ことを特徴とする請求項1の構造化文書処理方法。 - 構造化文書保持部に保持された構造化文書を処理する構造化文書処理システムにおいて、
前記構造化文書保持部の構造化文書中の木の位置情報を保持する位置情報保持部と、
指示された前記構造化文書の部分文書を、前記保持した木の位置情報を使用して、抽出する処理部とを有する
ことを特徴とする構造化文書処理システム。 - 前記抽出した部分文書を保持する部分文書保持部を更に有し、
前記処理部は、抽出する部分文書が前記部分文書保持部に保持されているかを判定し、前記抽出する部分文書が前記部分文書保持部に保持されている時は、前記部分文書保持部から前記部分文書を抽出し、前記抽出する部分文書が前記部分文書保持部に保持されていない時は、前記木の位置情報を使用して、前記構造化文書から前記部分文書を抽出する
ことを特徴とする請求項7の構造化文書処理システム。 - 前記処理部は、前記部分文書保持部に、前記構造化文書中の編集された部分文書を保持する
ことを特徴とする請求項9の構造化文書処理システム。 - 構造化文書保持部に保持された構造化文書を処理するプログラムであって、
構造化文書中の木の位置情報を位置情報保持部に保持するステップと、指示された前記構造化文書の部分文書を、前記保持した木の位置情報を使用して、抽出するステップとをコンピュータに実行させる
ことを特徴とするコンピュータ読み取り可能なプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004042289A JP2005234837A (ja) | 2004-02-19 | 2004-02-19 | 構造化文書処理方法、構造化文書処理システム及びそのプログラム |
US10/964,736 US20050187899A1 (en) | 2004-02-19 | 2004-10-15 | Structured document processing method, structured document processing system, and program for same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004042289A JP2005234837A (ja) | 2004-02-19 | 2004-02-19 | 構造化文書処理方法、構造化文書処理システム及びそのプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005234837A true JP2005234837A (ja) | 2005-09-02 |
Family
ID=34857970
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004042289A Pending JP2005234837A (ja) | 2004-02-19 | 2004-02-19 | 構造化文書処理方法、構造化文書処理システム及びそのプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20050187899A1 (ja) |
JP (1) | JP2005234837A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007200189A (ja) * | 2006-01-30 | 2007-08-09 | Hitachi Ltd | 文書検索方法、文書検索プログラムおよび文書検索装置 |
JP2007323443A (ja) * | 2006-06-01 | 2007-12-13 | Canon Inc | Webサービス実行方法及び情報処理装置 |
JP2009521774A (ja) * | 2005-12-22 | 2009-06-04 | オラクル・インターナショナル・コーポレーション | Xml文書をメモリにロードする方法及びメカニズム |
JP2009157875A (ja) * | 2007-12-28 | 2009-07-16 | Dainippon Printing Co Ltd | 構造化文書ファイル、およびその処理装置および方法 |
JP2009537029A (ja) * | 2006-05-12 | 2009-10-22 | サムスン エレクトロニクス カンパニー リミテッド | コンテンツ暗号キーの位置を効率的に提供する方法および装置 |
JP2009258971A (ja) * | 2008-04-16 | 2009-11-05 | Ntt Docomo Inc | データ同期方法および通信装置 |
JP2010282347A (ja) * | 2009-06-03 | 2010-12-16 | Nec Corp | 構文解析装置、構文解析方法、及びプログラム |
US8423888B2 (en) | 2005-03-30 | 2013-04-16 | Fujitsu Limited | Document conversion and use system |
CN111259202A (zh) * | 2020-01-10 | 2020-06-09 | 西宁宁光工程咨询有限公司 | 一种文档结构化数据嵌入方法及系统 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4525115B2 (ja) * | 2004-03-11 | 2010-08-18 | 日本電気株式会社 | 構造化文書処理装置、構造化文書処理方法、および構造化文書処理プログラム |
US20060224956A1 (en) * | 2005-04-05 | 2006-10-05 | International Business Machines Corporation | Intelligent document saving |
JP4234698B2 (ja) * | 2005-06-20 | 2009-03-04 | 富士通株式会社 | 構造化文書処理システム |
CN101223603A (zh) * | 2005-07-22 | 2008-07-16 | 皇家飞利浦电子股份有限公司 | 光盘节目播放控制方法及装置 |
JP5142773B2 (ja) * | 2008-03-13 | 2013-02-13 | キヤノン株式会社 | メッセージ生成処理方法及びメッセージ生成処理装置 |
US8413165B2 (en) * | 2008-03-31 | 2013-04-02 | Sap Ag | Managing consistent interfaces for maintenance order business objects across heterogeneous systems |
US9715558B2 (en) * | 2008-04-14 | 2017-07-25 | International Business Machines Corporation | Structure-position mapping of XML with variable-length data |
US10229379B2 (en) * | 2015-04-20 | 2019-03-12 | Sap Se | Checklist function integrated with process flow model |
CN108519963B (zh) * | 2018-03-02 | 2021-12-03 | 山东科技大学 | 一种将流程模型自动转换为多语言文本的方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0830620A (ja) * | 1994-07-19 | 1996-02-02 | Fuji Xerox Co Ltd | 構造検索装置 |
CA2242158C (en) * | 1997-07-01 | 2004-06-01 | Hitachi, Ltd. | Method and apparatus for searching and displaying structured document |
JP3879350B2 (ja) * | 2000-01-25 | 2007-02-14 | 富士ゼロックス株式会社 | 構造化文書処理システム及び構造化文書処理方法 |
JP3943830B2 (ja) * | 2000-12-18 | 2007-07-11 | 株式会社東芝 | 文書合成方法および文書合成装置 |
JP4045399B2 (ja) * | 2001-08-24 | 2008-02-13 | 富士ゼロックス株式会社 | 構造化文書管理装置及び構造化文書管理方法 |
JP4045400B2 (ja) * | 2001-08-24 | 2008-02-13 | 富士ゼロックス株式会社 | 検索装置及び検索方法 |
US7451390B2 (en) * | 2001-09-10 | 2008-11-11 | Fujitsu Limited | Structured document processing system, method, program and recording medium |
JP2003150586A (ja) * | 2001-11-12 | 2003-05-23 | Ntt Docomo Inc | 文書変換システム、文書変換方法及び文書変換プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP4418154B2 (ja) * | 2002-12-27 | 2010-02-17 | 株式会社エヌ・ティ・ティ・ドコモ | 構造化文書変換装置、構造化文書変換方法および構造化文書変換プログラム |
JP4267336B2 (ja) * | 2003-01-30 | 2009-05-27 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 構造パターン候補を生成する方法、システムおよびプログラム |
-
2004
- 2004-02-19 JP JP2004042289A patent/JP2005234837A/ja active Pending
- 2004-10-15 US US10/964,736 patent/US20050187899A1/en not_active Abandoned
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8423888B2 (en) | 2005-03-30 | 2013-04-16 | Fujitsu Limited | Document conversion and use system |
JP2009521774A (ja) * | 2005-12-22 | 2009-06-04 | オラクル・インターナショナル・コーポレーション | Xml文書をメモリにロードする方法及びメカニズム |
JP4746433B2 (ja) * | 2006-01-30 | 2011-08-10 | 株式会社日立製作所 | 文書検索方法、文書検索プログラムおよび文書検索装置 |
JP2007200189A (ja) * | 2006-01-30 | 2007-08-09 | Hitachi Ltd | 文書検索方法、文書検索プログラムおよび文書検索装置 |
JP2009537029A (ja) * | 2006-05-12 | 2009-10-22 | サムスン エレクトロニクス カンパニー リミテッド | コンテンツ暗号キーの位置を効率的に提供する方法および装置 |
US8340297B2 (en) | 2006-05-12 | 2012-12-25 | Samsung Electronics Co., Ltd. | Method and apparatus for efficiently providing location of contents encryption key |
JP2007323443A (ja) * | 2006-06-01 | 2007-12-13 | Canon Inc | Webサービス実行方法及び情報処理装置 |
JP2009157875A (ja) * | 2007-12-28 | 2009-07-16 | Dainippon Printing Co Ltd | 構造化文書ファイル、およびその処理装置および方法 |
JP4719243B2 (ja) * | 2008-04-16 | 2011-07-06 | 株式会社エヌ・ティ・ティ・ドコモ | データ同期方法および通信装置 |
JP2009258971A (ja) * | 2008-04-16 | 2009-11-05 | Ntt Docomo Inc | データ同期方法および通信装置 |
JP2010282347A (ja) * | 2009-06-03 | 2010-12-16 | Nec Corp | 構文解析装置、構文解析方法、及びプログラム |
CN111259202A (zh) * | 2020-01-10 | 2020-06-09 | 西宁宁光工程咨询有限公司 | 一种文档结构化数据嵌入方法及系统 |
CN111259202B (zh) * | 2020-01-10 | 2023-08-04 | 西宁宁光工程咨询有限公司 | 一种文档结构化数据嵌入方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
US20050187899A1 (en) | 2005-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005234837A (ja) | 構造化文書処理方法、構造化文書処理システム及びそのプログラム | |
US20170357631A1 (en) | Analysis of documents using rules | |
US7975220B2 (en) | Apparatus, program product and method for structured document management | |
EP1949269B1 (en) | Managing relationships between resources stored within a repository | |
US20080126396A1 (en) | System and method for implementing dynamic forms | |
JP2008052662A (ja) | 構造化文書管理システム及びプログラム | |
US20070055679A1 (en) | Data expansion method and data processing method for structured documents | |
JPH07319917A (ja) | 文書データべース管理装置および文書データべースシステム | |
US7457812B2 (en) | System and method for managing structured document | |
US20130212121A1 (en) | Client-side modification of electronic documents in a client-server environment | |
JPWO2006137563A1 (ja) | データ処理装置及びデータ処理方法 | |
JPWO2006137562A1 (ja) | 文書処理装置及び文書処理方法 | |
JP2008097215A (ja) | データ処理装置 | |
JPWO2003067470A1 (ja) | 文書配信装置、文書受信装置、文書配信方法、文書配信プログラム、文書配信システム | |
JPWO2002103554A1 (ja) | データ処理方法、データ処理プログラム、およびデータ処理装置 | |
US7451390B2 (en) | Structured document processing system, method, program and recording medium | |
US20060112327A1 (en) | Structured document processing apparatus and structured document processing method, and program | |
US20030041305A1 (en) | Resilient data links | |
US7805424B2 (en) | Querying nested documents embedded in compound XML documents | |
JP2002342342A (ja) | 文書管理方法及びその実施システム並びにその処理プログラムと記録媒体 | |
JP4242701B2 (ja) | 格納検索装置、格納検索プログラム、および格納検索プログラム記録媒体 | |
JP2004303097A (ja) | 構造化文書の部分文書抽出プログラムおよび部分文書抽出方法 | |
JP2008140157A (ja) | 構造化文書処理装置 | |
JP2004348485A (ja) | 構造化文書処理方法及び装置及び構造化文書処理プログラム及び構造化文書処理プログラムを格納した記憶媒体 | |
JP2008140081A (ja) | 構造化文書検索システム及びデータベース管理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051026 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070515 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070717 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071127 |