JP5665821B2 - 文書処理装置、及びプログラム - Google Patents
文書処理装置、及びプログラム Download PDFInfo
- Publication number
- JP5665821B2 JP5665821B2 JP2012204591A JP2012204591A JP5665821B2 JP 5665821 B2 JP5665821 B2 JP 5665821B2 JP 2012204591 A JP2012204591 A JP 2012204591A JP 2012204591 A JP2012204591 A JP 2012204591A JP 5665821 B2 JP5665821 B2 JP 5665821B2
- Authority
- JP
- Japan
- Prior art keywords
- output
- condition
- document
- structured document
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/149—Adaptation of the text data for streaming purposes, e.g. Efficient XML Interchange [EXI] format
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/154—Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、第1の実施形態にかかる文書処理装置の構成を示すブロック図である。本実施系形態においては、EXI規格によってバイナリー化されたXMLの構造化文書を処理する構成を示している。そのため、本実施形態では、スキーマとしてXMLスキーマを採用しているが、これはRELAX NGなどのほかの構造化文書を定義する文法を用いてもよい。また、構造化文書がXMLでなくASN.1などの他の構造化文書であってもよく、状態機械として文法が表現することのできる構造化文書のフォーマットであれば使用することができる。また、文書処理装置への入出力はEXIを採用しているが、他の規格を用いてもよい。
QE1:/measurement/points/point/typeの値がtemperatureである
QE2:/measurement/points/point/valueの値が40以上である
200 文書処理装置
210 状態遷移実行部
220 文書記憶部
230 状態機械記憶部
240 割当部
250 クエリ要素判定部
260 終了条件決定部
270 出力部
300 XMLスキーマ
400 入力クエリデータ
500 EXIストリーム
600 EXIストリーム
Claims (6)
- 構造化文書を定義する文法から生成される状態機械を記憶する状態機械記憶部と、
処理中のバイナリー化された構造化文書を記憶する文書記憶部と、
前記構造化文書の入力を受け付け、前記文書記憶部に記憶する文書受付部と、
前記文書記憶部に記憶された前記構造化文書を、前記構造化文書に対応する記憶された前記状態機械にしたがって、状態の遷移を行い、遷移が実行されるごとに、前記文書記憶部に記憶された前記構造化文書の現在状態を更新する状態遷移実行部と、
前記構造化文書に対する条件を指定するクエリデータから条件単位毎に分割されて複数生成されるクエリ要素に対し、入力された前記構造化文書中の注目する値に対応する属性を満たすか否かを判定し、出力値として、条件を満たす旨の肯定出力、条件を満たさない旨の否定出力、及び条件の判定を未だ行うことができない旨を示す待機出力のいずれかを出力し、前記肯定出力、又は前記否定出力が出力されるまでは、前記待機出力を出力するクエリ要素判定部と、
前記クエリ要素判定部が出力する各出力値の条件の組み合わせの論理式により表現され、入力された前記構造化文書が前記クエリデータの条件を満たすか否かを表現する終了条件の出力として、条件を満たす旨の肯定出力、条件を満たさない旨の否定出力、及び条件の判定を未だ行うことができない旨を示す待機出力のいずれかを出力する終了条件決定部と、
前記構造化文書を出力する出力部と、
を備え、
前記状態遷移実行部は、前記終了条件決定部が前記待機出力を出力している間は、前記遷移を実行し、前記終了条件決定部が前記否定出力を出力した場合は、処理中の入力された前記構造化文書を破棄して、前記文書受付部に次の前記構造化文書の入力を指示し、
前記出力部は、前記終了条件決定部が前記肯定出力を出力する場合は、処理中の前記構造化文書を出力し、
前記クエリ要素は、前記状態機械に含まれる特定の状態遷移を有限回遷移したら値を確定させるというクエリ要素、又は指定された要素の値が条件を満たすか否かを判定するクエリ要素のいずれかである
ことを特徴とする文書処理装置。 - 前記構造化文書を定義する文法、及び前記クエリデータの入力を受け付け、前記文法に基づいて前記状態機械を生成するとともに、前記文法、及び前記クエリデータに基づいて前記クエリ要素、及び前記終了条件を生成する文法生成部と
を更に備えることを特徴とする請求項1に記載の文書処理装置。 - 複数の前記終了条件決定部を備え、
前記終了条件決定部は、それぞれ対応する出力先が設定されており、
前記出力部は、前記終了条件決定部が前記終了条件を満たして肯定出力を出力した場合に、肯定出力を出力した前記終了条件決定部に対応する前記出力先に対して、前記構造化文書を出力する
ことを特徴とする請求項1または2に記載の文書処理装置。 - 構造化文書を定義する文法から生成される状態機械を記憶する状態機械記憶部と、
処理中のバイナリー化された構造化文書を記憶する文書記憶部と、
前記構造化文書の入力を受け付け、前記文書記憶部に記憶する文書受付部と、
前記文書記憶部に記憶された前記構造化文書を、前記構造化文書に対応する記憶された前記状態機械にしたがって、状態の遷移を行い、遷移が実行されるごとに、前記文書記憶部に記憶された前記構造化文書の現在状態を更新する状態遷移実行部と、
前記構造化文書に対する条件を指定するクエリデータから条件単位毎に分割されて複数生成されるクエリ要素に対し、入力された前記構造化文書中の注目する値に対応する属性を満たすか否かを判定し、出力値として、条件を満たす旨の肯定出力、条件を満たさない旨の否定出力、及び条件の判定を未だ行うことができない旨を示す待機出力のいずれかを出力し、前記肯定出力、又は前記否定出力が出力されるまでは、前記待機出力を出力するクエリ要素判定部と、
前記クエリ要素判定部が出力する各出力値の条件の組み合わせの論理式により表現され、入力された前記構造化文書が前記クエリデータの条件を満たすか否かを表現する終了条件の出力として、条件を満たす旨の肯定出力、条件を満たさない旨の否定出力、及び条件の判定を未だ行うことができない旨を示す待機出力のいずれかを出力する複数の終了条件決定部と、
前記構造化文書を出力する出力部と、
を備え、
前記状態遷移実行部は、前記終了条件決定部が前記待機出力を出力している間は、前記遷移を実行し、前記終了条件決定部が前記否定出力を出力した場合は、処理中の入力された前記構造化文書を破棄して、前記文書受付部に次の前記構造化文書の入力を指示し、
前記終了条件決定部は、それぞれ対応する出力先が設定されており、
前記出力部は、前記終了条件決定部が前記終了条件を満たして肯定出力を出力した場合に、肯定出力を出力した前記終了条件決定部に対応する前記出力先に対して、処理中の前記構造化文書を出力する
ことを特徴とする文書処理装置。 - コンピュータを、
構造化文書を定義する文法から生成される状態機械を記憶する状態機械記憶部と、
処理中のバイナリー化された構造化文書を記憶する文書記憶部と、
前記構造化文書の入力を受け付け、前記文書記憶部に記憶する文書受付部と、
前記文書記憶部に記憶された前記構造化文書を、前記構造化文書に対応する記憶された前記状態機械にしたがって、状態の遷移を行い、遷移が実行されるごとに、前記文書記憶部に記憶された前記構造化文書の現在状態を更新する状態遷移実行部と、
前記構造化文書に対する条件を指定するクエリデータから条件単位毎に分割されて複数生成されるクエリ要素に対し、入力された前記構造化文書中の注目する値に対応する属性を満たすか否かを判定し、出力値として、条件を満たす旨の肯定出力、条件を満たさない旨の否定出力、及び条件の判定を未だ行うことができない旨を示す待機出力のいずれかを出力し、前記肯定出力、又は前記否定出力が出力されるまでは、前記待機出力を出力するクエリ要素判定部と、
前記クエリ要素判定部が出力する各出力値の条件の組み合わせの論理式により表現され、入力された前記構造化文書が前記クエリデータの条件を満たすか否かを表現する終了条件の出力として、条件を満たす旨の肯定出力、条件を満たさない旨の否定出力、及び条件の判定を未だ行うことができない旨を示す待機出力のいずれかを出力する終了条件決定部と、
前記構造化文書を出力する出力部と、
として機能させるためのプログラムであって、
前記状態遷移実行部は、前記終了条件決定部が前記待機出力を出力している間は、前記遷移を実行し、前記終了条件決定部が前記否定出力を出力した場合は、処理中の入力された前記構造化文書を破棄して、前記文書受付部に次の前記構造化文書の入力を指示し、
前記出力部は、前記終了条件決定部が前記肯定出力を出力する場合は、処理中の前記構造化文書を出力し、
前記クエリ要素は、前記状態機械に含まれる特定の状態遷移を有限回遷移したら値を確定させるというクエリ要素、又は指定された要素の値が条件を満たすか否かを判定するクエリ要素のいずれかである
ことを特徴とするプログラム。 - コンピュータを、
構造化文書を定義する文法から生成される状態機械を記憶する状態機械記憶部と、
処理中のバイナリー化された構造化文書を記憶する文書記憶部と、
前記構造化文書の入力を受け付け、前記文書記憶部に記憶する文書受付部と、
前記文書記憶部に記憶された前記構造化文書を、前記構造化文書に対応する記憶された前記状態機械にしたがって、状態の遷移を行い、遷移が実行されるごとに、前記文書記憶部に記憶された前記構造化文書の現在状態を更新する状態遷移実行部と、
前記構造化文書に対する条件を指定するクエリデータから条件単位毎に分割されて複数生成されるクエリ要素に対し、入力された前記構造化文書中の注目する値に対応する属性を満たすか否かを判定し、出力値として、条件を満たす旨の肯定出力、条件を満たさない旨の否定出力、及び条件の判定を未だ行うことができない旨を示す待機出力のいずれかを出力し、前記肯定出力、又は前記否定出力が出力されるまでは、前記待機出力を出力するクエリ要素判定部と、
前記クエリ要素判定部が出力する各出力値の条件の組み合わせの論理式により表現され、入力された前記構造化文書が前記クエリデータの条件を満たすか否かを表現する終了条件の出力として、条件を満たす旨の肯定出力、条件を満たさない旨の否定出力、及び条件の判定を未だ行うことができない旨を示す待機出力のいずれかを出力する複数の終了条件決定部と、
前記構造化文書を出力する出力部と、
として機能させるためのプログラムであって、
前記状態遷移実行部は、前記終了条件決定部が前記待機出力を出力している間は、前記遷移を実行し、前記終了条件決定部が前記否定出力を出力した場合は、処理中の入力された前記構造化文書を破棄して、前記文書受付部に次の前記構造化文書の入力を指示し、
前記終了条件決定部は、それぞれ対応する出力先が設定されており、
前記出力部は、前記終了条件決定部が前記終了条件を満たして肯定出力を出力した場合に、肯定出力を出力した前記終了条件決定部に対応する前記出力先に対して、処理中の前記構造化文書を出力する
ことを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012204591A JP5665821B2 (ja) | 2012-09-18 | 2012-09-18 | 文書処理装置、及びプログラム |
US14/027,658 US20140082481A1 (en) | 2012-09-18 | 2013-09-16 | Document processing device and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012204591A JP5665821B2 (ja) | 2012-09-18 | 2012-09-18 | 文書処理装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014059744A JP2014059744A (ja) | 2014-04-03 |
JP5665821B2 true JP5665821B2 (ja) | 2015-02-04 |
Family
ID=50275799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012204591A Expired - Fee Related JP5665821B2 (ja) | 2012-09-18 | 2012-09-18 | 文書処理装置、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20140082481A1 (ja) |
JP (1) | JP5665821B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2605481A1 (de) * | 2011-12-13 | 2013-06-19 | Siemens Aktiengesellschaft | Verfahren und Vorrichtung zum Filtern von Netzwerkverkehr |
US10282400B2 (en) * | 2015-03-05 | 2019-05-07 | Fujitsu Limited | Grammar generation for simple datatypes |
US10311137B2 (en) * | 2015-03-05 | 2019-06-04 | Fujitsu Limited | Grammar generation for augmented datatypes for efficient extensible markup language interchange |
JP2023025969A (ja) | 2021-08-11 | 2023-02-24 | 富士通株式会社 | 情報処理方法、および情報処理プログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9032A (en) * | 1852-06-15 | mooee | ||
IL107657A (en) * | 1993-11-18 | 1997-01-10 | Scitex Corp Ltd | Method for transferring documents |
JP3368883B2 (ja) * | 2000-02-04 | 2003-01-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データ圧縮装置、データベースシステム、データ通信システム、データ圧縮方法、記憶媒体及びプログラム伝送装置 |
US7627589B2 (en) * | 2004-08-10 | 2009-12-01 | Palo Alto Research Center Incorporated | High performance XML storage retrieval system and method |
JP5156205B2 (ja) * | 2006-07-21 | 2013-03-06 | 株式会社ブリヂストン | 航空機用空気入りラジアルタイヤ |
US8024325B2 (en) * | 2008-06-25 | 2011-09-20 | Oracle International Corporation | Estimating the cost of XML operators for binary XML storage |
US8560944B2 (en) * | 2010-04-04 | 2013-10-15 | Hewlett-Packard Development Company, L.P. | Document modeling using concurrent hierarchical state machines |
-
2012
- 2012-09-18 JP JP2012204591A patent/JP5665821B2/ja not_active Expired - Fee Related
-
2013
- 2013-09-16 US US14/027,658 patent/US20140082481A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2014059744A (ja) | 2014-04-03 |
US20140082481A1 (en) | 2014-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI506556B (zh) | 用於編譯正規表達式之方法及裝置 | |
JP3832830B2 (ja) | XPath評価方法、これを用いたXPath評価装置及び情報処理装置 | |
TWI517036B (zh) | 程式化的平行機與電腦實施方法、電腦可讀媒體、非暫態電腦可讀媒體、用於編譯程式之電腦及系統 | |
US9396298B1 (en) | Linear array display | |
JP5665821B2 (ja) | 文書処理装置、及びプログラム | |
KR20140005258A (ko) | 요소 이용을 위한 상태 그룹화 | |
CN108563448B (zh) | 程序文件的编译方法、系统、计算机设备和存储介质 | |
WO2024114655A1 (zh) | 一种规则表达式匹配方法、装置及计算机可读存储介质 | |
CN109783626A (zh) | 问题生成方法、智能问答系统、介质以及计算机系统 | |
US20160342615A1 (en) | Method and device for generating pileup file from compressed genomic data | |
JP6692281B2 (ja) | テストケース生成装置、及びテストケース生成方法 | |
JP2011257817A (ja) | 特許明細書分析装置、及び文章分析装置。 | |
JPWO2013172310A1 (ja) | ルール発見システムと方法と装置並びにプログラム | |
CN113254023B (zh) | 对象读取方法、装置和电子设备 | |
US11977642B2 (en) | Information processing device, information processing method and computer readable medium | |
JP6364332B2 (ja) | 仕様生成方法、仕様生成装置、及びプログラム | |
JP2006277282A (ja) | モデル評価解析システムおよびモデル評価解析プログラム | |
JP6502044B2 (ja) | データ解析装置、データ解析方法、および、プログラム。 | |
JP6802109B2 (ja) | ソフトウェア仕様分析装置、及びソフトウェア仕様分析方法 | |
CN108614691B (zh) | 网络功能的开发方法、系统、计算机设备和存储介质 | |
JP2010186412A (ja) | 文書管理方法及び管理装置 | |
JP2008243075A (ja) | 構造化文書管理装置及び方法 | |
JP2014086048A (ja) | 検証装置、検査方法およびプログラム | |
JP2015022356A (ja) | テストシナリオバリエーション生成装置及び方法及びプログラム | |
JP6453685B2 (ja) | 演算制御装置、演算制御方法及び演算制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140717 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140805 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141209 |
|
LAPS | Cancellation because of no payment of annual fees |