JP2010182183A - 構造化文書間整合管理装置及びプログラム - Google Patents
構造化文書間整合管理装置及びプログラム Download PDFInfo
- Publication number
- JP2010182183A JP2010182183A JP2009026379A JP2009026379A JP2010182183A JP 2010182183 A JP2010182183 A JP 2010182183A JP 2009026379 A JP2009026379 A JP 2009026379A JP 2009026379 A JP2009026379 A JP 2009026379A JP 2010182183 A JP2010182183 A JP 2010182183A
- Authority
- JP
- Japan
- Prior art keywords
- similar element
- rule information
- document
- structured
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】構造化文書間整合管理装置10は、構造化文書記憶部11に記憶された構造化文書から、類似する内容が記述された要素のパスと類似する内容と類似度とを類似要素組として抽出する類似要素組抽出部31と、比較する類似要素組の組の構造的距離や支持度及び確信度に基づいて、相関関係を有する条件部類似要素組q1と結論部類似要素組q2とが記述された相関ルール情報を生成する相関ルール情報生成部32と、相関ルール情報に基づいて整合箇所指定パスが記述された整合管理ルール情報を生成する整合管理ルール情報生成部33とを備える。
【選択図】 図1
Description
従って、本発明は以上のような手段を講じたことにより、構造化文書記憶手段に記憶された構造化文書から、類似する内容が記述された要素のパスと類似する内容と類似度とを類似要素組として抽出し、比較する類似要素組の組の構造的距離や支持度及び確信度に基づいて、相関関係を有する条件部類似要素組と結論部類似要素組とが記述された相関ルール情報を生成し、相関ルール情報に基づいて整合箇所指定パスが記述された整合管理ルール情報を生成するので、整合管理ルール情報から不整合箇所を特定することで、整合管理する箇所を事前に登録しなくても、複数の構造化文書間の整合性を管理し得る構造化文書間整合管理装置を提供することができる。
(構造化文書間整合管理装置の構成)
図1は本発明の第1の実施形態に係る構造化文書間整合管理装置10の構成を示す模式図である。
次に本実施形態に係る構造化文書間整合管理装置10の動作を説明する。構造化文書間整合管理装置10では、(A)構造化文書から類似要素組を抽出し、(B)類似要素組から相関ルール情報を生成し、(C)相関ルール情報から整合管理ルール情報を生成する。そして、(D)この整合管理ルール情報に基づいて構造化文書集合の中の不整合箇所を検出し、(E)不整合箇所を画面に表示して、ユーザの操作により、構造化文書間の整合性の管理を可能とする。以下、詳細に説明する。
図8は本実施形態に係る類似要素組抽出部31の動作を説明するためのフローチャートである。
図9は本実施形態に係る相関ルール情報生成部32の動作を説明するためのフローチャートである。
図11は本実施形態に係る整合管理ルール情報生成部33の動作を説明するためのフローチャートである。
図12は本実施形態に係る不整合検出部41の動作を説明するためのフローチャートである。
構造化文書記憶部21に記憶された構造化文書間で不整合箇所が検出されると、その不整合箇所が文書管理データ表示部42の画面に表示される。これに対し、ユーザによる文書管理データ入力部43の操作により、構造化文書間の整合性の管理が可能となる。
以上説明したように、本実施形態に係る構造化文書間整合管理装置10によれば、構造化文書記憶部11に記憶された構造化文書から、類似する内容が記述された要素のパスと類似する内容と類似度とを類似要素組として抽出する類似要素組抽出部31と、比較する類似要素組の組の構造的距離や支持度及び確信度に基づいて、相関関係を有する条件部類似要素組q1と結論部類似要素組q2とが記述された相関ルール情報を生成する相関ルール情報生成部32と、相関ルール情報に基づいて整合箇所指定パスが記述された整合管理ルール情報を生成する整合管理ルール情報生成部33とを備えているので、整合管理ルール情報から不整合箇所を特定することで、整合管理する箇所を事前に登録しなくても、複数の構造化文書間の整合性を管理することができる。
なお、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に構成要素を適宜組み合わせてもよい。
Claims (6)
- 構造化文書間の整合性を管理する構造化文書間整合管理装置であって、
予め定義された要素に従って構造化された構造化文書を記憶する構造化文書記憶手段と、
前記構造化文書記憶手段に記憶された構造化文書について、2つの要素毎に比較し、
比較される2つの要素間の内容の類似度を算出し、
前記類似度に基づいて、類似する内容を有する要素の組を抽出し、
抽出された要素の組におけるそれぞれの要素についてパスを抽出し、
前記抽出したパスと前記類似する内容と前記類似度とを類似要素組として抽出する類似要素組抽出手段と、
前記類似要素組抽出手段により抽出された全ての類似要素組のパスを一般化し、
パスを一般化した2組の類似要素組に対し、各要素間の構造的距離に基づいて相関関係を有する類似要素組の組の候補を設定し、
相関関係を有する類似要素組の組の候補から、支持度及び確信度に基づいて、相関関係を有する条件部類似要素組と結論部類似要素組とが記述された相関ルール情報を生成する相関ルール情報生成手段と、
前記類似要素組抽出手段により抽出された全ての類似要素組のうち、前記相関ルール情報に記述された条件部類似要素組の各要素と、一般化したパスが一致する類似要素組を読み出し、
この読み出した類似要素組の内容を、前記結論部類似要素組の各要素における前記条件部類似要素組との対応箇所に、類似度に応じて書き込んで整合箇所指定パスを生成し、
前記整合箇所指定パスを含む構造化文書を前記構造化文書記憶手段から読み出し、該読み出した全ての構造化文書と前記整合箇所指定パスとが関連付けて記述された整合管理ルール情報を生成する整合管理ルール情報生成手段と、
を備えたことを特徴とする構造化文書間整合管理装置。 - 請求項1に記載の構造化文書間整合管理装置において、
前記整合管理ルール情報に記述された全ての構造化文書に対する整合箇所指定パスにより指定される要素の内容に不整合箇所があるか否かを検出する不整合検出手段と、
前記不整合検出手段により前記整合管理ルール情報に記述された構造化文書間の複数の要素の内容に不整合箇所が検出された場合、該不整合箇所の内容を構造化文書毎に表示する不整合箇所表示手段と、
前記不整合箇所の内容の修正を受け付ける修正受付手段と、
前記修正受付手段により前記不整合箇所の内容の修正を受け付けた場合、前記構造化文書記憶手段に記憶された構造化文書の内容を修正する文書修正手段と、
を備えたことを特徴とする構造化文書間整合管理装置。 - 請求項2に記載の構造化文書間整合管理装置において、
前記整合管理ルール情報に対して修正条件情報を記述する手段と、
前記修正条件情報に対応して、前記構造化文書間での不整合の種類と、該不整合の種類に応じた修正方法とが示された不整合パターンを記憶する不整合パターン記憶手段と、
前記不整合検出手段により不整合箇所が検出された場合、前記修正条件情報に対応する修正方法を前記不整合パターン記憶手段から読み出して表示する修正方法表示手段と、
を備えたことを特徴とする構造化文書間整合管理装置。 - 構造化文書間の整合性を管理する構造化文書間整合管理装置に用いられる構造化文書間整合管理プログラムであって、
前記構造化文書間整合管理装置のコンピュータを、
予め定義された要素に従って構造化された複数の構造化文書を記憶する構造化文書記憶手段、
前記構造化文書記憶手段に記憶された構造化文書について、2つの要素毎に比較し、
比較される2つの要素間の内容の類似度を算出し、
前記類似度に基づいて、類似する内容を有する要素の組を抽出し、
抽出された要素の組におけるそれぞれの要素のパスを抽出し、
前記抽出したパスと前記類似する内容と前記類似度とを類似要素組として抽出する類似要素組抽出手段、
前記類似要素組抽出手段により抽出された全ての類似要素組のパスを一般化し、
パスを一般化した2組の類似要素組に対し、各要素間の構造的距離に基づいて相関関係を有する類似要素組の組の候補を設定し、
相関関係を有する類似要素組の組の候補から、支持度及び確信度に基づいて、相関関係を有する条件部類似要素組と結論部類似要素組とが記述された相関ルール情報を生成する相関ルール情報生成手段、
前記類似要素組抽出手段により抽出された全ての類似要素組のうち、前記相関ルール情報に記述された条件部類似要素組の各要素と、一般化したパスが一致する類似要素組を読み出し、
この読み出した類似要素組の内容を、前記結論部類似要素組の各要素における前記条件部類似要素組との対応箇所に、類似度に応じて書き込んで整合箇所指定パスを生成し、
前記整合箇所指定パスを含む構造化文書を前記構造化文書記憶手段から読み出し、該読み出した全ての構造化文書と前記整合箇所指定パスとが関連付けて記述された整合管理ルール情報を生成する整合管理ルール情報生成手段、
として実現させる構造化文書間整合管理プログラム。 - 請求項4に記載の構造化文書間整合管理プログラムにおいて、
前記コンピュータを、
前記整合管理ルール情報に記述された全ての構造化文書に対する整合箇所指定パスにより指定される要素の内容に不整合箇所があるか否かを検出する不整合検出手段、
前記不整合検出手段により前記整合管理ルール情報に記述された構造化文書間の複数の要素の内容に不整合箇所が検出された場合、該不整合箇所の内容を構造化文書毎に表示する不整合箇所表示手段、
前記不整合箇所の内容の修正を受け付ける修正受付手段、
前記修正受付手段により前記不整合箇所の内容の修正を受け付けた場合、前記構造化文書記憶手段に記憶された構造化文書の内容を修正する文書修正手段、
としてさらに実現させる構造化文書間整合管理プログラム。 - 請求項5に記載の構造化文書間整合管理プログラムにおいて、
前記コンピュータを、
前記整合管理ルール情報に対して修正条件情報を記述する手段、
前記修正条件情報に対応して、前記構造化文書間での不整合の種類と、該不整合の種類に応じた修正方法とが示された不整合パターンを記憶する不整合パターン記憶手段、
前記不整合検出手段により不整合箇所が検出された場合、前記修正条件情報に対応する修正方法を前記不整合パターン記憶手段から読み出して表示する修正方法表示手段、
としてさらに実現させる構造化文書間整合管理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009026379A JP4829317B2 (ja) | 2009-02-06 | 2009-02-06 | 構造化文書間整合管理装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009026379A JP4829317B2 (ja) | 2009-02-06 | 2009-02-06 | 構造化文書間整合管理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010182183A true JP2010182183A (ja) | 2010-08-19 |
JP4829317B2 JP4829317B2 (ja) | 2011-12-07 |
Family
ID=42763734
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009026379A Expired - Fee Related JP4829317B2 (ja) | 2009-02-06 | 2009-02-06 | 構造化文書間整合管理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4829317B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012212329A (ja) * | 2011-03-31 | 2012-11-01 | Tottori Univ | テキストデータの冗長性を解析する情報解析装置 |
WO2015087632A1 (ja) * | 2013-12-10 | 2015-06-18 | 株式会社日立製作所 | データ処理方法およびデータ処理サーバ |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0816558A (ja) * | 1994-06-24 | 1996-01-19 | Fujitsu Ltd | 文章作成支援システム |
JP2004029902A (ja) * | 2002-06-21 | 2004-01-29 | Hitachi Ltd | 複数データベースにまたがる項目パターン抽出方法、ネットワークシステム及び処理装置 |
JP2007265335A (ja) * | 2006-03-30 | 2007-10-11 | Nec Corp | Xmlスキーマ編集支援装置及びxmlスキーマ編集支援方法並びにプログラム |
-
2009
- 2009-02-06 JP JP2009026379A patent/JP4829317B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0816558A (ja) * | 1994-06-24 | 1996-01-19 | Fujitsu Ltd | 文章作成支援システム |
JP2004029902A (ja) * | 2002-06-21 | 2004-01-29 | Hitachi Ltd | 複数データベースにまたがる項目パターン抽出方法、ネットワークシステム及び処理装置 |
JP2007265335A (ja) * | 2006-03-30 | 2007-10-11 | Nec Corp | Xmlスキーマ編集支援装置及びxmlスキーマ編集支援方法並びにプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012212329A (ja) * | 2011-03-31 | 2012-11-01 | Tottori Univ | テキストデータの冗長性を解析する情報解析装置 |
WO2015087632A1 (ja) * | 2013-12-10 | 2015-06-18 | 株式会社日立製作所 | データ処理方法およびデータ処理サーバ |
JP2015114743A (ja) * | 2013-12-10 | 2015-06-22 | 株式会社日立製作所 | データ処理方法およびデータ処理サーバ |
Also Published As
Publication number | Publication date |
---|---|
JP4829317B2 (ja) | 2011-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200202072A1 (en) | Natural language processing for extracting conveyance graphs | |
US9092789B2 (en) | Method and system for semantic analysis of unstructured data | |
US11635946B2 (en) | Analyzing objects from a graphical interface for standards verification | |
KR102432104B1 (ko) | 데이터 요소 간의 관계를 결정하기 위한 시스템 및 방법 | |
Dalmaris et al. | A framework for the improvement of knowledge‐intensive business processes | |
US20210149932A1 (en) | Methods and systems for a compliance framework database schema | |
US11106906B2 (en) | Systems and methods for information extraction from text documents with spatial context | |
US8601367B1 (en) | Systems and methods for generating filing documents in a visual presentation context with XBRL barcode authentication | |
JP2008310566A (ja) | ビジネスプロセス作成方法、ビジネスプロセス作成装置、及びビジネスプロセス作成プログラム | |
CN111061833A (zh) | 数据处理方法、装置、电子设备和计算机可读存储介质 | |
US20140019854A1 (en) | Reviewer feedback for document development | |
US20210056110A1 (en) | Automatically migrating computer content | |
Dam et al. | Managing changes in the enterprise architecture modelling context | |
Basoglu et al. | Inline XBRL versus XBRL for SEC reporting | |
US20210174013A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
US20190324767A1 (en) | Decentralized sharing of features in feature management frameworks | |
CN114528008A (zh) | 基于分布式版本控制系统的代码管控方法、设备及介质 | |
US11922230B2 (en) | Natural language processing of API specifications for automatic artifact generation | |
US20210173844A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
JP2021089668A (ja) | 情報処理装置及びプログラム | |
JP4829317B2 (ja) | 構造化文書間整合管理装置及びプログラム | |
US11468228B2 (en) | Content frames for productivity applications | |
JP6336922B2 (ja) | 業務バリエーションに基づく業務影響箇所抽出方法および業務影響箇所抽出装置 | |
US7730105B2 (en) | Time sharing managing apparatus, document creating apparatus, document reading apparatus, time sharing managing method, document creating method, and document reading method | |
US20160373402A1 (en) | Information Management and Notification System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110823 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110915 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140922 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4829317 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |