JP6657920B2 - 文書検証支援装置、文書検証支援方法、及び、文書検証支援プログラム - Google Patents
文書検証支援装置、文書検証支援方法、及び、文書検証支援プログラム Download PDFInfo
- Publication number
- JP6657920B2 JP6657920B2 JP2015247531A JP2015247531A JP6657920B2 JP 6657920 B2 JP6657920 B2 JP 6657920B2 JP 2015247531 A JP2015247531 A JP 2015247531A JP 2015247531 A JP2015247531 A JP 2015247531A JP 6657920 B2 JP6657920 B2 JP 6657920B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- information
- division
- granularity
- verification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、本願発明の第1の実施の形態に係る文書検証支援装置10を概念的に示すブロック図である。文書検証支援装置10は、参照文書と検証対象文書との間において、記載内容に関する対応関係を抽出することにより、参照文書に記載された内容と対応関係がある記載が、検証対象文書の中に存在するか否かを、ユーザが検証することを支援する装置である。
図12は、第2の実施形態に係る文書検証支援装置20の構成を概念的に示すブロック図である。
上述した各実施形態において図1、及び、図12に示した各部は、専用のHW(HardWare)(電子回路)によって実現することができる。また、図1及び図12において、少なくとも、下記構成は、ソフトウェアプログラムの機能(処理)単位(ソフトウェアモジュール)と捉えることができる。
・文書入力部11、
・粒度決定部12及び22、
・分割部13及び23、
・記憶部14における記憶制御機能、
・抽出部15及び25。
・CPU(Central_Processing_Unit)901、
・ROM(Read_Only_Memory)902、
・RAM(Random_Access_Memory)903、
・ハードディスク(記憶装置)904、
・外部装置との通信インタフェース905、
・バス906(通信線)、
・CD−ROM(Compact_Disc_Read_Only_Memory)等の記録媒体907に格納されたデータを読み書き可能なリーダライタ908、
・入出力インタフェース909。
11 文書入力部
12 粒度決定部
120 分割粒度別カウント情報
13 分割部
130 参照文書の分割情報
131 文書名情報
132 名詞句情報テーブル
133 検証対象文書の分割情報
134 文書名情報
135 文情報テーブル
14 記憶部
140 言語仕様情報
15 抽出部
150 対応関係情報テーブル
160 参照文書情報
170 検証対象文書情報
180 検証支援情報
20 文書検証支援装置
22 粒度決定部
23 分割部
230 仕様情報
25 抽出部
260 参照文書情報
270 検証対象文書情報
280 検証支援情報
900 情報処理装置
901 CPU
902 ROM
903 RAM
904 ハードディスク(記憶装置)
905 通信インタフェース
906 バス
907 記録媒体
908 リーダライタ
909 入出力インタフェース
Claims (9)
- 参照文書情報が示す参照文書と検証対象文書情報が示す検証対象文書とを分割する際の分割粒度を、前記参照文書及び前記検証対象文書の特性に基づいて、前記参照文書及び前記検証対象文書毎に決定する粒度決定手段と、
前記参照文書及び前記検証対象文書が用いる言語の仕様情報に基づいて、前記参照文書及び前記検証対象文書を、前記粒度決定手段により決定された前記分割粒度によって1以上の要素に分割する分割手段と、
前記分割手段によって前記要素に分割された前記参照文書と前記検証対象文書との間において、対応関係がある前記要素同士を、所定の抽出基準に基づいて抽出し、抽出した結果を検証支援情報として出力する抽出手段と、
を備え、
前記粒度決定手段は、前記分割手段によって分割される前記参照文書の要素の個数と、前記分割手段によって分割される前記検証対象文書の要素の個数とが、最も近い値になるように、前記分割粒度を決定する、
文書検証支援装置。 - 前記粒度決定手段は、前記参照文書及び前記検証対象文書に含まれる階層構造を示す情報を使用することによって、前記分割粒度を決定する、
請求項1に記載の文書検証支援装置。 - 前記粒度決定手段は、前記分割粒度を、文書を構成する、段落、文、節、及び、句を含む単位、あるいは、文字数のうちのいずれかに決定する、
請求項1または2に記載の文書検証支援装置。 - 前記粒度決定手段は、前記参照文書を分割する際の前記分割粒度を、名詞句に決定する、
請求項3に記載の文書検証支援装置。 - 前記抽出手段は、前記分割手段によって分割された前記参照文書の第一の前記要素に含まれる名詞のうち、所定の割合あるいは所定の個数以上の名詞が、前記分割手段によって分割された前記検証対象文書の第二の前記要素にも含まれる場合に、前記参照文書の前記第一の要素と前記検証対象文書の前記第二の要素とを、前記対応関係がある要素同士として抽出する、
請求項1乃至4のいずれか一項に記載の文書検証支援装置。 - 前記抽出手段は、前記参照文書の要素及び前記検証対象文書の要素について、所定の絞り込み基準に基づいて、抽出する対象を絞り込む、
請求項1乃至5のいずれか一項に記載の文書検証支援装置。 - 前記抽出手段は、前記分割手段によって分割された前記参照文書の要素のうち、前記対応関係がある要素同士の一方として抽出しない前記要素が存在する場合、当該要素に関する警告メッセージを、前記検証支援情報に含めて出力する、
請求項1乃至6のいずれか一項に記載の文書検証支援装置。 - 情報処理装置によって、
参照文書情報が示す参照文書と検証対象文書情報が示す検証対象文書とを分割する際の分割粒度を、前記参照文書及び前記検証対象文書の特性に基づいて、前記参照文書及び前記検証対象文書毎に決定し、
前記参照文書及び前記検証対象文書が用いる言語の仕様情報に基づいて、前記参照文書及び前記検証対象文書を、決定された前記分割粒度によって1以上の要素に分割し、
前記要素に分割された前記参照文書と前記検証対象文書との間において、対応関係がある前記要素同士を、所定の抽出基準に基づいて抽出し、抽出した結果を検証支援情報として出力する方法であって、
分割される前記参照文書の要素の個数と、分割される前記検証対象文書の要素の個数とが、最も近い値になるように、前記分割粒度を決定する、
文書検証支援方法。 - 参照文書情報が示す参照文書と検証対象文書情報が示す検証対象文書とを分割する際の分割粒度を、前記参照文書及び前記検証対象文書の特性に基づいて、前記参照文書及び前記検証対象文書毎に決定する粒度決定処理と、
前記参照文書及び前記検証対象文書が用いる言語の仕様情報に基づいて、前記参照文書及び前記検証対象文書を、前記粒度決定処理により決定された前記分割粒度によって1以上の要素に分割する分割処理と、
前記分割処理によって前記要素に分割された前記参照文書と前記検証対象文書との間において、対応関係がある前記要素同士を、所定の抽出基準に基づいて抽出し、抽出した結果を検証支援情報として出力する抽出処理と、
をコンピュータに実行させるためのプログラムであって、
前記粒度決定処理は、前記分割処理によって分割される前記参照文書の要素の個数と、前記分割処理によって分割される前記検証対象文書の要素の個数とが、最も近い値になるように、前記分割粒度を決定する、
文書検証支援プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015247531A JP6657920B2 (ja) | 2015-12-18 | 2015-12-18 | 文書検証支援装置、文書検証支援方法、及び、文書検証支援プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015247531A JP6657920B2 (ja) | 2015-12-18 | 2015-12-18 | 文書検証支援装置、文書検証支援方法、及び、文書検証支援プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017111742A JP2017111742A (ja) | 2017-06-22 |
JP6657920B2 true JP6657920B2 (ja) | 2020-03-04 |
Family
ID=59079703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015247531A Active JP6657920B2 (ja) | 2015-12-18 | 2015-12-18 | 文書検証支援装置、文書検証支援方法、及び、文書検証支援プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6657920B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5423993B2 (ja) * | 2008-12-26 | 2014-02-19 | 日本電気株式会社 | テキスト処理装置、テキスト処理方法、及びプログラム |
KR101384405B1 (ko) * | 2010-01-19 | 2014-04-10 | 후지쯔 가부시끼가이샤 | 해석 방법, 해석 장치 및 해석 프로그램 |
JP2014232505A (ja) * | 2013-05-30 | 2014-12-11 | 株式会社東芝 | 項目間関連生成支援装置 |
-
2015
- 2015-12-18 JP JP2015247531A patent/JP6657920B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017111742A (ja) | 2017-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7478092B2 (en) | Key term extraction | |
AU2016269573B2 (en) | Input entity identification from natural language text information | |
Padró et al. | Freeling 3.0: Towards wider multilinguality | |
Xue et al. | The penn chinese treebank: Phrase structure annotation of a large corpus | |
US10762293B2 (en) | Using parts-of-speech tagging and named entity recognition for spelling correction | |
US9002695B2 (en) | Machine translation device, method of processing data, and program | |
AU2017208219A1 (en) | Generating a domain ontology using word embeddings | |
JP2009534743A (ja) | 非構造化リソースの構文解析方法 | |
JP2007287134A (ja) | 情報抽出装置、及び情報抽出方法 | |
JP2020126493A (ja) | 対訳処理方法および対訳処理プログラム | |
WO2014064803A1 (ja) | 文書処理プログラム、文書処理装置、文書処理システム、文書処理方法 | |
US11074402B1 (en) | Linguistically consistent document annotation | |
JP5564705B2 (ja) | 文構造解析装置、文構造解析方法および文構造解析プログラム | |
US9158748B2 (en) | Correction of quotations copied from electronic documents | |
JP2002117027A (ja) | 感情情報抽出方法および感情情報抽出プログラムの記録媒体 | |
JP5979650B2 (ja) | 用語を適切な粒度で分割する方法、並びに、用語を適切な粒度で分割するためのコンピュータ及びそのコンピュータ・プログラム | |
JP6657920B2 (ja) | 文書検証支援装置、文書検証支援方法、及び、文書検証支援プログラム | |
JP2017151553A (ja) | 機械翻訳装置、機械翻訳方法、及びプログラム | |
Habash et al. | Mada+ tokan manual | |
JP2015095182A (ja) | 文字列処理装置、方法、及びプログラム | |
JP5795302B2 (ja) | 形態素解析装置、方法、及びプログラム | |
JP6677158B2 (ja) | 文書データ処理装置、文書データ処理方法、及び文書データ処理プログラム | |
Gakis et al. | Construction of a Modern Greek grammar checker through Mnemosyne formalism | |
Hardie et al. | Extending corpus annotation of Nepali: advances in tokenisation and lemmatisation | |
KR20240070874A (ko) | 텍스트 데이터에 대한 띄어쓰기 교정 수행 방법 및 텍스트 데이터에 대한 띄어쓰기 교정 수행 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191023 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191029 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200120 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6657920 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |