JP2021056614A - 文書審査支援装置、文書審査支援方法及びコンピュータプログラム - Google Patents
文書審査支援装置、文書審査支援方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2021056614A JP2021056614A JP2019177101A JP2019177101A JP2021056614A JP 2021056614 A JP2021056614 A JP 2021056614A JP 2019177101 A JP2019177101 A JP 2019177101A JP 2019177101 A JP2019177101 A JP 2019177101A JP 2021056614 A JP2021056614 A JP 2021056614A
- Authority
- JP
- Japan
- Prior art keywords
- document
- specified
- unit
- examination
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
(第1の実施形態)
図1は、第1の実施形態における文書審査支援装置10の機能構成を表す概略ブロック図である。
文書審査支援装置10は、文書の審査の支援を行う。ここで、文書とは、例えば、契約書、融資等の申し込み書類や公募案件への応募書類、社内の稟議書等のある程度記載内容が定められていて、かつ、記載形式が定められている文書であればどのような文書であってもよい。以下の説明では、文書として、契約書を例に説明する。文書審査支援装置10が行う文書の審査の支援とは、文書(例えば、契約書)における内容(例えば、条文の内容)、記載すべき事項の有無、記載の誤り等の顧客が文書の確認を行う際のサポートを意味する。文書審査支援装置10は、例えばVMやコンテナ技術で構築されるOS、パーソナルコンピュータ、ノートパソコン、スマートフォン、携帯電話、タブレット端末等の情報処理装置を用いて構成される。
制御部11は、CPU(Central Processing Unit)等のプロセッサやメモリを用いて構成される。制御部11は、プログラムを実行することによって、文書入力部111、文書構造化部112、文書評価部113、画面データ生成部114及び表示部115として機能する。
文書構造化部112は、テキスト化部1121、文書分解部1122、規定種別判定部1123、規定項目判定部1124及び規定箇所抽出部1125で構成される。
テキスト化部1121は、入力された文書に基づいて、入力された文書を必要に応じてテキスト化する。テキスト化部1121は、入力された文書がテキストファイルである場合には、文書をテキスト化しない。一方、テキスト化部1121は、入力された文書がテキストファイルではない場合、文書をテキスト化する。テキストファイルではない場合とは、例えば文書が、画像ファイル(例えば、PDF(Portable Document Format)ファイル)の文書、レイアウト情報や文字飾り情報が含まれているワードプロセッサー文書及びHTML(Hyper Text Markup Language)ファイルの場合である。テキスト化部1121は、入力されたファイルが、レイアウト情報や文字飾り情報が含まれているワードプロセッサー文書の場合にはレイアウト情報や文字飾り情報を除去することによって文書をテキストファイルに変換する。テキスト化部1121は、入力されたファイルが、画像ファイルの場合にはOCR(Optical Character Reader)により文書をテキストファイルに変換する。
文書評価部113は、規定種別判定部1123により判定された規定種別と、規定項目判定部1124により判定された規定項目と、記憶部12に記憶される審査ルールとに基づいて文書を評価する。
画面データ生成部114は、文書評価部113による評価結果と、規定箇所抽出部1125により抽出された規定箇所とに基づいて、文書の審査結果を確認するための画面データ(以下「評価結果画面データ」という。)を生成する。
審査ルール122は、例えば図4及び図5のいずれかに示す構造であり、文書内の規定項目及び規定種別を審査するためのルールである。図4は、第1の実施形態における文書内の規定項目に関する審査ルールの一例を示す図である。また、図5は、第1の実施形態における文書内の規定種別に関する審査ルールの一例を示す図である。図4に示すように、規定項目に関する審査ルール122には各規定項目において「規定値条件」及び「適否」の値が定められている。「規定値条件」は規定項目の適否を判定するための条件である。例えば、規定値条件としては”損害賠償範囲_通常損害”の事例のように個別の規定値を与える場合や、”支払期日_日数”の事例のように値の範囲を与える場合がある。また規定項目”甲”の例のように、規定値で抽出された値になんらかの演算を施して適否を判定することも考えられる。本実施形態では、”甲”で抽出された取引先が、すでに取引先としてデータベースに登録されているか否かを以って判定することを示している。
文書入力部111は、文書を入力する(ステップS101)。例えば、文書入力部111が図7に示す文書を入力したとする。文書入力部111は、入力した文書を文書構造化部112に出力する。文書構造化部112のテキスト化部1121は、入力された文書がテキストファイルであるか否かを判定する(ステップS102)。入力された文書がテキストファイルではない場合(ステップS102−NO)、テキスト化部1121は文書をテキストファイルに変換する(ステップS103)。テキスト化部1121は、テキストファイルに変換した文書を文書分解部1122に出力する。
文書審査支援装置10は、審査の対象である文書を規定種別及び規定項目のいずれか一方に基づいて意味構造に分解して評価するように構成されてもよい。文書審査支援装置10が、規定種別に基づいて意味構造に分解して評価する場合には、文書審査支援装置10は規定項目判定部1124を備えなくてもよい。また、文書審査支援装置10が、規定項目に基づいて意味構造に分解して評価する場合には、文書審査支援装置10は規定種別判定部1123を備えなくてもよい。以下、各パターンの構成について説明する。
第2の実施形態では、文書入力部111が、審査対象となる文書を複数入力する場合の処理について説明する。
図10は、第2の実施形態における文書審査支援装置10aの機能構成を表す概略ブロック図である。文書審査支援装置10aは、制御部11a及び記憶部12aを備える。
制御部11aは、CPU等のプロセッサやメモリを用いて構成される。制御部11aは、プログラムを実行することによって、文書入力部111、文書構造化部112、文書評価部113a、画面データ生成部114及び表示部115として機能する。制御部11aは、文書評価部113に代えて文書評価部113aを備える点で制御部11と構成が異なる。制御部11aは、その他の構成については制御部11と同様である。そのため、文書評価部113aの構成についてのみ説明する。
文書入力部111は、文書を入力する(ステップS101)。例えば、文書入力部111が図7に示す第1文書に加えて、図13に示す第2文書を入力したとする。文書入力部111は、入力した第1文書及び第2文書を文書構造化部112に出力する。文書構造化部112のテキスト化部1121は、入力された第1文書及び第2文書がそれぞれテキストファイルであるか否かを判定する(ステップS202)。入力された第1文書及び第2文書のいずれか又は両方がテキストファイルではない場合(ステップS202−NO)、テキスト化部1121はテキストファイルではない文書をテキストファイルに変換する(ステップS203)。テキスト化部1121は、第1文書及び第2文書を文書分解部1122に出力する。
文書審査支援装置10aは、審査の対象である複数の文書を規定種別及び規定項目のいずれか一方に基づいて意味構造に分解して評価するように構成されてもよい。文書審査支援装置10aが、規定種別に基づいて意味構造に分解して評価する場合には、文書審査支援装置10aは規定項目判定部1124を備えなくてもよい。また、文書審査支援装置10aが、規定項目に基づいて意味構造に分解して評価する場合には、文書審査支援装置10aは規定種別判定部1123を備えなくてもよい。
このように構成される場合、審査ルール122aに登録されていなかった規定種別については文書審査担当者が個別に文書を評価する。これにより、一部の規定種別については人間による評価が行われるが、文書全てを人間が評価するのに比べて、文書審査担当者の労力を低減することができる。
文書審査支援装置10及び10aは、評価結果を他の装置に出力するように構成されてもよい。この場合、文書審査支援装置10及び10aは、出力部をさらに備える。出力部は、評価結果を他の装置に出力する。例えば、出力部は、ネットワークを介して評価結果を他の装置に出力してもよいし、自装置に接続された印刷装置に評価結果を出力してもよい。
本発明の一態様は、審査の対象である文書全体を対象として前記文書に規定されている規定種別又は前記規定種別に基づく規定項目の少なくともいずれか一方を前記条項単位毎に取得する文書構造化部と、取得された前記規定種別又は規定項目の少なくともいずれか一方が、文書に応じて予め定義された審査ルールを満たすか否かに応じて前記文書を評価する文書評価部と、評価結果を出力する出力部と、を備える文書審査支援装置である。
本発明の一態様は、審査の対象である文書全体を対象として前記文書に規定されている規定種別又は前記規定種別に基づく規定項目の少なくともいずれか一方を前記条項単位毎に取得する文書構造化ステップと、取得された前記規定種別又は規定項目の少なくともいずれか一方が、文書に応じて予め定義された審査ルールを満たすか否かに応じて前記文書を評価する文書評価ステップと、評価結果を出力する出力ステップと、を備える文書審査支援方法である。
Claims (9)
- 審査の対象である文書を規定種別及び規定項目のいずれか一方又は両方に基づいて意味構造に分解する文書構造化部と、
分解結果と、文書に応じて予め定義された審査ルールとを照合することによって前記文書を評価する文書評価部と、
評価結果を出力する出力部と、
を備える文書審査支援装置。 - 前記文書構造化部は、前記文書がテキスト形式のファイルでない場合には前記文書をテキスト形式のファイルに変換し、文書全体を対象として前記文書に規定されている規定種別を判定又は文書をある記述単位に分解した後の前記記述単位毎に規定されている規定種別を判定し、
前記文書評価部は、前記文書構造化部の前記規定種別の判定結果が、前記審査ルールを満たすか否かによって前記文書を評価する、請求項1に記載の文書審査支援装置。 - 前記文書構造化部は、前記文書がテキスト形式のファイルでない場合には前記文書をテキスト形式のファイルに変換し、文書全体を対象として前記文書に規定されている規定項目を判定又は文書をある記述単位に分解した後の前記記述単位毎に規定されている規定項目を判定し、
前記文書評価部は、前記文書構造化部の前記規定項目の判定結果が、前記審査ルールを満たすか否かによって前記文書を評価する、請求項1に記載の文書審査支援装置。 - 前記文書構造化部は、前記文書がテキスト形式のファイルでない場合には前記文書をテキスト形式のファイルに変換し、文書全体を対象として前記文書に規定されている規定種別を判定又は文書をある記述単位に分解した後の前記記述単位毎に規定されている規定種別を判定し、前記規定種別毎に文書が規定している規定項目を判定し、前記文書評価部は、前記文書構造化部の前記規定種別の判定結果と、前記規定項目の判定結果のそれぞれが、前記審査ルールを満たすか否かによって前記文書を評価する、請求項1に記載の文書審査支援装置。
- 前記文書構造化部は、前記文書を意味構造に分解するために判定した規定種別及び規定項目のいずれか一方又は両方に関する内容を記述している前記文書内の規定箇所を抽出する、請求項1から4のいずれか一項に記載の文書審査支援装置。
- 前記文書構造化部は、複数の文書それぞれを規定種別及び規定項目のいずれか一方又は両方に基づいて意味構造に分解し、
複数の文書で意味構造が合致する部分を対応付けて表示する表示部をさらに備える、請求項1から5のいずれか一項に記載の文書審査支援装置。 - 前記文書構造化部は、複数の文書それぞれを規定種別及び規定項目のいずれか一方又は両方に基づいて意味構造に分解し、
前記文書評価部は、前記審査ルールと、前記複数の文書それぞれの分解結果の組み合わせとを照合し、前記審査ルールを満たすか否かによって前記文書を評価する、請求項1から6のいずれか一項に記載の文書審査支援装置。 - 審査の対象である文書を規定種別及び規定項目のいずれか一方又は両方に基づいて意味構造に分解する文書構造化ステップと、
分解結果と、文書に応じて予め定義された審査ルールとを照合することによって前記文書を評価する文書評価ステップと、
評価結果を出力する出力ステップと、
を備える文書審査支援方法。 - 審査の対象である文書を規定種別及び規定項目のいずれか一方又は両方に基づいて意味構造に分解する文書構造化ステップと、
分解結果と、文書に応じて予め定義された審査ルールとを照合することによって前記文書を評価する文書評価ステップと、
評価結果を出力する出力ステップと、
をコンピュータに実行させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019177101A JP7037530B2 (ja) | 2019-09-27 | 2019-09-27 | 文書審査支援装置、文書審査支援方法及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019177101A JP7037530B2 (ja) | 2019-09-27 | 2019-09-27 | 文書審査支援装置、文書審査支援方法及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021056614A true JP2021056614A (ja) | 2021-04-08 |
JP7037530B2 JP7037530B2 (ja) | 2022-03-16 |
Family
ID=75270704
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019177101A Active JP7037530B2 (ja) | 2019-09-27 | 2019-09-27 | 文書審査支援装置、文書審査支援方法及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7037530B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7266654B1 (ja) | 2021-10-14 | 2023-04-28 | エヌ・ティ・ティ・アドバンステクノロジ株式会社 | 文書審査支援装置、文書審査支援方法及びコンピュータプログラム |
JP7405287B1 (ja) | 2022-09-15 | 2023-12-26 | 大日本印刷株式会社 | 情報処理装置、コンピュータプログラム及び情報処理方法 |
JP7430219B2 (ja) | 2022-06-21 | 2024-02-09 | エヌ・ティ・ティ・アドバンステクノロジ株式会社 | 文書情報構造化装置、文書情報構造化方法およびプログラム |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003099678A (ja) * | 2001-09-21 | 2003-04-04 | Daiwa Securities Group Inc | 契約情報管理システム、プログラムおよび情報記憶媒体 |
JP2008287303A (ja) * | 2007-05-15 | 2008-11-27 | Hitachi Ltd | 法令順守支援システム |
US20080306894A1 (en) * | 2007-06-11 | 2008-12-11 | Vijay Rajkumar | Computer-implemented methods and systems for identifying and reporting deviations from standards and policies for contracts, agreements and other business documents |
JP2010231743A (ja) * | 2009-03-30 | 2010-10-14 | Ntt Data Corp | 文書審査支援装置、文書審査支援方法およびプログラム |
JP2017134768A (ja) * | 2016-01-29 | 2017-08-03 | 株式会社三井住友銀行 | 紙文書管理システム |
JP2019101539A (ja) * | 2017-11-29 | 2019-06-24 | Nttテクノクロス株式会社 | 契約内容評価装置、契約内容評価方法及びプログラム |
JP2019114264A (ja) * | 2017-12-24 | 2019-07-11 | Gva Tech株式会社 | 法律文書レビュープログラム、法律文書レビュー方法、及び法律文書レビューシステム |
-
2019
- 2019-09-27 JP JP2019177101A patent/JP7037530B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003099678A (ja) * | 2001-09-21 | 2003-04-04 | Daiwa Securities Group Inc | 契約情報管理システム、プログラムおよび情報記憶媒体 |
JP2008287303A (ja) * | 2007-05-15 | 2008-11-27 | Hitachi Ltd | 法令順守支援システム |
US20080306894A1 (en) * | 2007-06-11 | 2008-12-11 | Vijay Rajkumar | Computer-implemented methods and systems for identifying and reporting deviations from standards and policies for contracts, agreements and other business documents |
JP2010231743A (ja) * | 2009-03-30 | 2010-10-14 | Ntt Data Corp | 文書審査支援装置、文書審査支援方法およびプログラム |
JP2017134768A (ja) * | 2016-01-29 | 2017-08-03 | 株式会社三井住友銀行 | 紙文書管理システム |
JP2019101539A (ja) * | 2017-11-29 | 2019-06-24 | Nttテクノクロス株式会社 | 契約内容評価装置、契約内容評価方法及びプログラム |
JP2019114264A (ja) * | 2017-12-24 | 2019-07-11 | Gva Tech株式会社 | 法律文書レビュープログラム、法律文書レビュー方法、及び法律文書レビューシステム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7266654B1 (ja) | 2021-10-14 | 2023-04-28 | エヌ・ティ・ティ・アドバンステクノロジ株式会社 | 文書審査支援装置、文書審査支援方法及びコンピュータプログラム |
JP2023064113A (ja) * | 2021-10-14 | 2023-05-11 | エヌ・ティ・ティ・アドバンステクノロジ株式会社 | 文書審査支援装置、文書審査支援方法及びコンピュータプログラム |
JP7430219B2 (ja) | 2022-06-21 | 2024-02-09 | エヌ・ティ・ティ・アドバンステクノロジ株式会社 | 文書情報構造化装置、文書情報構造化方法およびプログラム |
JP7405287B1 (ja) | 2022-09-15 | 2023-12-26 | 大日本印刷株式会社 | 情報処理装置、コンピュータプログラム及び情報処理方法 |
JP2024042634A (ja) * | 2022-09-15 | 2024-03-28 | 大日本印刷株式会社 | 情報処理装置、コンピュータプログラム及び情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP7037530B2 (ja) | 2022-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210103964A1 (en) | Account manager virtual assistant using machine learning techniques | |
JP7037530B2 (ja) | 文書審査支援装置、文書審査支援方法及びコンピュータプログラム | |
US9892384B2 (en) | Extracting product purchase information from electronic messages | |
US9063978B1 (en) | Apparatuses, methods and systems for a financial transaction tagger | |
US9043355B1 (en) | Apparatuses, methods and systems for a journal entry automator | |
US9454526B1 (en) | Apparatuses, methods and systems for a chart of accounts simplifier | |
JP2022501666A (ja) | 人工知能基盤の法律文書分析システム及び方法 | |
US20210201266A1 (en) | Systems and methods for processing claims | |
US9875486B2 (en) | Extracting product purchase information from electronic messages | |
CN110678858B (zh) | 检索用资料信息存储装置 | |
US20200356725A1 (en) | System and method for automatically tagging customer messages using artificial intelligence models | |
JP7042501B2 (ja) | 法律文書レビュープログラム、法律文書レビュー方法、及び法律文書レビューシステム | |
CN114549241A (zh) | 合同审查方法、装置、系统与计算机可读存储介质 | |
CN114303140A (zh) | 与产品和服务相关的知识产权数据分析 | |
WO2016064679A1 (en) | Extracting product purchase information from electronic messages | |
CN110610003A (zh) | 用于辅助文本标注的方法和系统 | |
JP6917400B2 (ja) | 文書審査支援方法、文書審査支援装置及びコンピュータプログラム | |
WO2016189605A1 (ja) | データ分析に係るシステム、制御方法、制御プログラム、および、その記録媒体 | |
Kirmani et al. | ShortMail: an email summarizer system | |
Pustulka et al. | Text mining innovation for business | |
CN111797608B (zh) | 信用数据核对方法及装置 | |
CN112270223A (zh) | 保单检视方法、装置及计算机可读存储介质 | |
JP7273442B1 (ja) | 情報処理システム、情報処理方法及びプログラム | |
Zhang et al. | A multi agent recommender system that utilises consumer reviews in its recommendations | |
Fernando | Intelligent Document Processing: A Guide For Building RPA Solutions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190927 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210831 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211018 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220304 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7037530 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |