JP2014238629A - Contract analyzing system, program and method - Google Patents

Contract analyzing system, program and method Download PDF

Info

Publication number
JP2014238629A
JP2014238629A JP2013119508A JP2013119508A JP2014238629A JP 2014238629 A JP2014238629 A JP 2014238629A JP 2013119508 A JP2013119508 A JP 2013119508A JP 2013119508 A JP2013119508 A JP 2013119508A JP 2014238629 A JP2014238629 A JP 2014238629A
Authority
JP
Japan
Prior art keywords
clause
document
contract
analysis
legal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013119508A
Other languages
Japanese (ja)
Other versions
JP5383943B1 (en
Inventor
喬明 金子
Takaaki Kaneko
喬明 金子
昌平 上田
Shohei Ueda
昌平 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2013119508A priority Critical patent/JP5383943B1/en
Application granted granted Critical
Publication of JP5383943B1 publication Critical patent/JP5383943B1/en
Publication of JP2014238629A publication Critical patent/JP2014238629A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a technology capable of presenting necessary information according to a content of a contract so that even general users other than law experts can personally recognize risks and problems contained in the contract.SOLUTION: A contract analyzing system 11 performs processes of: generating a document vector for each clause, with respect to multiple clauses included in multiple laws and regulations; comparing document vectors of the clauses with each other and generating a clause group that is formed by uniting multiple clauses having similarity equal to or greater than a prescribed threshold; generating a document vector for each clause group, with respect to each clause group; generating a document vector for each term, with respect to input contract data; comparing the document vector for each term with the document vector for each clause group and specifying each clause of laws included in the most similar clause group as a related clause to the relevant contractual term; and generating an analysis result screen with the related clauses listed for each contractual term.

Description

この発明は契約書分析システム及びプログラムに係り、特に、入力された契約書データに関連する法律の条文や判例を提示したり、注意すべき文言を指摘したりする、契約書チェックの支援技術に関する。   The present invention relates to a contract analysis system and program, and more particularly, to a contract check support technology that presents legal texts and precedents related to input contract data and points out cautionary words. .

法律専門家ではない一般のビジネスパーソンであっても、取引に際して契約書を作成したり、相手方から提示された契約書の内容をチェックしたりする場面に遭遇することがある。
このような場合、弁護士等の専門家に相談するのが理想ではあるが、月額の顧問料を含め比較的高額の報酬を覚悟する必要がある。
また、最近ではネット上で法律専門家による契約書のチェックを受けられるサービスも存在しており、顧問弁護士を抱える場合に比べてリーズナブルな価格で専門的なアドバイスを得ることができるようになってきている。
契約書作成・リーガルチェックサービスインターネットURL:http://www.miraio.com/service/keiyaku/keiyakusho/検索日:2013年4月30日 契約書チェック/作成業務のご案内インターネットURL:http://www.keiyaku-sakusei.net/contractservices.html検索日:2013年4月30日
Even a general business person who is not a legal expert may encounter a situation in which a contract is prepared for a transaction or the contents of the contract presented by the other party are checked.
In such cases, it is ideal to consult a lawyer or other specialist, but it is necessary to prepare for a relatively high remuneration, including a monthly advisor fee.
Recently, there are also services that allow legal specialists to check contracts online, and it has become possible to obtain professional advice at a reasonable price compared to having legal counsel. ing.
Contract creation and legal check service Internet URL: http://www.miraio.com/service/keiyaku/keiyakusho/ Search date: April 30, 2013 Contract Check / Creation Information Internet URL: http://www.keiyaku-sakusei.net/contractservices.htmlSearch Date: April 30, 2013

しかしながら、このようなネット経由のサービスを利用する場合であっても、判断自体は法律専門家によってなされるため、契約案件が生じる度に専門家に対する費用が発生することとなり、企業の規模や案件の重要度によっては、頻繁に利用することが許されない場合も多い。   However, even when using such a service via the Internet, since the judgment itself is made by a legal expert, the cost to the expert will be incurred each time a contract is made. Depending on the degree of importance, there are many cases where frequent use is not permitted.

この発明は、このような現状に鑑みて案出されたものであり、法律にあまり詳しくない一般のユーザであっても、当該契約書が孕む危険性や問題点を自ら認識できるように、契約書の内容に応じて必要な情報を提示可能な技術を提供することを目的としている。   The present invention has been devised in view of such a current situation, so that even a general user who is not familiar with the law can recognize the risks and problems of the contract themselves. The purpose is to provide a technology that can present necessary information according to the contents of the book.

上記の目的を達成するため、請求項1に記載した契約書分析システムは、複数の法令に含まれる複数の法律条文について、条文毎の文書ベクトルを生成する処理と、各条文の文書ベクトル同士を比較し、所定の閾値以上の類似性を有する複数の条文を合体させた条文グループを生成する処理と、各条文グループについて、条文グループ毎の文書ベクトルを生成する処理と、入力された契約書データについて、条項毎の文書ベクトルを生成する処理と、この条項毎の文書ベクトルと、上記条文グループ毎の文書ベクトルとを比較し、類似する条文グループに含まれる各法律条文を、当該契約条項の関連条文と特定する処理と、契約条項毎に関連条文を列記した分析結果画面を生成する処理を実行することを特徴としている。   In order to achieve the above object, the contract analysis system described in claim 1 is configured to generate a document vector for each article and to generate a document vector for each article for a plurality of law articles included in a plurality of laws and regulations. Processing to generate a text group that combines multiple texts having similarities equal to or greater than a predetermined threshold, processing to generate a document vector for each text group for each text group, and input contract data The document vector for each clause is generated, the document vector for each clause is compared with the document vector for each clause group, and each legal clause included in the similar clause group is related to the contract clause. The process is characterized by executing a process for specifying a text and a process for generating an analysis result screen listing related texts for each contract clause.

請求項2に記載した契約書分析システムは、請求項1のシステムであって、さらに、法律条文毎に関連文献を格納しておく関連文献記憶手段を備えており、上記関連条文を特定した後に、当該関連文献記憶手段を参照して、各関連条文に係る関連文献を抽出する処理が実行され、上記分析結果画面において各関連文献が表示されることを特徴としている。   The contract analysis system described in claim 2 is the system of claim 1, further comprising related document storage means for storing related documents for each legal article, and after specifying the related articles Referring to the related document storage means, a process of extracting a related document related to each related clause is executed, and each related document is displayed on the analysis result screen.

請求項3に記載した契約書分析システムは、請求項1または2のシステムであって、さらに、特定の法律用語と注釈情報との対応関係を格納しておく解析ルール記憶手段を備えており、上記契約書データ中に上記法律用語が含まれている場合に、当該法律用語に対応の注釈情報を付加する処理が実行され、上記分析結果画面において各注釈情報が表示されることを特徴としている。   The contract analysis system according to claim 3 is the system according to claim 1 or 2, further comprising an analysis rule storage means for storing a correspondence relationship between a specific legal term and annotation information, When the legal data is included in the contract data, processing for adding annotation information corresponding to the legal data is executed, and each annotation information is displayed on the analysis result screen. .

請求項4に記載した契約書分析プログラムは、コンピュータを、複数の法令に含まれる複数の法律条文について、条文毎の文書ベクトルを生成する手段、各条文の文書ベクトル同士を比較し、所定の閾値以上の類似性を有する複数の条文を合体させた条文グループを生成する手段、各条文グループについて、条文グループ毎の文書ベクトルを生成する手段、入力された契約書データについて、条項毎の文書ベクトルを生成する手段、この条項毎の文書ベクトルと、上記条文グループ毎の文書ベクトルとを比較し、類似する条文グループに含まれる各法律条文を、当該契約条項の関連条文と特定する手段、契約条項毎に関連条文を列記した分析結果画面を生成する手段として機能させることを特徴としている。   The contract analysis program according to claim 4, the computer, means for generating a document vector for each article for a plurality of law articles included in a plurality of laws and regulations, comparing the document vectors of each article, a predetermined threshold Means for generating a group of clauses combining a plurality of clauses having similarities as described above, means for generating a document vector for each clause group for each clause group, and for each entered contract document data, a document vector for each clause. The means for generating, the document vector for each clause, and the document vector for each clause group are compared, and each legal clause included in a similar clause group is identified as the relevant clause of the contract clause, for each contract clause. It is characterized by functioning as a means for generating an analysis result screen listing related clauses.

請求項1に記載した契約書分析システム及び請求項4に記載した契約書分析プログラムによれば、ユーザが契約書データを入力することにより、各契約条項に関連が深い法律条文が自動的に提示されるため、法律に疎いユーザであっても関連条文を事前にチェックすることが可能となる。しかも、関連条文は法律の垣根を越えてグループ単位で提示されるため、各契約条項を特定の法域に囚われることなく、多面的にチェックすることが可能となる。   According to the contract analysis system described in claim 1 and the contract analysis program described in claim 4, when the user inputs the contract data, a legal text closely related to each contract is automatically presented. Therefore, even a user who is not legal can check the related articles in advance. In addition, since related clauses are presented in groups across legal boundaries, each contract clause can be checked in a multifaceted manner without being bound by a specific jurisdiction.

請求項2に記載した契約書分析システムの場合、契約条項毎に判例や学説等の関連文献が表示されるため、ユーザは提示された関連条文について、さらに深い知識を得ることが可能となる。   In the case of the contract analysis system according to the second aspect, since related documents such as precedents and academic theories are displayed for each contract clause, the user can obtain deeper knowledge about the presented related clause.

請求項3に記載した契約書分析システムの場合、契約条項毎に含まれる特定の法律用語について注釈情報が表示されるため、ユーザは契約書が孕んでいる問題点について事前に認識することが可能となる。   In the case of the contract analysis system described in claim 3, since the annotation information is displayed for specific legal terms included in each contract clause, the user can recognize in advance the problems that the contract contains. It becomes.

図1は、この発明に係る法律文書解析システム10を含む契約書分析システム11を示すブロック図である。
この契約書分析システム11は、Webサーバ12とAPサーバ14から構成され、APサーバ14は、法律文書解析部16と、文書ベクトル生成部18と、関連条文特定部20と、分析画面生成部22と、解析ルール記憶部24と、法律条文記憶部26と、関連文献記憶部28とを備えている。
FIG. 1 is a block diagram showing a contract analysis system 11 including a legal document analysis system 10 according to the present invention.
The contract analysis system 11 includes a Web server 12 and an AP server 14. The AP server 14 includes a legal document analysis unit 16, a document vector generation unit 18, a related clause specification unit 20, and an analysis screen generation unit 22. And an analysis rule storage unit 24, a legal text storage unit 26, and a related literature storage unit 28.

上記法律文書解析部16、文書ベクトル生成部18、関連条文特定部20及び分析画面生成部22は、OS及び専用のアプリケーションプログラムに従って動作するAPサーバ14のCPUによって実現される。
また、上記解析ルール記憶部24、法律条文記憶部26及び関連文献記憶部28は、APサーバ14の外部記憶装置内に設けられている。
The legal document analysis unit 16, the document vector generation unit 18, the related clause specification unit 20, and the analysis screen generation unit 22 are realized by the CPU of the AP server 14 that operates according to the OS and a dedicated application program.
The analysis rule storage unit 24, the legal text storage unit 26, and the related document storage unit 28 are provided in the external storage device of the AP server 14.

上記法律条文記憶部26には、主要な法令(民法、商法、会社法、特許法、商標法、著作権法、不正競争防止法、独占禁止法、刑法、民事訴訟法等)における主要な条文や規則のテキストデータが格納されている。   The above-mentioned legal text storage unit 26 contains the main texts in the main laws and regulations (civil law, commercial law, company law, patent law, trademark law, copyright law, unfair competition prevention law, antitrust law, criminal law, civil law law, etc.). And text data of rules are stored.

また、上記関連文献記憶部28には、主要な法令における主要な条文毎に、様々な関連文献情報が格納されている。
図2はその一例を示すものであり、民法709条について、複数のコメント(弁護士等の法律実務家によるワンポイントアドバイス)、判例及び学説が関連文献として紐付けられている様子が描かれている。
各関連文献中には、文献のタイトル、概要、他の関連文献や関連画像、関連動画等とのリンク情報が含まれている。
関連文献の種類としては、上記のコメントや判例、学説に限定されるものではなく、契約文例等であってもよい。
The related document storage unit 28 stores various related document information for each main article in the main laws and regulations.
FIG. 2 shows an example of this, and it shows a state in which multiple comments (one-point advice by lawyers such as lawyers), precedents and doctrines are linked as related literature for Article 709 of the Civil Code. .
Each related document includes link information with a document title, an outline, other related documents, related images, related moving images, and the like.
The types of related documents are not limited to the above comments, precedents, and theories, but may be contract examples.

上記Webサーバ12は、会員ユーザのリクエストに応じて、各種画面(Htmlファイル)を生成・送信する機能を担うものであり、インターネット30を介して多数の会員ユーザ32のクライアント端末34と接続されている。   The Web server 12 is responsible for generating and transmitting various screens (Html files) in response to member user requests, and is connected to the client terminals 34 of many member users 32 via the Internet 30. Yes.

この契約書分析システム11の利用を希望する会員ユーザ32は、まずクライアント端末34からWebサーバ12にアクセスし、契約書分析サービスにログインする。
この結果、Webサーバ12からクライアント端末34に対して、契約書入力画面が送信される。図3(a)は、クライアント端末34のWebブラウザ上に表示された契約書入力画面40を示している。
A member user 32 who wishes to use the contract analysis system 11 first accesses the Web server 12 from the client terminal 34 and logs in to the contract analysis service.
As a result, the contract document input screen is transmitted from the Web server 12 to the client terminal 34. FIG. 3A shows a contract input screen 40 displayed on the Web browser of the client terminal 34.

会員ユーザ32は、この契約書入力画面40に対して、契約書の各条項42をキーボードやコピー&ペーストによって入力し、送信ボタン44をクリックする。
この結果、クライアント端末34からWebサーバ12に契約書データが送信される。
The member user 32 inputs each clause 42 of the contract on the contract input screen 40 using a keyboard or copy and paste, and clicks the send button 44.
As a result, the contract data is transmitted from the client terminal 34 to the Web server 12.

以後、図4のフローチャートに従い、このシステム11における処理手順を説明する。
まず、Webサーバ12からAPサーバ14に渡された契約書データ(テキストデータ)46は、法律文書解析部16において、形態素解析処理に付される(S10)。
ここで「形態素解析」とは、自然言語で記述された文を、意味を有する最小の言語単位である形態素に分解し、それぞれの品詞を同定する処理をいう。
Hereinafter, the processing procedure in the system 11 will be described with reference to the flowchart of FIG.
First, the contract document data (text data) 46 transferred from the Web server 12 to the AP server 14 is subjected to morphological analysis processing in the legal document analysis unit 16 (S10).
Here, “morpheme analysis” refers to a process of decomposing a sentence described in a natural language into morphemes, which are the smallest meaningful language units, and identifying each part of speech.

つぎに法律文書解析部16は、解析ルール記憶部24を参照し、形態素解析された契約書データについて解析ルール適用処理を施す(S12)。
以下において、この解析ルール適用処理について詳述する。
Next, the legal document analysis unit 16 refers to the analysis rule storage unit 24 and applies analysis rule application processing to the contract data subjected to morphological analysis (S12).
Hereinafter, the analysis rule application process will be described in detail.

[1.構文解析における解析ルールの適用処理]
テキストマイニングにおいては、文書を構成する各形態素間の係り受けの関係を特定する構文解析処理が不可欠であり、法律文書解析部16も当然ながらこの構文解析処理を実行する。
この際、法律文書解析部16は、解析ルール記憶部24に格納されたルールに合致する文については、通常の構文解析とは異なる観点から係り受け構造を抽出する特別な処理を実行する。
[1. Analysis rule application processing in syntax analysis]
In text mining, a syntax analysis process that specifies a dependency relationship between each morpheme constituting a document is indispensable, and the legal document analysis unit 16 naturally executes this syntax analysis process.
At this time, the legal document analysis unit 16 executes a special process for extracting a dependency structure from a viewpoint different from normal syntax analysis for a sentence that matches the rules stored in the analysis rule storage unit 24.

(1) 並列関係に関する処理
契約文書中に「A及びB並びにCであるD」という文が存在する場合、一般的な構文解析では「A+B+C=D」というように、各要素が単純にANDで結合された対等の並列関係として解釈され、「AとBとCであるD」という文に変換されてしまう。
これに対し法律文書解析部16は、図5(a)に示すように、「A及びB並びにC」の部分について、「A+B/C」という法律分野に特有のルールに従った正しい構文を抽出することができ、以下の二つの文を生成する。
(i)「AとBであるD」
(ii)「CであるD」
このために、解析ルール記憶部24には以下の解析ルールが規定されている。
■「A及びB並びにC」の接続関係→「A+B/C」
(1) Processing related to parallel relations When there is a sentence “D that is A, B, and C” in the contract document, each element is simply AND in general parsing, such as “A + B + C = D”. It is interpreted as a connected parallel relationship of equality, and is converted into a sentence “D which is A, B, and C”.
On the other hand, as shown in FIG. 5A, the legal document analysis unit 16 extracts the correct syntax according to the rule specific to the legal field of “A + B / C” for “A, B and C”. The following two sentences are generated.
(i) “D that is A and B”
(ii) “D that is C”
For this purpose, the analysis rule storage unit 24 defines the following analysis rules.
■ Connection relationship of “A, B and C” → “A + B / C”

同様に、「A又はB若しくはCであるD」という文についても、一般的な構文解析では「A+B+C=D」と解釈され、「AとBとCであるD」という文に変換されることになる。
これに対し法律文書解析部16は、図5(b)に示すように、「A又はB若しくはC」の部分について、「A/B+C」という正しい構文を抽出することができ、以下の二つの文を生成する。
(i)「AであるD」
(ii)「BとCであるD」
このために、解析ルール記憶部24には以下の解析ルールが規定されている。
■「A又はB若しくはC」の接続関係→「A/B+C」
Similarly, the sentence “D that is A, B, or C” is also interpreted as “A + B + C = D” in general parsing and converted to the sentence “D that is A, B, and C”. become.
On the other hand, as shown in FIG. 5 (b), the legal document analysis unit 16 can extract the correct syntax “A / B + C” for the part “A, B, or C”. Generate a statement.
(i) “D that is A”
(ii) “D that is B and C”
For this purpose, the analysis rule storage unit 24 defines the following analysis rules.
■ Connection relationship of “A or B or C” → “A / B + C”

(2) 例示関係に関する処理
法律文書においては、「その他」の文言と「その他の」の文言とでは異なった意味に解釈される。
例えば、「陸海空軍『その他の』戦力を保持しない。」という文の場合、陸海空軍はその他の戦力の例示に過ぎないことを意味しているのに対し、「賃金、給料『その他』これに準ずる収入があるときは、…」の文においては、これに準ずる収入が賃金や給料と並列関係にあることを意味している。
(2) Processing related to example relations In legal documents, the words “other” and “other” are interpreted differently.
For example, the sentence “Do not hold the land, sea and air force“ other ”” means that the land, sea and air force is only an example of other forces, whereas “wage, salary“ other ”. In the case of “when there is equivalent income,” means that income equivalent to this is in parallel with wages and salaries.

このため法律文書解析部16は、「陸海空軍その他の戦力を保持しない。」という文に基づいて、「戦力(例えば陸海空軍)を保持しない。」のように、文意に沿った形に変換した文を新たに生成し、元の文と置き換える。
また、法律文書解析部16は、「賃金、給料その他これに準ずる収入があるときは、…」という文に基づいて、「(1)賃金があるときは、…」、「(2)給料があるときは、…」、「(3)賃金・給料に準ずる収入があるときは、…」のように、文意を正しく表現するために複数の文を生成し、元の文と置き換える。
For this reason, the legal document analysis unit 16 converts it into a form that conforms to the meaning of the sentence based on the sentence “Do not hold the land, sea, air force and other forces”. A new sentence is generated and replaced with the original sentence.
In addition, the legal document analysis unit 16 based on the sentence “When there is wage, salary or other income equivalent to this…”, “(1) When there is wage…”, “(2) Salary In some cases, like "..." and "(3) When there is income equivalent to wages / salary ...", in order to correctly express the meaning of the sentence, multiple sentences are generated and replaced with the original sentence.

これに対し、一般的な構文解析エンジンを用いた場合、「の」の有無の違いが無視される結果、「その他」と「その他の」は同じ文書構造を表す語として処理されてしまう。このため、「陸海空軍その他の戦力を保持しない。」という文は、そのまま「陸海空軍とその他の戦力を保持しない。」という文として後続処理に投入される。同様に、「賃金、給料その他これに準ずる収入があるときは、…」という文は、「賃金と、給料と、その他これに準ずる収入があるときは、…」という文として後続処理に投入される。   On the other hand, when a general parsing engine is used, the difference in the presence or absence of “no” is ignored. As a result, “other” and “other” are processed as words representing the same document structure. For this reason, the sentence “Do not hold the land, naval and air forces and other forces” is input to the subsequent processing as the sentence “Do not hold the land and naval air forces and other forces”. Similarly, the sentence “When there is wage, salary or other income equivalent to this ...” is put into the subsequent processing as the sentence “When there is wage, salary or other income equivalent to this ...”. The

法律文書解析部16が、上記のような法律実務に即した正しい文を生成することができるように、解析ルール記憶部24には例えば以下のような解析ルールが規定されている。
■「その他の」→直前に位置する語は直後に位置する語の例示→直前に位置する語の先頭に「例えば」を付加し、全体を括弧で囲んだ上で、直後に位置する語の後ろに移動させる。 ■「その他」→直前に位置する語と直後に位置する語とは並列関係→それぞれを単独で用いた文を生成する。
法律文書解析部16は、構文解析処理を行う際にこの解析ルールに従うことにより、図6(a)及び(b)に示すように、正しく各要素間の係り受け構造を導き、新たな文の生成を行うことができる。
For example, the following analysis rules are defined in the analysis rule storage unit 24 so that the legal document analysis unit 16 can generate a correct sentence in accordance with the above-described legal practice.
■ “Other” → The word located immediately before is an example of the word located immediately after. → “For example” is added to the head of the word located immediately before, and the whole word is enclosed in parentheses. Move back. (1) “Other” → Parallel relationship between the word immediately before and the word immediately after → Create a sentence using each of them independently.
The legal document analysis unit 16 follows the analysis rules when performing the syntax analysis process, thereby correctly deriving the dependency structure between the elements as shown in FIGS. 6 (a) and 6 (b), and creating a new sentence. Generation can be performed.

(3) 条件関係に関する例外処理
「場合」と「とき」は、一般には同じ意味に解釈することができるが、法律の分野において同一文中に用いられた場合には、「場合」が「大条件」を表し、「とき」が「小条件」を表すものとして解釈される。
例えば、「当事者の一方が本契約に違反した『場合』において、その違反が30日を経過しても是正されない『とき』は、他方当事者は、本契約を解除することができる」という文の場合、「30日を経過している」という状態のみでは条件に合致せず、大前提として「契約違反」が生じていることが要求される。
(3) Exception handling related to conditional relations Generally, "case" and "time" can be interpreted in the same meaning, but when used in the same sentence in the field of law, "case" ”And“ time ”are interpreted as“ small condition ”.
For example, the sentence “If one of the parties violates this Agreement and the violation is not corrected after 30 days, the other party may terminate this Agreement” In this case, it is required that “30 days have passed” does not meet the condition, and “contract violation” occurs as a major premise.

このため、解析ルール記憶部24には、以下のような解析ルールが規定されている。
■「場合」と「とき」が同一文中に存在している場合→「『場合』の先行語」が大条件となり、「『とき』の先行語」は小条件となる
法律文書解析部16は、構文解析処理を行う際にはこの解析ルールに従い、正しく各要素間の係り受け構造を導くことができる。
For this reason, the analysis rule storage unit 24 defines the following analysis rules.
■ When "Case" and "Time" exist in the same sentence → "Precursor of" Case "" becomes a major condition, and "Precedence of" Case "" becomes a minor condition. When performing the parsing process, it is possible to correctly derive the dependency structure between the elements according to the analysis rule.

[2.注釈情報の付加等による解析ルールの適用処理]
構文解析以外でも、法律文書の評価時には特定の用語について特別な配慮を要するケースが多々ある。
このため法律文書解析部16は、解析ルール記憶部24に格納された解析ルールに合致する用語については、対応の注釈情報を付加したり、特定の文字列に変換する処理を実行する
[2. Application processing of analysis rules by adding annotation information]
In addition to parsing, there are many cases where special consideration is required for specific terms when evaluating legal documents.
For this reason, the legal document analysis unit 16 adds a corresponding annotation information to a term that matches the analysis rule stored in the analysis rule storage unit 24, or executes a process of converting it into a specific character string.

(1) 数値+範囲指定語に関する処理
一般的な構文解析においては、具体的な数値に「以上」、「以下」、「未満」、「を超える」といった「範囲指定語」が付加されている語については、その数値を抽出するに止まり、その指定範囲を正しく抽出することができていない。
しかしながら、法律文書を評価する際にはこの範囲指定が極めて重要となる。
このため、解析ルール記憶部24には、以下のような解析ルールが規定されている。
■「以上」→直前の数値を含む
■「以下」→直前の数値を含む
■「を超える」→直前の数値を含まない
■「未満」→直前の数値を含まない
(1) Processing related to numerical values + range specification words In general syntax analysis, "range specification words" such as "more than", "less than", "less than", and "greater than" are added to specific numerical values. For words, the numerical values are not extracted, and the specified range cannot be extracted correctly.
However, this range designation is extremely important when evaluating legal documents.
For this reason, the analysis rule storage unit 24 defines the following analysis rules.
■ "More" → Includes the previous value ■ "Following" → Includes the previous value ■ "Over" → Does not include the previous value ■ "Less than" → Does not include the previous value

法律文書解析部16はこの解析ルールに従い、以下のように解析対象の文書中に「18歳以上」という語が含まれていた場合、その部分に「18歳を含む」の注釈情報を付与する。
●「…18歳以上の会員ユーザについては、保護者の承諾を要しない。」
<18歳を含む>
In accordance with this analysis rule, the legal document analysis unit 16 assigns annotation information “includes 18 years old” to the part of the document to be analyzed that includes the word “18 years or older” as follows: .
● “… Members over the age of 18 do not require parental consent.”
<Including 18 years old>

あるいは、解析対象の文書中に「18歳未満」という語が含まれていた場合、以下のように法律文書解析部16はその部分に「18歳を含まない」の注釈情報を付与する。
●「…ただし、同居の親族が18歳未満の場合にはこの限りでない。」
<18歳を含まない>
Alternatively, when the word “under the age of 18” is included in the document to be analyzed, the legal document analysis unit 16 adds annotation information “not including the age of 18” to the portion as follows.
● “However, this does not apply if the relative living together is under the age of 18.”
<Excluding 18 years old>

この「数値+範囲指定語」に関する解釈ルールは法律分野に特有のものではなく、常識的な判断と合致するものといえるが、法律上の解釈も一般常識と異ならないということを明確化することに意義が認められる。   Clarify that the interpretation rules for this "number + range specification word" are not specific to the legal field and are consistent with common sense judgment, but the legal interpretation is not different from general common sense. The significance is recognized.

(2) 効力の取消しに関する処理
一般的な構文解析エンジンにおいて、「解除」と「解約」は同じく「取消し」の意味を有する単語として解釈されるが、法律文書中において両者は取消しの効力発生時期に差違が生じる。すなわち、「解除」は契約等の当初に遡って取消しの効力が発生するのに対し、「解約」の場合には解約の時から将来に向かって取消しの効力が発生する。
また、「解除」はその意味内容からして、「はじめからなかったものとみなす」という表現と同義といえる。
(2) Processing related to revocation of effect In a general parsing engine, “cancel” and “cancel” are interpreted as words having the same meaning as “cancel”. Differences occur. In other words, “cancellation” has the effect of cancellation going back to the beginning of the contract, while “cancellation” has the effect of cancellation from the time of cancellation to the future.
In addition, “cancel” can be said to be synonymous with the expression “deemed not to be new” in terms of its meaning.

以上のことを踏まえて、解析ルール記憶部24には次のような解析ルールが規定されている。
■「解除」→「遡って効力喪失」
■「解約」→「将来に向かって効力喪失」
■「はじめからなかったものとみなす」→「=解除」
Based on the above, the analysis rule storage unit 24 defines the following analysis rule.
■ "Release" → "Returning effectiveness"
■ "Cancellation" → "Effectiveness toward the future"
■ “Consider that it was not the beginning” → “= Cancel”

法律文書解析部16はこの解析ルールに従い、解析対象の文書中に「解除」という語が含まれていた場合、その部分に「遡って効力喪失」の注釈情報を付与する。
●「…契約を解除することができる。」
<遡って効力喪失>
In accordance with this analysis rule, the legal document analysis unit 16 assigns annotation information “retroactively lost” to the portion of the analysis target document that includes the word “cancel”.
● “… Can cancel the contract.”
<Retroactive loss of effectiveness>

また、解析対象の文書中に「解約」という語が含まれていた場合、以下のように法律文書解析部16は「将来に向かって効力喪失」の注釈情報を付与する。
●「…甲又は乙が解約の意思表示をしてから3ヶ月以内に…」
<将来に向かって効力喪失>
Further, when the word “cancel” is included in the analysis target document, the legal document analysis unit 16 gives the annotation information “loss of effectiveness toward the future” as follows.
● "... within 3 months after Party A or Party B has indicated the intention to cancel ..."
<Loss of efficacy toward the future>

さらに、解析対象の文書中に「はじめからなかったものとみなす」という表現が含まれていた場合、法律文書解析部16は「解除する」に置換する。   Furthermore, if the analysis target document includes the expression “consider that it was not the beginning”, the legal document analysis unit 16 replaces it with “cancel”.

(3) 緊急表現に関する処理
法律文書中には、「直ちに」、「速やかに」、「遅滞なく」のように時間的な緊急度を表す複数の用語があり、それぞれの示す緊急度には軽重が存在している。
具体的には、「直ちに」が最も緊急度が高く、「速やかに」はそれよりも急迫性が低く、「遅滞なく」の場合には合理的理由の存在によって多少の遅れは許されるニュアンスが含まれている。
(3) Handling of urgent expressions In legal documents, there are multiple terms that indicate temporal urgency such as “immediately”, “promptly”, and “without delay”. Is present.
Specifically, “immediately” is the most urgent, “promptly” is less impulsive, and in the case of “without delay,” there is a nuance that allows some delay due to the existence of a reasonable reason. include.

このため、解析ルール記憶部24には、以下のような解析ルールが規定されている。
■「直ちに」→「緊急度:高」
■「速やかに」→「緊急度:中」
■「遅滞なく」→「緊急度:低」
For this reason, the analysis rule storage unit 24 defines the following analysis rules.
■ "Immediately" → "Urgentness: High"
■ “Promptly” → “Emergency: Medium”
■ “No delay” → “Urgentness: Low”

この解析ルールに従い、法律文書解析部16は次のように解析対象の文書中に「直ちに」という語が含まれていた場合、その部分に「緊急度:高」の注釈情報を付与する。
●「…の場合、甲は乙に対し直ちにその旨の通知を行うものとする。」
<緊急度:高>
In accordance with this analysis rule, if the word “immediately” is included in the document to be analyzed as follows, the legal document analysis unit 16 assigns annotation information of “urgency: high” to that portion.
● “In the case of…, Party A shall immediately notify to that effect”
<Emergency: High>

また、解析対象の文書中に「速やかに」という語が含まれていた場合、法律文書解析部16は以下のように「緊急度:中」の注釈情報を付与する。
●「…速やかに立ち退くことを約する。」
<緊急度:中>
In addition, when the word “promptly” is included in the analysis target document, the legal document analysis unit 16 assigns annotation information of “emergency level: medium” as follows.
● “... I promise to evacuate quickly”
<Emergency: Medium>

さらに、解析対象の文書中に「遅滞なく」という語が含まれていた場合、法律文書解析部16は以下のように「緊急度:低」の注釈情報を付与する。
●「…の場合、甲は乙に遅滞なく連絡しなければならない。」
<緊急度:低>
Further, when the word “without delay” is included in the analysis target document, the legal document analysis unit 16 assigns the annotation information “urgent: low” as follows.
● “In case of…, Party A must contact you without delay.”
<Urgent level: Low>

(4) 禁止表現に関する処理
法律文書においては、同じ禁止を意味する場合であっても、「Aをしてはならない」という表現と、「Aをすることができない」という表現では、禁止の度合いが異なって解釈される。
このため、解析ルール記憶部24には、以下のような解析ルールが規定されている。
■「〜してはならない」→「強い禁止」
■「〜することができない」→「弱い禁止」
(4) Processing related to prohibited expressions In legal documents, even if it means the same prohibition, the expression "Do not do A" and the expression "Cannot do A" indicate the degree of prohibition. Are interpreted differently.
For this reason, the analysis rule storage unit 24 defines the following analysis rules.
■ "Do not do" → "strong prohibition"
■ "I can't do" → "Weak ban"

この解析ルールに従い、法律文書解析部16は、解析対象の文書中に「〜してはならない」という表現が存在した場合、その部分に「強い禁止」の注釈情報を付与する。
●「…甲乙は互いに相手方の営業上の秘密を漏洩してはならない。」
<強い禁止>
In accordance with this analysis rule, the legal document analysis unit 16 assigns “strongly prohibited” annotation information to the portion of the analysis target document that includes “not to be”.
● “... Do not leak trade secrets of the other party to each other.”
<Strong prohibition>

また、解析対象の文書中に「〜することができない」という表現が含まれていた場合、法律文書解析部16は以下のように「弱い禁止」の注釈情報を付与する。
●「…承諾を得た場合を除き、第三者に開示することができない。」
<弱い禁止>
Further, when the expression “cannot be” is included in the analysis target document, the legal document analysis unit 16 assigns “weak prohibition” annotation information as follows.
● “… Cannot be disclosed to a third party unless consent is obtained.”
<Weak ban>

(5) 事業関連用語に関する処理
一般的には「事業」と「営業」は同義と解釈されており、構文解析エンジンにおいても同義語として何れか一方の表現に統一されてしまう。ところが、法律文書において用いられる場合、前者が「一定の目的をもって反復継続して行われる行為の総称」を意味するのに対し、後者が「営利を目的とする事業」を意味するものとして解釈され、両者には明確な差違が認められる。
また、「業として」という表現は、特定の法律分野(例えば特許法)においては「事業として」と同義のものとして理解されている。
(5) Processing related to business-related terms Generally, “business” and “sales” are interpreted as synonyms, and in the parsing engine, they are unified into either one as synonyms. However, when used in legal documents, the former means “a general term for actions that are repeatedly performed for a certain purpose”, whereas the latter is interpreted as meaning “a business for profit”. There is a clear difference between the two.
In addition, the expression “as business” is understood as synonymous with “as business” in a specific legal field (for example, patent law).

以上のことを踏まえて、解析ルール記憶部24には次のような解析ルールが規定されている。
■「事業」≠「営業」
■「業として」→「事業として」
Based on the above, the analysis rule storage unit 24 defines the following analysis rule.
■ “Business” ≠ “Sales”
■ “As a business” → “As a business”

このルールに従い、法律文書解析部16は、解析対象の文書中に「事業」や「営業」の語が含まれていた場合、何れか一方の表現を他方の表現に置き換えることは控え、それぞれの表現を維持する。   In accordance with this rule, the legal document analysis unit 16 refrains from replacing either expression with the other expression if the word “business” or “sales” is included in the document to be analyzed. Maintain expression.

また、解析対象の文書中に「業として」という語が含まれていた場合、法律文書解析部16は次のように「事業として」に置き換える。
●「…甲は特許発明を業として実施した場合の対価について…」

「…甲は特許発明を事業として実施した場合の対価について…」
Further, if the word “as business” is included in the document to be analyzed, the legal document analysis unit 16 replaces it as “business” as follows.
● “... I think about the value of patented invention as a business ...”

“… I think about the compensation when the patented invention is implemented as a business…”

法律文書解析部16において形態素解析、構文解析、注釈情報の付加、文字列変換等の加工処理が施された契約書データは、文書ベクトル生成部18に渡され、契約条項単位で文書ベクトル化される(S14)。
例えば、図7に示すように、契約書中に複数の条項が含まれていた場合、文書ベクトル生成部18は、条項単位で複数の文書ベクトル47を生成する。
The contract document data that has undergone processing such as morphological analysis, syntax analysis, addition of annotation information, and character string conversion in the legal document analysis unit 16 is passed to the document vector generation unit 18 where it is converted into a document vector for each contract clause. (S14).
For example, as shown in FIG. 7, when a contract includes a plurality of clauses, the document vector generation unit 18 generates a plurality of document vectors 47 for each clause.

ここで「文書ベクトル化」とは、各文書に含まれるキーワードの組合せと出現頻度に基づいて文書の特徴をベクトルとして表現する技術であり、既存のベクトル化エンジンに各テキストを投入することにより、算出される。
ただし、文書ベクトル化処理の対象となるのは契約書に元から含まれていたテキストと、法律文書解析部16によって置換された文字列に限定され、法律文書解析部16によって付加された注釈情報は対象外となる。
上記のように、法律文書特有の構文解析が必要な文については、事前に法律文書解析部16によって最適化された文に変換されているため、文書ベクトル化処理に際し文意に沿った正しい文書ベクトルが生成される。
Here, “document vectorization” is a technique for expressing the characteristics of a document as a vector based on the combination of keywords included in each document and the appearance frequency. By inputting each text into an existing vectorization engine, Calculated.
However, the document vectorization process is limited to the text originally included in the contract and the character string replaced by the legal document analysis unit 16, and the annotation information added by the legal document analysis unit 16 Is excluded.
As described above, sentences that require parsing specific to legal documents have been converted into sentences optimized by the legal document analysis unit 16 in advance, so that the correct document in line with the meaning of the sentence in the document vectorization process A vector is generated.

法律文書解析部16は、上記した契約書データ46の解析処理と平行して、法律条文記憶部26に格納された法律条文についても、上記と同様の形態素解析処理(S10)及び解析ルール適用処理(S12)を実行し、解析済みの法律条文データを文書ベクトル生成部18に渡す。   The legal document analysis unit 16 performs the same morphological analysis processing (S10) and analysis rule application processing on the legal text stored in the legal text storage unit 26 in parallel with the analysis processing of the contract data 46 described above. (S12) is executed, and the analyzed legal text data is passed to the document vector generation unit 18.

これを受けた文書ベクトル生成部18は、図7に示すように、まず法律の条文単位で文書ベクトルを生成するベクトル化処理を実行する(S16)。この際、条文が複数の条項を含む場合には、条項単位で文書ベクトルが生成される。   Receiving this, the document vector generation unit 18 first executes a vectorization process for generating a document vector in units of legal provisions as shown in FIG. 7 (S16). At this time, if the text includes a plurality of clauses, a document vector is generated for each clause.

つぎに文書ベクトル生成部18は、条文単位の文書ベクトルを比較し、相互間のなす角が閾値内にあるもの同士を集めて各条文を1文書に合体させるグループ化処理を実行する(S18)。
この際、各法律条文は「民法」や「不正競争防止法」といった法域の垣根を越えて、純粋に記述内容の類似度に応じて集められたグループ化文書48が生成される。
Next, the document vector generation unit 18 compares the document vectors in units of sentences, collects those whose angles between each other are within a threshold value, and executes a grouping process for merging each article into one document (S18). .
At this time, a grouped document 48 that is collected according to the degree of similarity of the description content is generated purely according to the degree of similarity of the description contents, beyond the boundaries of the jurisdictions such as the “civil law” and the “unfair competition prevention law”.

つぎに文書ベクトル生成部18は、各グループ化文書48に対して、再度ベクトル化処理を施す(S20)。この結果、グループ化文書48単位での文書ベクトル49が得られる。
最後に文書ベクトル生成部18は、各グループ化文書48のベクトルデータ49と、各契約条項のベクトルデータ47を関連条文特定部20に渡す。
Next, the document vector generation unit 18 performs the vectorization process again on each grouped document 48 (S20). As a result, a document vector 49 for each grouped document 48 is obtained.
Finally, the document vector generation unit 18 passes the vector data 49 of each grouped document 48 and the vector data 47 of each contract clause to the related clause identification unit 20.

これを受けた関連条文特定部20は、各契約条項のベクトル47と法律条文のグループ化文書48のベクトル49をマッチングし(S22)、相互間のなす角が最も小さくなるグループ化文書48に含まれる各法律条文を、当該契約条項の関連条文として特定する。
図7においては、契約書の第21条に対して、民法709条及び不正競争防止法4条が関連条文として特定された例が示されている。
この関連条文情報50は、分析画面生成部22に渡される。
In response to this, the related clause specifying unit 20 matches each contract clause vector 47 with the vector 49 of the legal clause grouped document 48 (S22), and is included in the grouped document 48 having the smallest angle between them. Each legal article to be identified is identified as a related article of the contract clause.
FIG. 7 shows an example in which the civil law article 709 and the unfair competition prevention law article 4 are specified as related articles with respect to article 21 of the contract.
The related clause information 50 is passed to the analysis screen generation unit 22.

分析画面生成部22は、関連文献記憶部28を参照し、上記関連条文に係る関連文献(コメントや判例、学説等)を抽出する(S24)。
つぎに、分析画面生成部22は契約書の分析画面を生成し(S26)、分析画面データ52をWebサーバ12に渡す。
The analysis screen generating unit 22 refers to the related document storage unit 28, and extracts related documents (comments, precedents, academics, etc.) related to the related articles (S24).
Next, the analysis screen generator 22 generates a contract analysis screen (S26), and passes the analysis screen data 52 to the Web server 12.

この分析画面データ52は、Webサーバ12からクライアント端末34に送信され、Webブラウザ上に表示される。
図3(b)は、Webブラウザ上に表示された契約書分析画面60を示すものであり、契約書中の条項42毎に関連条文62が列記されている。各関連条文62は、契約条項の文書ベクトルとの類似度が高い順に表示される。
The analysis screen data 52 is transmitted from the Web server 12 to the client terminal 34 and displayed on the Web browser.
FIG. 3B shows a contract analysis screen 60 displayed on the Web browser, and related clauses 62 are listed for each clause 42 in the contract. Each related clause 62 is displayed in descending order of similarity to the document vector of the contract clause.

各関連条文62には、それぞれの関連文献の存在を示すボタン(コメントボタン64、判例ボタン66、学説ボタン68)が表示されている。
ここでユーザ32が、例えば不競法第4条の「判例1」のボタン66をクリックすると、同条に関連付けられた判例のタイトル、概要、リンク情報が表示されたポップアップウィンドウ70が画面60上に表示される。
In each related article 62, buttons (comment button 64, case button 66, and doctrine button 68) indicating the existence of each related document are displayed.
Here, when the user 32 clicks, for example, the button 66 of “judicial precedent 1” in Article 4 of the non-compete law, a pop-up window 70 displaying the title, outline and link information of the case associated with the article is displayed on the screen 60. Is displayed.

また、契約条項42の文中に注釈情報が付された文字列が含まれている場合、その存在が明確となるように、下線やハイライト等の強調表示がなされると同時に、注釈情報が明示される。
図においては、契約条項中の「速やかに」に下線が引かれると共に、「<緊急度:中>」の注釈タグ72が表示されている。
Also, if the text of the contract clause 42 contains a character string with annotation information, the underline and highlighting are highlighted and the annotation information is clearly indicated so that its existence is clear. Is done.
In the figure, “promptly” in the contract clause is underlined and an annotation tag 72 of “<emergency: medium>” is displayed.

このように、契約書分析画面60において契約条項42毎に関連条文のリストと、各関連条文に係る関連文献情報が提示され、かつ法律解釈上特に注意すべき文言には注釈タグ72が付加されて注意が喚起されるため、法律にあまり詳しくないユーザ32であっても、問題の所在を確実に認識することが可能となる。   In this way, on the contract analysis screen 60, a list of related clauses for each contract clause 42 and related literature information related to each related clause are presented, and an annotation tag 72 is added to a word that should be particularly noted in legal interpretation. Therefore, even the user 32 who is not familiar with the law can surely recognize the location of the problem.

上記のように、文書ベクトル化処理に先立って、法律文書に対して最適化処理(構文解析の最適化、文字列の変換)が施されているため、正確な文書ベクトルを生成することができ、マッチングの精度を高めることができる。   As described above, the legal document is optimized prior to the document vectorization process (optimization of parsing, character string conversion), so an accurate document vector can be generated. , Matching accuracy can be increased.

また、法律条文のベクトル化に際しては、まず個々の条文単位で文書ベクトル化した後、そのベクトルの類似度に応じて、法律の垣根を越えてグループ化が図られるため、契約条項に関連のある条文を複数の異なる法域から網羅的に抽出することが可能となる。   In addition, when vectorizing legal provisions, documents are first vectorized in units of individual articles, and then grouped across legal boundaries according to the similarity of the vectors. It becomes possible to exhaustively extract the text from multiple different jurisdictions.

上記においては、契約書データ46の解析及びベクトル化と平行して、法律条文の解析、ベクトル化、グループ化及び再ベクトル化が実行されるため、法律改正があった場合にも常に最新のデータに基づいてマッチング処理がなされる利点を有している。   In the above, analysis, vectorization, grouping, and re-vectorization of the legal provisions are executed in parallel with the analysis and vectorization of the contract data 46. There is an advantage that matching processing is performed based on the above.

しかしながら、この発明はこれに限定されるものではない。
すなわち、法律条文については予め解析、ベクトル化、グループ化及び再ベクトル化を実行すると共に、その処理結果を所定の記憶手段に格納しておき、契約書の文書ベクトルとのマッチング処理時に関連条文特定部20がこれを参照するようにシステムを構成することもできる。
この場合、法律文書解析部16及び文書ベクトル生成部18は、何れかの法律について改正が生じたタイミングで、全法律条文の解析、ベクトル化、グループ化及び再ベクトル化を実行することで、データの鮮度を維持する。
However, the present invention is not limited to this.
That is, analysis, vectorization, grouping, and revectorization are executed in advance for the legal text, and the processing results are stored in a predetermined storage means, and the related text is specified at the time of matching processing with the document vector of the contract. The system may be configured so that the unit 20 refers to this.
In this case, the legal document analysis unit 16 and the document vector generation unit 18 perform analysis, vectorization, grouping, and re-vectorization of all the legal provisions at the timing when any law is revised, thereby obtaining data. Maintain the freshness of

また上記においては、各契約条項のベクトル47と法律条文のグループ化文書48のベクトル49とのマッチングに際し、相互間のなす角が最小となる一つのグループ化文書48が類似する条文グループとして特定される例を示したが、この発明はこれに限定されるものではない。
例えば、各契約条項のベクトル47との間のなす角が所定の閾値内に収まるベクトル49を備えた複数のグループ化文書を特定し、それぞれのグループ化文書48に含まれる法律条文を、当該契約条項の関連条文と認定することもできる。
あるいは、各契約条項のベクトル47と各グループ化文書48のベクトル49との間のなす角を小さい順に整列させ、上位N%のグループ化文書48に含まれる法律条文を、当該契約条項の関連条文と認定してもよい。この場合、「N」の値については、事前にユーザが1%刻みで設定しておく。
Also, in the above, when matching the vector 47 of each contract clause with the vector 49 of the legal text grouped document 48, one grouped document 48 that minimizes the angle between them is identified as a similar text group. However, the present invention is not limited to this example.
For example, a plurality of grouped documents having a vector 49 in which an angle between each contract clause vector 47 falls within a predetermined threshold is specified, and the legal text included in each grouped document 48 is changed to the contract. It can also be recognized as the relevant clause of the clause.
Alternatively, the angle between the vector 47 of each contract clause and the vector 49 of each grouped document 48 is aligned in ascending order, and the legal text included in the top N% grouped document 48 is changed to the relevant text of the contract clause. May be certified. In this case, the value of “N” is set in advance by the user in 1% increments.

この発明に係る法律文書解析システムを含む契約書分析システムシステムを示すブロック図である。It is a block diagram which shows the contract analysis system system containing the legal document analysis system which concerns on this invention. 関連文献記憶部に格納されたデータの一例を示す図である。It is a figure which shows an example of the data stored in the related literature memory | storage part. 契約書入力画面及び契約書分析画面を示す図である。It is a figure which shows a contract input screen and a contract analysis screen. このシステムの処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of this system. 並列関係に関する解析ルールの適用結果を示す図である。It is a figure which shows the application result of the analysis rule regarding a parallel relationship. 例示関係に関する解析ルールの適用結果を示す図である。It is a figure which shows the application result of the analysis rule regarding an example relationship. 文書ベクトル化処理及びマッチング処理の概要を示す模式図である。It is a schematic diagram which shows the outline | summary of a document vectorization process and a matching process.

10 法律文書解析システム
11 契約書分析システム
12 Webサーバ
14 APサーバ
16 法律文書解析部
18 文書ベクトル生成部
20 関連条文特定部
22 分析画面生成部
24 解析ルール記憶部
26 法律条文記憶部
28 関連文献記憶部
30 インターネット
32 会員ユーザ
34 クライアント端末
40 契約書入力画面
42 契約条項
44 送信ボタン
47 文書ベクトル
48 グループ化文書
49 グループ単位の文書ベクトル
50 関連条文情報
52 分析画面データ
60 契約書分析画面
62 関連条文
64 コメントボタン
66 判例ボタン
68 学説ボタン
70 ポップアップウィンドウ
72 注釈タグ
10 Legal document analysis system
11 Contract analysis system
12 Web server
14 AP server
16 Legal Document Analysis Department
18 Document vector generator
20 Related Article Identification Department
22 Analysis screen generator
24 Analysis rule storage
26 Legal Text Storage Department
28 Related literature storage
30 Internet
32 member users
34 Client terminal
40 Contract input screen
42 Contract terms
44 Submit button
47 document vector
48 Grouped documents
49 Group unit document vector
50 Related Article Information
52 Analysis screen data
60 Contract analysis screen
62 Related Articles
64 Comment button
66 Legal Button
68 Theory Button
70 pop-up window
72 Annotation tags

この発明は契約書分析システムプログラム及び方法に係り、特に、入力された契約書データに関連する法律の条文や判例を提示したり、注意すべき文言を指摘したりする、契約書チェックの支援技術に関する。 The present invention relates to a contract analysis system , program, and method , and in particular, support for checking a contract that presents legal texts and precedents related to input contract data and points out cautionary words. Regarding technology.

法律専門家ではない一般のビジネスパーソンであっても、取引に際して契約書を作成したり、相手方から提示された契約書の内容をチェックしたりする場面に遭遇することがある。
このような場合、弁護士等の専門家に相談するのが理想ではあるが、月額の顧問料を含め比較的高額の報酬を覚悟する必要がある。
また、最近ではネット上で法律専門家による契約書のチェックを受けられるサービスも存在しており、顧問弁護士を抱える場合に比べてリーズナブルな価格で専門的なアドバイスを得ることができるようになってきている。
契約書作成・リーガルチェックサービスインターネットURL:http://www.miraio.com/service/keiyaku/keiyakusho/検索日:2013年4月30日 契約書チェック/作成業務のご案内インターネットURL:http://www.keiyaku-sakusei.net/contractservices.html検索日:2013年4月30日
Even a general business person who is not a legal expert may encounter a situation in which a contract is prepared for a transaction or the contents of the contract presented by the other party are checked.
In such cases, it is ideal to consult a lawyer or other specialist, but it is necessary to prepare for a relatively high remuneration, including a monthly advisor fee.
Recently, there are also services that allow legal specialists to check contracts online, and it has become possible to obtain professional advice at a reasonable price compared to having legal counsel. ing.
Contract creation and legal check service Internet URL: http://www.miraio.com/service/keiyaku/keiyakusho/ Search date: April 30, 2013 Contract Check / Creation Information Internet URL: http://www.keiyaku-sakusei.net/contractservices.htmlSearch Date: April 30, 2013

しかしながら、このようなネット経由のサービスを利用する場合であっても、判断自体は法律専門家によってなされるため、契約案件が生じる度に専門家に対する費用が発生することとなり、企業の規模や案件の重要度によっては、頻繁に利用することが許されない場合も多い。   However, even when using such a service via the Internet, since the judgment itself is made by a legal expert, the cost to the expert will be incurred each time a contract is made. Depending on the degree of importance, there are many cases where frequent use is not permitted.

この発明は、このような現状に鑑みて案出されたものであり、法律にあまり詳しくない一般のユーザであっても、当該契約書が孕む危険性や問題点を自ら認識できるように、契約書の内容に応じて必要な情報を提示可能な技術を提供することを目的としている。   The present invention has been devised in view of such a current situation, so that even a general user who is not familiar with the law can recognize the risks and problems of the contract themselves. The purpose is to provide a technology that can present necessary information according to the contents of the book.

上記の目的を達成するため、請求項1に記載した契約書分析システムは、複数の法令に含まれる複数の法律条文について、条文毎の文書ベクトルを生成する処理と、各条文の文書ベクトル同士を比較し、所定の閾値以上の類似性を有する複数の条文を合体させた条文グループを生成する処理と、各条文グループについて、条文グループ毎の文書ベクトルを生成する処理と、入力された契約書データについて、条項毎の文書ベクトルを生成する処理と、この条項毎の文書ベクトルと、上記条文グループ毎の文書ベクトルとを比較し、類似する条文グループに含まれる各法律条文を、当該契約条項の関連条文と特定する処理と、契約条項毎に関連条文を列記した分析結果画面を生成する処理を実行することを特徴としている。   In order to achieve the above object, the contract analysis system described in claim 1 is configured to generate a document vector for each article and to generate a document vector for each article for a plurality of law articles included in a plurality of laws and regulations. Processing to generate a text group that combines multiple texts having similarities equal to or greater than a predetermined threshold, processing to generate a document vector for each text group for each text group, and input contract data The document vector for each clause is generated, the document vector for each clause is compared with the document vector for each clause group, and each legal clause included in the similar clause group is related to the contract clause. The process is characterized by executing a process for specifying a text and a process for generating an analysis result screen listing related texts for each contract clause.

請求項2に記載した契約書分析システムは、請求項1のシステムであって、さらに、法律条文毎に関連文献を格納しておく関連文献記憶手段を備えており、上記関連条文を特定した後に、当該関連文献記憶手段を参照して、各関連条文に係る関連文献を抽出する処理が実行され、上記分析結果画面において各関連文献が表示されることを特徴としている。   The contract analysis system described in claim 2 is the system of claim 1, further comprising related document storage means for storing related documents for each legal article, and after specifying the related articles Referring to the related document storage means, a process of extracting a related document related to each related clause is executed, and each related document is displayed on the analysis result screen.

請求項3に記載した契約書分析システムは、請求項1または2のシステムであって、さらに、特定の法律用語と注釈情報との対応関係を格納しておく解析ルール記憶手段を備えており、上記契約書データ中に上記法律用語が含まれている場合に、当該法律用語に対応の注釈情報を付加する処理が実行され、上記分析結果画面において各注釈情報が表示されることを特徴としている。   The contract analysis system according to claim 3 is the system according to claim 1 or 2, further comprising an analysis rule storage means for storing a correspondence relationship between a specific legal term and annotation information, When the legal data is included in the contract data, processing for adding annotation information corresponding to the legal data is executed, and each annotation information is displayed on the analysis result screen. .

請求項4に記載した契約書分析プログラムは、コンピュータを、複数の法令に含まれる複数の法律条文について、条文毎の文書ベクトルを生成する手段、各条文の文書ベクトル同士を比較し、所定の閾値以上の類似性を有する複数の条文を合体させた条文グループを生成する手段、各条文グループについて、条文グループ毎の文書ベクトルを生成する手段、入力された契約書データについて、条項毎の文書ベクトルを生成する手段、この条項毎の文書ベクトルと、上記条文グループ毎の文書ベクトルとを比較し、類似する条文グループに含まれる各法律条文を、当該契約条項の関連条文と特定する手段、契約条項毎に関連条文を列記した分析結果画面を生成する手段として機能させることを特徴としている。   The contract analysis program according to claim 4, the computer, means for generating a document vector for each article for a plurality of law articles included in a plurality of laws and regulations, comparing the document vectors of each article, a predetermined threshold Means for generating a group of clauses combining a plurality of clauses having similarities as described above, means for generating a document vector for each clause group for each clause group, and for each entered contract document data, a document vector for each clause. The means for generating, the document vector for each clause, and the document vector for each clause group are compared, and each legal clause included in a similar clause group is identified as the relevant clause of the contract clause, for each contract clause. It is characterized by functioning as a means for generating an analysis result screen listing related clauses.

請求項5に記載した契約書分析方法は、コンピュータを用いて契約書を分析する方法であって、法律条文記憶部に格納された複数の法令に含まれる複数の法律条文について、条文毎の文書ベクトルを生成する工程と、各条文の文書ベクトル同士を比較し、所定の閾値以上の類似性を有する複数の条文を合体させた条文グループを生成する工程と、各条文グループについて、条文グループ毎の文書ベクトルを生成する工程と、入力された契約書データについて、条項毎の文書ベクトルを生成する工程と、この条項毎の文書ベクトルと、上記条文グループ毎の文書ベクトルとを比較し、類似する条文グループに含まれる各法律条文を、当該契約条項の関連条文と特定する工程と、契約条項毎に関連条文を列記した分析結果画面を生成する工程とからなることを特徴としている。The contract analysis method described in claim 5 is a method of analyzing a contract using a computer, and a plurality of legal texts included in a plurality of laws and regulations stored in the legal text storage unit are documented for each text. A step of generating a vector, a step of comparing document vectors of each clause, a step of generating a clause group in which a plurality of clauses having a similarity equal to or higher than a predetermined threshold are combined, and each clause group, A step of generating a document vector, a step of generating a document vector for each clause of the input contract data, a comparison of the document vector for each clause with the document vector for each of the above clause groups, and a similar clause The process of identifying each legal clause included in the group as the relevant clause of the contract clause, and the step of generating an analysis result screen listing the relevant clause for each contract clause. It is characterized in that it comprises.

請求項1に記載した契約書分析システム請求項4に記載した契約書分析プログラム及び請求項5に記載した契約書分析方法によれば、ユーザが契約書データを入力することにより、各契約条項に関連が深い法律条文が自動的に提示されるため、法律に疎いユーザであっても関連条文を事前にチェックすることが可能となる。しかも、関連条文は法律の垣根を越えてグループ単位で提示されるため、各契約条項を特定の法域に囚われることなく、多面的にチェックすることが可能となる。 Agreement analysis system according to claim 1, according to the contract analytical method described in the contract analysis program and claim 5 and claim 4, when the user inputs the contract data, each contract terms Since a legal article closely related to is automatically presented, even a user who is not familiar with the law can check the related article in advance. In addition, since related clauses are presented in groups across legal boundaries, each contract clause can be checked in a multifaceted manner without being bound by a specific jurisdiction.

請求項2に記載した契約書分析システムの場合、契約条項毎に判例や学説等の関連文献が表示されるため、ユーザは提示された関連条文について、さらに深い知識を得ることが可能となる。   In the case of the contract analysis system according to the second aspect, since related documents such as precedents and academic theories are displayed for each contract clause, the user can obtain deeper knowledge about the presented related clause.

請求項3に記載した契約書分析システムの場合、契約条項毎に含まれる特定の法律用語について注釈情報が表示されるため、ユーザは契約書が孕んでいる問題点について事前に認識することが可能となる。   In the case of the contract analysis system described in claim 3, since the annotation information is displayed for specific legal terms included in each contract clause, the user can recognize in advance the problems that the contract contains. It becomes.

図1は、この発明に係る法律文書解析システム10を含む契約書分析システム11を示すブロック図である。
この契約書分析システム11は、Webサーバ12とAPサーバ14から構成され、APサーバ14は、法律文書解析部16と、文書ベクトル生成部18と、関連条文特定部20と、分析画面生成部22と、解析ルール記憶部24と、法律条文記憶部26と、関連文献記憶部28とを備えている。
FIG. 1 is a block diagram showing a contract analysis system 11 including a legal document analysis system 10 according to the present invention.
The contract analysis system 11 includes a Web server 12 and an AP server 14. The AP server 14 includes a legal document analysis unit 16, a document vector generation unit 18, a related clause specification unit 20, and an analysis screen generation unit 22. And an analysis rule storage unit 24, a legal text storage unit 26, and a related literature storage unit 28.

上記法律文書解析部16、文書ベクトル生成部18、関連条文特定部20及び分析画面生成部22は、OS及び専用のアプリケーションプログラムに従って動作するAPサーバ14のCPUによって実現される。
また、上記解析ルール記憶部24、法律条文記憶部26及び関連文献記憶部28は、APサーバ14の外部記憶装置内に設けられている。
The legal document analysis unit 16, the document vector generation unit 18, the related clause specification unit 20, and the analysis screen generation unit 22 are realized by the CPU of the AP server 14 that operates according to the OS and a dedicated application program.
The analysis rule storage unit 24, the legal text storage unit 26, and the related document storage unit 28 are provided in the external storage device of the AP server 14.

上記法律条文記憶部26には、主要な法令(民法、商法、会社法、特許法、商標法、著作権法、不正競争防止法、独占禁止法、刑法、民事訴訟法等)における主要な条文や規則のテキストデータが格納されている。   The above-mentioned legal text storage section 26 contains the main texts of the main laws and regulations (civil law, commercial law, company law, patent law, trademark law, copyright law, unfair competition prevention law, antitrust law, criminal law, civil law law, etc.). And text data of rules are stored.

また、上記関連文献記憶部28には、主要な法令における主要な条文毎に、様々な関連文献情報が格納されている。
図2はその一例を示すものであり、民法709条について、複数のコメント(弁護士等の法律実務家によるワンポイントアドバイス)、判例及び学説が関連文献として紐付けられている様子が描かれている。
各関連文献中には、文献のタイトル、概要、他の関連文献や関連画像、関連動画等とのリンク情報が含まれている。
関連文献の種類としては、上記のコメントや判例、学説に限定されるものではなく、契約文例等であってもよい。
The related document storage unit 28 stores various related document information for each main article in the main laws and regulations.
FIG. 2 shows an example of this, and it shows a state in which multiple comments (one-point advice by lawyers such as lawyers), precedents and doctrines are linked as related literature for Article 709 of the Civil Code. .
Each related document includes link information with a document title, an outline, other related documents, related images, related moving images, and the like.
The types of related documents are not limited to the above comments, precedents, and theories, but may be contract examples.

上記Webサーバ12は、会員ユーザのリクエストに応じて、各種画面(Htmlファイル)を生成・送信する機能を担うものであり、インターネット30を介して多数の会員ユーザ32のクライアント端末34と接続されている。   The Web server 12 is responsible for generating and transmitting various screens (Html files) in response to member user requests, and is connected to the client terminals 34 of many member users 32 via the Internet 30. Yes.

この契約書分析システム11の利用を希望する会員ユーザ32は、まずクライアント端末34からWebサーバ12にアクセスし、契約書分析サービスにログインする。
この結果、Webサーバ12からクライアント端末34に対して、契約書入力画面が送信される。図3(a)は、クライアント端末34のWebブラウザ上に表示された契約書入力画面40を示している。
A member user 32 who wishes to use the contract analysis system 11 first accesses the Web server 12 from the client terminal 34 and logs in to the contract analysis service.
As a result, the contract document input screen is transmitted from the Web server 12 to the client terminal 34. FIG. 3A shows a contract input screen 40 displayed on the Web browser of the client terminal 34.

会員ユーザ32は、この契約書入力画面40に対して、契約書の各条項42をキーボードやコピー&ペーストによって入力し、送信ボタン44をクリックする。
この結果、クライアント端末34からWebサーバ12に契約書データが送信される。
The member user 32 inputs each clause 42 of the contract on the contract input screen 40 using a keyboard or copy and paste, and clicks the send button 44.
As a result, the contract data is transmitted from the client terminal 34 to the Web server 12.

以後、図4のフローチャートに従い、このシステム11における処理手順を説明する。
まず、Webサーバ12からAPサーバ14に渡された契約書データ(テキストデータ)46は、法律文書解析部16において、形態素解析処理に付される(S10)。
ここで「形態素解析」とは、自然言語で記述された文を、意味を有する最小の言語単位である形態素に分解し、それぞれの品詞を同定する処理をいう。
Hereinafter, the processing procedure in the system 11 will be described with reference to the flowchart of FIG.
First, the contract document data (text data) 46 transferred from the Web server 12 to the AP server 14 is subjected to morphological analysis processing in the legal document analysis unit 16 (S10).
Here, “morpheme analysis” refers to a process of decomposing a sentence described in a natural language into morphemes, which are the smallest meaningful language units, and identifying each part of speech.

つぎに法律文書解析部16は、解析ルール記憶部24を参照し、形態素解析された契約書データについて解析ルール適用処理を施す(S12)。
以下において、この解析ルール適用処理について詳述する。
Next, the legal document analysis unit 16 refers to the analysis rule storage unit 24 and applies analysis rule application processing to the contract data subjected to morphological analysis (S12).
Hereinafter, the analysis rule application process will be described in detail.

[1.構文解析における解析ルールの適用処理]
テキストマイニングにおいては、文書を構成する各形態素間の係り受けの関係を特定する構文解析処理が不可欠であり、法律文書解析部16も当然ながらこの構文解析処理を実行する。
この際、法律文書解析部16は、解析ルール記憶部24に格納されたルールに合致する文については、通常の構文解析とは異なる観点から係り受け構造を抽出する特別な処理を実行する。
[1. Analysis rule application processing in syntax analysis]
In text mining, a syntax analysis process that specifies a dependency relationship between each morpheme constituting a document is indispensable, and the legal document analysis unit 16 naturally executes this syntax analysis process.
At this time, the legal document analysis unit 16 executes a special process for extracting a dependency structure from a viewpoint different from normal syntax analysis for a sentence that matches the rules stored in the analysis rule storage unit 24.

(1) 並列関係に関する処理
契約文書中に「A及びB並びにCであるD」という文が存在する場合、一般的な構文解析では「A+B+C=D」というように、各要素が単純にANDで結合された対等の並列関係として解釈され、「AとBとCであるD」という文に変換されてしまう。
これに対し法律文書解析部16は、図5(a)に示すように、「A及びB並びにC」の部分について、「A+B/C」という法律分野に特有のルールに従った正しい構文を抽出することができ、以下の二つの文を生成する。
(i)「AとBであるD」
(ii)「CであるD」
このために、解析ルール記憶部24には以下の解析ルールが規定されている。
■「A及びB並びにC」の接続関係→「A+B/C」
(1) Processing related to parallel relations When there is a sentence “D that is A, B, and C” in the contract document, each element is simply AND in general parsing, such as “A + B + C = D”. It is interpreted as a connected parallel relationship of equality, and is converted into a sentence “D which is A, B, and C”.
On the other hand, as shown in FIG. 5A, the legal document analysis unit 16 extracts the correct syntax according to the rule specific to the legal field of “A + B / C” for “A, B and C”. The following two sentences are generated.
(i) “D that is A and B”
(ii) “D that is C”
For this purpose, the analysis rule storage unit 24 defines the following analysis rules.
■ Connection relationship of “A, B and C” → “A + B / C”

同様に、「A又はB若しくはCであるD」という文についても、一般的な構文解析では「A+B+C=D」と解釈され、「AとBとCであるD」という文に変換されることになる。
これに対し法律文書解析部16は、図5(b)に示すように、「A又はB若しくはC」の部分について、「A/B+C」という正しい構文を抽出することができ、以下の二つの文を生成する。
(i)「AであるD」
(ii)「BとCであるD」
このために、解析ルール記憶部24には以下の解析ルールが規定されている。
■「A又はB若しくはC」の接続関係→「A/B+C」
Similarly, the sentence “D that is A, B, or C” is also interpreted as “A + B + C = D” in general parsing and converted to the sentence “D that is A, B, and C”. become.
On the other hand, as shown in FIG. 5 (b), the legal document analysis unit 16 can extract the correct syntax “A / B + C” for the part “A, B, or C”. Generate a statement.
(i) “D that is A”
(ii) “D that is B and C”
For this purpose, the analysis rule storage unit 24 defines the following analysis rules.
■ Connection relationship of “A or B or C” → “A / B + C”

(2) 例示関係に関する処理
法律文書においては、「その他」の文言と「その他の」の文言とでは異なった意味に解釈される。
例えば、「陸海空軍『その他の』戦力を保持しない。」という文の場合、陸海空軍はその他の戦力の例示に過ぎないことを意味しているのに対し、「賃金、給料『その他』これに準ずる収入があるときは、…」の文においては、これに準ずる収入が賃金や給料と並列関係にあることを意味している。
(2) Processing related to example relations In legal documents, the words “other” and “other” are interpreted differently.
For example, the sentence “Do not hold the land, sea and air force“ other ”” means that the land, sea and air force is only an example of other forces, whereas “wage, salary“ other ”. In the case of “when there is equivalent income,” means that income equivalent to this is in parallel with wages and salaries.

このため法律文書解析部16は、「陸海空軍その他の戦力を保持しない。」という文に基づいて、「戦力(例えば陸海空軍)を保持しない。」のように、文意に沿った形に変換した文を新たに生成し、元の文と置き換える。
また、法律文書解析部16は、「賃金、給料その他これに準ずる収入があるときは、…」という文に基づいて、「(1)賃金があるときは、…」、「(2)給料があるときは、…」、「(3)賃金・給料に準ずる収入があるときは、…」のように、文意を正しく表現するために複数の文を生成し、元の文と置き換える。
For this reason, the legal document analysis unit 16 converts it into a form that conforms to the meaning of the sentence based on the sentence “Do not hold the land, sea, air force and other forces”. A new sentence is generated and replaced with the original sentence.
In addition, the legal document analysis unit 16 based on the sentence “When there is wage, salary or other income equivalent to this…”, “(1) When there is wage…”, “(2) Salary In some cases, like "..." and "(3) When there is income equivalent to wages / salary ...", in order to correctly express the meaning of the sentence, multiple sentences are generated and replaced with the original sentence.

これに対し、一般的な構文解析エンジンを用いた場合、「の」の有無の違いが無視される結果、「その他」と「その他の」は同じ文書構造を表す語として処理されてしまう。このため、「陸海空軍その他の戦力を保持しない。」という文は、そのまま「陸海空軍とその他の戦力を保持しない。」という文として後続処理に投入される。同様に、「賃金、給料その他これに準ずる収入があるときは、…」という文は、「賃金と、給料と、その他これに準ずる収入があるときは、…」という文として後続処理に投入される。   On the other hand, when a general parsing engine is used, the difference in the presence or absence of “no” is ignored. As a result, “other” and “other” are processed as words representing the same document structure. For this reason, the sentence “Do not hold the land, naval and air forces and other forces” is input to the subsequent processing as the sentence “Do not hold the land and naval air forces and other forces”. Similarly, the sentence “When there is wage, salary or other income equivalent to this ...” is put into the subsequent processing as the sentence “When there is wage, salary or other income equivalent to this ...”. The

法律文書解析部16が、上記のような法律実務に即した正しい文を生成することができるように、解析ルール記憶部24には例えば以下のような解析ルールが規定されている。
■「その他の」→直前に位置する語は直後に位置する語の例示→直前に位置する語の先頭に「例えば」を付加し、全体を括弧で囲んだ上で、直後に位置する語の後ろに移動させる。 ■「その他」→直前に位置する語と直後に位置する語とは並列関係→それぞれを単独で用いた文を生成する。
法律文書解析部16は、構文解析処理を行う際にこの解析ルールに従うことにより、図6(a)及び(b)に示すように、正しく各要素間の係り受け構造を導き、新たな文の生成を行うことができる。
For example, the following analysis rules are defined in the analysis rule storage unit 24 so that the legal document analysis unit 16 can generate a correct sentence in accordance with the above-described legal practice.
■ “Other” → The word located immediately before is an example of the word located immediately after. → “For example” is added to the head of the word located immediately before, and the whole word is enclosed in parentheses. Move back. (1) “Other” → Parallel relationship between the word immediately before and the word immediately after → Create a sentence using each of them independently.
The legal document analysis unit 16 follows the analysis rules when performing the syntax analysis process, thereby correctly deriving the dependency structure between the elements as shown in FIGS. 6 (a) and 6 (b), and creating a new sentence. Generation can be performed.

(3) 条件関係に関する例外処理
「場合」と「とき」は、一般には同じ意味に解釈することができるが、法律の分野において同一文中に用いられた場合には、「場合」が「大条件」を表し、「とき」が「小条件」を表すものとして解釈される。
例えば、「当事者の一方が本契約に違反した『場合』において、その違反が30日を経過しても是正されない『とき』は、他方当事者は、本契約を解除することができる」という文の場合、「30日を経過している」という状態のみでは条件に合致せず、大前提として「契約違反」が生じていることが要求される。
(3) Exception handling related to conditional relations Generally, "case" and "time" can be interpreted in the same meaning, but when used in the same sentence in the field of law, "case" ”And“ time ”are interpreted as“ small condition ”.
For example, the sentence “If one of the parties violates this Agreement and the violation is not corrected after 30 days, the other party may terminate this Agreement” In this case, it is required that “30 days have passed” does not meet the condition, and “contract violation” occurs as a major premise.

このため、解析ルール記憶部24には、以下のような解析ルールが規定されている。
■「場合」と「とき」が同一文中に存在している場合→「『場合』の先行語」が大条件となり、「『とき』の先行語」は小条件となる
法律文書解析部16は、構文解析処理を行う際にはこの解析ルールに従い、正しく各要素間の係り受け構造を導くことができる。
For this reason, the analysis rule storage unit 24 defines the following analysis rules.
■ When "Case" and "Time" exist in the same sentence → "Precursor of" Case "" becomes a major condition, and "Precedence of" Case "" becomes a minor condition. When performing the parsing process, it is possible to correctly derive the dependency structure between the elements according to the analysis rule.

[2.注釈情報の付加等による解析ルールの適用処理]
構文解析以外でも、法律文書の評価時には特定の用語について特別な配慮を要するケースが多々ある。
このため法律文書解析部16は、解析ルール記憶部24に格納された解析ルールに合致する用語については、対応の注釈情報を付加したり、特定の文字列に変換する処理を実行する
[2. Application processing of analysis rules by adding annotation information]
In addition to parsing, there are many cases where special consideration is required for specific terms when evaluating legal documents.
For this reason, the legal document analysis unit 16 adds a corresponding annotation information to a term that matches the analysis rule stored in the analysis rule storage unit 24, or executes a process of converting it into a specific character string.

(1) 数値+範囲指定語に関する処理
一般的な構文解析においては、具体的な数値に「以上」、「以下」、「未満」、「を超える」といった「範囲指定語」が付加されている語については、その数値を抽出するに止まり、その指定範囲を正しく抽出することができていない。
しかしながら、法律文書を評価する際にはこの範囲指定が極めて重要となる。
このため、解析ルール記憶部24には、以下のような解析ルールが規定されている。
■「以上」→直前の数値を含む
■「以下」→直前の数値を含む
■「を超える」→直前の数値を含まない
■「未満」→直前の数値を含まない
(1) Processing related to numerical values + range specification words In general syntax analysis, "range specification words" such as "more than", "less than", "less than", and "greater than" are added to specific numerical values. For words, the numerical values are not extracted, and the specified range cannot be extracted correctly.
However, this range designation is extremely important when evaluating legal documents.
For this reason, the analysis rule storage unit 24 defines the following analysis rules.
■ "More" → Includes the previous value ■ "Following" → Includes the previous value ■ "Over" → Does not include the previous value ■ "Less than" → Does not include the previous value

法律文書解析部16はこの解析ルールに従い、以下のように解析対象の文書中に「18歳以上」という語が含まれていた場合、その部分に「18歳を含む」の注釈情報を付与する。
●「…18歳以上の会員ユーザについては、保護者の承諾を要しない。」
<18歳を含む>
In accordance with this analysis rule, the legal document analysis unit 16 assigns annotation information “includes 18 years old” to the part of the document to be analyzed that includes the word “18 years or older” as follows: .
● “… Members over the age of 18 do not require parental consent.”
<Including 18 years old>

あるいは、解析対象の文書中に「18歳未満」という語が含まれていた場合、以下のように法律文書解析部16はその部分に「18歳を含まない」の注釈情報を付与する。
●「…ただし、同居の親族が18歳未満の場合にはこの限りでない。」
<18歳を含まない>
Alternatively, when the word “under the age of 18” is included in the document to be analyzed, the legal document analysis unit 16 adds annotation information “not including the age of 18” to the portion as follows.
● “However, this does not apply if the relative living together is under the age of 18.”
<Excluding 18 years old>

この「数値+範囲指定語」に関する解釈ルールは法律分野に特有のものではなく、常識的な判断と合致するものといえるが、法律上の解釈も一般常識と異ならないということを明確化することに意義が認められる。   Clarify that the interpretation rules for this "number + range specification word" are not specific to the legal field and are consistent with common sense judgment, but the legal interpretation is not different from general common sense. The significance is recognized.

(2) 効力の取消しに関する処理
一般的な構文解析エンジンにおいて、「解除」と「解約」は同じく「取消し」の意味を有する単語として解釈されるが、法律文書中において両者は取消しの効力発生時期に差違が生じる。すなわち、「解除」は契約等の当初に遡って取消しの効力が発生するのに対し、「解約」の場合には解約の時から将来に向かって取消しの効力が発生する。
また、「解除」はその意味内容からして、「はじめからなかったものとみなす」という表現と同義といえる。
(2) Processing related to revocation of effect In a general parsing engine, “cancel” and “cancel” are interpreted as words having the same meaning as “cancel”. Differences occur. In other words, “cancellation” has the effect of cancellation going back to the beginning of the contract, while “cancellation” has the effect of cancellation from the time of cancellation to the future.
In addition, “cancel” can be said to be synonymous with the expression “deemed not to be new” in terms of its meaning.

以上のことを踏まえて、解析ルール記憶部24には次のような解析ルールが規定されている。
■「解除」→「遡って効力喪失」
■「解約」→「将来に向かって効力喪失」
■「はじめからなかったものとみなす」→「=解除」
Based on the above, the analysis rule storage unit 24 defines the following analysis rule.
■ "Release" → "Returning effectiveness"
■ "Cancellation" → "Effectiveness toward the future"
■ “Consider that it was not the beginning” → “= Cancel”

法律文書解析部16はこの解析ルールに従い、解析対象の文書中に「解除」という語が含まれていた場合、その部分に「遡って効力喪失」の注釈情報を付与する。
●「…契約を解除することができる。」
<遡って効力喪失>
In accordance with this analysis rule, the legal document analysis unit 16 assigns annotation information “retroactively lost” to the portion of the analysis target document that includes the word “cancel”.
● “… Can cancel the contract.”
<Retroactive loss of effectiveness>

また、解析対象の文書中に「解約」という語が含まれていた場合、以下のように法律文書解析部16は「将来に向かって効力喪失」の注釈情報を付与する。
●「…甲又は乙が解約の意思表示をしてから3ヶ月以内に…」
<将来に向かって効力喪失>
Further, when the word “cancel” is included in the analysis target document, the legal document analysis unit 16 gives the annotation information “loss of effectiveness toward the future” as follows.
● "... within 3 months after Party A or Party B has indicated the intention to cancel ..."
<Loss of efficacy toward the future>

さらに、解析対象の文書中に「はじめからなかったものとみなす」という表現が含まれていた場合、法律文書解析部16は「解除する」に置換する。   Furthermore, if the analysis target document includes the expression “consider that it was not the beginning”, the legal document analysis unit 16 replaces it with “cancel”.

(3) 緊急表現に関する処理
法律文書中には、「直ちに」、「速やかに」、「遅滞なく」のように時間的な緊急度を表す複数の用語があり、それぞれの示す緊急度には軽重が存在している。
具体的には、「直ちに」が最も緊急度が高く、「速やかに」はそれよりも急迫性が低く、「遅滞なく」の場合には合理的理由の存在によって多少の遅れは許されるニュアンスが含まれている。
(3) Handling of urgent expressions In legal documents, there are multiple terms that indicate temporal urgency such as “immediately”, “promptly”, and “without delay”. Is present.
Specifically, “immediately” is the most urgent, “promptly” is less impulsive, and in the case of “without delay,” there is a nuance that allows some delay due to the existence of a reasonable reason. include.

このため、解析ルール記憶部24には、以下のような解析ルールが規定されている。
■「直ちに」→「緊急度:高」
■「速やかに」→「緊急度:中」
■「遅滞なく」→「緊急度:低」
For this reason, the analysis rule storage unit 24 defines the following analysis rules.
■ "Immediately" → "Urgentness: High"
■ “Promptly” → “Emergency: Medium”
■ “No delay” → “Urgentness: Low”

この解析ルールに従い、法律文書解析部16は次のように解析対象の文書中に「直ちに」という語が含まれていた場合、その部分に「緊急度:高」の注釈情報を付与する。
●「…の場合、甲は乙に対し直ちにその旨の通知を行うものとする。」
<緊急度:高>
In accordance with this analysis rule, if the word “immediately” is included in the document to be analyzed as follows, the legal document analysis unit 16 assigns annotation information of “urgency: high” to that portion.
● “In the case of…, Party A shall immediately notify to that effect”
<Emergency: High>

また、解析対象の文書中に「速やかに」という語が含まれていた場合、法律文書解析部16は以下のように「緊急度:中」の注釈情報を付与する。
●「…速やかに立ち退くことを約する。」
<緊急度:中>
In addition, when the word “promptly” is included in the analysis target document, the legal document analysis unit 16 assigns annotation information of “emergency level: medium” as follows.
● “... I promise to evacuate quickly”
<Emergency: Medium>

さらに、解析対象の文書中に「遅滞なく」という語が含まれていた場合、法律文書解析部16は以下のように「緊急度:低」の注釈情報を付与する。
●「…の場合、甲は乙に遅滞なく連絡しなければならない。」
<緊急度:低>
Further, when the word “without delay” is included in the analysis target document, the legal document analysis unit 16 assigns the annotation information “urgent: low” as follows.
● “In case of…, Party A must contact you without delay.”
<Urgent level: Low>

(4) 禁止表現に関する処理
法律文書においては、同じ禁止を意味する場合であっても、「Aをしてはならない」という表現と、「Aをすることができない」という表現では、禁止の度合いが異なって解釈される。
このため、解析ルール記憶部24には、以下のような解析ルールが規定されている。
■「〜してはならない」→「強い禁止」
■「〜することができない」→「弱い禁止」
(4) Processing related to prohibited expressions In legal documents, even if it means the same prohibition, the expression "Do not do A" and the expression "Cannot do A" indicate the degree of prohibition. Are interpreted differently.
For this reason, the analysis rule storage unit 24 defines the following analysis rules.
■ "Do not do" → "strong prohibition"
■ "I can't do" → "Weak ban"

この解析ルールに従い、法律文書解析部16は、解析対象の文書中に「〜してはならない」という表現が存在した場合、その部分に「強い禁止」の注釈情報を付与する。
●「…甲乙は互いに相手方の営業上の秘密を漏洩してはならない。」
<強い禁止>
In accordance with this analysis rule, the legal document analysis unit 16 assigns “strongly prohibited” annotation information to the portion of the analysis target document that includes “not to be”.
● “... Do not leak trade secrets of the other party to each other.”
<Strong prohibition>

また、解析対象の文書中に「〜することができない」という表現が含まれていた場合、法律文書解析部16は以下のように「弱い禁止」の注釈情報を付与する。
●「…承諾を得た場合を除き、第三者に開示することができない。」
<弱い禁止>
Further, when the expression “cannot be” is included in the analysis target document, the legal document analysis unit 16 assigns “weak prohibition” annotation information as follows.
● “… Cannot be disclosed to a third party unless consent is obtained.”
<Weak ban>

(5) 事業関連用語に関する処理
一般的には「事業」と「営業」は同義と解釈されており、構文解析エンジンにおいても同義語として何れか一方の表現に統一されてしまう。ところが、法律文書において用いられる場合、前者が「一定の目的をもって反復継続して行われる行為の総称」を意味するのに対し、後者が「営利を目的とする事業」を意味するものとして解釈され、両者には明確な差違が認められる。
また、「業として」という表現は、特定の法律分野(例えば特許法)においては「事業として」と同義のものとして理解されている。
(5) Processing related to business-related terms Generally, “business” and “sales” are interpreted as synonyms, and in the parsing engine, they are unified into either one as synonyms. However, when used in legal documents, the former means “a general term for actions that are repeatedly performed for a certain purpose”, whereas the latter is interpreted as meaning “a business for profit”. There is a clear difference between the two.
In addition, the expression “as business” is understood as synonymous with “as business” in a specific legal field (for example, patent law).

以上のことを踏まえて、解析ルール記憶部24には次のような解析ルールが規定されている。
■「事業」≠「営業」
■「業として」→「事業として」
Based on the above, the analysis rule storage unit 24 defines the following analysis rule.
■ “Business” ≠ “Sales”
■ “As a business” → “As a business”

このルールに従い、法律文書解析部16は、解析対象の文書中に「事業」や「営業」の語が含まれていた場合、何れか一方の表現を他方の表現に置き換えることは控え、それぞれの表現を維持する。   In accordance with this rule, the legal document analysis unit 16 refrains from replacing either expression with the other expression if the word “business” or “sales” is included in the document to be analyzed. Maintain expression.

また、解析対象の文書中に「業として」という語が含まれていた場合、法律文書解析部16は次のように「事業として」に置き換える。
●「…甲は特許発明を業として実施した場合の対価について…」

「…甲は特許発明を事業として実施した場合の対価について…」
Further, if the word “as business” is included in the document to be analyzed, the legal document analysis unit 16 replaces it as “business” as follows.
● “... I think about the value of patented invention as a business ...”

“… I think about the compensation when the patented invention is implemented as a business…”

法律文書解析部16において形態素解析、構文解析、注釈情報の付加、文字列変換等の加工処理が施された契約書データは、文書ベクトル生成部18に渡され、契約条項単位で文書ベクトル化される(S14)。
例えば、図7に示すように、契約書中に複数の条項が含まれていた場合、文書ベクトル生成部18は、条項単位で複数の文書ベクトル47を生成する。
The contract document data that has undergone processing such as morphological analysis, syntax analysis, addition of annotation information, and character string conversion in the legal document analysis unit 16 is passed to the document vector generation unit 18 where it is converted into a document vector for each contract clause. (S14).
For example, as shown in FIG. 7, when a contract includes a plurality of clauses, the document vector generation unit 18 generates a plurality of document vectors 47 for each clause.

ここで「文書ベクトル化」とは、各文書に含まれるキーワードの組合せと出現頻度に基づいて文書の特徴をベクトルとして表現する技術であり、既存のベクトル化エンジンに各テキストを投入することにより、算出される。
ただし、文書ベクトル化処理の対象となるのは契約書に元から含まれていたテキストと、法律文書解析部16によって置換された文字列に限定され、法律文書解析部16によって付加された注釈情報は対象外となる。
上記のように、法律文書特有の構文解析が必要な文については、事前に法律文書解析部16によって最適化された文に変換されているため、文書ベクトル化処理に際し文意に沿った正しい文書ベクトルが生成される。
Here, “document vectorization” is a technique for expressing the characteristics of a document as a vector based on the combination of keywords included in each document and the appearance frequency. By inputting each text into an existing vectorization engine, Calculated.
However, the document vectorization process is limited to the text originally included in the contract and the character string replaced by the legal document analysis unit 16, and the annotation information added by the legal document analysis unit 16 Is excluded.
As described above, sentences that require parsing specific to legal documents have been converted into sentences optimized by the legal document analysis unit 16 in advance, so that the correct document in line with the meaning of the sentence in the document vectorization process A vector is generated.

法律文書解析部16は、上記した契約書データ46の解析処理と平行して、法律条文記憶部26に格納された法律条文についても、上記と同様の形態素解析処理(S10)及び解析ルール適用処理(S12)を実行し、解析済みの法律条文データを文書ベクトル生成部18に渡す。   The legal document analysis unit 16 performs the same morphological analysis processing (S10) and analysis rule application processing on the legal text stored in the legal text storage unit 26 in parallel with the analysis processing of the contract data 46 described above. (S12) is executed, and the analyzed legal text data is passed to the document vector generation unit 18.

これを受けた文書ベクトル生成部18は、図7に示すように、まず法律の条文単位で文書ベクトルを生成するベクトル化処理を実行する(S16)。この際、条文が複数の条項を含む場合には、条項単位で文書ベクトルが生成される。   Receiving this, the document vector generation unit 18 first executes a vectorization process for generating a document vector in units of legal provisions as shown in FIG. 7 (S16). At this time, if the text includes a plurality of clauses, a document vector is generated for each clause.

つぎに文書ベクトル生成部18は、条文単位の文書ベクトルを比較し、相互間のなす角が閾値内にあるもの同士を集めて各条文を1文書に合体させるグループ化処理を実行する(S18)。
この際、各法律条文は「民法」や「不正競争防止法」といった法域の垣根を越えて、純粋に記述内容の類似度に応じて集められたグループ化文書48が生成される。
Next, the document vector generation unit 18 compares the document vectors in units of sentences, collects those whose angles between each other are within a threshold value, and executes a grouping process for merging each article into one document (S18). .
At this time, a grouped document 48 that is collected according to the degree of similarity of the description content is generated purely according to the degree of similarity of the description contents, beyond the boundaries of the jurisdictions such as the “civil law” and the “unfair competition prevention law”.

つぎに文書ベクトル生成部18は、各グループ化文書48に対して、再度ベクトル化処理を施す(S20)。この結果、グループ化文書48単位での文書ベクトル49が得られる。
最後に文書ベクトル生成部18は、各グループ化文書48のベクトルデータ49と、各契約条項のベクトルデータ47を関連条文特定部20に渡す。
Next, the document vector generation unit 18 performs the vectorization process again on each grouped document 48 (S20). As a result, a document vector 49 for each grouped document 48 is obtained.
Finally, the document vector generation unit 18 passes the vector data 49 of each grouped document 48 and the vector data 47 of each contract clause to the related clause identification unit 20.

これを受けた関連条文特定部20は、各契約条項のベクトル47と法律条文のグループ化文書48のベクトル49をマッチングし(S22)、相互間のなす角が最も小さくなるグループ化文書48に含まれる各法律条文を、当該契約条項の関連条文として特定する。
図7においては、契約書の第21条に対して、民法709条及び不正競争防止法4条が関連条文として特定された例が示されている。
この関連条文情報50は、分析画面生成部22に渡される。
In response to this, the related clause specifying unit 20 matches each contract clause vector 47 with the vector 49 of the legal clause grouped document 48 (S22), and is included in the grouped document 48 having the smallest angle between them. Each legal article to be identified is identified as a related article of the contract clause.
FIG. 7 shows an example in which the civil law article 709 and the unfair competition prevention law article 4 are specified as related articles with respect to article 21 of the contract.
The related clause information 50 is passed to the analysis screen generation unit 22.

分析画面生成部22は、関連文献記憶部28を参照し、上記関連条文に係る関連文献(コメントや判例、学説等)を抽出する(S24)。
つぎに、分析画面生成部22は契約書の分析画面を生成し(S26)、分析画面データ52をWebサーバ12に渡す。
The analysis screen generating unit 22 refers to the related document storage unit 28, and extracts related documents (comments, precedents, academics, etc.) related to the related articles (S24).
Next, the analysis screen generator 22 generates a contract analysis screen (S26), and passes the analysis screen data 52 to the Web server 12.

この分析画面データ52は、Webサーバ12からクライアント端末34に送信され、Webブラウザ上に表示される。
図3(b)は、Webブラウザ上に表示された契約書分析画面60を示すものであり、契約書中の条項42毎に関連条文62が列記されている。各関連条文62は、契約条項の文書ベクトルとの類似度が高い順に表示される。
The analysis screen data 52 is transmitted from the Web server 12 to the client terminal 34 and displayed on the Web browser.
FIG. 3B shows a contract analysis screen 60 displayed on the Web browser, and related clauses 62 are listed for each clause 42 in the contract. Each related clause 62 is displayed in descending order of similarity to the document vector of the contract clause.

各関連条文62には、それぞれの関連文献の存在を示すボタン(コメントボタン64、判例ボタン66、学説ボタン68)が表示されている。
ここでユーザ32が、例えば不競法第4条の「判例1」のボタン66をクリックすると、同条に関連付けられた判例のタイトル、概要、リンク情報が表示されたポップアップウィンドウ70が画面60上に表示される。
In each related article 62, buttons (comment button 64, case button 66, and doctrine button 68) indicating the existence of each related document are displayed.
Here, when the user 32 clicks, for example, the button 66 of “judicial precedent 1” in Article 4 of the non-compete law, a pop-up window 70 displaying the title, outline and link information of the case associated with the article is displayed on the screen 60. Is displayed.

また、契約条項42の文中に注釈情報が付された文字列が含まれている場合、その存在が明確となるように、下線やハイライト等の強調表示がなされると同時に、注釈情報が明示される。
図においては、契約条項中の「速やかに」に下線が引かれると共に、「<緊急度:中>」の注釈タグ72が表示されている。
Also, if the text of the contract clause 42 contains a character string with annotation information, the underline and highlighting are highlighted and the annotation information is clearly indicated so that its existence is clear. Is done.
In the figure, “promptly” in the contract clause is underlined and an annotation tag 72 of “<emergency: medium>” is displayed.

このように、契約書分析画面60において契約条項42毎に関連条文のリストと、各関連条文に係る関連文献情報が提示され、かつ法律解釈上特に注意すべき文言には注釈タグ72が付加されて注意が喚起されるため、法律にあまり詳しくないユーザ32であっても、問題の所在を確実に認識することが可能となる。   In this way, on the contract analysis screen 60, a list of related clauses for each contract clause 42 and related literature information related to each related clause are presented, and an annotation tag 72 is added to a word that should be particularly noted in legal interpretation. Therefore, even the user 32 who is not familiar with the law can surely recognize the location of the problem.

上記のように、文書ベクトル化処理に先立って、法律文書に対して最適化処理(構文解析の最適化、文字列の変換)が施されているため、正確な文書ベクトルを生成することができ、マッチングの精度を高めることができる。   As described above, the legal document is optimized prior to the document vectorization process (optimization of parsing, character string conversion), so an accurate document vector can be generated. , Matching accuracy can be increased.

また、法律条文のベクトル化に際しては、まず個々の条文単位で文書ベクトル化した後、そのベクトルの類似度に応じて、法律の垣根を越えてグループ化が図られるため、契約条項に関連のある条文を複数の異なる法域から網羅的に抽出することが可能となる。   In addition, when vectorizing legal provisions, documents are first vectorized in units of individual articles, and then grouped across legal boundaries according to the similarity of the vectors. It becomes possible to exhaustively extract the text from multiple different jurisdictions.

上記においては、契約書データ46の解析及びベクトル化と平行して、法律条文の解析、ベクトル化、グループ化及び再ベクトル化が実行されるため、法律改正があった場合にも常に最新のデータに基づいてマッチング処理がなされる利点を有している。   In the above, analysis, vectorization, grouping, and re-vectorization of the legal provisions are executed in parallel with the analysis and vectorization of the contract data 46. There is an advantage that matching processing is performed based on the above.

しかしながら、この発明はこれに限定されるものではない。
すなわち、法律条文については予め解析、ベクトル化、グループ化及び再ベクトル化を実行すると共に、その処理結果を所定の記憶手段に格納しておき、契約書の文書ベクトルとのマッチング処理時に関連条文特定部20がこれを参照するようにシステムを構成することもできる。
この場合、法律文書解析部16及び文書ベクトル生成部18は、何れかの法律について改正が生じたタイミングで、全法律条文の解析、ベクトル化、グループ化及び再ベクトル化を実行することで、データの鮮度を維持する。
However, the present invention is not limited to this.
That is, analysis, vectorization, grouping, and revectorization are executed in advance for the legal text, and the processing results are stored in a predetermined storage means, and the related text is specified at the time of matching processing with the document vector of the contract. The system may be configured so that the unit 20 refers to this.
In this case, the legal document analysis unit 16 and the document vector generation unit 18 perform analysis, vectorization, grouping, and re-vectorization of all the legal provisions at the timing when any law is revised, thereby obtaining data. Maintain the freshness of

また上記においては、各契約条項のベクトル47と法律条文のグループ化文書48のベクトル49とのマッチングに際し、相互間のなす角が最小となる一つのグループ化文書48が類似する条文グループとして特定される例を示したが、この発明はこれに限定されるものではない。
例えば、各契約条項のベクトル47との間のなす角が所定の閾値内に収まるベクトル49を備えた複数のグループ化文書を特定し、それぞれのグループ化文書48に含まれる法律条文を、当該契約条項の関連条文と認定することもできる。
あるいは、各契約条項のベクトル47と各グループ化文書48のベクトル49との間のなす角を小さい順に整列させ、上位N%のグループ化文書48に含まれる法律条文を、当該契約条項の関連条文と認定してもよい。この場合、「N」の値については、事前にユーザが1%刻みで設定しておく。
Also, in the above, when matching the vector 47 of each contract clause with the vector 49 of the legal text grouped document 48, one grouped document 48 that minimizes the angle between them is identified as a similar text group. However, the present invention is not limited to this example.
For example, a plurality of grouped documents having a vector 49 in which an angle between each contract clause vector 47 falls within a predetermined threshold is specified, and the legal text included in each grouped document 48 is changed to the contract. It can also be recognized as the relevant clause of the clause.
Alternatively, the angle between the vector 47 of each contract clause and the vector 49 of each grouped document 48 is aligned in ascending order, and the legal text included in the top N% grouped document 48 is changed to the relevant text of the contract clause. May be certified. In this case, the value of “N” is set in advance by the user in 1% increments.

この発明に係る法律文書解析システムを含む契約書分析システムシステムを示すブロック図である。It is a block diagram which shows the contract analysis system system containing the legal document analysis system which concerns on this invention. 関連文献記憶部に格納されたデータの一例を示す図である。It is a figure which shows an example of the data stored in the related literature memory | storage part. 契約書入力画面及び契約書分析画面を示す図である。It is a figure which shows a contract input screen and a contract analysis screen. このシステムの処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of this system. 並列関係に関する解析ルールの適用結果を示す図である。It is a figure which shows the application result of the analysis rule regarding a parallel relationship. 例示関係に関する解析ルールの適用結果を示す図である。It is a figure which shows the application result of the analysis rule regarding an example relationship. 文書ベクトル化処理及びマッチング処理の概要を示す模式図である。It is a schematic diagram which shows the outline | summary of a document vectorization process and a matching process.

10 法律文書解析システム
11 契約書分析システム
12 Webサーバ
14 APサーバ
16 法律文書解析部
18 文書ベクトル生成部
20 関連条文特定部
22 分析画面生成部
24 解析ルール記憶部
26 法律条文記憶部
28 関連文献記憶部
30 インターネット
32 会員ユーザ
34 クライアント端末
40 契約書入力画面
42 契約条項
44 送信ボタン
47 文書ベクトル
48 グループ化文書
49 グループ単位の文書ベクトル
50 関連条文情報
52 分析画面データ
60 契約書分析画面
62 関連条文
64 コメントボタン
66 判例ボタン
68 学説ボタン
70 ポップアップウィンドウ
72 注釈タグ
10 Legal document analysis system
11 Contract analysis system
12 Web server
14 AP server
16 Legal Document Analysis Department
18 Document vector generator
20 Related Article Identification Department
22 Analysis screen generator
24 Analysis rule storage
26 Legal Text Storage Department
28 Related literature storage
30 Internet
32 member users
34 Client terminal
40 Contract input screen
42 Contract terms
44 Submit button
47 document vector
48 Grouped documents
49 Group unit document vector
50 Related Article Information
52 Analysis screen data
60 Contract analysis screen
62 Related Articles
64 Comment button
66 Legal Button
68 Theory Button
70 pop-up window
72 Annotation tags

Claims (4)

複数の法令に含まれる複数の法律条文について、条文毎の文書ベクトルを生成する処理と、
各条文の文書ベクトル同士を比較し、所定の閾値以上の類似性を有する複数の条文を合体させた条文グループを生成する処理と、
各条文グループについて、条文グループ毎の文書ベクトルを生成する処理と、
入力された契約書データについて、条項毎の文書ベクトルを生成する処理と、
この条項毎の文書ベクトルと、上記条文グループ毎の文書ベクトルとを比較し、類似する条文グループに含まれる各法律条文を、当該契約条項の関連条文と特定する処理と、
契約条項毎に関連条文を列記した分析結果画面を生成する処理と、
を実行することを特徴とする契約書分析システム。
For a plurality of legal articles included in a plurality of laws and regulations, a process for generating a document vector for each article,
A process of comparing the document vectors of each clause, and generating a clause group in which a plurality of clauses having similarity equal to or greater than a predetermined threshold are combined;
For each article group, a process for generating a document vector for each article group;
A process for generating a document vector for each clause for the entered contract data,
A process of comparing the document vector for each clause with the document vector for each clause group, and identifying each legal clause included in a similar clause group as a related clause in the contract clause;
Processing to generate an analysis result screen listing relevant terms for each contract clause;
A contract analysis system characterized by
法律条文毎に、関連文献を格納しておく関連文献記憶手段を備えており、
上記関連条文を特定した後に、当該関連文献記憶手段を参照して、各関連条文に係る関連文献を抽出する処理が実行され、
上記分析結果画面において各関連文献が表示されることを特徴とする請求項1に記載の契約書分析システム。
For each legal article, it has a related document storage means for storing related documents,
After specifying the related clauses, referring to the relevant document storage means, a process of extracting the related documents related to each related clause is executed,
2. The contract analysis system according to claim 1, wherein each related document is displayed on the analysis result screen.
特定の法律用語と注釈情報との対応関係を格納しておく解析ルール記憶手段を備えており、
上記契約書データ中に上記法律用語が含まれている場合に、当該法律用語に対応の注釈情報を付加する処理が実行され、
上記分析結果画面において各注釈情報が表示されることを特徴とする請求項1または2に記載の契約書分析システム。
It has an analysis rule storage means for storing the correspondence between specific legal terms and annotation information,
When the above legal terms are included in the contract data, processing for adding annotation information corresponding to the legal terms is executed,
3. The contract analysis system according to claim 1, wherein each annotation information is displayed on the analysis result screen.
コンピュータを、
複数の法令に含まれる複数の法律条文について、条文毎の文書ベクトルを生成する手段、
各条文の文書ベクトル同士を比較し、所定の閾値以上の類似性を有する複数の条文を合体させた条文グループを生成する手段、
各条文グループについて、条文グループ毎の文書ベクトルを生成する手段、
入力された契約書データについて、条項毎の文書ベクトルを生成する手段、
この条項毎の文書ベクトルと、上記条文グループ毎の文書ベクトルとを比較し、類似する条文グループに含まれる各法律条文を、当該契約条項の関連条文と特定する手段、
契約条項毎に関連条文を列記した分析結果画面を生成する手段、
として機能させることを特徴とする契約書分析プログラム。
Computer
A means for generating a document vector for each article for a plurality of laws and regulations included in a plurality of laws and regulations,
Means for comparing document vectors of each clause and generating a clause group that combines a plurality of clauses having a similarity equal to or greater than a predetermined threshold;
For each article group, a means for generating a document vector for each article group,
A means for generating a document vector for each clause of the entered contract data;
A means for comparing the document vector for each clause with the document vector for each clause group and identifying each legal clause included in a similar clause group as a related clause in the contract clause;
A means for generating an analysis result screen listing relevant terms for each contract clause,
Contract analysis program characterized by functioning as
JP2013119508A 2013-06-06 2013-06-06 Contract analysis system, program and method Active JP5383943B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013119508A JP5383943B1 (en) 2013-06-06 2013-06-06 Contract analysis system, program and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013119508A JP5383943B1 (en) 2013-06-06 2013-06-06 Contract analysis system, program and method

Publications (2)

Publication Number Publication Date
JP5383943B1 JP5383943B1 (en) 2014-01-08
JP2014238629A true JP2014238629A (en) 2014-12-18

Family

ID=50036594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013119508A Active JP5383943B1 (en) 2013-06-06 2013-06-06 Contract analysis system, program and method

Country Status (1)

Country Link
JP (1) JP5383943B1 (en)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019506683A (en) * 2016-02-22 2019-03-07 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited Method and system for contract management in the data market
JP2019207592A (en) * 2018-05-30 2019-12-05 Gva Tech株式会社 Legal document evaluation method, legal document evaluation program, legal document evaluation device and legal document evaluation system
JP2019212315A (en) * 2018-05-30 2019-12-12 Gva Tech株式会社 Method, program, device, and system for evaluating legal sentence
JP2020009243A (en) * 2018-07-10 2020-01-16 Gva Tech株式会社 Method, device, program and system for evaluating legal document
JP2020119128A (en) * 2019-01-22 2020-08-06 株式会社三菱総合研究所 Information processing device, information processing method and program
US10755094B2 (en) 2016-11-10 2020-08-25 Optim Corporation Information processing apparatus, system and program for evaluating contract
JP2020144421A (en) * 2019-03-04 2020-09-10 株式会社日本法務システム研究所 System and method for processing information
JP2020144844A (en) * 2019-03-04 2020-09-10 株式会社日本法務システム研究所 System and method for processing information
JP2020184251A (en) * 2019-05-09 2020-11-12 Gva Tech株式会社 Legal sentence evaluation method, legal sentence evaluation program, legal sentence evaluation device, and legal sentence evaluation system
JP6841394B1 (en) * 2020-01-28 2021-03-10 株式会社日本法務システム研究所 Information processing system
JP6946598B1 (en) * 2020-12-07 2021-10-06 株式会社GiRAFFE&Co. Expert Comments on Terms of Use Equipment, Methods, and Programs
JP2022003565A (en) * 2019-06-24 2022-01-11 Gva Tech株式会社 Legal sentence evaluation method, legal sentence evaluation program, legal sentence evaluation device and legal sentence evaluation system
WO2022102965A1 (en) * 2020-11-10 2022-05-19 삼성전자주식회사 Method for analyzing document
WO2022123811A1 (en) * 2020-12-07 2022-06-16 株式会社GiRAFFE&Co. Device, method, and program for providing expert comment regarding terms of use
WO2023021685A1 (en) * 2021-08-20 2023-02-23 株式会社LegalOn Technologies Contract review program, contract review device, and contract review method

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110096681B (en) * 2019-03-16 2023-11-17 平安科技(深圳)有限公司 Contract term analysis method, apparatus, device and readable storage medium
US11200259B2 (en) * 2019-04-10 2021-12-14 Ivalua S.A.S. System and method for processing contract documents
CN110163478B (en) * 2019-04-18 2024-04-05 平安科技(深圳)有限公司 Risk examination method and device for contract clauses
WO2021049485A1 (en) * 2019-09-10 2021-03-18 株式会社日立製作所 Legal analyzer and legal analysis method
CN112559674A (en) * 2019-09-25 2021-03-26 北京国双科技有限公司 Method for inquiring content of legal item in referee document and related device
TWI760851B (en) * 2020-09-21 2022-04-11 臺灣土地銀行股份有限公司 Legality Analysis and Inspection System of Procurement Contract Items
KR102506778B1 (en) * 2020-11-26 2023-03-07 주식회사 리걸인사이트 Method and apparatus for analyzing risk of contract
CN117252690B (en) * 2023-11-17 2024-02-23 杭州钱袋数字科技有限公司 Loan contract online signing method and system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4979000B2 (en) * 2007-01-05 2012-07-18 Kddi株式会社 Information retrieval method, apparatus and program
JP5184290B2 (en) * 2008-10-07 2013-04-17 株式会社エヌ・ティ・ティ・データ Document creation support apparatus, document creation support method, and program
JP2010108268A (en) * 2008-10-30 2010-05-13 Toshiba Corp Document processing apparatus

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019506683A (en) * 2016-02-22 2019-03-07 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited Method and system for contract management in the data market
US10755094B2 (en) 2016-11-10 2020-08-25 Optim Corporation Information processing apparatus, system and program for evaluating contract
JP2019207592A (en) * 2018-05-30 2019-12-05 Gva Tech株式会社 Legal document evaluation method, legal document evaluation program, legal document evaluation device and legal document evaluation system
JP2019212315A (en) * 2018-05-30 2019-12-12 Gva Tech株式会社 Method, program, device, and system for evaluating legal sentence
JP2020009243A (en) * 2018-07-10 2020-01-16 Gva Tech株式会社 Method, device, program and system for evaluating legal document
JP2020119128A (en) * 2019-01-22 2020-08-06 株式会社三菱総合研究所 Information processing device, information processing method and program
JP7325103B2 (en) 2019-03-04 2023-08-14 Fraim株式会社 Information processing system and information processing method
JP2020144421A (en) * 2019-03-04 2020-09-10 株式会社日本法務システム研究所 System and method for processing information
JP2020144844A (en) * 2019-03-04 2020-09-10 株式会社日本法務システム研究所 System and method for processing information
JP2020184251A (en) * 2019-05-09 2020-11-12 Gva Tech株式会社 Legal sentence evaluation method, legal sentence evaluation program, legal sentence evaluation device, and legal sentence evaluation system
JP2022003565A (en) * 2019-06-24 2022-01-11 Gva Tech株式会社 Legal sentence evaluation method, legal sentence evaluation program, legal sentence evaluation device and legal sentence evaluation system
JP2021117844A (en) * 2020-01-28 2021-08-10 株式会社日本法務システム研究所 Information processing system
JP6841394B1 (en) * 2020-01-28 2021-03-10 株式会社日本法務システム研究所 Information processing system
WO2022102965A1 (en) * 2020-11-10 2022-05-19 삼성전자주식회사 Method for analyzing document
JP6946598B1 (en) * 2020-12-07 2021-10-06 株式会社GiRAFFE&Co. Expert Comments on Terms of Use Equipment, Methods, and Programs
WO2022123811A1 (en) * 2020-12-07 2022-06-16 株式会社GiRAFFE&Co. Device, method, and program for providing expert comment regarding terms of use
WO2023021685A1 (en) * 2021-08-20 2023-02-23 株式会社LegalOn Technologies Contract review program, contract review device, and contract review method

Also Published As

Publication number Publication date
JP5383943B1 (en) 2014-01-08

Similar Documents

Publication Publication Date Title
JP5383943B1 (en) Contract analysis system, program and method
US11914954B2 (en) Methods and systems for generating declarative statements given documents with questions and answers
JP5383942B1 (en) Legal document analysis system and program
Estival et al. Author profiling for English emails
US20190394238A1 (en) IT compliance and request for proposal (RFP) management
Bhatia et al. Towards an information type lexicon for privacy policies
WO2016117607A1 (en) Annotation assistance device and computer program therefor
US11948113B2 (en) Generating risk assessment software
US20130006986A1 (en) Automatic Classification of Electronic Content Into Projects
Hutchinson Natural language processing and machine learning as practical toolsets for archival processing
Honkisz et al. A concept for generating business process models from natural language description
Sleimi et al. A query system for extracting requirements-related information from legal texts
Rice et al. Machine coding of policy texts with the Institutional Grammar
JP2023509437A (en) Systems and methods for analyzing and identifying relationships from various data sources
CA2807494A1 (en) Method and system for integrating web-based systems with local document processing applications
Osman et al. From natural language text to visual models: A survey of issues and approaches
Sleimi et al. Automated recommendation of templates for legal requirements
Chieze et al. An automatic system for summarization and information extraction of legal information
WO2016067396A1 (en) Sentence sorting method and computer
JP5438603B2 (en) Kansei dictionary editing support system and program
Barreira et al. A framework for digital forensics analysis based on semantic role labeling
JP6976585B2 (en) Anaphora / abbreviated analyzer and computer program
JP6813432B2 (en) Document processing equipment, document processing methods and programs
US20200042594A1 (en) Proposition identification in natural language and usage thereof
Fox Mining the digital library

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130924

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131001

R150 Certificate of patent or registration of utility model

Ref document number: 5383943

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250