JP2014238628A - Legal document analysis system and program - Google Patents
Legal document analysis system and program Download PDFInfo
- Publication number
- JP2014238628A JP2014238628A JP2013119507A JP2013119507A JP2014238628A JP 2014238628 A JP2014238628 A JP 2014238628A JP 2013119507 A JP2013119507 A JP 2013119507A JP 2013119507 A JP2013119507 A JP 2013119507A JP 2014238628 A JP2014238628 A JP 2014238628A
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- sentence
- legal document
- document
- legal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 18
- 230000000877 morphologic effect Effects 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 35
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000012986 modification Methods 0.000 abstract 1
- 230000004048 modification Effects 0.000 abstract 1
- 239000013598 vector Substances 0.000 description 35
- 230000014509 gene expression Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 238000005065 mining Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 101150047061 tag-72 gene Proteins 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
この発明は法律文書解析システム及びプログラムに係り、特に、契約書や条文等の法律文書に対して、後続するコンピュータ処理に適した形式に変換する前処理技術に関する。 The present invention relates to a legal document analysis system and program, and more particularly to a preprocessing technique for converting a legal document such as a contract or a clause into a format suitable for subsequent computer processing.
テキストマイニング技術の進歩に伴い、人間が記述した自然文に対しても、検索や翻訳等のコンピュータ処理が施されるようになってきている。
確かに、一般的なニュース記事やブログ記事のように、初めから読みやすさに重点をおいて記述された文書であれば、現在の文書解析技術であっても自然文をある程度正しい意味で解釈することができるといえる。
しかしながら、読みやすさよりも正確さや厳密さを重視して記述される法律文書の場合には、一般的な文法ルールに則った解析だけでは不十分といえる。
Certainly, a document written with an emphasis on readability from the beginning, such as general news articles and blog articles, interprets natural sentences with a certain degree of correct meaning even with the current document analysis technology. I can say that.
However, in the case of legal documents that are described with emphasis on accuracy and rigor rather than readability, it is not sufficient to analyze only in accordance with general grammatical rules.
もちろん、翻訳ソフトの中には法律文書に最適化されていることをアピールする製品も存在するが(非特許文献1)、これらは専門の法律用語辞書を充実させるといった単語レベルでの対応に過ぎず、また文法解析にしても英文ベースに止まっており、日本の法律分野に特有の文法ルールや解釈ルールまでは対応できていない。このため、単語が羅列されただけの意味不明な翻訳文が出力されたり、意味が取り違えられた翻訳文が出力されたりする危険性があった。 Of course, some translation software products that are optimized for legal documents exist (Non-Patent Document 1), but these are only word-level correspondences such as enhancing specialized legal terminology dictionaries. In addition, the grammar analysis is based on English, and the grammar rules and interpretation rules peculiar to the Japanese legal field cannot be handled. For this reason, there is a risk that a translated sentence with an unknown meaning in which words are enumerated is output, or a translated sentence having a wrong meaning is output.
この発明は、このような現状に鑑みて案出されたものであり、後続のコンピュータ処理においてその意味内容が正しく解釈されるように、事前に法律文書を最適化する技術を提供することを目的としている。 The present invention has been devised in view of such a current situation, and an object of the present invention is to provide a technique for optimizing a legal document in advance so that the semantic content is correctly interpreted in subsequent computer processing. It is said.
上記の目的を達成するため、請求項1に記載した法律文書解析システムは、文を構成する特定の要素間の関係と、各要素に対する変換処理の内容を、法律文書に特有の解析ルールとして予め定義しておく解析ルール記憶手段を備えており、入力された法律文書データを形態素単位に分解する形態素解析処理と、各形態素間の係り受け構造を特定する構文解析処理とを実行するシステムであって、上記構文解析処理に際して上記解析ルール記憶手段を参照し、上記法律文書データ中に上記解析ルールに該当する要素間の関係を備えた文が含まれている場合には、当該解析ルールに定義された変換処理を施した文を生成することを特徴としている。 In order to achieve the above object, the legal document analysis system according to claim 1 preliminarily describes the relationship between specific elements constituting a sentence and the contents of conversion processing for each element as analysis rules specific to the legal document. The system includes analysis rule storage means to be defined, and executes a morphological analysis process that decomposes input legal document data into morpheme units and a parsing process that specifies a dependency structure between morphemes. When the syntax analysis processing refers to the analysis rule storage means, and the legal document data includes a sentence having a relationship between elements corresponding to the analysis rule, the analysis rule defines It is characterized in that a sentence subjected to the converted processing is generated.
請求項2に記載した法律文書解析システムは、請求項1のシステムであって、上記解析ルールが、要素間の並列関係を定義するものであり、上記構文解析処理に際し、この解析ルールに該当する文に対して、対応の変換処理を施した文が生成されることを特徴としている。 The legal document analysis system according to claim 2 is the system according to claim 1, wherein the analysis rule defines a parallel relationship between elements, and corresponds to the analysis rule in the parsing process. A feature is that a sentence subjected to a corresponding conversion process is generated.
請求項3に記載した法律文書解析システムは、請求項1または2のシステムであって、上記解析ルールが、要素間の例示関係を定義するものであり、上記構文解析処理に際し、この解析ルールに該当する文に対して、対応の変換処理を施した文が生成されることを特徴としている。 The legal document analysis system according to claim 3 is the system according to claim 1 or 2, wherein the analysis rule defines an example relation between elements, and in the parsing process, A feature is that a sentence subjected to corresponding conversion processing is generated for the corresponding sentence.
請求項4に記載した法律文書解析プログラムは、コンピュータを、文を構成する特定の要素間の関係と、各要素に対する変換処理の内容を、法律文書に特有の解析ルールとして予め定義しておく解析ルール記憶手段、入力された法律文書データを形態素単位に分解する形態素解析手段、各形態素間の係り受け構造を特定する構文解析手段として機能させるものであって、上記構文解析手段が、上記解析ルール記憶手段を参照し、上記法律文書データ中に上記解析ルールに該当する要素間の関係を備えた文が含まれている場合には、当該解析ルールに定義された変換処理を施した文を生成することを特徴としている。 The legal document analysis program according to claim 4 is an analysis in which a computer defines in advance the relation between specific elements constituting a sentence and the contents of conversion processing for each element as analysis rules specific to the legal document. A rule storage means, a morpheme analysis means for decomposing input legal document data into morpheme units, and a syntax analysis means for specifying a dependency structure between morphemes, wherein the syntax analysis means includes the analysis rule Referring to storage means, if the legal document data contains a sentence with a relationship between the elements corresponding to the analysis rule, a sentence subjected to the conversion process defined in the analysis rule is generated. It is characterized by doing.
この発明に係る法律文書解析システム及びプログラムの場合、解析ルール記憶手段に格納された解析ルールに従って文の変換処理が実行されるため、この解析ルール記憶手段に法律文書に特有の解析ルールを予め定義しておくことで、法律文書の構造を最適化することができ、後続の翻訳処理や概念検索処理を高精度化することが可能となる。 In the case of the legal document analysis system and program according to the present invention, the sentence conversion processing is executed in accordance with the analysis rule stored in the analysis rule storage means, so that the analysis rule specific to the legal document is defined in advance in the analysis rule storage means By doing so, the structure of the legal document can be optimized, and subsequent translation processing and concept retrieval processing can be made highly accurate.
図1は、この発明に係る法律文書解析システム10を含む契約書分析システム11を示すブロック図である。
この契約書分析システム11は、Webサーバ12とAPサーバ14から構成され、APサーバ14は、法律文書解析部16と、文書ベクトル生成部18と、関連条文特定部20と、分析画面生成部22と、解析ルール記憶部24と、法律条文記憶部26と、関連文献記憶部28とを備えている。
FIG. 1 is a block diagram showing a
The
上記法律文書解析部16、文書ベクトル生成部18、関連条文特定部20及び分析画面生成部22は、OS及び専用のアプリケーションプログラムに従って動作するAPサーバ14のCPUによって実現される。
また、上記解析ルール記憶部24、法律条文記憶部26及び関連文献記憶部28は、APサーバ14の外部記憶装置内に設けられている。
The legal
The analysis
上記法律条文記憶部26には、主要な法令(民法、商法、会社法、特許法、商標法、著作権法、不正競争防止法、独占禁止法、刑法、民事訴訟法等)における主要な条文や規則のテキストデータが格納されている。
The above-mentioned legal
また、上記関連文献記憶部28には、主要な法令における主要な条文毎に、様々な関連文献情報が格納されている。
図2はその一例を示すものであり、民法709条について、複数のコメント(弁護士等の法律実務家によるワンポイントアドバイス)、判例及び学説が関連文献として紐付けられている様子が描かれている。
各関連文献中には、文献のタイトル、概要、他の関連文献や関連画像、関連動画等とのリンク情報が含まれている。
関連文献の種類としては、上記のコメントや判例、学説に限定されるものではなく、契約文例等であってもよい。
The related
FIG. 2 shows an example of this, and it shows a state in which multiple comments (one-point advice by lawyers such as lawyers), precedents and doctrines are linked as related literature for Article 709 of the Civil Code. .
Each related document includes link information with a document title, an outline, other related documents, related images, related moving images, and the like.
The types of related documents are not limited to the above comments, precedents, and theories, but may be contract examples.
上記Webサーバ12は、会員ユーザのリクエストに応じて、各種画面(Htmlファイル)を生成・送信する機能を担うものであり、インターネット30を介して多数の会員ユーザ32のクライアント端末34と接続されている。
The
この契約書分析システム11の利用を希望する会員ユーザ32は、まずクライアント端末34からWebサーバ12にアクセスし、契約書分析サービスにログインする。
この結果、Webサーバ12からクライアント端末34に対して、契約書入力画面が送信される。図3(a)は、クライアント端末34のWebブラウザ上に表示された契約書入力画面40を示している。
A
As a result, the contract document input screen is transmitted from the
会員ユーザ32は、この契約書入力画面40に対して、契約書の各条項42をキーボードやコピー&ペーストによって入力し、送信ボタン44をクリックする。
この結果、クライアント端末34からWebサーバ12に契約書データが送信される。
The
As a result, the contract data is transmitted from the
以後、図4のフローチャートに従い、このシステム11における処理手順を説明する。
まず、Webサーバ12からAPサーバ14に渡された契約書データ(テキストデータ)46は、法律文書解析部16において、形態素解析処理に付される(S10)。
ここで「形態素解析」とは、自然言語で記述された文を、意味を有する最小の言語単位である形態素に分解し、それぞれの品詞を同定する処理をいう。
Hereinafter, the processing procedure in the
First, the contract document data (text data) 46 transferred from the
Here, “morpheme analysis” refers to a process of decomposing a sentence described in a natural language into morphemes, which are the smallest meaningful language units, and identifying each part of speech.
つぎに法律文書解析部16は、解析ルール記憶部24を参照し、形態素解析された契約書データについて解析ルール適用処理を施す(S12)。
以下において、この解析ルール適用処理について詳述する。
Next, the legal
Hereinafter, the analysis rule application process will be described in detail.
[1.構文解析における解析ルールの適用処理]
テキストマイニングにおいては、文書を構成する各形態素間の係り受けの関係を特定する構文解析処理が不可欠であり、法律文書解析部16も当然ながらこの構文解析処理を実行する。
この際、法律文書解析部16は、解析ルール記憶部24に格納されたルールに合致する文については、通常の構文解析とは異なる観点から係り受け構造を抽出する特別な処理を実行する。
[1. Analysis rule application processing in syntax analysis]
In text mining, a syntax analysis process that specifies a dependency relationship between each morpheme constituting a document is indispensable, and the legal
At this time, the legal
(1) 並列関係に関する処理
契約文書中に「A及びB並びにCであるD」という文が存在する場合、一般的な構文解析では「A+B+C=D」というように、各要素が単純にANDで結合された対等の並列関係として解釈され、「AとBとCであるD」という文に変換されてしまう。
これに対し法律文書解析部16は、図5(a)に示すように、「A及びB並びにC」の部分について、「A+B/C」という法律分野に特有のルールに従った正しい構文を抽出することができ、以下の二つの文を生成する。
(i)「AとBであるD」
(ii)「CであるD」
このために、解析ルール記憶部24には以下の解析ルールが規定されている。
■「A及びB並びにC」の接続関係→「A+B/C」
(1) Processing related to parallel relations When there is a sentence “D that is A, B, and C” in the contract document, each element is simply AND in general parsing, such as “A + B + C = D”. It is interpreted as a connected parallel relationship of equality, and is converted into a sentence “D which is A, B, and C”.
On the other hand, as shown in FIG. 5A, the legal
(i) “D that is A and B”
(ii) “D that is C”
For this purpose, the analysis
■ Connection relationship of “A, B and C” → “A + B / C”
同様に、「A又はB若しくはCであるD」という文についても、一般的な構文解析では「A+B+C=D」と解釈され、「AとBとCであるD」という文に変換されることになる。
これに対し法律文書解析部16は、図5(b)に示すように、「A又はB若しくはC」の部分について、「A/B+C」という正しい構文を抽出することができ、以下の二つの文を生成する。
(i)「AであるD」
(ii)「BとCであるD」
このために、解析ルール記憶部24には以下の解析ルールが規定されている。
■「A又はB若しくはC」の接続関係→「A/B+C」
Similarly, the sentence “D that is A, B, or C” is also interpreted as “A + B + C = D” in general parsing and converted to the sentence “D that is A, B, and C”. become.
On the other hand, as shown in FIG. 5 (b), the legal
(i) “D that is A”
(ii) “D that is B and C”
For this purpose, the analysis
■ Connection relationship of “A or B or C” → “A / B + C”
(2) 例示関係に関する処理
法律文書においては、「その他」の文言と「その他の」の文言とでは異なった意味に解釈される。
例えば、「陸海空軍『その他の』戦力を保持しない。」という文の場合、陸海空軍はその他の戦力の例示に過ぎないことを意味しているのに対し、「賃金、給料『その他』これに準ずる収入があるときは、…」の文においては、これに準ずる収入が賃金や給料と並列関係にあることを意味している。
(2) Processing related to example relations In legal documents, the words “other” and “other” are interpreted differently.
For example, the sentence “Do not hold the land, sea and air force“ other ”” means that the land, sea and air force is only an example of other forces, whereas “wage, salary“ other ”. In the case of “when there is equivalent income,” means that income equivalent to this is in parallel with wages and salaries.
このため法律文書解析部16は、「陸海空軍その他の戦力を保持しない。」という文に基づいて、「戦力(例えば陸海空軍)を保持しない。」のように、文意に沿った形に変換した文を新たに生成し、元の文と置き換える。
また、法律文書解析部16は、「賃金、給料その他これに準ずる収入があるときは、…」という文に基づいて、「(1)賃金があるときは、…」、「(2)給料があるときは、…」、「(3)賃金・給料に準ずる収入があるときは、…」のように、文意を正しく表現するために複数の文を生成し、元の文と置き換える。
For this reason, the legal
In addition, the legal
これに対し、一般的な構文解析エンジンを用いた場合、「の」の有無の違いが無視される結果、「その他」と「その他の」は同じ文書構造を表す語として処理されてしまう。このため、「陸海空軍その他の戦力を保持しない。」という文は、そのまま「陸海空軍とその他の戦力を保持しない。」という文として後続処理に投入される。同様に、「賃金、給料その他これに準ずる収入があるときは、…」という文は、「賃金と、給料と、その他これに準ずる収入があるときは、…」という文として後続処理に投入される。 On the other hand, when a general parsing engine is used, the difference in the presence or absence of “no” is ignored. As a result, “other” and “other” are processed as words representing the same document structure. For this reason, the sentence “Do not hold the land, naval and air forces and other forces” is input to the subsequent processing as the sentence “Do not hold the land and naval air forces and other forces”. Similarly, the sentence “When there is wage, salary or other income equivalent to this ...” is put into the subsequent processing as the sentence “When there is wage, salary or other income equivalent to this ...”. The
法律文書解析部16が、上記のような法律実務に即した正しい文を生成することができるように、解析ルール記憶部24には例えば以下のような解析ルールが規定されている。
■「その他の」→直前に位置する語は直後に位置する語の例示→直前に位置する語の先頭に「例えば」を付加し、全体を括弧で囲んだ上で、直後に位置する語の後ろに移動させる。 ■「その他」→直前に位置する語と直後に位置する語とは並列関係→それぞれを単独で用いた文を生成する。
法律文書解析部16は、構文解析処理を行う際にこの解析ルールに従うことにより、図6(a)及び(b)に示すように、正しく各要素間の係り受け構造を導き、新たな文の生成を行うことができる。
For example, the following analysis rules are defined in the analysis
■ “Other” → The word located immediately before is an example of the word located immediately after. → “For example” is added to the head of the word located immediately before, and the whole word is enclosed in parentheses. Move back. (1) “Other” → Parallel relationship between the word immediately before and the word immediately after → Create a sentence using each of them independently.
The legal
(3) 条件関係に関する例外処理
「場合」と「とき」は、一般には同じ意味に解釈することができるが、法律の分野において同一文中に用いられた場合には、「場合」が「大条件」を表し、「とき」が「小条件」を表すものとして解釈される。
例えば、「当事者の一方が本契約に違反した『場合』において、その違反が30日を経過しても是正されない『とき』は、他方当事者は、本契約を解除することができる」という文の場合、「30日を経過している」という状態のみでは条件に合致せず、大前提として「契約違反」が生じていることが要求される。
(3) Exception handling related to conditional relations Generally, "case" and "time" can be interpreted in the same meaning, but when used in the same sentence in the field of law, "case" ”And“ time ”are interpreted as“ small condition ”.
For example, the sentence “If one of the parties violates this Agreement and the violation is not corrected after 30 days, the other party may terminate this Agreement” In this case, it is required that “30 days have passed” does not meet the condition, and “contract violation” occurs as a major premise.
このため、解析ルール記憶部24には、以下のような解析ルールが規定されている。
■「場合」と「とき」が同一文中に存在している場合→「『場合』の先行語」が大条件となり、「『とき』の先行語」は小条件となる
法律文書解析部16は、構文解析処理を行う際にはこの解析ルールに従い、正しく各要素間の係り受け構造を導くことができる。
For this reason, the analysis
■ When "Case" and "Time" exist in the same sentence → "Precursor of" Case "" becomes a major condition, and "Precedence of" Case "" becomes a minor condition. When performing the parsing process, it is possible to correctly derive the dependency structure between the elements according to the analysis rule.
[2.注釈情報の付加等による解析ルールの適用処理]
構文解析以外でも、法律文書の評価時には特定の用語について特別な配慮を要するケースが多々ある。
このため法律文書解析部16は、解析ルール記憶部24に格納された解析ルールに合致する用語については、対応の注釈情報を付加したり、特定の文字列に変換する処理を実行する
[2. Application processing of analysis rules by adding annotation information]
In addition to parsing, there are many cases where special consideration is required for specific terms when evaluating legal documents.
For this reason, the legal
(1) 数値+範囲指定語に関する処理
一般的な構文解析においては、具体的な数値に「以上」、「以下」、「未満」、「を超える」といった「範囲指定語」が付加されている語については、その数値を抽出するに止まり、その指定範囲を正しく抽出することができていない。
しかしながら、法律文書を評価する際にはこの範囲指定が極めて重要となる。
このため、解析ルール記憶部24には、以下のような解析ルールが規定されている。
■「以上」→直前の数値を含む
■「以下」→直前の数値を含む
■「を超える」→直前の数値を含まない
■「未満」→直前の数値を含まない
(1) Processing related to numerical values + range specification words In general syntax analysis, "range specification words" such as "more than", "less than", "less than", and "greater than" are added to specific numerical values. For words, the numerical values are not extracted, and the specified range cannot be extracted correctly.
However, this range designation is extremely important when evaluating legal documents.
For this reason, the analysis
■ "More" → Includes the previous value ■ "Following" → Includes the previous value ■ "Over" → Does not include the previous value ■ "Less than" → Does not include the previous value
法律文書解析部16はこの解析ルールに従い、以下のように解析対象の文書中に「18歳以上」という語が含まれていた場合、その部分に「18歳を含む」の注釈情報を付与する。
●「…18歳以上の会員ユーザについては、保護者の承諾を要しない。」
<18歳を含む>
In accordance with this analysis rule, the legal
● “… Members over the age of 18 do not require parental consent.”
<Including 18 years old>
あるいは、解析対象の文書中に「18歳未満」という語が含まれていた場合、以下のように法律文書解析部16はその部分に「18歳を含まない」の注釈情報を付与する。
●「…ただし、同居の親族が18歳未満の場合にはこの限りでない。」
<18歳を含まない>
Alternatively, when the word “under the age of 18” is included in the document to be analyzed, the legal
● “However, this does not apply if the relative living together is under the age of 18.”
<Excluding 18 years old>
この「数値+範囲指定語」に関する解釈ルールは法律分野に特有のものではなく、常識的な判断と合致するものといえるが、法律上の解釈も一般常識と異ならないということを明確化することに意義が認められる。 Clarify that the interpretation rules for this "number + range specification word" are not specific to the legal field and are consistent with common sense judgment, but the legal interpretation is not different from general common sense. The significance is recognized.
(2) 効力の取消しに関する処理
一般的な構文解析エンジンにおいて、「解除」と「解約」は同じく「取消し」の意味を有する単語として解釈されるが、法律文書中において両者は取消しの効力発生時期に差違が生じる。すなわち、「解除」は契約等の当初に遡って取消しの効力が発生するのに対し、「解約」の場合には解約の時から将来に向かって取消しの効力が発生する。
また、「解除」はその意味内容からして、「はじめからなかったものとみなす」という表現と同義といえる。
(2) Processing related to revocation of effect In a general parsing engine, “cancel” and “cancel” are interpreted as words having the same meaning as “cancel”. Differences occur. In other words, “cancellation” has the effect of cancellation going back to the beginning of the contract, while “cancellation” has the effect of cancellation from the time of cancellation to the future.
In addition, “cancel” can be said to be synonymous with the expression “deemed not to be new” in terms of its meaning.
以上のことを踏まえて、解析ルール記憶部24には次のような解析ルールが規定されている。
■「解除」→「遡って効力喪失」
■「解約」→「将来に向かって効力喪失」
■「はじめからなかったものとみなす」→「=解除」
Based on the above, the analysis
■ "Release" → "Returning effectiveness"
■ "Cancellation" → "Effectiveness toward the future"
■ “Consider that it was not the beginning” → “= Cancel”
法律文書解析部16はこの解析ルールに従い、解析対象の文書中に「解除」という語が含まれていた場合、その部分に「遡って効力喪失」の注釈情報を付与する。
●「…契約を解除することができる。」
<遡って効力喪失>
In accordance with this analysis rule, the legal
● “… Can cancel the contract.”
<Retroactive loss of effectiveness>
また、解析対象の文書中に「解約」という語が含まれていた場合、以下のように法律文書解析部16は「将来に向かって効力喪失」の注釈情報を付与する。
●「…甲又は乙が解約の意思表示をしてから3ヶ月以内に…」
<将来に向かって効力喪失>
Further, when the word “cancel” is included in the analysis target document, the legal
● "... within 3 months after Party A or Party B has indicated the intention to cancel ..."
<Loss of efficacy toward the future>
さらに、解析対象の文書中に「はじめからなかったものとみなす」という表現が含まれていた場合、法律文書解析部16は「解除する」に置換する。
Furthermore, if the analysis target document includes the expression “consider that it was not the beginning”, the legal
(3) 緊急表現に関する処理
法律文書中には、「直ちに」、「速やかに」、「遅滞なく」のように時間的な緊急度を表す複数の用語があり、それぞれの示す緊急度には軽重が存在している。
具体的には、「直ちに」が最も緊急度が高く、「速やかに」はそれよりも急迫性が低く、「遅滞なく」の場合には合理的理由の存在によって多少の遅れは許されるニュアンスが含まれている。
(3) Handling of urgent expressions In legal documents, there are multiple terms that indicate temporal urgency such as “immediately”, “promptly”, and “without delay”. Is present.
Specifically, “immediately” is the most urgent, “promptly” is less impulsive, and in the case of “without delay,” there is a nuance that allows some delay due to the existence of a reasonable reason. include.
このため、解析ルール記憶部24には、以下のような解析ルールが規定されている。
■「直ちに」→「緊急度:高」
■「速やかに」→「緊急度:中」
■「遅滞なく」→「緊急度:低」
For this reason, the analysis
■ "Immediately" → "Urgentness: High"
■ “Promptly” → “Emergency: Medium”
■ “No delay” → “Urgentness: Low”
この解析ルールに従い、法律文書解析部16は次のように解析対象の文書中に「直ちに」という語が含まれていた場合、その部分に「緊急度:高」の注釈情報を付与する。
●「…の場合、甲は乙に対し直ちにその旨の通知を行うものとする。」
<緊急度:高>
In accordance with this analysis rule, if the word “immediately” is included in the document to be analyzed as follows, the legal
● “In the case of…, Party A shall immediately notify to that effect”
<Emergency: High>
また、解析対象の文書中に「速やかに」という語が含まれていた場合、法律文書解析部16は以下のように「緊急度:中」の注釈情報を付与する。
●「…速やかに立ち退くことを約する。」
<緊急度:中>
In addition, when the word “promptly” is included in the analysis target document, the legal
● “... I promise to evacuate quickly”
<Emergency: Medium>
さらに、解析対象の文書中に「遅滞なく」という語が含まれていた場合、法律文書解析部16は以下のように「緊急度:低」の注釈情報を付与する。
●「…の場合、甲は乙に遅滞なく連絡しなければならない。」
<緊急度:低>
Further, when the word “without delay” is included in the analysis target document, the legal
● “In case of…, Party A must contact you without delay.”
<Urgent level: Low>
(4) 禁止表現に関する処理
法律文書においては、同じ禁止を意味する場合であっても、「Aをしてはならない」という表現と、「Aをすることができない」という表現では、禁止の度合いが異なって解釈される。
このため、解析ルール記憶部24には、以下のような解析ルールが規定されている。
■「〜してはならない」→「強い禁止」
■「〜することができない」→「弱い禁止」
(4) Processing related to prohibited expressions In legal documents, even if it means the same prohibition, the expression "Do not do A" and the expression "Cannot do A" indicate the degree of prohibition. Are interpreted differently.
For this reason, the analysis
■ "Do not do" → "strong prohibition"
■ "I can't do" → "Weak ban"
この解析ルールに従い、法律文書解析部16は、解析対象の文書中に「〜してはならない」という表現が存在した場合、その部分に「強い禁止」の注釈情報を付与する。
●「…甲乙は互いに相手方の営業上の秘密を漏洩してはならない。」
<強い禁止>
In accordance with this analysis rule, the legal
● “... Do not leak trade secrets of the other party to each other.”
<Strong prohibition>
また、解析対象の文書中に「〜することができない」という表現が含まれていた場合、法律文書解析部16は以下のように「弱い禁止」の注釈情報を付与する。
●「…承諾を得た場合を除き、第三者に開示することができない。」
<弱い禁止>
Further, when the expression “cannot be” is included in the analysis target document, the legal
● “… Cannot be disclosed to a third party unless consent is obtained.”
<Weak ban>
(5) 事業関連用語に関する処理
一般的には「事業」と「営業」は同義と解釈されており、構文解析エンジンにおいても同義語として何れか一方の表現に統一されてしまう。ところが、法律文書において用いられる場合、前者が「一定の目的をもって反復継続して行われる行為の総称」を意味するのに対し、後者が「営利を目的とする事業」を意味するものとして解釈され、両者には明確な差違が認められる。
また、「業として」という表現は、特定の法律分野(例えば特許法)においては「事業として」と同義のものとして理解されている。
(5) Processing related to business-related terms Generally, “business” and “sales” are interpreted as synonyms, and in the parsing engine, they are unified into either one as synonyms. However, when used in legal documents, the former means “a general term for actions that are repeatedly performed for a certain purpose”, whereas the latter is interpreted as meaning “a business for profit”. There is a clear difference between the two.
In addition, the expression “as business” is understood as synonymous with “as business” in a specific legal field (for example, patent law).
以上のことを踏まえて、解析ルール記憶部24には次のような解析ルールが規定されている。
■「事業」≠「営業」
■「業として」→「事業として」
Based on the above, the analysis
■ “Business” ≠ “Sales”
■ “As a business” → “As a business”
このルールに従い、法律文書解析部16は、解析対象の文書中に「事業」や「営業」の語が含まれていた場合、何れか一方の表現を他方の表現に置き換えることは控え、それぞれの表現を維持する。
In accordance with this rule, the legal
また、解析対象の文書中に「業として」という語が含まれていた場合、法律文書解析部16は次のように「事業として」に置き換える。
●「…甲は特許発明を業として実施した場合の対価について…」
↓
「…甲は特許発明を事業として実施した場合の対価について…」
Further, if the word “as business” is included in the document to be analyzed, the legal
● “... I think about the value of patented invention as a business ...”
↓
“… I think about the compensation when the patented invention is implemented as a business…”
法律文書解析部16において形態素解析、構文解析、注釈情報の付加、文字列変換等の加工処理が施された契約書データは、文書ベクトル生成部18に渡され、契約条項単位で文書ベクトル化される(S14)。
例えば、図7に示すように、契約書中に複数の条項が含まれていた場合、文書ベクトル生成部18は、条項単位で複数の文書ベクトル47を生成する。
The contract document data that has undergone processing such as morphological analysis, syntax analysis, addition of annotation information, and character string conversion in the legal
For example, as shown in FIG. 7, when a contract includes a plurality of clauses, the document
ここで「文書ベクトル化」とは、各文書に含まれるキーワードの組合せと出現頻度に基づいて文書の特徴をベクトルとして表現する技術であり、既存のベクトル化エンジンに各テキストを投入することにより、算出される。
ただし、文書ベクトル化処理の対象となるのは契約書に元から含まれていたテキストと、法律文書解析部16によって置換された文字列に限定され、法律文書解析部16によって付加された注釈情報は対象外となる。
上記のように、法律文書特有の構文解析が必要な文については、事前に法律文書解析部16によって最適化された文に変換されているため、文書ベクトル化処理に際し文意に沿った正しい文書ベクトルが生成される。
Here, “document vectorization” is a technique for expressing the characteristics of a document as a vector based on the combination of keywords included in each document and the appearance frequency. By inputting each text into an existing vectorization engine, Calculated.
However, the document vectorization process is limited to the text originally included in the contract and the character string replaced by the legal
As described above, sentences that require parsing specific to legal documents have been converted into sentences optimized by the legal
法律文書解析部16は、上記した契約書データ46の解析処理と平行して、法律条文記憶部26に格納された法律条文についても、上記と同様の形態素解析処理(S10)及び解析ルール適用処理(S12)を実行し、解析済みの法律条文データを文書ベクトル生成部18に渡す。
The legal
これを受けた文書ベクトル生成部18は、図7に示すように、まず法律の条文単位で文書ベクトルを生成するベクトル化処理を実行する(S16)。この際、条文が複数の条項を含む場合には、条項単位で文書ベクトルが生成される。
Receiving this, the document
つぎに文書ベクトル生成部18は、条文単位の文書ベクトルを比較し、相互間のなす角が閾値内にあるもの同士を集めて各条文を1文書に合体させるグループ化処理を実行する(S18)。
この際、各法律条文は「民法」や「不正競争防止法」といった法域の垣根を越えて、純粋に記述内容の類似度に応じて集められたグループ化文書48が生成される。
Next, the document
At this time, a grouped
つぎに文書ベクトル生成部18は、各グループ化文書48に対して、再度ベクトル化処理を施す(S20)。この結果、グループ化文書48単位での文書ベクトル49が得られる。
最後に文書ベクトル生成部18は、各グループ化文書48のベクトルデータ49と、各契約条項のベクトルデータ47を関連条文特定部20に渡す。
Next, the document
Finally, the document
これを受けた関連条文特定部20は、各契約条項のベクトル47と法律条文のグループ化文書48のベクトル49をマッチングし(S22)、相互間のなす角が最も小さくなるグループ化文書48に含まれる各法律条文を、当該契約条項の関連条文として特定する。
図7においては、契約書の第21条に対して、民法709条及び不正競争防止法4条が関連条文として特定された例が示されている。
この関連条文情報50は、分析画面生成部22に渡される。
In response to this, the related
FIG. 7 shows an example in which the civil law article 709 and the unfair competition prevention law article 4 are specified as related articles with respect to article 21 of the contract.
The
分析画面生成部22は、関連文献記憶部28を参照し、上記関連条文に係る関連文献(コメントや判例、学説等)を抽出する(S24)。
つぎに、分析画面生成部22は契約書の分析画面を生成し(S26)、分析画面データ52をWebサーバ12に渡す。
The analysis
Next, the
この分析画面データ52は、Webサーバ12からクライアント端末34に送信され、Webブラウザ上に表示される。
図3(b)は、Webブラウザ上に表示された契約書分析画面60を示すものであり、契約書中の条項42毎に関連条文62が列記されている。各関連条文62は、契約条項の文書ベクトルとの類似度が高い順に表示される。
The
FIG. 3B shows a
各関連条文62には、それぞれの関連文献の存在を示すボタン(コメントボタン64、判例ボタン66、学説ボタン68)が表示されている。
ここでユーザ32が、例えば不競法第4条の「判例1」のボタン66をクリックすると、同条に関連付けられた判例のタイトル、概要、リンク情報が表示されたポップアップウィンドウ70が画面60上に表示される。
In each
Here, when the
また、契約条項42の文中に注釈情報が付された文字列が含まれている場合、その存在が明確となるように、下線やハイライト等の強調表示がなされると同時に、注釈情報が明示される。
図においては、契約条項中の「速やかに」に下線が引かれると共に、「<緊急度:中>」の注釈タグ72が表示されている。
Also, if the text of the
In the figure, “promptly” in the contract clause is underlined and an
このように、契約書分析画面60において契約条項42毎に関連条文のリストと、各関連条文に係る関連文献情報が提示され、かつ法律解釈上特に注意すべき文言には注釈タグ72が付加されて注意が喚起されるため、法律にあまり詳しくないユーザ32であっても、問題の所在を確実に認識することが可能となる。
In this way, on the
上記のように、文書ベクトル化処理に先立って、法律文書に対して最適化処理(構文解析の最適化、文字列の変換)が施されているため、正確な文書ベクトルを生成することができ、マッチングの精度を高めることができる。 As described above, the legal document is optimized prior to the document vectorization process (optimization of parsing, character string conversion), so an accurate document vector can be generated. , Matching accuracy can be increased.
また、法律条文のベクトル化に際しては、まず個々の条文単位で文書ベクトル化した後、そのベクトルの類似度に応じて、法律の垣根を越えてグループ化が図られるため、契約条項に関連のある条文を複数の異なる法域から網羅的に抽出することが可能となる。 In addition, when vectorizing legal provisions, documents are first vectorized in units of individual articles, and then grouped across legal boundaries according to the similarity of the vectors. It becomes possible to exhaustively extract the text from multiple different jurisdictions.
上記においては、契約書データ46の解析及びベクトル化と平行して、法律条文の解析、ベクトル化、グループ化及び再ベクトル化が実行されるため、法律改正があった場合にも常に最新のデータに基づいてマッチング処理がなされる利点を有している。
In the above, analysis, vectorization, grouping, and re-vectorization of the legal provisions are executed in parallel with the analysis and vectorization of the
しかしながら、この発明はこれに限定されるものではない。
すなわち、法律条文については予め解析、ベクトル化、グループ化及び再ベクトル化を実行すると共に、その処理結果を所定の記憶手段に格納しておき、契約書の文書ベクトルとのマッチング処理時に関連条文特定部20がこれを参照するようにシステムを構成することもできる。
この場合、法律文書解析部16及び文書ベクトル生成部18は、何れかの法律について改正が生じたタイミングで、全法律条文の解析、ベクトル化、グループ化及び再ベクトル化を実行することで、データの鮮度を維持する。
However, the present invention is not limited to this.
That is, analysis, vectorization, grouping, and revectorization are executed in advance for the legal text, and the processing results are stored in a predetermined storage means, and the related text is specified at the time of matching processing with the document vector of the contract. The system may be configured so that the
In this case, the legal
また上記においては、各契約条項のベクトル47と法律条文のグループ化文書48のベクトル49とのマッチングに際し、相互間のなす角が最小となる一つのグループ化文書48が類似する条文グループとして特定される例を示したが、この発明はこれに限定されるものではない。
例えば、各契約条項のベクトル47との間のなす角が所定の閾値内に収まるベクトル49を備えた複数のグループ化文書を特定し、それぞれのグループ化文書48に含まれる法律条文を、当該契約条項の関連条文と認定することもできる。
あるいは、各契約条項のベクトル47と各グループ化文書48のベクトル49との間のなす角を小さい順に整列させ、上位N%のグループ化文書48に含まれる法律条文を、当該契約条項の関連条文と認定してもよい。この場合、「N」の値については、事前にユーザが1%刻みで設定しておく。
Also, in the above, when matching the
For example, a plurality of grouped documents having a
Alternatively, the angle between the
10 法律文書解析システム
11 契約書分析システム
12 Webサーバ
14 APサーバ
16 法律文書解析部
18 文書ベクトル生成部
20 関連条文特定部
22 分析画面生成部
24 解析ルール記憶部
26 法律条文記憶部
28 関連文献記憶部
30 インターネット
32 会員ユーザ
34 クライアント端末
40 契約書入力画面
42 契約条項
44 送信ボタン
47 文書ベクトル
48 グループ化文書
49 グループ単位の文書ベクトル
50 関連条文情報
52 分析画面データ
60 契約書分析画面
62 関連条文
64 コメントボタン
66 判例ボタン
68 学説ボタン
70 ポップアップウィンドウ
72 注釈タグ
10 Legal document analysis system
11 Contract analysis system
12 Web server
14 AP server
16 Legal Document Analysis Department
18 Document vector generator
20 Related Article Identification Department
22 Analysis screen generator
24 Analysis rule storage
26 Legal Text Storage Department
28 Related literature storage
30 Internet
32 member users
34 Client terminal
40 Contract input screen
42 Contract terms
44 Submit button
47 document vector
48 Grouped documents
49 Group unit document vector
50 Related Article Information
52 Analysis screen data
60 Contract analysis screen
62 Related Articles
64 Comment button
66 Legal Button
68 Theory Button
70 pop-up window
72 Annotation tags
上記の目的を達成するため、請求項1に記載した法律文書解析システムは、文を構成する特定の要素間に「要素A及び要素B並びに要素Cである要素D」という関係が存在する場合に、「要素Aと要素Bである要素D」と「要素Cである要素D」の文を生成すべきことを規定した解析ルールと、文を構成する特定の要素間に「要素A又は要素B若しくは要素Cである要素D」という関係が存在する場合に、「要素Aである要素D」と「要素Bと要素Cである要素D」の文を生成すべきことを規定した解析ルールが格納された解析ルール記憶手段と、入力された法律文書データを形態素単位に分解する形態素解析手段と、各形態素間の係り受け構造を特定する構文解析手段とを備えた法律文書解析システムであって、上記構文解析手段は、上記解析ルール記憶手段を参照し、上記法律文書データ中に上記解析ルールに該当する要素間の関係を備えた文が含まれている場合には、当該解析ルールに定義された変換処理を施した文を生成することを特徴としている。 In order to achieve the above-mentioned object, the legal document analysis system according to claim 1 is provided when there is a relationship of “element D that is element A, element B, and element C” between specific elements constituting the sentence. , “Element A or Element B” between an analysis rule that specifies that a sentence “element D that is element A and element B” and “element D that is element C” should be generated, and a specific element that constitutes the sentence Or, when there is a relationship of “element D that is element C”, an analysis rule that specifies that statements of “element D that is element A” and “element D that is element B and element C” should be generated is stored an analysis rule storage means is, the input legal document data a legal document analysis system comprising a decomposing morphological analysis unit into morphemes, and parsing means for identifying the dependency structure between the morphemes, the syntax analysis means, above When the analysis rule storage means is referenced and the legal document data contains a sentence having a relationship between elements corresponding to the analysis rule, the sentence subjected to the conversion process defined in the analysis rule It is characterized by generating.
請求項2に記載した法律文書解析プログラムは、コンピュータを、文を構成する特定の要素間に「要素A及び要素B並びに要素Cである要素D」という関係が存在する場合に、「要素Aと要素Bである要素D」と「要素Cである要素D」の文を生成すべきことを規定した解析ルールと、文を構成する特定の要素間に「要素A又は要素B若しくは要素Cである要素D」という関係が存在する場合に、「要素Aである要素D」と「要素Bと要素Cである要素D」の文を生成すべきことを規定した解析ルールが格納された解析ルール記憶手段、入力された法律文書データを形態素単位に分解する形態素解析手段、各形態素間の係り受け構造を特定する構文解析手段として機能させるプログラムであって、上記構文解析手段は、上記解析ルール記憶手段を参照し、上記法律文書データ中に上記解析ルールに該当する要素間の関係を備えた文が含まれている場合には、当該解析ルールに定義された変換処理を施した文を生成することを特徴としている。
The legal document analysis program according to claim 2 causes the computer to execute “element A and element B when there is a relationship“ element A, element B, and element C ” between specific elements constituting the sentence. An analysis rule that specifies that a sentence of “element D that is element B” and “element D that is element C” should be generated, and “element A, element B, or element C between specific elements constituting the sentence” An analysis rule memory storing an analysis rule that specifies that a sentence “element D as element A” and “element D as element B and element C” should be generated when the relationship “element D” exists Means, a morpheme analysis means for decomposing input legal document data into morpheme units, and a program for functioning as a syntax analysis means for specifying a dependency structure between each morpheme, wherein the syntax analysis means stores the analysis rule storage unit If the legal document data contains a sentence with the relationship between the elements corresponding to the analysis rule, generate a sentence subjected to the conversion process defined in the analysis rule. It is characterized by.
Claims (4)
入力された法律文書データを形態素単位に分解する形態素解析処理と、
各形態素間の係り受け構造を特定する構文解析処理と、
を実行する法律文書解析システムであって、
上記構文解析処理に際して上記解析ルール記憶手段を参照し、上記法律文書データ中に上記解析ルールに該当する要素間の関係を備えた文が含まれている場合には、当該解析ルールに定義された変換処理を施した文を生成することを特徴とする法律文書解析システム。 It includes an analysis rule storage means for predefining the relationship between specific elements constituting a sentence and the content of conversion processing for each element as an analysis rule specific to a legal document,
Morphological analysis processing that decomposes input legal document data into morpheme units,
A parsing process that identifies the dependency structure between each morpheme,
A legal document analysis system that implements
When the syntax analysis process refers to the analysis rule storage means, and the legal document data includes a sentence having a relationship between elements corresponding to the analysis rule, it is defined in the analysis rule. A legal document analysis system that generates a sentence subjected to conversion processing.
上記構文解析処理に際し、この解析ルールに該当する文に対して、対応の変換処理を施した文が生成されることを特徴とする請求項1に記載の法律文書解析システム。 The above analysis rule defines the parallel relationship between elements,
2. The legal document analysis system according to claim 1, wherein a sentence in which a corresponding conversion process is applied to a sentence corresponding to the analysis rule is generated in the parsing process.
上記構文解析処理に際し、この解析ルールに該当する文に対して、対応の変換処理を施した文が生成されることを特徴とする請求項1または2に記載の法律文書解析システム。 The analysis rule defines an example relationship between elements,
3. The legal document analysis system according to claim 1, wherein a sentence in which a corresponding conversion process is applied to a sentence corresponding to the analysis rule is generated in the parsing process.
文を構成する特定の要素間の関係と、各要素に対する変換処理の内容を、法律文書に特有の解析ルールとして予め定義しておく解析ルール記憶手段、
入力された法律文書データを形態素単位に分解する形態素解析手段、
各形態素間の係り受け構造を特定する構文解析手段、
として機能させるプログラムであって、
上記構文解析手段は、上記解析ルール記憶手段を参照し、上記法律文書データ中に上記解析ルールに該当する要素間の関係を備えた文が含まれている場合には、当該解析ルールに定義された変換処理を施した文を生成することを特徴とする法律文書解析プログラム。 Computer
Analysis rule storage means for predefining the relationship between specific elements constituting a sentence and the content of conversion processing for each element as an analysis rule specific to a legal document,
Morphological analysis means for decomposing input legal document data into morpheme units,
A syntax analysis means for specifying a dependency structure between each morpheme,
A program that functions as
The syntax analysis means refers to the analysis rule storage means, and if the legal document data includes a sentence having a relationship between elements corresponding to the analysis rule, the syntax analysis means is defined in the analysis rule. A legal document analysis program characterized by generating a sentence that has undergone conversion processing.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013119507A JP5383942B1 (en) | 2013-06-06 | 2013-06-06 | Legal document analysis system and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013119507A JP5383942B1 (en) | 2013-06-06 | 2013-06-06 | Legal document analysis system and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5383942B1 JP5383942B1 (en) | 2014-01-08 |
JP2014238628A true JP2014238628A (en) | 2014-12-18 |
Family
ID=50036593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013119507A Expired - Fee Related JP5383942B1 (en) | 2013-06-06 | 2013-06-06 | Legal document analysis system and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5383942B1 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020013524A (en) * | 2018-07-04 | 2020-01-23 | 株式会社LegalForce | Document preparation program and information processing device |
JPWO2021049485A1 (en) * | 2019-09-10 | 2021-03-18 | ||
JP2021114084A (en) * | 2020-01-17 | 2021-08-05 | 富士フイルムビジネスイノベーション株式会社 | Information processing device and program |
US20240257269A1 (en) * | 2023-01-26 | 2024-08-01 | Intuit Inc. | Data-backed customizable compensation estimation based on disparate electronic data sources |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109409625B (en) * | 2018-08-16 | 2021-09-14 | 上海绿狮智能信息科技股份有限公司 | Method for quantitatively evaluating legal affairs |
CN111008261B (en) * | 2018-09-19 | 2023-08-25 | 北京国双科技有限公司 | Method and device for determining referee document based on prepositive document |
JP6963828B2 (en) * | 2018-11-13 | 2021-11-10 | Gva Tech株式会社 | Legal document data correction method, legal document data correction system and legal document data correction program |
JP6582337B1 (en) * | 2018-11-13 | 2019-10-02 | Gva Tech株式会社 | Legal document data correction method, legal document data correction system, and legal document data correction program |
CN111367879A (en) * | 2018-12-26 | 2020-07-03 | 北京国双科技有限公司 | Legal document processing method and device |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4458517B2 (en) * | 2003-11-19 | 2010-04-28 | 株式会社 日立システムアンドサービス | Information extraction apparatus and method |
JP4745422B2 (en) * | 2009-05-29 | 2011-08-10 | 株式会社東芝 | Representative sentence extraction device and program |
-
2013
- 2013-06-06 JP JP2013119507A patent/JP5383942B1/en not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020013524A (en) * | 2018-07-04 | 2020-01-23 | 株式会社LegalForce | Document preparation program and information processing device |
JPWO2021049485A1 (en) * | 2019-09-10 | 2021-03-18 | ||
JP7312841B2 (en) | 2019-09-10 | 2023-07-21 | 株式会社日立製作所 | Law analysis device and law analysis method |
JP2021114084A (en) * | 2020-01-17 | 2021-08-05 | 富士フイルムビジネスイノベーション株式会社 | Information processing device and program |
JP7512596B2 (en) | 2020-01-17 | 2024-07-09 | 富士フイルムビジネスイノベーション株式会社 | Information processing device and program |
US20240257269A1 (en) * | 2023-01-26 | 2024-08-01 | Intuit Inc. | Data-backed customizable compensation estimation based on disparate electronic data sources |
Also Published As
Publication number | Publication date |
---|---|
JP5383942B1 (en) | 2014-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5383943B1 (en) | Contract analysis system, program and method | |
JP5383942B1 (en) | Legal document analysis system and program | |
US11914954B2 (en) | Methods and systems for generating declarative statements given documents with questions and answers | |
Kulkarni et al. | Natural language processing recipes | |
Pinto et al. | Comparing the performance of different NLP toolkits in formal and social media text | |
Bhatia et al. | Mining privacy goals from privacy policies using hybridized task recomposition | |
Tan et al. | Phrase-level sentiment polarity classification using rule-based typed dependencies and additional complex phrases consideration | |
Bhatia et al. | Towards an information type lexicon for privacy policies | |
Vlas et al. | A rule-based natural language technique for requirements discovery and classification in open-source software development projects | |
US10824816B2 (en) | Semantic parsing method and apparatus | |
Chen et al. | Gender bias and under-representation in natural language processing across human languages | |
CN111382571A (en) | Information extraction method, system, server and storage medium | |
de Araujo et al. | Automatic information extraction from texts with inference and linguistic knowledge acquisition rules | |
Osman et al. | From natural language text to visual models: A survey of issues and approaches | |
Wang et al. | Cyber threat intelligence entity extraction based on deep learning and field knowledge engineering | |
US20210073466A1 (en) | Semantic vector rule discovery | |
US20210064820A1 (en) | Machine learning lexical discovery | |
Kramer et al. | Improvement of a naive Bayes sentiment classifier using MRS-based features | |
Ling'en Meng et al. | Research of Semantic Role Labeling and Application in Patent Knowledge Extraction. | |
Xu et al. | Developing and validating a parser-based suicidality detection model in text-based mental health services | |
Staufer et al. | Silencing the Risk, Not the Whistle: A Semi-automated Text Sanitization Tool for Mitigating the Risk of Whistleblower Re-Identification | |
JP2016057810A (en) | Predicate argument structure extraction device, method, program, and computer readable storage medium | |
US20200042594A1 (en) | Proposition identification in natural language and usage thereof | |
Chiruzzo et al. | Spanish HPSG Treebank based on the AnCora Corpus | |
Mestric et al. | Aspect Level Sentiment Analysis Methods Applied to Text in Formal Military Reports |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130924 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131001 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |