JP6640395B1 - 情報処理システム及び情報処理方法 - Google Patents

情報処理システム及び情報処理方法 Download PDF

Info

Publication number
JP6640395B1
JP6640395B1 JP2019038397A JP2019038397A JP6640395B1 JP 6640395 B1 JP6640395 B1 JP 6640395B1 JP 2019038397 A JP2019038397 A JP 2019038397A JP 2019038397 A JP2019038397 A JP 2019038397A JP 6640395 B1 JP6640395 B1 JP 6640395B1
Authority
JP
Japan
Prior art keywords
clause
vector
contract
type
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019038397A
Other languages
English (en)
Other versions
JP2020144421A (ja
Inventor
圭 堀口
圭 堀口
良輔 後藤
良輔 後藤
飯島 健
健 飯島
Original Assignee
株式会社日本法務システム研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=69320923&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP6640395(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 株式会社日本法務システム研究所 filed Critical 株式会社日本法務システム研究所
Priority to JP2019038397A priority Critical patent/JP6640395B1/ja
Priority to JP2019233845A priority patent/JP7325103B2/ja
Application granted granted Critical
Publication of JP6640395B1 publication Critical patent/JP6640395B1/ja
Publication of JP2020144421A publication Critical patent/JP2020144421A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】契約書の作成及びチェックの効率を向上させる情報処理システム及び情報処理方法を提供する。【解決手段】複数の端末と、ネットワークを介して接続するサーバと、で構成する情報処理システムにおいて、サーバは、契約書の条項が変換されたベクトルと当該条項の種類を表す条項種類識別情報もしくは当該条項に対する条項メタデータとの分析した関係が記憶されているストレージと、対象の契約書の対象の条項をベクトルに変換する変換部と、当該分析した関係に基づいて、当該変換後の当該ベクトルを入力として、当該対象の条項の種類を識別する条項種類識別情報もしくは前記対象の条項に対する条項メタデータを予測して出力する予測部と、を有する。【選択図】図4

Description

本発明は、情報処理システム及び情報処理方法に関する。
取引を伴う業務において、互いの取引条件などを記載した契約書は、契約締結時の証拠として機能する重要な書類であり、契約書の作成は、非常に重要な業務である。契約書作成に関する技術として、例えば、特許文献1には、電算機のデータベースには契約類型毎に予め想定される全ての契約パターン、該契約パターン毎のケースであって個々の個別案件毎に修正すべき箇所を表示したケース、想定されるリスク等を蓄積し、契約文書作成者は、前記契約文書作成システムの端末装置で契約類型から案件に類似した契約類型を選択し、選択した契約類型に対応する契約パターンを順次表示させ、表示された契約パターン毎に必要とするケースを選択し、必要に応じて選択されたパターン及びケースに沿ったリスク等を表示させ、全ての選択終了後に全体の契約文書及び個別案件に適合した語句に修正箇所を修正し、契約文書を作成する契約文書作成システムが開示されている。
特開2006−65421号公報
Matteo Pagliardini, Prakhar Gupta, Martin Jaggi、"Unsupervised Learning of Sentence Embeddings using Compositional n-Gram Features", NAACL 2018 - Conference of the North American Chapter of the Association for Computational Linguistics, pages 528-540
特許文献1に記載の技術は、予め想定される全ての契約パターンを用意し、その中から選択されたひな形の契約書を用いることが想定されている。しかしながら、実際の契約においては、予め自社が用意したひな形の契約書を用いる場合だけでなく、初めて自社で契約書を用意する場合や相手側が提示した契約書を用いる場合がある。これらの場合において契約の担当者がその種類の契約に不慣れであると、条項がどのような条項であるのかを把握することが難しいという問題があった。また、契約の担当者がその種類の契約に不慣れであると、個々の条項が自己にとって有利であるのか不利であるのかが分からず契約書の作成及び/またはチェックを行うことが難しいという問題があった。このような問題があるため、契約書の作成及び/またはチェックの効率が悪いという問題がある。
本発明は、上記問題に鑑みてなされたものであり、契約書の作成及び/またはチェックの効率を向上させること可能とする情報処理システム及び情報処理方法を提供することを目的とする。
本発明の第1の態様に係る情報処理システムは、契約書の条項が変換されたベクトルと当該条項の種類を表す条項種類識別情報もしくは当該条項に対する条項メタデータとの分析した関係が記憶されているストレージと、対象の契約書の対象の条項をベクトルに変換する変換部と、前記分析した関係に基づいて、前記変換後の前記ベクトルを入力として、前記対象の条項の種類を識別する条項種類識別情報もしくは前記対象の条項に対する条項メタデータを予測して出力する予測部と、を備える。
この構成によれば、対象の条項に条項種類識別情報を割り当てることで、ユーザは対象の条項の種類を把握することができるので、契約書の条項がどのような条項であるのかをユーザが把握するのを容易化することができる。これにより、契約書の作成及び/またはチェックの効率を向上させることができる。
あるいは、この構成によれば、条項メタデータが契約のどちらの側が不利な条項であることを示唆する場合、対象のユーザは、自己にとって不利な条項を不利にならないように変更したり、自己に不利にならないように条項を新たに追加したりすることができる。また、条項メタデータが契約のどちらの側が有利な条項であることを示唆する場合、対象のユーザは、自己にとって有利な条項を把握しつつ契約書の作成及び/またはチェックを行うことができる。これにより、契約書の作成及び/またはチェックの効率を向上させることができる。
本発明の第2の態様に係る情報処理システムは、第1の態様に係る情報処理システムであって、前記ストレージに記憶されている分析した関係は、標準契約書に含まれるいずれの条項のベクトルとも設定基準以上の類似性がない条項のベクトルを入力とし当該条項に対してユーザが割り当てた条項種類を識別する条項種類識別情報を出力とする教師データとして機械学習した分類モデルであり、前記予測部は、前記分類モデルに前記変換後のベクトルを入力して、前記対象の条項の種類を識別する条項種類識別情報を出力する。
この構成によれば、条項の種類の判別精度を向上させることができる。
本発明の第3の態様に係る情報処理システムは、第1の態様に係る情報処理システムであって、前記ストレージに記憶されている分析した関係は、標準契約書に含まれる条項それぞれに対応するベクトルと、当該条項の種類を表す条項種類識別情報との組であり、前記予測部は、変換後の前記ベクトルを、前記ストレージに記憶されている、標準契約書に含まれる条項それぞれのベクトルと比較し、比較の結果、類似度が基準を満たすベクトルに前記ストレージにおいて関連付けられた条項種類識別情報を出力する。
この構成によれば、対象の条項を、標準契約書に含まれる条項と比較することができ、対象の条項の種類を判断することができる。
本発明の第4の態様に係る情報処理システムは、第3の態様に係る情報処理システムであって、前記ストレージには、標準契約書に含まれる条項それぞれに対応するベクトルと当該条項に付された条項種類識別情報との組に対して、契約書の種類が更に関連付けられて記憶されており、前記対象の契約書の種類を取得する取得部を更に備え、前記予測部は、前記変換後のベクトルを、前記取得部によって取得された前記対象の契約書の種類と同じ種類の標準契約書に含まれる条項それぞれのベクトルと比較する。
この構成によれば、対象の条項を、対象の契約書の種類と同じ種類の標準契約書に含まれる条項と比較することができ、対象の条項の種類の判別精度を向上させることができる。
本発明の第5の態様に係る情報処理システムは、第3または4の態様に係る情報処理システムであって、前記変換部は、対象の契約書に含まれる条項それぞれをベクトルに変換し、前記予測部は、前記変換後のベクトルそれぞれを、前記対象の契約書と同種の標準契約書に含まれる条項それぞれのベクトルと比較し、前記予測部による比較の結果、前記変換後のベクトルのうち、標準契約書に含まれるいずれの条項のベクトルとも設定基準以上の類似性がないベクトルに対応する条項を非類似条項として出力する出力部を更に備える。
この構成によれば、ユーザは標準的な契約書にない条項を把握することができるので、契約書の作成及び/またはチェックを効率化することができる。
本発明の第6の態様に係る情報処理システムは、第5の態様に係る情報処理システムであって、前記出力部によって出力された前記非類似条項のベクトルを入力とし当該条項に対してユーザが割り当てた条項の種類を識別する条項種類識別情報を出力とする教師データを用いて、機械学習することにより分類モデルを更新する更新部を更に備え、前記予測部は、更新後の前記分類モデルに前記変換後のベクトルを入力して、前記対象の条項の種類を識別する条項種類識別情報を出力する。
この構成によれば、更新された分類モデルを用いることにより、条項に正しい条項種類識別情報を割り当てられる精度を向上させることができる。
本発明の第7の態様に係る情報処理システムは、第3または4の態様に係る情報処理システムであって、前記変換部は、対象の契約書に含まれる条項それぞれをベクトルに変換し、前記予測部は、前記変換後のベクトルそれぞれを、前記対象の契約書と同種の標準契約書に含まれる条項それぞれのベクトルと比較し、前記予測部による比較の結果、前記標準契約書に含まれる条項のベクトルのうち、前記変換後のベクトルとの間で設定基準以上の類似性がないベクトルに対応する条項の種類を表す条項種類識別情報に対応する情報を、前記対象の契約書に不足している条項として出力する出力部を更に備える。
この構成によれば、ユーザは標準的な契約書にない条項を把握することができるので、契約書の作成及び/またはチェックを効率化することができる。
本発明の第8の態様に係る情報処理システムは、第1から7のいずれかの態様に係る情報処理システムであって、前記ストレージには、前記条項種類識別情報に対して、一以上の条項データ及び/または条項メタデータが関連付けられて記憶されており、前記対象の契約書に含まれる特定の条項に対する前記ユーザの特定の操作を受け付けた場合、当該特定の条項の種類を識別する条項種類識別情報と同じ条項種類識別情報に前記ストレージにおいて関連付けられた条項データ及び/または条項メタデータを出力する条項データ出力部を更に備える。
この構成によれば、ユーザが選択した条項と同種の他の条項を参照することができるので、契約書の作成を効率化することができる。
本発明の第9の態様に係る情報処理システムは、第1から8のいずれかの態様に係る情報処理システムであって、前記変換部は、対象の契約書の条項を日本語から外国語へ翻訳し、翻訳後の外国語の条項をベクトルに変換する。
この構成によれば、外国語に変換した後にベクトルに変換するので、日本語による表記ゆれを吸収して、ベクトルに変換した後に、意味が近いもの同士をより類似度が高いベクトルに、意味が遠いもの同士をより類似度が低いベクトルに変換することができる。
本発明の第10の態様に係る情報処理システムは、第9の態様に係る情報処理システムであって、前記外国語は、英語である。
この構成によれば、英語に翻訳して、英語からベクトル化することによって、日本語よりも英語の方があいまいでなく構文のゆれが少ないので、ベクトル化したときに日本語からベクトルに変換するよりも、意味が近いもの同士をより類似度が高いベクトルに、意味が遠いもの同士をより類似度が低いベクトルに変換することができる。
本発明の第11の態様に係る情報処理システムは、第1から10のいずれかの態様に係る情報処理システムであって、前記対象の契約書を、条項毎に分割する分割部を更に備え、前記変換部は、前記分割部による分割後の条項をベクトルに変換する。
この構成によれば、対象の契約書を条項毎に分割し、分割後の条項をベクトルに変換するので、対象の契約書のそれぞれの条項に条項種類識別情報を割り当てることができる。
本発明の第12の態様に係る情報処理システムは、第1の態様に係る情報処理システムであって、前記ストレージには、ユーザ区分と当該ユーザ区分にとって有利もしくは不利な標準条項のベクトルとの組と、条項メタデータとの分析した関係が記憶されており、前記予測部は、前記分析した関係に基づいて、対象のユーザの区分と前記対象の条項のベクトルとを入力として、条項メタデータを予測して出力する。
この構成によれば、対象のユーザの区分では不利な条項の場合、条項を変更または追加するよう示唆する条項メタデータが得られるので、対象のユーザは、自己にとって不利な条項を不利にならないように変更したり、自己に不利にならないように条項を新たに追加したりすることができる。また、対象のユーザの区分では有利な条項の場合、有利な条項であることを示唆する条項メタデータが得られるので、対象のユーザは、自己にとって有利な条項を把握しつつ契約書の作成及び/またはチェックを行うことができる。これにより、契約書の作成及び/またはチェックの効率を向上させることができる。
本発明の第13の態様に係る情報処理方法は、条項が変換されたベクトルと当該条項の種類を表す条項種類識別情報もしくは当該条項に対する条項メタデータとの分析した関係が記憶されているストレージが記憶されている情報処理システムが実行する情報処理方法であって、対象の契約書の対象の条項をベクトルに変換するステップと、前記分析した関係に基づいて、前記変換後の前記ベクトルを入力として、前記対象の条項の種類を識別する条項種類識別情報もしくは前記対象の条項に対する条項メタデータを予測して出力するステップと、を有する。
この構成によれば、対象の条項に条項種類識別情報を割り当てることで、ユーザは対象の条項の種類を把握することができるので、契約書の条項がどのような条項であるのかをユーザが把握するのを容易化することができる。これにより、契約書の作成及び/またはチェックの効率を向上させることができる。あるいは、この構成によれば、条項メタデータが得られるので、対象のユーザは、自己にとって不利な条項を不利にならないように変更したり、自己に不利にならないように条項を新たに追加したりすることができる。また、有利な条項であることが示唆する条項メタデータが得られるので、対象のユーザは、自己にとって有利な条項を把握しつつ契約書の作成及び/またはチェックを行うことができる。これにより、契約書の作成及び/またはチェックの効率を向上させることができる。
本発明の一態様によれば、対象の条項に条項種類識別情報を割り当てることで、ユーザは対象の条項の種類を把握することができるので、契約書の条項がどのような条項であるのかをユーザが把握するのを容易化することができる。これにより、契約書の作成及び/またはチェックの効率を向上させることができる。
あるいは、本発明の一態様によれば、条項メタデータが契約のどちらの側が不利な条項であることを示唆する場合、対象のユーザは、自己にとって不利な条項を不利にならないように変更したり、自己に不利にならないように条項を新たに追加したりすることができる。また、条項メタデータが契約のどちらの側が有利な条項であることを示唆する場合、対象のユーザは、自己にとって有利な条項を把握しつつ契約書の作成及び/またはチェックを行うことができる。これにより、契約書の作成及び/またはチェックの効率を向上させることができる。
本実施形態に係る条項の分類モデルの学習方法を説明する模式図である。 本実施形態に係る情報処理システムの概略構成図である。 本実施形態に係る端末の概略構成図である。 本実施形態に係るサーバの概略構成図である。 本実施形態に係るサーバのストレージに記憶されているマスタテーブルの一例である。 本実施形態に係るサーバのストレージに記憶されているテーブルの一例である。 本実施形態に係る処理の一つを説明する模式図である。 条項に含まれる文章の数が三つの場合における条項のベクトル化の一例を示す模式図である。 端末1に表示されるブラウザ画面の第1の例である。 図9において「このタグで検索する」ボタンB1が押された場合のブラウザ画面の一例である。 本実施形態において予測部が類似度を用いて条項に条項種類を割り当てる場合の処理の一例を示すフローチャートである。 本実施形態において条項種類及び類似条項を提示する処理の一例を示すフローチャートである。 本実施形態において予測部が分類モデルを用いて条項に条項種類を割り当てる場合の処理の一例を示すフローチャートである。
以下、各実施形態について、図面を参照しながら説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
本実施形態では、上記の課題に加えてもしくは代えて、以下の課題を解決する。例えば初めて自社で契約書を用意する場合や相手側から契約書を提示された場合などにおいて、契約書の作成及び/またはチェックの効率を向上させたいという課題がある。契約書の作成及び/またはチェックの効率を向上させるためには、対象の契約書の中から、その種類の契約書では一般的でない条項(例えば、共同開発契約書であれば共同開発契約書では一般的でない条項など)を見分けることができれば、その条項に注力してチェックすることができる。しかしながら、対象の契約書の中から、その種類の契約書では一般的でない条項を見分けることが難しいという問題がある。
また、契約書の作成及び/またはチェックの効率を向上させるためには、対象の契約書において、その種類の契約書としては不足している条項(例えば、共同開発契約書であれば共同開発によって生まれた知的財産権の取り扱いを定めた条項など)がどんな条項であるかを把握できれば、その条項を加えることができる。しかしながら、対象の契約書において、その種類の契約書としては不足している条項がどんな条項であるかを把握することが難しいという問題がある。
図1は、本実施形態に係る条項の分類モデルの学習方法を説明する模式図である。図1に示すように、標準的な契約書である標準契約書のデータベースには、標準契約書が条項毎に分割されて保存されている。
(ステップS1)まず例えばサーバは、対象の契約書のデータである契約書データDTを用いて、対象の契約書を条項単位に分割する。そして例えばサーバは、この契約書データDTの条項単位のデータと標準契約書の条項毎のデータとを結合してクラスタリングし(グループ分けし)、条項それぞれのベクトルを取得する。
(ステップS2)例えばサーバは、対象の契約書の条項それぞれのベクトルV11〜V16について、対象の契約書と同種の標準契約書の条項それぞれのベクトルV21〜V26との間で類似度(例えばコサイン類似度)を計算する。本実施形態では、類似度は一例としてコサイン類度であるものとして説明する。
対象の契約書の条項のうち類似度が設定基準以上の条項(ここでは、V12〜V15)を除外する。例えばベクトルV11は、ベクトルV21〜V26それぞれとの類似度が一つも設定基準以上にならなかったので残される。同様に例えばベクトルV16は、ベクトルV21〜V26それぞれとの類似度が一つも設定基準以上にならなかったので残される。これにより、例えばベクトルV11、V16は、標準契約書の中に類似度が設定基準以上の条項がなかったので、例えばサーバは、一般的でない条項としてユーザに示唆する。
一方、例えばサーバは、対象の契約書の条項のうち類似度が設定基準以上の条項(ここでは、V12〜V15)それぞれについて、対象の契約書と同種の標準契約書の条項のベクトルV21〜V26のうち類似度が最も高いベクトルの条項に対応する条項種別を、当該ベクトルの条項種別に割り当てる。具体的には例えばサーバは、条項V12と、類似度が設定基準以上で且つ最も類似しているベクトルV23であるとすると、条項12に対して、ベクトルV23に対応する条項種別を割り当てる。
例えばベクトルV21は、ベクトルV11〜V16それぞれとの類似度が一つも設定基準以上にならなかったので残される。同様に例えばベクトルV21は、ベクトルV11〜V16それぞれとの類似度が一つも設定基準以上にならなかったので残される。これにより、例えばベクトルV21、V26は、対象の契約書の中に類似度が設定基準以上の条項がなかったので、例えばサーバは、その種類の契約書としては不足している条項としてユーザに示唆する。
(ステップS3)ユーザが、類似度が設定基準未満の非類似条項それぞれ(ここでは例えばベクトルV11、V16に対応する条項)に、条項種類を割り当てる。例えば、ユーザがベクトルV11の条項を読んで、「秘密保持」の条項だと判断すれば、ユーザが端末を操作してベクトルV11の条項に対して「秘密保持」を割り当てる。
(ステップS4)続いて、例えばサーバは、非類似条項のベクトルを入力とし当該非類似条項に対してユーザが割り当てた条項種類を識別する条項種類IDを出力とする教師データを用いて、機械学習することによって分類モデルを更新する。
(ステップS5)一定の性能要件を満たした場合、類似度ではなく、この分類モデルを用いて、条項それぞれの種類を予測する。
本実施形態に係る情報処理システムの概略構成図である。図2に示すように、情報処理システムSは一例として、端末1−1〜1−Nと通信回路網CNを介して接続されたサーバ2を備える。情報処理システムSは、端末1−1、…、1−N(Nは自然数)を備えてもよいし、備えなくてもよい。
端末1−1〜1−Nは、別々のユーザが使用する端末装置であり、例えば、多機能携帯電話(いわゆるスマートフォン)などの携帯電話、タブレット、ノートパソコン、またはデスクトップパソコンなどである。端末1−1〜1−Nは例えば、WEBブラウザを用いて、サーバ2から提供される情報を表示する。
サーバ2は情報処理装置の一例であり、端末1−1〜1−Nに対して情報を提供する。以下、端末1−1〜1−Nを総称して端末1とも呼ぶ。
図3は、本実施形態に係る端末の概略構成図である。図3に示すように、端末1は例えば、入力インタフェース11と、通信回路12と、ストレージ13と、メモリ14と、出力インタフェース15と、プロセッサ16とを備える。
入力インタフェース11は、ユーザからの入力を受け付け、受け付けた入力に応じた入力信号をプロセッサ16へ出力する。
通信回路12は、通信回路網CNに接続されて、通信回路網CNに接続されているサーバ2と通信する。この通信は有線であっても無線であってもよい。
ストレージ13には、プロセッサ16が読み出して実行するためのプログラム及び各種のデータが格納されている。
メモリ14は、データ及びプログラムを一時的に保持する。メモリ14は、揮発性メモリであり、例えばRAM(Random Access Memory)である。
出力インタフェース15は、ディスプレイ17と接続されており、プロセッサ16の指令に従って情報をディスプレイ17に出力する。これにより、ディスプレイ17に情報が表示される。なおディスプレイ17は端末1に外付けではなく端末1に内蔵されていてもよい。
プロセッサ16は、ストレージ13から本実施形態に係るプログラムをメモリ14にロードし、当該プログラムに含まれる一連の命令を実行することによって、読込受付部161、編集受付部162、条項データ要求部163、条項種類要求部164.通信制御部165、出力制御部166として機能する。それぞれの処理については後述する。
図4は、本実施形態に係るサーバの概略構成図である。図4に示すように、サーバ2は、入力インタフェース21と、通信回路22と、ストレージ23と、メモリ24と、出力インタフェース25と、プロセッサ26とを備える。
入力インタフェース21は、サーバ2の管理者からの入力を受け付け、受け付けた入力に応じた入力信号をプロセッサ26へ出力する。
通信回路22は、通信回路網CNに接続されて、通信回路網CNに接続されている端末1−1〜1−Nと通信する。この通信は有線であっても無線であってもよい。
ストレージ23は、プロセッサ26が読み出して実行するためのプログラム及び各種のデータが格納されている。
メモリ24は、データ及びプログラムを一時的に保持する。メモリ24は、揮発性メモリであり、例えばRAM(Random Access Memory)である。
出力インタフェース25は、外部の機器(例えばディスプレイと接続されており、プロセッサ26からの指令に従って当該外部の機器に信号(例えば映像信号)を出力する。これにより、例えばディスプレイに映像信号が入力されて情報が表示される。
プロセッサ26は、ストレージ23からプログラムをメモリ24にロードし、当該プログラムに含まれる一連の命令を実行することによって、取得部261、分割部262、変換部263、予測部264、条項データ読出部(条項データ出力部)265、条項種類読出部266、出力部267、更新部268、通信制御部269として機能する。それぞれの処理については後述する。
図5は、本実施形態に係るサーバのストレージに記憶されているマスタテーブルの一例である。図5に示すように、本実施形態に係るサーバ2のストレージ23に記憶されている契約書種類マスタテーブルM1には、契約書種類IDと、条項名との組のレコードが蓄積されている。ここで契約書種類IDは、契約書の種類を識別する契約書種類識別情報の一例である。
図5に示すように、本実施形態に係るサーバ2のストレージ23に記憶されている条項種類マスタテーブルM2には、条項種類IDと、条項名との組のレコードが蓄積されている。ここで条項種類IDは、条項の種類を識別する条項種類識別情報の一例である。
図6は、本実施形態に係るサーバのストレージに記憶されているテーブルの一例である。標準条項テーブルT1には、予め用意された標準的な契約書に含まれる条項に関する情報が格納される。図6に示すように、本実施形態に係るサーバ2のストレージ23に記憶されている標準条項テーブルT1には、契約書種類IDと、条項種類IDと、ベクトルと、条項との組のレコードが蓄積されている。ベクトルは、条項すなわち条項単位の文章群が変換されたものである。ベクトルは例えば、高次元の実数ベクトルである。変換時には、近い意味の条項を近いベクトルに変換される。
このように、ストレージ23には、標準契約書に含まれる条項それぞれに対応するベクトルと当該条項に付された条項種類識別情報(ここでは契約書種類ID)との組に対して、契約書の種類が更に関連付けられて記憶されている。
条項テーブルT2には、ユーザによって入力された契約書に含まれる条項が蓄積されている。図6に示すように、本実施形態に係るサーバ2のストレージ23に記憶されている条項テーブルT2には、契約書種類IDと、条項種類IDと、条項との組のレコードが蓄積されている。
サーバ2のストレージ23には、契約書の条項が変換されたベクトルと当該条項の種類を表す条項種類識別情報(ここでは条項種類ID)との分析した関係が記憶されている。このストレージ23に記憶されている分析した関係は、本実施形態では二種類ある。ストレージ23に記憶されている分析した関係の一つは、標準契約書に含まれる条項それぞれに対応するベクトルと、当該条項の種類を表す条項種類識別情報(ここでは条項種類ID)との組である。ストレージ23に記憶されている分析した関係のもう一つは、標準契約書に含まれるいずれの条項のベクトルとも設定基準以上の類似性がない条項のベクトルを入力とし当該条項に対してユーザが割り当てた条項種類を識別する条項種類識別情報を出力とする教師データとして機械学習した分類モデルである。
図7は、本実施形態に係る処理の一つを説明する模式図である。読込受付部161は、ユーザによる操作に応じて提供された契約書データDTを読み込み、通信制御部165(図3参照)は、契約書データDTをサーバ2へ送信するよう通信回路12を制御する。
編集受付部162は、契約書データDTに対する編集を受け付けて、出力制御部166(図3参照)は編集された契約書データDTをディスプレイ17に表示するよう制御する。
取得部261は、対象の契約書の種類を取得する。その際、例えば、取得部261は、対象の契約書に含まれるタイトルを契約書の種類として取得してもよいし、対象の契約書に含まれるタイトルから契約書の種類を判断してもよい。また、対象の契約書の種類をユーザが指定するようにしてもよく、その場合、取得部261は、端末1がユーザから受け付けた対象の契約書の種類を取得してもよい。
分割部262は、対象の契約書を、条項毎に分割する。この分割の処理は、例えば、分割部262は、「条」という単語を抽出し、この「条」を境目とみなして、条項毎に分割してもよい。
変換部263は、対象の契約書の対象の条項をベクトルに変換する。具体的には例えば、変換部263は、分割部262による分割後の条項をベクトルに変換する。この変換については後述する。
予測部264は、上記分析した関係に基づいて、前記変換後の前記ベクトルを入力として、対象の条項の種類を識別する条項種類識別情報(ここでは条項種類ID)を予測して出力する。
例えばストレージ23に保存された分類モデルが一定の性能要件を満たしていない場合、予測部264は、変換後のベクトルを、ストレージ23に記憶されている、標準契約書に含まれる条項それぞれのベクトルと比較し、比較の結果、類似度が基準を満たすベクトル(ここでは一例として最も類似するベクトル)にストレージ23において関連付けられた条項種類識別情報(ここでは条項種類ID)を出力する。これにより、対象の条項を、標準契約書に含まれる条項と比較することができ、対象の条項の種類を判断することができる。
より詳細には、予測部264は、変換後のベクトルを、取得部261によって取得された対象の契約書の種類と同じ種類の標準契約書に含まれる条項それぞれのベクトルと比較する。これにより、対象の条項を、対象の契約書の種類と同じ種類の標準契約書に含まれる条項と比較することができ、対象の条項の種類の判別精度を向上させることができる。
ここで比較時には、予測部264は例えば、変換後のベクトルと標準契約書に含まれる条項それぞれとの間でコサイン類似度を算出し、算出されたコサイン類似度のうちコサイン類似度が最も高いベクトルにストレージ23において関連付けられた条項種類IDを出力する。これにより、条項の種類を把握することができる。
一方、例えば、ストレージ23に保存された分類モデルが一定の性能要件を満たす場合、予測部264は、この分類モデルに当該変換後のベクトルを入力して、対象の条項の種類を識別する条項種類識別情報(ここでは条項種類ID)を出力する。これにより、条項の種類の判別精度を向上させることができる。
そして、予測部264は、条項それぞれについて、出力した条項種類IDを条項番号と関連付けてストレージ23に蓄積させる。
<ベクトルへの変換処理について>
続いて変換部263におけるベクトルの変換処理の例について説明する。図8は、条項に含まれる文章の数が三つの場合における条項のベクトル化の一例を示す模式図である。図8に示すように、変換部263は、条項に含まれる第1文をベクトルX1に変換する。同様に変換部263は条項に含まれる第2文をベクトルX2に変換する。同様に変換部263は条項に含まれる第3文をベクトルX3に変換する。そして、変換部263は、ベクトルの平均(X1+X2+X3)/3を、当該条項に対応するベクトルとして出力する。
ここで文章からベクトルに変換する処理の例について説明する。
(ステップ1)まず、変換部263は、文章を形態素に分解する。
例えば文が「今日はいい天気です」の場合、「今日」、「は」、「いい」、「天気」、「です」に分割される。
(ステップ2)次に、変換部263は、連続するN個(Nは自然数)の形態素をn−gramとして定義する。例えば、Nが2の場合、n−gramは、以下のように定義される。
N = 2 : (今日, は), (は, いい), (いい 天気), (天気 です)
(ステップ3)変換部263は、仮に三つの文書S1、S2、S3があった場合、以下となるような最適な行列U、Vを計算する。すなわち文書S1のすべてのn−gramは文書S1に最も現れ、文書S2、文書S3に含まれる異なるn−gramは現れない。文書S2、文書S3に関しても同様である。この行列U、Vは、非特許文献1に記載されているものである。行列Uは、センテンス(文章)ごとの値の集合で、行列U、Vの最適化によって学習(最適化関数)を実行することにより、文書のベクトル(分散表現)を導出する。行列Uは、行列Vと大きさの同じで90度傾けた行列で、センテンス(文章)毎の値の集合である。そして変換部263は、行列の片方であるVをもとに、含まれるすべてのn−gram分散表現を平均して文章のベクトル(分散表現ともいう)を得る。
以下、対象の文章(センテンス)Sをベクトルに変換する処理の具体的な手法の例について簡単に説明する。学習時には、行列Vで単語ごとの表現を求める。単語のセンテンス内での出現パターンを学習するためパラメーターUも使う。また行列U、Vを誤差関数を使って最適化する。なお、誤差関数は例えば非特許文献1の式(3)を用いてもよい。
分散表現導出時には、文章(センテンス)SのBag of WordsベクトルDを求める。ベクトルDと行列Vを掛け合わせ、出現頻度を加味したn−gramごとのベクトル表現の平均を取り、文章Sのベクトル表現を求める。
なお、文章をベクトルに変換する処理は、公知のライブラリや公知の方法を用いてもよい。
<条項種類の表示処理について>
条項種類の表示の処理の一例について説明する。図9は、端末1に表示されるブラウザ画面の第1の例である。図9において、端末1において、事業譲渡契約書のデータが読み込まれた場合に、端末1のブラウザに条項毎に表示される。図9では、「第1条」が、ユーザによって選択された場合の画面である。ユーザによって「1条」が選択された場合、図7に示すように条項種類要求部164は、条項番号として「1」をサーバ2に送信して条項種類を要求する。この要求に対して、条項種類読出部266は、条項番号「1」に関連付けて記憶された条項種類IDをストレージ23から読み出す。そして、通信制御部269は、読み出された条項種類IDに対応する情報を端末1へ送信するよう通信回路22を制御する。端末1の出力制御部166は、この情報を受信した場合、条項種類ID(ここでは「事業譲渡」を識別するID)に対応するタグが表示する。これにより、図9のように、「1条」に対して「事業譲渡」のタグR1が付されて表示される。
<類似条項出力処理について>
続いて類似条項出力処理について説明する。図9において、「このタグで検索する」ボタンB1が表示されている。また、「条項を削除」ボタンB2が表示され、「条項を追加」ボタンB3が表示されている。「条項を削除」ボタンB2が押されると、端末1のプロセッサ16は、この条項を削除する。一方、「条項を追加」ボタンB3が押されると、端末1のプロセッサ16は、編集中の条項を追加する。
また、図9において、契約書の種類を選択するセレクトボックスSB1と、条項の種類を選択するセレクトボックスSB2が表示されている。セレクトボックスSB1で契約書の種類が選択され、セレクトボックスSB2で条項の種類が選択された場合、端末1の条項データ要求部163は、この選択された契約書の種類を識別する契約書種類IDと、この選択された条項の種類を識別する条項種類IDをサーバ2へ送信して、当該契約書の種類で且つ当該条項の種類に該当する条項データを要求する。この要求に応じて、サーバ2の条項データ読出部265は、当該受信した契約書種類IDと条項種類IDの組に対応付けられた条項をストレージ23の条項テーブルT2から読み出す。そして、通信制御部165は、この読み出された条項を示す条項データを端末1へ送信する。端末1の出力制御部166は、この条項データをブラウザ画面に表示する。これにより、図9の場合、契約書種類で事業譲渡契約が選択され且つ条項種類として損害賠償が選択されているので、画面領域R2において、他の事業譲渡契約書の損害賠償の条項が表示される。
図10は、図9において「このタグで検索する」ボタンB1が押された場合のブラウザ画面の一例である。図9において、「このタグで検索する」ボタンB1が押されると、当該条項に割り当てられた条項種類と同じ条項種類が割り当てられている他の同種(ここでは事業譲渡譲渡)の契約書の条項が例えば、図10の画面領域R3に表示される。更に、条項タグのセレクトボックスの値が、「損害賠償」から「事業譲渡」に切り替わる。
その際の処理としては、「このタグで検索する」ボタンB1が押されると、端末1の条項データ要求部163は、当該契約書の種類を識別する契約書種類IDと、この割り当てられた条項の種類を識別する条項種類IDをサーバ2へ送信して、当該契約書の種類で且つ当該条項の種類に該当する条項データを要求する。この要求に応じて、サーバ2の条項データ読出部265は、当該受信した契約書種類IDと条項種類IDの組に対応付けられた条項をストレージ23の条項テーブルT2から読み出す。そして、通信制御部165は、この読み出された条項を示す条項データを端末1へ送信する。端末1の出力制御部166は、この条項データをブラウザ画面に表示する。これにより、図10の場合、画面領域R3において、他の事業譲渡契約書の事業譲渡の条項が表示される。
図11は、本実施形態において予測部が類似度を用いて条項に条項種類を割り当てる場合の処理の一例を示すフローチャートである。
(ステップS10)まず、端末1の読込受付部161が契約書データを読み込む。
(ステップS20)次に、端末1の通信制御部165は、この契約書データをサーバ2へ送信する。
(ステップS30)契約書データを受信したサーバ2の取得部261は、契約書の種類を例えば当該契約書に含まれるタイトルから取得する。
(ステップS40)次に、サーバ2の分割部262は、当該契約書を条項毎に分割する。
以下、ステップS50〜S100の処理を、分割された条項毎に実行する。
(ステップS50)サーバ2の変換部263は、対象の契約書の条項を日本語から外国語(ここでは一例として英語)へ翻訳する。
(ステップS60)次にサーバ2の変換部263は翻訳後の外国語(ここでは一例として英語)の条項をベクトルに変換する。これにより、外国語(ここでは一例として英語)に変換した後にベクトルに変換するので、日本語による表記ゆれを吸収して、ベクトルに変換した後に、意味が近いもの同士をより類似度が高いベクトルに、意味が遠いもの同士をより類似度が低いベクトルに変換することができる。特に英語に翻訳して、英語からベクトル化することによって、日本語よりも英語の方があいまいでなく構文のゆれが少ないので、ベクトル化したときに日本語からベクトルに変換するよりも、意味が近いもの同士をより類似度が高いベクトルに、意味が遠いもの同士をより類似度が低いベクトルに変換することができる。
(ステップS70)次に、予測部264は、変換後のベクトルと、標準条項テーブルの同じ種類の契約書の各ベクトルとの類似度(例えばコサイン類似度)を算出する。
(ステップS80)次に、出力部267は、算出した類似度のうち、類似度が設定基準以上である類似度があるか否か判定する。
(ステップS90)ステップS80で、算出した類似度のうち、類似度が設定基準以上である類似度がある場合、出力部267は、類似度が最も高いベクトルに対応する条項種類IDを、条項番号に関連付けてストレージ23に保存する。
(ステップS100)一方、ステップS80で、算出した類似度のうち、類似度が設定基準以上である類似度がない場合、出力部267は、当該条項の条項番号を非類似条項としてストレージ23に保存する。
(ステップS110)次に、サーバ2の出力部267は、非類似条項の条項番号を読み出す。
このように、変換部263は、対象の契約書に含まれる条項それぞれをベクトルに変換する。そして予測部264は、前記変換後のベクトルそれぞれを、前記対象の契約書と同種の標準契約書に含まれる条項それぞれのベクトルと比較する(ここでは一例としてコサイン類似度を算出する)。出力部267は、予測部264による比較の結果、前記変換後のベクトルのうち(例えば、図1のベクトルV11〜V16)、標準契約書に含まれるいずれの条項のベクトルとも設定基準以上の類似性がないベクトル(例えば、図1のベクトルV11、V16の二つのベクトル)に対応する条項を非類似条項として出力する。この構成により、ユーザは標準的な契約書にない条項を把握することができるので、契約書の作成及び/またはチェックを効率化することができる。
ステップS110において、出力部267は、予測部264による比較の結果、標準契約書に含まれる条項のベクトル(例えば、図1のベクトルV21〜V26)のうち、前記変換後のベクトルとの間で設定基準以上の類似性がないベクトル(例えば、図1のベクトルV21、V26の二つのベクトル)に対応する条項の種類を表す条項種類識別情報(ここでは条項種類ID)に対応する情報を、対象の契約書に不足している条項として出力してもよい。この構成により、ユーザは標準的な契約書にない条項を把握することができるので、契約書の作成及び/またはチェックを効率化することができる。
(ステップS120)次に、サーバ2の通信制御部269は、読み出された非類似条項の条項番号、条項毎に分けた契約書データを送信する。
(ステップS130)端末1の出力制御部166は、類似条項の条項番号、条項毎に分けた契約書データを取得した場合、契約書を条項毎に分けて表示するとともに、非類似条項を区別可能に表示する。これにより、ユーザは非類似条項を把握することができ、この非類似条項に対して条項種類を割り当てる。
(ステップS140)端末1のプロセッサ16は、非類似条項に対して条項種類がユーザによって入力されたか否か判定する。
(ステップS150)ステップS140において、類似条項に対して条項種類がユーザによって入力された場合、非類似条項の条項番号と、ユーザによって入力された条項種類を識別する条項種類IDをサーバ2へ送信する。
(ステップS160)サーバ2は、非類似条項の条項番号と条項種類IDを受信した場合、受信した非類似条項の条項番号で特定される条項のベクトルを入力とし受信した条項種類IDを出力とするデータセットを、ストレージ23に保存された教師データに加える。
(ステップS170)サーバ2の更新部268は、一定期間毎または設定されたタイミングで、ストレージ23に保存された教師データを用いて、機械学習を実行することによって、分類モデルを更新する。
このように、更新部268は、出力部267によって出力された非類似条項のベクトルを入力とし当該条項に対してユーザが割り当てた条項の種類を識別する条項種類識別情報(条項種類ID)を出力とする教師データを用いて、機械学習することにより分類モデルを更新する。そして、予測部264は、更新後の分類モデルに変換後のベクトルを入力して、対象の条項の種類を識別する条項種類識別情報(ここでは条項種類ID)を出力する。これにより、更新された分類モデルを用いることにより、条項に正しい条項種類識別情報(ここでは条項種類ID)を割り当てられる精度を向上させることができる。
図12は、本実施形態において条項種類及び類似条項を提示する処理の一例を示すフローチャートである。この処理は、図11または後述する図13の処理が終わった後に実行される処理である。
(ステップS210)端末1の条項種類要求部164は、ユーザによって条項が選択されたか否か判定する。
(ステップS220)ステップS210でユーザによって条項が選択された場合、通信制御部165は、ユーザによって選択された条項の条項番号をサーバ2へ送信するよう制御する。
(ステップS230)サーバ2の条項種類読出部266は、条項番号に対応する条項種類IDをストレージ23から読み出す。
(ステップS240)サーバ2の通信制御部269は、読み出された条項種類IDに対応する情報を端末1へ送信するよう制御する。
(ステップS250)端末1の出力制御部166は、この条項種類IDに対応する情報を受信した場合、この条項種類IDに対応する情報(例えば、図9の「事業譲渡」のタグR1)をブラウザ画面に更に表示する。
(ステップS260)例えば図9のブラウザ画面において、端末1の条項データ要求部163は、「このタグで検索する」ボタンB1が押されたか否かを判定する。
(ステップS270)ステップS260「このタグで検索する」ボタンB1が押されたと判定された場合、端末1の通信制御部165は、「このタグで検索する」ボタンB1が関連付けられている条項の条項種類ID(図9の例では、「事情譲渡」の条項種類ID)をサーバ2へ送信するよう制御する。
(ステップS280)次に、サーバ2の条項データ読出部265は、条項種類IDを受信した場合、ストレージ23の条項テーブルT2において、この条項種類IDに関連付けられた条項を類似条項として少なくとも一つ読み出す。 このように、ストレージ23には、条項種類識別情報(ここでは条項種類ID)に対して、一以上の条項データが関連付けられて記憶されている。条項データ読出部(条項データ出力部)265は、対象の契約書に含まれる特定の条項に対するユーザの特定の操作を受け付けた場合、当該特定の条項の種類を識別する条項種類識別情報(ここでは条項種類ID)と同じ条項種類識別情報(ここでは条項種類ID)にストレージ23において関連付けられた条項データを出力する。これにより、ユーザが選択した条項と同種の他の条項を参照することができるので、契約書の作成を効率化することができる。
なお、ストレージ23には、条項種類識別情報(ここでは条項種類ID)に対して、一以上の条項データに加えてもしくは替えて、その条項データに関連する変更履歴、リスク情報(例えば、その条項がリスクが高いか低いを示す情報)、コメント、及び/または修正条項案、追加の条項案などのデータ(以下、これらを総称して「条項メタデータ」という。)が関連付けられて記憶されていてもよい。その場合、条項データ読出部(条項データ出力部)265は、対象の契約書に含まれる特定の条項に対するユーザの特定の操作を受け付けた場合、当該特定の条項の種類を識別する条項種類識別情報(ここでは条項種類ID)と同じ条項種類識別情報(ここでは条項種類ID)にストレージ23において関連付けられた条項データ及び/または及び条項メタデータを出力してもよい。
(ステップS290)サーバ2の通信制御部165は、ステップS280で読み出された条項のデータを端末1へ送信するよう制御する。
(ステップS300)端末1の出力制御部166は、条項のデータを受信した場合、この受信した条項データを例えばブラウザ画面に更に表示する。これにより、ユーザが選択した条項と同種の他の条項を参照することができるので、契約書の作成を効率化することができる。
図13は、本実施形態において予測部が分類モデルを用いて条項に条項種類を割り当てる場合の処理の一例を示すフローチャートである。ステップS410〜S460の処理は、図11のステップS10〜S60と同じであるので、その説明を省略する。なお、条項毎にステップS450〜S480の処理が繰り返される。
(ステップS470)サーバ2の予測部264は、分類モデルに前記変換後のベクトルを入力して、対象の条項の種類を識別する条項種類IDを出力する。
(ステップS480)次に、サーバ2の予測部264は、対象の条項について、条項番号とステップS470で出力された条項種類IDの組をストレージ23に保存する。
(ステップS490)サーバ2の通信制御部269は、条項毎に分けた契約書データを送信する。
(ステップS500)端末1の出力制御部166は、条項毎に分けた契約書データを受信した場合、この条項毎に分けた契約書データを用いて、契約書を条項毎に分けて表示する。
以上、本実施形態に係る情報処理システムSは、契約書の条項が変換されたベクトルと当該条項の種類を表す条項種類識別情報との分析した関係が記憶されているストレージ23を備える。更に情報処理システムSは、対象の契約書の対象の条項をベクトルに変換する変換部を備える。更に情報処理システムSは、前記分析した関係に基づいて、前記変換後の前記ベクトルを入力として、前記対象の条項の種類を識別する条項種類識別情報を予測して出力する予測部264を備える。
この構成によれば、対象の条項に条項種類識別情報を割り当てることで、ユーザは対象の条項の種類を把握することができるので、契約書の条項がどのような条項であるのかをユーザが把握するのを容易化することができる。
なお、本実施形態ではストレージ23に、契約書の条項が変換されたベクトルと当該条項の種類を表す条項種類識別情報との分析した関係が記憶されていたが、これに限らず、
これに加えてもしくは替えて、契約書の条項が変換されたベクトルと当該条項に対する条項メタデータ(例えば、その条項のリスク度、条項の変更または追加を促すコメント、修正条項案、追加すべき条項など)との分析した関係が記憶されていてもよい。その場合、予測部264は、この分析した関係に基づいて、前記変換後の前記ベクトルを入力として、対象の条項の条項メタデータを予測して出力してもよい。
この構成によれば、条項メタデータが契約のどちらの側が不利な条項であることを示唆する場合、対象のユーザは、自己にとって不利な条項を不利にならないように変更したり、自己に不利にならないように条項を新たに追加したりすることができる。また、条項メタデータが契約のどちらの側が有利な条項であることを示唆する場合、対象のユーザは、自己にとって有利な条項を把握しつつ契約書の作成及び/またはチェックを行うことができる。これにより、契約書の作成及び/またはチェックの効率を向上させることができる。
更例えば売買契約書の場合、その契約当事者であるユーザが買主か売主か(すなわち契約当事者の立場)によって、ある条項が有利か不利かが変わってくるし、ある別の条項(例えば、買主であれば売主が瑕疵責任を有する条項など)を追加すべきか否かが変わってくる。また、契約書は、契約当事者の立場だけでなく、(1)法人、個人、大企業、中小企業、民間企業などの営利団体、大学などの非営利団体といった当事者の区分によって、ある条項が有利か不利かが変わってくるし、ある別の条項を追加するか否かが変わってくる。また(2)金額の多寡、期間などの重要な指標である重要指標区分は、重点的にチェックすべきである。
(2)の金額の多寡は、例えば、ある種類のライセンス契約では売上額の5%がライセンス料であるのが標準のところ、相手方から提示された契約書のドラフトに売上額の10%がライセンス料であると記載があった場合には、ライセンスを受ける側にとって不利である。すなわち、契約書に記載された金額の多寡も、契約当事者の立場または当事者の区分によって、有利か不利かが変わってくる。
そのため、本実施形態に係る情報処理システムにおいて、予測部264は、契約当事者であるユーザの区分(例えば、契約当事者の立場、当事者の区分など)の観点から、対象の条項(ユーザが読み込ませた契約書の条項)が不利な場合には、条項の変更を示唆するかもしくは条項を追加するよう示唆する条項メタデータを出力してもよい。
具体的には例えば、対象の条項(ユーザが読み込ませた契約書の条項)のベクトルを、ユーザの区分及び/または重要指標区分に応じて有利もしくは不利と判別できる標準条項のデータセットに含まれる標準条項のベクトルと比較し、対象のベクトルと標準条項のベクトルとの類似度が基準を満たす場合、当該標準条項のデータセットに含まれる条項メタデータ(例えば、修正条項例、追加条項例、コメントなど)を出力してもよい。
<例1>
例えば、ストレージ23には、ある種類の条項(例えば、停止条項など)について、契約書識別情報(例えば、売買契約書を識別する契約書ID)と、ユーザ区分(例えば、買主)と、当該ユーザ区分にとって不利な標準条項(例えば、X条項)と、条項メタデータ(例えば「この条項は不利です。○○と変更することをお勧めします」というコメント)が関連付けられて記憶されている。その場合に、ユーザが提供した契約書の当該種類の条項にA条項が含まれていた場合について説明する。
サーバ2のプロセッサ26は、例えば、A条項がX条項に設定基準以上類似し(例えば、A条項のベクトルとX条項のベクトルのコサイン類似度が閾値以上の場合)且つ対象のユーザがX条項にストレージ23において関連付けられたユーザ区分である買主に該当する場合、「この条項は不利です。○○と変更することをお勧めします」というコメントを条項メタデータとして出力してもよい。
<例2>
例えば、ストレージ23には、ある種類の条項(例えば、停止条項など)について、契約書識別情報(例えば、売買契約書を識別する契約書ID)と、ユーザ区分(例えば、買主)と、当該ユーザ区分にとって不利な標準条項(例えば、Y条項)と、条項メタデータ(例えば「以下の条項を追加することをお勧めします」というコメントと、当該お勧めする条項C)が関連付けられて記憶されている。その場合に、ユーザが提供した契約書の当該種類の条項にB条項が含まれていた場合について説明する。
予測部264は、例えば、B条項がY条項に設定基準以上類似し(例えば、B条項のベクトルとY条項のベクトルのコサイン類似度が閾値以上の場合)且つ対象のユーザがY条項にストレージ23において関連付けられたユーザ区分である買主に該当する場合、「以下の条項を追加することをお勧めします」というコメントとともに条項Cを出力してもよい。
なお、不利な標準条項に加えてまたは替えて、有利な標準条項がストレージ23に記憶されていてもよい。
このように、ストレージ23には、ユーザ区分(例えば、買主)と、当該ユーザ区分にとって有利もしくは不利な標準条項(例えば、Y条項)のベクトルと、条項メタデータ(例えば「以下の条項を追加することをお勧めします」というコメントと、当該お勧めする条項C)が関連付けられて記憶されていてもよい。そして、予測部264は、例えば、対象の条項のベクトルがストレージ23に記憶されている標準条項のベクトルに設定基準以上類似し且つ対象のユーザの区分が当該標準条項のベクトルにストレージ23で関連付けられたユーザ区分に該当する場合、当該対象条項のベクトルと当該ユーザ区分の組にストレージ23で関連付けられた条項メタデータを出力してもよい。
この構成により、対象のユーザの区分では不利な条項の場合、条項を変更または追加するよう示唆する条項メタデータが得られるので、対象のユーザは、自己にとって不利な条項を不利にならないように変更したり、自己に不利にならないように条項を新たに追加したりすることができる。また、対象のユーザの区分では有利な条項の場合、有利な条項であることが示唆する条項メタデータが得られるので、対象のユーザは、自己にとって有利な条項を把握しつつ契約書の作成及び/またはチェックを行うことができる。これにより、契約書の作成及び/またはチェックの効率を向上させることができる。
なお、ストレージ23には、ユーザ区分と、当該ユーザ区分にとって有利もしくは不利な標準条項のベクトルと、条項メタデータの組に対して、契約書識別情報が更に関連付けられて記憶されていてもよい。
その場合、予測部264は、例えば、対象の条項のベクトルがストレージ23に記憶されている標準条項のベクトルに設定基準以上類似し、対象の契約書の契約書識別情報が当該標準条項のベクトルにストレージ23で関連付けられた契約書識別情報に一致し、且つ対象のユーザの区分が当該標準条項のベクトルにストレージ23で関連付けられたユーザ区分に該当する場合、当該対象条項のベクトルと当該ユーザ区分の組にストレージ23で関連付けられた条項メタデータを出力してもよい。
なお、上記のようにルールベースで条項メタデータを出力することに限らず、機械学習により得られた助言モデルを用いて条項メタデータを出力してもよい。ここで助言モデルは例えば、ユーザ区分と当該ユーザ区分にとって有利もしくは不利な標準条項のベクトルとの組を入力とし条項メタデータを出力とする教師データとして機械学習したモデルであり、ストレージ23に記憶されていてもよい。この場合、サーバ2のプロセッサ26は、この助言モデルに対象のユーザの区分と前記対象の条項のベクトルとを入力して、条項メタデータを出力する予測部として機能してもよい。
以上のように、サーバ2のプロセッサ26は、ユーザ区分と当該ユーザ区分にとって有利もしくは不利な標準条項のベクトルとの組と、条項メタデータとの分析した関係(例えば、上記のルールベースの関係または上記の助言モデル)に基づいて、対象のユーザの区分と対象の条項のベクトルとを入力として、条項メタデータを予測して出力する予測部として機能してもよい。
この構成によれば、対象のユーザの区分では不利な条項の場合、条項を変更または追加するよう示唆する条項メタデータが得られるので、対象のユーザは、自己にとって不利な条項を不利にならないように変更したり、自己に不利にならないように条項を新たに追加したりすることができる。また、対象のユーザの区分では有利な条項の場合、有利な条項であることが示唆する条項メタデータが得られるので、対象のユーザは、自己にとって有利な条項を把握しつつ契約書の作成及び/またはチェックを行うことができる。これにより、契約書の作成及び/またはチェックの効率を向上させることができる。
なお、この分析した関係は、ユーザ区分と当該ユーザ区分にとって有利もしくは不利な標準条項のベクトルとの組と、条項メタデータとの分析した関係に限らず、契約書識別情報とユーザ区分と当該ユーザ区分にとって有利もしくは不利な標準条項のベクトルとの組と、条項メタデータとの分析した関係であってもよい。
なお、上述した実施形態で説明したサーバ2の少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ハードウェアで構成する場合には、情報処理システム1の少なくとも一部の機能を実現するプログラムをフレキシブルディスクやCD−ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
また、サーバ2の少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
さらに、一つまたは複数の情報処理装置によってサーバ2を情報処理システムとして機能させてもよい。複数の情報処理装置を用いて場合、情報処理装置のうちの1つをコンピュータとし、当該コンピュータが所定のプログラムを実行することにより、情報処理システムの少なくとも1つの手段として機能が実現されてもよい。
また、方法の発明においては、全ての工程(ステップ)をコンピュータによって自動制御で実現するようにしてもよい。また、各工程をコンピュータに実施させながら、工程間の進行制御を人の手によって実施するようにしてもよい。また、さらには、全工程のうちの少なくとも一部を人の手によって実施するようにしてもよい。
以上、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
1 端末
11 入力インタフェース
12 通信回路
13 ストレージ
14 メモリ
15 出力インタフェース
16 プロセッサ
161 読込受付部
162 編集受付部
163 条項データ要求部
164 条項種類要求部
165 通信制御部
166 出力制御部
17 ディスプレイ
2 サーバ
21 入力インタフェース
22 通信回路
23 ストレージ
24 メモリ
25 出力インタフェース
26 プロセッサ
261 取得部
262 分割部
263 変換部
264 予測部
265 条項データ読出部(条項データ出力部)
266 条項種類読出部
267 出力部
268 更新部
269 通信制御部
S 情報処理システム

Claims (14)

  1. 対象の契約書と同種の標準契約書に含まれる条項それぞれのベクトルが記憶されているストレージと、
    対象の契約書に含まれる条項それぞれをベクトルに変換する変換部と、
    前記変換後のベクトルそれぞれを、前記ストレージを参照して前記対象の契約書と同種の標準契約書に含まれる条項それぞれのベクトルと比較する予測部と、
    前記予測部による比較の結果、前記変換後のベクトルのうち、標準契約書に含まれるいずれの条項のベクトルとも設定基準以上の類似性がないベクトルに対応する条項を非類似条項として出力する出力部と、
    を備える情報処理システム。
  2. 前記出力部によって出力された前記非類似条項のベクトルを入力とし当該条項に対してユーザが割り当てた条項の種類を識別する条項種類識別情報を出力とする教師データを用いて、機械学習することにより分類モデルを更新する更新部を更に備え、
    前記予測部は、更新後の前記分類モデルに前記変換後のベクトルを入力して、前記対象の条項の種類を識別する条項種類識別情報を出力する
    請求項1に記載の情報処理システム。
  3. 対象の契約書と同種の標準契約書に含まれる条項それぞれのベクトルと当該条項の種類を識別する条項種類識別情報が関連付けられて記憶されているストレージと、
    対象の契約書に含まれる条項それぞれをベクトルに変換する変換部と、
    前記変換後のベクトルそれぞれを、前記ストレージを参照して前記対象の契約書と同種の標準契約書に含まれる条項それぞれのベクトルと比較する予測部と、
    前記予測部による比較の結果、前記ストレージを参照して前記標準契約書に含まれる条項のベクトルのうち、前記変換後のベクトルとの間で設定基準以上の類似性がないベクトルに対応する条項の種類を表す条項種類識別情報に対応する情報を、前記対象の契約書に不足している条項として出力する出力部と、
    を備える情報処理システム。
  4. 前記ストレージには、契約書の条項が変換されたベクトルと当該条項の種類を表す条項種類識別情報もしくは当該条項に対する条項メタデータとの分析した関係が記憶されており
    前記予測部は、前記分析した関係に基づいて、前記変換後の前記ベクトルを入力として、前記対象の条項の種類を識別する条項種類識別情報もしくは前記対象の条項に対する条項メタデータを予測して出力する
    請求項1から3のいずれか一項に記載の情報処理システム。
  5. 前記ストレージに記憶されている分析した関係は、標準契約書に含まれるいずれの条項
    のベクトルとも設定基準以上の類似性がない条項のベクトルを入力とし当該条項に対して
    ユーザが割り当てた条項種類を識別する条項種類識別情報を出力とする教師データとして
    機械学習した分類モデルであり、
    前記予測部は、前記分類モデルに前記変換後のベクトルを入力して、前記対象の条項の
    種類を識別する条項種類識別情報を出力する
    請求項に記載の情報処理システム。
  6. 前記ストレージに記憶されている分析した関係は、標準契約書に含まれる条項それぞれに対応するベクトルと、当該条項の種類を表す条項種類識別情報との組であり、
    前記予測部は、変換後の前記ベクトルを、前記ストレージに記憶されている、標準契約書に含まれる条項それぞれのベクトルと比較し、比較の結果、類似度が基準を満たすベクトルに前記ストレージにおいて関連付けられた条項種類識別情報を出力する
    請求項に記載の情報処理システム。
  7. 前記ストレージには、標準契約書に含まれる条項それぞれに対応するベクトルと当該条項に付された条項種類識別情報との組に対して、契約書の種類が更に関連付けられて記憶されており、
    前記対象の契約書の種類を取得する取得部を更に備え、
    前記予測部は、前記変換後のベクトルを、前記取得部によって取得された前記対象の契約書の種類と同じ種類の標準契約書に含まれる条項それぞれのベクトルと比較する
    請求項に記載の情報処理システム。
  8. 前記ストレージには、条項種類識別情報に対して、一以上の条項データ及び/または条項メタデータが関連付けられて記憶されており、
    前記対象の契約書に含まれる特定の条項に対するユーザの特定の操作を受け付けた場合、当該特定の条項の種類を識別する条項種類識別情報と同じ条項種類識別情報に前記ストレージにおいて関連付けられた条項データ及び/または条項メタデータを出力する条項データ出力部
    を更に備える請求項1から7のいずれか一項に記載の情報処理システム。
  9. 前記変換部は、対象の契約書の条項を日本語から外国語へ翻訳し、翻訳後の外国語の条項をベクトルに変換する
    請求項1から8のいずれか一項に記載の情報処理システム。
  10. 前記外国語は、英語である
    請求項9に記載の情報処理システム。
  11. 前記対象の契約書を、条項毎に分割する分割部を更に備え、
    前記変換部は、前記分割部による分割後の条項をベクトルに変換する
    請求項1から10のいずれか一項に記載の情報処理システム。
  12. 前記ストレージには、ユーザ区分と当該ユーザ区分にとって有利もしくは不利な標準条項のベクトルとの組と、条項メタデータとの分析した関係が記憶されており、
    前記予測部は、前記分析した関係に基づいて、対象のユーザの区分と前記対象の条項のベクトルとを入力として、条項メタデータを予測して出力する
    請求項に記載の情報処理システム。
  13. 対象の契約書と同種の標準契約書に含まれる条項それぞれのベクトルが記憶されているストレージを備える情報処理システムが実行する情報処理方法であって、
    対象の契約書に含まれる条項それぞれをベクトルに変換するステップと、
    前記変換後のベクトルそれぞれを、前記ストレージを参照して前記対象の契約書と同種の標準契約書に含まれる条項それぞれのベクトルと比較するステップと、
    前記比較の結果、前記変換後のベクトルのうち、標準契約書に含まれるいずれの条項のベクトルとも設定基準以上の類似性がないベクトルに対応する条項を非類似条項として出力するステップと、
    を有する情報処理方法。
  14. 対象の契約書と同種の標準契約書に含まれる条項それぞれのベクトルと当該条項の種類を識別する条項種類識別情報が関連付けられて記憶されているストレージを備える情報処理システムが実行する情報処理方法であって、
    対象の契約書に含まれる条項それぞれをベクトルに変換するステップと、
    前記変換後のベクトルそれぞれを、前記ストレージを参照して前記対象の契約書と同種の標準契約書に含まれる条項それぞれのベクトルと比較するステップと、
    前記比較の結果、前記ストレージを参照して前記標準契約書に含まれる条項のベクトルのうち、前記変換後のベクトルとの間で設定基準以上の類似性がないベクトルに対応する条項の種類を表す条項種類識別情報に対応する情報を、前記対象の契約書に不足している条項として出力するステップと、
    を有する情報処理方法。
JP2019038397A 2019-03-04 2019-03-04 情報処理システム及び情報処理方法 Active JP6640395B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019038397A JP6640395B1 (ja) 2019-03-04 2019-03-04 情報処理システム及び情報処理方法
JP2019233845A JP7325103B2 (ja) 2019-03-04 2019-12-25 情報処理システム及び情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019038397A JP6640395B1 (ja) 2019-03-04 2019-03-04 情報処理システム及び情報処理方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019233845A Division JP7325103B2 (ja) 2019-03-04 2019-12-25 情報処理システム及び情報処理方法

Publications (2)

Publication Number Publication Date
JP6640395B1 true JP6640395B1 (ja) 2020-02-05
JP2020144421A JP2020144421A (ja) 2020-09-10

Family

ID=69320923

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019038397A Active JP6640395B1 (ja) 2019-03-04 2019-03-04 情報処理システム及び情報処理方法

Country Status (1)

Country Link
JP (1) JP6640395B1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021176628A1 (ja) * 2020-03-05 2021-09-10 株式会社LegalForce 文書作成プログラム及び情報処理装置
KR20210117601A (ko) * 2020-03-19 2021-09-29 주식회사 포스코 불공정 약관 예측 방법 및 시스템

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023021685A1 (ja) * 2021-08-20 2023-02-23 株式会社LegalOn Technologies 契約書レビュープログラム、契約書レビュー装置、及び契約書レビュー方法
JP7169421B1 (ja) 2021-12-15 2022-11-10 三井住友ファイナンス&リース株式会社 電子契約書作成支援システム、方法、およびプログラム
WO2024047918A1 (ja) * 2022-09-02 2024-03-07 株式会社LegalOn Technologies 情報処理方法、情報処理装置、情報処理プログラム及び情報処理システム
JP7366473B1 (ja) 2022-12-12 2023-10-23 知念芳文 文書処理プログラム及び情報処理装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012173824A (ja) * 2011-02-18 2012-09-10 Hitachi Ltd 契約書作成支援システム
US9305082B2 (en) * 2011-09-30 2016-04-05 Thomson Reuters Global Resources Systems, methods, and interfaces for analyzing conceptually-related portions of text
JP5998035B2 (ja) * 2012-12-11 2016-09-28 株式会社日立製作所 文書作成支援装置、文書作成支援方法及び文書作成支援プログラム
JP5383943B1 (ja) * 2013-06-06 2014-01-08 株式会社野村総合研究所 契約書分析システム、プログラム及び方法
CN108399482B (zh) * 2018-01-17 2022-04-29 创新先进技术有限公司 合同的评估方法、装置和电子设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021176628A1 (ja) * 2020-03-05 2021-09-10 株式会社LegalForce 文書作成プログラム及び情報処理装置
US11966645B2 (en) 2020-03-05 2024-04-23 Legalon Technologies, Inc. Document creation method, information processing device and non-transitory computer-readable medium
KR20210117601A (ko) * 2020-03-19 2021-09-29 주식회사 포스코 불공정 약관 예측 방법 및 시스템
KR102494012B1 (ko) * 2020-03-19 2023-01-30 주식회사 포스코 불공정 약관 예측 방법 및 시스템

Also Published As

Publication number Publication date
JP2020144421A (ja) 2020-09-10

Similar Documents

Publication Publication Date Title
JP6640395B1 (ja) 情報処理システム及び情報処理方法
US11727203B2 (en) Information processing system, feature description method and feature description program
Rai Identifying key product attributes and their importance levels from online customer reviews
WO2021114810A1 (zh) 基于图结构的公文推荐方法、装置、计算机设备及介质
KR102285142B1 (ko) 챗봇을 위한 학습 데이터 추천 장치 및 방법
JP4746439B2 (ja) 文書検索サーバおよび文書検索方法
KR20190015797A (ko) 인공지능(ai)을 통한 딥러닝훈련모듈과, 순위화프레임워크모듈을 활용하여, 법률전문가에게 최적화된 모범답안을 제시하는 한편, 법률정보를 의미 벡터로 변환하여, 데이터베이스에 저장하고, 이에 대한 문자열 사전모듈을 활용한 온라인 법률정보사전을 제공하는 시스템 및 그 방법
US20180293215A1 (en) Method and Computer Program for Sharing Memo between Electronic Documents
JP2020035019A (ja) 情報処理装置、情報処理方法及びプログラム
JP2015138351A (ja) 情報検索装置、情報検索方法および情報検索プログラム
JP6841394B1 (ja) 情報処理システム
JP7456137B2 (ja) 情報処理装置及びプログラム
JP2018084983A (ja) コンテンツマッチングシステム
US20200387505A1 (en) Information processing system, feature description method and feature description program
US20220343087A1 (en) Matching service requester with service providers
JP7325103B2 (ja) 情報処理システム及び情報処理方法
KR102519955B1 (ko) 토픽 키워드의 추출 장치 및 방법
KR101723310B1 (ko) 특허공보를 기반으로한 대리인 검색 서비스 제공 시스템 및 방법
JP2008152359A (ja) システム基盤構成策定支援システム及び支援方法
KR101592670B1 (ko) 인덱스를 이용하는 데이터 검색 장치 및 이를 이용하는 방법
JP2021114070A (ja) 情報検索装置、情報検索方法、および情報検索プログラム
JP6181890B2 (ja) 文献解析装置、文献解析方法およびプログラム
KR102662784B1 (ko) 인공지능을 이용한 자동 가명처리기법 추천 방법
JP6296651B2 (ja) 文書間関係抽出装置およびプログラム
JP7193890B2 (ja) 文書情報評価装置および文書情報評価方法並びに文書情報評価プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190312

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190312

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190318

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190709

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191225

R150 Certificate of patent or registration of utility model

Ref document number: 6640395

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350