WO2021049485A1

WO2021049485A1 - 法律分析装置、及び法律分析方法

Info

Publication number: WO2021049485A1
Application number: PCT/JP2020/033945
Authority: WO
Inventors: 井奥　章; 恭介村井
Original assignee: 株式会社日立製作所
Priority date: 2019-09-10
Filing date: 2020-09-08
Publication date: 2021-03-18
Also published as: JPWO2021049485A1; JP7312841B2

Abstract

法律分析装置においては、関連する法律の対応関係を示す法律対応づけ情報と複数の法律に含まれる単語の出現を管理する語句出現情報とを記憶する記憶部と、複数の法律を分析する法律分析部と、法律分析部の分析結果を提示する提示部と、を有する。法律分析部は、法律に対する質問文と分析したい必須法律を含む分析要求を受け付ける入力受付部と、入力受付部によって受け付けられた分析要求から指定語を抽出し、指定語を含む第１の法律を語句出現情報に基づいて、検索する検索部と、法律対応づけ情報に基づいて、第１の法律と関連する関連法律を抽出し、第１の法律と前記関連法律を出力する法律特定部と、必須法律と指定語に基づいて語彙辞書を参照して関連語を抽出し、語句出現情報の法律毎に前記関連語を追加する分析部と、法律特定部から出力された第1の法律と関連法律から、分析部により追加された関連語を含む語彙出現情報に基づいて、分析対象となる法律を特定する統合部とを有する。

Description

法律分析装置、及び法律分析方法

　本発明は、法律文書を分析する技術に関する。

　従来から、社会課題やビジネス環境等の変化に応じて、法律は変化している。新しい法律が施行されたり、既存の法律が改正されたりすることで、社会変化にあわせて法制度は整備される。一方で、過去の事案については、改正前の法律で、引き続き解釈しなければならない事案も多い。総じて、参照すべき法律の母数は、増えており、そのなかかから、目的に応じて法律を解釈する必要がある。かかる状況下、法律情報を効率的に収集し、的確に解釈することは容易ではない。

　裁判所や弁護士等の士業の専門家にとどまらず、法的解釈の主体や対象情報が拡大しており、さらなる効率化が求められる業務が増えている。

　行政の現場での自治体職員で例示すると、国や省庁の法令に違反しない範囲で独自の条例や規則などを定め、それに準拠した制度やサービスを一般市町村民に対して提供する職務がある。そのため、法令が改正されると、それに従い条例や規則などを改正し、提供するサービスを見直すことが必要となる。

　しかし、法令は膨大かつ多岐に渡り、頻繁に改正が発生するため、自治体職員が迅速かつ的確にキャッチアップしていくことが困難である。さらに、参照すべき法令が特定できたとしても、条文構造は複雑になりがちで調査の時間と精度の面で問題が生じやすい。係る状況下でも法令を遵守した業務遂行や行政サービスの担保が求められる。

　例えば、法改正等に際して、特別法と一般法といった複数の法律の間の依存関係の状態などを人間が把握して、適切な影響範囲を探し出そうとすると、分析者の労力や分析に要する時間を多く費やしてしまう。法律間をまたがって依存関係の状態を分析者（ユーザ）が自ら把握することは、各種法的知識（条文の文法、条文間の関係、法律間の関係）の双方への深い理解が必要になるため、法律の数、規模と複雑さの拡大に伴い、一層難しくなっている。

　特許文献１は、法律専門家以外の一般のユーザであっても、契約書が孕む危険性や問題点を自ら認識できるように、契約書の内容に応じて必要な法律情報を提示可能な技術を提供している。

特許第５３８３９４３号明細書

　特許文献１は、複数の法令に含まれる複数の法律条文について、条文毎の文書ベクトルを生成する処理と、各条文の文書ベクトル同士を比較し、所定の閾値以上の類似性を有する複数の条文を合体させた条文グループを生成する処理と、各条文グループについて、条文グループ毎の文書ベクトルを生成する処理と、入力された契約書データについて、条項毎の文書ベクトルを生成する処理と、この条項毎の文書ベクトルと、上記条文グループ毎の文書ベクトルとを比較し、類似する条文グループに含まれる各法律条文を、当該契約条項の関連条文と特定する処理と、契約条項毎に関連条文を列記した分析結果画面を生成する処理と、を実行する契約書分析システムを提供するものである。ここで「文書ベクトル」とは、各文書に含まれるキーワードの組合せと出現頻度に基づいて文書の特徴をベクトルとして表現する技術である。

　特許文献１で開示されている技術は、大規模な文書情報の中から、所望の文書を効率的に発見するための技術の一つであり、入力されたキーワードを含む文書を発見することで、ユーザが所望の文書を効率的に入手することができる。

　特許文献１で各法律条文と比較対比されるものは、契約書の条項であり、共に法律あるいは法律に近い様式の文書を対象としているが、ユーザからの質問文等の分析要求においては、法律文書（条文等）とは同一ではないキーワード（単語等）で分析要求が表現されることが少なくない。法律条文等を構成する単語等と分析要求に示される単語等とが異なる場合にも、単語の意味の関連性（類似性等）に注目し、関連条文を精度よく効率的に提示することについては、特許文献１で言及されていない。

　本発明は、上記事情に鑑みなされたものであり、その目的は、ユーザからの質問文等の分析要求に対し、法律を容易且つ適切に分析することのできる技術を提供することにある。

　上記目的を達成するため、法律分析装置においては、関連する法律の対応関係を示す法律対応づけ情報と複数の法律に含まれる単語の出現を管理する語句出現情報とを記憶する記憶部と、複数の法律を分析する法律分析部と、法律分析部の分析結果を提示する提示部と、を有する。法律分析部は、法律に対する質問文と分析したい必須法律を含む分析要求を受け付ける入力受付部と、入力受付部によって受け付けられた分析要求から指定語を抽出し、指定語を含む第１の法律を語句出現情報に基づいて、検索する検索部と、法律対応づけ情報に基づいて、第１の法律と関連する関連法律を抽出し、第１の法律と前記関連法律を出力する法律特定部と、必須法律と指定語に基づいて語彙辞書を参照して関連語を抽出し、語句出現情報の法律毎に前記関連語を追加する分析部と、法律特定部から出力された第1の法律と関連法律から、分析部により追加された関連語を含む語彙出現情報に基づいて、分析対象となる法律を特定する統合部とを有する。

　本発明によれば、目的に応じて関連する法律を容易且つ適切に分析することができる。

実施例に係る法律分析装置の全体構成図である。実施例に係る法律分析装置の一部の機能構成図である。実施例に係るユーザの分析要求と検索対象の条文の一例を示した図である。実施例に係るユーザの分析要求から検索される条文の一例を示した図である。実施例に係る法律対応づけ表の一例を示した図である。実施例に係る語句出現表の一例を示した図である。実施例に係る単語抽出テンプレートの一例を示した図である。実施例に係る語彙辞書の一例を示した図である。実施例に係る法律分析装置による分析処理のフローチャートである。実施例に係る法律対応付け情報取得部による法律抽出の一例を示した図である。実施例に係る法律分析装置による分析処理のフローチャートである。実施例に係る法律分析装置による関係法律分析処理の詳細を説明するフローチャートである。

　各実施例について、図面を参照して説明する。これに先立ち、本明細書で使用する用語を定義する。
・「関連語」：ある単語に対する同義語、類義語、対義語、さらには上位語、下位語、などを含む。対訳語などを含めてもよい。さらに、同義語や類義語などの特定の種別への分類は難しいが、ある単語に対して関係性が深い単語は、「関係語」として、関連語の一種として位置づける。ここで「単語」は、複数の単語が組み合わさった複合語等の語句をも包含するものとする。これら「関連語」の単語意味関係の抽出が不十分であると、大規模な文書情報の中から、所望の文書を効率的に検出するための技術（文書検索技術等）においては、検出の漏れ（検索漏れ）を発生しやすくなる。
・「法律記述の特殊なルール」：次に示す「法規的解釈」や「文理解釈」を含む。
・「法規的解釈」：法律の中で置いている定義規定等の規定に注目する法解釈。
・「文理解釈」：法律の条文に固有の字義や単語間の並列関係を定義する法律固有の文法構造に注目する法解釈。

　上記「法規的解釈」の一例を示すため、会社法を例にとると、次に示す会社法（会社計算規則）の条文を手がかりに会社法の解釈において企業会計の基準等の語義をしん酌することが、該当する。
・会社計算規則第三条　この省令の用語の解釈及び規定の適用に関しては、一般に公正妥当と認められる企業会計の基準その他の企業会計の慣行をしん酌しなければならない。

この条文は会社法に出現する単語等の語義を企業会計の規定を踏まえた語義として解釈すべきことを求めている。語義解釈において法律で特殊なルールを定めている場合に相当し、関連語（同義語や類義語など）の抽出や類似条文の抽出においても留意する必要がある。

　なお、以下に説明する実施例は特許請求の範囲に係る発明を限定するものではなく、また実施例の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。

　以下の説明において、「プロセッサ部」は、１以上のプロセッサである。少なくとも１つのプロセッサは、典型的には、ＣＰＵ（Central Processing Unit）のようなマイクロプロセッサであるが、ＧＰＵ（Graphics Processing Unit）のような他種のプロセッサでもよい。少なくとも１つのプロセッサは、シングルコアでもよいしマルチコアでもよい。

　また、少なくとも１つのプロセッサは、処理の一部又は全部を行うハードウェア回路（例えばＦＰＧＡ（Field-Programmable Gate Array）又はＡＳＩＣ（Application Specific Integrated Circuit））といった広義のプロセッサでもよい。

　また、以下の説明において、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセッサ部によって実行されることで、定められた処理を、適宜に記憶部及び／又はインターフェース部などを用いながら行うため、処理の主語が、プロセッサ部（或いは、そのプロセッサ部を有するコントローラのようなデバイス）とされてもよい。

　プログラムは、計算機のような装置にインストールされてもよいし、例えば、プログラム配布サーバ又は計算機が読み取り可能な（例えば非一時的な）記録媒体にあってもよい。また、以下の説明において、２以上のプログラムが１つのプログラムとして実現されてもよいし、１つのプログラムが２以上のプログラムとして実現されてもよい。

　また、以下の説明において、「計算機システム」は、１以上の物理的な計算機を含んだシステムである。物理的な計算機は、汎用計算機でも専用計算機でもよい。物理的な計算機は、Ｉ／Ｏ（Input/Output）要求を発行する計算機（例えばホスト計算機やサーバシステムと呼ぶ）として機能してもよいし、Ｉ／Ｏ要求に応答してデータのＩ／Ｏを行う計算機（例えばストレージ装置）として機能してもよい。

　以下の説明では、「ＡＡＡ表」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「ＡＡＡ表」を「ＡＡＡ情報」と呼ぶことができる。

　まず、実施例１に係る法律分析装置について説明する。

　図１は、実施例１に係る法律分析装置の全体構成図である。
法律分析装置１０は、例えば、一般的なコンピュータにより構成され、制御部であるＣＰＵ１００と、主記憶装置１０１と、記憶部の一例としての記憶装置１０２と、読取装置１０４と、入出力装置１０５と、通信装置１０６と、これらを通信可能に接続するバス１０７とを備える。

　ＣＰＵ１００は、主記憶装置１０１や記憶装置１０２に格納されたプログラムを実行することにより、各種処理を実行する。主記憶装置１０１は、例えば、ＲＡＭ（Random Access Memory）であり、ＣＰＵ１００で実行されるプログラムや、ＣＰＵ１００で使用される各種情報を記憶する。

　記憶装置１０２は、例えば、ＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）で構成され、各種情報や、各種プログラムを記憶する。

　読取装置１０４は、ＣＤ－ＲＯＭやＤＶＤ－ＲＯＭ等の可搬性を有する可搬型記憶媒体１０３から情報を読み出す。実施例１では、可搬型記憶媒体１０３に記憶された法律分析プログラムが読取装置１０４により読み出されて、記憶装置１０２に格納される。入出力装置１０５は、情報を提示するディスプレイ（提示部）や、ユーザからの入力を受け付けるキーボードやマウス等である。入出力装置１０５は、ユーザインターフェース機能を有するディスプレイのように、入出力装置が一体的に構成された装置であってもよく、あるいは、入力装置と出力装置とが独立して構成された装置であってもよい。通信装置１０６は、ＮＩＣ（Network Interface Card）等であり、法律分析装置１０を通信ネットワークに接続する。

　なお、実施例１では、法律分析プログラムを、法律分析装置１０が単体で実行するものを例として説明するが、例えば、法律分析プログラムを、法律分析装置１０と、ネットワークを介して接続されたサーバとにより実行するようにしてもよい。

　図２は、実施例１に係る法律分析装置の一部の機能構成図である。図２を用いて、各機能の概略を説明する。

　法律分析装置１０の記憶装置１０２は、法律情報格納部１２１と、分析関連情報格納部１２２とを備える。

　法律情報格納部１２１は、分析対象となる複数の法律情報を格納する。法律情報としては、国の法律、政令、省令、地方自治体の条例等を含む。また、法律情報格納部１２１には、後述する法律対応づけ情報２５０（図５参照）、語句出現情報２６０（図６参照）、単語抽出テンプレート２７０（図７）、語彙辞書２８０(図８)等も格納する。分析関連情報格納部１２２は、法律情報の分析に必要な各種情報、例えば、分析に利用可能な外部ツール（前処理を実施するツール）の情報を格納する。

　主記憶装置１０１は、法律分析部１３０を構成する法律分析プログラム等のコンピュータプログラムを保有しており、このプログラムをＣＰＵ１００が実行することにより、各種処理機能部が構成される。

　主記憶装置１０１の法律分析プログラムをＣＰＵ１００が実行することにより構成される処理機能部としては、ユーザからの質問、質問文、分析対象となる法律（必須法律）等の分析要求を受け付ける入力受付部１３１と、ユーザからの質問文や法律を構成する単語やその品詞等の解析を行う検索部１３２と、図５に示す法律対応づけ情報２５０を読み出し、分析対象の必須法律と関連性のある他の法律（関連法律）を抽出する法律特定部１３３と、検索部１３２によって、取得された質問文に含まれる単語（指定語）をキーワードとして、関連する単語（注目語）を、抽出する自然言語関係性分析部（以下、分析部）１３４と、法律特定部１３３と分析部１３４の出力から分析対象の法律を絞る照合・統合部１３５と、照合・統合部１３５により抽出された法律を提示する分析結果提示部１３６とがある。なお、これら機能部の処理は、ＣＰＵ１００が実行する処理ということができる。

　入力受付部１３１は、入出力装置１０５を介して、関連する法律を分析するための分析要求、例えばユーザからの質問文を受け付ける。分析要求としては、関連する法律を分析するために用いる単語、語句、文、文章であってもよいが、所謂法律文書ではない、通常の質問文を想定する。実施例１では、分析要求に基づく語、例えば、分析要求の語や、分析要求の文に含まれる語等を「指定語」と称する。実施例１では、この指定語をキーとして、関連する法律を検索、分析等を行う。なお、指定語としては、１つの語であってもよく、複数の語、すなわち、語句であってもよい。

　図３は、ユーザの分析要求と分析対象の条文の一例を示した図である。
図３では、分析要求として、「東京都以外に本店のある法人が、都内に初めて支店を設置する場合の手続きについて教えてください。」という質問文３０１が入力受付部１３１に入力され、入出力装置１０５を介して表示装置に表示された状態を示す。

　質問文には、「支店」３０２という指定語が含まれているが、ユーザの質問に対して検索されるべき東京都都税条例の第２６条（以下、都条例）３０３には、「支店」という単語が含まれていないため、検索結果に含まれないこととなる。

　図４は、ユーザの分析要求から検索される条文の一例を示した図である。
図４は、図３と同様の質問文が入力されたことを前提とする。図４に示した法人税法４０２には、ユーザの質問文３０１に含まれる「支店」３０２という指定語の他、「事業所」４０３が含まれ、「支店」と「事業所」が「その他の」４０２という単語で結び付けられていることを示している。

　ユーザの質問文に含まれる指定語で単純に検索を行うと、検索結果に含まれるべき都条例が検索結果に含まれない。本実施例では、このような場合であっても、検索されるべき都条例を検索するための技術を提供することを目的としている。

　図２の説明に戻り、法律分析装置１０の概要を説明する。
検索部１３２は、法律情報格納部１２１から各法律の条文からなる法律情報等のデータと、分析関連情報格納部１２２から前処理のための分析ツールとを、それぞれ受け取り、法律の条文を形態素解析し、各単語の出現の有無を分析することで語句出現表２６０（図６参照）を生成する。また、法律対応づけ情報２５０(図５参照)を生成する。生成した語句出現表２６０や法律対応づけ情報２５０は記憶装置１０２に格納される。

　法律対応づけ情報２５０は、分析者の知見に基づいて作成してもよいし法律情報（条文等）に含まれる情報を利用して生成してもよい。前掲した会社計算規則第三条の条文の情報を利用するならば、法律対応づけ情報２５０には「会社法」と、（法律以外の文書になるが）企業会計の基準（たとえば「企業会計原則」）とが関係を有するペアとして記録されてもよい。

　また、検索部１３２は、入力受付部１３１から入力されたユーザの分析要求を形態素解析により前処理し、分析要求から指定語「支店」を抽出する。また、検索部１３２は、生成した語句出現表２６０を記憶装置１０２から受け取り、指定語「支店」が出現する法律名を出力する。例えば、質問文に含まれる「支店」という指定語を含む法律名「法人税法」を出力する。

　法律特定部１３３は、記憶装置１０２から法律対応づけ情報２５０を取得すると共に、検索部１３２から法律名、例えば、質問文に含まれる「支店」という指定語を含む法律名「法人税法」が入力される。入力された「法人税法」から法律対応づけ情報２５０を参照して、関連法律として「都条例」を抽出し、「法人税法」と「都条例」を出力する。

　分析部１３４は、記憶装置１０２から語句出現表２６０を取得し、語句出現表２６０に基づいて、入力受付部１３１で受け付けた分析要求に含まれる指定語や指定語に関連性が高い関連語（注目語）を抽出する。

　照合・統合部１３５は、法律特定部１３３及び分析部１３４で得られた結果を、照合・統合して、分析要求に関連する法律を特定し、特定した法律を分析結果とする。分析結果提示部１３６は、照合・統合部１３５による分析結果を、ユーザにわかりやすく可視化して入出力装置１０５に表示する。

　図５は、記憶装置１０２の法律情報格納部１２１に格納される法律対応づけ情報２５０の一例を示した図である。

　法律対応づけ情報２５０は、対応関係のある法律同士を対応づけて管理する法律対応づけ情報をテーブル形式としたものである。法律対応づけ情報２５０の各エントリは、下位法律名欄として法律名（注目名）２５１と、上位法律名欄として法律名（関係法律名）２５２とを含む。下位法律名欄２５１には、エントリに対応する法律(法律の一部としての条文等でもよい)の名称が格納される。上位法律名欄２５２には、エントリに対応する下位法律名欄２５１に名称が格納されている下位関係の法律と対応関係がある上位関係の法律(法律の一部としての条文等でもよい)の名称が格納される。なお、法律名に代えて、条文番号等の法律内における記載箇所を示すＩＤ情報としてもよい。

　このエントリによると、下位法律名欄２５１の法律は、上位法律名欄２５２の法律に基づいて作成されたものであることがわかる。より具体的には、図５の二行目のエントリによると、下位関係の法律である法律ｆ２が、上位関係の法律である法律(法律の条文)Ｓ１を実現するための法律であることを示している。なお、図５の下位法律名欄ｆ、上位法律名Ｓとの対応関係の具体例は、あくまでも一例を示すものである。一般的には、下位法律名欄２５１の法律よりも、上位法律名欄２５２の法律(法律の条文)の方が、効力が強い。

　法律対応づけ情報２５０は、ユーザが予め作成した情報を外部から、法律分析装置１０に入力して法律情報格納部１２１に格納するようにしてよい。法律分析装置１０において、所定のアルゴリズムに従って作成するようにしてもよい。

　なお、図５の法律対応づけ情報２５０は、一例として、下位関係の法律と、上位関係の法律とのそれぞれに対応する欄を設けて対応関係を示しているが、これに限られず、複数の上位関係がある場合には、それぞれの上位関係ごとの法律に対応する欄を設けるようにして、下位関係の法律と、複数の上位関係のそれぞれの関係の法律とを対応づけるようにしてもよい。

　また、図５の法律対応づけ情報２５０では、下位関係の法律と、上位関係の法律とを対応づけるようにしているが、同一階層の法律同士を対応づけるようにしてもよい。また、対応付ける法律文書の単位としては、各法律や各政令等の全体としてもよく、それらの一部分(条文)としてもよい。このように、法律対応づけ情報２５０は、対応関係のある複数の法律と、複数の法律の優先順位を示す関係種別とを含むルールが記述されている情報源に相当する。

　法律対応づけ情報２５０の関係種別２５３には、下位法律名欄２５１と上位法律名欄２５２の内、どちらが優先されるかを表す情報（優先順位）が格納される。例えば、下位法律欄２５１のｆ２「会社法」に対して、上位法律名欄２５２としてＳ１「民法」が格納され、会社法が優先されることが示されている。この関係種別２５３には、一般法、特別法とった情報を追加して、法律の適用優先順位をあらわしても良い。また、議会を通して制定される「法律」以外の政令や省令等との関係情報を追加してもよい。

　税法で例示すると、相続税に関する法律である「相続税法」の場合、「民法」と関係が深い。相続税法では民法の規定を借用しており、民法に存在しない規定が相続税法で規定されている、という関係にある。そして「相続税法」は、政令である「相続税法施行令」、省令である「相続税法施行規則」、と相互に関係している。重要で基本的な事項は法律に示され、計算の規定や手続き的事項や様式などの具体的な規定は政令や省令等に示されている。また、相続税法を含む税法の特例的な位置づけで「租税特別措置法」には相続税法を含む各税法の時限的な規定等が掲げられているが、この租税特別措置法に対しても施行令、施行規則及び関係通達が各々存在する。したがって相続税法の条文（条文を構成する語義等も含む）の理解には、他の法律（民法や租税特別措置法）、関連する上記政令や省令等の規定を把握しておくことが必要となり、法律対応づけ情報２５０には、これら相互に関係する法律等の情報が記述されることになる。

　また、法律と条例の関係情報を追加してもよい。法人に対する課税を規定する法律であれば、課税主体が国である税金（法人税）を規定する法律（法人税法）と課税主体が地方（都道府県等）である税金（法人住民税や法人事業税）を規定する法律（地方税法）、そして地方税法の規定に基づき、各自治体等が具体的で細かな内容を定めた「条例」の関係情報を追加してもよい。

　さらに、法律ではなくとも法律を説明する「逐条解説」等と呼ばれる文書の情報も法律対応づけ情報２５０に追加してよい。たとえば国税庁長官が定める判断が示された「相続税法関係通達」は相続税法の規定の説明がなされている文書であり、法的な強制力はないものの相続税法の解釈に影響する点で、相続税法と対応づけて法律対応づけ情報２５０に計上される情報としての適格性を有する。

　さらに、後法優先の原則に基づき法律間の制定の時期の前後関係の情報を追加して、法律の適用優先順位をあらわしても良い。

　図６は、実施例１に係る語句出現表を示した図である。
語句出現表２６０は、各法律における単語の出現の有無を管理する表である。

　行の支店２６２、事業所２６３、支払い２６４、金額２６５は、法律に含まれる単語を示している。各単語は、検索部１３２が形態素解析処理により、抽出することができる。Ｓ１－Ｓｎ、ｆ１－ｆｎは、法律或いは法律と条文を示している。

　語句出現表２６０は、行に示した単語が各法律に出現しているかを示している。具体的には、対応する法律において対応する単語が存在している場合には、存在していることを意味する「１」が設定され、存在していない場合には、存在しないことを意味する「０」が設定される。例えば、「支店」および「事業所」という単語は、法律Ｓ２（法人税法第１３２条）に含まれる。一方、ｆ３（都条例第２６条）には、「支店」という単語は含まれないが、「事業所」という単語が含まれる。

　このように、行名称を各法律の名称、例えば、文書名、法律ファイル名、条文名等とし、列名称を複数の語のそれぞれとし、行名称及び列名称のそれぞれの交点のセルには、対応する法律における、対応する単語の出現有無が設定されている。なお、図６に示す語句出現表２６０では、法律における単語の出現を管理するようにしているが、例えば、複数の語（語句、文等）を単位として、その単位の出現を管理するようにしてもよい。

　図７は、単語抽出テンプレートの一例を示した図である。
単語抽出テンプレート２７０は、図８に示す語彙辞書を作成するためのルールを示している。単語抽出テンプレート２７０は、法律文脈パターン２７１に従って、抽出される単語２７２と、抽出される単語の関係２７３を規定したものである。例えば、法律に「Ａ、Ｂその他のＣ」という記載があり、Ａ、Ｂ、Ｃが同じ品詞である場合、抽出される単語は「Ａ」「Ｂ」「Ｃ」である。法律文脈パターン２７１は、法律の記述において、法律を対象とした文理解釈あるいは法規的解釈のうちの一つ以上に基づいて構成される。

　この場合、「Ａ」「Ｂ」の関係は関係語、「Ａ」「Ｂ」は「Ｃ」に対して上位語という関係として抽出される。これは法律文書に特徴的な記述作法（条文等に特徴的な構文構造等）に従う解釈に基づいた抽出結果であり、法律の条文に固有の字義や単語間の並列関係を定義する法律固有の文法構造に注目する「文理解釈」を可能にした結果に相当する。

　図８は、語彙辞書の一例を示した図である。図８は、図７に示した単語抽出テンプレート２７０（No.１のパターン）を「法人税法」に適応した結果を示した図となる。語彙辞書は、照合・統合部１３５で分析対象を絞り込むために使用される。

　語彙辞書２８０には、見出し語２８１、見出し語に関連する関連語２８２、見出し語２８１と関連語２８２との関係を示すタイプ２８３、適応した法律を示す法律名２８４が対応して管理される。法律名２８４の情報をあわせて管理することで、同一の単語等であっても法律毎に関連語が異なる場合の解釈に対応することが可能になる。そして、分析要求に関係する単語等が多義的であり、法律毎に優先されるべき語義が法律記述の特殊なルールに基づいて規定される結果、法律毎に意味が異なる場合であっても、関連語（同義語や類義語等）を抽出することが可能になる。語彙辞書２８０中の見出し語２８１は、検索部１３２によって抽出された指定語とすることができる。

　例えば、「支店、事業所」のような上位、下位の関係にある単語ペアに対し、「支店」が見出し、「事業所」が関連語であり、「事業所」が「支店」の「上位語」（より抽象的な語）であることが格納されている。語彙辞書は、辞書引きの都合上、冗長にデータを保持しているものとする。すなわち、「支店、事業所」という単語ペアに対し、「支店」を見出し語とした行と、「事業所」を見出し語とした行の両方を保持しているものとする。ここで、特に単語ペアが上位、下位の関係にある場合には、順序を逆にしたペアのタイプは同様に逆になることに注意が必要である。例えば、「支店」は「事業所」の下位語となる。

　次に、法律分析装置１０の処理動作について説明する。
図９は、実施例１に係る、法律分析装置１０による分析処理のフローチャートである。
まず、入力受付部１３１は、入出力装置１０５により、ユーザから関連する法律を分析するための分析要求の入力を受け付ける（Ｓ１０１）。ここでは、理解を容易にするため、図３の質問文「東京都以外に本店のある法人が、都内に初めて支店を設置する場合の手続きについて教えてください。」３０１が入力された場合を例に説明するが、分析要求はこれに限るものではない。

　ステップＳ１０１で、検索対象として必ず分析対象としたい法律がある場合、「必須法律」として入力する。図３の質問文の例では、「都条例」と入力されることとなる。

　次いで、検索部１３２は、質問文３０１に対して、前処理を行う（Ｓ１０２）。このステップで、例えば、質問文３０１から文構造を解析するツールを用いて指定語となる「支店」という単語が抽出する。

　次に、検索部１３２は、ステップＳ１０２で抽出された「支店」という単語が含まれる法律を図６に示した語句出現表２６０を参照して抽出する。この例では、Ｓ２（法人税法）、ｆ２(会社法)、ｆ７が指定語を含む法律として、図１０の「支店」から抽出される法律１００１のように抽出される（ステップＳ１０３）。

　次いで、法律特定部１３３は、法律対応づけ情報２５０を参照し、ステップＳ１０３で抽出された法律、Ｓ２（法人税法）、ｆ２(会社法)、ｆ７と関連する法律を抽出する。つまり、Ｓ２（法人税法）に対してｆ３都条例、ｆ２(会社法)に対してＳ１(民法)、ｆ７に対してＳ４が関連法律として抽出される（ステップＳ１０４）。

　ステップＳ１０３で指定語から抽出される法律と、ステップＳ１０４で抽出された法律の関係を図１０に示す。ステップＳ１０３で指定語から抽出された法律１００１に加え、ステップＳ１０４で分析対象となる関連法１００２が増えていることが分かる。この処理は、図５に示した法律対応付け２５０を参照して、関連ある法律を分析対象に含めることで、漏れのない検索を行うためである。

　分析部１３４は、自然言語関係性を分析する処理を実行する（Ｓ１０５）。
ステップＳ１０５では、分析部１３４は、ステップＳ１０２の前処理で特定された指定語について、語句出現表２６０を参照して処理を行う。例えば、分析要求に基づく指定語が「支店」である場合には、分析部１３４は、語句出現表２６０の「支店」を列名に持つ列２６２において、「１」が設定されているレコード（行）の名称を特定する。この例では、分析部１３４は、レコードの名称として、Ｓ２、ｆ２、ｆ７の法律を特定する。つまり、「支店」という単語は、Ｓ２、ｆ２、ｆ７に含まれていることを意味する。

　次いで、分析部１３４は、法律Ｓ２、ｆ２、ｆ７の内、Ｓ２とｆ７の二つの法律に指定語の「支店」と「事業所」が出現しているため、指定語「支店」が含まれる法律Ｓ２、ｆ２、ｆ７と関連性が高い関連語として、「事業所」を抽出し、語句出現表２６０に追加する。なお、指定語が「金額」である場合には、同様な処理により、「金額」を列名に持つ列２６５を参照し、「金額」と関係が強い法律を分析結果とする。

　ステップＳ１０４とＳ１０５の処理は、並列的に実施してもよい。なお、法律対応づけ情報を使用しない場合にはステップＳ１０４の処理を省いてもよい。また、ステップＳ１０４を実施し、ステップＳ１０５の処理を省いてもよい。

　次いで、照合・統合部１３５は、ステップＳ１０４で得られた法律と、ステップＳ１０５で得られた関連語から分析対象を絞り込む処理（関係法律抽出処理（図１１参照））を実行する（Ｓ１０６）。この際、必要に応じてステップＳ１０１で入力される必須法律に基づいて、分析対象の法律を絞り込むことができる。

　次いで、分析結果提示部１３６は、関係法律抽出処理により得られた分析結果を、入出力装置１０５に接続された表示手段に提示するよう制御する（Ｓ１０７）。
以上が、法律分析装置１０の概要であるが、ステップＳ１０５の関連する単語の追加を行うための他の例について説明する。

　図１１は、分析部１３４がステップＳ１０５の指定語に対する関連語の抽出し、語句出現表２６０に追加する他の方法を示したフローチャートである。
まず、分析部１３４は、検索部１３２から分析対象となる法律名「法人税法」と指定語「支店」が入力される（Ｓ２０１）。つまり、語彙辞書（図８）の見出し語２８１の「支店」と法律名２８４が入力される。

　ここで、法律名「法人税法」と、指定語「支店」が入力されると、入力された法律名と指定語に基づき、語彙辞書２８０を参照して関連語「事業所」を抽出する（Ｓ２０２）。これは、指定語の他に、指定語に関連する関連語を分析対象にすることで漏れのない分析結果を得るためである。つまり、法律特定部１３３で分析対象の法律を拡張し、分析部１３４で分析対象の単語を拡張することで、漏れのない法律分析を可能としている。

　次に、分析部１３４は、図６の語句出現表２６０の「追加された注目語」行の「事業所」の列に対応するセルに、非ゼロの数値で更新する。この操作により、関連語は、注目語として管理される。注目語「事業所」のセル更新値としては注目語「支店」と重み付けに差をつける場合には「０．５」等でよい（Ｓ２０３）。この重みづけにより、質問文に含まれる指定語に関連の高い法律を点数で把握することができる。

　次に、図１２により、図９のステップＳ１０６の関係法律分析処理の詳細を説明する。
照合・統合部１３５は、更新された語句出現表をもとに指定語や注目語を含む法律を抽出する（Ｓ３０１）。

　次に、ステップＳ３０２で、照合・統合部１３５は、語句出現表２６０を参照し、法律毎に点数をつけ、点数の高い順に並び替えた結果を分析結果提示部１３６に出力する。つまり、語句出現表２６０に追加され、重みづけをされた注目語と質問文に含まれる指定語によって、法律毎に、指定語と注目語の出現に重み付けを掛け合わせたものを加算することによって求めることができる。

　また、他の例としては、ステップＳ３０１で、ステップＳ１０１で入力された必須法律である「東京都税条例」に基づいて、図５の法律対応づけ表２５０を参照し、「東京都税条例」と関連付けられた法律の範囲内で、指定語である「支店」と注目語である「事業所」を含む法律を分析対象法律として絞り込んでもよい。

　例えば、質問文３０１に対し、ステップＳ１０４で拡張された法律（関連法）には、図１０に示すようにＳ１（民法）、Ｓ２（法人税法）、Ｓ４、ｆ２（会社法）、ｆ３(都条例)、ｆ７が含まれる。図６の語句出現表２６０でも、指定語「支店」を含む「会社法」は、法律対応づけ表２５０で、「都条例」と対応付けられていないため、分析対象から除外される。また、指定語「支店」は含まないが、注目語である「事業所」を含み、法律対応づけ表２５０にｆ３「都条例」と対応するＳ３「刑法」は、指定語「支店」と注目語「事業所」の何れも含まないため、分析対象から除外する。

　この場合、照合・統合部１３５から指定語「支店」に関係がある（関係が強い）法律群が出力される（Ｓ３０２）。

　以上のように、法律特定部１３３で分析対象の法律を拡張し、分析部１３４で分析対象となる単語を拡張して、漏れのない分析を行うと共に、照合・統合部１３５では、分析対象の絞り込みを行い、分析結果の精度を向上させている。照合・統合部１３５では、法律毎に点数を計算する。点数の計算は、法律毎に、指定語と注目語の出現に重み付けを掛け合わせたものを加算することによって求めることができる。

　以上の通り、例えば、必須法律（例　東京都税条例）内にその指定語が記述されていない場合においても、指定語「支店」に関係する「事業所」を含む東京都税条例の条文（具体例におけるｆ７がこれに対応）を抽出結果に含めることができる。

　実施例１に係る法律分析装置によると、指定語のみではなく関連する語も検索語として追加することで本来ユーザにとって必要な情報（法律等）を漏らす可能性を低減できる。また、複数の法律から複数の関連条文を探すような、探索範囲が広くなる場合にも、分析要求に照らして適切な法律のみが表示されるので、ユーザにとって不要な法律の情報が表示されることを回避できる。結果として、精度よく、かつ、分析時間等の面で効率のよい分析を可能になる。

　図７の単語抽出テンプレートの他の例について説明する。
法律文書においては、「その他」あるいは「その他の」でつながれた語句は、相互に関係の深い単語であることが明示されている。しかも「その他」の文言と「その他の」の文言とでは異なった意味に解釈され、「その他」の前後は並列関係であり、「その他の」の場合は、直前の語句は直後の語句の例示にあると解釈される。上記のような法律実務に即した正しい語句の関係性を解釈し関係性の深い語句を取得することができるように、法律固有ルール記述部には例えば以下のような解析ルールが規定されている。

　「その他の」の場合、直前に位置する語は直後に位置する語の例示であり、直前に位置する語の先頭に「例えばJを付加し、全体を括弧で囲んだ上で、直後に位置する語の後ろに移動させる。

　一方、「その他」の場合、直前に位置する語と直後に位置する語とは並列関係であり、それぞれを単独で用いた文を生成する。

　さらに、法律文脈パターン２７１に法律内の定義規定の構造が登録されている状態も、単語抽出テンプレートの典型的な例である。図７のNo.３のパターンに「法人税法」の「恒久的施設」という用語を適応させると、図８相当の情報として下に示す結果が得られる。

　この結果はその法律に固有で解釈において優先すべき定義等を特記した規定を踏まえる「法規的解釈」を可能にした結果に相当する。尚、「恒久的施設」の定義として図７に適応させた条文は法人税法第二条の次の記述である。
・法人税法第二条十二の十九　恒久的施設　次に掲げるものをいう。（中略）イ　外国法人の国内にある支店、工場その他事業を行う一定の場所で政令で定めるもの。
  ・見出し語：　恒久的施設
  ・関連語：　外国法人の国内にある支店
  ・タイプ：　同義語
  ・法律：　　法人税法

　ここで「外国法人の国内にある支店」の部分は単語に分解した結果が示されていてもよい。その場合は以下のような図８への記載内容が一例として想定される。
  ・見出し語：　恒久的施設
  ・関連語：　支店
  ・タイプ：　関係語
  ・法律：　　法人税法
　これらの解析ルールに従うことにより、正しく各語句聞の関係性構造を導き、新たな関連語（同義語や類義語等）の取得を行うことができる。

　実施例１では、ユーザによる質問文と必須法律が分析要求として入力される例を示したが、実施例３では、法改正が行われたときに、どの法律や条例が影響を受けるかを分析する。

　実施例３では、実施例１の分析要求として、法改正が行われた法律名が必須法律に対応する情報となり、法改正箇所を前処理することで、法改正箇所から指定語を抽出するようにすれば、良いこととなる。

　実施例３によれば、法改正が行われた際に、それに伴って改正が必要となる条文等を容易に抽出することができる。

　実施例４では、実施例１の語彙出現表をもとに分析要求を記述した文書や法律の条文等の特徴を数値化し、分析要求を記述した文書等とその数値が似ている条文等を分析要求に関係が強い検索結果として出力する。あるいは、実施例１で得た検索結果である条文等と数値が似ている条文等も、分析要求に関係が強い検索結果としてあわせて出力する。

　条文等の特徴の数値化の手段としては特許文献１でも活用されている文書ベクトル化が公知の典型的な手段である。「文書ベクトル化」とは、各文書に含まれるキーワードの組合せと出現頻度に基づいて文書の特徴をベクトルとして表現する技術である。特許文献１にもとづく分析では、双方に共通する単語が多い法律条文等は類似性が高いと判定される傾向になると考えられる。

　実施例４では文や文書の特徴を数値化するための入力となる語彙出現表が，法律固有の文理解釈や法規的解釈にもとづいて抽出した法律毎の関連語で更新された状態であることが本発明に特徴的といえる。条文等の特徴の数値化の手段としては特許文献１でも活用されている文書ベクトル化が公知の典型的な手段であるが、実施例４の趣旨を逸脱しない範囲においては、文書ベクトル化に限定されるものではない。

　実施例４によれば、分析要求に対して関係の深い条文等として、文や文章単位で類似する条文等を容易に抽出することができる。

１０：法律分析装置、１００：ＣＰＵ、１０１：主記憶装置、１０２：記憶装置、１０５：入出力装置、１２１：法律情報格納部、１２２：分析関連情報格納部、１３１：入力受付部、１３２：検索部、１３３：法律特定部、１３４：自然言語関係性分析部、１３５…照合・統合部、１３６…分析結果提示部。

Claims

　複数の法律の中から分析要求に関連する法律を抽出する法律分析装置であって、
　関連する法律の対応関係を示す法律対応づけ情報と前記複数の法律に含まれる単語の出現を管理する語句出現情報とを記憶する記憶部と、
　前記複数の法律を分析する法律分析部と、
　前記法律分析部の分析結果を提示する提示部と、を有し、
　前記法律分析部は、
　法律に対する質問文と分析したい必須法律を含む分析要求を受け付ける入力受付部と、
　前記入力受付部によって受け付けられた分析要求から指定語を抽出し、前記指定語を含む第１の法律を前記語句出現情報に基づいて、検索する検索部と、
　前記法律対応づけ情報に基づいて、前記第１の法律と関連する関連法律を抽出し、前記第１の法律と前記関連法律を出力する法律特定部と、
　前記必須法律と前記指定語に基づいて語彙辞書を参照して関連語を抽出し、前記語句出現情報の法律毎に前記関連語を追加する分析部と、
　前記法律特定部から出力された前記第1の法律と前記関連法律から、前記分析部により追加された前記関連語を含む語彙出現情報に基づいて、分析対象となる法律を特定する統合部と、を有する、
ことを特徴とする法律分析装置。
　請求項１に記載の法律分析装置において、
　前記分析部は、
　抽出された前記関連語を、前記語彙出現情報の法律毎に重み付けを行って追加することで、前記記憶部に記憶される前記語句出現情報を更新する、
ことを特徴とする法律分析装置。
　請求項２に記載の法律分析装置において、
　前記記憶部に記憶される法律対応づけ情報は、対応関係のある下位法律と上位法律と、前記下位法律と前記上位法律の優先順位を示す関係種別とを含む
ことを特徴とする法律分析装置。
　請求項２に記載の法律分析装置において、
　前記記憶部は、法律文脈パターンを格納し、
　前記分析部は、前記指定語から前記関連語を、前記法律文脈パターンに照らして法律毎に抽出し、前記記憶部に記憶される前記語句出現情報を法律毎に更新する、
ことを特徴とする法律分析装置。
　請求項４に記載の法律分析装置において、
　前記記憶部は、前記法律文脈パターン、見出し語、前記見出し語に関連する前記関連語と法律名を対応して記憶する語彙辞書、及び、前記見出し語とその同義語とを格納した同義語辞書の内、少なくとも一つの辞書を格納し、
　前記語彙辞書及び前記同義語辞書は、前記法律文脈パターンと、前記法律文脈パターンから抽出される少なくとも二つの単語と、前記二つの単語間の関係を対応付けて法律毎に管理するものである
ことを特徴とする法律分析装置。
　請求項４に記載の法律分析装置において、
　前記記憶部に格納される前記法律文脈パターンは、法律を対象とした文理解釈あるいは法規的解釈のうちの一つ以上に基づいて構成される
ことを特徴とする法律分析装置。
　請求項５に記載の法律分析装置において、
　前記記憶部に格納される前記法律文脈パターンは、法律を対象とした文理解釈あるいは法規的解釈のうちの一つ以上に基づいて構成される
ことを特徴とする法律分析装置。
　請求項７に記載の法律分析装置において、
　前記分析部は、前記検索部から前記指定語が入力され、前記法律特定部から法律名が入力され、前記検索部から入力された指定語と前記法律特定部から入力された法律名に基づき、前記語彙辞書及び前記同義語辞書の内の少なくとも一つを参照して、前記関連語を出力する
ことを特徴とする法律分析装置。
　請求項４に記載の法律分析装置において、前記関連語は、前記見出し語との関係で同義語、類義語、対義語、上位語、下位語、あるいは対訳語である
ことを特徴とする法律分析装置。
　請求項５に記載の法律分析装置において、前記関連語は、前記見出し語との関係で同義語、類義語、対義語、上位語、下位語、あるいは対訳語である
ことを特徴とする法律分析装置。
　請求項６に記載の法律分析装置において、前記関連語は、前記見出し語との関係で同義語、類義語、対義語、上位語、下位語、あるいは対訳語である
ことを特徴とする法律分析装置。
　関連する法律の対応関係を示す法律対応づけ情報と、複数の法律に含まれる単語の出現を管理する語句出現情報とを記憶する記憶部と、前記複数の法律を分析する法律分析部と、前記法律分析部の分析結果を提示する提示部とを有し、前記複数の法律の中から分析要求に関連する法律を抽出する法律分析装置における方法であって、
　前記法律分析部は、
　法律に対する質問文と分析したい必須法律を含む分析要求を受け付け、
　前記受け付けられた分析要求から指定語を抽出し、前記指定語を含む第１の法律を前記語句出現情報に基づいて検索し、
　前記法律対応づけ情報に基づいて、前記第１の法律と関連する関連法律を抽出し、前記第１の法律と前記関連法律を出力し、
　前記必須法律と前記指定語に基づいて語彙辞書を参照して関連語を抽出し、前記語句出現情報の法律毎に前記関連語を追加し、
　前記第１の法律と前記関連法律から、前記関連語が追加された語彙出現情報に基づいて、分析対象となる法律を特定する
ことを特徴とする方法。