JP3908261B2

JP3908261B2 - 修辞構造解析システム

Info

Publication number: JP3908261B2
Application number: JP2006146038A
Authority: JP
Inventors: 昭宏新森; 学奥村; 雄三丸川; 真岩山
Original assignee: インテック・ウェブ・アンド・ゲノム・インフォマティクス株式会社
Priority date: 2006-05-26
Filing date: 2006-05-26
Publication date: 2007-04-25
Anticipated expiration: 2022-11-11
Also published as: JP2006260597A

Description

本発明は、特許請求項の解析のための自然言語処理技術を用いた方法、プログラム、及びシステムに関する。

特許の重要性が広く認識されるようになっている。特に、ビジネスやサービスの方法を権利の対象とする「ビジネスモデル特許」の出現や、コンピュータプログラムを対象とした「ソフトウエア特許」の認知により、広い範囲の企業関係者が特許に関わらざるを得ない状況が生まれている。

特許出願数は現在、年間４０万件以上に達しており、そのデータ量は日々増加している。こうした膨大な特許データを対象とした研究は従来、検索に関するものがほとんどであった。すなわち、ある製品やサービスに関連した既存特許を漏れなく、高精度で発見することに研究と技術開発の主眼が置かれてきた。

特許明細書において、最も重要な箇所は、特許請求項（クレーム）を記述した箇所である。しかし、特許請求項は、独特の記述スタイルをもち、文長が長く、記述構造が複雑であり、知的財産権担当者や弁理士などの専門家以外の人にとっては極めて読みにくいものになっている。

新聞記事や一般的な論説文を主な対象として開発された、係り受け解析ツールＫＮＰ（非特許文献１）を日本語の特許請求項に対して実行すると、多くの場合に解析に失敗する。ＫＮＰは、シソーラスとダイナミックプログラミングを用いて文中の並列構造を検出することで、日本語の長い文を解析できるようにしている。しかし、特許請求項においては、１つの事項を説明した後でそれを用いて別の事項を説明するという、連鎖的な記述が多くみられるため、このアルゴリズムが必ずしもうまく動作しないためである。

複数の文・節から構成される談話の構造を解析するための理論として、修辞構造理論（ＲＳＴ：ＲｈｅｔｏｒｉｃａｌＳｔｒｕｃｔｕｒｅＴｈｅｏｒｙ）（非特許文献２）が提唱されている。修辞構造理論においては、通常複数の文から構成されるテキストの構造を解明するために、修辞構造解析（ｒｈｅｔｏｒｉｃａｌｓｔｒｕｃｔｕｒｅａｎａｌｙｓｉｓ）が行われる。修辞構造解析では、テキストを記述のまとまりごとに断片（ｓｅｇｍｅｎｔ）に分割し、断片間の関係付けを行いながら修辞構造木（ｒｈｅｔｏｒｉｃａｌｓｔｒｕｃｔｕｒｅｔｒｅｅ）を組み上げることで、その構造を解明する。断片間を関係付ける際には、あらかじめ定義してある修辞関係（ｒｈｅｔｏｒｉｃａｌｒｅｌａｔｉｏｎ）の１つが割り当てられる。修辞関係には、関係を構成する要素群が対等である関係と、重要な要素（ｎｕｃｌｅｕｓ：核＝主要部）と補足的な要素（ｓａｔｅｌｌｉｔｅ：衛星＝周辺部）とから構成される関係とがある。前者を多核（ｍｕｌｔｉ−ｎｕｃｌｅａｒ）関係と呼び、後者を単核（ｓｉｎｇｌｅ−ｎｕｃｌｅａｒ）関係と呼ぶ。修辞構造を対話型でグラフィカルに編集・表示するためのツールとして、Ｔｃｌ／ＴｋによるＲＳＴＴｏｏｌ（非特許文献３）も開発されている。

英語の新聞記事や論説文（論文、社説等）を対象として、手がかり句を用いて修辞構造を解析する手法（非特許文献４）が提案されている。また、日本語の新聞記事や論説文（論文、社説等）を対象とした手法もいくつか提唱されている（特許文献１、特許文献２、特許文献３）。しかし、これらの手法は、基本的には、複数の文を対象としており、１文から構成される特許請求項の解析に使用することはできない。特許明細書の閲覧に関する手法（特許文献４）もすでに提唱されているが、これらは、言語処理技術により特許請求項の構造を解析する本手法とは異なるものである。
特公平０７−１１８０１号公報特公平０７−００７４１８号公報特表２００１−５２３０１９号公報ｖ特開２００２−１４９７０４号公報黒橋禎夫：結構やるな、ＫＮＰ、情報処理、Ｖｏｌ．４１、Ｎｏ．１１、ｐｐ．１２１５−１２２０，（２０００）．ＢｉｌｌＭａｎｎ：ＡｎＩｎｔｒｏｄｕｃｔｉｏｎｔｏＲｈｅｔｏｒｉｃａｌＳｔｒｕｃｔｕｒｅＴｈｅｏｒｙ（ＲＳＴ），ｈｔｔｐ：／／ｗｗｗ．ｓｉｌ．ｏｒｇ／ｍａｎｎｂ／ｒｓｔ／ｒｉｎｔｒｏ９９．ｈｔｍ，（１９９９）．ＭｉｃｈａｅｌＯ 'Ｄｏｎｎｅｌｌ：ＲＳＴ−Ｔｏｏｌ：ＡｎＲＳＴＡｎａｌｙｓｉｓＴｏｏｌ，Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ６ｔｈＥｕｒｏｐｅａｎＷｏｒｋｓｈｏｐｏｎＮａｔｕｒａｌＬａｎｇｕａｇｅＧｅｎｅｒａｔｉｏｎ，（１９９７）．ＤａｎｉｅｌＭａｒｃｕ：ＴｈｅＲｈｅｔｏｒｉｃａｌＰａｒｓｉｎｇｏｆＵｎｒｅｓｔｒｉｃｔｅｄＴｅｘｔｓ：ＡＳｕｒｆａｃｅ−ｂａｓｅｄＡｐｐｒｏａｃｈ，ＣｏｍｐｕｔａｔｉｏｎａｌＬｉｎｇｕｉｓｔｉｃｓ，Ｖｏｌ．２６，Ｎｏ．３，（２０００）．

本発明は、文長が長く記述が複雑な特許請求項の修辞構造を解析し、その読解を支援するとともに、他の言語処理アプリケーションの利用を支援するための方法、プログラム、及びシステムを提供する。

まず、特許請求項の記述スタイルを以下の３つに類型化する。
（１）順次列挙形式
「…し、…し、…した、…」のように、処理を順序的に記述する形式。
（２）構成要素列挙形式
「…と、…と、…とからなる、…」のように、構成要素を列挙する形で記述する形式。
（３）ジェプソン（Ｊｅｐｓｏｎ）的形式
「…において、…を特徴とする、…」、「…であって、…を特徴とする、…」のように、最初に、公知部分（既に知られている内容）または前提条件を述べた上で、新規部分（この発明の特徴となる部分）または本論部分を記述する形式。

次に、特許請求項用の修辞関係を図１に示すように定義する。図１の例の欄において、"［"と"］"で囲まれた部分が断片である。単核の関係の場合、下線が引かれている部分が核である。そして、図１に示す修辞関係を用いて、修辞構造解析を行う。

第一の発明は、コンピュータを用いて特許請求項の修辞構造解析を行う方法に関するものである。第二の発明は、コンピュータを用いて特許請求項の修辞構造解析を行うプログラムに関するものである。第一の発明および第二の発明の処理フローを図２に示す。その手順として、以下のものを備える。
（１）形態素解析手順
解析対象の特許請求項を形態素解析して形態素単位文字列に分割する。
（２）字句解析手順
前記形態素解析手順の出力を入力し、文脈を判定しながら所与の手がかり句集合の一要素に相当する１つ以上の形態素単位文字列を検索し、検出された場合は当該手がかり句に対応するトークンと前記１つ以上の形態素単位文字列を連結した文字列とを出力し、それ以外の部分については当該形態素に対応するトークンと当該形態素単位文字列とを出力する。
（３）修辞構造解析手順
前記字句解析手順から出力されたトークンと文字列とを入力し、文脈自由文法で記述された文法からパーサジェネレータにより生成されたパーサにより１つ以上の前記形態素単位文字列から構成される断片の集合にまとめ、前記断片集合の要素間に関係付けを行うことで修辞構造木を組み上げる。

第三の発明は、コンピュータを用いて特許請求項の修辞構造解析を行うシステムに関するものである。第三の発明のシステム構成を図３に示す。その手段として、以下のものを備える。
（１）形態素解析手段
解析対象の特許請求項を形態素解析して形態素単位文字列に分割する。

（２）字句解析手段
前記形態素解析手段の出力を入力し、文脈を判定しながら所与の手がかり句集合の一要素に相当する１つ以上の形態素単位文字列を検索し、検出された場合は当該手がかり句に対応するトークンと前記１つ以上の形態素単位文字列を連結した文字列とを出力し、それ以外の部分については当該形態素に対応するトークンと当該形態素単位文字列とを出力する。
（３）修辞構造解析手段
前記字句解析手段から出力されたトークンと文字列とを入力し、文脈自由文法で記述された文法からパーサジェネレータにより生成されたパーサにより１つ以上の前記形態素単位文字列から構成される断片の集合にまとめ、前記断片集合の要素間に関係付けを行うことで修辞構造木を組み上げる。

第一の発明または第二の発明または第三の発明のいずれか一の発明において使用する所与の手がかり句集合には、
・既存の特許明細書から抽出した複数の特許請求項で明示的に指定されている断片境界周辺の記述形式を収集してパターン化することで得られる手がかり句と、
・既存の特許明細書から抽出した複数の特許請求項で高頻度で使用される記述形式をパターン化することで得られる手がかり句と
を含むことを特徴とする。

第一の発明または第二の発明または第三の発明のいずれか一の発明の出力として得られる特許請求項の修辞構造解析結果を、タグ付きテキストとして出力する。

本発明により、文長が長く記述が複雑な特許請求項の修辞構造を解析することができるため、当該特許請求項を構成する要素または処理が明確になる。修辞構造解析結果を視覚的に表示することで、その読解性が格段に向上する。修辞構造をタグ付きテキストとして出力することで、当該特許請求項を構成する要素または処理と、当該特許明細書の発明の詳細な説明中での対応する説明箇所の自動リンク付けや、他の関連特許との比較分析、特許請求項の他言語への翻訳など、他の言語処理アプリケーションでの利用が容易となる。

（実施例１）
第一の発明、第二の発明、第三の発明の実施例について説明する。

（０）修辞構造解析に使用する手がかり句

図４に示す手がかり句を使用して、修辞構造解析を行う。なお、図４中、および以降の説明において、手がかり句およびパターンの表記には、Ｐｅｒｌ言語（参考文献：ＬａｒｒｙＷａｌｌ、ＴｏｍＣｈｒｉｓｔｉａｎｓｅｎ、ＲａｎｄａｌＬ．Ｓｃｈｗａｒｔｚ共著、近藤嘉雪訳、プログラミングＰｅｒｌ改訂版、オライリージャパン）の正規表現を使用している。
（１）形態素解析

奈良先端科学技術大学院大学で開発された形態素解析ツールである茶筌（参考文献：松本裕治、北内啓、山下達雄、平野善隆、松田寛、高岡一馬、浅原正幸：形態素解析システム『茶筌』ｖｅｒｓｉｏｎ２．２．９使用説明書，奈良先端科学技術大学院大学松本研究室，（２００２））を使用して形態素解析を行う。その際、もともと挿入されている改行コードは、そのままの状態で入力する。茶筌には、−ｊオプションを使用し、区切り文字を「。：；」のいずれかとする。
（２）字句解析

形態素解析結果を、文脈を判定しながら、トークンと文字列のペアの列に変換する。トークンの種別は、以下の通りである。
ＪＥＰＳＯＮ＿ＣＵＥ
図４におけるＪＥＰＳＯＮ＿ＣＵＥに該当する手がかり句を認識した場合に１回だけ出力する。改行コードを含む特許請求項の場合、改行コードが後続する場合のみ、手がかり句を認識させる。該当するものが個以上存在する場合、後方に出現するものに対して出力する。
ＦＥＡＴＵＲＥ＿ＣＵＥ
図４におけるＦＥＡＴＵＲＥ＿ＣＵＥに該当する手がかり句を認識した場合に出力する。
ＣＯＭＰＯＳＥ＿ＣＵＥ
文脈に依存して、図４におけるＣＯＭＰＯＳＥ＿ＣＵＥに該当する手がかり句を認識した場合に出力する。
ＮＯＵＮ
文脈に依存して認識した「（名詞｜記号）と（、｜，）」の名詞・記号の部分、または記述末尾に連続出現する名詞・記号・接続詞・動詞体言接続形・接頭詞について、出力する。
ＰＯＳＴＰ＿ＴＯ
文脈に依存して認識した「（名詞｜記号）と（、｜，）」について、「と」の部分に対して出力する。
ＰＯＳＴＰ＿ＮＯ
記述末尾の名詞・記号、またはＪＥＰＳＯＮ＿ＣＵＥ、またはＦＥＡＴＵＲＥ＿ＣＵＥの直前の名詞・記号について、その前方に隣接して助詞「の」「と」「における」のいずれかが存在し、その直前に名詞または記号が隣接する場合、助詞「の」「と」「における」に対して出力する。
ＶＥＲＢ＿ＲＥＮＹＯＵ
文脈に依存して認識した「（動詞連用形｜助動詞連用形）（、｜，）」について、「（動詞連用形｜助動詞連用形）」の部分に対して出力する。
ＶＥＲＢ＿ＫＩＨＯＮ
文脈に依存して認識した「（動詞基本形｜助動詞基本形）（、｜，）」について、「（動詞基本形｜助動詞基本形）」の部分に対して出力する。
ＰＵＮＣＴ＿ＴＯＵＴＥＮ
文脈に依存して認識した「（名詞｜記号）と（、｜，）」または「（動詞連用形｜助動詞連用形）（、｜，）」について，「（、｜，）」の部分に対して出力する。
ＷＯＲＤ
上記の処理対象とならなかった形態素に対して出力する。

字句解析の文脈依存の処理の詳細について、以下に説明する。
（１）記述末尾から前方向に探索し、ＮＯＵＮ、ＰＯＳＴＰ＿ＮＯトークンに変換する。
（２）ＪＥＰＳＯＮ＿ＣＵＥ、ＦＥＡＴＵＲＥ＿ＣＵＥの直前から前方向に探索し、ＮＯＵＮ、ＰＯＳＴＰ＿ＮＯトークンに変換する。
（３）非ジェプソン的形式の場合は全体に対して１回、ジェプソン的形式の場合は公知部分・前提条件と、新規部分・本論部分のそれぞれに対して、前方向に探索し、以下のいずれのパターンが後に出現するかを調べ、見つかったものをトークン化する。
（ａ）（動詞基本形｜助動詞基本形）（、｜，）？ＮＯＵＮ
（ｂ）ＣＯＭＰＯＳＥ＿ＣＵＥ
（４）（ａ）の場合、さらに前方向に探索し、他の手がかり句トークンが存在するまでの範囲において、ＶＥＲＢ＿ＲＥＮＹＯＵ、ＰＵＮＣＴ＿ＴＯＵＴＥＮトークンに変換する。
（５）（ｂ）の場合、ＣＯＭＰＯＳＥ＿ＣＵＥの直前に、「と（、｜，）？」が存在するときは、さらに前方向に探索し、他の手がかり句トークンが存在するまでの範囲において、ＮＯＵＮ、ＰＯＳＴＰ＿ＴＯ、ＰＵＮＣＴ＿ＴＯＵＴＥＮトークンに変換する。そうでない場合、他の手がかり句トークンが存在するまでの範囲において、ＶＥＲＢ＿ＲＥＮＹＯＵ、ＰＵＮＣＴ＿ＴＯＵＴＥＮトークンに変換する。
（６）上記の処理によって生成されたＮＯＵＮトークンに対して、その前方向を探索し、ＮＯＵＮ、ＰＯＳＴＰ＿ＮＯトークンに変換する。

字句解析における文脈依存処理の状況を示すために、図５の特許請求項テキスト（特開平１０−０１１１１１の第一請求項）を字句解析に入力したときの出力の一部を図６に示す。図６において、各行は、トークンと文字列のペアから成っている。ここでたとえば、「原稿」という名詞に対するトークンとして、出現文脈に応じて、ＮＯＵＮとＷＯＲＤのいずれかが与えられている。また、「...」は、途中の省略箇所を表している。

（３）修辞構造解析
文脈自由文法による記述からパーサを生成するパーサジェネレータであるＢｉｓｏｎ（参考文献：ＣｈａｒｌｅｓＤｏｎｎｅｌｌｙ，ＲｉｃｈａｒｄＳｔａｌｌｍａｎ：Ｂｉｓｏｎ：ＴｈｅＹＡＣＣ−ｃｏｍｐａｔｉｂｌｅＰａｒｓｅｒＧｅｎｅｒａｔｏｒ，Ｖｅｒｓｉｏｎ１．２５，１９９５）互換のＰｅｒｌ用ツールであるＰａｒｓｅ：：Ｙａｐｐ（入手先：ｈｔｔｐ：／／ｗｗｗ．ｃｐａｎ．ｏｒｇ／ｍｏｄｕｌｅｓ／ｂｙ−ａｕｔｈｏｒｓ／ｉｄ／Ｆ／ＦＤ／ＦＤＥＳＡＲ／Ｐａｒｓｅ−Ｙａｐｐ−１．０５．ｔａｒ．ｇｚ，（ｃ）１９９８−２００１ＦｒａｎｃｏｉｓＤｅｓａｒｍｅｎｉｅｎ）利用してパーサを生成し、このパーサを用いて修辞構造解析を行う。

図７に、Ｐａｒｓｅ：：Ｙａｐｐに入力するファイルを示す。このファイルは、％％で区切られた、以下の３つの部分から構成されている。
（ａ）宣言部分
（ｂ）文脈自由文法のルールと対応するアクションの集合
（ｃ）補助的なサブルーチン定義
（ｂ）の文脈自由文法記述において、アルファベット大文字で記述されたものはトークン（終端記号）であり、アルファベット小文字で記述されたものは非終端記号である。アクションは｛｝内に記述されている。アクション記述中で、＄＿［１］、＄＿［２］はそれぞれ、対応するルール右側の１番目、２番目の要素に対応する値を意味する。（ａ）、（ｂ）、（ｃ）において、プログラムの記述は、Ｐｅｒｌの記法に従っている。

（実施例２）
第四の発明の実施例について説明する。

まず、既存の特許明細書から抽出した複数の特許請求項で明示的に指定されている断片境界周辺の記述形式を収集してパターン化することによる手がかり句の収集について説明する。

既存の特許明細書から第一請求項を抽出し、などのタグを削除して、第一請求項テキスト集合とする。第一請求項テキスト集合の要素のうち、記述中に改行コード（０ｘ０ａのコード）を含むもの、つまり２行以上から構成されるものを対象とし、茶筌を用いて形態素解析を行う。茶筌には、−ｊオプションを使用し、区切り文字を「。：；」のいずれかとする。最終行以外の行において、行末の改行直前の形態素を３つ分抽出し、以下のようにパターン化する。

・名詞と記号はそれぞれ、「名詞」と「記号」に変換する。

・動詞連用形と助動詞連用形はそれぞれ、「動詞連用形」と「助動詞連用形」に変換する。

ＮＴＣＩＲ３特許データコレクション（参考文献：岩山真，藤井敦，高野明彦，神門典子：特許コーパスを用いた検索タスクの提案，情報処理学会研究報告−情報学基礎，ＦＩ−６３−００７，２００１）から抽出した約６万件の第一請求項を対象として、上記の処理を行った結果を図８に示す。

図８の結果から、以下のような手がかり句を収集することができる。
（名詞｜記号）と（、｜，）
（動詞連用形｜助動詞連用形）（、｜，）
（名詞｜記号）（において｜に於いて｜に於て）（、｜，）
（名詞｜記号）であって（、｜，）

次に、既存の特許明細書から抽出した複数の特許請求項で高頻度で使用される記述形式をパターン化することによる手がかり句の収集について説明する。

前記の第一請求項テキスト集合について、各要素を茶筌により形態素解析し、分かち書きを行う。これに対して、２０グラムまでのｎグラム統計（参考文献：長尾真編、岩波講座ソフトウエア科学１５「自然言語処理」、１９９９）をとる。その結果をもとに、以下のような手がかり句を収集することができる。

を特徴と（した｜する）（、｜，）？

前記の第一請求項テキスト集合について、各要素を茶筌により形態素解析し、名詞・複合名詞・未知語・形容詞・接頭詞・助詞・記号をそれぞれ、「名詞」・「複合名詞」・「未知語」・「形容詞」・「接頭詞」・「助詞」・「記号」に変換することでパターン化し、以下のような正規表現により、記述末尾の「名詞まとまり」を判定する。

（（＜接頭詞＞｜＜名詞＞｜＜複合名詞＞｜＜未知語＞｜＜形容詞＞）＊｜（（＜接頭詞＞｜＜名詞＞｜＜複合名詞＞｜＜未知語＞｜＜形容詞＞）＋（＜記号＞｜＜助詞＞）？（＜接頭詞＞｜＜名詞＞｜＜複合名詞＞｜＜未知語＞｜＜形容詞＞）＊））
（＜名詞＞｜＜複合名詞＞｜＜未知語＞）＄
検出した「名詞まとまり」の直前の１５形態素を抽出して分析する。これにより、以下のような手がかり句を収集することができる。
を特徴と（した｜する）（、｜，）？
を備えた（、｜，）？
を設けた（、｜，）？
を含（む｜んだ）（、｜，）？

（実施例３）
第五の発明の実施例について説明する。

図５の特許請求項を入力し、第一の発明または第二の発明または第三の発明の出力として得られる修辞構造解析結果を視覚的に表示したものを図９に示す。

（実施例４）
第六の発明の実施例について説明する。

図５の特許請求項を入力し、第一の発明または第二の発明または第三の発明の出力として得られる修辞構造解析結果をタグ付きテキストとして出力したものを図９に示す。

（実施例５）
図１１の特許請求項を入力して修辞構造解析を行い、修辞構造解析結果を視覚的に表示したものを図１２に示す。タグ付きテキストとして出力したものを図１３に示す。

以上のように、本発明は、文長が長く記述が複雑な特許請求項の修辞構造を解析し、その読解が支援できる、という効果を有し、特許請求項を解析する装置等として有用である。

特許請求項用の修辞関係処理フローシステム構成特許請求項解析のための手がかり句修辞構造解析を行う特許請求項の例１字句解析の出力の一部修辞構造解析用の文脈自由文法とアクション修辞構造解析用の文脈自由文法とアクション修辞構造解析用の文脈自由文法とアクション修辞構造解析用の文脈自由文法とアクション修辞構造解析用の文脈自由文法とアクション修辞構造解析用の文脈自由文法とアクション修辞構造解析用の文脈自由文法とアクション修辞構造解析用の文脈自由文法とアクション修辞構造解析用の文脈自由文法とアクション修辞構造解析用の文脈自由文法とアクション修辞構造解析用の文脈自由文法とアクション修辞構造解析用の文脈自由文法とアクション修辞構造解析用の文脈自由文法とアクション修辞構造解析用の文脈自由文法とアクション修辞構造解析用の文脈自由文法とアクション改行が挿入されている特許請求項における改行直前の３形態素パターン修辞構造解析結果の視覚表示１修辞構造解析結果のタグ付きテキスト１修辞構造解析を行う特許請求項の例２修辞構造解析結果の視覚表示２修辞構造解析結果のタグ付きテキスト２

符号の説明

１０１解析対象の特許請求項
１０２形態素解析手順
１０３形態素解析結果
１０４手がかり句収集方法
１０５手がかり句集合
１０６字句解析手順
１０７字句解析結果（トークンと文字列のペア集合）
１０８修辞構造解析手順
１０９視覚表示
１１０修辞構造解析結果（タグ付きテキスト）
２０１解析対象の特許請求項
２０２形態素解析手段
２０３形態素解析結果
２０５手がかり句集合
２０６字句解析手段
２０７字句解析結果（トークンと文字列のペア集合）
２０８修辞構造解析手段
２０９視覚表示
２１０修辞構造解析結果（タグ付きテキスト）

Claims

ファイルに、
ジェプソン的形式の請求項であることを示す１以上の文字列である手がかり句の情報とジェプソン的形式の請求項に対応するトークンの情報の対を１以上有する手がかり句集合を格納しており、
ファイルに、
形態素単位文字列の情報を断片集合にまとめ、当該断片集合を構成する要素間に関係付けを行うための情報であり、トークンの情報または非終端記号の情報と、１以上のトークンの情報の列または／および１以上の非終端記号の情報の列と、断片集合にまとめ、当該断片集合を構成する要素間に関係付けを行うためのアクションの情報とのペアの情報を、複数格納しており、
解析対象の特許請求項の情報に対して、形態素解析して形態素単位文字列の情報に分割し、当該分割した形態素単位文字列を１以上得る形態素解析手段と、
前記手がかり句集合をファイルから読み出し、
当該読み出した手がかり句集合が有する手がかり句の情報であり、ジェプソン的形式の請求項であることを示す手がかり句の情報を、前記１以上の形態素単位文字列の情報に対して探索し、かつ、改行コードを探索し、改行コードの存在を検知した場合には改行コードが後続する場合のみジェプソン的形式の請求項であることを示す手がかり句の情報に一致する１以上の形態素単位文字列の情報に対して、当該手がかり句の情報と対になっているトークンの情報と前記一致する１以上の形態素単位文字列の情報をペアにして取得し、
前記ジェプソン的形式の請求項であることを示す手がかり句の情報に一致する１以上の形態素単位文字列の情報が存在するジェプソン的形式の請求項である場合には、当該請求項の前提部分と本論部分に分け、それぞれの部分に対して、末尾から前方向に探索し、前記読み出したいずれかの手がかり句の情報に一致する１以上の形態素単位文字列の情報には、当該手がかり句の情報と対になっているトークンの情報を割り当て、
ジェプソン的形式の請求項でない場合には、全体に対して末尾から前方向に探索し、前記読み出したいずれかの手がかり句の情報に一致する１以上の形態素単位文字列の情報には、当該手がかり句の情報と対になっているトークンの情報を割り当て、
かつ、ジェプソン的形式の請求項である場合でもジェプソン的形式の請求項でない場合でも、いずれの手がかり句の情報にも一致しない形態素単位文字列の情報に対して、当該形態素単位文字列に対応するトークンの情報と前記一致しない形態素単位文字列の情報をペアにして取得する字句解析手段と、
形態素単位文字列の情報を断片集合にまとめ、当該断片集合を構成する要素間に関係付けを行うための情報であり、トークンの情報または非終端記号の情報と、１以上のトークンの情報の列または／および１以上の非終端記号の情報の列と、断片集合にまとめ、当該断片集合を構成する要素間に関係付けを行うためのアクションの情報とのペアの情報を、ファイルから読み出し、
前記字句解析手段の処理結果の情報が有する１以上のトークンの情報列が、読み出した前記１以上のトークンの情報の列と一致する場合に、当該読み出した前記１以上のトークンの情報の列に対応するトークンの情報または非終端記号の情報に、前記字句解析手段の処理結果が有する１以上のトークンの情報列を置き換え、かつ、当該読み出した前記１以上のトークンの情報の列に対応するアクションの情報を用いて、形態素単位文字列の情報を断片集合にまとめ上げる処理および当該断片集合を構成する要素間に関係付け行うための情報を付与する処理を、トークンの情報がすべて非終端記号の情報に置き換わるまで繰り返し行い、当該まとめ上げる処理および関係付け行うための情報を付与する処理により得られた情報であり、１以上の断片集合の情報と、前記１以上の断片集合の情報を構成する１以上の要素の情報の間の修辞関係を示す情報を有する修辞構造木の情報を取得する修辞構造解析手段と、
前記修辞構造解析手段が取得した修辞構造木の情報を、木構造として視覚的にディスプレイに表示する手段を具備する特許請求項の修辞構造解析システム。