JP3908261B2 - 修辞構造解析システム - Google Patents

修辞構造解析システム Download PDF

Info

Publication number
JP3908261B2
JP3908261B2 JP2006146038A JP2006146038A JP3908261B2 JP 3908261 B2 JP3908261 B2 JP 3908261B2 JP 2006146038 A JP2006146038 A JP 2006146038A JP 2006146038 A JP2006146038 A JP 2006146038A JP 3908261 B2 JP3908261 B2 JP 3908261B2
Authority
JP
Japan
Prior art keywords
information
token
unit character
morpheme
jepson
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006146038A
Other languages
English (en)
Other versions
JP2006260597A (ja
Inventor
昭宏 新森
学 奥村
雄三 丸川
真 岩山
Original Assignee
インテック・ウェブ・アンド・ゲノム・インフォマティクス株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インテック・ウェブ・アンド・ゲノム・インフォマティクス株式会社 filed Critical インテック・ウェブ・アンド・ゲノム・インフォマティクス株式会社
Priority to JP2006146038A priority Critical patent/JP3908261B2/ja
Publication of JP2006260597A publication Critical patent/JP2006260597A/ja
Application granted granted Critical
Publication of JP3908261B2 publication Critical patent/JP3908261B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、特許請求項の解析のための自然言語処理技術を用いた方法、プログラム、及びシステムに関する。
特許の重要性が広く認識されるようになっている。特に、ビジネスやサービスの方法を権利の対象とする「ビジネスモデル特許」の出現や、コンピュータプログラムを対象とした「ソフトウエア特許」の認知により、広い範囲の企業関係者が特許に関わらざるを得ない状況が生まれている。
特許出願数は現在、年間40万件以上に達しており、そのデータ量は日々増加している。こうした膨大な特許データを対象とした研究は従来、検索に関するものがほとんどであった。すなわち、ある製品やサービスに関連した既存特許を漏れなく、高精度で発見することに研究と技術開発の主眼が置かれてきた。
特許明細書において、最も重要な箇所は、特許請求項(クレーム)を記述した箇所である。しかし、特許請求項は、独特の記述スタイルをもち、文長が長く、記述構造が複雑であり、知的財産権担当者や弁理士などの専門家以外の人にとっては極めて読みにくいものになっている。
新聞記事や一般的な論説文を主な対象として開発された、係り受け解析ツールKNP(非特許文献1)を日本語の特許請求項に対して実行すると、多くの場合に解析に失敗する。KNP は、シソーラスとダイナミックプログラミングを用いて文中の並列構造を検出することで、日本語の長い文を解析できるようにしている。しかし、特許請求項においては、1つの事項を説明した後でそれを用いて別の事項を説明するという、連鎖的な記述が多くみられるため、このアルゴリズムが必ずしもうまく動作しないためである。
複数の文・節から構成される談話の構造を解析するための理論として、修辞構造理論(RST: Rhetorical Structure Theory)(非特許文献2)が提唱されている。修辞構造理論においては、通常複数の文から構成されるテキストの構造を解明するために、修辞構造解析(rhetorical structure analysis)が行われる。修辞構造解析では、テキストを記述のまとまりごとに断片(segment)に分割し、断片間の関係付けを行いながら修辞構造木(rhetorical structure tree)を組み上げることで、その構造を解明する。断片間を関係付ける際には、あらかじめ定義してある修辞関係(rhetorical relation)の1つが割り当てられる。修辞関係には、関係を構成する要素群が対等である関係と、重要な要素(nucleus:核=主要部)と補足的な要素(satellite:衛星=周辺部)とから構成される関係とがある。前者を多核(multi−nuclear)関係と呼び、後者を単核(single−nuclear)関係と呼ぶ。修辞構造を対話型でグラフィカルに編集・表示するためのツールとして、Tcl/TkによるRSTTool(非特許文献3)も開発されている。
英語の新聞記事や論説文(論文、社説等)を対象として、手がかり句を用いて修辞構造を解析する手法(非特許文献4)が提案されている。また、日本語の新聞記事や論説文(論文、社説等)を対象とした手法もいくつか提唱されている(特許文献1、特許文献2、特許文献3)。しかし、これらの手法は、基本的には、複数の文を対象としており、1文から構成される特許請求項の解析に使用することはできない。 特許明細書の閲覧に関する手法(特許文献4)もすでに提唱されているが、これらは、言語処理技術により特許請求項の構造を解析する本手法とは異なるものである。
特公平07−11801号公報 特公平07−007418号公報 特表2001−523019号公報 v 特開2002−149704号公報 黒橋禎夫:結構やるな、KNP、情報処理、Vol.41、No.11、pp.1215−1220, (2000). Bill Mann: An Introduction to Rhetorical Structure Theory (RST), http://www.sil.org/mannb/rst/rintro99.htm, (1999). Michael O 'Donnell: RST−Tool: An RST Analysis Tool, Proceedings of the 6th European Workshop on Natural Language Generation, (1997). Daniel Marcu: The Rhetorical Parsing of Unrestricted Texts: A Surface−based Approach, Computational Linguistics, Vol.26, No.3, (2000).
本発明は、文長が長く記述が複雑な特許請求項の修辞構造を解析し、その読解を支援するとともに、他の言語処理アプリケーションの利用を支援するための方法、プログラム、及びシステムを提供する。
まず、特許請求項の記述スタイルを以下の3つに類型化する。
(1)順次列挙形式
「…し、…し、…した、…」のように、処理を順序的に記述する形式。
(2)構成要素列挙形式
「…と、…と、…とからなる、…」のように、構成要素を列挙する形で記述する形式。
(3)ジェプソン(Jepson)的形式
「…において、…を特徴とする、…」、「…であって、…を特徴とする、…」のように、最初に、公知部分(既に知られている内容)または前提条件を述べた上で、新規部分(この発明の特徴となる部分)または本論部分を記述する形式。
次に、特許請求項用の修辞関係を図1に示すように定義する。図1の例の欄において、"["と"]"で囲まれた部分が断片である。単核の関係の場合、下線が引かれている部分が核である。そして、図1に示す修辞関係を用いて、修辞構造解析を行う。
第一の発明は、コンピュータを用いて特許請求項の修辞構造解析を行う方法に関するものである。第二の発明は、コンピュータを用いて特許請求項の修辞構造解析を行うプログラムに関するものである。第一の発明および第二の発明の処理フローを図2に示す。その手順として、以下のものを備える。
(1)形態素解析手順
解析対象の特許請求項を形態素解析して形態素単位文字列に分割する。
(2)字句解析手順
前記形態素解析手順の出力を入力し、文脈を判定しながら所与の手がかり句集合の一要素に相当する1つ以上の形態素単位文字列を検索し、検出された場合は当該手がかり句に対応するトークンと前記1つ以上の形態素単位文字列を連結した文字列とを出力し、それ以外の部分については当該形態素に対応するトークンと当該形態素単位文字列とを出力する。
(3)修辞構造解析手順
前記字句解析手順から出力されたトークンと文字列とを入力し、文脈自由文法で記述された文法からパーサジェネレータにより生成されたパーサにより1つ以上の前記形態素単位文字列から構成される断片の集合にまとめ、前記断片集合の要素間に関係付けを行うことで修辞構造木を組み上げる。
第三の発明は、コンピュータを用いて特許請求項の修辞構造解析を行うシステムに関するものである。第三の発明のシステム構成を図3 に示す。その手段として、以下のものを備える。
(1)形態素解析手段
解析対象の特許請求項を形態素解析して形態素単位文字列に分割する。
(2)字句解析手段
前記形態素解析手段の出力を入力し、文脈を判定しながら所与の手がかり句集合の一要素に相当する1つ以上の形態素単位文字列を検索し、検出された場合は当該手がかり句に対応するトークンと前記1つ以上の形態素単位文字列を連結した文字列とを出力し、それ以外の部分については当該形態素に対応するトークンと当該形態素単位文字列とを出力する。
(3)修辞構造解析手段
前記字句解析手段から出力されたトークンと文字列とを入力し、文脈自由文法で記述された文法からパーサジェネレータにより生成されたパーサにより1つ以上の前記形態素単位文字列から構成される断片の集合にまとめ、前記断片集合の要素間に関係付けを行うことで修辞構造木を組み上げる。
第一の発明または第二の発明または第三の発明のいずれか一の発明において使用する所与の手がかり句集合には、
・既存の特許明細書から抽出した複数の特許請求項で明示的に指定されている断片境界周辺の記述形式を収集してパターン化することで得られる手がかり句と、
・既存の特許明細書から抽出した複数の特許請求項で高頻度で使用される記述形式をパターン化することで得られる手がかり句と
を含むことを特徴とする。
第一の発明または第二の発明または第三の発明のいずれか一の発明の出力として得られる特許請求項の修辞構造解析結果を、タグ付きテキストとして出力する。
本発明により、文長が長く記述が複雑な特許請求項の修辞構造を解析することができるため、当該特許請求項を構成する要素または処理が明確になる。修辞構造解析結果を視覚的に表示することで、その読解性が格段に向上する。修辞構造をタグ付きテキストとして出力することで、当該特許請求項を構成する要素または処理と、当該特許明細書の発明の詳細な説明中での対応する説明箇所の自動リンク付けや、他の関連特許との比較分析、特許請求項の他言語への翻訳など、他の言語処理アプリケーションでの利用が容易となる。
(実施例1)
第一の発明、第二の発明、第三の発明の実施例について説明する。
(0)修辞構造解析に使用する手がかり句
図4に示す手がかり句を使用して、修辞構造解析を行う。なお、図4中、および以降の説明において、手がかり句およびパターンの表記には、Perl言語(参考文献:Larry Wall、Tom Christiansen、Randal L. Schwartz 共著、近藤 嘉雪 訳、プログラミングPerl 改訂版、オライリージャパン)の正規表現を使用している。
(1)形態素解析
奈良先端科学技術大学院大学で開発された形態素解析ツールである茶筌(参考文献:松本裕治、北内啓、山下達雄、平野善隆、松田寛、高岡一馬、浅原正幸:形態素解析システム『茶筌』version 2.2.9 使用説明書,奈良先端科学技術大学院大学松本研究室,(2002))を使用して形態素解析を行う。その際、もともと挿入されている改行コードは、そのままの状態で入力する。茶筌には、−j オプションを使用し、区切り文字を「。:;」のいずれかとする。
(2)字句解析
形態素解析結果を、文脈を判定しながら、トークンと文字列のペアの列に変換する。トークンの種別は、以下の通りである。
JEPSON_CUE
図4におけるJEPSON_CUE に該当する手がかり句を認識した場合に1回だけ出力する。改行コードを含む特許請求項の場合、改行コードが後続する場合のみ、手がかり句を認識させる。該当するものが個以上存在する場合、後方に出現するものに対して出力する。
FEATURE_CUE
図4におけるFEATURE_CUE に該当する手がかり句を認識した場合に出力する。
COMPOSE_CUE
文脈に依存して、図4におけるCOMPOSE_CUEに該当する手がかり句を認識した場合に出力する。
NOUN
文脈に依存して認識した「(名詞|記号)と(、|,)」の名詞・記号の部分、または記述末尾に連続出現する名詞・記号・接続詞・動詞体言接続形・接頭詞について、出力する。
POSTP_TO
文脈に依存して認識した「(名詞|記号)と(、|,)」について、「と」の部分に対して出力する。
POSTP_NO
記述末尾の名詞・記号、またはJEPSON_CUE、またはFEATURE_CUEの直前の名詞・記号について、その前方に隣接して助詞「の」「と」「における」のいずれかが存在し、その直前に名詞または記号が隣接する場合、助詞「の」「と」「における」に対して出力する。
VERB_RENYOU
文脈に依存して認識した「(動詞連用形|助動詞連用形)(、|,)」について、「(動詞連用形|助動詞連用形)」の部分に対して出力する。
VERB_KIHON
文脈に依存して認識した「(動詞基本形|助動詞基本形)(、|,)」について、「(動詞基本形|助動詞基本形)」の部分に対して出力する。
PUNCT_TOUTEN
文脈に依存して認識した「(名詞|記号)と(、|,)」または「(動詞連用形|助動詞連用形)(、|,)」について,「(、|,)」の部分に対して出力する。
WORD
上記の処理対象とならなかった形態素に対して出力する。
字句解析の文脈依存の処理の詳細について、以下に説明する。
(1)記述末尾から前方向に探索し、NOUN、POSTP_NOトークンに変換する。
(2)JEPSON_CUE、FEATURE_CUEの直前から前方向に探索し、NOUN、POSTP_NOトークンに変換する。
(3)非ジェプソン的形式の場合は全体に対して1回、ジェプソン的形式の場合は公知部分・前提条件と、新規部分・本論部分のそれぞれに対して、前方向に探索し、以下のいずれのパターンが後に出現するかを調べ、見つかったものをトークン化する。
(a)(動詞基本形|助動詞基本形)(、|,)?NOUN
(b)COMPOSE_CUE
(4)(a)の場合、さらに前方向に探索し、他の手がかり句トークンが存在するまでの範囲において、VERB_RENYOU、PUNCT_TOUTENトークンに変換する。
(5)(b)の場合、COMPOSE_CUEの直前に、「と(、|,)?」が存在するときは、さらに前方向に探索し、他の手がかり句トークンが存在するまでの範囲において、NOUN、POSTP_TO、PUNCT_TOUTENトークンに変換する。そうでない場合、他の手がかり句トークンが存在するまでの範囲において、VERB_RENYOU、PUNCT_TOUTENトークンに変換する。
(6)上記の処理によって生成されたNOUNトークンに対して、その前方向を探索し、NOUN、POSTP_NOトークンに変換する。
字句解析における文脈依存処理の状況を示すために、図5の特許請求項テキスト(特開平10−011111の第一請求項)を字句解析に入力したときの出力の一部を図6に示す。図6において、各行は、トークンと文字列のペアから成っている。ここでたとえば、「原稿」という名詞に対するトークンとして、出現文脈に応じて、NOUNとWORDのいずれかが与えられている。また、「...」は、途中の省略箇所を表している。
(3)修辞構造解析
文脈自由文法による記述からパーサを生成するパーサジェネレータであるBison(参考文献:Charles Donnelly, Richard Stallman: Bison:The YACC−compatible Parser Generator,Version 1.25,1995)互換のPerl用ツールであるParse::Yapp(入手先:http://www.cpan.org/modules/by−authors/id/F/FD/FDESAR/Parse−Yapp−1.05.tar.gz, (c) 1998−2001 Francois Desarmenien)利用してパーサを生成し、このパーサを用いて修辞構造解析を行う。
図7に、Parse::Yappに入力するファイルを示す。このファイルは、%%で区切られた、以下の3つの部分から構成されている。
(a)宣言部分
(b)文脈自由文法のルールと対応するアクションの集合
(c)補助的なサブルーチン定義
(b)の文脈自由文法記述において、アルファベット大文字で記述されたものはトークン(終端記号)であり、アルファベット小文字で記述されたものは非終端記号である。アクションは{}内に記述されている。アクション記述中で、$_[1]、$_[2]はそれぞれ、対応するルール右側の1番目、2番目の要素に対応する値を意味する。(a)、(b)、(c)において、プログラムの記述は、Perlの記法に従っている。
(実施例2)
第四の発明の実施例について説明する。
まず、既存の特許明細書から抽出した複数の特許請求項で明示的に指定されている断片境界周辺の記述形式を収集してパターン化することによる手がかり句の収集について説明する。
既存の特許明細書から第一請求項を抽出し、などのタグを削除して、第一請求項テキスト集合とする。第一請求項テキスト集合の要素のうち、記述中に改行コード(0x0aのコード)を含むもの、つまり2行以上から構成されるものを対象とし、茶筌を用いて形態素解析を行う。茶筌には、−jオプションを使用し、区切り文字を「。:;」のいずれかとする。最終行以外の行において、行末の改行直前の形態素を3つ分抽出し、以下のようにパターン化する。
・名詞と記号はそれぞれ、「名詞」と「記号」に変換する。
・動詞連用形と助動詞連用形はそれぞれ、「動詞連用形」と「助動詞連用形」に変換する。
NTCIR3特許データコレクション(参考文献: 岩山真,藤井敦,高野明彦,神門典子:特許コーパスを用いた検索タスクの提案,情報処理学会研究報告−情報学基礎,FI−63−007,2001)から抽出した約6万件の第一請求項を対象として、上記の処理を行った結果を図8に示す。
図8の結果から、以下のような手がかり句を収集することができる。
(名詞|記号)と(、|,)
(動詞連用形|助動詞連用形)(、|,)
(名詞|記号)(において|に於いて|に於て)(、|,)
(名詞|記号)であって(、|,)
次に、既存の特許明細書から抽出した複数の特許請求項で高頻度で使用される記述形式をパターン化することによる手がかり句の収集について説明する。
前記の第一請求項テキスト集合について、各要素を茶筌により形態素解析し、分かち書きを行う。これに対して、20グラムまでのnグラム統計(参考文献:長尾真編、岩波講座ソフトウエア科学15「自然言語処理」、1999)をとる。その結果をもとに、以下のような手がかり句を収集することができる。
を特徴と(した|する)(、|,)?
前記の第一請求項テキスト集合について、各要素を茶筌により形態素解析し、名詞・複合名詞・未知語・形容詞・接頭詞・助詞・記号をそれぞれ、「名詞」・「複合名詞」・「未知語」・「形容詞」・「接頭詞」・「助詞」・「記号」に変換することでパターン化し、以下のような正規表現により、記述末尾の「名詞まとまり」を判定する。
((<接頭詞>|<名詞>|<複合名詞>|<未知語>|<形容詞>)* | ((<接頭詞>|<名詞>|<複合名詞>|<未知語>|<形容詞>)+(<記号>|<助詞>)?(<接頭詞>|<名詞>|<複合名詞>|<未知語>|<形容詞>)* ))
(<名詞>|<複合名詞>|<未知語>)$
検出した「名詞まとまり」の直前の15形態素を抽出して分析する。これにより、以下のような手がかり句を収集することができる。
を特徴と(した|する)(、|,)?
を備えた(、|,)?
を設けた(、|,)?
を含(む|んだ)(、|,)?
(実施例3)
第五の発明の実施例について説明する。
図5の特許請求項を入力し、第一の発明または第二の発明または第三の発明の出力として得られる修辞構造解析結果を視覚的に表示したものを図9に示す。
(実施例4)
第六の発明の実施例について説明する。
図5の特許請求項を入力し、第一の発明または第二の発明または第三の発明の出力として得られる修辞構造解析結果をタグ付きテキストとして出力したものを図9に示す。

(実施例5)
図11の特許請求項を入力して修辞構造解析を行い、修辞構造解析結果を視覚的に表示したものを図12に示す。タグ付きテキストとして出力したものを図13に示す。
以上のように、本発明は、文長が長く記述が複雑な特許請求項の修辞構造を解析し、その読解が支援できる、という効果を有し、特許請求項を解析する装置等として有用である。
特許請求項用の修辞関係 処理フロー システム構成 特許請求項解析のための手がかり句 修辞構造解析を行う特許請求項の例1 字句解析の出力の一部 修辞構造解析用の文脈自由文法とアクション 修辞構造解析用の文脈自由文法とアクション 修辞構造解析用の文脈自由文法とアクション 修辞構造解析用の文脈自由文法とアクション 修辞構造解析用の文脈自由文法とアクション 修辞構造解析用の文脈自由文法とアクション 修辞構造解析用の文脈自由文法とアクション 修辞構造解析用の文脈自由文法とアクション 修辞構造解析用の文脈自由文法とアクション 修辞構造解析用の文脈自由文法とアクション 修辞構造解析用の文脈自由文法とアクション 修辞構造解析用の文脈自由文法とアクション 修辞構造解析用の文脈自由文法とアクション 修辞構造解析用の文脈自由文法とアクション 修辞構造解析用の文脈自由文法とアクション 改行が挿入されている特許請求項における改行直前の3形態素パターン 修辞構造解析結果の視覚表示1 修辞構造解析結果のタグ付きテキスト1 修辞構造解析を行う特許請求項の例2 修辞構造解析結果の視覚表示2 修辞構造解析結果のタグ付きテキスト2
符号の説明
101 解析対象の特許請求項
102 形態素解析手順
103 形態素解析結果
104 手がかり句収集方法
105 手がかり句集合
106 字句解析手順
107 字句解析結果(トークンと文字列のペア集合)
108 修辞構造解析手順
109 視覚表示
110 修辞構造解析結果(タグ付きテキスト)
201 解析対象の特許請求項
202 形態素解析手段
203 形態素解析結果
205 手がかり句集合
206 字句解析手段
207 字句解析結果(トークンと文字列のペア集合)
208 修辞構造解析手段
209 視覚表示
210 修辞構造解析結果(タグ付きテキスト)

Claims (1)

  1. ファイルに、
    ジェプソン的形式の請求項であることを示す1以上の文字列である手がかり句の情報とジェプソン的形式の請求項に対応するトークンの情報の対を1以上有する手がかり句集合を格納しており、
    ファイルに、
    形態素単位文字列の情報を断片集合にまとめ、当該断片集合を構成する要素間に関係付けを行うための情報であり、トークンの情報または非終端記号の情報と、1以上のトークンの情報の列または/および1以上の非終端記号の情報の列と、断片集合にまとめ、当該断片集合を構成する要素間に関係付けを行うためのアクションの情報とのペアの情報を、複数格納しており、
    解析対象の特許請求項の情報に対して、形態素解析して形態素単位文字列の情報に分割し、当該分割した形態素単位文字列を1以上得る形態素解析手段と、
    前記手がかり句集合をファイルから読み出し、
    当該読み出した手がかり句集合が有する手がかり句の情報であり、ジェプソン的形式の請求項であることを示す手がかり句の情報を、前記1以上の形態素単位文字列の情報に対して探索し、かつ、改行コードを探索し、改行コードの存在を検知した場合には改行コードが後続する場合のみジェプソン的形式の請求項であることを示す手がかり句の情報に一致する1以上の形態素単位文字列の情報に対して、当該手がかり句の情報と対になっているトークンの情報と前記一致する1以上の形態素単位文字列の情報をペアにして取得し、
    前記ジェプソン的形式の請求項であることを示す手がかり句の情報に一致する1以上の形態素単位文字列の情報が存在するジェプソン的形式の請求項である場合には、当該請求項の前提部分と本論部分に分け、それぞれの部分に対して、末尾から前方向に探索し、前記読み出したいずれかの手がかり句の情報に一致する1以上の形態素単位文字列の情報には、当該手がかり句の情報と対になっているトークンの情報を割り当て、
    ジェプソン的形式の請求項でない場合には、全体に対して末尾から前方向に探索し、前記読み出したいずれかの手がかり句の情報に一致する1以上の形態素単位文字列の情報には、当該手がかり句の情報と対になっているトークンの情報を割り当て、
    かつ、ジェプソン的形式の請求項である場合でもジェプソン的形式の請求項でない場合でも、いずれの手がかり句の情報にも一致しない形態素単位文字列の情報に対して、当該形態素単位文字列に対応するトークンの情報と前記一致しない形態素単位文字列の情報をペアにして取得する字句解析手段と、
    形態素単位文字列の情報を断片集合にまとめ、当該断片集合を構成する要素間に関係付けを行うための情報であり、トークンの情報または非終端記号の情報と、1以上のトークンの情報の列または/および1以上の非終端記号の情報の列と、断片集合にまとめ、当該断片集合を構成する要素間に関係付けを行うためのアクションの情報とのペアの情報を、ファイルから読み出し、
    前記字句解析手段の処理結果の情報が有する1以上のトークンの情報列が、読み出した前記1以上のトークンの情報の列と一致する場合に、当該読み出した前記1以上のトークンの情報の列に対応するトークンの情報または非終端記号の情報に、前記字句解析手段の処理結果が有する1以上のトークンの情報列を置き換え、かつ、当該読み出した前記1以上のトークンの情報の列に対応するアクションの情報を用いて、形態素単位文字列の情報を断片集合にまとめ上げる処理および当該断片集合を構成する要素間に関係付け行うための情報を付与する処理を、トークンの情報がすべて非終端記号の情報に置き換わるまで繰り返し行い、当該まとめ上げる処理および関係付け行うための情報を付与する処理により得られた情報であり、1以上の断片集合の情報と、前記1以上の断片集合の情報を構成する1以上の要素の情報の間の修辞関係を示す情報を有する修辞構造木の情報を取得する修辞構造解析手段と、
    前記修辞構造解析手段が取得した修辞構造木の情報を、木構造として視覚的にディスプレイに表示する手段を具備する特許請求項の修辞構造解析システム。
JP2006146038A 2006-05-26 2006-05-26 修辞構造解析システム Expired - Fee Related JP3908261B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006146038A JP3908261B2 (ja) 2006-05-26 2006-05-26 修辞構造解析システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006146038A JP3908261B2 (ja) 2006-05-26 2006-05-26 修辞構造解析システム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2002326334A Division JP4289871B2 (ja) 2002-11-11 2002-11-11 特許請求項の修辞構造解析方法、特許請求項の修辞構造解析プログラム、及び特許請求項の修辞構造解析システム

Publications (2)

Publication Number Publication Date
JP2006260597A JP2006260597A (ja) 2006-09-28
JP3908261B2 true JP3908261B2 (ja) 2007-04-25

Family

ID=37099675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006146038A Expired - Fee Related JP3908261B2 (ja) 2006-05-26 2006-05-26 修辞構造解析システム

Country Status (1)

Country Link
JP (1) JP3908261B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101069278B1 (ko) * 2009-08-21 2011-10-04 (주)윕스 청구항 시각화 장치 및 방법
US10853574B2 (en) * 2017-09-28 2020-12-01 Oracle International Corporation Navigating electronic documents using domain discourse trees
US11809825B2 (en) 2017-09-28 2023-11-07 Oracle International Corporation Management of a focused information sharing dialogue based on discourse trees
CN112106056A (zh) 2018-05-09 2020-12-18 甲骨文国际公司 构造虚构的话语树来提高回答聚敛性问题的能力
US11580298B2 (en) 2019-11-14 2023-02-14 Oracle International Corporation Detecting hypocrisy in text
JPWO2021125252A1 (ja) * 2019-12-20 2021-06-24
CN112966474B (zh) * 2021-02-20 2024-05-24 中央民族大学 一种基于多级注意力机制的藏文机器阅读理解方法

Also Published As

Publication number Publication date
JP2006260597A (ja) 2006-09-28

Similar Documents

Publication Publication Date Title
JP3908261B2 (ja) 修辞構造解析システム
JP2007334894A (ja) ドキュメントの注釈をソースドキュメントのコンテキスト内で視覚化すること
KR20160138077A (ko) 기계 번역 시스템 및 방법
JP2007241764A (ja) 構文解析プログラム、構文解析方法、構文解析装置、及び構文解析プログラムが記録されたコンピュータ読み取り可能な記録媒体
Khan et al. A light weight stemmer for Urdu language: a scarce resourced language
Hardie Corpus linguistics
Sornlertlamvanich et al. Thai Part-of-Speech Tagged Corpus: ORCHID
JP2006251843A (ja) 同義語対抽出装置及びそのためのコンピュータプログラム
Tsarfaty Integrated morphological and syntactic disambiguation for modern hebrew
Sagot et al. A morphological lexicon for the Persian language
Jacksi et al. The Kurdish Language corpus: state of the art
JP4289871B2 (ja) 特許請求項の修辞構造解析方法、特許請求項の修辞構造解析プログラム、及び特許請求項の修辞構造解析システム
Vasiu et al. Enhancing tokenization by embedding romanian language specific morphology
Puscasu A multilingual method for clause splitting
Yeshambel et al. Evaluation of corpora, resources and tools for Amharic information retrieval
Kumarasinghe et al. Sinmorphy: A morphological analyzer for the sinhala language
Sawalha et al. Linguistically informed and corpus informed morphological analysis of Arabic
Borin et al. Language technology for digital linguistics: Turning the linguistic survey of India into a rich source of linguistic information
Dione Finite-state tokenization for a deep Wolof LFG grammar
Robertson Show, Don't Tell: Visualising Finnish Word Formation in a Browser-Based Reading Assistant
Adewole et al. Token Validation in Automatic Corpus Gathering for Yoruba Language
Lehal A two stage word segmentation system for handling space insertion problem in Urdu script
Cheng et al. MAG-Tagalog: A rule-based Tagalog morphological analyzer and generator
Bonus The Tagalog Stemming Algorithms (TagSA)
Dash et al. Lemmatization of Inflected Nouns

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060901

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070117

R150 Certificate of patent or registration of utility model

Ref document number: 3908261

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100126

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100126

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130126

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130126

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130126

Year of fee payment: 6

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130126

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160126

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees