JP2014013549A - 自然言語解析システムおよび自然言語解析方法 - Google Patents
自然言語解析システムおよび自然言語解析方法 Download PDFInfo
- Publication number
- JP2014013549A JP2014013549A JP2012151514A JP2012151514A JP2014013549A JP 2014013549 A JP2014013549 A JP 2014013549A JP 2012151514 A JP2012151514 A JP 2012151514A JP 2012151514 A JP2012151514 A JP 2012151514A JP 2014013549 A JP2014013549 A JP 2014013549A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- word
- semantic
- tag
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】解析対象文章の分野や文章自体の構成に拘わらず、解析対象文章の意味・内容の解釈の精度を向上することのできる自然言語解析システムおよび自然言語解析方法を提供する。
【解決手段】この自然言語解析システムは、様々な内容語や機能語を格納している意味概念辞書を格納しており、前記内容語にはそれぞれ1つ又は複数の意味タグが付与されており、各意味タグのうち一部は前記内容語と、前記内容語と同一文中又は他の文中にあらわれ前記内容語と因果関係のある単語等とを関連付けるものである。そして、このシステムは、意味概念辞書を参照して解析対象文章を解析し、解析対象文章に因果関係を示す意味タグを付与し出力するので、クライアントコンピュータ側で複数の文から成る文章の文脈を文を跨いで推測できるようになる。
【選択図】図1
【解決手段】この自然言語解析システムは、様々な内容語や機能語を格納している意味概念辞書を格納しており、前記内容語にはそれぞれ1つ又は複数の意味タグが付与されており、各意味タグのうち一部は前記内容語と、前記内容語と同一文中又は他の文中にあらわれ前記内容語と因果関係のある単語等とを関連付けるものである。そして、このシステムは、意味概念辞書を参照して解析対象文章を解析し、解析対象文章に因果関係を示す意味タグを付与し出力するので、クライアントコンピュータ側で複数の文から成る文章の文脈を文を跨いで推測できるようになる。
【選択図】図1
Description
この発明は、文章を解析する技術に関し、特に、自然言語からなる文章をその文章中に明記されていない文脈を推測しながら解析することのできる自然言語解析システムおよび自然言語解析方法並びに意味タグ付与システムに関する。
従来から、文章要約ソフト、翻訳ソフト、検索ソフト、テキストマイニングエンジン等の文章情報を活用する製品・サービスの分野において、文章の内容や意図を出来るだけ正確に解釈するために様々な手法が検討されてきている。ここで、前記要約ソフト等の対象となる文章には様々な分野のものがあり、また、文章を構成する文や文章自体の構成には分野や書き手により様々なパターンがあり、機械が処理するコンピュータ言語と異なり曖昧性を有する。このため、人間が書く文章の内容や意図を正確に解釈するために様々な研究が行われてきているが、文章の内容や意図をコンピュータによって正確に把握することはいまだに難しい技術であると言われている。
例えば、単語自体の意味や、各単語をその類似語や上位概念語と関連づけて巨大な単語のシソーラスを形成しておき、解析対象文章に形態素解析や構文解析を行った後に、その解析後の文章に上記シソーラスを適用し、解析対象文章の内容や意味を解釈する手法が研究されてきている。また、単に形態素解析、構文解析および上記の単語のシソーラスを用いて文章を解析しただけでは、動詞等の単語の多義性等により文章の内容や意味を正確に把握することはできないので、動詞と名詞等の頻度情報によるベクトル空間上の単語間距離に基づいて動詞の一意性を判断し、その判断結果に基づいて前記シソーラスを修正する方法も検討されている(例えば、特許文献1参照)。
また、単語の多義性を判断する手法の一つとして、多義性動詞や多義性名詞に複数の意味を付与すると共に、各意味に対応する対象・範囲を意味クラスとして付与し、これらを上記シソーラスに格納する方法も検討されている(例えば、特許文献2参照)。この方法では、動詞や名詞の各意味に対してそれぞれ対応する対象・範囲が付与されているので、例えばある多義性名詞(例えば、車を運転する者、工具、およびゴルフの道具の意味を有する「ドライバー」)を、その文にあらわれる他の単語の意味に応じて点数付けし、その点数に応じてその文の中における前記多義性名詞の意味が選択される。これにより、各文中にあらわれる各単語の意味をより正確に解釈して、文章全体の意味・内容解釈の精度の向上を図っている。
しかしながら、上述のように、要約ソフトやテキストマイニングツールの対象となる文章には様々な分野のものがあり、また、文章を構成する文や文章自体の構成には分野や書き手により様々なパターンがある。例えば、長文が多用されており、各文の中に行動、評価、結論、その理由、原因、目的、感情等が全て含まれている文章もあるが、逆に短文が多用されており、行動の文、評価の文、理由の文、原因の文、感情の文などがそれぞれ独立して存在する文章もある。また、短文が多用される文章(例えば会話書き起こし文など)の場合、行動や評価の理由がその文の近くの文の記載されている場合もあるが、遠く離れた文に記載されている場合もある。このため、前記特許文献1および2のように、ある1文中における単語の意味をその文章中にあらわれる前後の単語を参照して正確に把握するようにしても、文章全体の文脈を正確に把握できない場合があり、文章全体の意味・内容解釈の精度の向上には限界がある。
また、従来における主な文章要約技術は、文章中に出現する頻度の多い単語や予め設定された単語を重要語として選定する重要語選定工程と、各文において重要語と関連して使用されている単語を選定する単語選定工程と、重要語が多くあらわれる1つ又は複数の文を重要文として選定する文選定工程とを有し、前記文選定工程で選定された文を前記重要語選定工程と単語選定工程で選ばれた単語を中心にして短縮するものである。このため、従来の要約技術を用いる場合、解析対象文章に比較的長めの文が使用されており、要約による文章の圧縮率が30%以上であれば、要約された文章に元の文章の意味・内容がうまく反映される場合もあるが、解析対象文章に短文が多用されており、要約による文章の圧縮率が30%以下である場合や重要語が明示的に抽出できない要約対象文章などは、要約された文章において元の文章の意味・内容を反映させることは難しい。
本発明は、このような課題を解決するためになされたもので、解析対象文章の分野や文章自体の構成に拘わらず、解析対象文章の意味・内容の解釈の精度を向上することのできる自然言語解析システムおよび自然言語解析方法並びに意味タグ付与システムを提供することにある。
上記目的を達成するため、本発明の主要な観点によれば、クライアントコンピュータと、前記クライアントコンピュータと通信回線を介して接続される自然言語解析サーバとを有する自然言語解析システムであって、前記自然言語解析サーバは、行動又は評価の内容を有する様々な内容語を格納している意味概念辞書を記憶格納する意味概念辞書格納部であって、前記意味概念辞書に格納されている前記各内容語には1つ又は複数の因果関係意味タグが付与されており、前記1つ又は複数の因果関係意味タグはそれぞれ、前記各内容語と、前記各内容語と因果関係のある1つ又は複数の単語、句又は節とを関連付けるものである、前記意味概念辞書格納部を有し、前記自然言語解析サーバはさらに、コンピュータが、前記クライアントコンピュータから解析対象文章を受信しメモリに格納する解析対象文章格納手段と、コンピュータが、前記解析対象文章格納手段で格納した解析対象文章を前記メモリから取り出し、取り出した解析対象文章に分かち書き処理、品詞付け処理、文節統合処理、および係り受け解析を実行する形態素・構文解析処理手段と、コンピュータが、前記形態素・構文解析処理手段による解析後の文章中において内容語を少なくとも1つ選択する内容語選択手段と、コンピュータが、前記意味概念辞書格納部に格納された前記意味概念辞書から、前記内容語選択手段により選択された内容語又は当該内容語の同義語、類義語、対義語、上位概念語若しくは下位概念語である内容語に付与された前記1つ又は複数の因果関係意味タグを読み出し、読み出した因果関係意味タグのうち前記解析対象文章中にあらわれる単語、句又は節と関連する因果関係意味タグを少なくとも1つ特定する意味タグ特定手段と、コンピュータが、前記意味タグ特定手段で特定された因果関係意味タグのうち少なくとも1つを、前記意味タグ特定手段で関連すると特定された前記単語、句又は節と関連付けて前記解析後の文章中における前記選択された内容語に付与する意味タグ付与手段と、コンピュータが、前記意味タグ付与手段によって意味タグが付与された前記解析後文章を前記クライアントコンピュータに送信する送信手段とを有することを特徴とする自然言語解析システムが提供される。
また、本発明の他の主要な観点によれば、クライアントコンピュータと、前記クライアントコンピュータと通信回線を介して接続される自然言語解析サーバとを有する自然言語解析システムであって、前記クライアントコンピュータは、コンピュータが、他のコンピュータから解析対象文章を受信しメモリに格納する格納手段と、コンピュータが、前記格納手段で格納した前記解析対象文章を前記メモリから取り出し、取り出した解析対象文章に分かち書き処理、品詞付け処理、文節統合処理、および係り受け解析を実行する形態素・構文解析処理手段と、コンピュータが、前記形態素・構文解析処理手段による解析後の解析対象文章を前記自然言語解析サーバに送信する送信手段とを有し、前記自然言語解析サーバは、行動又は評価の内容を有する様々な内容語を格納している意味概念辞書を記憶格納する意味概念辞書格納部であって、前記意味概念辞書に格納されている前記各内容語には1つ又は複数の因果関係意味タグが付与されており、前記1つ又は複数の因果関係意味タグはそれぞれ、前記各内容語と、前記各内容語と因果関係のある1つ又は複数の単語、句又は節とを関連付けるものである、前記意味概念辞書格納部を有し、前記自然言語解析サーバはさらに、コンピュータが、前記クライアントコンピュータから前記解析後の解析対象文章を受信しメモリに格納する解析対象文章格納手段と、コンピュータが、前記解析対象文章格納手段で格納した前記解析後の解析対象文章を前記メモリから取り出し、取り出した前記解析後の解析対象文章中において内容語を少なくとも1つ選択する内容語選択手段と、コンピュータが、前記意味概念辞書格納部に格納された意味概念辞書から、前記内容語選択手段により選択された内容語又は当該内容語の同義語、類義語、対義語、上位概念語若しくは下位概念語である内容語に付与された前記1つ又は複数の因果関係意味タグを読み出し、読み出した因果関係意味タグのうち前記解析後の解析対象文章中にあらわれる単語、句又は節と関連する因果関係意味タグを少なくとも1つ特定する意味タグ特定手段と、コンピュータが、前記意味タグ特定手段で特定された因果関係意味タグのうち少なくとも1つを、前記意味タグ特定手段で関連すると特定された前記単語、句又は節と関連付けて前記解析後の解析対象文章中における前記選択された内容語に付与する意味タグ付与手段と、コンピュータが、前記意味タグ付与手段によって意味タグが付与された前記解析後の解析対象文章を前記クライアントコンピュータに送信する送信手段とを有することを特徴とする自然言語解析システムが提供される。
また、本発明のさらに他の主要な観点によれば、クライアントコンピュータと前記クライアントコンピュータと通信回線を介して接続される自然言語解析サーバとを用いて解析対象文章を解析する自然言語解析方法であって、前記自然言語解析サーバは、行動又は評価の内容を有する様々な内容語を格納している意味概念辞書を記憶格納する意味概念辞書格納部であって、前記意味概念辞書に格納されている前記各内容語には1つ又は複数の因果関係意味タグが付与されており、前記1つ又は複数の因果関係意味タグはそれぞれ、前記各内容語と、前記各内容語と因果関係のある1つ又は複数の単語、句又は節とを関連付けるものである、前記意味概念辞書格納部を有し、この方法は、前記クライアントコンピュータ又は前記自然言語解析サーバが、前記解析対象文章に分かち書き処理、品詞付け処理、文節統合処理、および係り受け解析を実行する形態素・構文解析工程と、前記クライアントコンピュータ又は前記自然言語解析サーバが、前記形態素・構文解析工程による解析後の文章中において内容語を少なくとも1つ選択する内容語選択工程と、前記自然言語解析サーバが、前記意味概念辞書格納部に格納された前記意味概念辞書から、前記内容語選択工程により選択された内容語又は当該内容語の同義語、類義語、対義語、上位概念語若しくは下位概念語である内容語に付与された1つ又は複数の因果関係意味タグを読み出し、読み出した因果関係意味タグのうち前記解析対象文章中にあらわれる単語、句又は節と関連する因果関係意味タグを少なくとも1つ特定する意味タグ特定工程と、前記自然言語解析サーバが、前記意味タグ特定工程で特定された因果関係意味タグのうち少なくとも1つを、前記意味タグ特定工程で関連すると特定された前記単語、句又は節と関連付けて前記解析後の文章中における前記選択された内容語に付与する意味タグ付与工程と、前記自然言語解析サーバが、前記意味タグ付与工程によって意味タグが付与された前記解析後文章を前記クライアントコンピュータに送信する送信工程とを有することを特徴とする自然言語解析方法が提供される。
また、本発明の実施形態によれば、前記因果関係意味タグが、前記行動又は評価の内容を有する様々な内容語と、当該各内容語の行動又は評価の理由又は原因となる1つ又は複数の単語、句又は節とを関連付けるものであることを特徴とする自然言語解析システムが提供される。
また、本発明の他の実施形態によれば、前記意味概念辞書には、様々な文末の形態が格納されていると共に、前記各文末の形態にはそれぞれ文種別タグが付与されており、前記各文種別タグは、前記各文末の形態を有する文が少なくとも依頼、使役、断定、質問、疑問、結果、意思、推測、思惟および結論から選択される1以上の意を有することを示すものであり、前記意味タグ付与手段は、前記意味概念辞書に格納されている前記様々な文末の形態と前記解析対象文章中にあらわれる各文の文末とを対比し、前記解析対象文章中の文に前記文種別タグを付与するものであり、前記クライアントコンピュータは、コンピュータが、前記出力手段によって出力された意味タグ付きの前記解析後文章を受信し格納する解析後文章格納手段と、コンピュータが、前記解析後文章中の文に付与された前記文種別タグおよび/又は前記因果関係意味タグに基づき、前記解析後文章中の各文のうち前記文章中で主となる内容を述べている1つ又は複数の文を特定する主要文特定手段と、コンピュータが、前記主要文特定手段で特定された1つ又は複数の文が要部であるとして前記解析対象文章の要約を作成する要約作成手段とを有することを特徴とする自然言語解析システムが提供される。
また、本発明のさらに他の実施形態によれば、前記意味概念辞書には様々な単語の対、句の対、又は節の対が関連付けされていると共に、前記各単語の対、句の対、又は節の対にはそれぞれ論理関係意味タグが付与されており、前記論理関係意味タグは、前記単語の対、句の対、又は節の対が論理的にどのように関係しているかを示すものであり、前記意味タグ付与手段は、前記意味概念辞書に格納されている前記単語の対、句の対、又は節の対関連意味タグを前記解析対象文章中にあらわれる単語の対、句の対、又は節の対と対比し、前記解析対象文章中の単語の対、句の対、又は節の対に前記論理関係意味タグを付与するものであることを特徴とする自然言語解析システムが提供される。
また、本発明のさらに他の実施形態によれば、前記形態素・構文解析処理手段は、前記解析対象文章に代名詞処理およびゼロ代名詞処理をさらに実行する照応解析処理(照応詞から先行詞を特定する)を行うものであることを特徴とする自然言語解析システムが提供される。
このように、意味概念辞書格納部には行動又は評価の内容を有する様々な内容語が格納され、各内容語には1又は複数の因果関係意味タグが付与されており、各因果関係意味タグはそれぞれ、前記各内容語と、前記各内容語と関係のある1つ又は複数の形態素、単語、句又は節とを関連付けるものである。また、内容語選択手段によって解析対象文章中において内容語が選択され、意味タグ特定手段によって、選択された内容語に関連して意味概念辞書格納部に格納されている因果関係意味タグのうち前記解析対象文章中にあらわれる単語、句又は節と関連する因果関係意味タグが特定される。そして、特定された因果関係意味タグが、この因果関係意味タグと関連して前記解析文章中にあらわれる単語、句又は節と関連付けて前記解析後の解析対象文章中における前記選択された内容語に付与され、前記解析後の文章がクライアントコンピュータに出力される。
例えば、「私は参考になる本を本屋で見つけた。本は赤色で安かった。それを早速買った。」という文章が解析対象文章であり、意味概念辞書格納部に「買う」という内容語が格納されており、当該内容語に複数の因果関係意味タグが付与されている場合を考える。ここでは、因果関係意味タグとして、「買う」の理由を示す第1の意味タグが「買う」の理由となる単語「参考になる」と関連付けて付与されており、「買う」の理由を示す第2の意味タグが「買う」の理由となる単語「赤い」と関連付けて付与されており、「買う」の理由となる第3の意味タグが「買う」の理由となる単語「安い」と関連付けて付与されており、「買う」の原因となる第4の意味タグが「買う」の原因となる単語「見つける」と関連付けて付与され、他にも様々な因果関係意味タグが付与されているものとする。
この場合、内容語選択手段によって「買う」が選択されると、意味タグ特定手段によって、「買う」に関連して意味概念辞書格納部に格納されている因果関係意味タグのうち前記解析文章中にあらわれる単語と関連する第1〜第4の意味タグが特定される。また、特定された第1〜3の理由を示す意味タグと第4の原因を示す意味タグが、これらの意味タグと関連して前記解析文章中にあらわれる単語である「参考になる」、「赤色」、「安かった」、「見つけた」と関連付けて解析後の解析対象文章中に付与され、この解析後の文章がクライアントコンピュータに出力される。例えば、「私は参考になる本を本屋で見つけた。本は赤色で安かった。私はその本を早速買った(理由:参考になる、理由:赤色、理由:安かった、原因:見つけた)。」というように、「買った」に複数の因果関係意味タグが付与された状態で出力される。なお、この出力された文章は形態素・構文解析処理が行われたものであり、他の意味タグが付与されていても構わないものである。
これにより、この文章中の第三の文の「私はその本を早速買った。」に複数の因果関係意味タグが付され、これにより第三の文の理由や原因が第一および第二の文にあることが推測できるようになる。このように、3つの文の関係が推測できるようになるので、第三の文が最終的な行動であり、第一および第二の文がその原因や理由を示す文であることを推測することができる。このように、解析対象文章に因果関係意味タグを付与し出力することにより、クライアントコンピュータ側において複数の文から成る文章の文脈を文を跨いで推測できるようになる。
また、本発明のさらに他の主要な観点によれば、クライアントコンピュータから解析対象文章を受信し当該解析対象文章に意味タグを付与する意味タフ付与システムであって、この意味タグ付与システムは、様々な内容語および機能語を格納している意味概念辞書を記憶格納する意味概念辞書格納部であって、前記意味概念辞書に格納されている前記様々な内容語および機能語の一部は行動又は評価の内容を有する内容語であり、前記行動又は評価の内容を有する各内容語には1つ又は複数の因果関係意味タグが付与されており、前記1つ又は複数の因果関係意味タグはそれぞれ、前記行動又は評価の内容を有する各内容語と、前記行動又は評価の内容を有する各内容語と因果関係のある1つ又は複数の単語、句又は節とを関連付けるものである、前記意味概念辞書格納部を有し、この意味タグ付与システムは、コンピュータが、前記解析対象文章中において行動又は評価の内容を有する内容語を少なくとも1つ選択する内容語選択手段と、コンピュータが、前記意味概念辞書格納部に格納された前記意味概念辞書から、前記内容語選択手段により選択された内容語又は当該内容語の同義語、類義語、対義語、上位概念語若しくは下位概念語である内容語に付与された前記1つ又は複数の因果関係意味タグを読み出し、読み出した因果関係意味タグのうち前記解析対象文章中にあらわれる単語、句又は節と関連する因果関係意味タグを少なくとも1つ特定する意味タグ特定手段と、コンピュータが、前記意味タグ特定手段で特定された因果関係意味タグのうち少なくとも1つを、前記意味タグ特定手段で関連すると特定された前記単語、句又は節と関連付けて前記解析対象文章中にあらわれる前記選択された内容語に付与する意味タグ付与手段とを有することを特徴とする意味タグ付与システムが提供される。
また、本発明の他の実施形態によれば、前記意味概念辞書に格納されている前記様々な内容語および機能語の一部は様々な名詞であると共に、前記名詞と機能語との様々な組合せが前記意味概念辞書に格納されており、前記各組合せには1つ又は複数の意味タグが付与されており、前記各意味タグはそれぞれ、前記各組合せと、前記各組合せと主語述語関係又は修飾関係のある単語、句又は節とを関連付けるものであり、前記内容語選択手段は、前記解析対象文章中において名詞と機能語との組合せを少なくとも1つ選択するものであり、前記意味タグ特定手段は、前記意味概念辞書格納部に格納された前記意味概念辞書から、前記内容語選択手段により選択された名詞と機能語との組合せ又は前記選択された名詞の同義語、類義語、対義語、上位概念語若しくは下位概念語と機能語との組合せに付与された前記1つ又は複数の意味タグを読み出し、読み出した意味タグのうち前記解析対象文章中にあらわれる単語、句又は節と関連する意味タグを少なくとも1つ特定するものであり、前記意味タグ付与手段は、前記意味タグ特定手段で特定された意味タグのうち少なくとも1つを、この意味タグと関連して前記解析対象文章中にあらわれる単語、句又は節と関連付けて前記解析対象文章中の前記選択された名詞と機能語との組合せに付与するものであることを特徴とする意味タグ付与システムが提供される。
また、本発明のさらに他の実施形態によれば、前記因果関係意味タグは、前記行動又は評価の内容を有する様々な内容語と、当該各内容語の行動又は評価の理由又は原因となる1つ又は複数の単語、句又は節とを関連付けるものであることを特徴とする自然言語解析システムが提供される。
また、本発明のさらに他の実施形態によれば、前記意味概念辞書には、様々な文末の形態が格納されていると共に、前記各文末の形態にはそれぞれ文種別タグが付与されており、前記各文種別タグは、前記各文末の形態を有する文が少なくとも依頼、使役、断定、質問、疑問、結果、意思、推測、思惟および結論から選択される1以上の意を有することを示すものであり、前記意味タグ付与手段は、前記意味概念辞書に格納されている前記様々な文末の形態と前記解析対象文章中にあらわれる各文の文末とを対比し、前記解析対象文章中の文に前記文種別タグを付与するものであることを特徴とする意味タグ付与システムが提供される。
また、本発明の実施形態によれば、前記意味概念辞書には様々な単語の対、句の対、又は節の対が関連付けされていると共に、前記各単語の対、句の対、又は節の対にはそれぞれ論理関係意味タグが付与されており、前記論理関係意味タグは、前記単語の対、句の対、又は節の対が論理的にどのように関係しているかを示すものであり、前記意味タグ付与手段は、前記意味概念辞書に格納されている前記単語の対、句の対、又は節の対を前記解析対象文章中にあらわれる単語の対、句の対、又は節の対と対比し、前記解析対象文章中の単語の対、句の対、又は節の対に前記論理関係意味タグを付与するものであることを特徴とする意味タグ付与システムが提供される。
本発明によれば、解析対象文章に因果関係意味タグを付与し出力することにより、クライアントコンピュータ側において複数の文から成る文章の文脈を文を跨いで推測できるようになるので、解析対象文章の分野、文章の構成、文章自体の構成等に拘わらず、解析対象文章の意味・内容の解釈の精度を向上することができるようになる。
なお、この発明の更なる他の特徴と顕著な効果は次の発明を実施するための最良の形態の項に記載された実施形態及び図面を参照することによって当業者に理解される。
以下、本発明の実施形態を図面に基づき説明する。
図1は本発明の一実施形態に係る自然言語解析システムの概略構成を示す図である。この自然言語解析システムは一例としてシステムの一部がテキストマイニングサービスを提供する企業が有するものであり、上記企業内に配置された自然言語解析サーバ100と、上記企業の外部に配置されたクライアントコンピュータ500とを有する。また、自然言語解析サーバ100は、形態素・構文解析部200と、意味タグ付与システム300とを有し、意味タグ付与システム300は意味概念辞書サーバ400を有する。
形態素・構文解析部200は、CPU、RAM、記憶装置、入力装置等のコンピュータとしての通常の構成を備える。また、自然言語解析サーバ100は、意味タグ付与システム300、意味概念辞書サーバ400、クライアントコンピュータ500等と通信を行うためのものであって、コネクタやプロトコルスタックを有する通信部210と、後述するようにクライアントコンピュータから受信する解析対象文章を格納する解析対象文章格納部220とを有する。また、形態素・構文解析部200はそのプログラム格納部に、コンピュータにそれぞれ所定の動作を行わせる分かち書き処理部231と、品詞付け処理部232と、文節統合処理部233と、係り受け解析処理部234と、代名詞処理部235と、格納処理部236とを有する。これらの機能については形態素・構文解析部200、意味タグ付与システム300およびクライアントコンピュータ500が行う処理の例(図2および5参照)に沿って以下に説明する。
意味タグ付与システム300は、CPU、RAM、記憶装置、入力装置等のコンピュータとしての通常の構成を備える。また、意味タグ付与システム300は、形態素・構文解析部200、意味概念辞書サーバ400、クライアントコンピュータ500等と通信を行うためのものであって、コネクタやプロトコルスタックを有する通信部310と、後述するように形態素・構文解析部200から受信する解析後文章を格納する解析後文章格納部320と、意味タグ付与ルール格納部330とを有する。また、意味タグ付与システム300はそのプログラム格納部に、コンピュータにそれぞれ所定の動作を行わせる内容語選択処理部341と、意味タグ選択処理部342と、意味タグ付与処理部343と、格納処理部344とを有する。これらの機能については形態素・構文解析部200、意味タグ付与システム300およびクライアントコンピュータ500が行う処理の例(図2および5参照)に沿って以下に説明する。
意味概念辞書サーバ400は、CPU、RAM等のコンピュータとしての通常の機能を備える。また、意味概念辞書サーバ400は、形態素・構文解析部200、意味タグ付与システム300、クライアントコンピュータ500等と通信を行うためのものであって、コネクタやプロトコルスタックを有する通信部410と、後述のように、後述する意味タグが付与された様々な語が格納されている意味概念辞書420が記憶格納された意味概念辞書格納部420とを有する。
クライアントコンピュータ500は、例えば、要約サービスをウェッブ上で提供する企業に設置されている。この場合、クライアントコンピュータ500は、ユーザのコンピュータからインターネットを介して要約対象文章を受け付けた後、当該要約対象文章を要約し、要約した文章をインターネット経由でユーザのコンピュータに提供する。この例に限らず、クライアントコンピュータ500は、テキストマイニングを行いその結果を他のコンピュータに提供するものであっても構わないし、その他の用途に用いるコンピュータでも構わない。本実施形態のクライアントコンピュータ500は、形態素・構文解析部200、意味タグ付与システム300、意味概念辞書サーバ400等と通信を行うためのものであって、コネクタやプロトコルスタックを有する通信部510と、ユーザから受信した要約対象文章を解析対象文章として格納する解析対象文章格納部520と、自然言語解析サーバ100から受信した解析後文章を格納する解析後文章格納部530とを有する。また、クライアントコンピュータ500はそのプログラム格納部に、コンピュータにそれぞれ所定の動作を行わせる解析対象文章送信処理部541と、解析後文章受信処理部542と、要約処理部543とを有する。これらの機能については形態素・構文解析部200、意味タグ付与システム300およびクライアントコンピュータ500が行う処理の例(図2および5参照)に沿って以下に説明する。
先ず、意味概念辞書格納部420の意味概念辞書421に様々な語を意味タグ付きで格納する方法の一例について、図2のフローチャートを参照しながら説明する。なお、以下説明する方法はあくまで一例であり、様々な方法で意味タグ概念辞書421に様々な語を意味タグ付きで格納することが可能である。
また、この例では、自然言語解析サーバ100は外部から様々な文章データが継続して入力されるようになっている(図1参照)。例えば、新聞、雑誌、ウェッブサイト、書籍、論文等の文字データや、音声データが音声認識装置によって変換された文字データや、文字データと画像データが混在するデータや、画像データ付きの音声データが音声認識装置によって変換された画像データ付きの文字データ等が、継続して自然言語解析サーバ100に入力される。ここでは、説明の便宜上、「彼は英語の参考書を安かったので買った。」、「多くの人はその厚い本を参考になるので買う。」、「私は昨日この本を本屋で買ったが、それはこれが私の好きな赤色だったからだ。」、「彼はお目当ての本を見つけたので躊躇せず早速買った。」の文字データが入力される場合について説明する。
上記の文字データを自然言語解析サーバ100が受け付けると、形態素・構文解析部200の分かち書き処理部231が入力された文章を形態素に分割する分かち書き処理を行い(ステップS1)、品詞付け処理部232が各形態素に品詞を付与する品詞付け処理を行う(ステップS2)。続いて、形態素・構文解析部200の文節統合処理部233が、品詞付けがされた各形態素を必要に応じて統合して文節を生成する文節統合処理を行い(ステップS3)、係り受け解析処理部234が、前記文節統合処理部233によって文節統合された各文において、文中の各文節がどの文節を修飾するかを解析する係り受け解析処理を行う(ステップS4)。また、形態素・構文解析部200の代名詞処理部235が、前記ステップS1〜S4の後に、代名詞を具体的な名詞に置き換える代名詞処理および/又は主語が無い文に主語を補うゼロ代名詞処理を行う(ステップS5)。例えば、「私は昨日この本を買ったが、それはこれが私の好きな赤色だったからだ。」の文における「これ」は「その本」を指すので、「私は昨日この本を買ったが、それはこの本が私の好きな赤色だったからだ。」のように具体的な名詞に置き換える。ここで、ステップS1〜S5の分かち書きによる形態素への分割、各形態素への品詞付け、必要に応じた文節の生成、係り受け解析処理、代名詞処理およびゼロ代名詞処理は、公知の様々な手法を用いて行うことができるが、意味概念辞書格納部320に既に格納されている単語(内容語、機能語)を参照しながら、前記公知の手法を用いて前記ステップS1〜S5の処理を行うこともできるし、意味概念辞書格納部320に既に格納されている単語と各単語に付与された分かち書き、品詞、文節生成に関する情報、係り受け解析のための情報、並びに代名詞処理およびゼロ代名詞処理のための情報に基づいて、前記ステップS1〜S5の処理を行うことも可能である。
そして、自然言語解析サーバ100の格納処理部236が、上記ステップS1〜S5により解析された各文の単語や、単語の組合せ(内容語と内容語の組合せ、内容語と機能語との組合せ)を、上記解析結果と共に意味概念辞書421に格納する(ステップS6)。勿論、意味概念辞書421に既に格納されている単語やその組合せは格納されない。格納する場合は、例えば、「彼は英語の…。」の文の「彼」、「英語」、「参考書」は名詞として、「安かった」又は「安い」は形容詞として、「買った」又は「買う」は動詞として意味概念辞書421に格納される。ここで、意味概念辞書421に「安かった」と「安い」や、「買った」と「買う」をそれぞれ格納することも可能であるが、本実施形態では当該文にあらわれる「安かった」と「買った」を基本活用形である「安い」と「買う」として意味概念辞書421に格納する。
続いて、意味タグ付与システム300が、自然言語解析サーバ100の格納処理部236によって意味概念辞書421に格納された単語や前記組合せに、意味タグを付与する。意味タグを付与する具体的な方法は様々あるが、以下ではその一例を示す。
先ず、形態素・構文解析部200から意味タグ付与システム300に、上記ステップS1〜S5により解析された各文の単語や単語の組合せ(内容語と内容語の組合せ、内容語と機能語との組合せ)が、上記解析結果と共に送信され(ステップS7)、意味タグ付与システム300は意味タグ付与処理部343により、受け取った単語やその組合せにそれぞれ意味タグを付与する(ステップS8)。この意味タグの付与は、意味タグ付与ルール格納部330に格納されている意味タグ付与ルール331に基づいて行われる。なお、意味概念辞書421に既に格納されている単語やその組合せと、それらに付与されている意味タグを、前記意味タグ付与の際に参照することも可能である。意味タグ付与ルールの一例を図3に示す。意味タグ付与ルールによって付される意味タグには、文中の内容語の前後にあらわれる機能語を参照するだけで付されるものと、前後にあわれる機能語の他に当該文中に表れる他の単語、句、節等との関係も参照して付されるものがある。意味タグ付与の一例として、前記文「彼は英語の参考書を安かったので買った。」について図3の意味タグ付与ルールを適用すると、名詞(内容語)である「彼」又は内容語と機能語との組合せの「彼+は」には動詞(内容語)「買う」との係り受け関係で「agt」(行為者)の意味タグが付与され、名詞である「参考書」又は名詞と機能語との組合せの「参考書+を」には「買う」との係り受け関係で「obj」(目的語)の意味タグが付与され、動詞(内容語)である「買う」には形容詞(内容語)である「安い」との係り受け関係で「rea」の意味タグ(因果関係意味タグの中の理由の意味タグ)が付与される。ここで、「rea」の意味タグは「買う」と「安い」を関連付けるものである。「彼」の「agt」は後の機能語と、当該文中に表れる動詞「買う」との関係(主述関係)で付され、「参考書」の「obj」は機能語の「を」との関係だけでも付すことができるが、本実施形態では当該文中にあらわれる動詞「買う」との関係(目的物)も考慮される。例えば、「買う」の「rea」の意味タグは「買う」の直前の機能語の「ので」という「理由」を示す機能語(意味概念辞書421格納)と、当該文中にあらわれる「安かった」との係り受け関係で付される。なお、理由の意味タグが「買う」と「安い」を関連付けるように「安い」に付与される場合であっても、「買う」に付与される場合と同様の機能を有するので、本明細書では、当該理由の意味タグが「買う」と「安い」を関連付けるように「買う」に付されているものと見なす。
また、「彼はお目当ての本を見つけたので躊躇せず買った。」の文では、「買う」は「見つける」の直後の機能語の「ので」との係り受け関係で「cau」の意味タグ(因果関係意味タグの中の原因の意味タグ)が付与される。ここで、「cau」の意味タグが「買う」と「見つける」を関連付けるように「見つける」に付与される場合であっても、「買う」に付与される場合と同様の機能を有するので、本明細書では、当該原因の意味タグが「買う」と「安い」を関連付けるように「買う」に付されているものと見なされる。
上記理由の意味タグ(rea)の付与は様々な方法で行うことが可能であるが、他の例として、「面白い本を入手する。」、「紹介された本を入手する。」、「勧められた本を入手する。」の文について理由の意味タグ(rea)を付与する場合、各文の主語述語の係り受け関係「本を、入手する」について、述語である「入手する」の係り側になっている「本を」に係っている語彙、すなわち「面白い」、「勧められた」、「紹介された」に理由の意味タグ(rea)を付与することもできる。このように、係り受け関係と品詞分類に基づき理由の意味タグ(rea)を付与することが可能であり、そして、前記述語の上位概念語、下位概念語、同義語、類義語、若しくは対義語にも理由の意味タグ(rea)を付与することが可能である。なお、以下のステップS19でも同様の方法で理由の意味タグを付与することが可能である。
一方、「私は昨日この本を本屋で買ったが、…」の文における「本屋」については、「買う」との関係で「loc」(空間的位置)の意味タグが付与され、「彼はお目当ての本を見つけたので躊躇せず早速買った。」の文における「躊躇せず」や「早速」については、「買う」との関係で「tim」(時間的位置)の意味タグが付与される。
続いて、意味タグ付与システム300の格納処理部344が、上記のように付与された各意味タグを、意味概念辞書421に格納する(ステップS9)。ここで、意味概念辞書421内では、類義語、同義語、対義語、上位概念語、および下位概念語が互いに関連付けられ、シソーラスが形成されている。シソーラスの形成は特開2001−331515号公報に記載のある方法、特開2009−181408号公報に記載のある方法、その他の公知の方法を用いることができる。このようにシソーラスが形成されているので、ステップS9において、前記意味タグは、適宜類義語、同義語、対義語、上位概念語および下位概念語にも適宜付与され格納される。意味概念辞書421に格納された意味タグは例えば図4のようになり、「彼+は」とその上位概念語である「人間」に「agt」の意味タグが付与され、「買う」とその上位概念語である「入手する」に「rea」の意味タグが付与される。なお、本実施形態では、動詞「買う」に付与される意味タグが多いので、「買う」を目的語(本、宝石)に応じて分割し、分割したそれぞれの動詞「買う」に理由の意味タグを付与する構成としている。また、図4では「彼」に「agt」のみが付されているが、「彼」に「agt」以外の「rea」やその他の意味タグが付与される場合もある。
上記ステップS1〜S9が様々な且つ膨大な文章データに対して行われることにより、意味概念辞書421に膨大な量の単語や単語の組合せ(内容語と内容語の組合せ、内容語と機能語との組合せ)が格納されると共に、格納された単語やその組合せに意味タグ付与ルール331に基づいて意味タグが付与される。
続いて、クライアントコンピュータ500から自然言語解析サーバ100に解析対象文章が送信され、その解析対象文章が自然言語解析サーバ100によって解析される場合について、図5のフローチャートを参照しながら説明する。
先ず、クライアントコンピュータ500の解析対象文章送信処理部541が解析対象文章を自然言語解析サーバ100に送信し(ステップ11)、自然言語解析サーバ100の形態素・構文解析部200が受信した解析対象文章を解析対象文章格納部220に格納する(ステップ12)。ここでは、説明の便宜上、「私は参考になる本を本屋で見つけた。本は赤色で安かった。それを早速買った。」が解析対象文章である場合について説明する。
上記ステップS12の後、上記ステップS1〜S4の場合と同様に、形態素・構文解析部200の分かち書き処理部231が入力された文章を形態素に分割する分かち書き処理を行い(ステップS13)、品詞付け処理部232が各形態素に品詞を付与する品詞付け処理を行う(ステップS14)。続いて、形態素・構文解析部200の文節統合処理部233が、品詞付けがされた各形態素を必要に応じて統合して文節を生成する文節統合処理を行い(ステップS15)、係り受け解析処理部234が、前記文節統合処理部233によって文節統合された各文において、文中の各文節がどの文節を修飾するかを解析する係り受け解析処理を行う(ステップS16)。そして、自然言語解析サーバ100の形態素・構文解析部200が上記ステップS13〜S16による解析後の文章又はその単語を、上記解析結果と共に意味タグ付与システム300に送信し(ステップS17)、意味タグ付与システム300は受信したものを解析後文章格納部320に格納する(ステップS18)。
続いて、意味タグ付与システム300が、解析後文章格納部320に格納された単語や、単語の組合せ(内容語と内容語の組合せ、内容語と機能語の組合せ)に、意味タグを付与する(ステップS19)。意味タグを付与する具体的な方法は様々あるが、以下ではその一例を示す。
本実施形態では、意味概念辞書421に既に格納されている単語(内容語、機能語)と、単語の組合せ(内容語と内容語の組合せ、内容語と機能語との組合せ)と、それらに付与されている意味タグと、必要に応じて意味タグ付与ルール格納部330に格納されている意味タグ付与ルール331とに基づいて、解析後文章格納部320に格納された解析後文章の単語又はその組合せにそれぞれ意味タグを付与する。上記文の単語又はその組合せに意味タグを付与した例を図6に示す。上記ステップS8と同様に、行為者の意味タグ(agt)や目的語の意味タグ(obj)が付与されると共に、理由、原因等の因果関係を示す意味タグ(rea,cau,pur,cnd,sbj,cnc,contrst,rst)が付与される。特に、上記解析対象文章には「買った」の動詞が含まれているが、この「買った」は意味概念辞書421に格納されている動詞「買う」に対応しており、この動詞には複数の理由および原因の意味タグと、各理由および原因の意味タグによってそれぞれ動詞「買う」と関連付けられた単語、句又は節が格納されている。この理由や原因を示す因果関係意味タグを付与する際は、先ず、上記解析対象文章中において内容語(動詞、形容詞、名詞等)が選択される。なお、上記解析対象文章中の全ての内容語が選択されても構わないし、一部であっても構わない。ここで、選択される内容語は行動や評価の内容を有するものであることが好ましい。続いて、意味概念辞書421を参照し、選択された内容語又は選択された内容語の同義語、類義語、対義語、上位概念語若しくは下位概念語である内容語に付与された因果関係意味タグのうち、前記解析対象文章中にあらわれる単語、句又は節と関連する因果関係意味タグを特定する。そして、特定された因果関係意味タグを、前記関連すると特定された解析文章中の単語、句又は節と関連付けて前記解析後の文章中における前記選択された内容語に付与する。これにより、上記解析対象文章の例では、図6に示すように、「買った」の動詞に3つの理由の因果関係意味タグが付与され、1つの原因の因果関係意味タグが付与される。
続いて、意味タグが付与された解析後の解析対象文章が形態素。構文解析部200に送信され、形態素・構文解析部200の代名詞処理部235が、代名詞を具体的な名詞に置き換える代名詞処理又は名詞が無い文に名詞を補うゼロ代名詞処理を行う(ステップS20)。このステップは前記ステップS16の後に行っても良い。
そして、図6のように意味タグが付与された解析後文章が形態素・構文解析部200からクライアントコンピュータ500に送信される(ステップS22)。
ステップS22で送信された解析後文章を受信したクライアントコンピュータ500では、解析後文章受信処理部542によって解析後文章を解析後文章格納部530に格納する(ステップS22)。そして、クライアントコンピュータ500が有する要約プログラムによって、解析対象文章の要約を行う(ステップS23)。
この要約を行う際に、解析対象文章の解析後文章には図6のように意味タグが付与されているので、意味タグを利用して要約を行うことができる。例えば、理由や原因を示す因果関係意味タグを活用することにより、文脈を推測しながら要約を行うことが可能となる。具体的には、「私は参考になる本を本屋で見つけた。本は赤色で安かった。私はその本を早速買った(理由:参考になる、理由:赤色、理由:安かった、原因:見つけた)。」のように、この文章中の第三の文の「私はその本を早速買った。」に複数の因果関係意味タグが付され、これにより第三の文の理由や原因が第一および第二の文にあることが推測できるようになっている。即ち、3つの文の関係が推測できるようになるので、第三の文が最終的な行動であり、第一および第二の文がその原因や理由を示す文であることを推測することができる。
このように、本実施形態によれば、解析対象文章に因果関係意味タグを付与し出力することにより、クライアントコンピュータ側で複数の文から成る文章の文脈を文を跨いで推測できるようになる。このため、上記解析対象文章は複数の単文で構成され、互いの文章の関係は接続語等によって明確に示されていないが、最後の文に記載された最終的な行動の理由が第一及び第二の文に記載されていることを把握しながら要約を行うことができる。即ち、解析対象文章に因果関係意味タグを付与し出力することにより、解析対象文章の分野、文章の構成、文章自体の構成等に拘わらず、解析対象文章の意味・内容の解釈の精度を向上することができるようになる。なお、要約に限らず、翻訳ソフト、検索エンジン、テキストマイニングエンジン、Q&A形式の対話ソフト等の自然言語解析を行う製品・サービスに上記技術を適用した場合でも、上記と同様の作用効果が得られる。
また、上記の解析対象文章は比較的短く、最終的な行動の理由や原因が比較的近い文に記載されているが、解析対象文章が長く、行動や評価の理由や原因が比較的遠い文に記載されている場合でも、上記の因果関係意味タグの付与・活用によって、解析対象文章の意味・内容の解釈の精度を向上することが可能となる。
また、因果関係意味タグとしては「rea」、「cau」の他に、上記のように「pur」(目的)、「cnd」(条件)、「sbj」(仮定)、「cnc」(逆説)、「contrst」(対象)、「rst」(結果)等を付与することもある。これらの因果関係意味タグも、行動や評価の内容語と、その理由や原因となる単語、句又は節とを関連付けるものである。また、「pur」(目的)、「cnd」(条件)、「sbj」(仮定)、「cnc」(逆説)、「contrst」(対象)、「rst」(結果)等の因果関係意味タグも意味概念辞書421に蓄積することができるものである。よって、これらの意味タグを付与し活用する場合でも、上述と同様の作用効果を奏する。
また、上記解析後文章では、図6に示すように、単語(名詞)である「私」と機能語の「は」との組合せ(「私」だけでも良い)に行為者(who)を示す意味タグが付与され、「本」と「を」との組合せ(「本」だけでも良い)に目的語(what)を示す意味タグが付与される。このように、解析対象文章を構成する単語又は単語と機能語との組合せに行為者や目的語を示す意味タグが付与されるので、行為者や目的語の意味タグが付与された単語又は単語と機能語との組合せを参照することにより、行為者や目的語を把握しながら解析対象文章の要約等を行うことができる。
また、上記解析後文章では、図6に示すように、単語(名詞)である「本屋」と機能語の「で」の組合せ(「本屋」だけでも良い)に空間的位置(場所;where)を示す「loc」の意味タグが付与され、「早速」に時間的位置(時間;when)を示す「tim」の意味タグが付与される。このように、解析対象文章を構成する単語又は単語と機能語との組合せに場所や時間の意味タグが付与されるので、場所や時間の意味タグが付与された単語又は単語と機能語との組合せを参照することにより、場所や時間を把握しながら解析対象文章の要約等を行うことができる。
また、上記解析対象文章にはあらわれなかったが、例えば意味概念辞書421に単語(名詞)である「車」と機能語の「で」との組合せ(「車」だけでも良い)について手段・道具(how)をあらわす意味タグの「mns」が付与されており、解析後文章中に登場する「車」又は「車」と「で」との組合せに「mns」が付与される場合は、手段・道具を把握しながら解析対象文章の要約などを行うことができる。
同様に、例えば意味概念辞書421に単語(名詞)である「夫」と、人名である「道夫」(名詞)にそれぞれ互いに対し等価であること(同一の意味であること)をあらわす「eq」が付与されており、解析後文章中に登場する「道夫」に「夫」に対して「eq」が付与される場合は、「夫」と「道夫」の両者が同一の意味で使用されていることを把握しながら解析対象文章の要約などを行うことができる。
同様に、例えば機能語である「と」等で接続された「地名(大阪等)」と「地名(東京等)」にそれぞれ互いに対する連語であることをあらわす「and」が付与されており、解析後文章中に登場する「大阪」に「東京」に対して「and」が付与されている場合は、「大阪」と「東京」が連語であることを把握しながら解析対象文章の要約などを行うことができる。
同様に、例えば機能語である「か」等で接続された「地名(大阪等)」と「地名(東京等)」にそれぞれ互いに対する選語であることをあらわす「or」が付与されており、解析後文章中に登場する「大阪」に「東京」に対して「or」が付与されている場合は、「大阪」と「東京」が選語であることを把握しながら解析対象文章の要約などを行うことができる。
同様に、例えば機能語である「か」等で接続された互いに反対の意を表す単語である「服従」と「反乱」にそれぞれ互いに対して排他的選語であることをあらわす「exclusive or」が付与されており、解析後文章中に登場する「服従」に「反乱」に対して「exclusive or」が付与されている場合は、「服従」と「反乱」が排他的選語であることを把握しながら解析対象文章の要約などを行うことができる。
これらの「eq」、「and」、「or」、「exclusive or」等の意味タグは、図3に示すように、論理的関係を示す意味タグであり、対になる形態素同士、単語同士、句同士、又は節同士の論理的な関係を示すものである。このため、対になる単語同士、句同士、又は節同士の論理的な関係を把握しながら解析対象文章の要約などを行うことができる。
尚、前記実施形態では、クライアントコンピュータ500が自然言語解析サーバ100に「私は参考になる本を本屋で見つけた。本は赤色で安かった。それを早速買った。」を解析対象文章として送信する場合について説明したが、もう少し長い文章が解析対象文章であり、その解析対象文章に上記の解析および意味タグ付与が行われる場合についても説明する。下記の解析後の解析対象文章は英語専門塾阿佐ヶ谷英語塾の英文要約(要旨要約)問題の英文要約問題1の解法から言葉を抽出して記載したものである。また、下記文章は、上記と同様の方法で解析対象文章に意味タグが付与されたものであるが、ここでは、説明の便宜上、理由のおよび原因の因果関係意味タグと、各文の文末に文の種別を示すために付される文種別タグのみが付与されている。文種別タグは、文末の形態に応じた意味タグである。そして、文種別タグは、文が依頼、使役、断定、質問、疑問、結果、意思、推測、思惟および結論から選択される1つ以上の意を有することを示すものである。例えば、文末が「…動詞+もらった。(答えてもらった。)」の時は、「依頼」や「使役」の意を有する文種別タグが付与され、文末が「…形容詞+だった。」又は「名詞(代名詞)+だった。」の時は、「断定」や「結果」の意を有する文種別タグが付与され、文末が「…動詞+か。」の時は、「質問」や「疑問」の意を有する文種別タグが付与され、文末が「…動詞+とした。(知ろうとした。)」の時は、「意思」の意を有する文種別タグが付与され、「…主張の意を有する動詞+した。(主張した。)」の時は、「意思」の意を有する文種別タグが付与され、「…動詞+のだろうか。」の時は、「推測」や「思惟」の意を有する文種別タグが付与され、「…形容詞+からであろう。」の時は、「推測」の意を有する文種別タグが付与され、「…形容詞+からであろうか。」の時は、「疑問」の意を有する文種別タグが付与され、「…形容詞+である。」や「…名詞+である。」の時は、「断定」や「結論」の意を有する文種別タグが付与される。このような文種別タグと、その意味タグに対応する文末形態が、ステップS1〜S9のステップによって意味概念辞書421に蓄積されることにより、上記のような解析対象文章中の各文末に対応する文種別タグを付与できるようになる。
また、意味概念辞書421では、単語(動詞)である「答えてもらった」には「知ろうとして」という形容詞や、その類義語や上位概念語に関連付けて「rea」の意味タグが付与され、「答えてもらった」には「暇つぶしに」という副詞や、その類義語や上位概念語に関連付けて「cau」の意味タグが付与されており、これら意味概念辞書421に格納された内容に基づき、以下の文章中には理由および原因の因果関係意味タグが付与されている。以下において[ ]内の記載が意味タグおよび文種別タグである。
(第一文)私は、…暇つぶしに、乗り合わせた乗客に…質問をして[rea暇つぶしにrea知ろうとして]答えてもらった[rea知ろうとしてcau質問をして][依頼、使役の文種別タグ]。
(第二文)…質問はこうだった[断定の文種別タグ]。
(第三文)「象とセカンドのどちらが大きいと思いますか」[質問、疑問の文種別タグ]。
(第四文)セカンドというのは…知ろうとした[意思の文種別タグ]。
(第五文)乗客の…物理学者だった[断定、結果の文種別タグ]。
(第六文)1秒というのは…それ(光が伝わる距離)は象よりはるかに大きい、と彼(乗客の一人の物理学者)は主張した[cau質問をして][意思の文種別タグ]。
(第七文)しかし、…他の乗客は象のほうが大きいと主張した[cau質問をして]」[意思の文種別タグ]。
(第八文)もっとも、…違っていたが[断定の文種別タグ]。
(第九文)なぜたいていの人は、象(1頭)のほうが1秒よりも大きい…思うのだろうか[推測、思惟の文種別タグ]。
(第十文)おそらく、…象が…たいていの動物よりも大きいと考え…、秒のほうは…たいていの時間…よりも小さいからであろう[推測、疑問の文種別タグ]。
(第十一文)実は…象は動物としては大きく、秒は時間としては小さい…ということである[断定、結論の文種別タグ]。
(第十二文)つまり、…私たちは…種類の異なるものを、同種のもの…と関連付けて比較しているのである[断定、結論の文種別タグ]。
(第二文)…質問はこうだった[断定の文種別タグ]。
(第三文)「象とセカンドのどちらが大きいと思いますか」[質問、疑問の文種別タグ]。
(第四文)セカンドというのは…知ろうとした[意思の文種別タグ]。
(第五文)乗客の…物理学者だった[断定、結果の文種別タグ]。
(第六文)1秒というのは…それ(光が伝わる距離)は象よりはるかに大きい、と彼(乗客の一人の物理学者)は主張した[cau質問をして][意思の文種別タグ]。
(第七文)しかし、…他の乗客は象のほうが大きいと主張した[cau質問をして]」[意思の文種別タグ]。
(第八文)もっとも、…違っていたが[断定の文種別タグ]。
(第九文)なぜたいていの人は、象(1頭)のほうが1秒よりも大きい…思うのだろうか[推測、思惟の文種別タグ]。
(第十文)おそらく、…象が…たいていの動物よりも大きいと考え…、秒のほうは…たいていの時間…よりも小さいからであろう[推測、疑問の文種別タグ]。
(第十一文)実は…象は動物としては大きく、秒は時間としては小さい…ということである[断定、結論の文種別タグ]。
(第十二文)つまり、…私たちは…種類の異なるものを、同種のもの…と関連付けて比較しているのである[断定、結論の文種別タグ]。
上記のように解析後文章に意味タグや文種別タグが付与されているので、意味タグや文種別タグを利用して要約を行うことができる。例えば、文種別タグを利用して、上記解析後の文章で主題を抽出することができる。第一文から第十二文において、結論結果などあらわす文は第五、第十一、及び第十二文である。結論結果の文に主題があらわれている可能性が高いので、これらの文から主題の推測が可能になる。また、第一文と第三文が依頼、使役、質問、疑問を示すことがわかる。したがって、第一文や第三文に主題に対する依頼や質問があることも推測され、その主題についての結論が第五、第十一又は第十二文であらわされていいるとの推定が可能になる。また、内容に基づいて解析すると、第十一文は第三文に対応している内容を有しており、第十二文は第九文に対応している内容を有していることがわかる。さらに、理由、原因の意味タグを見ると、第六文と第七文は第1文に対応していることがわかる。これらの内容を踏まえると、第十二文又は第十一文に本文章の主題があらわれており、第十二文を中心として文脈に沿った要約をすることも可能であり、第十一文の主題を中心として文脈に沿った要約をすることも可能である。さらに、第十一文および第十二文を中心として文脈に沿った要約をすることも可能である。
さらに、他の解析対象文章(下記)に上記の解析および意味タグ付与が行われる場合についても説明する。下記の解析後の解析対象文章は英語専門塾阿佐ヶ谷英語塾の英文要約(要旨要約)問題の英文要約問題2の解法から言葉を抽出して記載したものである。また、下記文章は、上記と同様な方法で意味タグが付与されたものであるが、ここでは、説明の便宜上、理由および原因の因果関係意味タグと、対になる語が対比されている事を示す対比の意味タグ「cont」と、各文の文末に文の種別を示すために付される文種別タグについて説明する。文種別タグは上記の通りである。
また、前記意味概念辞書421では、「(素人の画家にとって)興味ぶかい」という形容詞や、その類義語や上位概念語に「rea」の意味タグが付与され、前記形容詞、類義語又は上位概念語とその理由となる「以外にすることがほとんどない」、「すでに出来上がっている」、「再構成する必要がない」等が前記「rea」の意味タグによって関連付けられており、「(本職の画家が)敬遠する」という動詞や、その類義語や上位概念語に「rea」の意味タグが付与され、前記動詞、類義語又は上位概念語とその理由となる、「技量を試す」、「画家としての技量」、「見いだす」、「創造する」、「芸術を作る」等が前記「rea」の意味タグによって関連付けられている。そして、解析対象文章中で行動や評価をあらわす動詞や形容詞が複数選択され、選択された語に対応する理由および原因の意味タグや、選択された語の同義語、類義語、対義語、上位概念語又は下位概念語に付与された理由および原因の意味タグが意味概念辞書から読み出され、読み出された理由および原因の意味タグのうち解析対象文章中にあらわれる単語、句又は節と関連する因果関係意味タグが特定され、特定された理由の意味タグが、関連すると特定された前記単語、句又は節と関連付けて解析対象文章中の前記選択された内容語に付与されると、以下のようになる。また、以下の解析対象文章には、各文の文末に文の種別を示すために付される文種別タグが付与されている。
(第一文)素人画家[cont:本職の画家]にとって…最も興味ぶかい[rea:以外にすることがほとんどない、rea:再構成する必要がない、rea:すでに〜出来上がっている]風景が、…本職の画家[cont:素人画家]が…敬遠する[rea:以外にすることがほとんどない、rea:再構成する必要がない、rea:既に〜出来上がっている、rea:技量を試す、rea:画家としての技量、rea:見いだす、rea:創造する、rea:芸術を作る]風景である…ある[断定の文種別タグ]。
(第二文)…偉大な風景画家[cont:素人画家]で、もともと…美しい題材を好んで描いた者はほとんどいない[rea:以外にすることがほとんどない、rea:再構成する必要がない、rea:既に〜出来上がっている、rea:技量を試す、rea:画家としての技量、rea:見いだす、rea:創造する、rea:芸術を作る][断定の文種別タグ]。
(第三文)もともと美しい…風景は、画家にとって…忠実な模写以外にすることがほとんどないのである[断定の文種別タグ]。
(第四文)これは素人画家[cont:本職の画家]にとっては…結構なことである[rea:以外にすることがほとんどない、rea:再構成する必要がない、rea:すでに〜出来上がっている][断定の文種別タグ]。
(第五文)というのも、…再構成する必要がないことを意味するからだ[断定の文種別タグ]。
(第六文)描き手にとって、…構図が出来上がっているのである[断定]。
(第七文)しかし、本職の画家は…望まない[rea:以外にすることがほとんどない、rea:再構成する必要がない、rea:既に〜出来上がっている、rea:技量を試す、rea:画家としての技量][断定の文種別タグ]。
(第八文)本職の画家[cont:素人画家]は、素人画家[cont:本職の画家]が…風景のほうを好む[rea:以外にすることがほとんどない、rea:再構成する必要がない、rea:既に〜出来上がっている、rea:技量を試す、rea:画家としての技量、rea:見いだす、rea:創造する、rea:芸術を作る]。
(第九文)本職の画家[cont:素人画家]がこうした種類の風景を好む[rea:以外にすることがほとんどない、rea:再構成する必要がない、rea:既に〜出来上がっている、rea:技量を試す、rea:画家としての技量、rea:見いだす、rea:創造する、rea:芸術を作る]のは、自分の画家としての技量を試す…、「…画家としての技量…挑戦のゆえであり」、画家としての技量とは、…美を見いだすこと、…秩序を創造すること、…芸術を作ることなのである[断定の文種別タグ]。
(第二文)…偉大な風景画家[cont:素人画家]で、もともと…美しい題材を好んで描いた者はほとんどいない[rea:以外にすることがほとんどない、rea:再構成する必要がない、rea:既に〜出来上がっている、rea:技量を試す、rea:画家としての技量、rea:見いだす、rea:創造する、rea:芸術を作る][断定の文種別タグ]。
(第三文)もともと美しい…風景は、画家にとって…忠実な模写以外にすることがほとんどないのである[断定の文種別タグ]。
(第四文)これは素人画家[cont:本職の画家]にとっては…結構なことである[rea:以外にすることがほとんどない、rea:再構成する必要がない、rea:すでに〜出来上がっている][断定の文種別タグ]。
(第五文)というのも、…再構成する必要がないことを意味するからだ[断定の文種別タグ]。
(第六文)描き手にとって、…構図が出来上がっているのである[断定]。
(第七文)しかし、本職の画家は…望まない[rea:以外にすることがほとんどない、rea:再構成する必要がない、rea:既に〜出来上がっている、rea:技量を試す、rea:画家としての技量][断定の文種別タグ]。
(第八文)本職の画家[cont:素人画家]は、素人画家[cont:本職の画家]が…風景のほうを好む[rea:以外にすることがほとんどない、rea:再構成する必要がない、rea:既に〜出来上がっている、rea:技量を試す、rea:画家としての技量、rea:見いだす、rea:創造する、rea:芸術を作る]。
(第九文)本職の画家[cont:素人画家]がこうした種類の風景を好む[rea:以外にすることがほとんどない、rea:再構成する必要がない、rea:既に〜出来上がっている、rea:技量を試す、rea:画家としての技量、rea:見いだす、rea:創造する、rea:芸術を作る]のは、自分の画家としての技量を試す…、「…画家としての技量…挑戦のゆえであり」、画家としての技量とは、…美を見いだすこと、…秩序を創造すること、…芸術を作ることなのである[断定の文種別タグ]。
上記のように意味タグが付与された解析後文章を参照すると、全ての文に断定の種別をあらわす意味タグが付与されていることから、文の種別では当該文章の要部を判定し難い状態ではある。一方、当該文章には意味タグ[cont]により対比される「素人画家」と「本職の画家」という対の名詞があり、各名詞は上記では割愛されているが「agt」や「aen」の意味タグが付与され、行為者や属性が帰せられる対象として働くものであり、各名詞の行為や評価をあらわす内容語(例えば「望まない」)に理由をあらわす因果関係意味タグが付与されている。付与された意味タグを参照することにより、当該文章の要旨が「素人画家」と「本職の画家」の対比にあることや、当該文章の主となる内容が、「素人画家」や「本職の画家」があらわれ且つ理由をあらわす因果関係意味タグが付与されている文に記載されていることを推測できる。
例えば、上記の検索対象文章の第一文には「素人画家」と「本職の画家」のっ両方があらわれ、「素人画家」の行動「興味ぶかい(と思う)」と「本職の画家」の行動「敬遠する」があらわれ、各行動に理由の因果関係意味タグが付されている。また、上記では割愛しているが、前記「風景」や、「風景」と類義語である「劇的な題材」や「美しい題材」には、前記行動と関係付けられた意味タグが付される。このため、第一文の「素人画家」、「本職の画家」、各行為者の行動、「風景」の語、および「rea」の意味タグで関係付けられた形態素、単語、文節、句又は節の内容により、前記検索対象文章の主となる内容を推測できる。従って、上記検索対象文章から全文に亘って単語や文章を拾う従来型の要約をすることなく、全文の要旨を捉えた要約することができる。
例えば、「もともと美しいか、人の目をひきつける風景は、忠実な模写以外にすることがほとんどなく、すでに構図が出来上がっているので、その風景は素人画家にとって興味ぶかいが、本職の画家は敬遠する。なぜならば、画家としての技量は、美を見出すこと、秩序を創造すること、要するに、自然から芸術を作ることなのである。」と要約することができる。
尚、この発明は上記一実施形態に限定されるものではなく、発明の要旨を変更しない範囲で種々変形可能である。
100…自然言語解析サーバ、200…形態素・構文解析部、210…通信部、220…解析対象文章格納部、231…分かち書き処理部、232…品詞受け処理部、233…文節統合処理部、234…係り受け解析処理部、235…代名詞処理部、236…格納処理部、300…意味タグ付与システム、310…通信部、320…解析後文章格納部、330…意味タグ付与ルール格納部、331…意味タグ付与ルール、341…内容語選択処理部、342…意味タグ選択処理部、343…意味タグ付与処理部、344…格納処理部、400…意味概念辞書サーバ、410…通信部、420…意味概念辞書格納部、421…意味概念辞書、500…クライアントコンピュータ、510…通信部、520…解析対象文章格納部、530…解析後文章格納部、531…解析対象文章送信処理部、532…解析後文章受信処理部、533…要約処理部。
Claims (16)
- クライアントコンピュータと、前記クライアントコンピュータと通信回線を介して接続される自然言語解析サーバとを有する自然言語解析システムであって、
前記自然言語解析サーバは、行動又は評価の内容を有する様々な内容語を格納している意味概念辞書を記憶格納する意味概念辞書格納部であって、前記意味概念辞書に格納されている前記各内容語には1つ又は複数の因果関係意味タグが付与されており、前記1つ又は複数の因果関係意味タグはそれぞれ、前記各内容語と、前記各内容語と因果関係のある1つ又は複数の単語、句又は節とを関連付けるものである、前記意味概念辞書格納部を有し、
前記自然言語解析サーバはさらに、
コンピュータが、前記クライアントコンピュータから解析対象文章を受信しメモリに格納する解析対象文章格納手段と、
コンピュータが、前記解析対象文章格納手段で格納した解析対象文章を前記メモリから取り出し、取り出した解析対象文章に分かち書き処理、品詞付け処理、文節統合処理、および係り受け解析を実行する形態素・構文解析処理手段と、
コンピュータが、前記形態素・構文解析処理手段による解析後の文章中において内容語を少なくとも1つ選択する内容語選択手段と、
コンピュータが、前記意味概念辞書格納部に格納された前記意味概念辞書から、前記内容語選択手段により選択された内容語又は当該内容語の同義語、類義語、対義語、上位概念語若しくは下位概念語である内容語に付与された前記1つ又は複数の因果関係意味タグを読み出し、読み出した因果関係意味タグのうち前記解析対象文章中にあらわれる単語、句又は節と関連する因果関係意味タグを少なくとも1つ特定する意味タグ特定手段と、
コンピュータが、前記意味タグ特定手段で特定された因果関係意味タグのうち少なくとも1つを、前記意味タグ特定手段で関連すると特定された前記単語、句又は節と関連付けて前記解析後の文章中における前記選択された内容語に付与する意味タグ付与手段と、
コンピュータが、前記意味タグ付与手段によって意味タグが付与された前記解析後文章を前記クライアントコンピュータに送信する送信手段と
を有する
ことを特徴とする自然言語解析システム。 - クライアントコンピュータと、前記クライアントコンピュータと通信回線を介して接続される自然言語解析サーバとを有する自然言語解析システムであって、
前記クライアントコンピュータは、
コンピュータが、他のコンピュータから解析対象文章を受信しメモリに格納する格納手段と、
コンピュータが、前記格納手段で格納した前記解析対象文章を前記メモリから取り出し、取り出した解析対象文章に分かち書き処理、品詞付け処理、文節統合処理、および係り受け解析を実行する形態素・構文解析処理手段と、
コンピュータが、前記形態素・構文解析処理手段による解析後の解析対象文章を前記自然言語解析サーバに送信する送信手段と
を有し、
前記自然言語解析サーバは、行動又は評価の内容を有する様々な内容語を格納している意味概念辞書を記憶格納する意味概念辞書格納部であって、前記意味概念辞書に格納されている前記各内容語には1つ又は複数の因果関係意味タグが付与されており、前記1つ又は複数の因果関係意味タグはそれぞれ、前記各内容語と、前記各内容語と因果関係のある1つ又は複数の単語、句又は節とを関連付けるものである、前記意味概念辞書格納部を有し、
前記自然言語解析サーバはさらに、
コンピュータが、前記クライアントコンピュータから前記解析後の解析対象文章を受信しメモリに格納する解析対象文章格納手段と、
コンピュータが、前記解析対象文章格納手段で格納した前記解析後の解析対象文章を前記メモリから取り出し、取り出した前記解析後の解析対象文章中において内容語を少なくとも1つ選択する内容語選択手段と、
コンピュータが、前記意味概念辞書格納部に格納された意味概念辞書から、前記内容語選択手段により選択された内容語又は当該内容語の同義語、類義語、対義語、上位概念語若しくは下位概念語である内容語に付与された前記1つ又は複数の因果関係意味タグを読み出し、読み出した因果関係意味タグのうち前記解析後の解析対象文章中にあらわれる単語、句又は節と関連する因果関係意味タグを少なくとも1つ特定する意味タグ特定手段と、
コンピュータが、前記意味タグ特定手段で特定された因果関係意味タグのうち少なくとも1つを、前記意味タグ特定手段で関連すると特定された前記単語、句又は節と関連付けて前記解析後の解析対象文章中における前記選択された内容語に付与する意味タグ付与手段と、
コンピュータが、前記意味タグ付与手段によって意味タグが付与された前記解析後の解析対象文章を前記クライアントコンピュータに送信する送信手段と
を有する
ことを特徴とする自然言語解析システム。 - 請求項1又は2記載の自然言語解析システムにおいて、
前記因果関係意味タグは、前記行動又は評価の内容を有する様々な内容語と、当該各内容語の行動又は評価の理由又は原因となる1つ又は複数の単語、句又は節とを関連付けるものである
ことを特徴とする自然言語解析システム。 - 請求項1、2又は3記載の自然言語解析システムにおいて、
前記意味概念辞書には、様々な文末の形態が格納されていると共に、前記各文末の形態にはそれぞれ文種別タグが付与されており、前記各文種別タグは、前記各文末の形態を有する文が少なくとも依頼、使役、断定、質問、疑問、結果、意思、推測、思惟および結論から選択される1以上の意を有することを示すものであり、
前記意味タグ付与手段は、前記意味概念辞書に格納されている前記様々な文末の形態と前記解析対象文章中にあらわれる各文の文末とを対比し、前記解析対象文章中の文に前記文種別タグを付与するものであり、
前記クライアントコンピュータは、
コンピュータが、前記出力手段によって出力された意味タグ付きの前記解析後文章を受信し格納する解析後文章格納手段と、
コンピュータが、前記解析後文章中の文に付与された前記文種別タグおよび/又は前記因果関係意味タグに基づき、前記解析後文章中の各文のうち前記文章中で主となる内容を述べている1つ又は複数の文を特定する主要文特定手段と、
コンピュータが、前記主要文特定手段で特定された1つ又は複数の文が要部であるとして前記解析対象文章の要約を作成する要約作成手段と
を有する
ことを特徴とする自然言語解析システム。 - 請求項1、2又は3記載の自然言語解析システムにおいて、
前記意味概念辞書には様々な単語の対、句の対、又は節の対が格納されていると共に、前記各単語の対、句の対、又は節の対にはそれぞれ論理関係意味タグが付与されており、前記論理関係意味タグは、前記単語の対、句の対、又は節の対が論理的にどのように関係しているかを示すものであり、
前記意味タグ付与手段は、前記意味概念辞書に格納されている前記単語の対、句の対、又は節の対を前記解析対象文章中にあらわれる単語の対、句の対、又は節の対と対比し、前記解析対象文章中の単語の対、句の対、又は節の対に前記論理関係意味タグを付与するものである
ことを特徴とする自然言語解析システム。 - 請求項1、2、3、4又は5記載の自然言語解析システムにおいて、
前記形態素・構文解析処理手段は、前記解析対象文章に代名詞処理およびゼロ代名詞処理をさらに実行するものである
ことを特徴とする自然言語解析システム。 - クライアントコンピュータと前記クライアントコンピュータと通信回線を介して接続される自然言語解析サーバとを用いて解析対象文章を解析する自然言語解析方法であって、
前記自然言語解析サーバは、行動又は評価の内容を有する様々な内容語を格納している意味概念辞書を記憶格納する意味概念辞書格納部であって、前記意味概念辞書に格納されている前記各内容語には1つ又は複数の因果関係意味タグが付与されており、前記1つ又は複数の因果関係意味タグはそれぞれ、前記各内容語と、前記各内容語と因果関係のある1つ又は複数の単語、句又は節とを関連付けるものである、前記意味概念辞書格納部を有し、
この方法は、
前記クライアントコンピュータ又は前記自然言語解析サーバが、前記解析対象文章に分かち書き処理、品詞付け処理、文節統合処理、および係り受け解析を実行する形態素・構文解析工程と、
前記クライアントコンピュータ又は前記自然言語解析サーバが、前記形態素・構文解析工程による解析後の文章中において内容語を少なくとも1つ選択する内容語選択工程と、
前記自然言語解析サーバが、前記意味概念辞書格納部に格納された前記意味概念辞書から、前記内容語選択工程により選択された内容語又は当該内容語の同義語、類義語、対義語、上位概念語若しくは下位概念語である内容語に付与された1つ又は複数の因果関係意味タグを読み出し、読み出した因果関係意味タグのうち前記解析対象文章中にあらわれる単語、句又は節と関連する因果関係意味タグを少なくとも1つ特定する意味タグ特定工程と、
前記自然言語解析サーバが、前記意味タグ特定工程で特定された因果関係意味タグのうち少なくとも1つを、前記意味タグ特定工程で関連すると特定された前記単語、句又は節と関連付けて前記解析後の文章中における前記選択された内容語に付与する意味タグ付与工程と、
前記自然言語解析サーバが、前記意味タグ付与工程によって意味タグが付与された前記解析後文章を前記クライアントコンピュータに送信する送信工程と
を有する
ことを特徴とする自然言語解析方法。 - 請求項7記載の自然言語解析方法において、
前記因果関係意味タグは、前記行動又は評価の内容を有する様々な内容語と、当該各内容語の行動又は評価の理由又は原因となる1つ又は複数の単語、句又は節とを関連付けるものである
ことを特徴とする自然言語解析方法。 - 請求項7又は8記載の自然言語解析方法において、
前記意味概念辞書には、様々な文末の形態が格納されていると共に、前記各文末の形態にはそれぞれ文種別タグが付与されており、前記各文種別タグは、前記各文末の形態を有する文が少なくとも依頼、使役、断定、質問、疑問、結果、意思、推測、思惟および結論から選択される1以上の意を有することを示すものであり、
前記意味タグ付与工程では、前記自然言語解析サーバが、前記意味概念辞書に格納されている前記様々な文末の形態と前記解析対象文章中にあらわれる各文の文末とを対比し、前記解析対象文章中の文に前記文種別タグを付与し、
この方法はさらに、
前記クライアントコンピュータが、前記送信手段によって出力された意味タグ付きの前記解析後文章を受信しメモリに格納する解析後文章格納工程と、
前記クライアントコンピュータが、前記解析後文章格納工程で前記メモリに格納した前記解析後文章を前記メモリから取り出すと共に、取り出した前記解析後文章中の文に付与された前記文種別タグおよび/又は前記因果関係意味タグに基づき、前記解析後文章中の各文のうち前記文章中で主となる内容を述べている1つ又は複数の文を特定する主要文特定工程と、
前記主要文特定工程で特定された1つ又は複数の文が要部であるとして前記解析対象文章の要約を作成する要約作成工程と、
を有する
ことを特徴とする自然言語解析方法。 - 請求項7又は8記載の自然言語解析方法において、
前記意味概念辞書には様々な単語の対、句の対、又は節の対が格納されていると共に、前記各単語の対、句の対、又は節の対にはそれぞれ論理関係意味タグが付与されており、前記論理関係意味タグは、前記単語の対、句の対、又は節の対が論理的にどのように関係しているかを示すものであり、
前記意味タグ付与工程では、前記意味概念辞書に格納されている前記単語の対、句の対、又は節の対を前記解析対象文章中にあらわれる単語の対、句の対、又は節の対と対比し、前記解析対象文章中の単語の対、句の対、又は節の対に前記倫理関係意味タグを付与する
ことを特徴とする自然言語解析方法。 - 請求項7、8、9又は10記載の自然言語解析方法において、
前記形態素・構文解析処理工程では、前記解析対象文章に代名詞処理およびゼロ代名詞処理をさらに行う
ことを特徴とする自然言語解析方法。 - クライアントコンピュータから解析対象文章を受信し当該解析対象文章に意味タグを付与する意味タフ付与システムであって、
この意味タグ付与システムは、
様々な内容語および機能語を格納している意味概念辞書を記憶格納する意味概念辞書格納部であって、前記意味概念辞書に格納されている前記様々な内容語および機能語の一部は行動又は評価の内容を有する内容語であり、前記行動又は評価の内容を有する各内容語には1つ又は複数の因果関係意味タグが付与されており、前記1つ又は複数の因果関係意味タグはそれぞれ、前記行動又は評価の内容を有する各内容語と、前記行動又は評価の内容を有する各内容語と因果関係のある1つ又は複数の単語、句又は節とを関連付けるものである、前記意味概念辞書格納部を有し、
この意味タグ付与システムは、
コンピュータが、前記解析対象文章中において行動又は評価の内容を有する内容語を少なくとも1つ選択する内容語選択手段と、
コンピュータが、前記意味概念辞書格納部に格納された前記意味概念辞書から、前記内容語選択手段により選択された内容語又は当該内容語の同義語、類義語、対義語、上位概念語若しくは下位概念語である内容語に付与された前記1つ又は複数の因果関係意味タグを読み出し、読み出した因果関係意味タグのうち前記解析対象文章中にあらわれる単語、句又は節と関連する因果関係意味タグを少なくとも1つ特定する意味タグ特定手段と、
コンピュータが、前記意味タグ特定手段で特定された因果関係意味タグのうち少なくとも1つを、前記意味タグ特定手段で関連すると特定された前記単語、句又は節と関連付けて前記解析対象文章中にあらわれる前記選択された内容語に付与する意味タグ付与手段と
を有する
ことを特徴とする意味タグ付与システム。 - 請求項12記載の意味タグ付与システムにおいて、
前記意味概念辞書に格納されている前記様々な内容語および機能語の一部は様々な名詞であると共に、前記名詞と機能語との様々な組合せが前記意味概念辞書に格納されており、前記各組合せには1つ又は複数の意味タグが付与されており、前記各意味タグはそれぞれ、前記各組合せと、前記各組合せと主語述語関係又は修飾関係のある単語、句又は節とを関連付けるものであり、
前記内容語選択手段は、前記解析対象文章中において名詞と機能語との組合せを少なくとも1つ選択するものであり、
前記意味タグ特定手段は、前記意味概念辞書格納部に格納された前記意味概念辞書から、前記内容語選択手段により選択された名詞と機能語との組合せ又は前記選択された名詞の同義語、類義語、対義語、上位概念語若しくは下位概念語と機能語との組合せに付与された前記1つ又は複数の意味タグを読み出し、読み出した意味タグのうち前記解析対象文章中にあらわれる単語、句又は節と関連する意味タグを少なくとも1つ特定するものであり、
前記意味タグ付与手段は、前記意味タグ特定手段で特定された意味タグのうち少なくとも1つを、この意味タグと関連して前記解析対象文章中にあらわれる単語、句又は節と関連付けて前記解析対象文章中の前記選択された名詞と機能語との組合せに付与するものである
ことを特徴とする意味タグ付与システム。 - 請求項12又は13記載の意味タグ付与システムにおいて、
前記因果関係意味タグは、前記行動又は評価の内容を有する様々な内容語と、当該各内容語の行動又は評価の理由又は原因となる1つ又は複数の単語、句又は節とを関連付けるものである
ことを特徴とする自然言語解析システム。 - 請求項12、13又は14記載の意味タグ付与システムにおいて、
前記意味概念辞書には、様々な文末の形態が格納されていると共に、前記各文末の形態にはそれぞれ文種別タグが付与されており、前記各文種別タグは、前記各文末の形態を有する文が少なくとも依頼、使役、断定、質問、疑問、結果、意思、推測、思惟および結論から選択される1以上の意を有することを示すものであり、
前記意味タグ付与手段は、前記意味概念辞書に格納されている前記様々な文末の形態と前記解析対象文章中にあらわれる各文の文末とを対比し、前記解析対象文章中の文に前記文種別タグを付与するものである
ことを特徴とする意味タグ付与システム。 - 請求項12、13又は14記載の意味タグ付与システムにおいて、
前記意味概念辞書には様々な単語の対、句の対、又は節の対が格納されていると共に、前記各単語の対、句の対、又は節の対にはそれぞれ論理関係意味タグが付与されており、前記論理関係意味タグは、前記単語の対、句の対、又は節の対が論理的にどのように関係しているかを示すものであり、
前記意味タグ付与手段は、前記意味概念辞書に格納されている前記単語の対、句の対、又は節の対を前記解析対象文章中にあらわれる単語の対、句の対、又は節の対と対比し、前記解析対象文章中の単語の対、句の対、又は節の対に前記論理関係意味タグを付与するものである
ことを特徴とする意味タグ付与システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012151514A JP2014013549A (ja) | 2012-07-05 | 2012-07-05 | 自然言語解析システムおよび自然言語解析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012151514A JP2014013549A (ja) | 2012-07-05 | 2012-07-05 | 自然言語解析システムおよび自然言語解析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014013549A true JP2014013549A (ja) | 2014-01-23 |
Family
ID=50109181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012151514A Pending JP2014013549A (ja) | 2012-07-05 | 2012-07-05 | 自然言語解析システムおよび自然言語解析方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014013549A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105096942A (zh) * | 2014-05-21 | 2015-11-25 | 清华大学 | 语义分析方法和装置 |
CN107315798A (zh) * | 2017-06-19 | 2017-11-03 | 北京神州泰岳软件股份有限公司 | 基于多主题语义标签信息映射的结构化处理方法及装置 |
JP2021012625A (ja) * | 2019-07-09 | 2021-02-04 | 株式会社日立製作所 | 要約文作成方法、及び要約文作成システム |
WO2021053511A1 (en) * | 2019-09-18 | 2021-03-25 | International Business Machines Corporation | Hypernym detection using strict partial order networks |
WO2021112384A1 (ko) * | 2019-12-05 | 2021-06-10 | 울산대학교 산학협력단 | 자연어 표상 방법 및 이를 수행하기 위해 매체에 저장된 컴퓨터 프로그램 |
-
2012
- 2012-07-05 JP JP2012151514A patent/JP2014013549A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105096942A (zh) * | 2014-05-21 | 2015-11-25 | 清华大学 | 语义分析方法和装置 |
CN107315798A (zh) * | 2017-06-19 | 2017-11-03 | 北京神州泰岳软件股份有限公司 | 基于多主题语义标签信息映射的结构化处理方法及装置 |
JP2021012625A (ja) * | 2019-07-09 | 2021-02-04 | 株式会社日立製作所 | 要約文作成方法、及び要約文作成システム |
JP7309489B2 (ja) | 2019-07-09 | 2023-07-18 | 株式会社日立製作所 | 要約文作成方法、及び要約文作成システム |
WO2021053511A1 (en) * | 2019-09-18 | 2021-03-25 | International Business Machines Corporation | Hypernym detection using strict partial order networks |
US11068665B2 (en) | 2019-09-18 | 2021-07-20 | International Business Machines Corporation | Hypernym detection using strict partial order networks |
GB2602762A (en) * | 2019-09-18 | 2022-07-13 | Ibm | Hypernym detection using strict partial order networks |
US11694035B2 (en) | 2019-09-18 | 2023-07-04 | International Business Machines Corporation | Hypernym detection using strict partial order networks |
WO2021112384A1 (ko) * | 2019-12-05 | 2021-06-10 | 울산대학교 산학협력단 | 자연어 표상 방법 및 이를 수행하기 위해 매체에 저장된 컴퓨터 프로그램 |
KR20210070685A (ko) * | 2019-12-05 | 2021-06-15 | 울산대학교 산학협력단 | 자연어 표상 방법 및 이를 수행하기 위해 매체에 저장된 컴퓨터 프로그램 |
KR102313721B1 (ko) * | 2019-12-05 | 2021-10-15 | 울산대학교 산학협력단 | 자연어 표상 방법 및 이를 수행하기 위해 매체에 저장된 컴퓨터 프로그램 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Olohan et al. | Reporting that in translated English. Evidence for subconscious processes of explicitation? | |
Sugiyama et al. | Open-domain utterance generation for conversational dialogue systems using web-scale dependency structures | |
Hjort-Pedersen et al. | Explicitation and implicitation in legal translation–a process study of trainee translators | |
JP2014013549A (ja) | 自然言語解析システムおよび自然言語解析方法 | |
Meibauer | What is an indirect speech act? Reconsidering the literal force hypothesis | |
Janssen-Lauret | Committing to an individual: ontological commitment, reference and epistemology | |
Stormbom | Gendering in open access research articles: The role of epicene pronouns | |
KR101405893B1 (ko) | 단말기를 이용한 영어문장의 분석시스템 및 그 방법 | |
Mota et al. | eSPERTo’s paraphrastic knowledge applied to question-answering and summarization | |
Ptaszynski et al. | Towards socialized machines: Emotions and sense of humour in conversational agents | |
JP4033011B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
Slocum | The ordinary meaning of rules | |
Mohammed | Translating Humorous Expressions into Arabic with Reference to Loss, Gain, and Compensation | |
Ptaszynski et al. | Contextual affect analysis: a system for verification of emotion appropriateness supported with Contextual Valence Shifters | |
Aliyeva | Text Linguistics and the Use of Linguistic Data in Modern Technologies: Prospects for Development | |
JP2007133905A (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
Rush | A Computer Assisted Language Analysis System. | |
KR100276687B1 (ko) | 대화식 학습 보조 장치 및 그의 대화분석 방법u | |
Yang et al. | Construction of an “Analects of Confucius” knowledge base including pragmatics information | |
JP4039282B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
Amon | Between rhetorical questions and information requests: A versatile interrogative clause in Estonian | |
Ninio | Learning to produce complement predicates with shared semantic subjects | |
JP6996190B2 (ja) | 複合語生成装置、プログラム及び複合語生成方法 | |
Pinheiro et al. | A semi-automated method for acquisition of common-sense and inferentialist knowledge | |
Borchmann | Are discourse-initial action-guiding verbless speech acts elliptical? |