JP4300056B2 - CONCEPT EXPRESSION GENERATION METHOD, PROGRAM, STORAGE MEDIUM, AND CONCEPT EXPRESSION GENERATION DEVICE - Google Patents

CONCEPT EXPRESSION GENERATION METHOD, PROGRAM, STORAGE MEDIUM, AND CONCEPT EXPRESSION GENERATION DEVICE Download PDF

Info

Publication number
JP4300056B2
JP4300056B2 JP2003122554A JP2003122554A JP4300056B2 JP 4300056 B2 JP4300056 B2 JP 4300056B2 JP 2003122554 A JP2003122554 A JP 2003122554A JP 2003122554 A JP2003122554 A JP 2003122554A JP 4300056 B2 JP4300056 B2 JP 4300056B2
Authority
JP
Japan
Prior art keywords
expression
intention
clause
phrase
concept
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003122554A
Other languages
Japanese (ja)
Other versions
JP2004326596A (en
Inventor
奈穂子 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003122554A priority Critical patent/JP4300056B2/en
Priority to CNB200480000557XA priority patent/CN100463571C/en
Publication of JP2004326596A publication Critical patent/JP2004326596A/en
Application granted granted Critical
Publication of JP4300056B2 publication Critical patent/JP4300056B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Mobile Radio Communication Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、例えばパーソナルコンピュータなど情報処理装置上で実現される、文書検索システム、文書分類システム、文書分析システムといった文書処理システムなどに用いることができる概念表現生成技術に関する。
【0002】
【従来の技術】
近年、アンケートデータやコールセンターデータなど大量のテキストデータを分析することを目的としたテキストマイニング技術が注目されてきている。こうした分析をおこなう際には、文書集合内に含まれる特徴的な概念情報を抽出することが大きな課題の一つとなる。
概念情報抽出を含む情報抽出技術は、大量の文書データから何らかの知見を見出す方法として研究が進んでいる。文書から、その文書の主題やトピック、書き手の意図などを表現する有益な情報を抽出することができれば、それらに基づいた文書検索、文書分類、文書分析などの応用が実現可能となる。利用者にとって有益な抽出情報とは、利用者の任意の尺度をもって文書から抽出される概念であるが、これらを精度良く利用者の意図どおりに抽出し、表現する技術が求められているのである。
従来、文書の特徴的な概念は、所定値以上の出現頻度をもつ語句、語句群などの表層表現、いわゆるキーワードまたは共起する複数のキーワード群、キーワードを用いたアンドやオアの論理式などによって表現されることが多かった。例えば特開平8−30627号公報記載の従来技術では、文書の特徴的な概念表現に際してのキーワード抽出のためのキーワード抽出技法を提示しており、特開2000−067054公報に示された従来技術では、文書の特徴概念表現のために出現頻度が所定値以上の単語を抽出する。また、特開平2001−290826公報に示された従来技術では、特定の単語の論理演算式で表現する。
しかしながら、一つまたは複数のキーワードの共起情報、複数のキーワードの論理式などで表現する方法では、例えば、「OSのインストール」という概念を含む文書群を検索しようとした場合、「OS」&「インストール」というキーワードの論理式を概念表現とすることになるが、この場合、「OSのインストールができない」(概念に合致)という文書も、「OSはWin95だが、ドライバーがインストールできない」という文書も該当してしまい、検索精度に悪影響を及ぼすという問題があり、概念記述に限界があることが明らかになってきている。
さらに、利用者の所望する概念は、必ずしも高頻度に出現する単語とは限らない。例えば「インストールできる」という文を含む文書と、「インストールできない」という文を含む文書を、可能、不可能という観点で概念を表現したい場合、全く逆の概念を有するにもかかわらず、従来のキーワードによる概念生成においては、同じ概念として処理されてしまう。このように頻度に基づくキーワード抽出でカバーできない事例も明らかになっていている。
【0003】
そこで、対象文書の構文情報を利用して語と語の関係を抽出したり、文書の書き手の意図を抽出し、それを概念表現生成に利用する方法も提案されている。例えば特開平5−265760号公報に示された従来技術では、構文解析の結果得られる因果関係など、特定の命題間関係を、構造タグの付いた文節の構造知識という形式の知識表現へ変換し、概念表現としている。この表現方法は、命題間関係が明らかになり、利用者の観点が一致した場合、強力な表現方法である。しかし、この知識表現は、複数行にわたる文節の構造知識という形式であるので、利用者に言語知識がなければこれらの概念群を概観しにくいという問題点がある。さらに、構造上、概念の組み合わせを記述しにくいという問題点もある。
また、特開2000−172691公報に示された従来技術では、係り受け解析の結果得られる特定の自立語と、テンス・アスペクト・モダリティ情報付きの文構造を処理単位としている。しかし、この従来技術では、テンス、アスペクト、モダリティ情報の取得に関する具体的な方法の記載がなく、再現性に問題がある。また、特開2001−075966公報に示された従来技術では、キーワードを概念表現に置き換え、さらに構文解析の結果、係り受け関係にある概念の組み合わせや、概念+評価ラベルという形式で概念表現をおこなう。この評価ラベルには、打消の意図なども含まれ、先の例のような可能、不可能の概念を区別することが可能である。このように概念表現方法が豊富な手法であるが、しかし、概念変換のための辞書が必要であり、この辞書の構築は、前記のとおり、コストが高いという問題がある。
また、特開2001−84250公報に示された従来技術では、対象文書を構文解析して、その結果得られる語と語の関係構文木や線形リストが概念表現の役割を果たしている。語と語の関係構文木の形式で概念を表現するので、単語による表現に比べて情報が豊富で、ごみの少ない概念が生成できる。しかし、表記を統一するための変換辞書が必要な上、表現方法が知識パターンとしての構文木や線形リストであるので、そういった表現になじみの少ない利用者には難解であり、データの概観も難しく、抽出した概念の組み合わせなどの操作がしにくいという問題点がある。
【特許文献1】
特開平8−30627号公報
【特許文献2】
特開2000−067054公報
【特許文献3】
特開2001−290826公報
【特許文献4】
特開平5−265760号公報
【特許文献5】
特開2000−172691公報
【特許文献6】
特開2001−075966公報
【特許文献7】
特開2001−84250公報
【0004】
【発明が解決しようとする課題】
前記したように、従来技術には、テキスト文書からそのテキスト文書の内容を表現する有益な概念情報を抽出するのに高いコストを要するとか、概念表現が利用者にわかりにくいとか、概念表現を操作しにくいとかいった問題があった。
本発明の目的は、このような従来技術の問題を解決することにあり、具体的には、テキスト文書からそのテキスト文書の内容を表現する有益な概念情報を低コストで抽出し、利用者にわかりやすく、操作しやすい概念表現を実現することができる概念表現生成技術を提供することにある。特に本発明では、テキストに対しておこなう言語解析結果から得られる文節情報と文節間関係情報から書き手の様々な意図表現を抽出し、それを用いて概念を表現することができる概念表現生成方法を提供する。これにより、利用者は、特別な文法知識がなくても、テキストに含まれる概念を容易に概観できるし、概念の検索、概念の拡張や絞込みなどの操作を容易におこなうことができる。
【0005】
【課題を解決するための手段】
前記の課題を解決するために、請求項1記載の発明では、意図表現パターン辞書を記憶する記憶手段と、制御手段とを備える概念表現生成システムにて実行される概念表現生成方法であって、前記意図表現パターン辞書は、単語の表記、当該単語の品詞、当該単語の意図表現が対応付けられた意図表現パターンと、当該意図表現パターンが特定の意図表現パターンか否かを示すフラグとを対応付けて、それぞれの単語について記憶しており、前記制御手段が、テキストの入力を受け付ける入力ステップと、前記入力ステップにて受け付けたテキストに対して、形態素解析及び当該テキストを構成する文節単位の係り受け解析を実行する言語解析ステップと、前記言語解析ステップにて得られた言語解析結果に基づき、前記テキストを構成する個々の文節について、当該文節に含まれる単語の表記及び品詞と、当該文節の係り受け情報と、を含む文節情報を生成する文節情報生成ステップと、各文節の前記文節情報に含まれる単語が、前記意図表現パターン辞書が記憶する意図表現パターンと一致するかを判定し、一致すると判定された場合には、当該意図表現パターンに対応付けて記憶されている意図表現を、当該一致すると判定された文節の文節情報に付加する意図表現設定ステップと、前記文節情報に付加された意図表現を用いて、各文節の概念表現を生成する概念表現生成ステップとを実行し、前記意図表現設定ステップはさらに、前記意図表現パターン辞書が記憶する意図表現パターンと一致すると判定された意図表現パターンが特定の意図表現パターンであり、かつ、当該特定の意図表現パターンが自立語の特定パターンであり、かつ、前記一致すると判定された文節が受け文節になっている係り受け文節対が存在する場合に、当該係り受け文節対の係り文節の文節情報にも、前記一致すると判定された文節の文節情報に付加された意図表現を付加することを実行することを特徴とする。
また、請求項記載の発明では、前記意図表現パターン辞書は、前記意図表現パターンの参照、追加、修正、または削除が可能なテーブル形式で記憶されていることを特徴とする。
また、請求項3記載の発明では、前記意図表現設定ステップはさらに、前記係り受け文節対の係り文節を構成する自立語が形式名詞であり、かつ、当該係り受け文節対の係り文節が連体修飾関係で受け文節になっている場合に、前記係り受け文節対の係り文節の文節情報に、前記連体修飾関係で係り文節の文節情報に対応する意図表現を付加することを特徴とする。
また、請求項4記載の発明では、前記概念表現生成ステップはさらに、意図表現が付加されなかった文節を検出し、当該文節に所定の意図表現がつかなかったことを明示することを特徴とする。
また、請求項5記載の発明では、前記意図表現には、打消表現、可能表現、要望表現、疑問表現、理由表現のいずれかを含むことを特徴とする。
また、請求項6記載の発明では、前記概念表現生成ステップは、前記文節の文節情報に打消の意の意図表現が偶数個付加されている場合、その打消の意の意図表現を肯定の意の意図表現に変換することを特徴とする。
また、請求項7記載の発明では、情報処理装置上で実行されるプログラムにおいて、請求項乃至のいずれか1項に記載の概念表現生成方法によった概念表現生成が実行されるようにプログラミングされていることを特徴とする。
また、請求項8記載の発明では、ログラムを記憶した記憶媒体において、請求項7に記載のプログラムを記憶したことを特徴とする。
【0006】
また、請求項9記載の発明では、意図表現パターン辞書を記憶する記憶手段と、制御手段とを備える概念表現生成システムにて実行される概念表現生成装置であって、前記意図表現パターン辞書は、単語の表記、当該単語の品詞、当該単語の意図表現が対応付けられた意図表現パターンと、当該意図表現パターンが特定の意図表現パターンか否かを示すフラグとを対応付けて、それぞれの単語について記憶しており、前記制御手段が、テキストの入力を受け付ける入力手段と、前記入力手段にて受け付けたテキストに対して、形態素解析及び当該テキストを構成する文節単位の係り受け解析を実行する言語解析手段と、前記言語解析手段にて得られた言語解析結果に基づき、前記テキストを構成する個々の文節について、当該文節に含まれる単語の表記及び品詞と、当該文節の係り受け情報と、を含む文節情報を生成する文節情報生成手段と、各文節の前記文節情報に含まれる単語が、前記意図表現パターン辞書が記憶する意図表現パターンと一致するかを判定し、一致すると判定された場合には、当該意図表現パターンに対応付けて記憶されている意図表現を、当該一致すると判定された文節の文節情報に付加する意図表現設定手段と、前記文節情報に付加された意図表現を用いて、各文節の概念表現を生成する概念表現生成手段とを有し、前記意図表現設定手段はさらに、前記意図表現パターン辞書が記憶する意図表現パターンと一致すると判定された意図表現パターンが特定の意図表現パターンであり、かつ、当該特定の意図表現パターンが自立語の特定パターンであり、かつ、前記一致すると判定された文節が受け文節になっている係り受け文節対が存在する場合に、当該係り受け文節対の係り文節の文節情報にも、前記一致すると判定された文節の文節情報に付加された意図表現を付加することを実行することを特徴とする
また、請求項10記載の発明では、前記意図表現パターン辞書は、前記意図表現パターンの参照、追加、修正、または削除が可能なテーブル形式で記憶されていることを特徴とする
また、請求項11記載の発明では、前記意図表現設定手段はさらに、前記係り受け文節対の係り文節を構成する自立語が形式名詞であり、かつ、当該係り受け文節対の係り文節が連体修飾関係で受け文節になっている場合に、前記係り受け文節対の係り文節の文節情報に、前記連体修飾関係で係り文節の文節情報に対応する意図表現を付加することを特徴とする
また、請求項12記載の発明では、前記概念表現生成手段はさらに、意図表現が付加されなかった文節を検出し、当該文節に所定の意図表現がつかなかったことを明示することを特徴とする
また、請求項13記載の発明では、前記意図表現には、打消表現、可能表現、要望表現、疑問表現、理由表現のいずれかを含むことを特徴とする
また、請求項14記載の発明では、前記概念表現生成手段は、前記文節の文節情報に打消の意の意図表現が偶数個付加されている場合、その打消の意の意図表現を肯定の意の意図表現に変換することを特徴とする
【0007】
【発明の実施の形態】
以下、図面により本発明の実施の形態を詳細に説明する。
図1は本発明の実施の形態を示す概念表現生成システムの構成ブロック図である。図示したように、この概念表現生成システムは、入力部1、言語解析部2、言語解析用辞書3、テキストデータ構造生成部4、テキストデータ構造記憶部5、意図表現設定部6、意図表現パターン辞書7、概念表現生成部8、概念表現記憶部9、および出力部10などを備えている。なお、ここでは、請求項1記載の言語解析手段、テキストデータ構造生成手段、意図表現設定手段、および概念表現生成手段がそれぞれ、言語解析部2、テキストデータ構造生成部4、意図表現設定部6、および概念表現生成部8により実現される。
また、入力部1、言語解析部2、テキストデータ構造生成部4、意図表現設定部6、概念表現生成部8、および出力部10は、プログラムを記憶したメモリ、およびそのプログラムに従って動作するCPUなどにより実現され、言語解析用辞書3、テキストデータ構造記憶部5、および意図表現パターン辞書7は、例えばハードディスク記憶装置の一部を記憶領域として用いて実現される。また、入力部1が入力処理をおこなうための入力手段は例えばキーボードや音声入力装置であり、出力部10が出力処理をおこなう相手の出力手段は例えば表示装置や音声出力装置である。
また、言語解析部2は少なくとも形態素解析と係り受け解析をおこなう。形態素解析処理は、テキストを単語毎に区切り、品詞など各単語の属性を付加する処理で、原理は「日本語情報処理・第4章 形態素解析」に詳しいが、その処理方法としては、最長一致法、コスト最小法、用例検索法など、既存の手法を用いる。係り受け解析は、係り受け処理の1単位である文節を生成し、文節と文節がどのような関係にあるかを同定する処理で、原理は「日本語情報処理・第5章 構文解析」や、「二文節間の係り受けを基礎とした日本語の構文分析」(吉田)にあるような既存の手法を用いる。
一般に文節は1つの自立語と0個以上の付属語で構成され、解析方法によっては、1文節に複数個の自立語が含まれるような結果を出す定義の仕方もあるが、この実施例では、文節にはかならず1つだけしか自立語を含まないように文節を生成する解析方法を用いる。
【0008】
図2はテキストデータ構造の構造例、図3はテキストデータ構造の各構成要素が管理する情報例である。言語解析によって得られた情報を、テキストデータ構造生成部4において図2に示したようなテキストデータ構造に変換し、記憶する。前記したテキストデータ構造の各構成要素とは、上位から順に、テキスト、文、文節、単語である(図2参照)。図3に示したように、例えば文節情報には、文節を構成する単語情報の他、当該文節へ係る係り文節情報、当該文節が係る先の受け文節情報、意図表現などがある。
意図表現とは、文節内の意図を示す表現であり、主に助動詞など文節構成単語の表現パターンで判断することができる。例えば、「〜ない(助動詞)」「〜ず(助動詞)」という表現パターンは「打消」の意図を、「〜できる(補助動詞)」という表現パターンは「可能」の意図を、「〜たい(助動詞)」という表現パターンは「要望」の意図を、「〜ので(接続助詞)」という表現パターンは「理由」の意図を、当該文節に対して付加していると判断できる。なお、言語解析終了時には、意図表現はまだ設定されない。この後、意図表現設定部6により文節中から意図表現の表現パターンにマッチする文節が抽出され、テキストデータ構造記憶部5に、当該文節に対応づけて予め登録しておいた所定の意図表現が付加されるのである。
図4は意図表現パターン辞書の記載例である。図示したように表現パターンおよび対応する意図表現を含む意図表現パターン辞書を、ユーザインタフェースを介して参照、追加、修正、または削除が可能なテーブル形式で予め記憶しておく。そして、意図表現抽出では、文節を順に読み込み、図4に例示されているような意図表現パターン辞書とのマッチング処理をおこなう。マッチングキーは少なくとも1単語あたり表記と品詞を用いる。そして、マッチした場合の表現パターンによって、意図表現(図4参照)を、当該対象文節と、場合によっては係り受け関係にある係り文節、さらにその文節への係り文節へ付加し、テキストデータ構造記憶部5に記憶されている内容を更新する。
【0009】
次に、本発明の一実施例を説明する。例えばアンケートなどで以下のA〜Eの回答文書を得て、概念表現生成によって分析する場合を想定する。以下、この実施例の概念表現生成過程について説明する。
A:ドライバをインストールできない。
B:ドライバのインストールができない。
C:ドライバをインストールすることができない。
D:ドライバはインストールできた。
E:ドライバをインストールできなくもない。
まず、このようなそれぞれのテキスト文書を言語解析し、図5に示したようなテキストデータ構造へ変換する。なお、図5の文節構造リスト例において、bの後続数字は文節番号、「・」は単語や品詞の切れ目を表わす(図6以下、同様)。単語列および品詞列は、処理上は、単語ID(識別符号)、品詞番号列などで処理可能である。
次に、文書ID毎に、文節の先頭から順に図4に示した辞書を参照・比較し、表現パターンが一致した文節に対して、対応する意図表現をテキストデータ構造中の当該文節情報に付加する。なお、表現パターンが特定パターンだった場合(図4参照)、当該対象文節へ意図表現を付与すると同時に、その対象文節への係り文節を参照し、その文節構成要素に形式名詞が含まれていなかった場合、その係り文節へも意図表現を付与する。もし、形式名詞が含まれていた場合は、その係り文節の、そのまた係り文節へ意図表現を付与する。これにより、前記文書A〜Eには、図6〜図7に示したように意図表現が付与される。なお、図6(a)の意図表現については、「でき」が補助動詞「できる」可能にマッチし、「ない」が助動詞「ない」打消にマッチする。
また、図6(b)では、「でき」が動詞「できる」可能にマッチし、「ない」が助動詞「ない」打消にマッチし、動詞「できる」が特定パターンであるので、係り文節b2を参照し、b2に形式名詞が含まれないので係り文節b2にも同様の意図表現を付加する。また、図6(c)では、「でき」が動詞「できる」可能にマッチし、「ない」が助動詞「ない」打消にマッチし、動詞「できる」が特定パターンであるので、係り文節b3を参照し、b3に形式名詞が含まれるので、b3の係り文節b2にも同様の意図表現を付加する。また、図7(d)では、「でき」が補助動詞「できる」可能にマッチする。また、図7(e)では、「でき」が補助動詞「できる」可能にマッチし、「なく」が助動詞「ない」打消にマッチし、形容詞「ない」打消にマッチし、形容詞「ない」が特定パターンであるので、係り文節b2にも同様の意図表現を付加する。
【0010】
意図表現設定の動作フローを図8に示す。以下、図8に従って、この動作フローを説明する。
まず、意図表現設定部6が、テキストデータ構造記憶部5から対象テキストの文節構造リスト(図5参照)を取り出し、各文節を構成する単語の表記および品詞(図5参照)を文節先頭から文節ID順に文節バッファに書き込む(S1)。そして、図4に例示されているような意図表現パターン辞書とのマッチング処理をおこなう(S2)。マッチングキーは少なくとも1単語あたり表記と品詞を用いる。その結果、マッチしなかったならば(S3でN)、文節バッファを空にし(S4)、次の文節があるならば(S5でY)、次の文節についてステップS1から繰り返す。
一方、ステップS3においてマッチした場合は(S3でY)、マッチした表現パターンが自立語の特定パターン(図4参照)か否かを判定する(S7)。そして、特定パターンであれば(S7でY)、係り文節があるか否かを判定し(S8)、係り文節があれば(S8でY)、その文節の自立語が形式名詞か否かを判定する(S9)。こうして、形式名詞であると判定されたならば(S9でY)、その文節への連体修飾(係り)文節があるか否かを判定し(S10)、あれば(S10でY)当該意図表現(図4参照)をテキストデータ構造(文節構造リスト)中のその連体修飾文節の意図表現の項に付加(設定)し(S11)、さらに、その意図表現をテキストデータ構造中のマッチ文節(S3においてマッチした文節)の意図表現の項に付加する(S13)。
それに対して、ステップS9において形式名詞でないと判定された場合(S9でN)、およびステップS10において連体修飾文節がないと判定された場合(S10でN)は、当該意図表現をテキストデータ構造中の当該係り文節の意図表現の項に付加し(S12)、さらに、その意図表現をテキストデータ構造中のマッチ文節(S3においてマッチした文節)の意図表現の項に付加する(S13)。また、ステップS7において特定パターンでないと判定された場合には(S7でN)、当該意図表現をテキストデータ構造中のマッチ文節(S3においてマッチした文節)の意図表現の項のみに付加する(S13)。
こうして、ステップS13が終了すると、次の文節があるか否かを判定し(S5)、あれば(S5でY)ステップS1から繰り返し、なければ(S5でN)テキストデータ構造記憶部5に記憶されている内容を意図表現の付加された内容に更新する(S6)。
次に、意図表現を用いて概念候補を生成する。概念表現には、単語の概念を扱う表現と、意図概念を扱う表現がある。本発明では、意図概念を扱う表現に主題を置くので、この実施例においては、意図概念の生成について説明する。単語の概念を扱う表現には言及しないが、例えば、単語の概念とその単語が属する文節に対して付与された意図表現とから、「単語概念+意図概念」という組み合わせの概念ももちろん生成できるので、その概念表現についても例示する。
【0011】
図9〜図10は、文書A〜Eに対して、文節に付与された意図表現から、文書の概念候補生成をおこなった例である。なお、図9(a)において、概念候補の項の左側の概念候補は「単語概念+意図概念」、右側の概念候補は「意図概念」、つまりカッコ外が単語概念でカッコ内が意図概念である(以下、同様)。また、この実施例では、各文節の意図表現ごとに意図表現の付加回数を数えるが、図10(e)の例ではb3の意図表現がb2にも付加されるので、b2の意図表現の数は、「+打消」が2つと偶数である。そこで、「+打消+打消」を「−打消」と変換する。
以上の処理で、文書A〜Eの文書群に対する、意図表現を利用した概念表現の生成が終了する。概念表現生成部8は生成した概念表現候補を概念表現記憶部9に記憶し、利用者が分析を行なう際、指定や呼び出しに応じて出力部10により記憶されている概念表現候補を表示装置などへ出力する。そして、利用者は、前記した例で「インストールに否定」的な意図の文書を集めてカテゴリを作成したいと考えた場合、表示された概念候補のなかから選択することにより概念「インストール(+打消)」の文書を検索する。こうして、文書A、B、Cにおいて、「インストール否定」カテゴリが生成される。
【0012】
概念表現生成の動作フローを図11に示す。以下、図11に従って、この動作フローを説明する。
まず、概念表現生成部8が、対象テキストの意図表現付加後の文節構造リストをテキストデータ構造記憶部5から取り出し、文節先頭から文節ID順に意図表現およびその文節の単語(形式名詞を含まない自立語のみ)(図9〜10参照)を意図情報バッファに書き込む(S21)。そして、文節ごとに打消意図の意図表現の数を数え(S22)、その数が偶数か否かを判定し(S23)、偶数であれば(S23でY)、複数個記載の打消意図を1個の肯定意図記載に変換する(S24)。図10(e)に示したように、「+打消+打消」であれば「−打消」というように変換するのである。
続いて、変換後の意図表現と単語の繋ぎ合わせ処理などをおこなって、概念候補(概念表現候補)を生成する(S25)。例えば、まず単語を記載し、その後に両端をカッコした意図表現を記載する(図9〜10参照)。この際、動詞は終止形に変換するというように、語尾変化のある単語については基本形にする。なお、概念候補は、単に意図表現だけの項も生成する(図9〜10参照)。
最後に、概念表現生成部8は概念候補を付加した文節構造リストを概念表現記憶部9に格納する(S26)。
【0013】
ところで、利用者が、文書A〜Eの文書から例えば「インストールの可否の統計を取りたい」と考えて、「可能(不可能は除く)」に言及している文書を抽出しようというとき、前記した実施例ではまず「可能」の文書カテゴリを生成し、そこから部分カテゴリ「+可能+打消」を作成し、「+可能」カテゴリと「+可能+打消」カテゴリの差分をとる必要があり、手間がかかる。
そこで、そのような場合には、予め意図表現が付いていないことを明示するようにする。例えば、「インストール(+可能−打消)」という概念を生成すれば、いくつもカテゴリを作成して差分を取るなどの手間なしに、打消表現の付かない可能だけの表現をもつ文書カテゴリを1回の検索で得ることが可能となるのである。そのため、具体的には、各文節に付与されなかった意図表現を概念生成時にマイナス表示などにより明示させる。例えば文書Dでは、意図表現が「+可能」のみであるが、「打消表現の有無を明示させる」機能を用いて、図12に示したような概念候補を追加生成するのである。
意図表現が付いていないことを予め明示する機能は、予めデフォルトで設定しておいてもよいが、設定しないで、利用者が分析時に任意に起動してもよい。起動の方法は、選択ボタンやキーボード入力など既存の入力手段を用いれば実現可能である。この機能を用いれば、「インストール(+可能−打消)」という概念を持つ文書を検索すればよく、その結果、文書Dと文書Eとから成る「インストールが可能(不可能は除く)」の文書カテゴリを作成することができる。
【0014】
図13に、このような概念表現生成の動作フローを示す。以下、図13に従って、この動作フローを説明する。
まず、概念表現生成部8が、対象テキストの意図表現付加後の文節構造リストをテキストデータ構造記憶部5から取り出し、文節先頭から文節ID順に意図表現およびその文節の単語(形式名詞を含まない自立語のみ)を意図情報バッファに書き込む(S31)。
続いて、付加されていない意図表現があるか否かを判定する(S32)。例えば、「+可能」のみが付加された意図表現があるか否かを判定するのである。そして、あった場合には(S32でY)、その意図表現に「−(マイナス)記号」付きの意図表現、例えば「+可能」の後に「−打消」、「−要望」、「−疑問」というような意図表現を付加する(S33)。
次に、変換後の意図表現と単語の繋ぎ合わせ処理などをおこなって、概念候補(概念表現候補)を生成する(S34)。この際、動詞は終止形に変換するというように、語尾変化のある単語については基本形にする。概念候補としては、単に意図表現だけの項も生成する(図9〜10参照)。
最後に、概念表現生成部8は概念候補を付加した文節構造リストを概念表現記憶部9に格納する(S35)。
なお、図13に示した動作フローのステップS33とS34の間において、図11に示したステップS22〜S24を実行させる構成も可能である。
以上、図1に示したシステム構成の場合で説明したが、説明したような概念表現生成方法に従ってプログラミングしたプログラムを着脱可能な記憶媒体に記憶し、その記憶媒体をこれまで本発明によった概念表現生成をおこなえなかったパーソナルコンピュータなど情報処理装置に装着することにより、または、そのようなプログラムをネットワークを介してそのような情報処理装置へ転送することにより、そのような情報処理装置においても本発明によった概念表現生成をおこなうことができる。
【0015】
【発明の効果】
以上説明したように、本発明によれば、請求項1、9の発明では、対象とするテキストの概念表現を生成する際、テキストに対して少なくとも形態素解析および文節係り受け解析を含む言語解析をおこない、その言語解析結果に基づいてテキストを、少なくとも構成単語の表記、品詞、および係り受け情報を含む文節情報を有するテキストデータ構造に変換し、そのテキストデータ構造の文節情報を構成する単語の表記および品詞の並びが特定の表現パターンと一致した場合、その表現パターンに対応づけて記憶されている意図表現をそのテキストデータ構造の当該文節情報に対応づけて付加し、付加した意図表現を用いて概念表現を生成することができるので、テキストの内容を表現する有益な概念情報を低コストで表現できるし、利用者にわかりやすく、操作しやすい概念表現を実現できる。また、意図表現を付加する際、当該文節が、自立語そのものであり、特定の表現パターンと一致し、さらに、当該文節が受け文節になっている係り受け文節対が存在する場合、その係り受け文節対の係り文節の文節情報にも対応する意図表現が付加されるので、本来意図が付加されるべき係り文節にも意図表現を付加でき、したがって、文意に沿った概念表現を生成できる。
【0016】
また、請求項2、10記載の発明では、請求項2記載の発明において、表記および品詞の並びで構成される特定の表現パターン、および対応する意図表現を、ユーザインタフェースを介して参照、追加、修正、または削除が可能なテーブル形式で記憶する意図表現パターン辞書が用いられるので、利用者が任意にカスタマイズでき、利用者の意図に合った概念表現を生成できる。
また、請求項3、11記載の発明では、請求項10記載の発明において、係り受け文節対の係り文節を構成する自立語が形式名詞であった場合、当該係り文節が連体修飾関係で受け文節になっている係り受け文節対が存在したならば、形式名詞を含む文節の代わりにその係り受け文節対の係り文節の文節情報に対応する意図表現が付加されるので、本来意図が付加されるべきもうひとつ前の係り文節に意図表現を付加することができ、したがって、文意に沿った概念表現を生成できる。
【0017】
また、請求項4、12記載の発明では、請求項2記載の発明において、概念表現を生成する際、所定の意図表現が付加されなかった文節を検出し、その文節に所定の意図表現がつかなかったことを明示できるので、いくつもカテゴリを作成して差分を取ったりする手間をかけずに、意図表現の付かない表現も加味した高い表現力をもつ概念表現を生成できる。
また、請求項5、13記載の発明では、意図表現に少なくとも打消表現を含むので、打消の意図を概念表現に用いることが可能となる。また、意図表現に少なくとも可能表現を含むので、可能の意図を概念表現に用いることが可能となる。また、意図表現に少なくとも要望表現を含むので、要望の意図を概念表現に用いることが可能となる。また、意図表現に少なくとも疑問表現を含むので、疑問の意図を概念表現に用いることが可能となる。また、意図表現に少なくとも理由表現を含むので、理由の意図を概念表現に用いることが可能となる。
また、請求項6、14記載の発明では、当該文節の文節情報に打消の意の意図表現が偶数個付加された場合、その打消の意の意図表現が肯定の意の意図表現に変換されるので、利用者がこのような文法知識をもたなくても文意に沿った概念表現生成が可能となる。
また、請求項記載の発明では、請求項1乃至6のいずれか1項に記載の概念表現生成方法によった概念表現生成を実行させるようにプログラミングされているプログラムを情報処理装置上で実行できるので、情報処理装置を用いて請求項乃至のいずれか1項に記載の発明の効果を得ることができる。
また、請求項記載の発明では、請求項7に記載のプログラムを着脱可能な記憶媒体に記憶できるので、その記憶媒体をこれまで請求項乃至請求項のいずれか1項に記載の発明によった概念表現生成をおこなえなかったパーソナルコンピュータなど情報処理装置に装着することにより、そのような情報処理装置においても請求項乃至のいずれか1項に記載の発明の効果を得ることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態を示す概念表現生成システムの構成ブロック図。
【図2】本発明の実施の形態を示す概念表現生成システム要部のデータ構造図。
【図3】本発明の実施の形態を示す概念表現生成システム要部の他のデータ構造図。
【図4】本発明の実施の形態を示す概念表現生成システム要部のデータ構成図。
【図5】本発明の一実施例を示す概念表現生成システム要部のデータ構成図。
【図6】本発明の一実施例を示す概念表現生成システム要部の他のデータ構成図。
【図7】本発明の一実施例を示す概念表現生成システム要部の他のデータ構成図。
【図8】本発明の一実施例を示す概念表現生成システム要部の動作フロー図。
【図9】本発明の一実施例を示す概念表現生成システム要部の他のデータ構成図。
【図10】本発明の一実施例を示す概念表現生成システム要部の他のデータ構成図。
【図11】本発明の一実施例を示す概念表現生成システム要部の他の動作フロー図。
【図12】本発明の一実施例を示す概念表現生成システム要部の他のデータ構成図。
【図13】本発明の一実施例を示す概念表現生成システム要部の他の動作フロー図。
【符号の説明】
1 入力部、2 言語解析部、3 言語解析用辞書、4 テキストデータ構造生成部、5 テキストデータ構造記憶部、6 意図表現設定部、7 意図表現パターン辞書、8 概念表現生成部、9 概念表現記憶部、10 出力部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a concept expression generation technique that can be used in a document processing system such as a document search system, a document classification system, and a document analysis system, which is realized on an information processing apparatus such as a personal computer.
[0002]
[Prior art]
In recent years, text mining techniques aimed at analyzing a large amount of text data such as questionnaire data and call center data have attracted attention. When performing such an analysis, extracting characteristic conceptual information included in the document set is one of the major issues.
Research on information extraction technology including concept information extraction is progressing as a method of finding some knowledge from a large amount of document data. If useful information expressing the subject, topic, writer's intention, etc. of the document can be extracted from the document, applications such as document search, document classification, document analysis based on them can be realized. Extraction information useful to users is a concept that is extracted from a document with an arbitrary scale of the user, but there is a need for technology to extract and express these accurately as intended by the user. .
Conventionally, a characteristic concept of a document is based on a surface expression such as a phrase having a frequency of occurrence of a predetermined value or more, a phrase group, a so-called keyword or a plurality of co-occurring keyword groups, an AND or OR logical expression using the keyword, and the like. It was often expressed. For example, in the conventional technique described in Japanese Patent Laid-Open No. 8-30627, a keyword extraction technique for keyword extraction in expressing a characteristic concept of a document is presented. In the conventional technique disclosed in Japanese Patent Laid-Open No. 2000-067054, In order to express the feature concept of the document, words whose appearance frequency is a predetermined value or more are extracted. In the prior art disclosed in Japanese Patent Laid-Open No. 2001-290826, it is expressed by a logical operation expression of a specific word.
However, in the method of expressing by co-occurrence information of one or a plurality of keywords, logical expressions of a plurality of keywords, etc., for example, when searching for a document group including the concept of “OS installation”, “OS” & The logical expression of the keyword “install” is used as a conceptual expression. In this case, a document “OS cannot be installed” (conforms to the concept) is also a document “OS is Win95, but driver cannot be installed”. It has become clear that there is a problem that the search accuracy is adversely affected and there is a limit to the concept description.
Furthermore, the concept desired by the user is not necessarily a word that appears frequently. For example, if you want to express a concept in terms of possible and impossible for a document that includes a sentence that can be installed and a document that includes a sentence that cannot be installed, the conventional keywords In concept generation by, the same concept is processed. In this way, cases that cannot be covered by keyword extraction based on frequency have been clarified.
[0003]
In view of this, methods have been proposed in which the relationship between words is extracted using the syntax information of the target document, or the intention of the document writer is extracted and used to generate a concept expression. For example, in the prior art disclosed in Japanese Patent Application Laid-Open No. 5-265760, a specific propositional relationship such as a causal relationship obtained as a result of syntax analysis is converted into a knowledge representation in the form of structural knowledge of a clause with a structure tag. , Conceptual expression. This representation method is a powerful representation method when the relationship between propositions becomes clear and the viewpoints of the users agree. However, since this knowledge representation is in the form of phrase structure knowledge over multiple lines, there is a problem that it is difficult to overview these concept groups unless the user has language knowledge. Furthermore, there is a problem that it is difficult to describe the combination of concepts because of the structure.
Further, in the prior art disclosed in Japanese Patent Laid-Open No. 2000-172691, a specific independent word obtained as a result of dependency analysis and a sentence structure with tense / aspect / modality information are used as processing units. However, this conventional technique has a problem in reproducibility because there is no description of a specific method regarding acquisition of tense, aspect, and modality information. In the prior art disclosed in Japanese Patent Application Laid-Open No. 2001-075966, keywords are replaced with concept expressions, and further, as a result of syntax analysis, concept expressions are performed in the form of combinations of concepts that are in a dependency relationship or concepts + evaluation labels. . This evaluation label includes an intention to cancel, and it is possible to distinguish between possible and impossible concepts as in the previous example. As described above, the concept expression method is abundant, but a dictionary for concept conversion is necessary, and the construction of this dictionary has a problem that the cost is high as described above.
In the prior art disclosed in Japanese Patent Laid-Open No. 2001-84250, a target document is parsed, and a word-word relational syntax tree or a linear list obtained as a result plays a role of concept expression. Since concepts are expressed in the form of a word-to-word relational syntax tree, it is possible to generate concepts that are richer in information and less trash than words. However, since a conversion dictionary is required to unify the notation and the expression method is a syntax tree or linear list as a knowledge pattern, it is difficult for users who are unfamiliar with such expressions, and the data overview is also difficult. There is a problem that it is difficult to perform operations such as combinations of extracted concepts.
[Patent Document 1]
JP-A-8-30627
[Patent Document 2]
JP 2000-067054 A
[Patent Document 3]
JP 2001-290826 A
[Patent Document 4]
JP-A-5-265760
[Patent Document 5]
JP 2000-172691 A
[Patent Document 6]
Japanese Patent Laid-Open No. 2001-075966
[Patent Document 7]
JP 2001-84250 A
[0004]
[Problems to be solved by the invention]
As described above, the prior art requires high cost to extract useful conceptual information that expresses the contents of the text document from the text document, the concept expression is difficult for the user to understand, or the concept expression is manipulated. There was a problem that it was difficult to do.
An object of the present invention is to solve such a problem of the prior art. Specifically, useful conceptual information that expresses the contents of the text document is extracted from the text document at a low cost, and is provided to the user. It is an object of the present invention to provide a concept expression generation technique capable of realizing an easy-to-understand and easy to operate concept expression. In particular, according to the present invention, there is provided a concept expression generation method capable of extracting various intention expressions of a writer from phrase information and inter-phrase relation information obtained from a result of language analysis performed on a text, and expressing the concept using the expression. provide. Thus, the user can easily overview the concepts included in the text without special grammar knowledge, and can easily perform operations such as concept search, concept expansion, and narrowing down.
[0005]
[Means for Solving the Problems]
  In order to solve the above-mentioned problem, in the invention according to claim 1,A concept expression generation method executed in a concept expression generation system including a storage unit that stores an intention expression pattern dictionary and a control unit, wherein the intention expression pattern dictionary includes a word notation, a part of speech of the word, An intention expression pattern associated with an intention expression of a word and a flag indicating whether the intention expression pattern is a specific intention expression pattern are associated with each other and stored for each word. An input step for receiving an input of text, and a language analysis step for executing a morphological analysis and a dependency analysis of a phrase unit constituting the text with respect to the text received in the input step;Based on the language analysis result obtained in the language analysis step, for each clause constituting the text, phrase information including notation and part of speech of words included in the clause and dependency information of the clause A phrase information generation step to generate;It is determined whether a word included in the phrase information of each phrase matches an intention expression pattern stored in the intention expression pattern dictionary. If it is determined to match, the word is stored in association with the intention expression pattern. An intention expression setting step of adding the intended expression to the phrase information of the clause determined to match, and a concept expression generation step of generating a concept expression of each clause using the intention expression added to the phrase information In the intention expression setting step, the intention expression pattern determined to match the intention expression pattern stored in the intention expression pattern dictionary is a specific intention expression pattern, and the specific intention expression pattern Is a specific pattern of independent words, and there is a dependency phrase pair in which the phrase determined to match is a reception phrase In case, also clause information of the dependency clause pair relates clause, and executes the adding the added intention representation in clause information of the determined phrase with the consistent.
  Claims2In the described invention, the intention expression pattern dictionary is stored in a table format in which the intention expression pattern can be referred to, added, modified, or deleted.
  In the invention according to claim 3,The intention expression setting step further includes:The independent words constituting the dependency clauses of the dependency clause pair are formal nouns.AndThe concernedDependent clause pairWhen a dependency clause is a receiving clause in a linkage modification relationshipIn addition, in the clause information of the dependency clause of the dependency clause pair, an intention expression corresponding to the clause information of the dependency clause in the linkage modification relationship is added.It is characterized by adding.
  In the invention according to claim 4,The concept expression generation step further includes:Detect clauses with no intention expression added,ConcernedIt is characterized by clearly indicating that a predetermined intention expression was not attached to the phrase.
  The invention according to claim 5 is characterized in that the intention expression includes any one of cancellation expression, possible expression, request expression, question expression, and reason expression.
  In the invention according to claim 6,The concept expression generation step includes:In the case where an even number of intention expressions for canceling are added to the phrase information of the phrase, the intention expression for canceling is converted into an intention expression for positive.
  According to a seventh aspect of the present invention, in a program executed on the information processing apparatus,1Thru6It is programmed to execute concept expression generation by the concept expression generation method described in any one of the above.
  Further, in the invention described in claim 8, the storage medium storing the program claims7The described program is stored.
[0006]
  In the invention according to claim 9,A concept expression generation apparatus executed in a concept expression generation system comprising a storage means for storing an intention expression pattern dictionary and a control means, wherein the intention expression pattern dictionary includes word notation, part of speech of the word, An intention expression pattern associated with an intention expression of a word and a flag indicating whether the intention expression pattern is a specific intention expression pattern are associated with each other and stored for each word. Obtained by input means for receiving text input, language analysis means for executing morphological analysis and dependency analysis of the phrase units constituting the text on the text received by the input means, and the language analysis means Based on the obtained linguistic analysis results, for each clause constituting the text, the word notation and part of speech included in the clause, and the clause Clause information generating means for generating clause information including dependency information, and determining whether a word included in the clause information of each clause matches an intention expression pattern stored in the intention expression pattern dictionary. If it is determined, the intention expression setting means for adding the intention expression stored in association with the intention expression pattern to the phrase information of the phrase determined to match, and added to the phrase information. A concept expression generating unit that generates a concept expression of each clause using the intention expression, and the intention expression setting unit is further determined to match the intention expression pattern stored in the intention expression pattern dictionary A sentence in which the pattern is a specific intention expression pattern and the specific intention expression pattern is a specific pattern of independent words and is determined to match When there is a dependency clause pair in which is a receiving clause, the intention expression added to the clause information of the clause determined to match is also added to the clause information of the dependency clause of the dependency clause pair. It is characterized by performing.
  In the invention according to claim 10,The intention expression pattern dictionary is stored in a table format in which the intention expression pattern can be referred to, added, modified, or deleted..
  In the invention according to claim 11,The intention expression setting means further includes a case where the independent word constituting the dependency clause of the dependency clause pair is a formal noun, and the dependency clause of the dependency clause pair is a reception clause in a linkage modification relationship. The intention expression corresponding to the clause information of the dependency clause is added to the clause information of the dependency clause of the dependency clause pair in the linkage modification relationship..
  In the invention according to claim 12,The concept expression generation means further detects a phrase to which no intention expression is added, and clearly indicates that the predetermined intention expression has not been added to the phrase..
  In the invention according to claim 13,The intention expression includes any one of cancellation expression, possible expression, request expression, question expression, and reason expression..
  In the invention according to claim 14,The conceptual expression generation means converts an intention expression of intention to cancel to an intention expression of positive meaning when an even number of intention expressions to cancel is added to the phrase information of the phrase..
[0007]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a block diagram showing the configuration of a concept expression generation system according to an embodiment of the present invention. As shown in the figure, this conceptual expression generation system includes an input unit 1, a language analysis unit 2, a language analysis dictionary 3, a text data structure generation unit 4, a text data structure storage unit 5, an intention expression setting unit 6, an intention expression pattern. A dictionary 7, a concept expression generation unit 8, a concept expression storage unit 9, and an output unit 10 are provided. In this case, the language analysis unit, the text data structure generation unit, the intention expression setting unit, and the concept expression generation unit described in claim 1 are the language analysis unit 2, the text data structure generation unit 4, and the intention expression setting unit 6, respectively. And the concept expression generation unit 8.
The input unit 1, the language analysis unit 2, the text data structure generation unit 4, the intention expression setting unit 6, the concept expression generation unit 8, and the output unit 10 include a memory storing a program and a CPU that operates according to the program. The language analysis dictionary 3, the text data structure storage unit 5, and the intention expression pattern dictionary 7 are realized by using, for example, a part of a hard disk storage device as a storage area. The input means for the input unit 1 to perform input processing is, for example, a keyboard or a voice input device, and the output means of the other party to which the output unit 10 performs output processing is, for example, a display device or a voice output device.
The language analysis unit 2 performs at least morphological analysis and dependency analysis. Morphological analysis is a process that separates text into words and adds attributes of each word such as part of speech. The principle is detailed in “Japanese Information Processing / Chapter 4 Morphological Analysis”. Use existing methods such as method, minimum cost method, and example search method. Dependency analysis is a process that generates clauses that are one unit of dependency processing and identifies the relationship between clauses and clauses. The principle is "Japanese information processing / Chapter 5 Syntax analysis" , “The Japanese syntax analysis based on the dependency between two phrases” (Yoshida) is used.
In general, a phrase is composed of one independent word and zero or more attached words, and depending on the analysis method, there is a way to define a result that includes a plurality of independent words in one phrase. An analysis method for generating a phrase is used so that the phrase always includes only one independent word.
[0008]
FIG. 2 shows an example of the structure of the text data structure, and FIG. 3 shows an example of information managed by each component of the text data structure. Information obtained by the language analysis is converted into a text data structure as shown in FIG. 2 in the text data structure generation unit 4 and stored. The constituent elements of the text data structure are a text, a sentence, a clause, and a word in order from the top (see FIG. 2). As shown in FIG. 3, for example, the phrase information includes not only word information constituting the phrase, but also related phrase information related to the phrase, previous received phrase information related to the phrase, intention expression, and the like.
The intention expression is an expression indicating an intention in a phrase, and can be determined mainly by an expression pattern of a phrase constituent word such as an auxiliary verb. For example, the expression pattern of “~ not (auxiliary verb)” and “~ z (auxiliary verb)” has an intention of “cancellation”, and the expression pattern of “to be able to (auxiliary verb)” has an intention of “possible”. It can be determined that the expression pattern "auxiliary verb") adds the intention of "request", and the expression pattern "~ so (connection particle)" adds the intention of "reason" to the phrase. At the end of language analysis, the intention expression is not set yet. Thereafter, a phrase that matches the expression pattern of the intention expression is extracted from the phrase by the intention expression setting unit 6, and a predetermined intention expression registered in advance in association with the phrase is stored in the text data structure storage unit 5. It is added.
FIG. 4 is a description example of the intention expression pattern dictionary. As illustrated, an intention expression pattern dictionary including an expression pattern and a corresponding intention expression is stored in advance in a table format that can be referred to, added, modified, or deleted via a user interface. In the intention expression extraction, the clauses are sequentially read, and matching processing with an intention expression pattern dictionary as illustrated in FIG. 4 is performed. The matching key uses at least a notation and part of speech per word. Then, the intention expression (see FIG. 4) is added to the target clause, depending on the dependency clause in some cases, and further to the dependency clause to the clause, depending on the expression pattern when matched, and the text data structure storage The contents stored in the unit 5 are updated.
[0009]
Next, an embodiment of the present invention will be described. For example, it is assumed that the following answer documents A to E are obtained by a questionnaire or the like and analyzed by concept expression generation. The concept expression generation process of this embodiment will be described below.
A: The driver cannot be installed.
B: The driver cannot be installed.
C: The driver cannot be installed.
D: The driver was installed.
E: The driver cannot be installed.
First, each of such text documents is subjected to language analysis and converted into a text data structure as shown in FIG. In the example of the phrase structure list in FIG. 5, the subsequent number of “b” represents a phrase number, and “·” represents a break between words or parts of speech (the same applies to FIG. 6 and subsequent figures). The word string and the part-of-speech string can be processed with a word ID (identification code), a part-of-speech number string, and the like.
Next, for each document ID, the dictionary shown in FIG. 4 is referred to in order from the beginning of the phrase, and the corresponding intention expression is added to the corresponding phrase information in the text data structure for the phrase whose expression pattern matches. To do. If the expression pattern is a specific pattern (see FIG. 4), an intention expression is given to the target phrase, and at the same time, a related phrase to the target phrase is referred to, and no formal noun is included in the phrase component. If this happens, an intention expression is also given to the related clause. If a formal noun is included, an intention expression is assigned to the relevant clause. Thereby, intention expressions are given to the documents A to E as shown in FIGS. In the intention expression of FIG. 6A, “do” matches the auxiliary verb “can” and “no” matches the auxiliary verb “no” cancellation.
Also, in FIG. 6B, “done” matches the verb “can”, “no” matches the auxiliary verb “no” cancellation, and the verb “done” is a specific pattern, so the dependency phrase b2 is changed. Since b2 does not include a formal noun, a similar intention expression is added to the related phrase b2. Further, in FIG. 6C, “Done” matches the verb “can”, “No” matches the auxiliary verb “No” cancellation, and the verb “Done” is a specific pattern. Since a formal noun is included in b3, a similar intention expression is added to the related phrase b2 of b3. Further, in FIG. 7D, “done” matches with the auxiliary verb “done” possible. Further, in FIG. 7E, “done” matches the auxiliary verb “can”, “n” matches the auxiliary verb “none” cancellation, adjective “none” cancellation, and adjective “none” Since it is a specific pattern, a similar intention expression is also added to the dependency clause b2.
[0010]
FIG. 8 shows an operation flow of intention expression setting. Hereinafter, this operation flow will be described with reference to FIG.
First, the intention expression setting unit 6 retrieves the phrase structure list (see FIG. 5) of the target text from the text data structure storage unit 5, and displays the notation and part of speech (see FIG. 5) of each word constituting the phrase from the beginning of the phrase. Write to the phrase buffer in ID order (S1). Then, matching processing with an intention expression pattern dictionary as exemplified in FIG. 4 is performed (S2). The matching key uses at least a notation and part of speech per word. As a result, if there is no match (N in S3), the clause buffer is emptied (S4), and if there is a next clause (Y in S5), the next clause is repeated from step S1.
On the other hand, if there is a match in step S3 (Y in S3), it is determined whether or not the matched expression pattern is a specific pattern of independent words (see FIG. 4) (S7). If it is a specific pattern (Y in S7), it is determined whether or not there is a related phrase (S8). If there is a related phrase (Y in S8), it is determined whether or not the independent word of the phrase is a formal noun. Determine (S9). Thus, if it is determined that it is a formal noun (Y in S9), it is determined whether or not there is a combined modification (relationship) phrase to that phrase (S10), and if there is (Y in S10), the intention expression (See FIG. 4) is added (set) to the term of the intention expression of the linkage modification clause in the text data structure (phrase structure list) (S11), and the intention representation is further matched with the match clause (S3) in the text data structure. Is added to the term of intention expression of the phrase matched in (S13).
On the other hand, if it is determined in step S9 that it is not a formal noun (N in S9), and if it is determined in step S10 that there is no link modification clause (N in S10), the intention expression is included in the text data structure. Is added to the intention expression term of the relevant clause (S12), and the intention representation is added to the intention expression term of the matching clause (the clause matched in S3) in the text data structure (S13). If it is determined in step S7 that the pattern is not a specific pattern (N in S7), the intention expression is added only to the intention expression item of the match clause (the clause matched in S3) in the text data structure (S13). ).
Thus, when step S13 is completed, it is determined whether or not there is a next phrase (S5). If there is (Y in S5), the process is repeated from step S1, and if not (N in S5), stored in the text data structure storage unit 5. The content that has been added is updated to the content with the intention expression added (S6).
Next, a concept candidate is generated using the intention expression. Conceptual expressions include expressions that handle the concept of words and expressions that handle the concept of intention. In the present invention, since the subject matter is an expression that handles an intention concept, in this embodiment, generation of an intention concept will be described. Although we do not mention expressions that deal with word concepts, for example, it is possible to generate a combined concept of “word concept + intention concept” from the concept of word and the intention expression assigned to the phrase to which the word belongs. The concept expression is also illustrated.
[0011]
9 to 10 are examples in which document concept candidates are generated from the intention expressions given to the clauses for the documents A to E. FIG. 9A, the concept candidate on the left side of the concept candidate section is “word concept + intention concept”, the concept candidate on the right side is “intention concept”, that is, the word concept outside the parentheses and the intention concept inside the parentheses. Yes (hereinafter the same). In this embodiment, the number of additions of intention expressions is counted for each intention expression of each clause, but in the example of FIG. 10E, the intention expression of b3 is also added to b2, so the number of intention expressions of b2 Is an even number with two “+ cancellations”. Therefore, “+ cancel + cancel” is converted to “−cancel”.
With the above processing, the generation of the concept expression using the intention expression for the documents A to E is completed. The concept expression generation unit 8 stores the generated concept expression candidates in the concept expression storage unit 9, and when the user performs analysis, the concept expression candidates stored in the output unit 10 according to designation or call are displayed on a display device or the like. Output to. When the user wants to create a category by collecting documents with an intention of “negative to installation” in the above-described example, the user selects the concept “install (+ cancellation) by selecting from the displayed concept candidates. ) "Document. Thus, in the documents A, B, and C, an “installation denied” category is generated.
[0012]
FIG. 11 shows an operation flow of concept expression generation. The operation flow will be described below with reference to FIG.
First, the concept expression generation unit 8 extracts the phrase structure list after adding the intention expression of the target text from the text data structure storage unit 5, and the intention expression and the words of the phrase (independently including no formal nouns) in the order of the phrase ID from the beginning of the phrase. (Word only) (see FIGS. 9 to 10) is written in the intention information buffer (S21). Then, the number of intention expressions for canceling intention is counted for each phrase (S22), and it is determined whether or not the number is even (S23). It converts into a positive intention description (S24). As shown in FIG. 10E, if “+ cancellation + cancellation”, conversion is made as “−cancellation”.
Subsequently, a concept candidate (concept expression candidate) is generated by performing a process of joining the intention expression after conversion and a word (S25). For example, a word is described first, and then an intention expression in which both ends are parenthesized is described (see FIGS. 9 to 10). At this time, the verb is changed to the final form, and the word having a ending change is made the basic form. Note that the concept candidate also generates a term that is merely an intention expression (see FIGS. 9 to 10).
Finally, the concept expression generation unit 8 stores the phrase structure list to which the concept candidates are added in the concept expression storage unit 9 (S26).
[0013]
By the way, when the user wants to extract a document referring to “possible (except impossible)” from the documents A to E, for example, when he / she wants to collect “statistics on whether installation is possible”, In the embodiment described above, it is necessary to first generate a document category of “possible”, create a partial category “+ possible + cancellation” therefrom, and take a difference between the “+ possible” category and the “+ possible + cancellation” category, It takes time and effort.
Therefore, in such a case, it is clearly indicated that no intention expression is attached in advance. For example, if the concept of “installation (+ possible−cancellation)” is generated, a document category having only a possible expression without cancellation expression can be obtained once without creating a number of categories and taking a difference. It becomes possible to obtain by searching. Therefore, specifically, an intention expression that is not given to each clause is clearly indicated by a minus display or the like when the concept is generated. For example, in the document D, the intention expression is only “+ possible”, but the concept candidate as shown in FIG. 12 is additionally generated by using the function of “specify presence / absence of cancellation expression”.
The function of clearly indicating that no intention expression is attached may be set in advance by default, but may be arbitrarily activated by the user during analysis without being set. The activation method can be realized by using existing input means such as a selection button or keyboard input. If this function is used, a document having the concept of “installation (+ possible−cancellation)” may be searched, and as a result, an “installable (except impossible)” document composed of document D and document E is obtained. Categories can be created.
[0014]
FIG. 13 shows an operation flow of such concept expression generation. The operation flow will be described below with reference to FIG.
First, the concept expression generation unit 8 extracts the phrase structure list after adding the intention expression of the target text from the text data structure storage unit 5, and the intention expression and the words of the phrase (independently including no formal nouns) in order of the phrase ID from the beginning of the phrase. (Word only) is written into the intention information buffer (S31).
Subsequently, it is determined whether there is an intention expression that is not added (S32). For example, it is determined whether or not there is an intention expression to which only “+ possible” is added. If there is (Y in S32), the intention expression with “− (minus) sign” added to the intention expression, for example, “+ possible” followed by “−cancellation”, “−request”, “−question”. The intention expression is added (S33).
Next, a concept candidate (concept expression candidate) is generated by performing a process of connecting the intention expression after conversion and the word (S34). At this time, the verb is changed to the final form, and the word having a ending change is made the basic form. As a concept candidate, a term of only an intention expression is also generated (see FIGS. 9 to 10).
Finally, the concept expression generation unit 8 stores the phrase structure list to which the concept candidates are added in the concept expression storage unit 9 (S35).
A configuration in which steps S22 to S24 shown in FIG. 11 are executed between steps S33 and S34 in the operation flow shown in FIG. 13 is also possible.
As described above, in the case of the system configuration shown in FIG. 1, the program programmed according to the concept expression generation method as described above is stored in a removable storage medium, and the storage medium is the concept according to the present invention so far. This information processing apparatus can be installed in an information processing apparatus such as a personal computer that cannot generate an expression, or by transferring such a program to such an information processing apparatus via a network. It is possible to generate a concept expression according to the invention.
[0015]
【The invention's effect】
  As described above, according to the present invention, the claims1, 9In the present invention, when generating a conceptual expression of the target text, language analysis including at least morphological analysis and clause dependency analysis is performed on the text, and the text is expressed based on the result of the language analysis, at least as a constituent word. , Part of speech, and conversion to a text data structure having clause information including dependency information. If the word notation and part-of-speech arrangement constituting the clause information of the text data structure match a specific expression pattern, the expression pattern It is useful to express the contents of the text because the intention expression stored in association with can be added in association with the relevant clause information of the text data structure, and the concept expression can be generated using the added intention expression. Simple concept information can be expressed at low cost, and user-friendly and easy-to-operate concept expression can be realized.Also,When adding an intention expression, if there is a dependency phrase pair in which the phrase is an independent word, matches a specific expression pattern, and the phrase is a reception phrase, the dependency phrase pair Since the intention expression corresponding to the phrase information of the related phrase is also added, the intention expression can be added to the related phrase to which the intention should be originally added, and thus a conceptual expression in accordance with the meaning of the sentence can be generated.
[0016]
  Claims2, 10In the described invention, in the invention described in claim 2, a specific expression pattern composed of a notation and a part of speech part and a corresponding intention expression can be referred to, added, modified, or deleted through a user interface. Since an intention expression pattern dictionary stored in a table format is used, a user can arbitrarily customize the dictionary and generate a concept expression suitable for the user's intention.
  Claims3, 11In the described invention, in the invention described in claim 10, when the self-supporting word constituting the dependency clause of the dependency clause pair is a formal noun, the dependency clause is a reception clause due to the combination modification relationship. If there is a pair, an intention expression corresponding to the clause information of the dependency clause of the dependency clause pair is added instead of the clause containing the formal noun, so the previous dependency clause to which the intention should be originally added is added. It is possible to add an intention expression to the object, and thus it is possible to generate a concept expression in line with the meaning of the sentence.
[0017]
  Claims4, 12In the described invention, in the invention described in claim 2, when the concept expression is generated, the phrase to which the predetermined intention expression is not added is detected, and it can be clearly indicated that the predetermined intention expression has not been added to the phrase. It is possible to generate a conceptual expression having high expressive power that takes into account expressions without intention expressions without taking the time and effort of creating a number of categories and taking differences.
  Claims5, 13In the described invention, since the intention expression includes at least the cancellation expression, the intention of cancellation can be used for the conceptual expression.Moreover, since at least possible expression is included in the intention expression, the possible intention can be used for the conceptual expression. In addition, since the intention expression includes at least the desired expression, the desired intention can be used for the conceptual expression. In addition, since the intention expression includes at least the question expression, the intention of the question can be used for the concept expression. In addition, since the intention expression includes at least a reason expression, the intention of the reason can be used for the concept expression.
  Claims6, 14In the described invention, when an even number of intention intentions to cancel is added to the phrase information of the corresponding phrase, the intention expression of intention to cancel is converted to an intention expression of positive intention. This makes it possible to generate conceptual expressions in line with literary meaning without having sufficient grammatical knowledge.
Claims7In the described invention, since the program programmed to execute the concept representation generation by the concept representation generation method according to any one of claims 1 to 6 can be executed on the information processing apparatus. Claim using device1Thru6The effect of the invention described in any one of the above can be obtained.
  Claims8In the described invention, the claims7Since the described program can be stored in a removable storage medium, the storage medium has been claimed so far.1To claims6The information processing apparatus can also be attached to an information processing apparatus such as a personal computer that has not been able to generate a concept representation according to the invention described in any one of the above.1Thru6The effect of the invention described in any one of the above can be obtained.
[Brief description of the drawings]
FIG. 1 is a configuration block diagram of a concept expression generation system showing an embodiment of the present invention.
FIG. 2 is a data structure diagram of a main part of a concept expression generation system showing an embodiment of the present invention.
FIG. 3 is another data structure diagram of the main part of the concept expression generation system showing the embodiment of the present invention.
FIG. 4 is a data configuration diagram of the main part of the concept expression generation system showing the embodiment of the present invention.
FIG. 5 is a data configuration diagram of a main part of a concept expression generation system showing an embodiment of the present invention.
FIG. 6 is another data configuration diagram of the main part of the concept expression generation system showing an embodiment of the present invention.
FIG. 7 is another data configuration diagram of the main part of the concept expression generation system showing an embodiment of the present invention.
FIG. 8 is an operation flowchart of the main part of the concept expression generation system showing an embodiment of the present invention.
FIG. 9 is another data configuration diagram of the main part of the concept expression generation system showing an embodiment of the present invention.
FIG. 10 is another data configuration diagram of the main part of the concept expression generation system showing an embodiment of the present invention.
FIG. 11 is another operation flow diagram of the main part of the concept expression generation system showing an embodiment of the present invention.
FIG. 12 is another data configuration diagram of the main part of the concept expression generation system showing an embodiment of the present invention.
FIG. 13 is another operation flow diagram of the main part of the concept expression generation system showing an embodiment of the present invention.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 Input part, 2 language analysis part, 3 language analysis dictionary, 4 text data structure generation part, 5 text data structure storage part, 6 intention expression setting part, 7 intention expression pattern dictionary, 8 concept expression generation part, 9 concept expression Storage unit, 10 output unit

Claims (14)

意図表現パターン辞書を記憶する記憶手段と、制御手段とを備える概念表現生成システムにて実行される概念表現生成方法であって、
前記意図表現パターン辞書は、単語の表記、当該単語の品詞、当該単語の意図表現が対応付けられた意図表現パターンと、当該意図表現パターンが特定の意図表現パターンか否かを示すフラグとを対応付けて、それぞれの単語について記憶しており、
前記制御手段が、
テキストの入力を受け付ける入力ステップと、
前記入力ステップにて受け付けたテキストに対して、形態素解析及び当該テキストを構成する文節単位の係り受け解析を実行する言語解析ステップと、
前記言語解析ステップにて得られた言語解析結果に基づき、前記テキストを構成する個々の文節について、当該文節に含まれる単語の表記及び品詞と、当該文節の係り受け情報と、を含む文節情報を生成する文節情報生成ステップと、
各文節の前記文節情報に含まれる単語が、前記意図表現パターン辞書が記憶する意図表現パターンと一致するかを判定し、一致すると判定された場合には、当該意図表現パターンに対応付けて記憶されている意図表現を、当該一致すると判定された文節の文節情報に付加する意図表現設定ステップと、
前記文節情報に付加された意図表現を用いて、各文節の概念表現を生成する概念表現生成ステップとを実行し、
前記意図表現設定ステップはさらに、前記意図表現パターン辞書が記憶する意図表現パターンと一致すると判定された意図表現パターンが特定の意図表現パターンであり、かつ、当該特定の意図表現パターンが自立語の特定パターンであり、かつ、前記一致すると判定された文節が受け文節になっている係り受け文節対が存在する場合に、当該係り受け文節対の係り文節の文節情報にも、前記一致すると判定された文節の文節情報に付加された意図表現を付加することを実行すること、
を特徴とする概念表現生成方法。
A concept expression generation method executed in a concept expression generation system comprising a storage means for storing an intention expression pattern dictionary and a control means,
The intention expression pattern dictionary corresponds to a notation of a word, a part of speech of the word, an intention expression pattern associated with the intention expression of the word, and a flag indicating whether the intention expression pattern is a specific intention expression pattern. And remember about each word,
The control means is
An input step for accepting text input;
A language analysis step for executing morphological analysis and dependency analysis of the phrase unit constituting the text with respect to the text received in the input step;
Based on the language analysis result obtained in the language analysis step, for each clause constituting the text, phrase information including notation and part of speech of words included in the clause and dependency information of the clause A phrase information generation step to generate;
It is determined whether a word included in the phrase information of each phrase matches an intention expression pattern stored in the intention expression pattern dictionary. If it is determined to match, the word is stored in association with the intention expression pattern. An intention expression setting step for adding the intended expression to the phrase information of the phrase determined to match,
A concept expression generation step for generating a concept expression of each clause using the intention expression added to the phrase information; and
In the intention expression setting step, the intention expression pattern determined to match the intention expression pattern stored in the intention expression pattern dictionary is a specific intention expression pattern, and the specific intention expression pattern is an independent word specification. If there is a dependency clause pair that is a pattern and the clause determined to match is a receiving clause, the clause information of the dependency clause of the dependency clause pair is also determined to match Adding an intention expression added to the clause information of the clause,
A concept expression generation method characterized by
前記意図表現パターン辞書は、前記意図表現パターンの参照、追加、修正、または削除が可能なテーブル形式で記憶されていることを特徴とする請求項に記載の概念表現生成方法。2. The concept expression generation method according to claim 1 , wherein the intention expression pattern dictionary is stored in a table format in which the intention expression pattern can be referred to, added, modified, or deleted. 前記意図表現設定ステップはさらに、前記係り受け文節対の係り文節を構成する自立語が形式名詞であり、かつ、当該係り受け文節対の係り文節が連体修飾関係で受け文節になっている場合に、前記係り受け文節対の係り文節の文節情報に、前記連体修飾関係で係り文節の文節情報に対応する意図表現を付加することを特徴とする請求項1又は2に記載の概念表現生成方法。 The intention representation setting step further Ri independent words the format nouns der constituting the dependency clauses pairs relates clause, and, if the dependency clause pair relates clause is in clause received by adnominal relationship 3. The concept expression generation method according to claim 1 , wherein an intention expression corresponding to the phrase information of the dependency phrase in the linkage modification relation is added to the phrase information of the dependency phrase of the dependency phrase pair. . 前記概念表現生成ステップはさらに、意図表現が付加されなかった文節を検出し、当該文節に所定の意図表現がつかなかったことを明示することを特徴とする請求項1乃至のいずれか1項に記載の概念表現生成方法。 The concept representation generating step further detects a clause is intended expression was not added to any one of claims 1 to 3, characterized in that to clearly show that a given intention representation to the clause has never occurred The concept expression generation method described in 1. 前記意図表現には、打消表現、可能表現、要望表現、疑問表現、理由表現のいずれかを含むことを特徴とする請求項1乃至4のいずれか1項に記載の概念表現生成方法。Wherein the intention representation, bucking expression, can be expressed, it demands representation, doubts representation, conceptual representation generating method according to any one of claims 1 to 4, characterized in that it comprises one of the reasons expressed. 前記概念表現生成ステップは、前記文節の文節情報に打消の意の意図表現が偶数個付加されている場合、その打消の意の意図表現を肯定の意の意図表現に変換することを特徴とする請求項5に記載の概念表現生成方法。 In the concept expression generation step, when an even number of intention expressions to cancel are added to the phrase information of the clause, the intention expression to cancel is converted to an intention expression of a positive intention. The concept expression generation method according to claim 5. 情報処理装置上で実行されるプログラムにおいて、請求項乃至のいずれか1項に記載の概念表現生成方法によった概念表現生成が実行されるようにプログラミングされていることを特徴とするプログラム。A program executed on an information processing apparatus, wherein the program is programmed so that concept expression generation by the concept expression generation method according to any one of claims 1 to 6 is executed. . プログラムを記憶した記憶媒体において、請求項7に記載のプログラムを記憶したことを特徴とする記憶媒体。A storage medium storing the program, wherein the program according to claim 7 is stored. 意図表現パターン辞書を記憶する記憶手段と、制御手段とを備える概念表現生成システムにて実行される概念表現生成装置であって、A concept expression generation apparatus that is executed by a concept expression generation system including a storage unit that stores an intention expression pattern dictionary and a control unit,
前記意図表現パターン辞書は、単語の表記、当該単語の品詞、当該単語の意図表現が対応付けられた意図表現パターンと、当該意図表現パターンが特定の意図表現パターンか否かを示すフラグとを対応付けて、それぞれの単語について記憶しており、前記制御手段が、テキストの入力を受け付ける入力手段と、  The intention expression pattern dictionary corresponds to a notation of a word, a part of speech of the word, an intention expression pattern associated with the intention expression of the word, and a flag indicating whether the intention expression pattern is a specific intention expression pattern. In addition, each word is stored, and the control means receives an input of text, and
前記入力手段にて受け付けたテキストに対して、形態素解析及び当該テキストを構成する文節単位の係り受け解析を実行する言語解析手段と、  Language analysis means for executing morphological analysis and dependency analysis of the phrase unit constituting the text with respect to the text received by the input means;
前記言語解析手段にて得られた言語解析結果に基づき、前記テキストを構成する個々の文節について、当該文節に含まれる単語の表記及び品詞と、当該文節の係り受け情報と、を含む文節情報を生成する文節情報生成手段と、  Based on the language analysis result obtained by the language analysis means, for each clause constituting the text, phrase information including notation and part of speech of words included in the clause and dependency information of the clause. Clause information generation means for generating;
各文節の前記文節情報に含まれる単語が、前記意図表現パターン辞書が記憶する意図表現パターンと一致するかを判定し、一致すると判定された場合には、当該意図表現パターンに対応付けて記憶されている意図表現を、当該一致すると判定された文節の文節情報に付加する意図表現設定手段と、  It is determined whether a word included in the phrase information of each phrase matches an intention expression pattern stored in the intention expression pattern dictionary. If it is determined to match, the word is stored in association with the intention expression pattern. An intention expression setting means for adding the intention expression to the phrase information of the phrase determined to match,
前記文節情報に付加された意図表現を用いて、各文節の概念表現を生成する概念表現生成手段とを有し、  Using a concept expression generating means for generating a concept expression of each clause using an intention expression added to the clause information;
前記意図表現設定手段はさらに、  The intention expression setting means further includes
前記意図表現パターン辞書が記憶する意図表現パターンと一致すると判定された意図表現パターンが特定の意図表現パターンであり、かつ、当該特定の意図表現パターンが自立語の特定パターンであり、かつ、前記一致すると判定された文節が受け文節になっている係り受け文節対が存在する場合に、当該係り受け文節対の係り文節の文節情報にも、前記一致すると判定された文節の文節情報に付加された意図表現を付加することを実行することを特徴とする概念表現生成装置。  The intention expression pattern determined to match the intention expression pattern stored in the intention expression pattern dictionary is a specific intention expression pattern, and the specific intention expression pattern is an independent word specific pattern, and the match Then, when there is a dependency clause pair in which the determined clause is a receiving clause, the clause information of the dependency clause of the dependency clause pair is also added to the clause information of the determined clause. A concept expression generation apparatus characterized by executing an intention expression.
前記意図表現パターン辞書は、前記意図表現パターンの参照、追加、修正、または削除が可能なテーブル形式で記憶されていることを特徴とする請求項9に記載の概念表現生成装置。The conceptual expression generation device according to claim 9, wherein the intention expression pattern dictionary is stored in a table format in which the intention expression pattern can be referred to, added, modified, or deleted. 前記意図表現設定手段はさらに、前記係り受け文節対の係り文節を構成する自立語が形式名詞であり、かつ、当該係り受け文節対の係り文節が連体修飾関係で受け文節になっている場合に、前記係り受け文節対の係り文節の文節情報に、前記連体修飾関係で係り文節の文節情報に対応する意図表現を付加することを特徴とする請求項9又は10に記載の概念表現生成装置。The intention expression setting means further includes a case where the independent word constituting the dependency clause of the dependency clause pair is a formal noun, and the dependency clause of the dependency clause pair is a reception clause in a linkage modification relationship. 11. The concept expression generation apparatus according to claim 9, wherein an intention expression corresponding to the phrase information of the dependency phrase in the linkage modification relation is added to the phrase information of the dependency phrase of the dependency phrase pair. 前記概念表現生成手段はさらに、意図表現が付加されなかった文節を検出し、当該文節に所定の意図表現がつかなかったことを明示することを特徴とする請求項9乃至11のいずれか1項に記載の概念表現生成装置。12. The concept expression generation means further detects a phrase to which no intention expression is added, and clearly indicates that a predetermined intention expression has not been added to the phrase. The conceptual expression generation device described in 1. 前記意図表現には、打消表現、可能表現、要望表現、疑問表現、理由表現のいずれかを含むことを特徴とする請求項9乃至12のいずれか1項に記載の概念表現生成装置。 The concept expression generation apparatus according to claim 9, wherein the intention expression includes any one of cancellation expression, possible expression, request expression, question expression, and reason expression. 前記概念表現生成手段は、前記文節の文節情報に打消の意の意図表現が偶数個付加されている場合、その打消の意の意図表現を肯定の意の意図表現に変換することを特徴とする請求項13に記載の概念表現生成装置。 The conceptual expression generation means converts an intention expression of intention to cancel to an intention expression of positive meaning when an even number of intention expressions to cancel is added to the phrase information of the phrase. The conceptual expression generation device according to claim 13.
JP2003122554A 2003-04-25 2003-04-25 CONCEPT EXPRESSION GENERATION METHOD, PROGRAM, STORAGE MEDIUM, AND CONCEPT EXPRESSION GENERATION DEVICE Expired - Fee Related JP4300056B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003122554A JP4300056B2 (en) 2003-04-25 2003-04-25 CONCEPT EXPRESSION GENERATION METHOD, PROGRAM, STORAGE MEDIUM, AND CONCEPT EXPRESSION GENERATION DEVICE
CNB200480000557XA CN100463571C (en) 2003-04-25 2004-04-26 Radio communication system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003122554A JP4300056B2 (en) 2003-04-25 2003-04-25 CONCEPT EXPRESSION GENERATION METHOD, PROGRAM, STORAGE MEDIUM, AND CONCEPT EXPRESSION GENERATION DEVICE

Publications (2)

Publication Number Publication Date
JP2004326596A JP2004326596A (en) 2004-11-18
JP4300056B2 true JP4300056B2 (en) 2009-07-22

Family

ID=33500738

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003122554A Expired - Fee Related JP4300056B2 (en) 2003-04-25 2003-04-25 CONCEPT EXPRESSION GENERATION METHOD, PROGRAM, STORAGE MEDIUM, AND CONCEPT EXPRESSION GENERATION DEVICE

Country Status (2)

Country Link
JP (1) JP4300056B2 (en)
CN (1) CN100463571C (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101577661B (en) 2008-05-09 2013-09-11 华为技术有限公司 Method and equipment for switching path
WO2015192311A1 (en) * 2014-06-17 2015-12-23 Telefonaktiebolaget L M Ericsson(Publ) Reporting quality of experience of receiving digital content

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11355204A (en) * 1998-06-04 1999-12-24 Nec Corp Cdma mobile communication system and transmission power control method for the same
JP2001156752A (en) * 1999-11-24 2001-06-08 Toshiba Corp Mobile wireless terminal
CN1233110C (en) * 2000-10-11 2005-12-21 三星电子株式会社 Apparatus and method for controlling transmit antenna array for physical downlink shared channel in mobile communication system
EP1209859A1 (en) * 2000-11-22 2002-05-29 Siemens Aktiengesellschaft Method, apparatus and use of a protected channel for restoring a failed switched connection

Also Published As

Publication number Publication date
JP2004326596A (en) 2004-11-18
CN100463571C (en) 2009-02-18
CN1698394A (en) 2005-11-16

Similar Documents

Publication Publication Date Title
JP5744873B2 (en) Trusted Query System and Method
JP6074820B2 (en) Annotation auxiliary device and computer program therefor
KR101136007B1 (en) System and method for anaylyzing document sentiment
US20070179932A1 (en) Method for finding data, research engine and microprocessor therefor
KR20100038378A (en) A method, system and computer program for intelligent text annotation
JP2002215617A (en) Method for attaching part of speech tag
JP2001075966A (en) Data analysis system
US20120221324A1 (en) Document Processing Apparatus
JP2002117027A (en) Feeling information extracting method and recording medium for feeling information extracting program
JPH09198395A (en) Document retrieval device
JP4300056B2 (en) CONCEPT EXPRESSION GENERATION METHOD, PROGRAM, STORAGE MEDIUM, AND CONCEPT EXPRESSION GENERATION DEVICE
JPH08129554A (en) Relation expression extracting device and retrieval device for relation expression
JP4953440B2 (en) Morphological analysis device, morphological analysis method, morphological analysis program, and recording medium storing computer program
Revanth et al. Nl2sql: Natural language to sql query translator
JP4024137B2 (en) Quantity expression search device
JP5302784B2 (en) Machine translation method and system
JP2004220226A (en) Document classification method and device for retrieved document
JP4477587B2 (en) Method for generating operation buttons for computer processing of text data
JPS63228326A (en) Automatic key word extracting system
JP2838984B2 (en) General-purpose reference device
JP4980604B2 (en) Document search apparatus, document search method, document search program, and recording medium
JP2001297100A (en) Device for supporting refining of keyword extraction rule
JP2003099429A (en) Glossary generation device, glossary generation program and glossary retrieval device
JPH08249346A (en) Document retrieval device and document preparing method
JP4653375B2 (en) Structured document generation apparatus and structured document generation program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060306

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080311

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080512

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090331

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090420

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120424

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130424

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140424

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees