JP2008233964A - 構文・意味解析結果ランキングモデル作成方法および装置、プログラム並びに記録媒体 - Google Patents
構文・意味解析結果ランキングモデル作成方法および装置、プログラム並びに記録媒体 Download PDFInfo
- Publication number
- JP2008233964A JP2008233964A JP2007068208A JP2007068208A JP2008233964A JP 2008233964 A JP2008233964 A JP 2008233964A JP 2007068208 A JP2007068208 A JP 2007068208A JP 2007068208 A JP2007068208 A JP 2007068208A JP 2008233964 A JP2008233964 A JP 2008233964A
- Authority
- JP
- Japan
- Prior art keywords
- semantic
- syntax
- analysis result
- semantic information
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】記憶部2で意味情報DB22を予め記憶しておき、意味情報抽出部11Aにより、前記記憶部から読み出した構文・意味解析結果から意味解析結果を抽出し、この意味解析結果に基づいて前記記憶部から読み出した処理対象文から選択した対象語句について、前記記憶部2の意味情報DB22を検索することにより、当該対象語句に関する意味情報を抽出し、素性作成部11Eにより、前記意味情報抽出部11Aで抽出された意味情報に基づいて前記対象語句を展開することにより、構文・意味解析結果ランキングモデル23の作成に用いる素性を作成する。
【選択図】 図1
Description
こうした情報処理の精度を高めるためには、自然言語の文章を正しく構文解析することが重要である。また、より高度な情報処理を実現するには、構文解析だけでなく、より深い意味解析まで行なう必要がある。
また、本発明にかかる記録媒体は、上記プログラムが記録された記録媒体である。
[第1の実施の形態]
まず、図1を参照して、本発明の第1の実施の形態にかかる構文・意味解析モデル作成装置について説明する。図1は、本発明の第1の実施の形態にかかる構文・意味解析モデル作成装置の構成を示すブロック図である。
この構文・意味解析モデル作成装置10は、サーバやパーソナルコンピュータなどの一般的な情報処理装置からなり、入力されたツリーバンクデータベース(以下、ツリーバンクDBという)Xに含まれる各構文・意味解析結果を情報処理することにより、構文・意味解析結果をランキングするための構文・意味解析ランキングモデルYを作成して出力する機能を有している。
構文・意味解析モデル作成装置10には、主な機能部として、一般的な情報処理装置と同様に、演算処理部1、記憶部2、入出力インターフェース部(以下、入出力I/F部という)3、通信インターフェース部(以下、通信I/F部という)4、操作入力部5、および画面表示部6が設けられている。
演算処理部1で実現される主な処理部としては、学習用素性作成部11および機械学習部12がある。
記憶部2で記憶する主な処理情報としては、ツリーバンクデータベース(以下、ツリーバンクDBという)21、意味情報データベース(以下、意味情報DBという)22、および構文・意味解析ランキングモデル23がある。
通信I/F部4は、専用のデータ通信回路からなり、LANなどの通信回線を介して接続されたサーバなどの外部装置との間で、演算処理部1からの指示に応じて、ツリーバンクDBX、構文・意味ランキングモデルY、辞書、データベースなどの各種データやプログラムを送受信する機能を有している。
画面表示部6は、LCDやPDPなどの画面表示装置からなり、演算処理部1からの指示に応じてツリーバンクDBX、構文・意味ランキングモデルYなどの各種データや操作画面を画面表示する機能を有している。
学習用素性作成部11は、記憶部2のツリーバンクDB21に格納されている、対象処理文とその構文・意味解析結果とその正否を示す評価結果の組を読み出して、ランキングを行なうための素性を作成する機能を有している。
ツリーバンクDB21は、自然言語データからなる処理対象文と、この処理対象文を予め言語解析して得た構文・意味解析結果、この解析結果の正否すなわち正解/不正解を示す評価結果の組が格納されている。
意味情報抽出部11Aは、ツリーバンクDB21から読み出した構文・意味解析結果から意味解析結果を抽出する機能と、この意味解析結果に基づきツリーバンクDB21から読み出した処理対象文またはその処理対象文から選択した対象語句について、意味情報DB22を検索することにより、対象語句に関する意味情報を抽出する機能とを有している。なお、対象語句は、その語句単独で語義を持つ最小単位で処理対象文から選択する。
センスバンクDB22Aは、処理対象文ごとに当該対象処理部を構成する各対象語句に対する語義付与結果を蓄積するデータベースである。
シソーラス/オントロジーDB22Bは、互いに所定の関係にある各種語句や意味カテゴリを蓄積するデータベースである。
意味付与部11Bは、処理対象文についてセンスバンクDB22Aを検索し、当該対象語句に対する語義付与結果を抽出する機能と、シソーラス/オントロジーDB22Bを検索して、上位語や同義語、意味カテゴリ、上位の意味カテゴリなどの意味情報を抽出する機能とを有している。
なお、センスバンクDB22AとDB22Aについては、構文・意味解析ランキングモデルやその作成処理に要求される条件、例えば素性のバリエーションの広さ、ランキング精度、ランキング所要時間、モデル作成所要時間などの条件に基づいて選択すればよい。センスバンクDB22Aおよびシソーラス/オントロジーDB22Bの両方を設けてもよく、いずれか一方であってもよい。
意味的素性作成部11Fは、意味情報抽出部11Aで抽出された意味情報に含まれる、当該対象語句の語義、上位語や同義語、意味カテゴリ、上位の意味カテゴリに基づいて、対象語句を展開することにより、構文・意味解析結果ランキングモデルの作成に用いる意味的素性を作成する機能を有している。
構文的素性作成部11Gは、構文情報抽出部11Bで抽出された構文情報に基づいて、対象語句、品詞、解析に適用される文法的ルールを展開することにより、構文・意味解析結果ランキングモデルの作成に用いる構文的素性を作成する機能を有している。
機械学習部12は、素性選択部11Hで選択された素性を機械学習することにより構文・意味解析ランキングモデル23を作成する機能を有している。
構文・意味解析ランキングモデル23の作成結果は、素性の作成や選択を変化させるために素性作成部11Eや素性選択部11Hヘフィードバックされる。
最終的には、このようにして作成した構文・意味解析ランキングモデル23を、構文・意味解析器(図示せず)に組み込むか、後処理で構文解析結果のランキングを行なうかによって、構文解析の正解選択精度を改善してもよい。
次に、図3を参照して、本発明の第1の実施の形態にかかる構文・意味解析モデル作成装置の動作について説明する。図3は、本発明の第1の実施の形態にかかる構文・意味解析モデル作成装置のモデル作成処理を示すフローチャートである。
構文・意味解析モデル作成装置10の演算処理部1は、操作入力部5により、オペレータによるモデル作成処理の開始操作を検出した場合、図3のモデル作成処理を開始する。
次に、学習用素性作成部11は、素性作成部11Eの意味的素性作成部11Fにより、意味情報抽出部11Aで抽出された意味情報に基づいて、対象語句を展開することにより、構文・意味解析結果ランキングモデルの作成に用いる意味的素性を作成する(ステップ102)。
次に、図4および図5を参照して、本実施の形態で用いる構文・意味解析結果について説明する。図4は、構文解析結果の例である。図5は、構文・意味解析結果の例である。ここでは、処理対象文が日本語の場合を例として説明するが、英語、中国語、スペイン語、ドイツ語、フランス語など、自然言語であればいずれの言語でもよい。
一方、図5には、処理対象文「車を運転する人」について、構文解析した結果が示されており、解析結果T1−1−2は、その解析が正解した例、解析結果T1−1−1,T1−2−1,T1−2−2は、その解析が不正解であった例である。
図5のT1−1−1は、T1−1−2(図4のT1−1)と同じ構文構造であるが、このT1−1−1の場合は、「運転する」の項1が空になっていて、「(車を)運転する」は「人」にかかる単なる関係節との解釈になっている。
次に、図6−8を参照して、本実施の形態で用いる意味情報DBについて説明する。図6は、センスバンクDBに格納された処理対象文の語義付与情報の例である。図7は、センスバンクDBに格納された処理対象文への語義付与の基準となる辞書のエントリの例である。図8は、シソーラス/オントロジーDBに格納された処理対象文のシソーラス/オントロジーの例である。
また、語義が付与できない場合でも、シソーラス/オントロジーDB22Bにおける、該語句の意味カテゴリや、上位語、上位意味カテゴリなどだけを獲得して利用することも考えられる。
また、センスバンクDB22Aに格納されるセンスバンクも1つである必要はなく、複数のセンスバンクを格納してもよく、例えば檜センスバンクと岩波国語辞典タグ付コーパスの両方を格納することが考えられる。また、センスバンクが存在しない場合、あるいは、センスバンクが存在しても対象文に対する語義付与情報がない場合、語義付与部11Cのみを利用することも考えられる。
また、シソーラス/オントロジーDB22Bに格納されるシソーラス/オントロジーも1つである必要はなく、複数の辞書を格納してもよく、例えば日本語語彙大系と檜オントロジーの両方を格納することが考えられる。
次に、図9および図10を参照して、本実施の形態における意味情報抽出処理について説明する。図9は、シソーラス/オントロジーの意味カテゴリに含まれる語の例である。図10は、意味情報抽出処理の実行結果例である。
意味情報抽出部11Aは、ツリーバンクDB21に格納された1つまたは複数のツリーバンクから、構文・意味解析結果とこの解析結果が正解であるか、不正解であるかの判定結果を取り出す(図4,5)。ここで、ツリーバンクDB21から図4の解析結果T1が提供されたとすると、意味情報抽出部11Aは、解析結果T1に対応する語義付与結果を図6のセンスバンクDB22Aから獲得する。
次に、図11を参照して、本実施の形態における意味的素性作成処理について説明する。図11は、意味的素性作成処理の実行結果例である。なお、図11にあげた素性のうち、B0−B6は字面ベースの素性であり、先行研究で利用されている素性である。
また、意味的素性作成部11Fは、同じく図10の上位カテゴリを用いて内容語を展開し、あるいは一部の内容語のみを展開し、上位カテゴリに基づく素性H0−H7を作成する。ここで、H0−H7は、上位カテゴリとして、レベル3の意味カテゴリを利用している。
まず、語義情報を利用する場合の効果である。(1)「ドライバーでねじを締めた。」と(2)「ドライバーがねじを締めた。」の文章は非常に類似しているが、(1)の「ドライバー」は、ねじまわしの意味のドライバー(D4−1)であり、「締める」にかかる随格である一方、(2)の「ドライバー」は運転手の意味のドライバー(D4−2)であり、主格である。このように非常に類似した文章であっても、語義によって全く異なる格になりうる。
[締める,項1:ドライバー,項2:ねじ]
[締める,項1:ドライバー]
[締める,項1:−,項2:ねじ,随格:ドライバー]
[締める,随格:ドライバー]
[締める,項1=ドライバー(D4−2),項2:ねじ(D5−1)]
[締める,項1:ドライバー(D4−2)]
[締める,項1:−,項2:ねじ(D5−1),随格:ドライバー(D4−1)]
[締める,随格:ドライバー(D4−1)]
のように区別することができる。
[運転する,項1:彼,項2:新車]
しかし、図9から、「彼」,「新車」,「運転(する)」の意味カテゴリは、それぞれ、<人>,<乗り物(陸)>,<操縦>であることがわかるので、図12のC0−C7に一致する素性を獲得できる。
次に、図11を参照して、本実施の形態における素性選択処理について説明する。
図11には、意味的素性作成部11Fによって作成した素性が示されているが、これらすべての素性を、構文・意味解析ランキングモデル23の作成に利用する必要はない。
素性選択部11Hは、ある特定の条件を満たす素性を抽出あるいは削除し、構文・意味解析結果が正解であるか不正解であるかの判定結果と、この解析結果に対する素性を機械学習部12に出力する。
次に、図12を参照して、本実施の形態における機械学習処理について説明する。図12は、機械学習処理の実行結果例である。
機械学習部12は、学習用素性作成部11から、構文・意味解析結果の判定結果と、この解析結果に対して構文・意味解析ランキング用素性作成部11Eで作成された素性集合とを受け取り、どの素性が出現したときに解析結果が正解、あるいは不正解になりやすいかを統計的に学習し、学習結果を構文・意味解析ランキングモデル23へ出力する。
また、出現頻度によって、このパラメタの重みは変化する。新しい解析結果をランキングする場合、各解析結果から得られる素性集合とパラメタから、各解析結果のスコア(正解となる確率)を計算し、そのスコアによってランキングを行なう。
次に、本実施の形態のおける構文・意味解析ランキングモデル23の機能を説明する。
構文・意味解析ランキングモデル23は、データベース機能を有しており、各種素性を蓄積するだけでなく、構文・意味解析ランキングモデルを評価し、評価結果によって素性の作成や選択方法を変更するためのフィードバックを素性選択部11Hや素性作成部11E5に返す。
次に、図13を用いて、本発明の第1の実施の形態にかかる構文・意味解析ランキングモデル作成装置によって作成した構文・意味解析ランキングモデルを用いた、構文・意味解析ランキング装置について説明する。図13は、構文・意味解析ランキング装置の概略構成を示すブロック図である。
この構文・意味解析ランキング装置30には、主な機能部として、一般的な情報処理装置が持つ機能部以外に、言語解析器31、構文・意味解析器32、学習用素性作成部11、および機械学習部12が設けられている。
また、言語解析器31は、一般的な形態素解析器やチャンカー等からなり、入力文3Xの形態素解析を行う形態素解析や語句区分調整を行う機能を有している。構文・意味解析器32は、一般的な構文・意味解析器であり、言語解析器31の解析結果に基づき入力文3Xの構文・意味解析を行う機能を有している。
その後、構文・意味解析モデル作成装置10で予め作成しておいた構文・意味解析ランキングモデル23により、各解析結果が正解かどうかの確率を計算し、確率の高い順に解析結果を並べ、順位付けられた構文・意味解析解3Yとして出力する。あるいは、各解析結果が正解か不正解かの分類を行ない、正解か不正解かの分類結果を付けて出力する。
このように、本実施の形態は、記憶部2により、自然言語データからなる処理対象文とその構文・意味解析結果とその解析結果の正否を示す評価結果との組を記憶するとともに、各種語句に関する意味を示す意味情報を蓄積する意味情報DB22を予め記憶しておき、意味情報抽出部11Aにより、記憶部から読み出した構文・意味解析結果から意味解析結果を抽出し、この意味解析結果に基づいて記憶部から読み出した処理対象文から選択した対象語句について、記憶部2の意味情報DB22を検索することにより、当該対象語句に関する意味情報を抽出し、素性作成部11Eにより、意味情報抽出部11Aで抽出された意味情報に基づいて対象語句を展開することにより、構文・意味解析結果ランキングモデル23の作成に用いる素性を作成するようにしたものである。
次に、図16および図17を参照して、本発明の第2の実施の形態にかかる構文・意味解析モデル作成装置について説明する。図16は、本発明の第2の実施の形態にかかる構文・意味解析モデル作成装置の構成を示すブロック図であり、前述した図1と同じまたは同等部分について同一符号を付してある。図17は、本発明の第2の実施の形態にかかる構文・意味解析モデル作成装置の要部を示すブロック図であり、前述した図2と同じまたは同等部分について同一符号を付してある。
本実施の形態にかかる構文・意味解析モデル作成装置には、第1の実施の形態と比較して、記憶部2に構文意味情報辞書24が追加されているとともに、学習用素性作成部11の意味情報抽出部11Aに構文意味情報抽出部11Iが追加されている。なお、他の構成については第1の実施の形態と同様であり、ここでの詳細な説明は省略する。
代表語・典型語辞書DB24Bは、処理対象文の代表語辞書や典型語辞書を蓄積するデータベースであり、その辞書レコードには、少なくとも対象語句の見出しおよびその品詞、該見出し語と共起しやすい語(主に名詞)や句(主に名詞句)に関する情報が含まれている。
用例付き格フレーム辞書DB24Cは、処理対象文の用例付き格フレーム辞書を蓄積するデータベースであり、格納されている格フレーム辞書には、少なくとも対象語句の見出しおよびその品詞、該見出し語と実際に共起した語や句の用例に関する情報が含まれている。
また、図18では、見出し「運転する」の結合価辞書エントリとして、PID1の他にPID2が登録されている。
また、結合価辞書DB24A,代表語・典型語辞書DB24B,用例付き格フレーム辞書DB24Cに格納される辞書は、それぞれ1つである必要はなく、複数の辞書を格納してもよく、例えばALT−J/Eの結合価辞書とIPALの両方を格納することが考えられる。また、結合価辞書,代表語/典型語辞書,用例付き格フレーム辞書のいずれかが存在しなくても構わない。
次に、図3を参照して、本発明の第2の実施の形態にかかる構文・意味解析モデル作成装置の動作について説明する。
本実施の形態におけるモデル作成処理は、図3に示した第1の実施の形態のものとほぼ同様であるが、ステップ101,102において次のような相違がある。
すなわち、図18において、見出し語である「運転する(1品詞]さ変名詞)」に一致するエントリは、PID1とPID2があるが、図10から、T1の「人」「車」は、それぞれ意味カテゴリ<人>,<乗り物(陸)>に一致するため、PID1の方がより適切なエントリであるとわかる。
まず、図10の意味情報と、図11のPID1、図12のRD2、図13のCID1からなる構文意味情報のそれぞれに共通して一致するエントリを選択する方法がある。この場合、図21における素性P0,R0,Y0が選択される。
また、結合価辞書,代表語/典型語辞書,用例付き格フレームのそれぞれに一致するエントリを選択してもよく、この場合には図21の素性P1,R1,Y1が選択される。
また、どの項(格)に一致/不一致なのかという検索を行う方法では、図21の素性P3,P5,P6(一致))、素性Y5(不一致)が選択される。
また、一致したときのSC0REを入れる方法では、図21の素性P7が選択され、そのSC0REが高いか低いかの情報を入れる方法では、図21の素性P8が選択され、一致したときの用例の出現頻度が高いか低いかを検索する方法では、図21の素性Y0−Y4,Y6−Y8が選択される。
例えば、(5)「私は階段を誤って踏み外した。」を考えた場合、(5)の解析結果では、「階段を」が、「誤る」にかかるのか、「踏み外す」にかかるのかという曖昧性が出る。図18のPID3,PID4から、「階段を」が「誤る」にかかるとすると、PID3のN1は一致するが、N2には全く一致しない。一方、「踏み外す」なら、PID4のN1、N2の両方に一致する素性を作成でき、より確からしい素性を作成できる。
このように、本実施の形態では、記憶部2により、各種語句ついて当該語句が用いられる構文ごとに当該語句の意味を示す構文意味情報を蓄積する構文意味情報辞書24を予め記憶しておき、意味情報抽出部11Aにより、対象語句について構文意味情報辞書を検索することにより当該対象語句の構文意味情報を意味情報として抽出するようにしたので、既存の構文辞書の情報を流用でき、効率的に構文・意味解析システムの精度をあげることができる。
Claims (12)
- 自然言語データからなる処理対象文とその構文・意味解析結果とその正否を示す評価結果との組から作成した素性を機械学習することにより、自然言語に対する解析結果を自動的にランキングするための構文・意味解析結果ランキングモデルを作成する構文・意味解析結果ランキングモデル作成方法であって、
記憶部により、自然言語データからなる処理対象文とその構文・意味解析結果とその解析結果の正否を示す評価結果との組を記憶するとともに、各種語句に関する意味を示す意味情報を蓄積する意味情報データベースを記憶する記憶ステップと、
意味情報抽出部により、前記記憶部から読み出した構文・意味解析結果から意味解析結果を抽出し、この意味解析結果に基づき前記記憶部から読み出した処理対象文またはその処理対象文から選択した対象語句について、前記記憶部の意味情報データベースを検索することにより、当該対象語句に関する意味情報を抽出する意味情報抽出ステップと、
素性作成部により、前記意味情報抽出部で抽出された意味情報に基づいて前記対象語句を展開することにより、構文・意味解析結果ランキングモデルの作成に用いる素性を作成する素性作成ステップと
を備えることを特徴とする構文・意味解析結果ランキングモデル作成方法。 - 請求項1に記載の構文・意味解析結果ランキングモデル作成方法において、
構文情報抽出部により、前記記憶部から読み出した構文・意味解析結果から構文解析結果を抽出し、構文情報として出力する構文情報抽出ステップをさらに備え、
前記素性作成ステップにより、前記構文情報抽出部から出力された構文情報に基づいて、構文・意味解析結果ランキングモデルの作成に用いる素性を作成する
ことを特徴とする構文・意味解析結果ランキングモデル作成方法。 - 請求項1に記載の構文・意味解析結果ランキングモデル作成方法において、
前記意味情報データベースは、前記処理対象文の各対象語句に対する語義付与結果を蓄積するセンスバンクデータベース、または互いに所定の関係にある各種語句や意味カテゴリを蓄積するシソーラス/オントロジーデータベースからなり、
前記意味情報抽出ステップにより、前記意味情報データベースを検索することにより、前記対象語句の語義、または前記対象語句と所定の関係にある他の語句や意味カテゴリを、前記意味情報として抽出する
ことを特徴とする構文・意味解析結果ランキングモデル作成方法。 - 請求項1に記載の構文・意味解析結果ランキングモデル作成方法において、
前記記憶部により、各種語句ついて当該語句が用いられる構文ごとに当該語句の意味を示す構文意味情報を蓄積する構文意味情報辞書を記憶する記憶ステップをさらに備え、
前記意味情報抽出ステップにより、前記対象語句について前記構文意味情報辞書を検索することにより当該対象語句の構文意味情報を前記意味情報として抽出する
ことを特徴とする構文・意味解析結果ランキングモデル作成方法。 - 請求項4に記載の構文・意味解析結果ランキングモデル作成方法において、
前記構文意味情報辞書は、前記対象語句の結合価情報を蓄積する結合価辞書、前記対象語句の代表語あるいは典型語を蓄積する代表語/典型語辞書、または対象語句の用例付き格フレームを蓄積する用例付き格フレーム辞書のうちいずれか1つ以上の辞書からなり、
前記意味情報抽出ステップにより、前記構文意味情報辞書を検索することにより、前記対象語句の結合価情報、代表語、典型語、または用例付き格フレームのうちのいずれか1つ以上を、前記意味情報として抽出する
ことを特徴とする構文・意味解析結果ランキングモデル作成方法。 - 自然言語データからなる処理対象文とその構文・意味解析結果とその正否を示す評価結果との組から作成した素性を機械学習することにより、自然言語に対する解析結果を自動的にランキングするための構文・意味解析結果ランキングモデルを作成する構文・意味解析結果ランキングモデル作成装置であって、
自然言語データからなる処理対象文とその構文・意味解析結果とその解析結果の正否を示す評価結果との組を記憶するとともに、各種語句に関する意味を示す意味情報を蓄積する意味情報データベースを記憶する記憶部と、
前記記憶部から読み出した構文・意味解析結果から意味解析結果を抽出し、この意味解析結果に基づいて前記記憶部から読み出した処理対象文から選択した対象語句について、前記記憶部の意味情報データベースを検索することにより、当該対象語句に関する意味情報を抽出する意味情報抽出部と、
前記意味情報抽出部で抽出された意味情報に基づいて前記対象語句を展開することにより、構文・意味解析結果ランキングモデルの作成に用いる素性を作成する素性作成部と
を備えることを特徴とする構文・意味解析結果ランキングモデル作成装置。 - 請求項6に記載の構文・意味解析結果ランキングモデル作成装置において、
前記記憶部から読み出した構文・意味解析結果から構文解析結果を抽出し、構文情報として出力する構文情報抽出部をさらに備え、
前記素性作成部は、前記構文情報抽出部から出力された構文情報に基づいて、構文・意味解析結果ランキングモデルの作成に用いる素性を作成する
ことを特徴とする構文・意味解析結果ランキングモデル作成装置。 - 請求項6に記載の構文・意味解析結果ランキングモデル作成装置において、
前記意味情報データベースは、前記処理対象文の各対象語句に対する語義付与結果を蓄積するセンスバンクデータベース、または互いに所定の関係にある各種語句や意味カテゴリを蓄積するシソーラス/オントロジーデータベースからなり、
前記意味情報抽出部は、前記意味情報データベースを検索することにより、前記対象語句の語義、または前記対象語句と所定の関係にある他の語句や意味カテゴリを、前記意味情報として抽出する
ことを特徴とする構文・意味解析結果ランキングモデル作成装置。 - 請求項6に記載の構文・意味解析結果ランキングモデル作成装置において、
前記記憶部は、各種語句ついて当該語句が用いられる構文ごとに当該語句の意味を示す構文意味情報を蓄積する構文意味情報辞書を記憶し、
前記意味情報抽出部は、前記対象語句について前記構文意味情報辞書を検索することにより当該対象語句の構文意味情報を前記意味情報として抽出する
ことを特徴とする構文・意味解析結果ランキングモデル作成装置。 - 請求項9に記載の構文・意味解析結果ランキングモデル作成装置において、
前記構文意味情報辞書は、前記対象語句の結合価情報を蓄積する結合価辞書、前記対象語句の代表語あるいは典型語を蓄積する代表語/典型語辞書、または対象語句の用例付き格フレームを蓄積する用例付き格フレーム辞書のうちいずれか1つ以上の辞書を記憶し、
前記意味情報抽出部は、前記構文意味情報辞書を検索することにより、前記対象語句の結合価情報、代表語、典型語、または用例付き格フレームのうちのいずれか1つ以上を、前記意味情報として抽出する
ことを特徴とする構文・意味解析結果ランキングモデル作成装置。 - コンピュータに、請求項1に記載の構文・意味解析結果ランキングモデル作成方法の各ステップを実行させるためのプログラム。
- 請求項11に記載のプログラムが記録された記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007068208A JP4963245B2 (ja) | 2007-03-16 | 2007-03-16 | 構文・意味解析結果ランキングモデル作成方法および装置、プログラム並びに記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007068208A JP4963245B2 (ja) | 2007-03-16 | 2007-03-16 | 構文・意味解析結果ランキングモデル作成方法および装置、プログラム並びに記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008233964A true JP2008233964A (ja) | 2008-10-02 |
JP4963245B2 JP4963245B2 (ja) | 2012-06-27 |
Family
ID=39906720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007068208A Expired - Fee Related JP4963245B2 (ja) | 2007-03-16 | 2007-03-16 | 構文・意味解析結果ランキングモデル作成方法および装置、プログラム並びに記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4963245B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010282453A (ja) * | 2009-06-05 | 2010-12-16 | Hitachi Ltd | 機械翻訳方法、及びシステム |
JP2010282517A (ja) * | 2009-06-05 | 2010-12-16 | Nippon Telegr & Teleph Corp <Ntt> | 言語資源情報生成装置、方法、プログラム、および記録媒体 |
KR101061201B1 (ko) | 2009-09-03 | 2011-08-31 | 주식회사 다음커뮤니케이션 | 검색 랭킹 모델 시뮬레이션 시스템 및 그 방법 |
JP2014059754A (ja) * | 2012-09-18 | 2014-04-03 | Hitachi Ltd | 情報処理システム、及び、情報処理方法 |
US11687795B2 (en) | 2019-02-19 | 2023-06-27 | International Business Machines Corporation | Machine learning engineering through hybrid knowledge representation |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01113869A (ja) * | 1987-10-28 | 1989-05-02 | Hitachi Ltd | 日本文解析方式 |
JP2007011775A (ja) * | 2005-06-30 | 2007-01-18 | Nippon Telegr & Teleph Corp <Ntt> | 辞書作成装置、辞書作成方法、プログラム及び記録媒体 |
-
2007
- 2007-03-16 JP JP2007068208A patent/JP4963245B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01113869A (ja) * | 1987-10-28 | 1989-05-02 | Hitachi Ltd | 日本文解析方式 |
JP2007011775A (ja) * | 2005-06-30 | 2007-01-18 | Nippon Telegr & Teleph Corp <Ntt> | 辞書作成装置、辞書作成方法、プログラム及び記録媒体 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010282453A (ja) * | 2009-06-05 | 2010-12-16 | Hitachi Ltd | 機械翻訳方法、及びシステム |
JP2010282517A (ja) * | 2009-06-05 | 2010-12-16 | Nippon Telegr & Teleph Corp <Ntt> | 言語資源情報生成装置、方法、プログラム、および記録媒体 |
KR101061201B1 (ko) | 2009-09-03 | 2011-08-31 | 주식회사 다음커뮤니케이션 | 검색 랭킹 모델 시뮬레이션 시스템 및 그 방법 |
JP2014059754A (ja) * | 2012-09-18 | 2014-04-03 | Hitachi Ltd | 情報処理システム、及び、情報処理方法 |
US11687795B2 (en) | 2019-02-19 | 2023-06-27 | International Business Machines Corporation | Machine learning engineering through hybrid knowledge representation |
Also Published As
Publication number | Publication date |
---|---|
JP4963245B2 (ja) | 2012-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gambhir et al. | Recent automatic text summarization techniques: a survey | |
Vajjala et al. | On improving the accuracy of readability classification using insights from second language acquisition | |
Wong et al. | Exploiting parse structures for native language identification | |
Dell’Orletta et al. | READ–IT: Assessing readability of Italian texts with a view to text simplification | |
US11210468B2 (en) | System and method for comparing plurality of documents | |
Malandrakis et al. | Distributional semantic models for affective text analysis | |
JPH1173417A (ja) | テキストジャンル識別方法 | |
Fujita et al. | Exploiting semantic information for HPSG parse selection | |
Atkinson et al. | Rhetorics-based multi-document summarization | |
Jagadeesh et al. | Sentence extraction based single document summarization | |
Alami et al. | Hybrid method for text summarization based on statistical and semantic treatment | |
JP4963245B2 (ja) | 構文・意味解析結果ランキングモデル作成方法および装置、プログラム並びに記録媒体 | |
Yeom et al. | Unsupervised-learning-based keyphrase extraction from a single document by the effective combination of the graph-based model and the modified C-value method | |
Parameswarappa et al. | Kannada word sense disambiguation using decision list | |
Wu et al. | Semantic segment extraction and matching for internet FAQ retrieval | |
Gurevych et al. | Expert‐Built and Collaboratively Constructed Lexical Semantic Resources | |
Imperial et al. | Application of Lexical Features Towards Improvement of Filipino Readability Identification of Children's Literature | |
Ide et al. | Japanese Lexical Complexity for Non-Native Readers: A New Dataset | |
JPH11120206A (ja) | タグ付けされていないテキストの外観特徴を使用したテキストジャンルの自動決定方法及び装置 | |
Zhang et al. | Feature-based assessment of text readability | |
Gakis et al. | Design and implementation of an electronic lexicon for Modern Greek | |
Dinu et al. | Alternative measures of word relatedness in distributional semantics | |
Marian | Orthographic and phonological neighborhood databases across multiple languages | |
Anttila | Automatic Text Summarization | |
Luong et al. | Assessing vietnamese text readability using multi-level linguistic features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090109 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111125 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20111125 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120309 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120321 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120322 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150406 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |