JP3698454B2 - 並列句解析装置および学習データ自動作成装置 - Google Patents

並列句解析装置および学習データ自動作成装置 Download PDF

Info

Publication number
JP3698454B2
JP3698454B2 JP08251095A JP8251095A JP3698454B2 JP 3698454 B2 JP3698454 B2 JP 3698454B2 JP 08251095 A JP08251095 A JP 08251095A JP 8251095 A JP8251095 A JP 8251095A JP 3698454 B2 JP3698454 B2 JP 3698454B2
Authority
JP
Japan
Prior art keywords
parallel
learning
phrase
dependency
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP08251095A
Other languages
English (en)
Other versions
JPH08278973A (ja
Inventor
秀 富士
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP08251095A priority Critical patent/JP3698454B2/ja
Publication of JPH08278973A publication Critical patent/JPH08278973A/ja
Application granted granted Critical
Publication of JP3698454B2 publication Critical patent/JP3698454B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、学習辞書を参照して入力文中の並列構造を認識する並列句解析装置および学習データを作成する学習データ自動作成装置に関するものである。並列句解析装置や学習データ自動作成装置は、自然言語解析システムの中に存在する。
【0002】
一般に出回っている文書にはかなりの数の並列構造が含まれている。機械翻訳システムや文書推敲支援システムなどの自然言語解析システムでは、これらの並列構造を正しく認識しなければ正しい解析を行うことが出来ない。並列構造の認識を誤ると、殆どの場合、文意が正しく解釈できなくなり、解析全体として見ると致命的である。
【0003】
【従来の技術】
自然言語解析システムでは、並列構造を認識するための仕組みとして、次のようなものが考案され、実現されている。
1.システム操作者が並列構造を対話的に指定するもの。
システム解析できるところまで自動的に解析を行い、並列構造の曖昧性が生じた時点で、システム操作者に並列の範囲を指定させる。並列範囲の周囲に括弧付けさせるもの等がある。また、可能な並列候補を提示して操作者に正しいものを選ばせるものもある。
2.構文情報を使うもの。
並列候補の中で、構文的に妥当なもののみを使う。ただし、構文的に妥当な並列候補が複数ある場合があるので、この方法のみでは正しいものを見つけることが出来ない。
3.並列構造のバランスを使うもの。
並列候補の中で、並列キー両側の並列要素のバランスの良いものを優先的に正解として扱う。
4.用言の格情報を使うもの。
並列要素が、係り受け関係を持つとき、この係り受けの妥当性を加味して計算を行う。
5.意味属性を使うもの。
並列要素候補の意味属性から、その並列要素の妥当性を計算する。
6.上記の複数の情報を統合して使うもの。
【0004】
【発明が解決しようとする課題】
上述したような従来の並列構造認定では、使っている情報が固定的なものが多いので、或る分野に特徴的な並列構造を精度よく認識することが難しかった。分野に特徴的な並列構造とは、例えば文書処理の分野では、「書き込み」と「読み出し」、「作成」と「更新」と「保存」などがある。このような分野依存の構造は一般的な情報から或る程度は認識することが出来るが、分野に合わせて調整でき、確実な認識が出来るような装置が必要となる。
【0005】
また、上述したように並列構造は分野毎に特徴があるが、文書毎に特徴があることも多い。すなわち、或る特定の文書で一度使われた並列表現は、同一文書内で同じような形で再度使われることが多い。このような文脈依存の情報も合わせた調節が出来ることが望ましい。
【0006】
本発明は、この点に鑑みて創作されたものであって、分野や文脈依存の並列構造の知識を自動的に作成する学習データ自動作成装置を提供することを目的としている。
また、本発明は、学習データ作成自動装置によって作成された学習データを参照して、並列構造認識を行う並列句解析装置を提供することを目的としている。
【0007】
【課題を解決するための手段】
請求項の学習データ自動作成装置は、学習文を形態素に分解する形態素解析部と、形態素列を文節列に合成する文節合成部と、文節列の中から名詞と並列助詞という形を持つ文節である並列キーを見つけ出す並列キー判定部と、文節列および並列キーから、学習文の並列型を判定する並列型分類部と、文節列から、学習文の係り受け型を判定する係り受け型分類部と、学習文の並列型に基づいて、学習文における並列構造に曖昧性があるかを判断し、学習文の並列構造に並列の曖昧性がない並列要素だけを並列要素抽出の対象とする並列要素抽出部と、学習文の係り受け型に基づいて、係り受け要素を学習文から抽出する係り受け要素抽出部とを具備することを特徴とするものである。
【0009】
請求項の学習データ自動作成装置は、前記係り受け要素抽出部が、係り受け型分類部の出力結果の内、学習文の並列構造に係り受けの曖昧性がないものだけを係り受け要素抽出の対象とすることを特徴とするものである。
【0010】
請求項の学習データ自動作成装置は、前記並列要素抽出部が、並列型分類部の出力結果の内、学習文の並列構造に並列の曖昧性がある場合でも、全ての可能な並列の組合せに対して並列要素抽出を行い、頻度の高い並列要素のみを学習データとして登録することを特徴とするものである。
【0011】
請求項の学習データ自動作成装置は、前記係り受け要素抽出部が、係り受け型分類部の出力結果の内、学習文の並列構造に係り受けの曖昧性がある場合でも、全ての可能な並列の組合せに対して係り受け要素抽出を行い、頻度の高い係り受け要素のみを学習データとして登録することを特徴とするものである。
【0012】
請求項の並列句解析装置は、入力文を形態素列に分解する形態素解析部と、形態素列から文節列を合成する文節合成部と、並列要素および係り受け要素を記憶する学習辞書と、文節列の中から名詞と並列助詞という形を持つ文節である並列キーを見つけ出す並列キー判定部と、文節列および並列キーから、入力文の並列型を判定する並列型分類部と、文節列から、入力文の係り受け型を判定する係り受け型分類部と、入力文の並列型を参照して入力文から並列要素を抽出し、学習辞書に登録する並列要素抽出登録部と、入力文の係り受け型を参照して入力文から係り受け要素を抽出し、学習辞書に登録する係り受け要素抽出登録部と文節列および学習辞書の内容に基づいて、入力文中に存在する並列句の認識を行う並列構造認識部とを具備することを特徴とするものである。
【0013】
請求項の並列句解析装置は、請求項の並列句解析装置において、並列構造認識部が、文脈の学習データを事前の学習によって得られた学習データに優先させることを特徴とするものである。
【0014】
【作用】
本発明の学習データ自動作成装置の作用について説明する。例えば、「編集と印刷を行なう」と言う学習文が入力されると、この学習文は「編集」「と」「印刷」「を」「行な」「う」「。」と言う形態素列に変換される。
【0015】
この形態素列から文節列が作成される。上述の学習文に対応する文節列は、
「編集と」文節型=体(並) 係り受け型=体
「印刷を」文節型=体 係り受け型=用
「行なう。」文節型=用 係り受け型=×
と言うものである。上述の文節列の中に存在する並列キーは「編集と」と言う文節である。「編集と」の係り先は体言であり、この例では「編集と」に係る体言は「印刷を」しか存在しないので、学習文から「編集と印刷」と言う並列要素が抽出される。
【0016】
「文書の編集を行なう。」と言う学習文が学習データ作成装置に入力されると、この学習文は「文書」「の」「編集」「を」「行な」「う」「。」と言う形態素列に変換される。
【0017】
この形態素列から文節列が作成される。上述の学習文に対応する文節列は、
「文書の」文節型=体 係り受け型=体
「印刷を」文節型=体 係り受け型=用
「行なう。」文節型=用 係り受け型=×
と言うものである。この文節列において、「文書の」の係り先になるものは「印刷を」と言う文節しか存在しないので、学習文から「文書の印刷」と言う係り受け要素が抽出される。
【0018】
本発明の並列句解析装置の作用について説明する。学習辞書には、例えば「編集,印刷」「作成,更新,削除」「解析,生成」「分割,合成」などの並列要素と、「文書の作成」「文書の編集」「文書の更新」「文書の印刷」と言う係り受け要素が格納されている。例えば「編集と印刷を行なう」と言う文が入力されると、この入力文は「編集」「と」「印刷」「を」「行な」「う」「。」と言う形態素列に変換される。各形態素には文法上の属性が付加されている。文法上の属性とは、例えば「編集」がサ変名詞と言うものである。
【0019】
この形態素列から文節列が作成される。上述の入力文に対応する文節列は、
「編集と」文節型=体(並) 係り受け型=体
「印刷を」文節型=体 係り受け型=用
「行なう。」文節型=用 係り受け型=×
と言うものである。上述の文節列から、「編集と」が体言属性を持ち、且つ並列キーであり、「編集と」の係り先が体言であることが判る。
【0020】
「編集と」が並列キーであり、並列の相手が体言であり、学習辞書に「編集,印刷」と言う並列要素が登録されているので、「編集の」の並列相手が「印刷」であることが判る。
【0021】
【実施例】
図1は本発明の学習データ作成装置の例を示す図である。同図において、1は形態素解析部、2は文節合成部、3は並列キー判定部、4は並列型分類部、5は並列要素抽出部、6は係り受け型分類部、7は係受け関係抽出部をそれぞれ示している。
【0022】
形態素解析部1は、学習文を受け取り、学習文を形態素列に分解する。文節合成部2は、上述の形態素解析結果で得られた形態素列を文節に組み上げる。ここで言う文節とは、標準的な学校文法に基づく文節である。名詞や動詞などの自立語に、付属語が付いた形が多い。並列キー判定部3は、文節合成部2によって合成された文節列から文節のキーとなるものを判定する。並列キーとは、例えば「編集(名詞)と(並立助詞)」と言う形を持つ文節を意味している。
【0023】
並列型分類部4は、これまでに求めた文節および並列キーの情報から、入力文の並列型を分類する。並列型とは、例えば並列キーとされた文節と並立し得る文節が1個か複数個かを表すものである。並列要素抽出部5は、並列型分類部4で判定された学習文の並列型から、その学習文が学習に有用なものであるかどうかを判断し、有用であれば、その学習文からから並列要素を取り出す。取り出された並列要素は、後述の並列要素学習辞書に書き込まれる。
【0024】
係り受け型分類部6は、文節合成部2によって得られた文節列から、学習文の係り受け型を判定する。係り受け型とは、例えば係り元の文節の係り先となり得る文節が1個か複数個かを表すものである。係り受け関係抽出部7は、係り受け型分類部6によって判定された係り受け型から、学習文が係り受け情報を抽出するのに適当であるかどうかを判断し、適当であれば係り受け要素を取り出す。取り出された係り受け要素は、後述の係り受け要素学習辞書に格納される。
【0025】
図2は学習データ作成のための処理の流れを示す図である。ステップS1では、入力文が入力される。ステップS2では、入力文が形態素に分解される。ステップS3では、形態素列が文節列に組み上げられる。ステップS4では、文節列から並列型が判定される。ステップS5では、この判定結果から入力文が学習に適しているかどうかが判定される。学習に適している場合は、ステップS6で並列要素が並列要素学習辞書に登録される。
【0026】
ステップS7では、ステップS3で得られた文節列から係り受け型が判定される。ステップS8では、判定された係り受け型が学習に適しているか否が判断される。学習に適している場合は、ステップS9で係り受け要素を係り受け要素学習辞書に登録する。ステップS10では、入力文が最後の文かどうかを判定し、最後であれば終了する。最後でなければ、ステップS1に戻って次の入力文を受け付ける。
【0027】
図3は学習データ作成を説明する図である。図3(a) は、学習データである。図3(b) は、学習データに形態素解析をかけ、形態素列に分解したものである。図3(c) は、形態素列を文節に組み上げたものである。各文節には、文節の型および係り得る先の文節型を示してある。図3(c) は次のことを示す。「編集と」と言う文節が、体言であること、並列キーであること、係り先は体言であることを示す。また、「印刷を」と言う文節が、体言であること、係り先が用言であることを示す。更に、「行なう。」と言う文節が、用言であること、係り先がないことを示す。
【0028】
図3(c) によって、「編集と」と言う文節が並列キーであることが認識される。この文では、「編集と」と並列になり得る文節は「印刷を」しかないので、並列の曖昧性はなく、よって確実に並列要素を特定することが出来る文である。このことから、この文は、並列要素抽出に適した文であることが判断される。このような並列要素データを抽出して蓄積したものが、図3(e) の並列要素学習辞書である。
【0029】
図3(d) は「文書の編集を行う」と言う学習文から、文節を取り出したものである。この文は、「編集を」の対象として「文書の」しかあり得ず、係り受けの曖昧性がない。したがって、この文は係り受け要素抽出に適していると判断され、係り受け要素が抽出される。このようにして抽出された係り受け要素を蓄積したものが図3(e) の係り受け要素学習辞書である。
【0030】
図4は並列構造の曖昧性を説明する図である。本発明では、並列構造の型で文を分類し、入力文が学習に向いているかどうかを判定する。以下の例では、仮に“並列構造を含む文で、且つ、並列の曖昧性のない文”が学習に向いた文だとする。図4(a) および(b) の文は、ともに「読みだしと」と言う並列キーを持っているので、並列構造を持った文と言える。
【0031】
更に、図4(a) によると、「読みだしと」の係り先(この場合は並列の相手)は体言であるが、「読みだしと」の後には「ファイルへの」と言う体言と「書き込み」と言う体言があり、どちらに係るかは曖昧である。このようにして、この文は「並列構造に曖昧性がある」と判定される。一方、図4(b) においては、「読み出しと」の係り先(並列の相手)としては「書き込み」しか存在しないので、並列の曖昧性がない。このようにして、この文は「並列の曖昧性がない」と判定される。
【0032】
図5は係り受けの曖昧性を説明する図である。本発明においては、係り受け型で文を分類し、入力文が学習に向いているかどうかを判定する。以下の例では、仮に「係り受けの曖昧性のない文」が学習に向いた文だとする。図5(a) においては、「ファイルへ」と言う体言文節は用言に係るが、「ファイルへ」の後には「書き込まれた」と「読み出す」の2つの用言文節があり、どちらに係るかは本格的な解析をしないと判定できない。よって、この文を「係り受けの曖昧性のある文」と判定する。図5(b) では、「ファイルへの」の係り先は「読み出す」しかないので、この文は「係り受けの曖昧性のない文」だと判定される。
【0033】
学習文の並列構造における係り受けの曖昧性について例をあげて説明する。
例1(曖昧性なし):「東京および大阪に行った」
例2(曖昧性あり):「東京および大阪の町に行った」
例1では、「東京」と「大阪」が並列になっており、よって「行った」は「東京」と「大阪」の両方にかかると言うことが、一意に認識できる。例2では、「東京」と「大阪」が並列であると言う解釈と、「東京」と「大阪の町」が並列になっていると言う解釈ができる。よって、「行った」が「東京」と「大阪」にかかると言う解釈と、「行った」が「東京」と「町」にかかると言う解釈の両方ができる。このことから、この例文の係り受けは曖昧であると言える。
【0034】
以上のような操作を全ての学習文に対して行い、学習データの蓄積を行う。上述の例では、曖昧性のない文のみを学習の対象にするようになっているが、曖昧性がある場合には、全ての可能な組合せに展開してから学習辞書に蓄積し、頻度の低いものは捨てるような方法を取ることも出来る。例えば、上述の例1の場合は、全ての可能な組合せは、「東京に行った。」「大阪に行った。」になり、上述の例2の場合は、全ての可能な組合せは、「東京に行った。」「東京の町に行った。」「大阪の町に行った。」になる。
【0035】
図6は本発明の並列句解析装置の例を示す図である。同図において、1は形態素解析部、2は文節合成部、8は並列構造認識部、9は並列要素学習辞書、10は係り受け要素学習辞書をそれぞれ示す。
【0036】
形態素解析部1は、解析対象の入力文を形態素に分解する。文節合成部2は、上述の形態素列を文節列にまとめあげる。並列構造認識部8は、上述の文節列から並列構造を認識する。並列構造認識部8は、認識のために、並列要素学習辞書9および係り受け要素学習辞書10を参照する。これら並列要素学習辞書9および係り受け要素学習辞書10は、学習データ作成装置(図1を参照)によって、解析に先立って作成しておくものである。
【0037】
図7は学習データを使用して並列句解析を行うための処理の流れを示す図である。ステップS1では、文が入力される。ステップS2では、入力文が形態素に分解される。ステップS3では、形態素列が文節に組み上げられる。ステップS4では、学習段階で作成された学習辞書を参照しながら、並列句認識を行う。
【0038】
図8は並列構造の認識を説明する図である。図8(a) は解析対象の入力文である。図8(b) は入力文を文節に分解したものである。図8(c) は文節列から作ることが出来る並列の組合せの例である。図中、組合せは括弧で表してある。ここで、それぞれの組合せから得られる,全ての並列要素の組と係り受け要素の組について、学習辞書を検索する。検索した結果、要素が辞書に存在したものを,右側に並べてある。この中で、上から3番目の組合せが,学習辞書の内容にもっとも沿ったものであるので、並列句認識結果として出力する。図8(d) は、この出力結果である。なお、それぞれの組合せについて従来手法による点数付けを行っておき、この点数に学習辞書の検索結果の点数を加味して候補を選ぶようにしても良い。
【0039】
図9は本発明の文脈追従型並列句解析装置の例を示す図である。同図において、1は形態素解析部、2は文節合成部、3は並列キー判定部、4は並列型分類部、6は係り受け型分類部、8は並列構造認識部、9は並列要素学習辞書、10は係り受け要素学習辞書をそれぞれ示している。
【0040】
図9の文脈追従型並列句解析装置は、学習辞書を用いて並列句解析を行う装置において、学習辞書の学習も同時に行うようにしたものである。基本的には、学習のための構成と認識のための構成を組み合わせたような構成になっている。
【0041】
図中、並列キー判定部3までは普通の並列句解析装置と同じである。並列型分類部4および係り受け型分類部6は、並列構造認識処理中に、並列キー判定部3からの文節列を監視しており、学習に適当な文の場合には、並列要素学習辞書9又は係り受け要素学習辞書10に学習データを追加する。並列構造認識部8は、この動的に変化する学習辞書9,10を参照しながら、認識処理を行う。よって、学習が起こった次の文の認識から、この学習結果が並列構造認識部8に反映されるようになる。
【0042】
図9の文脈追従型並列句解析装置においては、学習辞書の中には、現文書の認識前から存在する学習データと、現文書の認識中に抽出された学習データとが存在することになるが、現文書の認識中で抽出された学習データの重みを、現文書の認識前から存在する学習データの重みよりも大きくすることが出来る。
【0043】
【発明の効果】
以上の説明から明らかなように、本発明によれば、並列句認識を行う際に、解析対象の分野に多用されるような並列表現を確実に認識することが出来る。また、この際に用られる学習データを,人手作業なしに自動的に作成することが出来る。
【図面の簡単な説明】
【図1】本発明の学習データ作成装置の例を示す図である。
【図2】学習データ作成のための処理の流れを示す図である。
【図3】学習データの作成を説明する図である。
【図4】並列構造の曖昧性を説明する図である。
【図5】係り受けの曖昧性を説明する図である。
【図6】本発明の並列句解析装置の例を示す図である。
【図7】学習データを用いて並列句解析を行うための処理の流れを示す図である。
【図8】並列構造の認識を説明する図である。
【図9】本発明の文脈追従型並列句解析装置の例を示す図である。
【符号の説明】
1 形態素解析部
2 文節合成部
3 並列キー判定部
4 並列型分類部
5 並列要素抽出部
6 係り受け分類部
7 係り受け関係抽出部
8 並列構造認識部
9 並列要素学習辞書
10 係り受け要素学習辞書

Claims (6)

  1. 学習文を形態素に分解する形態素解析部と、形態素列を文節列に合成する文節合成部と、
    文節列の中から、名詞と並列助詞という形を持つ文節である並列キーを見つけ出す並列キー判定部と、
    文節列および並列キーから、学習文の並列型を判定する並列型分類部と、
    文節列から、学習文の係り受け型を判定する係り受け型分類部と、
    学習文の並列型に基づいて、学習文における並列構造に曖昧性があるかを判断し、学習文の並列構造に並列の曖昧性がない並列要素だけを学習文から抽出する並列要素抽出部と、
    学習文の係り受け型に基づいて、係り受け要素を学習文から抽出する係り受け要素抽出部とを具備する
    ことを特徴とする学習データ自動作成装置。
  2. 学習文を形態素に分解する形態素解析部と、形態素列を文節列に合成する文節合成部と、
    文節列の中から、名詞と並列助詞という形を持つ文節である並列キーを見つけ出す並列キー判定部と、
    文節列および並列キーから、学習文の並列型を判定する並列型分類部と、
    文節列から、学習文の係り受け型を判定する係り受け型分類部と、
    学習文の並列型に基づいて、並列要素を学習文から抽出する並列要素抽出部と、
    学習文の係り受け型に基づいて、学習文における並列構造に係り受けの曖昧性があるかを判断し、学習文の並列構造に係り受けの曖昧性がない係り受け要素だけを係り受け要素抽出の対象とする係り受け要素抽出部とを具備する
    ことを特徴とする学習データ自動作成装置。
  3. 学習文を形態素に分解する形態素解析部と、形態素列を文節列に合成する文節合成部と、
    文節列の中から、名詞と並列助詞という形を持つ文節である並列キーを見つけ出す並列キー判定部と、
    文節列および並列キーから、学習文の並列型を判定する並列型分類部と、
    文節列から、学習文の係り受け型を判定する係り受け型分類部と、
    学習文の並列型に基づいて、学習文における並列構造に曖昧性があるかを判断し、学習文の並列構造に並列の曖昧性がある場合でも、全ての可能な並列の組合せに対して並列要素抽出を行い、頻度の高い並列要素のみを学習データとして登録する並列要素抽出部と、 学習文の係り受け型に基づいて、係り受け要素を学習文から抽出する係り受け要素抽出部とを具備する
    ことを特徴とする学習データ自動作成装置。
  4. 学習文を形態素に分解する形態素解析部と、形態素列を文節列に合成する文節合成部と、
    文節列の中から、名詞と並列助詞という形を持つ文節である並列キーを見つけ出す並列キー判定部と、
    文節列および並列キーから、学習文の並列型を判定する並列型分類部と、
    文節列から、学習文の係り受け型を判定する係り受け型分類部と、
    学習文の並列型に基づいて、並列要素を学習文から抽出する並列要素抽出部と、
    学習文の係り受け型に基づいて、学習文における並列構造に係り受けの曖昧性があるかを判断し、学習文の並列構造に係り受けの曖昧性がある場合でも、全ての可能な並列の組合せに対して係り受け要素抽出を行い、頻度の高い係り受け要素のみを学習データとして登録する係り受け要素抽出部とを具備する
    ことを特徴とする学習データ自動作成装置。
  5. 入力文を形態素列に分解する形態素解析部と、形態素列から文節列を合成する文節合成部と、
    並列要素および係り受け要素を記憶する学習辞書と、
    文節列の中から名詞と並列助詞という形を持つ文節である並列キーを見つけ出す並列キー判定部と、
    文節列および並列キーから、入力文の並列型を判定する並列型分類部と、
    文節列から、入力文の係り受け型を判定する係り受け型分類部と、
    入力文の並列型を参照して、入力文から並列要素を抽出し、学習辞書に登録する並列要素抽出登録部と、
    入力文の係り受け型を参照して入力文から係り受け要素を抽出し、学習辞書に登録する係り受け要素抽出登録部と文節列および学習辞書の内容に基づいて、入力文中に存在する並列句の認識を行う並列構造認識部とを具備する
    ことを特徴とする並列句解析装置。
  6. 並列構造認識部が、文脈の学習データを事前の学習によって得られた学習データに優先させる
    ことを特徴とする請求項の並列句解析装置。
JP08251095A 1995-04-07 1995-04-07 並列句解析装置および学習データ自動作成装置 Expired - Fee Related JP3698454B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08251095A JP3698454B2 (ja) 1995-04-07 1995-04-07 並列句解析装置および学習データ自動作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08251095A JP3698454B2 (ja) 1995-04-07 1995-04-07 並列句解析装置および学習データ自動作成装置

Publications (2)

Publication Number Publication Date
JPH08278973A JPH08278973A (ja) 1996-10-22
JP3698454B2 true JP3698454B2 (ja) 2005-09-21

Family

ID=13776525

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08251095A Expired - Fee Related JP3698454B2 (ja) 1995-04-07 1995-04-07 並列句解析装置および学習データ自動作成装置

Country Status (1)

Country Link
JP (1) JP3698454B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6576141B2 (ja) * 2015-07-28 2019-09-18 Kddi株式会社 特性語によってグループ状態を推定可能なプログラム
JP6663881B2 (ja) * 2017-04-13 2020-03-13 日本電信電話株式会社 並列句解析装置、並列句解析モデル学習装置、方法、及びプログラム

Also Published As

Publication number Publication date
JPH08278973A (ja) 1996-10-22

Similar Documents

Publication Publication Date Title
US6721697B1 (en) Method and system for reducing lexical ambiguity
Lee et al. Deterministic coreference resolution based on entity-centric, precision-ranked rules
US8527262B2 (en) Systems and methods for automatic semantic role labeling of high morphological text for natural language processing applications
US6223150B1 (en) Method and apparatus for parsing in a spoken language translation system
US6243669B1 (en) Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6442524B1 (en) Analyzing inflectional morphology in a spoken language translation system
US6278968B1 (en) Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6816830B1 (en) Finite state data structures with paths representing paired strings of tags and tag combinations
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
WO2008107305A2 (en) Search-based word segmentation method and device for language without word boundary tag
JP2001523019A (ja) テキストの本文の談話構造の自動認識
KR20080033325A (ko) 정의 추출
US11386269B2 (en) Fault-tolerant information extraction
KR100481598B1 (ko) 복합 형태소 분석 장치 및 방법
Márquez Part-of-speech Tagging: A Machine Learning Approach based on Decision Trees
JP3698454B2 (ja) 並列句解析装置および学習データ自動作成装置
Kuba et al. POS tagging of Hungarian with combined statistical and rule-based methods
Jafar Tafreshi et al. A novel approach to conditional random field-based named entity recognition using Persian specific features
JP3326646B2 (ja) 機械翻訳システム用辞書・ルール学習装置
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
Jaruskulchai An automatic indexing for Thai text retrieval
Galicia-Haro Using electronic texts for an annotated corpus building
Qayyum et al. Comparison of Parsers Dealing with Text Ambiguity in Natural Language Processing
JP2002278963A (ja) 事例翻訳装置
Ahmed Detection of foreign words and names in written text

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020416

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050613

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050705

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080715

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090715

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100715

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100715

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110715

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110715

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120715

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120715

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130715

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees