JP3433827B2 - 句構造抽出装置 - Google Patents

句構造抽出装置

Info

Publication number
JP3433827B2
JP3433827B2 JP25303193A JP25303193A JP3433827B2 JP 3433827 B2 JP3433827 B2 JP 3433827B2 JP 25303193 A JP25303193 A JP 25303193A JP 25303193 A JP25303193 A JP 25303193A JP 3433827 B2 JP3433827 B2 JP 3433827B2
Authority
JP
Japan
Prior art keywords
delimiter
verb
phrase
word
phrase structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25303193A
Other languages
English (en)
Other versions
JPH07105215A (ja
Inventor
秀 子 森
野 正 永
根 聡 関
橋 雅 則 高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP25303193A priority Critical patent/JP3433827B2/ja
Publication of JPH07105215A publication Critical patent/JPH07105215A/ja
Application granted granted Critical
Publication of JP3433827B2 publication Critical patent/JP3433827B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は、文書処理および自然言
語処理に利用される句構造抽出装置および構文チェック
装置に関するものである。 【0002】 【従来の技術】従来の自然言語処理における句構造抽出
装置は、特開昭64−38875号公報に開示されてい
るように、入力文に形態素解析を施した後、文や句の取
りうる構造を記述した統語規則を適用することにより、
入力文から規則と整合する文や句の構造を抽出するもの
であった。また、従来の構文チェック装置は、特開平2
−226364号公報に開示されているように、誤った
文法を用いて統語規則を記述し、構文解析中に入力文が
そのパターンに合致すると分かれば、誤りを含むと判断
していた。 【0003】しかしながら、このような句構造抽出装置
は、根本となる手法に構文解析を用いるために、ある単
語列に対する品詞の多義性すべてを考慮しなければなら
ず、1つ1つの品詞に対して統語規則を適用していく必
要があり、処理速度が遅くなるとともに、係り受け構造
の複雑なまたは曖昧な入力文には対処できないという問
題があった。また上記従来の構文チェック装置では、入
力文の正誤にかかわらず、正しい文に対する通常の統語
規則と誤りに対処するための統語規則の両方を適用する
ので、パターンが適切かどうかを判断するのに必要な評
価回数が、誤り統語規則と入力単語の数および入力単語
の該当する品詞の数に比例して増えることになり、誤り
解析はできても全体の処理速度は通常の構文解析よりも
さらに遅くなるという問題があった。 【0004】このような構文解析による句構造抽出装置
および構文チェック装置における問題を解決するため
に、特開平4−235672号公報には、文の切れ目に
関する人間の経験的な知識をルール化した切れ目ルール
を適用し、文の切れ目を最適化してボトムアップ的に構
文解析する方法が開示されている。また特開平5−54
063号公報には、解析構文木を構築する構文解析の手
法を用いずに、be動詞や前置詞等の特定の語句のテーブ
ルを複数用意し、これに合致する単語が入力文中に現れ
た場合には、その単語から所定の句構造が成立している
ものと仮定し、これをユーザに見せてユーザによりその
句構造の範囲を修正しながら解析を進める方法が開示さ
れている。 【0005】 【発明が解決しようとする課題】しかしながら、上記特
開平4−235672号公報記載の方法は、入力された
文に対しまず構文解析を行ない、これが失敗して構分解
析木を構築できない場合に、切れ目ルールを適用して入
力文の切れ目を自動的に最適化した後、改めて構文解析
を繰り返すため、やはり処理速度が遅くなるとともに、
切れ目ルール自体が、最終的に解析構文木が構築できる
ような文法規則から構成されているため、入力文中に文
法的な誤りがある非文の場合には対処することができな
いという問題があった。 【0006】一方、特開平5−54063号公報記載の
方法は、構文解析木を構築する構文解析の手法を用いて
いないため、解析の負荷を軽くでき、解析精度の向上を
期待できるものの、特定の語句のテーブルを用いてあら
かじめ推定した句構造をユーザに提示して確認してもら
う作業を必要とするため、処理の自動化ができないとい
う問題があった。 【0007】本発明は、このような従来の問題を解決す
るものであり、解析構文木を構築することなしに構文解
析を行なうことができ、処理速度が速くかつ文法的に誤
りのある非文が入力されても、ユーザの介入なしに自動
的に対処することのできる句構造抽出装置および構文チ
ェック装置を提供することを目的とする。 【0008】 【課題を解決するための手段】上記目的を達成するため
に、本発明の句構造抽出装置は、句構造の存在および位
置についての情報をもたらす句構造の区切り語を、名詞
句については代名詞になりうるか否かを規定し、動詞句
については助動詞になりうるか、動詞か助動詞にしかな
らないか、或いは副詞かを規定する品詞特性、名詞句に
ついては所有格かそれ以外か、または限定なしかを規定
し、動詞句については限定なしかまたは動詞を修飾する
か否かを規定する文法特性、および、名詞句および動詞
句について、副詞は文章中で動詞の前後位置に現れ、そ
の他については限定なしを規定する位置特性を用いて定
義し、前記区切り語を句構造を構成する際の性質によっ
て分類してなる区切り語定義データに基づいて、入力文
の形態素解析結果に対する区切り語とその区切り語の種
類に対応する識別子としての区切り語マーカとを設定す
る区切り語設定部と、前記形態素解析結果に基づいて仮
定される動詞候補から、前記区切り語マーカを用いた動
詞候補削除ルールに基づいて動詞を判定し、前記動詞に
基づいて動詞句を決定する句構造獲得部とを備えること
を特徴としたものである。 【0009】 【0010】語の中には、ある種の句構造の存在や位置
についての確実な、あるいは非常に確度の高い情報をも
たらすものがある。例えば英語において、冠詞は必ず名
詞句という句構造がその語から始まるという情報をもた
らし、動詞にしかなりえない語、例えばgoの過去形went
はその位置が必ず動詞句という句構造に含まれるという
情報をもたらす。本発明では、このような単語の文法情
報および文中の単語の位置情報から句構造の存在および
位置についての情報をもたらす語を、それぞれの句構造
を区分けする語という意味で句構造の区切り語と定義す
る。 【0011】 【作用】本発明では、まず区切り語設定部が、このよう
な区切り語を定義したデータに基づいて入力文全体から
句構造についての確度の高い情報を抽出し、特定の種類
の句構造が必ず存在する範囲やその開始位置、終了位
置、あるいは逆に存在しえない位置を判断し、区切り語
として登録しておく。その上で、句構造が文中に占める
範囲の中で上記の情報だけでは確定できない部分を、句
構造獲得部が句構造獲得規則を用いて詳細決定する。詳
細決定の際、句構造の内部構造が完全に決定できなかっ
たとしても、最初の区切り語によって示された「確実な
情報」に違反しないような最も確からしい範囲を必ず決
定するようにする。こうすることによって、たとえ文法
的に誤りがあって句の内部構造が乱されたとしても、書
き手が意図した句構造の範囲を極めて高い確率で出力さ
せることができる。また、ここで抽出された句構造の情
報に基づいて構文チェックを行なえば、書き手が意図し
た文の統語構造を最大限崩さずに利用できるので、単語
レベルでは検出できない誤りを検出することができる。
例えば、大きい構造によって関連づけられる離れた2単
語間の矛盾の検出が、たとえその大きい構造に誤りが含
まれていたとしても可能となる。 【0012】句構造抽出装置における区切り語定義デー
タは、語が各種の句構造の区切り語であるための条件を
記述したものである。条件は単語の文法情報および文中
での位置情報などである。区切り語は句の種類やもたら
す情報に応じていくつかの種類に分類され、区切り語定
義データには区切り語の種類ごとにその種の区切り語で
あるための条件を記述しておく。区切り語は句の存在の
有無や句の範囲に関する情報を与える。 【0013】区切り語設定部は、区切り語定義データを
用いて入力された各単語が各種の区切り語に該当するど
うかを判定し、登録する。ここで設定された区切り語の
もたらす情報のうち句構造の存在や位置に関する限定を
表すものは、以後の処理においてそれより強い理由がな
いかぎり犯されない一種の制約とみなされる。 【0014】句構造獲得部は、各種の句に対して以下の
処理を行なう。まず区切り語によってもたらされる句の
存在、開始位置、終了位置などの情報を基に句の範囲を
仮決定する。それまでに既に確定している句構造が存在
する場合は、その情報も仮決定の際に用いられる。区切
り語による情報だけでは決定できない部分は、区切り語
のもたらす情報に違反しない最長の範囲を決定するなど
の処理を行ない必ず決定しておく。この時点で仮決定さ
れた句構造の範囲は、上述の区切り語がもたらす情報に
よる限定(制約)を全て満たす。 【0015】次に句構造獲得部は、仮決定された句構造
のそれぞれに対して句構造獲得規則を適用する。句構造
獲得規則は、句の内部構造、周囲の語句などを考慮した
最も確からしい句構造を決定するための規則である。具
体的には句構造獲得規則の適用によって、仮決定範囲内
外の語の文法情報、仮決定した位置、それまでに確定し
た句構造の情報などを条件として、仮決定した範囲の確
定、修正、分割および内部構造の決定を行なう。このと
き、区切り語のもたらす情報による限定に違反した形で
変更が行なわれるのは、それよりも強い理由がある場合
に限るように規則を作成しておく。複数の種類の句構造
を獲得する場合は、全ての種類の句に対して以上の処理
を繰り返す。 【0016】上記のような作用により、句の内部に統語
構造を乱す誤りが存在していたとしても、句の存在やそ
の開始位置、終了位置などを区切り語の設定によってあ
らかじめ限定しておくことにより、高い確率で抽出でき
るような処理を実現することができる。 【0017】また構文チェック装置では、構文チェック
ルール適用部が、文の文法情報と句構造抽出装置によっ
て抽出された句構造とを入力とし、これらに対して構文
チェックルールを適用する。構文チェックルールは、語
や句の並び方や文法情報を調査することにより誤った表
現、あるいは誤りの可能性の高い表現を検出する規則で
ある。このとき、句構造抽出装置が抽出した誤りを含む
句をも条件として利用することを許す。規則適用の結
果、誤った表現などが検出されればそれを出力部に送
る。以上のような作用により、書き手が意図した誤りを
含む句を反映した構文チェックを行なうことができ、検
出の精度を向上させることができる。 【0018】 【実施例】 (実施例1)以下に本発明の句構造抽出装置を用いて英
文から句構造を抽出し、誤りがある入力からもできるだ
け句構造を抽出する例を説明する。なお、本実施例1お
よび実施例2を通じ、従来の意味の単語と混同しないよ
う、特殊な使い方だと思われる語および特徴的な語は"
「 」" で囲った。例えば「区切り語」とあるのは、上
記したように本発明に固有な意味を持っている。また、
実施例中"NP"とあるのは名詞句、"VP"とあるのは動詞
句、" 非VP" とあるのはVPに含まれない語、"Vtmp"とあ
るのは動詞の可能性のある語、"V" とあるのは動詞抽出
処理の結果、動詞と判定された語、" 非V"とあるのは動
詞の可能性のない語、" 非NP" とあるのはNPに含まれな
い語、"NPstart" とあるのはNPを始め得る語、"NPtmp"
とあるのはNP候補、"VPtmp" とあるのはVP候補、例文
中"< >"で囲んであるのはNP候補あるいはVP候補である
単語列あるいはNP/VP と判断された単語列を表す。ただ
し、説明を簡便にするため一部の情報は割愛した。 【0019】図1は本発明の第1の実施例における句構
造抽出装置の構成を示すものである。図1において、1
1は入力部、12は「区切り語」設定部、13は「区切
り語」定義データ、14は句構造獲得部、15は句構造
獲得規則、16は出力部である。 【0020】次に、上記実施例における処理の概略を説
明する。入力部11からは単語列およびその単語列に対
する形態素解析結果が入力される。「区切り語」設定部
12は、文中の各語に対して句構造抽出のための情報を
付加するため、入力部11から入力された各単語につい
て、対応する形態素解析結果から「区切り語」定義デー
タ13をもとに「区切り語」に特徴的な情報を探し、特
徴的な情報を持つ単語にそれらの句構造における性質の
違いに応じた「区切り語」情報を付加する。 【0021】句構造獲得部14は、まず動詞になり得る
語を動詞と仮定し、次にそれらの動詞になり得る語およ
びその前後の語の「区切り語」情報と形態素情報とをも
とに、動詞としての仮定が正しいかどうか調べる。矛盾
が発見された場合は動詞であるという仮定を取り消す。
次に動詞であると判断された語をもとに句構造獲得規則
15を呼び出し、VPを抽出する。動詞であると判断され
た語を含む単語列のうち、句構造抽出で予期しているVP
のパターンのあるものと一致して、かつ最長のものをVP
とみなす。 【0022】次に句構造獲得部14は、入力された単語
列のうち、VPと判定された部分を除いた部分をNPである
と仮定する。NPであると仮定された単語列については句
構造獲得規則15を適用する。句構造獲得規則15で
は、その単語列に含まれる語およびその単語列の前後の
語の「区切り語」情報と形態素情報をもとに、NPとして
の仮定が正しいかどうか調べる。NPの可能性があると判
断されれば、NPの範囲を検討するため、NPと仮定された
単語列の最後の単語が名詞相当語句になりうるか調べ
る。これが名詞相当語句になりえなければ、その語をNP
の候補の単語列から削除し、その直前の単語について同
様のチェックを繰り返す。名詞相当語句があれば、NPが
成立したとみなし、またその名詞相当語句をNPの中心と
みなす。名詞相当語句がない場合は、その単語列がNPで
あるという仮定を取り消す。 【0023】このように、句構造の範囲を仮定し抽出す
る句構造獲得部14の結果を受けて、出力部16は、単
語列の情報にVP,NP の範囲を示す情報を付加して出力す
る。 【0024】次に、上記実施例における各部の動作を具
体的に説明する。図2は「区切り語」設定部12がある
単語に対する「区切り語」をセットする流れを示す。ま
ず入力された単語について、形態素情報および位置情報
から「区切り語」定義データ13で定義される「区切り
語」の条件に該当するかどうか調べる( ステップ21)
。その結果を評価し( ステップ22) 、ある「区切り
語」条件に該当すれば、その種類の区切り語であること
を示す識別子( 以降、「区切り語マーカ」という。) を
その単語の「区切り語」情報として設定する( ステップ
23) 。該当しなければ「区切り語」設定部12には何
の情報も入力されない。 【0025】「区切り語」定義データ13の内容例を図
3に示す。「区切り語」とは各句構造の区切りに関する
情報を与えるもので、句構造を構成する際の性質によっ
て分類されている。「区切り語」は、本実施例では品
詞、文法特性、および位置特性を用いて定義した。 【0026】この区分に従うと、例えば、助動詞haveの
過去形had は形態素情報から動詞か助動詞にしかなりえ
ないので、「NPには含まれない」点で1-C に該当し、ま
た「助動詞になりうる」点および「助動詞あるいは動詞
にしかならない」点で2-a に該当するため、「区切り
語」情報としては1-C と2-a の2種類を持つことにな
る。 【0027】このようにして、「区切り語」設定部12
からは単語列とそれに対する形態素情報および「区切り
語マーカ」が出力される。 【0028】次に句構造獲得部14は、句構造獲得規則
15を参照し、句構造を抽出する。図4は句構造獲得処
理のフローチャートである。ここにあるように句構造獲
得には、まずVPを抽出し( ステップ41) 、次にNPを抽
出する( ステップ42) 。 【0029】図5はVP抽出処理のフローチャートであ
る。まず形態素解析結果をもとに、動詞、助動詞、be動
詞になりうるものをVPを構成しうる動詞と仮定する( ス
テップ51) 。次に句構造獲得部14は、句構造獲得規
則15を参照し、それらの動詞と仮定された語およびそ
の前後の語の「区切り語」情報と形態素情報とをもと
に、動詞候補削除ルール53を参照して動詞としての仮
定が正しいかどうか調べ、矛盾が発見された場合は動詞
であるという仮定を取り消す。( ステップ52) 。ここ
で用いられる動詞候補削除ルール53としては次のよう
なものがある。 ○動詞候補の「区切り語マーカ」に「VPに含まれない」
が存在し、かつその直前の語に「直後の語がVPに含まれ
ない」があれば、その動詞候補が動詞であるという仮定
を取り消す。 【0030】次に動詞であると判定された単語をもと
に、「VPに含まれない」「区切り語」に囲まれた部分の
うち、動詞候補と、「VPに含まれる」語が含まれている
部分をVPと仮定し、句構造抽出で予期しているVPのパタ
ーンデータ55を比較する( ステップ54) 。そしてVP
候補の単語列のうち、句構造抽出で予期しているVPのパ
ターンのあるものと一致して、かつ最長のものを一つの
まとまったVPとみなす。 【0031】ここでVPのパターンデータ55の例を図6
に示す。ただし、図6の[ ]内はなくてもよい要素
を、また"V" は図5のステップ52を経て動詞と判定さ
れた語句を示す。 【0032】以上の手順でVPが抽出されたあと、句構造
獲得部14はNP抽出を行なう。図7はNPを抽出するため
のフローチャートである。まず句構造獲得部14は、VP
でない部分およびNPに含まれうる部分をNPであると仮定
する( ステップ71) 。次にNPの候補の単語列のうち、
もっとも後にある要素が名詞相当語句でなければ、その
要素をNP候補から除外する( ステップ72) 。その結果
名詞相当語句がないNP候補列については、NPの候補から
削除する( ステップ73) 。残ったNP候補列については
名詞相当語句であるもっとも後の要素を各NPの中心とな
る名詞とみなし、そのNPを確定する( ステップ74) 。 【0033】以上のようにして句構造獲得部14は、単
語列の形態素情報と「区切り語」情報から句構造の範囲
と、どれが動詞であるか、また中心となる名詞はどれで
あるかを示す情報を出力部16に出力する。 【0034】( 動作例1)以上の要素からなる本発明の
句構造抽出装置の実施例の第1の動作例として文"I did
not see the pen."の解析例を以下に説明する。動作例
1では、入力部11から単語の位置情報を含む形態素解
析結果が渡されたものと仮定している。この場合、句構
造抽出装置に渡される各単語の情報の内容例は次の通り
である。 < 形態素解析結果> 1番目の語 I -- 1.代名詞 2番目の語 did -- 1. 助動詞doの過去形 -- 2. 動詞doの過去形 3番目の語 not -- 1. 副詞 4番目の語 see -- 1. 動詞see の原形 5番目の語 the -- 1. 冠詞 -- 2. 副詞 6番目の語 pen -- 1. 名詞 -- 2. 動詞 7番目の語 . -- 1. 記号 「区切り語」設定部12は、これらの情報を「区切り
語」定義データ13と照らし合わせ、入力された各単語
がどの「区切り語」に該当するか、その性質を調べる。 【0035】「区切り語」設定部12が「区切り語」の
種類を単語情報にセットする時の手順は図2に示してあ
り、「区切り語」かどうかを評価するための特定の性質
は、図3に例示したようなものである。例えば動作例の
文の1番目の単語"I" は、図3の1-A と、2-c に該当す
るので、"I" に対する「区切り語マーカ」には1-A と2-
c を示すものがセットされる。この時点での各単語の情
報は次のようになっている。 < 形態素解析結果および「区切り語マーカ」に含まれて
いる情報> 1番目の語 I -- 1.代名詞 「区切り語マーカ」 1-A:単独でNPを構成する 2-c:VPに含まれない 2番目の語 did -- 1. 助動詞doの過去形 -- 2. 動詞doの過去形 「区切り語マーカ」 1-C:NPには含まれない 2-a:VPに含まれる 3番目の語 not -- 1. 副詞 「区切り語マーカ」 2-a:VPに含まれる 4番目の語 see -- 1. 動詞see の原形 「区切り語マーカ」 1-C:NPには含まれない 2-a:VPに含まれる 5番目の語 the -- 1. 冠詞 「区切り語マーカ」 1-B:NPの始まりを示す 2-b:その語とその直後の語がVPに含まれない 6番目の語 pen -- 1. 名詞 -- 2. 動詞 「区切り語マーカ」 該当せず 7番目の語 . -- 1. 記号 「区切り語マーカ」 1-C:NPに含まれない 2-c:VPに含まれない 【0036】句構造獲得部14への入力は、このよう
に、単語列の形態素情報にその語が該当する「区切り
語」の種類を表す情報「区切り語マーカ」を加えたもの
である。この情報をもとに句構造獲得部14がVP候補を
抽出する様子を説明する。 【0037】(a):まず形態素情報から動詞あるいは
動詞相当語句になりうるものは動詞であり、VPに含まれ
ると仮定する( 図中、その単語の下に"Vtmp"と示した)
【0038】(b):句構造獲得規則15を参照する。
(a) で動詞と仮定されたものを取り消すルールにもとづ
き、上記動詞候補の「区切り語」情報に、「VPに含まれ
ない」ものが存在し、かつその直前に、「直後に動詞が
こない」「区切り語」があれば、(a)の仮定を取り消
す。これで"pen" が動詞であるという仮定は取り消され
る。 【0039】(c) :「VPに含まれない」語( 図中、そ
の単語の下に" 非VP" と示した) にはさまれた部分のう
ち、動詞になりうるものが含まれている部分をVPの範囲
と仮定し、その範囲に含まれる語句の「句構造マーカ」
にVP候補と推定する。 I did not see the pen . 非VP V V 非VP 非VP 非VP 【0040】(d):単語列の情報にVP候補の「句構造
マーカ」( 句構造候補を"< >"で囲み、その単語列の下
に"VPtmp" と示した) を入れる。 【0041】(e):句構造の候補を句構造獲得規則1
5にあるVPのパターンと比較し、評価する。前述(d)
のVP候補"do not see"は図6の規則のうち、4)の(ii)に
最も良く一致するため一つのVPとみなされ、次のように
解析される。 【0042】NP抽出については、「区切り語」設定部1
2で"I" が単独でNPを構成しうる要素であり、また"th
e" がNPを始め得る要素、"." がNPには含まれない要素
と分かるので、これをもとに句構造獲得部14でのVP抽
出後、NP候補として"I" と"thepen" があげられる。句
構造獲得部14では、これらのNP候補に対して前述のNP
獲得規則をかけ、NPが成立するか、また成立するならば
その範囲を調べる。動作例1のNP候補"I" と"the pen"
についてはどちらも名詞相当語句を含み、規則に違反し
ないのでNPとして認められ、出力部16には入力に対し
句構造情報が付加された以下の句構造が出力される。 <I> <did not see> <the pen>. NP VP NP 【0043】(動作例2)次に、実施例1における第2
の動作例として、連続したVPが別々のVPとして扱われる
例を示すため、"The greatest novel that he wrote is
on the desk."の解析を行なう。 【0044】(a):入力された形態素解析結果に対
し、「区切り語」設定部12は次のように「区切り語」
を付加する。 1番目の語 The -- 1. 冠詞 「区切り語マーカ」 1-B:NPの始まりを示す 2-b:その語とその直後の語がVPに含まれない 2番目の語 greatest -- 1.形容詞 「区切り語マーカ」 2-c:VPに含まれない 3番目の語 novel -- 1. 名詞 -- 2. 形容詞 「区切り語マーカ」 2-c:VPに含まれない 4番目の語 that -- 1.代名詞 -- 2.限定詞 「区切り語マーカ」 1-A:単独でNPを構成する 1-B:NPの始まりを示す 2-b:その語とその直後の語がVPに含まれない 2-c:VPに含まれない 5番目の語 he -- 1.代名詞 「区切り語マーカ」 1-A:単独でNPを構成する 2-c:VPに含まれない 6番目の語 wrote -- 1. 動詞write の過去形 「区切り語マーカ」 1-C:NPには含まれない 2-a:VPに含まれる 7番目の語 is -- 1.be動詞 「区切り語マーカ」 1-C:NPには含まれない 2-a:VPに含まれる 8番目の語 on -- 1.前置詞 -- 2.副詞 「区切り語マーカ」 1-C:NPには含まれない 2-a:VPに含まれる 2-b:その語とその直後の語がVPに含まれない 2-c:VPに含まれない 9番目の語 the -- 1. 冠詞 「区切り語マーカ」 1-B:NPの始まりを示す 2-b:その語とその直後の語がVPに含まれない 10 番目の語 desk -- 1.名詞 「区切り語マーカ」 2-c:VPに含まれない 11 番目の語 . -- 1. 記号 「区切り語マーカ」 1-C:NPに含まれない 2-c:VPに含まれない 【0045】(b):(a)の情報をもとに、句構造獲
得部14は動詞になりうるものは動詞であると仮定し、
なりえないものと区別する。 The greatest novel that he wrote is on the desk . 非V 非V 非V 非V 非V Vtmp Vtmp 非V 非V 非V 非V 【0046】(c) :句構造獲得規則15にもとづき動
詞候補を検討し、動詞でないと判断されたものがあれば
動詞であるという仮定を取り消す。 The greatest novel that he <wrote> <is> on the desk . V V 【0047】(d):句構造獲得規則15にもとづき、
予期されているVPのパターンと比較しVPを確定する。"w
rote is"は図6のVPのパターンに該当しないので、それ
ぞれ独立したVPと判断される。 The greatest novel that he <wrote> <is> on the desk . 非VP 非VP 非VP 非VP 非VP VP VP 非VP 非VP 非VP 非VP 【0048】(e):残った部分についてNP抽出を行な
う。まず非NPでもVPでもない部分をNPであると仮定す
る。また、単独でNPを構成するもの「区切り語」につい
ては単独でNPであると仮定する。 <The greatest novel> <that> <he> <wrote> <is> on <the desk> . NPtmp NPtmp NPtmp VP VP 非NP NPtmp 非NP 【0049】(f):句構造獲得規則15にもとづき、
NPとして成立することがわかればそのNPを確定し、句構
造獲得処理を終る。 <The greatest novel> <that> <he> <wrote> <is> on <the desk> . NP NP NP VP VP NP 【0050】(動作例3)次に、実施例1における第3
の動作例として、疑問文"Is this a notebook?"の解析
を行なう。なお、句構造抽出装置自体は、文の構造には
関与しないので、上記動作例1、2の肯定文の場合と手
順および適用するルールに変更はない。 【0051】(a):「区切り語」設定部12は,入力
された単語の形態素情報に、「区切り語」定義データ1
3にもとづいて「区切り語」情報を付加する。この段階
での各単語の情報は以下の通りである。 1番目の単語 Is -- 1.be動詞 「区切り語マーカ」 1-C:NPに含まれない 2-a:VPに含まれる 2番目の単語 this -- 1.代名詞 -- 2.限定詞 「区切り語マーカ」 1-A:単独でNPを構成する 1-B:NPの始まりを表す 2-b:その語と直後の語がVPに含まれない 2-c:VPに含まれない 3番目の単語 a -- 1. 冠詞 「区切り語マーカ」 1-B:NPの始まりを示す 2-b:その語と直後の語がVPに含まれない 4番目の単語 notebook -- 1.名詞 「区切り語マーカ」 2-c:VPに含まれない 5番目の単語 ? -- 1. 記号 「区切り語マーカ」 1-C:NPに含まれない 2-c:VPに含まれない 【0052】(b) :動詞になりうるものは動詞である
と仮定し、動詞になりえないものは区別する。 Is this a notebook ? Vtmp 非V 非V 非V 非V 【0053】(c) :"Is"を動詞と判断し、句構造獲得
規則15を参照してVPを確定する。 Is this a notebook ? VP 非VP 非VP 非VP 非VP 【0054】(d) :NP候補にNPであることを示す句構
造マーカをつける Is <this> <a notebook> ? VP NPtmp NPtmp 【0055】(e) :句構造獲得規則15のNP抽出ルー
ルにもとづき、矛盾がないと判断されてNPが確定する。 Is <this> <a notebook> ? VP NP NP 【0056】(動作例4)次に、実施例1における句構
造抽出装置に文法的に誤った文が入力された場合の動作
を動作例4として説明する。ここでは、文法的な誤りは
あるが句構造はできる場合の動作として文"I have note
book."の解析例を示す。 【0057】(a) :本動作例4において、入力部11
から入力された単語列とそれに対応する形態素情報は次
のようになっている。 1番目の語 I -- 1.代名詞 2番目の語 have -- 1.助動詞haveの原形 -- 2.動詞haveの原形 3番目の語 notebook -- 1.名詞 4番目の語 . -- 1.記号 【0058】(b) :「区切り語」設定部12は,「区
切り語」定義データ13と(a) の情報を照らし合わせて
「区切り語」設定処理を行ない、各単語に「区切り語マ
ーカ」を付加する。 1番目の語 I -- 1.代名詞 「区切り語マーカ」 1-A:単独でNPを構成する 2-c:VPに含まれない 2番目の語 have -- 1.助動詞haveの原形 -- 2.動詞haveの原形 「区切り語マーカ」 1-C:NPに含まれない 2-a:VPに含まれる 3番目の語 notebook -- 1.名詞 「区切り語マーカ」 2-c:VPに含まれない 4番目の語 . -- 1.記号 「区切り語マーカ」 1-C:NPに含まれない 2-c:VPに含まれない 【0059】(c) :句構造獲得部14は、まず動詞に
なりうるものを動詞と仮定する。 I have notebook . 非V Vtmp 非V 【0060】(d):句構造獲得部14は、句構造獲得
規則15にもとづいてVPを確定する。 I <have> notebook. 非VP VP 非VP 【0061】(e) :句構造獲得部14は、非NPではな
く、かつVPに含まれない部分をNPであると仮定する。 <I> <have> <notebook> . NPtmp VP NPtmp 非NP 【0062】(f) :句構造獲得部14は、句構造獲得
規則15にもとづいてNPを確定する。 <I> <have> <notebook> . NP VP NP 【0063】このようにして、"notebook"には必要な修
飾語句、例えば冠詞がついていないが、句構造抽出処理
の結果NPと推測される。同様に、例えば複数形の名詞に
不定冠詞がついた例についても同じ手順で処理される。
例えば文"That gentleman had a books." の最後の"a b
ooks."という部分は「区切り語」抽出の結果 NP を始め
る要素、名詞になり得る語、名詞句の終り、の並びと解
釈されるので、NP候補の範囲のとして”a books ”が抽
出され、”books ”が名詞になりうることから、正しい
句構造"a book." の場合と同様に句構造が成立したとみ
なされ、結果は"a books" がNPと認識されて出力され
る。 【0064】(動作例5)次に実施例1における第5の
動作例として誤った文が入ってきたとき、その誤りが原
因で句構造ができなかった場合の動作例を説明する。例
として冠詞に対する名詞がない、"This is an." の解析
過程を以下に示す。 【0065】(a) :入力部11から入力された単語列
とその形態素情報をもとに、「区切り語」設定部12は
「区切り語」情報を付加する。この時の情報は次のとお
り。 1番目の語 This -- 1.代名詞 -- 2.限定詞 「区切り語マーカ」 1-A:単独でNPを構成する 1-B:NPの始まりを示す 2-b:その語と直後の語がVPに含まれない 2-c:VPに含まれない 2番目の語 is -- 1.be動詞 「区切り語マーカ」 1-C:NPに含まれない 2-a:VPに含まれる 3番目の語 an -- 1.冠詞 「区切り語マーカ」 1-B:NPの始まりを示す 2-b:その語と直後の語がVPに含まれない 4番目の語 . -- 1. 記号 「区切り語」情報 1-C:NPに含まれない 2-c:VPに含まれない 【0066】(b) :句構造獲得部14が動詞になりう
るものを動詞と仮に判断する。 This <is> an . 非V Vtmp 非V 非V 【0067】(c) :VP確定 This <is> an . 非VP VP 非VP 非VP 【0068】(d) :NP候補にNPでありうることを示す
句構造マーカをつける。 <This> <is> an . NPtmp VP NPstart 非NP 【0069】(e) :NP抽出規則から、"This"は単独で
NPとして成立するが、名詞相当語句を含まないNP候補"a
n"をNPではないと判断、句構造を確定する。 <This> <is> an . NP VP NPstart "an"は次のNPの終りを示す語との間に名詞になり得る語
が必要だが、それがなかったため「句構造マーカ」は取
り消しになり、「区切り語マーカ」のみ残る。このよう
に入力が誤っていてそれが原因で句構造ができなかった
場合は「区切り語マーカ」の情報に、「句構造マーカ」
と矛盾するものが存在することになる。 【0070】以上のように、上記第1の実施例における
句構造抽出装置においては特定の性質を持った語句の情
報を句構造を構成する上での特徴によって再分類するこ
とにより、句構造の種類と範囲およびその構造を設定す
ることができる。すなわち本実施例においては、句構造
の区切りとなる語を品詞で決める際に、ある品詞が「あ
る句構造に含まれうるか」、「ある句構造に必ず含まれ
るか」、「ある句構造に含まれないか」で分けており、
ある単語が複数の「区切り語」に該当することを許し、
その中で経験的知識を用いて優先順位を付け、選択を行
なっている。また、単純にある単語が出てきたときに句
構造を決めるのではなく、その単語に他の「区切り語」
としての性質があればそれも考慮する。この結果、関係
詞、接続詞も「区切り語」となり、動詞句についても
「ある句構造に含まれうるか」で「区切り語」を設定し
ているため、動詞句も抽出することができる。さらに、
ある単語が多品詞であった場合に、複数の「区切り語」
に該当することを許しているため、多品詞で解析が間違
えやすい場合でも、品詞を断定する方法よりも精度がよ
くなる。例えば、”That boy ran away as he saw the
man.”のような文では、asを前置詞と解釈するようなこ
とがない。さらに、文法的な誤りのある非文を構文情報
を使わずに解析することができるので、例えば、構文解
析によって主語と動詞が分かっていなくても、句構造の
並びや位置から文の構造を推測することができ、後で構
文解析する必要がない。また、句構造抽出された後は、
句構造内部の単語をそれほど限定する必要がない。限定
するのは、「名詞句と判断された単語列の一番後の単語
は名詞である」、「動詞句パターンに一致する部分は動
詞句であり、動詞と一部の副詞のみからなる」等の場合
である。 【0071】まお、「区切り語」定義データ13の実現
については、ファイルに記述しておいて実行時に参照す
る方法の他、直接プログラムに記述し、入ってきた単語
の情報をもとに「区切り語」種別を動的に判断する方
法、あるいはあらかじめ「区切り語」を判別する処理を
辞書に施し、辞書情報に準じる形で「区切り語マーカ」
情報を作成しておいて参照する方法、などが考えられ
る。句構造獲得規則15についても同様である。 【0072】また、上記実施例では、動詞句と名詞句の
みを抽出しているが、ある単語が名詞と形容詞の両方に
なり得る場合、例えば”That dog is bad.”のような場
合には形容詞を名詞と誤解析する場合もあるので、この
ような場合には例外規則を設けるとよい。また動詞と形
容詞の両方を持つ単語についても同様である。 【0073】(実施例2)次に、本発明の第2の実施例
である構文チェック装置について説明する。 図8はこ
の構文チェック装置の構成を示している。図8におい
て、81は入力部、82は形態素解析部、83は上記実
施例1に示した句構造抽出装置と同じ句構造抽出部、8
4は構文チェックルール適用部、85は構文チェックを
起動するためのキーとその対処する誤りの種類と処理方
法とからなる構文チェックルール、86は入力文に対す
る誤りがあればその情報を出力する出力部である。 【0074】入力部81から入った入力文は、形態素解
析部82で単語に分割され、それぞれの単語に形態素情
報が付加される。これをもとに句構造抽出部83は上記
実施例1で述べたように「区切り語」情報を付加し、句
構造を抽出する。この結果を受けて構文チェックルール
適用部84は、入力文の各単語に対する「区切り語」の
情報を記した「区切り語マーカ」、句構造情報を含む
「句構造マーカ」と形態素情報、位置情報などをもとに
構文チェックルール85をそれぞれのキーごとに起動
し、チェックを行なう。また結果として得られた誤りの
有無、また誤りがあればその位置、および原因を含む情
報を出力部86に出力する。 【0075】ここで本実施例の構文チェック装置の特長
は、句構造抽出部83に上記実施例1の句構造抽出装置
を使っているために、入力文に対する句構造情報および
「区切り語」情報が参照でき、句構造が文法的に成立し
なかったような場合も、本来成立するはずだった句構造
をキーに使えることである。このため、例えば冠詞が必
要な名詞に冠詞がつかなかった場合も、その名詞がNPを
構成するはずだったことが推測できるので、その名詞が
NPとして問題がないかどうか調べることにより、誤りを
認識することができる。 【0076】次に構文チェックルール85の内容例を以
下に示す。 ○対処する誤りの種類: NPを始めうる要素を含むNPが
成立していない。 起動キー:NPを始めうる要素 処理方法: (1) 「区切り語マーカ」をもとに、NP を始めうる要素
であるか調べる。それ以外は対象外。 (2) 「句構造マーカ」をもとに、NP を始め得る要素を
含むNPが成立しているか調べる。成立していれば対象
外。 (3)NP を始め得る要素を含むNPが成立していなければ、
NP を始め得る要素を含むNPが成立していない、という
誤りを認識。 ○対処する誤りの種類:中心となる名詞に修飾語句が必
要である場合、それがついていない。 起動キー:NP 処理方法: (1) チェックの対象のNPに修飾語句がついているか調べ
る。ついていれば対象外。 (2) 中心となる名詞の種類を調べる。修飾語句がいらな
い語であれば対象外。 (3) 中心となる名詞が修飾語句を必要とするものであれ
ば、修飾語句が必要な名詞に修飾語句がついていない、
という誤りを認識。 ○対処する誤りの種類:前置詞句が規定数以上連続して
いる。 起動キー:文 処理方法: (1) 前置詞とNPの組の連続があれば、その連続数を数え
る。 (2) 連続数と規定数を比較し、規定数の方が大きければ
対象外。 (3) 規定数の方が小さければ、前置詞句が文中に規定数
以上連続した、という誤りを認識。 【0077】図9はこの構文チェックルール85を用い
た構文チェックルール適用部84の動作を説明するフロ
ーチャートである。構文チェックルール適用部84は、
入力文字列と前述のような起動キーが一致した場合、あ
るいは入力文字列中に句構造を認識した場合、あるいは
文そのものをキーとして、対応する構文チェックルール
85を起動する( ステップ91) 。次にチェック結果を
評価し( ステップ92) 、誤りが発見されればその誤り
の種類などからなる誤り情報を出力部86に出力する(
ステップ93) 。 【0078】(動作例1)次に、実施例2における第1
の動作例として"I have notebook."における"notebook"
のように、必要な修飾語句がないというような誤りがあ
っても句構造ができる場合について説明する。この場
合、実施例1の動作例4で述べたように、このときの句
構造抽出装置83の出力は次のようになっている。 <I> <have> <notebook> . NP VP NP 【0079】この修飾語句が必要な名詞"notebook"に修
飾語句がついていないNP"notebook"を本実施例の構文チ
ェック装置が解析する様子を以下に説明する。図10は
本実施例における構文チェック装置が構文チェックルー
ル85のうち、「修飾語句の必要な名詞に修飾語句がつ
いていない」誤りに対するチェックルールを文"I have
notebook."に適用したときの処理を示す。 【0080】このルールは、上記したルールとキーの例
にあるように、NPをキーとして各NPに対して適用され
る。この例では句構造抽出の結果、例文のNPは"I" と"n
otebook"の2つなので、まず"I" に対してルールが起動
した場合について説明する。まず、NPの中心となる名詞
の性質を調べ、これが単独でNPを構成するか調べる( ス
テップ101) 。これはNPの中心となる名詞の「区切り
語マーカ」に図3の1-Aに該当するものがあるかで調べ
られる。該当する場合、そのような名詞に修飾語句は不
要であり、また句構造抽出の仕様上、単独でNPを構成す
るものに修飾語句はついていないはずであるので、本チ
ェックの「修飾語句が必要な名詞に修飾語句がついてい
るか」の対象外になる。ここで例文の最初のNP"I" はこ
れに該当するためこのチェックの対象外と判断される。
このため"I" についてはこの誤りはない、と判断され(
ステップ106) 、このルールはこれ以上の処理を行な
わない。次に2つ目のNP"notebook"であるが、この中心
となる名詞"notebook"の「区切り語マーカ」には単独で
NPを構成するというものがないため、次の条件のチェッ
クに入る。NPの先頭にNPを始めうる修飾語句がついてい
るかというチェック(ステップ102) では、NP"noteb
ook"には一つしか単語がないため、やはり該当せず、次
の条件へ進む。NPの中心となる名詞は複数形かというチ
ェック( ステップ103) では、NP"notebook"に複数形
でありうるという情報がないため、次の条件へ進む。NP
の中心となる名詞は不可算名詞かというチェック( ステ
ップ104) では、NP"notebook"の辞書情報から該当し
ないと判断され、次へ進む。そして名詞"notebook"は
「修飾語句の必要な名詞」であり、これに「必要な修飾
語句がついていない」間違いがある、と判断される( ス
テップ105) 。 【0081】他の解析例として、句構造抽出部83では
句構造が成立しているが、中に文法的な間違いがある文
の解析例として、例えば実施例1の動作例4で触れた"T
hatgentleman had a books." を簡単に説明する。この
場合、構文チェック適用部84では間違っているNPの"a
books" について、構文チェックルール85にもとづい
て修飾語句と名詞の対応をチェックするときに、"a"
と"books" の整合性に矛盾が発見され、"a" は単数形の
名詞につくはずなのに対し、"books" の情報には複数形
の名詞とあるため、修飾語と対応する名詞の間違いとし
て認識され、その情報が出力部86から出力される。 【0082】(動作例2)次に、実施例2における第2
の動作例として、入力文が誤っていて、句構造抽出の結
果、句構造ができなかった例"This is an. "を説明す
る。 句構造抽出部23からは、実施例1の動作例5で
示したような句構造情報および「区切り語」情報が出力
される。 <This> <is> an. NP VP NPstart ここで"an"はNPの先頭になる「区切り語」であり、「区
切り語マーカ」にはこの語がNPの先頭になり、NPに含ま
れているはず、という情報が含まれている。一方、この
冠詞"an"は直後に名詞がないのでNPには含まれないた
め、"an"の「句構造マーカ」にはNPに含まれていないと
いう情報が入っている。 【0083】構文チェックルール適用部84は、この"a
n"の「区切り語マーカ」をもとにNPを始め得る要素をキ
ーとするチェックルールを起動し、「句構造マーカ」を
参照して"an"がNPに含まれているか調べる。含まれてい
れば正しいので対象外となるが、ここで"an"の句構造マ
ーカにはNPに含まれているという情報がないので、"an"
はNPを始め得る要素"an"を含むNPが成立していない間違
いとして認識され、誤り情報が出力部86に出力され
る。 【0084】本動作例2では、NP内の矛盾をチェックす
るルールを例に説明したが、同様に句構造抽出部83の
出力に含まれる句構造情報を利用することにより、VP内
の矛盾、例えば助動詞haveに対して過去分詞形以外の動
詞が来ているかどうかを調べることもできる。また、複
数の句構造の関係を調べるチェックルールを記述するこ
とにより、たとえば文の主語であるNPと、その対応する
VPを取得し、それらの整合性を調べることにより、文の
主語と述語が文法的に対応しているかどうかを調べた
り、後に節がくるはずの従属接続詞の直後に節ができて
いるかといったようなことを調べられるのはいうまでも
ない。 【0085】このように本実施例における構文チェック
装置では、「区切り語マーカ」と「句構造マーカ」を参
考に、句構造に含まれているはずだが句構造が成立して
いない状況、あるいは成立した各句構造内および各句構
造間の矛盾を見つけてその間違いを認識することができ
る。 【0086】 【発明の効果】以上のように、本発明による句構造抽出
装置は、句構造の区切り語を定義したデータに基づき、
入力文から例えば動詞として使われていそうな部分と名
詞として使われていそうな部分すなわち動詞句と名詞句
とを抽出し、これらの句構造から入力文を解析するよう
にしたので、構文木を生成することなしに構文解析をす
ることができる。またその際、各句構造の内部構造には
言及しないので、例えば冠詞から始まる名詞句におい
て、冠詞の表している数と、その冠詞が修飾する名詞の
数とが一致していなくても名詞句として認識するので、
また複数の句構造の結びつきについても考慮しないの
で、文法的に誤りのある非文が入力されても解析を行な
うことができる。したがってこのような句構造抽出装置
を構文チェック装置の句構造抽出部として用いることに
より、誤りを容易かつ高速に高精度に見つけることがで
きる。
【図面の簡単な説明】 【図1】本発明の第1の実施例における句構造抽出装置
の構成を示すブロック図 【図2】本発明の第1の実施例における句構造抽出装置
の「区切り語」設定部の動作を示すフロー図 【図3】「区切り語」定義データの内容例を示す一覧図 【図4】本発明の第1の実施例における句構造抽出装置
の句構造獲得部の動作を示すフロー図 【図5】本発明の第1の実施例における句構造抽出装置
の句構造獲得部が動詞句を抽出する動作を示すフロー図 【図6】本発明の第1の実施例における句構造抽出装置
の句構造獲得部が用いる動詞句のパターンデータの例を
示す一覧図 【図7】本発明の第1の実施例における句構造抽出装置
の句構造獲得部が名詞句を抽出する動作を示すフロー図 【図8】本発明の第2の実施例における構文チェック装
置の構成を示すブロック図 【図9】本発明の第2の実施例における構文チェック装
置の構文チェックルール適用部の動作を示すフロー図 【図10】本発明の第2の実施例における構文チェック
装置の構文チェックルール適用部の処理を示すフロー図 【符号の説明】 11 入力部 12 「区切り語」設定部 13 「区切り語」定義データ 14 句構造獲得部 15 句構造獲得規則 16 出力部 81 入力部 82 形態素解析部 83 句構造抽出部 84 構文チェックルール適用部 85 構文チェックルール 86 出力部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 高 橋 雅 則 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (56)参考文献 特開 平5−54063(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/28

Claims (1)

  1. (57)【特許請求の範囲】 【請求項1】 句構造の存在および位置についての情報
    をもたらす句構造の区切り語を、名詞句については代名
    詞になりうるか否かを規定し、動詞句については助動詞
    になりうるか、動詞か助動詞にしかならないか、或いは
    副詞かを規定する品詞特性、名詞句については所有格か
    それ以外か、または限定なしかを規定し、動詞句につい
    ては限定なしかまたは動詞を修飾するか否かを規定する
    文法特性、および、名詞句および動詞句について、副詞
    は文章中で動詞の前後位置に現れ、その他については限
    定なしを規定する位置特性を用いて定義し、前記区切り
    語を句構造を構成する際の性質によって分類してなる区
    切り語定義データに基づいて、入力文の形態素解析結果
    に対する区切り語とその区切り語の種類に対応する識別
    子としての区切り語マーカとを設定する区切り語設定部
    と、 前記形態素解析結果に基づいて仮定される動詞候補か
    ら、前記区切り語マーカを用いた動詞候補削除ルールに
    基づいて動詞を判定し、前記動詞に基づいて動詞句を決
    定する句構造獲得部とを備えることを特徴とする句構造
    抽出装置。
JP25303193A 1993-10-08 1993-10-08 句構造抽出装置 Expired - Fee Related JP3433827B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25303193A JP3433827B2 (ja) 1993-10-08 1993-10-08 句構造抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25303193A JP3433827B2 (ja) 1993-10-08 1993-10-08 句構造抽出装置

Publications (2)

Publication Number Publication Date
JPH07105215A JPH07105215A (ja) 1995-04-21
JP3433827B2 true JP3433827B2 (ja) 2003-08-04

Family

ID=17245520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25303193A Expired - Fee Related JP3433827B2 (ja) 1993-10-08 1993-10-08 句構造抽出装置

Country Status (1)

Country Link
JP (1) JP3433827B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI639927B (zh) * 2016-05-27 2018-11-01 雲拓科技有限公司 將一申請專利範圍中的申請專利範圍元件名詞所屬元件名詞對應標號予以對應之對應方法
CN109255116A (zh) * 2017-07-06 2019-01-22 云拓科技有限公司 将权利要求书中的权利要求元件名词所属元件名词对应标号予以对应的对应方法

Also Published As

Publication number Publication date
JPH07105215A (ja) 1995-04-21

Similar Documents

Publication Publication Date Title
Mikheev Tagging sentence boundaries
US7584093B2 (en) Method and system for generating spelling suggestions
JP4306894B2 (ja) 自然言語処理装置及びその方法、及び自然言語認識装置
Miłkowski Developing an open‐source, rule‐based proofreading tool
EP0266001A2 (en) A parser for natural language text
JP2002215617A (ja) 品詞タグ付けをする方法
EP2354967A1 (en) Semantic textual analysis
US20060200336A1 (en) Creating a lexicon using automatic template matching
JP2012520528A (ja) 自然言語テキストの自動的意味ラベリングのためのシステム及び方法
US20060200338A1 (en) Method and system for creating a lexicon
Morgan et al. University of Durham: Description of the LOLITA System as Used in MUC-6.
US7398210B2 (en) System and method for performing analysis on word variants
JPH08292955A (ja) 言語処理方法及びそれを適用するデータ処理装置
Glass et al. A naive salience-based method for speaker identification in fiction books
Berwick et al. Deterministic parsing and linguistic explanation
US7620541B2 (en) Critiquing clitic pronoun ordering in french
JP3433827B2 (ja) 句構造抽出装置
Dione Implementation and evaluation of an LFG-based parser for Wolof
Džeroski et al. Learning to lemmatise Slovene words
Sedlácek et al. Automatic Processing of Czech Inflectional and Derivative Morphology
JPH07244669A (ja) 文書検索方式
Štěpánek Post-annotation checking of prague dependency treebank 2.0 data
JPH07325825A (ja) 英文法チェックシステム装置
Afrin Extraction of basic noun phrases from natural language using statistical context-free grammar
Vale et al. Building a large dictionary of abbreviations for named entity recognition in Portuguese historical corpora

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees