JP2989823B2 - 文型認識方法 - Google Patents
文型認識方法Info
- Publication number
- JP2989823B2 JP2989823B2 JP63015124A JP1512488A JP2989823B2 JP 2989823 B2 JP2989823 B2 JP 2989823B2 JP 63015124 A JP63015124 A JP 63015124A JP 1512488 A JP1512488 A JP 1512488A JP 2989823 B2 JP2989823 B2 JP 2989823B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- sentence pattern
- slot
- candidate
- expressed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は文並列認識方法に関するものである。
(従来の技術) 従来の文型認識方式としては以下に述べる2つのもの
が知られている。1つの方式では、入力文における用言
が取り得る文型の中から一つをその用言の文型であると
仮定し、その仮定のもとで、該入力文の解析を進めてい
る。そして現れるべき文型構成要素が出現しないこと等
により解析失敗が検出された段階で、バックトラックし
て他の文型を一つ選び、失敗が検出されない文型が得ら
れるまでこの処理を繰り返し、失敗が検出されなかった
文型を該入力文の用言の文型と認定している。
が知られている。1つの方式では、入力文における用言
が取り得る文型の中から一つをその用言の文型であると
仮定し、その仮定のもとで、該入力文の解析を進めてい
る。そして現れるべき文型構成要素が出現しないこと等
により解析失敗が検出された段階で、バックトラックし
て他の文型を一つ選び、失敗が検出されない文型が得ら
れるまでこの処理を繰り返し、失敗が検出されなかった
文型を該入力文の用言の文型と認定している。
また別の方式では、入力文における用言の取り得る全
ての文型を行として並列表現し、かつ、その構成文法格
をスロット条件として表現したテーブルを用意する。そ
して該入力文中における文型構成要素の候補の素性を、
ある文型が持つ全スロット条件に対し順に合致するまで
比較してゆき、合致したスロットを埋め、この操作を最
初から最後の文型まで順番に繰り返し、空きスロットの
無い最多一致した文型を該入力文の文型と認定してい
る。
ての文型を行として並列表現し、かつ、その構成文法格
をスロット条件として表現したテーブルを用意する。そ
して該入力文中における文型構成要素の候補の素性を、
ある文型が持つ全スロット条件に対し順に合致するまで
比較してゆき、合致したスロットを埋め、この操作を最
初から最後の文型まで順番に繰り返し、空きスロットの
無い最多一致した文型を該入力文の文型と認定してい
る。
(発明が解決しようとする問題点) 上に述べた文型認識方式の前者の方式は、可能な文型
の中から認定される文型が、仮定された順序に依存する
ため、最多要素の文型を優先させようとしてそれから解
析を試ると、最多要素のものが必ずしも頻度の高いもの
ではないのでバックトラックの回数が多くなる。また、
頻度順に解析を試みると、本来文型構成要素と認識され
るべきものが、認識されずに解析がそのまま成功してし
まうという問題があった。
の中から認定される文型が、仮定された順序に依存する
ため、最多要素の文型を優先させようとしてそれから解
析を試ると、最多要素のものが必ずしも頻度の高いもの
ではないのでバックトラックの回数が多くなる。また、
頻度順に解析を試みると、本来文型構成要素と認識され
るべきものが、認識されずに解析がそのまま成功してし
まうという問題があった。
また後者の方式においては、前者における問題は存在
しないが、候補の素性とスロット条件との比較回数が極
めて多いという問題がある。一回のテーブル操作におい
て、その比較回数は、概算すると文型数の数倍になり、
処理工数、時間が極めてかかるという問題があった。
しないが、候補の素性とスロット条件との比較回数が極
めて多いという問題がある。一回のテーブル操作におい
て、その比較回数は、概算すると文型数の数倍になり、
処理工数、時間が極めてかかるという問題があった。
本発明の目的は、このような欠点を除去せしめて、比
較回数を減らし、効率的に文型を認識する方法を提供す
ることにある。
較回数を減らし、効率的に文型を認識する方法を提供す
ることにある。
(問題点を解決するための手段) 本発明は、文型を認識する自然言語処理システムにお
いて、 入力文中の用言に対し、該用言が取り得る全ての文型
が行として並列表現されたテーブルであり、各文型の構
成文法格が、用言との位置関係や表層文法格を基準に列
として設定した有限個のポジションにおけるスロットの
条件として表現されたテーブルをメモリ上に用意し、 該入力文中における文型構成要素の各候補に対し、該
テーブルのポジションを該候補の用言との位置関係や表
層文法格に従って一つ選択し、 該候補の素性を全ての可能な文型の選択されたポジシ
ョンにおけるスロットの条件と比較し、 条件の合うスロットが存在する場合に、そのスロット
を有する行に表現された文型のみを適格とすることによ
り、複数の文型を並列に処理することを特徴とする。
いて、 入力文中の用言に対し、該用言が取り得る全ての文型
が行として並列表現されたテーブルであり、各文型の構
成文法格が、用言との位置関係や表層文法格を基準に列
として設定した有限個のポジションにおけるスロットの
条件として表現されたテーブルをメモリ上に用意し、 該入力文中における文型構成要素の各候補に対し、該
テーブルのポジションを該候補の用言との位置関係や表
層文法格に従って一つ選択し、 該候補の素性を全ての可能な文型の選択されたポジシ
ョンにおけるスロットの条件と比較し、 条件の合うスロットが存在する場合に、そのスロット
を有する行に表現された文型のみを適格とすることによ
り、複数の文型を並列に処理することを特徴とする。
(作用) 本発明においては、有限個のポジションを設定するこ
とにより、候補の素性との比較が、特定のポジション以
外に対しては不要となり、比較回数が従来技術の数分の
1となり、処理工数の削減、処理速度の向上につなが
る。
とにより、候補の素性との比較が、特定のポジション以
外に対しては不要となり、比較回数が従来技術の数分の
1となり、処理工数の削減、処理速度の向上につなが
る。
(実施例) 次に第1図から第3図を参照して本発明の実施例につ
いて説明する。
いて説明する。
第1図は、本発明を利用した自然言語解析手法のフロ
ーチャートである。入力文は、形態素解析により、辞書
を用いながら、意味の最小単位である単語に分割され、
各単語に可能な品詞が付与される。用言の可能性のある
単語に対しては、その用言が取り得る文型が全て抽出さ
れる。抽出された文型情報は、スロットテーブルのテン
プレートを使用して、有限個のポジションで表現された
スロットテーブルに変換される。形態素解析結果は、構
文解析において、文型の構成要素に成り得る大きさにま
でまとめ上げられ、その素性が、スロットテーブル操作
関数を用いて、スロットテーブルにおける一つのポジシ
ョンに挿入され、全ての可能な文型のスロット条件と比
較される。合致するものが在れば、候補は文型構成要素
と認定され、合致したスロットを持つ文型のみが適格な
ものとして残され、合致したスロットは埋められる。文
型構成要素候補が現れ得る間は、このプロセスが繰り返
されるが、現れ得ない状態になった場合、空きスロット
の無い文型で、埋まったスロット数の最も多いものが入
力文の用言の文型と認定される。
ーチャートである。入力文は、形態素解析により、辞書
を用いながら、意味の最小単位である単語に分割され、
各単語に可能な品詞が付与される。用言の可能性のある
単語に対しては、その用言が取り得る文型が全て抽出さ
れる。抽出された文型情報は、スロットテーブルのテン
プレートを使用して、有限個のポジションで表現された
スロットテーブルに変換される。形態素解析結果は、構
文解析において、文型の構成要素に成り得る大きさにま
でまとめ上げられ、その素性が、スロットテーブル操作
関数を用いて、スロットテーブルにおける一つのポジシ
ョンに挿入され、全ての可能な文型のスロット条件と比
較される。合致するものが在れば、候補は文型構成要素
と認定され、合致したスロットを持つ文型のみが適格な
ものとして残され、合致したスロットは埋められる。文
型構成要素候補が現れ得る間は、このプロセスが繰り返
されるが、現れ得ない状態になった場合、空きスロット
の無い文型で、埋まったスロット数の最も多いものが入
力文の用言の文型と認定される。
第2図は用言の文型情報からスロットテーブルへの変
換例を示している。同図(a)は英語の例であり、同図
(b)には日本語の例が示されている。英語の例におい
ては、ポジションを用言との相対位置により設定してい
る。主語(SUB)はポジション1に設定され、用言の直
後の補語(COMP)、直接目的語(DOB)、間接目的語(I
OB)はポジション2に設定される。さらに後ろの要素は
順にポジション3、ポジション4に設定される。
換例を示している。同図(a)は英語の例であり、同図
(b)には日本語の例が示されている。英語の例におい
ては、ポジションを用言との相対位置により設定してい
る。主語(SUB)はポジション1に設定され、用言の直
後の補語(COMP)、直接目的語(DOB)、間接目的語(I
OB)はポジション2に設定される。さらに後ろの要素は
順にポジション3、ポジション4に設定される。
日本語の例では、ポジションを表層文法格により設定
している。文型がある種のシフトを受けた後に助詞が
「が」となる文法格はポジションGAに設定され、助詞が
「を」になるものはポジションWOに設定される。
している。文型がある種のシフトを受けた後に助詞が
「が」となる文法格はポジションGAに設定され、助詞が
「を」になるものはポジションWOに設定される。
ポジションの選択は、第3図(a)に示されるよう
に、英語においてはポジション1から順にポジション
2、ポジション3というように選択される。日本語にお
いては、第3図(b)に示すとおり文型構成要素の候補
の助詞の綴りを見てポジションが選択される。
に、英語においてはポジション1から順にポジション
2、ポジション3というように選択される。日本語にお
いては、第3図(b)に示すとおり文型構成要素の候補
の助詞の綴りを見てポジションが選択される。
第1図は、本発明の文並列認識方法を用いた文解析方式
の例を示すフローチャート、第2図(a),(b)は、
用言の文型情報からポジションを利用したスロットテー
ブルの変換例、第3図(a),(b)は、スロットテー
ブル上のポジションの選択法の例である。
の例を示すフローチャート、第2図(a),(b)は、
用言の文型情報からポジションを利用したスロットテー
ブルの変換例、第3図(a),(b)は、スロットテー
ブル上のポジションの選択法の例である。
Claims (1)
- 【請求項1】文型を認識する自然言語処理システムにお
いて、 入力文中の用言に対し、該用言が取り得る全ての文型が
行として並列表現されたテーブルであり、各文型の構成
文法格が、用言との位置関係や表層文法格を基準に列と
して設定した有限個のポジションにおけるスロットの条
件として表現されたテーブルをメモリ上に用意し、 該入力文中における文型構成要素の各候補に対し、該テ
ーブルのポジションを該候補の用言との位置関係や表層
文法格に従って一つ選択し、 該候補の素性を全ての可能な文型の選択されたポジショ
ンにおけるスロットの条件と比較し、 条件の合うスロットが存在する場合に、そのスロットを
有する行に表現された文型のみを適格とすることによ
り、複数の文型を並列に処理することを特徴とする文型
認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63015124A JP2989823B2 (ja) | 1988-01-25 | 1988-01-25 | 文型認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63015124A JP2989823B2 (ja) | 1988-01-25 | 1988-01-25 | 文型認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH01189767A JPH01189767A (ja) | 1989-07-28 |
JP2989823B2 true JP2989823B2 (ja) | 1999-12-13 |
Family
ID=11880073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63015124A Expired - Lifetime JP2989823B2 (ja) | 1988-01-25 | 1988-01-25 | 文型認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2989823B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108241609B (zh) * | 2016-12-23 | 2022-02-01 | 科大讯飞股份有限公司 | 排比句识别方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5840684A (ja) * | 1981-09-04 | 1983-03-09 | Hitachi Ltd | 自然言語間の自動翻訳方式 |
JP2632806B2 (ja) * | 1986-05-16 | 1997-07-23 | 株式会社リコー | 言語解析装置 |
-
1988
- 1988-01-25 JP JP63015124A patent/JP2989823B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH01189767A (ja) | 1989-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100734741B1 (ko) | 단어 인식 방법 및 시스템 및 컴퓨터 프로그램 메모리저장 디바이스 | |
NL9300310A (nl) | Inrichting en werkwijze voor syntactische signaal-analyse. | |
Al Saied et al. | The ATILF-LLF system for parseme shared task: A transition-based verbal multiword expression tagger | |
JPH11194793A (ja) | 音声ワープロ | |
JP2989823B2 (ja) | 文型認識方法 | |
US6219449B1 (en) | Character recognition system | |
JP2989824B2 (ja) | 文型・文法格認識方法 | |
JPH0619962A (ja) | テキスト分割装置 | |
JPH0528324A (ja) | 英文字認識装置 | |
EP0469485B1 (en) | Language processing system using an expanded LR parser | |
JP2995809B2 (ja) | 表内文字認識装置 | |
JP2746345B2 (ja) | 文字認識の後処理方法 | |
JPH0546814A (ja) | 文字読み取り装置 | |
JPH0540853A (ja) | 文字認識結果の後処理方式 | |
JPS60138689A (ja) | 文字認識方法 | |
JP2875678B2 (ja) | 文字認識結果の後処理方法 | |
JPH0614375B2 (ja) | 文字入力装置 | |
JPS60144886A (ja) | 文字認識装置における後処理方式 | |
JPH0262659A (ja) | 日本文訂正候補文字抽出装置 | |
JPS62206597A (ja) | 音声認識用単語予備選択方式 | |
JPH0833885B2 (ja) | 情報処理装置 | |
JPH01231191A (ja) | 文字認識装置 | |
JPH0756926A (ja) | 中日機械翻訳における離合詞処理方式 | |
JPS62285189A (ja) | 文字認識後処理方式 | |
JPH0468483A (ja) | 文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071008 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081008 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081008 Year of fee payment: 9 |