JP2989823B2 - 文型認識方法 - Google Patents

文型認識方法

Info

Publication number
JP2989823B2
JP2989823B2 JP63015124A JP1512488A JP2989823B2 JP 2989823 B2 JP2989823 B2 JP 2989823B2 JP 63015124 A JP63015124 A JP 63015124A JP 1512488 A JP1512488 A JP 1512488A JP 2989823 B2 JP2989823 B2 JP 2989823B2
Authority
JP
Japan
Prior art keywords
sentence
sentence pattern
slot
candidate
expressed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63015124A
Other languages
English (en)
Other versions
JPH01189767A (ja
Inventor
博 末松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP63015124A priority Critical patent/JP2989823B2/ja
Publication of JPH01189767A publication Critical patent/JPH01189767A/ja
Application granted granted Critical
Publication of JP2989823B2 publication Critical patent/JP2989823B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は文並列認識方法に関するものである。
(従来の技術) 従来の文型認識方式としては以下に述べる2つのもの
が知られている。1つの方式では、入力文における用言
が取り得る文型の中から一つをその用言の文型であると
仮定し、その仮定のもとで、該入力文の解析を進めてい
る。そして現れるべき文型構成要素が出現しないこと等
により解析失敗が検出された段階で、バックトラックし
て他の文型を一つ選び、失敗が検出されない文型が得ら
れるまでこの処理を繰り返し、失敗が検出されなかった
文型を該入力文の用言の文型と認定している。
また別の方式では、入力文における用言の取り得る全
ての文型を行として並列表現し、かつ、その構成文法格
をスロット条件として表現したテーブルを用意する。そ
して該入力文中における文型構成要素の候補の素性を、
ある文型が持つ全スロット条件に対し順に合致するまで
比較してゆき、合致したスロットを埋め、この操作を最
初から最後の文型まで順番に繰り返し、空きスロットの
無い最多一致した文型を該入力文の文型と認定してい
る。
(発明が解決しようとする問題点) 上に述べた文型認識方式の前者の方式は、可能な文型
の中から認定される文型が、仮定された順序に依存する
ため、最多要素の文型を優先させようとしてそれから解
析を試ると、最多要素のものが必ずしも頻度の高いもの
ではないのでバックトラックの回数が多くなる。また、
頻度順に解析を試みると、本来文型構成要素と認識され
るべきものが、認識されずに解析がそのまま成功してし
まうという問題があった。
また後者の方式においては、前者における問題は存在
しないが、候補の素性とスロット条件との比較回数が極
めて多いという問題がある。一回のテーブル操作におい
て、その比較回数は、概算すると文型数の数倍になり、
処理工数、時間が極めてかかるという問題があった。
本発明の目的は、このような欠点を除去せしめて、比
較回数を減らし、効率的に文型を認識する方法を提供す
ることにある。
(問題点を解決するための手段) 本発明は、文型を認識する自然言語処理システムにお
いて、 入力文中の用言に対し、該用言が取り得る全ての文型
が行として並列表現されたテーブルであり、各文型の構
成文法格が、用言との位置関係や表層文法格を基準に列
として設定した有限個のポジションにおけるスロットの
条件として表現されたテーブルをメモリ上に用意し、 該入力文中における文型構成要素の各候補に対し、該
テーブルのポジションを該候補の用言との位置関係や表
層文法格に従って一つ選択し、 該候補の素性を全ての可能な文型の選択されたポジシ
ョンにおけるスロットの条件と比較し、 条件の合うスロットが存在する場合に、そのスロット
を有する行に表現された文型のみを適格とすることによ
り、複数の文型を並列に処理することを特徴とする。
(作用) 本発明においては、有限個のポジションを設定するこ
とにより、候補の素性との比較が、特定のポジション以
外に対しては不要となり、比較回数が従来技術の数分の
1となり、処理工数の削減、処理速度の向上につなが
る。
(実施例) 次に第1図から第3図を参照して本発明の実施例につ
いて説明する。
第1図は、本発明を利用した自然言語解析手法のフロ
ーチャートである。入力文は、形態素解析により、辞書
を用いながら、意味の最小単位である単語に分割され、
各単語に可能な品詞が付与される。用言の可能性のある
単語に対しては、その用言が取り得る文型が全て抽出さ
れる。抽出された文型情報は、スロットテーブルのテン
プレートを使用して、有限個のポジションで表現された
スロットテーブルに変換される。形態素解析結果は、構
文解析において、文型の構成要素に成り得る大きさにま
でまとめ上げられ、その素性が、スロットテーブル操作
関数を用いて、スロットテーブルにおける一つのポジシ
ョンに挿入され、全ての可能な文型のスロット条件と比
較される。合致するものが在れば、候補は文型構成要素
と認定され、合致したスロットを持つ文型のみが適格な
ものとして残され、合致したスロットは埋められる。文
型構成要素候補が現れ得る間は、このプロセスが繰り返
されるが、現れ得ない状態になった場合、空きスロット
の無い文型で、埋まったスロット数の最も多いものが入
力文の用言の文型と認定される。
第2図は用言の文型情報からスロットテーブルへの変
換例を示している。同図(a)は英語の例であり、同図
(b)には日本語の例が示されている。英語の例におい
ては、ポジションを用言との相対位置により設定してい
る。主語(SUB)はポジション1に設定され、用言の直
後の補語(COMP)、直接目的語(DOB)、間接目的語(I
OB)はポジション2に設定される。さらに後ろの要素は
順にポジション3、ポジション4に設定される。
日本語の例では、ポジションを表層文法格により設定
している。文型がある種のシフトを受けた後に助詞が
「が」となる文法格はポジションGAに設定され、助詞が
「を」になるものはポジションWOに設定される。
ポジションの選択は、第3図(a)に示されるよう
に、英語においてはポジション1から順にポジション
2、ポジション3というように選択される。日本語にお
いては、第3図(b)に示すとおり文型構成要素の候補
の助詞の綴りを見てポジションが選択される。
【図面の簡単な説明】
第1図は、本発明の文並列認識方法を用いた文解析方式
の例を示すフローチャート、第2図(a),(b)は、
用言の文型情報からポジションを利用したスロットテー
ブルの変換例、第3図(a),(b)は、スロットテー
ブル上のポジションの選択法の例である。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文型を認識する自然言語処理システムにお
    いて、 入力文中の用言に対し、該用言が取り得る全ての文型が
    行として並列表現されたテーブルであり、各文型の構成
    文法格が、用言との位置関係や表層文法格を基準に列と
    して設定した有限個のポジションにおけるスロットの条
    件として表現されたテーブルをメモリ上に用意し、 該入力文中における文型構成要素の各候補に対し、該テ
    ーブルのポジションを該候補の用言との位置関係や表層
    文法格に従って一つ選択し、 該候補の素性を全ての可能な文型の選択されたポジショ
    ンにおけるスロットの条件と比較し、 条件の合うスロットが存在する場合に、そのスロットを
    有する行に表現された文型のみを適格とすることによ
    り、複数の文型を並列に処理することを特徴とする文型
    認識方法。
JP63015124A 1988-01-25 1988-01-25 文型認識方法 Expired - Lifetime JP2989823B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63015124A JP2989823B2 (ja) 1988-01-25 1988-01-25 文型認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63015124A JP2989823B2 (ja) 1988-01-25 1988-01-25 文型認識方法

Publications (2)

Publication Number Publication Date
JPH01189767A JPH01189767A (ja) 1989-07-28
JP2989823B2 true JP2989823B2 (ja) 1999-12-13

Family

ID=11880073

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63015124A Expired - Lifetime JP2989823B2 (ja) 1988-01-25 1988-01-25 文型認識方法

Country Status (1)

Country Link
JP (1) JP2989823B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108241609B (zh) * 2016-12-23 2022-02-01 科大讯飞股份有限公司 排比句识别方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
JP2632806B2 (ja) * 1986-05-16 1997-07-23 株式会社リコー 言語解析装置

Also Published As

Publication number Publication date
JPH01189767A (ja) 1989-07-28

Similar Documents

Publication Publication Date Title
KR100734741B1 (ko) 단어 인식 방법 및 시스템 및 컴퓨터 프로그램 메모리저장 디바이스
NL9300310A (nl) Inrichting en werkwijze voor syntactische signaal-analyse.
Al Saied et al. The ATILF-LLF system for parseme shared task: A transition-based verbal multiword expression tagger
JPH11194793A (ja) 音声ワープロ
JP2989823B2 (ja) 文型認識方法
US6219449B1 (en) Character recognition system
JP2989824B2 (ja) 文型・文法格認識方法
JPH0619962A (ja) テキスト分割装置
JPH0528324A (ja) 英文字認識装置
EP0469485B1 (en) Language processing system using an expanded LR parser
JP2995809B2 (ja) 表内文字認識装置
JP2746345B2 (ja) 文字認識の後処理方法
JPH0546814A (ja) 文字読み取り装置
JPH0540853A (ja) 文字認識結果の後処理方式
JPS60138689A (ja) 文字認識方法
JP2875678B2 (ja) 文字認識結果の後処理方法
JPH0614375B2 (ja) 文字入力装置
JPS60144886A (ja) 文字認識装置における後処理方式
JPH0262659A (ja) 日本文訂正候補文字抽出装置
JPS62206597A (ja) 音声認識用単語予備選択方式
JPH0833885B2 (ja) 情報処理装置
JPH01231191A (ja) 文字認識装置
JPH0756926A (ja) 中日機械翻訳における離合詞処理方式
JPS62285189A (ja) 文字認識後処理方式
JPH0468483A (ja) 文字認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071008

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081008

Year of fee payment: 9

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081008

Year of fee payment: 9