JP2989824B2 - 文型・文法格認識方法 - Google Patents

文型・文法格認識方法

Info

Publication number
JP2989824B2
JP2989824B2 JP63139875A JP13987588A JP2989824B2 JP 2989824 B2 JP2989824 B2 JP 2989824B2 JP 63139875 A JP63139875 A JP 63139875A JP 13987588 A JP13987588 A JP 13987588A JP 2989824 B2 JP2989824 B2 JP 2989824B2
Authority
JP
Japan
Prior art keywords
sentence
grammatical
pattern
slot
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63139875A
Other languages
English (en)
Other versions
JPH01307871A (ja
Inventor
博 末松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP63139875A priority Critical patent/JP2989824B2/ja
Publication of JPH01307871A publication Critical patent/JPH01307871A/ja
Application granted granted Critical
Publication of JP2989824B2 publication Critical patent/JP2989824B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文型認識方法および文法格認識方法に関す
るものである。
(従来の技術) 従来の文型認識方式としては以下に述べる二つのもの
が知られている。一つの方式では、入力文における用言
が取り得る文型の中から一つをその用言の文型であると
仮定し、その仮定のもとで、該入力文の解析を進めてい
る。そして現れるべき文型構成要素が出現しないこと等
により解析失敗が検出された段階で、バックトラックし
て他の文型を一つ選び、失敗が検出されない文型が得ら
れるまでこの処理を繰り返し、失敗が検出されなかった
文型を該入力文の用言の文型と認定している。
また別の方式では、入力文における用言の取り得る全
ての文型を行として並列表現し、かつ、その構成文法格
をスロット条件として表現したテーブルを用意し、該入
力文中における文型構成要素の候補の素性を、ある文型
が持つ全スロット条件に対し順に合致するまで比較して
ゆき、合致したスロットを埋め、この操作を最初から最
後の文型まで順番に繰り返し、空きスロットの無い最多
一致した文型を該入力文の文型と認定している。
また、文法格は解析の結果、文型が判明してから得ら
れるものであり、文型の認識には必要でないため、従来
技術としては、その認識法が存在しなかった。
(発明が解決しようとする課題) 上に述べた文型認識方式の前者は、可能な文型の中か
ら認定される文型が、仮定された順序に依存するため、
最多要素の文型を優先的に認定させようとして、それか
ら解析を試ると、最多要素のものが必ずしも頻度の高い
ものではないのでバックトラックの回数が多くなる。ま
た、文型の頻度順に解析を試ると、本来文型構成要素と
認識されるべきものが、認識されずに解析がそのまま成
功してしまうという問題があった。
後者においては、前者における問題は存在しないが、
候補の素性とスロット条件との比較回数が極めて多いと
いう問題があった。一回のテーブル操作において、その
比較回数は、概算すると文型数の数倍になり、処理工
数、時間が極めてかかるという問題があった。
また、文法格は、全ての自然言語において共通の概念
であり、文型構成要素の用言に対する意味的役割の表現
法や文生成の情報として有用であることが判明したた
め、その効率的な認識法の発明に迫られていた。
本発明の目的は、これらのような欠点・問題点を除去
せしめて、比較回数を減らした効果的な文型認識方法を
提供し、さらに効率的な文法格認識方法を提供すること
にある。
(課題を解決するための手段) 本発明の文型・文法格認識方法は、 文型とその構成文法格とを認識する自然言語処理シス
テムにおいて、 a)入力文中の用言に対し、該用言が取り得る全ての文
型が行として並列表現されたテーブルであり、各文型の
構成文法格が、用言との位置関係を基準に列として設定
した有限個のポジションにおけるスロットの条件として
表現されたテーブルと、 b)各文法格に対応した列を、シフトを受ける前の基本
パタンに出現する順番に配置し、文法格の全てのパタン
を各列における取る/取らないの二値表現で表現したテ
ーブル、 とをメモリ上に用意し、 該入力文中における文型構成要素の各候補に対し、
a)のテーブルのポジションを該候補の用言との位置関
係に従って一つ選択して、該候補の素性を、全ての可能
な文型の該ポジションにおけるスロットの条件と比較
し、 条件の合うスロットが存在する場合に、そのスロット
を有する文型のみを適格とする方法により、複数の文型
を並列に処理して該入力文の文型を絞り込み、 条件の合うスロットが存在する文型に対応する文法格
のパタン名とそのスロットが有するポジションを示す番
号とから、b)のテーブルにおいて該当する文法格のパ
タンにおいて、取ることを意味する値が格納された列の
数を順番にたどることにより数え、その数が該ポジショ
ンを示す番号と一致した列に対応する文法格を、該スロ
ットの文法格と認定することを特徴とする。
(作用) 本発明の文型・文法格認識方法においては、有限個の
ポジションを設定することにより、候補の素性との比較
が、特定のポジション以外に対しては不要となり、比較
回数が従来技術の数分の1となり、処理工数の削減、処
理速度の向上につながる。
また、本発明の文型・文法格認識方法においては、文
法格を体系的に管理しているので、その理解、管理、変
更が容易である。
(実施例) 次に第1図から第4図を参照して本発明の実施例につ
いて説明する。
第1図は、本発明を利用した自然言語解析手法のフロ
ーチャートである。入力文は、形態素解析により、辞書
を用いながら、意味の最小単位である単語に分割され、
各単語に可能な品詞が付与される。用言の可能性のある
単語に対しては、その用言が取り得る文型が全て抽出さ
れる。抽出された文型情報は、スロットテーブルのテン
プレートを使用して、有限個のポジションで表現された
スロットテーブルに変換される。形態素解析結果は、構
文解析において、文型の構成要素に成り得る大きさにま
でまとめ上げられ、その素性が、スロットテーブル操作
関数を用いて、スロットテーブルにおける一つのボジシ
ョンに挿入され、全ての可能な文型のスロット条件と比
較される。合致するものが在れば、候補は文型構成要素
と認定され、合致したスロットを持つ文型のみが適格な
ものとして残され、合致したスロットは埋められる。こ
の際、合致したスロットにおける基本パタンにおけるポ
ジション番号と、このスロットが存在する文型の文法格
パタン名とから、文法格バタンテーブルを用いて文型構
成要素に対し文法格が付与される。文型構成要素候補が
現れ得る間は、このプロセスが繰り返されるが、現れ得
ない状態になった場合、空きスロットの無い文型で、埋
まったスロット数の最も多いものが入力文の用言の文型
と認定される。
第2図は、用言の文型情報からスロットテーブルへの
変換例を示している。第2図(a)は英語の例であり、
第2図(b)には日本語の例が示されている。英語の例
においては、ポジションを用言との相対位置により設定
している。主語(SUB)はボジション1に設定され、用
言の直後の補語(COMP)、直接目的語(DOB)、間接目
的語(IOB)はボジション2に設定される。さらに後ろ
の要素は順にボジション3、ポジション4に設定され
る。
日本語の例では、ポジションを表層文法格により設定
している。文型がある種のシフトを受けた後に助詞が
「が」となる文法格はポジションGAに設定され、助詞が
「を」になるものはポジションWOに設定される。
ポジションの選択は、第3図に示されるように、第3
図(a)に示す英語の例においては、順にポジション1
からポジション2、ポジション3というように選択され
る。第3図(b)に示す日本語の例においては、文型構
成要素の候補の助詞の綴りを見てポジションが選択され
る。
第4図に文法格パタンテーブルの英語の例を示す。合
致したスロットが存在する文型に対応する文法格パタン
名により行を選択し、該スロットが有する基本パタンに
おけるポジションを示す番号の分だけ左端から1を数
え、数え終わった列に対応する文法格を該スロットの文
法格とする。
文法格パタンテーブルにおいて、ある文法格の有無を
1/0で表現してあるが、これに相当する2値表現は全て
クレームに含まれる。
【図面の簡単な説明】
第1図は、本発明の文型・文法格認識方法を用いた文解
析方式の例を示すフローチャート、第2図は、用言の文
型情報からポジションを利用したスロットデーブルへの
変換例、第3図はスロットテーブル上のポジションの選
択法の例、第4図は文法格パタンテーブルの英語の例で
ある。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文型とその構成文法格とを認識する自然言
    語処理システムにおいて、 a)入力文中の用言に対し、該用言が取り得る全ての文
    型が行として並列表現されたテーブルであり、各文型の
    構成文法格が、用言との位置関係を基準に列として設定
    した有限個のポジションにおけるスロットの条件として
    表現されたテーブルと、 b)各文法格に対応した列を、シフトを受ける前の基本
    パタンに出現する順番に配置し、文法格の全てのパタン
    を各列における取る/取らないの二値表現で表現したテ
    ーブル、 とをメモリ上に用意し、 該入力文中における文型構成要素の各候補に対し、a)
    のテーブルのポジションを該候補の用言との位置関係に
    従って一つ選択して、該候補の素性を、全ての可能な文
    型の該ポジションにおけるスロットの条件と比較し、 条件の合うスロットが存在する場合に、そのスロットを
    有する文型のみを適格とする方法により、複数の文型を
    並列に処理して該入力文の文型を絞り込み、 条件の合うスロットが存在する文型に対応する文法格の
    パタン名とそのスロットが有するポジションを示す番号
    とから、b)のテーブルにおいて該当する文法格のパタ
    ンにおいて、取ることを意味する値が格納された列の数
    を順番にたどることにより数え、その数が該ポジション
    を示す番号と一致した列に対応する文法格を、該スロッ
    トの文法格と認定することを特徴とする文型・文法格認
    識方法。
JP63139875A 1988-06-06 1988-06-06 文型・文法格認識方法 Expired - Lifetime JP2989824B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63139875A JP2989824B2 (ja) 1988-06-06 1988-06-06 文型・文法格認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63139875A JP2989824B2 (ja) 1988-06-06 1988-06-06 文型・文法格認識方法

Publications (2)

Publication Number Publication Date
JPH01307871A JPH01307871A (ja) 1989-12-12
JP2989824B2 true JP2989824B2 (ja) 1999-12-13

Family

ID=15255600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63139875A Expired - Lifetime JP2989824B2 (ja) 1988-06-06 1988-06-06 文型・文法格認識方法

Country Status (1)

Country Link
JP (1) JP2989824B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
JPS6069776A (ja) * 1983-09-26 1985-04-20 Casio Comput Co Ltd 電子式英文翻訳機

Also Published As

Publication number Publication date
JPH01307871A (ja) 1989-12-12

Similar Documents

Publication Publication Date Title
US4393460A (en) Simultaneous electronic translation device
US4468756A (en) Method and apparatus for processing languages
NL9300310A (nl) Inrichting en werkwijze voor syntactische signaal-analyse.
CN110413972B (zh) 一种基于nlp技术的表名字段名智能补全方法
Al Saied et al. The ATILF-LLF system for parseme shared task: A transition-based verbal multiword expression tagger
CN111613214A (zh) 一种用于提升语音识别能力的语言模型纠错方法
KR20230009564A (ko) 앙상블 스코어를 이용한 학습 데이터 교정 방법 및 그 장치
CN110134766B (zh) 一种面向中医古籍文献的分词方法和装置
Gu et al. Markov modeling of mandarin Chinese for decoding the phonetic sequence into Chinese characters
JPS58114225A (ja) 仮名漢字変換入力方式
CN110413779B (zh) 一种针对电力行业的词向量训练方法及其系统、介质
JP2989824B2 (ja) 文型・文法格認識方法
KR100474823B1 (ko) 자연어의품사태깅장치및그방법
JP2989823B2 (ja) 文型認識方法
KR0123238B1 (ko) 어절구조 특성을 이용한 형태소 분석 시스팀 및 분석 방법
JP2004264464A (ja) 特定分野辞書を利用した音声認識誤り訂正システム
JPS6239793B2 (ja)
JP6665029B2 (ja) 言語解析装置、言語解析方法、及びプログラム
JPH0619962A (ja) テキスト分割装置
Shetty et al. An approach to identify Indic languages using text classification and natural language processing
CN111737988B (zh) 一种复述句识别的方法及装置
JP2009086911A (ja) 固有表現抽出装置、その方法、プログラム及び記録媒体
JP2821143B2 (ja) 形態素分解装置
Sornlertlamvanich Probabilistic language modeling for generalized LR parsing
Homenda et al. Syntax and Semantics-Based Decision-Making

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071008

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081008

Year of fee payment: 9

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081008

Year of fee payment: 9