JPS59201172A - 曖味さ解析方式 - Google Patents

曖味さ解析方式

Info

Publication number
JPS59201172A
JPS59201172A JP58074995A JP7499583A JPS59201172A JP S59201172 A JPS59201172 A JP S59201172A JP 58074995 A JP58074995 A JP 58074995A JP 7499583 A JP7499583 A JP 7499583A JP S59201172 A JPS59201172 A JP S59201172A
Authority
JP
Japan
Prior art keywords
sentence structure
information
analysis
local
syntactic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58074995A
Other languages
English (en)
Other versions
JPH0415504B2 (ja
Inventor
Kazushi Muraki
一至 村木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP58074995A priority Critical patent/JPS59201172A/ja
Publication of JPS59201172A publication Critical patent/JPS59201172A/ja
Publication of JPH0415504B2 publication Critical patent/JPH0415504B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、言語の構文解析以降式におG′Vで、形態素
解析によって41られた情報を用い構文的・意味的1凌
昧さを高速に解析する曖昧さ解析方式に関する。
従来の構文解析方式では、構文解析規則と(+fふ書き
換え規則を用いて、飴の構文範噴をキーに入↓ 刃文の構Z的係り受けを同定するが、その際語の形態的
特性や局所的な語列パターンなどの情報を用いることが
なかったため、構文解析時の曖昧さが十分に解消できな
いで、構文解析途中に誤りが戻り処理をバックトラ、キ
ングと呼ふが、このパックトラッキンクオーバーヘッド
の減少には誤った規則の適用を事前に蕾止する手法が有
効と考えられ解析時に意味情報を1部導入する方式等が
提案されているが、構文規則の数や、抱文範唱を減らす
ことにより泪在的なハックトラッキング発生の危険性を
減少させ侮る。しかし構文規則や、横文範驕の数を極度
に減じると、言語の構文構造に関する十分な情報が抽出
できなくなり、以後の意味解析のだめの正しい情報を得
ることが困難になる。
本発明の目的は、構文解析以降の処理にとって十分な量
と質の構文情報を抽出し、かつ高速に曖昧さを解析する
効果をもつ曖昧さ解析方式を提供することである。
すなわち、形態素解析で得られた文字種などの形態的特
性と特殊語の存在情報を用い入力語列をいくつかにまと
めあげ、以後の構文解析時に発生する、バックトラッキ
ングポイント(オールターナティブな構文規則の存在場
所)の絶対数を減少することによりバックトラッキング
オーバーヘッドを減少しより信ぴょう性の高い構文構造
を高速に発見する曖昧さ解析方式を提供することにある
本発明の曖昧さ解析方式では、日本語における片仮名、
漢字、平仮名の文字種と連体助詞「の」などをまとめ上
げ情報として用いて形態素解析直後にまとめあげを行な
う。
一般に日本語文章中では、片仮名語列はコンマ。
ピリオド等のデリミターを含まない場合1つにまとめあ
げても構文構造は正しく保存されるし、漢字あるいは片
仮名だけからなる語列も同様に多くの場合、構文構造は
正しいまままとめあげられる更に片仮名語や漢字語が連
体助詞「の」だけで結合されている場合にも多くの場合
正しい構文構造を保ってまとめあげることができる。こ
れらの情報と、語の品詞情報とを用いて特定の形態特性
をもつ品詞語列をまとめ、当該語列に新しい品詞(構文
範晴と同じ)を割り振ることにより、構文解析からは、
入力文中の自立品詞の数を非常VC,4)さいものにし
、得る。これによって、通常構文解析が入力単語数nに
対しn  (K:定数)のステップを費すのをmKステ
ップ(mはまとめ上げによって得られた文中で品詞を割
り当てられたストリングの数’ m<<n :通常mは
m<n/2におさえられる)におさえることができる。
本発明によれば、形態素解析直後入力文中の、特定の形
態情報をもった語列を局所構文変換テーブルによってま
とめあげて品詞をまとめあげられたストリングに新たに
割り振る局所構文処理を行なった後、前記局所構文処理
の出力であるス)IJング列に対し構文解析処理を行な
うことを特徴とする曖昧さ解析方式が得られる。
次に本発明の実施例について図面を参照して説明するつ 第1図は1、本発明の1実施例を示すブロック図であり
、第2図は、局所構文処理テーブルの概念を説明する説
明図であり、第3図は第1図中の局所構文処理モジュー
ルのフローチャートである。
第1図において形態素処理モジュール1は、情報線O1
より入力文を読み込み飴の発見を行なった後辞書引きを
行ない各々の詔に品詞と辞せ)引きを行なった結果得ら
れる飴粟情報と文字種を付けた後、生成された語列を情
報線02を通し出力する。局所構文処理モジュール2は
前記情報鞭02より語列を読み込み情報線23を介し局
所構文変換テーブルを参照し、語列のまとめ上げと品詞
の割り振りを行ない、それ以上まとめあげられなくなっ
たらは生成されたストリング列を情報線03を介し出力
する。
構文解析処理モジー−ル4は前記情報線03より読み込
んだストリング列をもとにストリングに付加された品詞
と辞書情報をもとに飴・句・節の発見と各々の構文関係
を固定した後、当該構文関係情報を情報線04より出力
する。
第2図において、前記局所構文変換テーブル3はフィー
ルドF1〜F2k(K:正整数)、Gからなる局所構文
変換規則の集合であり、Fi(i:0以上の偶数)、F
i+、は1つの詔に関する情報を記述しており、Fiは
文字種、Fi十、  は品詞と他の開業情報を含み、他
方Gは品詞と他の藺粟情報を含む。第2図中N、V、D
、I、F ii:品詞情報で各々各詞、動詞、テリミタ
ー、活用市尾、付属語を示し、その添字は品詞の下位分
類を示す又、K、C。
Hは入力語文字種を示し、各々片仮名、漢字、平仮名を
示す。同図中、[]」あるいは「・」のように直接シン
ボルを記入することも許す。
他、X、Yは各々のフィールド中の定義域上に導入され
る変数である。G中の記述は次の意味をもつ。第1番の
数は、F1〜F2k  までで指定された語列から生成
される飴の中心詔を指定し、第2番の記号は品詞を、第
3番目は当該中心胎生にまとめあげる語(たとえば”1
.3″は第1番の飴から第3番の語までをひとまとめに
する)を示す。
削記局バr構文処理モジュールのフルーチャート第3図
では入力された語列中にFi、Fi+1(0≦i<K)
で指定された条件に合致する語が”’V’+1(O≦i
≦K)の11序でならんでいたならば、当期語列を1つ
にまとめ上げGで指定された品詞と他の前菜情報を付加
する。当該局所構文処理モジュール2は、前記局所構文
変換テーブル3中の前記局所構文変換規則を適用できな
くなるまで重複を許し適用する。
当該局所構文処理モジュール(第1図中2)は第3図に
示すように次の順で処理が進む。
(1)  局所変換テーブル3を読み1つの規則iを読
み込む。
(2)入力語列を左端jから規則iと対照しく3)前記
対照が成功したら、規則を適用した後当該入力語列で注
目位置をずらしj+1して(2)へ行く (4)前記対照が失敗しだら、条件により注目している
当該入力語列中の位置をずらしてj+1、(2)へ行く
か、(5)行く。
(5)全ての規則を参照し終ったら終了、それ以外は新
しい規則i+1を読みK(1)へ行く。
本発明の曖昧さ解析方式は文字種、品詞、特殊前案の情
報を用いて互いに構文的に確実に結ばれた連続語列を予
めまとめあげ以後の構文解析処理をより高速にし、かつ
より品質のよい構文解析を行なうことができるという効
果がある。
更に、本方式は従来の構文情報、形態情報、意味情報を
用いたi I解析方式と共存することができ、構文解析
処理方式の選択度はそこなわない。
【図面の簡単な説明】
第1図は本発明による曖昧さ解析方式の1実施例を示す
ブロック図、第2図は局所構文処理モジー−ル及び局所
変換テーブルを説明するだめの説明図、第3図は局所構
文処理モジュールの7 o −チャートである。 図において、lは形態素解析モジー−ル、2は局所構文
処理モジュール、3は局所構文変換テーブル、4は構文
解析モジュールをそれぞれ示す。 オ 1 ロ オ 2図

Claims (1)

    【特許請求の範囲】
  1. 言語構文解析方式における曖昧さ解析方式において、形
    態素処理後特別な文字種、構文範晴情報から、予測され
    る、構文的・意味的まとまりをまとめあげるだめの規則
    を保持する局所構文変換テーブルを用いて局所構文処理
    を行なった後に構文解析処理を売行することにより構文
    解析処理時の曖昧さを予め減少させることを特徴とする
    曖昧さ解析方式。
JP58074995A 1983-04-28 1983-04-28 曖味さ解析方式 Granted JPS59201172A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58074995A JPS59201172A (ja) 1983-04-28 1983-04-28 曖味さ解析方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58074995A JPS59201172A (ja) 1983-04-28 1983-04-28 曖味さ解析方式

Publications (2)

Publication Number Publication Date
JPS59201172A true JPS59201172A (ja) 1984-11-14
JPH0415504B2 JPH0415504B2 (ja) 1992-03-18

Family

ID=13563358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58074995A Granted JPS59201172A (ja) 1983-04-28 1983-04-28 曖味さ解析方式

Country Status (1)

Country Link
JP (1) JPS59201172A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62267873A (ja) * 1986-05-16 1987-11-20 Ricoh Co Ltd 言語解析装置
JPS63113668A (ja) * 1986-05-15 1988-05-18 Ricoh Co Ltd 言語解析装置
JPS63113669A (ja) * 1986-05-16 1988-05-18 Ricoh Co Ltd 言語解析装置
JPS63204462A (ja) * 1987-02-20 1988-08-24 Sanyo Electric Co Ltd 日本語解析処理方式
JPH01114983A (ja) * 1987-10-28 1989-05-08 Nec Corp 品詞推定方式
US5317510A (en) * 1989-03-15 1994-05-31 Kabushiki Kaisha Toshiba Method and apparatus for generating sentences from conceptual structures

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
JPS59121574A (ja) * 1982-12-28 1984-07-13 Fujitsu Ltd 翻訳処理方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
JPS59121574A (ja) * 1982-12-28 1984-07-13 Fujitsu Ltd 翻訳処理方式

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63113668A (ja) * 1986-05-15 1988-05-18 Ricoh Co Ltd 言語解析装置
JPS62267873A (ja) * 1986-05-16 1987-11-20 Ricoh Co Ltd 言語解析装置
JPS63113669A (ja) * 1986-05-16 1988-05-18 Ricoh Co Ltd 言語解析装置
JPS63204462A (ja) * 1987-02-20 1988-08-24 Sanyo Electric Co Ltd 日本語解析処理方式
JPH01114983A (ja) * 1987-10-28 1989-05-08 Nec Corp 品詞推定方式
US5317510A (en) * 1989-03-15 1994-05-31 Kabushiki Kaisha Toshiba Method and apparatus for generating sentences from conceptual structures

Also Published As

Publication number Publication date
JPH0415504B2 (ja) 1992-03-18

Similar Documents

Publication Publication Date Title
US5890103A (en) Method and apparatus for improved tokenization of natural language text
US6539348B1 (en) Systems and methods for parsing a natural language sentence
McDonald An efficient chart-based algorithm for partial-parsing of unrestricted texts
EP0241717A2 (en) Linguistic analysis method and apparatus
US5283737A (en) Mechanism for generating linguistic expressions based on synonyms and rules derived from examples
JPS59201172A (ja) 曖味さ解析方式
Garrido-Alenda et al. Incremental construction and maintenance of morphological analysers based on augmented letter transducers
Kitani et al. Pattern matching and discourse processing in information extraction from Japanese text
JP2960936B2 (ja) 係り受け解析装置
Edman et al. Subword-delimited downsampling for better character-level translation
Viet et al. Convamr: Abstract meaning representation parsing for legal document
CN110287496A (zh) 一种基于神经网络的英译汉词义消歧方法
KR100286649B1 (ko) 연어패턴에 기초한 어휘 변환방법
KR20010057763A (ko) 부분 대역 패턴 데이터베이스에 기반한 번역문 생성장치및 그 방법
JPS63221475A (ja) 構文解析方法
KR20020054244A (ko) 부분문틀을 이용한 장문 번역 장치 및 그 방법
JPH09237277A (ja) 複合名詞解析方法
JPS6368972A (ja) 未登録語処理方式
JPH01266670A (ja) 日本語対象文固有用語抽出処理装置
JP3222173B2 (ja) 日本語構文解析システム
JPH0656626B2 (ja) 言語意味解析装置
Murthy Parsing Telugu in the UCSG formalism
TAKASU et al. A Continuous Speech Recognition Model Utilizing Subject Transition in Sentences
JPH0157829B2 (ja)
JP3378059B2 (ja) 文生成装置