JPS58175075A - 構文分析方式 - Google Patents

構文分析方式

Info

Publication number
JPS58175075A
JPS58175075A JP57057921A JP5792182A JPS58175075A JP S58175075 A JPS58175075 A JP S58175075A JP 57057921 A JP57057921 A JP 57057921A JP 5792182 A JP5792182 A JP 5792182A JP S58175075 A JPS58175075 A JP S58175075A
Authority
JP
Japan
Prior art keywords
attributes
given
dictionary
attribute
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57057921A
Other languages
English (en)
Inventor
Masaie Amano
天野 真家
Hideki Hirakawa
秀樹 平川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP57057921A priority Critical patent/JPS58175075A/ja
Publication of JPS58175075A publication Critical patent/JPS58175075A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は与えられた原文中の辞書に未登録な単語の存在
によって生じる上記原文の構文分析不能事態を効果的に
回避することのできる実用性の高い構文分析方5t、に
関する。
〔発明の技術的背景とその問題点〕
近時、計算機システムを利用した文章解析・作成装置が
注目されている。中でも、与えられた文章の構文を自動
分析し、その分析結果に従って文書作成・編集を行うこ
ともなされている。
しかして、与えられた文章(原文)の構文分析を行5場
合、一般に単語と共にその属性が登録された辞書を用い
て上記原文を構成する各単#MO属性をそれぞれ求め、
これらの属性の繋が)関係と丈法規期とによって分析処
理がなされる。ところが、一般的に文章を構成する可能
性のある単語が全て辞書に登録されているとはいえず、
しばしば未登録単語が上記分析すべき原文中K1I4わ
れbことが多い、この場合、その単@に対する属性を決
定することができない為、構文分析が不可能となる。そ
して、その文章に対する他層を中断ぜざるを得ないと云
う不慮の事態が発生することKなる。
〔発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、与えられ九文章中に辞書に未登
録な単断が含まれ、そO単語に対して辞書引きによって
属性を与えることがで龜ないような場合であっても上記
文章の構文分析を効果的に行うことのできる実用性の高
い構文分析方式を提供することにある。
〔発明の概要〕
本発明は、与えられた文章(原文)を構成する各単1m
1に辞書引きKよってそれぞれ属性を与え、これらの属
性の繋が夛関係から上記文章の構文を分析すると共に1
この構文分析中に上記辞書1龜によって属性が与えられ
なかった単語が見出されたとき、上記構文分析の文法規
則上期待される属性を上記単語に与えて前記構文分析を
継続させるようにし友ものである。
〔発明の効果〕
従って本発明によれば、辞書引きによって属性が与えら
れなかつ九単語が存在しても、つま夛原文申に辞書に登
録されていない単語が存在しても、その属性を文法規則
上から推定してこれを与えて構文分析を行うので、構文
分析不能による文章処理の中断を招くことがない、しか
もめらゆゐ単語を登録した大容量の辞書を準備する必要
がないので汎用性に富み、その実用的利点が絶大である
等の効果を奏すゐ。
〔発明の実施例〕
以下、gigiを参照して本発明方式〇一実施例につき
説明する。
構文分析に供され為文章(原文)は、先ずそれを構成す
る単llk区分され、各単語について辞書を検索してそ
の属性が調べられる。辞書は、複数の単語をその属性の
情報と共にそれぞれ対応して登録したものであり、上記
属性は例えば華論の品詞情報として与えられる。この品
關の情報は、例えば次表の如く示される。
しかして次に、上記各単語に付され丸属性の繋が〉関係
から、所定の文法規則に従って前記原文の構文分析が行
われる。
第1図(a)〜(c)は文法規則の一例を示すもので○
印はステート、9印は最終ステートを示してお)、上記
各ステートを結ぶラインはアークを示している。構文分
析は上記アークを介して各ステートを辿ることによ)行
われる。
ζこで今、縞2図に示すようにr I EAT ANA
PPLE Jなる原文が構文分析の為に与えられ九とす
る。そして、この原文中の[ムPPLI J lkる単
語が辞書く未登録であったとする。この場合、辞書引き
によって!2図に示すようにrIJなる単語には「N」
なる属性が、r EAT JなるjILJWKはr V
T Jなる属性が、「l」なる単語にはr DI丁」な
る属性がそれヤれ付される。しかし、「ムPPLI J
 *る単語については、辞書に登録されていないことか
ら、その属性が不明となっている。
そこでこのような状履くおいて、これらの属性の繋がル
関係から次のようにして、その構文分析が行われる。こ
の構文分析は先ず、ステートSから、アークNPを辿る
ことによって行われる。このアータNPK示される文法
規則の下位構造は@III(bJK示される通夛であシ
、前記与えられた原文の最初の単語の属性がNであるこ
とから、ステートNPよりアークNを辿ってその最終ス
テー)(iK行會つく、この最終ステートQmへの到達
によって上位の文法構造に復帰し、そのステートq*K
J!る。これKよ夕、先ずアークNPK対する文法処理
が終了する。
しかるのち、今R#iステー)111からアークvPを
辿るが、このアークVPO下位構造が@1図(c) K
示されることから、ステー)VPから発するアータV丁
をチェックする。与えられた原文の第2番目の単語の属
性がこれに一致することから、このアークVTを辿9、
ステートq@に到着する。
しかして、このステートq−からは、アークNPが出て
いるので、先に説明した第1図(b)に示す文法構造の
チェックに移る。この文法構造にあっては、ステー)N
Pより出発するアークはDICTとNであル、与えられ
た原文o1gs100単語の属性がr DET Jであ
ることから上記アークDETをmシ、ステートqsK到
達する0以上により、原文の最初から3語までの単語に
対する構文分析が完了する。
次に、ステートq1からの文法規則を分析する訳である
が、原文の!4番目の檗IIgKついては、その属性が
与えられていないことから、その属性について次のよう
な推定が行われる。即ち、文法規則上、ステートqsよ
り出発するアークはNとムDJとの2つ番や、上記「廿
PIJ Jなる単@O属性として文法規則上rNJlる
いは「ムDJ Jが期待される。そこで先ず上記期待さ
れる属性r DET Jを「ムPPLE Jなる単暗に
与えて゛、その構文分析を行う、しかし、この−合には
アークADJによって到達するステー)(14が最終ス
テートでなく、シかも原文中に終に続く単語が存在しな
iことから、構文分析に失敗する。この結果、上記属性
の仮定が−っていることが判る。しかるのち、今度はr
 APPLE Jなる単語の属性として、残された属性
「N」を仮定し、文法規則に従う構文分析を行う、この
場合、ステー)QlからアークNを辿って最終ステー)
Qlに到達し、これによって第1図(c)に示す最終ス
テー)qyK復帰したのち、更に同図(1)K示す最終
ステートq雪に復帰して、その構文分析に区切)がつく
、同時に原文を構成する単語の属性チェックが尽きるこ
とによシ、ここに構文分析の成功結果を得ることになる
以上のように、原文に対する構文分析は、その構文分析
中に属性の付されていない単語が出現したとき、そO単
語に対して文法規則上期待される属性を推定し、これを
与えて上記構文分析を継続させるととくよって行われる
。従って、辞書に未登録な単語を含む文章が与えられた
場合であっても、その構文分析を効果的に行うことがで
き、これによって文章処理が中断されるような不具合を
招くことがない、しかも上述したように辞書に未登録な
単語を含む文章に対しても、その単語に過当な属性を与
えて構文分析を実行することができるので、辞書として
あらゆる出現可能性のある単語を登録する為の大容量の
ものを準備する必要がない等の実用上絶大なる効果を奏
する。
さて、第3図は上述した構文分析を行う実行プログラム
の処理フローの一例を示すものである。iち、このプロ
グラムが起動1され友とき、先ずステップ2において与
えられた原文を構成する各単語に対して辞書引きを行い
、各単語にそれぞれ属性を与える。しかるのち次のステ
ツfsでは、上記原文を構成する各単語についてサーブ
し、その全てに属性が与えられているか否かをチェック
する。そして、ステツf4において上記チェック結果を
判定し、全ての巣飴に属性が付けられている場合には、
ステツf5においてその構文分析を実行する。この構文
分析は#述した第1図(1)〜(a) K示す如き文法
規則に従って行われる。
一方、ステラ7’4における判定によって、属性が付け
られていない単語が残されてbると判定された場合、そ
の状態のままステツ16によって構文分析が行われる。
しかるのち、ステップ7を介してその構文分析の成功・
不成功の判定がなされ九のち、ステラ7’JKて属性の
ついていない単語が存在するか否かの判定が行われ、ス
テラf夕でその結果が弁別される。そして、ステップI
Oにおいて、上記属性の与えられていない単語に対して
文法規則上からその属性が推定され、これが与えられる
。以後、ステツ!6〜10が繰返して実行される。
このようなルーテンによる属性の推定と、その構文分析
が繰返して行われ、ステツf6の構文分析が成功した場
合、ステップ7の+U足によ9成功が見出されて、その
処理を終える。またステップ1により、属性のついてい
ない事始のチェックがなされ、文法規則上、それについ
て期待される属性がなくなつ九場合には、ステツf#の
判定によって、その処理を終了する“ことになる。
以上の制御フローによって、前述した構文分析処理が簡
易にして効果的に実行されることになる。そして、上述
した如く、辞書に未登録な単語を含む原文につめても、
その構文分析を効果的に行うことが可能となる。従って
、その実用的利点は絶大であり、構文分析の一形態とし
て非常に有用である。
尚、本発明は上記実施例に限定されるものではない1例
えば推定し九属性によって構文分析の成功結果が複数得
られる場合もあるが、このような場合には、これらの全
てを分析結果として得るようにすればよい、また一つの
文章中に辞1iFK未登録な単一が複数個存在する場合
もあるが、そのときには未登録単語が出現する都度、そ
の属性の推定処mを行うようにすればよい。
また文法規則は上記蕗1図葎)〜(c)に示すものに限
定されないとは勿論のことであシ、属性として品詞の情
報に限定されないことも云うまでもない、要するに本発
明はその要旨を逸脱しないm囲で種々変形し、応用して
実施することができる。
【図面の簡単な説明】
図は本発明の一実施例を説明する為のもので、第1図(
a)〜(c)は文法規則の一例を示す図、第2図は与え
られ九原文例とその属性の関係を示す図、第3図は実施
例に係る構文分析処理の制御フローを示す図である。 2・・・辞書引き処理、3・・・属性付けの判定処理、
5.6・・・構文分析処理、10・・・属性の推定処塊
。 出願人代理人  弁理士 鈴 江 武 彦牙1図 牙 2図 牙3図

Claims (1)

    【特許請求の範囲】
  1. 複数の単語とその属性の情報とをそれぞれ対応させて登
    録した辞書と、この辞書を検索して、与えられた原文を
    構成する各単語にそれぞれ属性を与える辞書引き手段と
    、この手段によ〕与えられた各単語の属性の関係から上
    記原文の構文を分析する手段と、仁の構文分析中に前記
    辞書引きKよる属性の与えられていない単語が見出され
    たとき上記構文分析の文法規則上期待される属性を上記
    填語に与えて前記構文分析を継続させる手段とを具備し
    たことを特徴とする構文分析方式。
JP57057921A 1982-04-07 1982-04-07 構文分析方式 Pending JPS58175075A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57057921A JPS58175075A (ja) 1982-04-07 1982-04-07 構文分析方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57057921A JPS58175075A (ja) 1982-04-07 1982-04-07 構文分析方式

Publications (1)

Publication Number Publication Date
JPS58175075A true JPS58175075A (ja) 1983-10-14

Family

ID=13069459

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57057921A Pending JPS58175075A (ja) 1982-04-07 1982-04-07 構文分析方式

Country Status (1)

Country Link
JP (1) JPS58175075A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6441068A (en) * 1987-08-05 1989-02-13 Ricoh Kk Translation editing device
US5220503A (en) * 1984-09-18 1993-06-15 Sharp Kabushiki Kaisha Translation system
US6022222A (en) * 1994-01-03 2000-02-08 Mary Beth Guinan Icon language teaching system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5220503A (en) * 1984-09-18 1993-06-15 Sharp Kabushiki Kaisha Translation system
JPS6441068A (en) * 1987-08-05 1989-02-13 Ricoh Kk Translation editing device
US6022222A (en) * 1994-01-03 2000-02-08 Mary Beth Guinan Icon language teaching system

Similar Documents

Publication Publication Date Title
Tomita An Efficient Context-Free Parsing Algorithm for Natural Languages.
JPH0343661B2 (ja)
JP3345763B2 (ja) 自然言語翻訳装置
Harris et al. Generating formal hardware verification properties from natural language documentation
JPH0713966A (ja) 文書の編集方法
Benítez et al. Methods and tools for building the Catalan WordNet
Li et al. SLOG: A structural generalization benchmark for semantic parsing
Antony et al. A survey of advanced methods for efficient text summarization
Bais et al. An Arabic natural language interface for querying relational databases based on natural language processing and graph theory methods
Kaul Practical applications of precedence graph grammars
Bais et al. A model of a generic natural language interface for querying database
JPS58175075A (ja) 構文分析方式
Kato et al. English multiword expression-aware dependency parsing including named entities
Cole et al. EP-odds and ends
Hemerelain et al. Semantic analysis of natural language queries for an object oriented database
JP3339006B2 (ja) 機械翻訳装置における並列名詞句処理装置
JPH0519187B2 (ja)
Atserias et al. Using a Diathesis Model for Semantic Parsing
JPS6368972A (ja) 未登録語処理方式
WO2023211370A2 (en) Semantic parsing for short text
Mann What conceptual graph workbenches need for natural language processing
Lalitha Devi et al. Syntactic structure transfer in a tamil to hindi MT system–a hybrid approach
CN114742068A (zh) Iso 19650标准文本的多语句关联分析方法及系统
Dimopoulos et al. A generic platform for the soc implementation of grammar-based applications
Nagao et al. PLATON--A New Programming Language for Natural Language Analysis