JPS6055468A - 多言語解析装置 - Google Patents

多言語解析装置

Info

Publication number
JPS6055468A
JPS6055468A JP58162978A JP16297883A JPS6055468A JP S6055468 A JPS6055468 A JP S6055468A JP 58162978 A JP58162978 A JP 58162978A JP 16297883 A JP16297883 A JP 16297883A JP S6055468 A JPS6055468 A JP S6055468A
Authority
JP
Japan
Prior art keywords
dictionary
grammar
node
semantic
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58162978A
Other languages
English (en)
Inventor
Yuji Uchida
裕士 内田
Akinari Masuyama
増山 顕成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58162978A priority Critical patent/JPS6055468A/ja
Publication of JPS6055468A publication Critical patent/JPS6055468A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、自然言語解析装置に係り、特に多言語の処理
が可能な多言語解析装置に関するものである。
〔従来技術と問題点〕
従来の自然言語解析装置は、例えば日本語を解析するも
のであれば、そのために日本語を解釈する部分がプログ
ラムの中に含まれており、また、英語を解析するもので
あれば、同様に英語を解釈する部分がプログラムの中に
含まれている、というようにそれ自身に言語依存である
部分を含むため、日本語を解析するものから英語を解析
するものというように、他の言語を取シ扱おうとすれば
、言語依存でおる部分を他の言語用に変えなければなら
ないために最初から設計し直す必要があった。
〔発明の目的〕
本発明は、上記の考察に基づくものであって、単語辞書
と文法辞書を取り換えるだけで解析装置や意味関係辞書
を変えることなく多言語の解析を可能とした多言語解析
装置を提供することを目的とするものである。
〔発明の楢級〕
そのために本発明の多言語解析装置は、文法規則を格納
する文法辞書、単語と該単語の意味情報と該単語の文法
属性情報とを格納する単語辞書、上記意味情報に対応し
て意味関係の規定した情報を格納する意味関係辞書、辞
書を参照する辞書参照装置、及び上記単語辞1を基に入
力文を単語単位の上記意味情報と文法属性情報とを有す
るノードに分割したノード・リストを入力し解析木を出
力する解析装置を備えた多言語解析装置であって、上記
解析装置は、上記ノード・リストの隣り合う2つのノー
ドを処理対応である解析窓とし、上記文法辞書を参照し
て文法の指示に従って上記解析窓の2つのノードについ
て新ノードの生成、置き換え、変換その他のノード・リ
スト変更処理を行い、且つ上記意味関係辞書を参照して
各ノード間の意味関係のチェックを行い、解析木を生成
し出力するように構成されたことを特徴とするものであ
る。
〔発明の実施例〕
以下、本発明の実施例を図面を参照しつつ説明する。
第1図は多言語解析装置の機能概要を説明する図、第2
図はノード・リストを説明する図、第3図tよ解析木を
説明する図、第4図は本発明の多言語解析装置の1実施
例構成を示す図、第5図は本発明の多言語解析装置の中
の解析装置の1実施例構我を示す図、第6図はノード・
リスト変更装置の動作を説明する図である。図において
、N1ないしN7はノード、1は文法参照装置、2は解
析装置、3は単語辞書参照装置、4は文法辞書、5は意
味関係辞書参照装置、6は意味関係辞書、7は単語辞書
、21はノード・リスト格納装置、22は文法解釈装置
、23はノード・リスト変更装置、24は履歴格納装置
、25は状態変数スタック、26は解析木格納装置を示
す。
本発明の多言語解析装置は、第1図に示すように、ノー
ド・リストを入力して解析木を出力するものである。「
彼は木を買った。」という日本語を最小単位の単語のノ
ードまで分割して作ったノードの一次元リストを示した
のが第2図である。
そして、とのノード・リストから生成される解析木の例
を示したのが第3図である。第3図において、第2図に
示すノード嗜リストのノードN1ないしN7は、ノード
N1とN2とを合わせて「彼は」という新たなノードが
作られ、またノードN3とN4とを合わせて「木を」、
同様に「其った。」という新たなノードが作られること
を示し、更に、「買・た。」にi、「木を」がかかシと
して、即ち「木を」は「頁った。」の対象であることが
<0BJECT)という文法の指示によって表わされ、
同様に[−買った。」にれ、「彼は」がががシとして、
即ち「彼は」は「貝った。」の主体であることが<AC
TOR>という文法の指示によって表わされている。こ
こで、ノードは、意味記号Sと文法属性Gより成り、例
えば先に述べた例のノードN1の「彼」の場合には、意
味記号Sが[HEJ、文法属性GがIN、IW%PRO
Njである。Nは名詞、IWは自立語、PRONは代名
詞であることを意味している。第1図に示す多言語解析
装置の構成を示したのが第4図である。
第4図において、文法辞書4は、その言語について単語
がどのような規則に従って並べられるのか、その他の文
法規則を格納する辞書であυ、これを参照するものが文
法参照装置1である。単語辞書7は、例えば日本語であ
れば、先に述べたような「彼」、「木」などの単語及び
それに対応する意味記号と文法属性を格納する辞書であ
り、これを参照するのが単語辞書参照装置6である。意
味関係辞書6は、例えば日本語の「歩く」、英語の[w
allc J 、仏語やその他の言語の歩くという意味
のことを同一の意味記号で表わしたものに対し、その主
体となり得るのは人間や動物に限られる、というような
意味関係の定義を格納する辞書であリ、この意味関係辞
書6を参照するのが意味関係辞書参照装置5である。解
析装置2は、ノード・リストを入力し、先に述べた各辞
書を参照しながら解析を行い、解析木を出力するもので
、その詳細な1実施例構成を示したのが第5図である。
第5図において、ノード・リスト格納装置21は、ノー
ド・リストと解析窓よシなる。ノード・リストは、単語
辞書を参照し、図示しない単語分割装置によって入力文
を分割し作成されるものである。解析窓とは現在処理の
対象となっている隣り合った2つのノードのことである
。文法解釈装置22は、解析窓中の2つのノードの文法
属性から適用できる文法を、文法参照装置1を通して文
法静置4から取り出し、文法の指示に従ってノード・リ
スト変更装置23に指示を与える。ノード・リスト変更
装に23は、文法解釈装置22の指示に従ってノード・
リスト及び解析木に変更を加え、履歴格納装置24に情
報を送る。解析木格納装置26は、それまでの処理でで
きた解析木を格納しておく。履歴格納装置24は、それ
までの状態と適用できる文法を格納しておく。状態変数
スタック25は、状態変数を文法の指示によって格納す
る。状態変数が状態変数スタック25に格納されると、
適用できる文法の範囲が広がる。
ノード・リスト変更装置23は、文法の指示に従って、
ノード・リストに対して次のような処理を行うことがで
きるものである。
■ 解析窓の2つのノードを新しい1つのノードに置き
換える。この場合、新ノードを親ノードとし、2つのノ
ードを子ノードとした解析木が解析木格納共、置26に
格納される。そして、新ノードの意味記号は、文法の指
示に従って次の場合のどれかを取る。
(イ) 左ノードの意味記号 ←) 右ノードの意味記号 (ハ) 左ノードと右ノードとをつなげた意味記号(文
法の指示に従って2つの意味記号の間に文法の指定した
記号をはさむことができる。
また、新ノードの文法属性は、文法の指示に従って次の
どれかとなる。
(イ) 左ノードの文法属性 (0) 右ノードの文法属性 (ハ) 左ノードと右ノードを合わせた文法属性更にこ
れらの文法属性に文法の指示した属性の追加、削除がで
きる。
■ 解析窓の左ノード(又は右ノード)を新ノードで置
き換える この場合、意味記号はもとのままである。
文法属性は先に述べたのと同様にして決めることができ
る。
■ 解析窓を右又は左にずらす。
■ パック・トラックをかける。
この場合、直前に適用された文法の直前の状態にもどす
ことができる。
■ 右又は左の解析窓の単語を変更する。
■ 右又は左の解析窓のノードをコピーして新ノードと
し、ノード・リストに追加する。例えば、「Aは山へ、
Bは海へ行く。」を「Aは山へ行く。Bは海へ行く。」
のように「行く」を追加する。
■ 右ノードと左ノードとを変換する。例えば「りんご
を3個」のような特殊の並びの場合には[3(1?4J
(の)「りんごを」のようにする。
次に「彼は歩く。」という文を例にノード・リスト変更
装置の動作を第6図を参照しつつ説明する。まず、「彼
れ歩く。」という文は、図示しない単語分割装置によっ
て単語辞書を参照して「彼」、「は」、「歩」、「<」
、「。」の各ノードに分割され、ノード・リスト格納装
置に格納される。各ノードの意味記号Sと文法属性Gは
第6図に示すような内容となり、これは、単語辞書を参
照することによシ得られる。第6図において、点線枠で
示したのが解析窓であり、隣り合う2つのノードにより
設定される。
(a) 文の先頭(左端)のノードから順にノード「彼
」と1は」を解析窓とする。ここで「彼」は、意味記号
SがHE、文法属性GがN、IWであシ、「は」は、文
法属性GがLA、DW%ACTである。LAは左方向に
対応することを意味し、DWは付Fi語を意味する。従
って、右方向に対応する伺属詔がある場合には、その文
法属性GにはRA、DWが付けられテいル。ACTはA
CTOR(主)になれるものであることを意味する。例
えば「・・・・・・は」でなく、「木を買う」の場合の
1を」はACTORになれないので、ACTは付かない
この解析窓では、文法辞■の参照により、(IW)+(
LA、DW)=(1,2、−LA、DW)+という文法
が適用される。右辺の訃は左ノード、2は右ノードを意
味し、右辺全体は、左ノードの文法属性と右ノードの文
法に1性がらLA、DWを除いたものを新たなノードの
文法属性とすることを表わしている。()の右の十記号
は合成タイプの文法であることを表わしている。
(h)「彼」と「は」を新ノード「彼は」に置き換え、
その右の「歩」とを解析窓とする。ここで、「彼は」は
、先に述べたように、意味記号SがII E、 文法属
性G がN%IW、ACTとナシ、マた「歩」は、意味
記号SがWALK、文法属性GがV、IWSTACTと
なる。■は動詞、TACTはACTORをとるもの(T
ake Actor )であることを意味する。
この解析窓では、文書辞書を参照することにより (IW、−lP、H)+(IW)=(1、PH)Fとい
う文法が適用される。IPHは句でないことを表わし、
右辺全体は、1(左ノード「彼は」の文法属性)にPH
を伺け、「彼は」の上に新ノードを作るととを表わして
いる。Fは1番目の」二に新ノードを作る、先読みを表
わす。その結果、解析木は第6図(C)に示すようにな
る。
(C) そして、−X−+−X−=R という文法が適用される。■記号は何でもよいことを表
わし、Rは解析窓を右ヘシフトすることを表わす。
(d)1歩」と1<」を解析窓とする。
ここで「<」の文法属性GはLA%DWとなる。
この解析窓では、 (IW)+(LA、DW)=(1,2、−LA、DW)
+という文法が適用され、 (e)「歩」と「<」が合成され、新ノード「歩く」で
置き換えられ、「彼は」と「歩く」が解析窓となる。そ
して、この解析窓では、%++=Rという文法が適用さ
れる。
(1)「$、<」と1−0」とを解析窓とする。右ノー
ド「。」の文法属性GはPERIODとなり、この解析
窓では、 (IW)+(IRIOD)=(1、PII)+という文
法が適用される。
(q)「彼は」と「歩く。」を解析窓とする。
その解析窓では、 (N、IW、ACT、PH)+(V、AC’l’、PI
I)=(2)→<ACTOR> という文法が適用される。このとき、(II E 1W
ALK、<ACTOR> )が意味関係辞書に参照され
る。従って、例えば「彼」が「シんご」であるとすると
、「りんごは歩く。」という文はあり得す、このような
場合、意味関係辞書を参照することによってチェックさ
れる。
<h> 以上の処理にょシ第6図<h>に示すような解
析木を解析木格納装置に格納し、解析を終了する。
単語辞書は、日本語であれば以上に述べたように「彼」
、「は」、「歩」などの単語及びそれに対応する意味記
号Sと文法属性Gとを入れておけばよく、英語であれば
、同様に英単語及びそれに対応する意味記号Sと文法属
性Gとを入れておけばよい。文法辞書も当然各言語に応
じた文法規則を入れておけばよい。それに対して、意味
関係辞書は、例えば、先に述べたように「歩く」という
意味記号のものに対して「りんご」という意味記号のも
のは主体になり得ないというような情報を入れておく。
このような情報は、他の言語であっても変わらない。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば、言語
の違いに応じて単語辞書と文法辞書とを変えるだけで、
解析装置や意味関係辞書を変えることなく多言語の解析
が可能となる。従って、単語辞書と文法辞書とを言語に
合わせて用意すれば、汎用性の高い多言語解析システム
を容易に構図することか可能となる。
【図面の簡単な説明】 第1図は多言語解析装置の機能概要を説明する図、第2
図はノード・リストを説明する図、第3図は解析木を説
明する図、第4図は本発明の多言語解析装置の1実施例
構成を示す図、第5図は本発明の多言語解析装置の中の
解析装置の1実施例構成を示す図、第6図はノード・リ
スト変更装置の動作を説明する図である。 N1ないしN7・・・ノード、1・・・文法参照装置、
2・・・解析装置、3・・・単語辞書参照装置、4・・
・文法辞書、5・・・意味関係辞書参照装置、6・・・
意味関係辞書、7・・・単語辞書、21ノード・リスト
格納装置、22文法解釈装置、23ノード・リスト変更
装置、24履歴格納装置、25状態変数スタツク、26
解析木格納装置。 特許出願人 富士通株式会社 代理人弁理士 京 谷 四 部 ケ 1 図 臂 2 図 才 3 [’3 プ 4 (2) 健 61必 (浣) 一′11′G 図 (d)

Claims (1)

    【特許請求の範囲】
  1. 文法規則を格納する文法辞書、単語と該単語の意味情報
    と該単語の文法属性情報とを格納する単語辞書、上記意
    味情報に対応して意味関係の規定した情報を格納する意
    味関係辞書、辞書を参照する辞書参照装置、及び上記単
    語辞書を基に入力文を単語単位の上記意味情報と文法属
    性情報とを有するノードに分割したノード・リストを入
    力し解析木を出力する解析装置を備えた多言語解析装置
    であって、上記解析装置は、上記ノード・リストの隣り
    合う2つのノードを処理対応である解析窓とし、上記文
    法辞書を参照して文法の指示に従って上記解析窓の2つ
    のノードについて新ノードの生成、置き換え、変換その
    他のノード・リスト変更処理を行い、且つ上記意味関係
    辞書を参照して各ノード間の意味関係のチェックを行い
    、解析木を生成し出力するように構成されたことを特徴
    とする多言語解析装置。
JP58162978A 1983-09-05 1983-09-05 多言語解析装置 Pending JPS6055468A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58162978A JPS6055468A (ja) 1983-09-05 1983-09-05 多言語解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58162978A JPS6055468A (ja) 1983-09-05 1983-09-05 多言語解析装置

Publications (1)

Publication Number Publication Date
JPS6055468A true JPS6055468A (ja) 1985-03-30

Family

ID=15764891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58162978A Pending JPS6055468A (ja) 1983-09-05 1983-09-05 多言語解析装置

Country Status (1)

Country Link
JP (1) JPS6055468A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5079701A (en) * 1987-09-29 1992-01-07 Sharp Kabushiki Kaisha System for registering new words by using linguistically comparable reference words

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5079701A (en) * 1987-09-29 1992-01-07 Sharp Kabushiki Kaisha System for registering new words by using linguistically comparable reference words

Similar Documents

Publication Publication Date Title
JPH05324713A (ja) 自然語処理方法および自然語処理システム
JPH02165378A (ja) 機械翻訳システム
Fan et al. An HPSG-based shared-grammar for the Chinese languages: ZHONG [|]
JPS6318458A (ja) 感情情報抽出装置
Waseem et al. Language-independence of DisCoCirc's Text Circuits: English and Urdu
JPS6055468A (ja) 多言語解析装置
Arwidarasti et al. Converting an Indonesian constituency treebank to the Penn treebank format
JP2005284723A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Wijerathna et al. A translator from sinhala to english and english to sinhala (sees)
JP3113257B2 (ja) 機械翻訳装置
JPH03260766A (ja) 括弧生成判定機能付翻訳装置
JP4869281B2 (ja) 機械翻訳装置、プログラム及び方法
JP2007133905A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3919732B2 (ja) 機械翻訳装置及び機械翻訳プログラム
Suryachandra et al. Statistical approaches in parsing for Telugu language
Anisimov et al. Chunking in Dependency Model and Spelling Correction in Russian
KR20110092691A (ko) 코더 친화적 기계이해형 자연어 텍스트 표현 방법
JPS6174068A (ja) 翻訳装置
JPS59121574A (ja) 翻訳処理方式
Ali et al. Implementation of the rule-based approach for the resolution of strong personal anaphora in Pashto discourse
JP4033088B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4033012B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Mitreska et al. xAMR: Cross-lingual AMR End-to-End Pipeline
Sanders The Rosetta translation system
JP2555921B2 (ja) 翻訳変換機能付きワープロ装置