JPH06332938A - 自然言語解析装置および機械翻訳装置 - Google Patents

自然言語解析装置および機械翻訳装置

Info

Publication number
JPH06332938A
JPH06332938A JP5119455A JP11945593A JPH06332938A JP H06332938 A JPH06332938 A JP H06332938A JP 5119455 A JP5119455 A JP 5119455A JP 11945593 A JP11945593 A JP 11945593A JP H06332938 A JPH06332938 A JP H06332938A
Authority
JP
Japan
Prior art keywords
dependency
analysis
natural language
unit
symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5119455A
Other languages
English (en)
Other versions
JP3197110B2 (ja
Inventor
Shinji Tokunaga
信治 徳永
Hiroshi Tanano
裕氏 棚野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP11945593A priority Critical patent/JP3197110B2/ja
Publication of JPH06332938A publication Critical patent/JPH06332938A/ja
Application granted granted Critical
Publication of JP3197110B2 publication Critical patent/JP3197110B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 自然言語による入力文に対して正しい係り受
け解析を実施する。 【構成】 翻訳モジュール5の辞書引き形態素解析部8
は、入力文中に付加された係り受け記号を参照して形態
素解析を行う。構文解析部9は、形態素解析結果に基づ
いて入力文の構文を解析して構文解析木の候補を得る。
係り受け処理部10は、係り受け記号に基づく係り受け
指示情報を参照して、得られた構文解析木の候補の中か
らオペレータの指示に適合する構文解析木を特定する。
こうして、自然言語による入力文に対してオペレータに
よる指示に従って正しく係り受け解析を実施する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、文章理解装置等の自
然言語の解析を必要とする装置に用いられる自然言語解
析装置およびこの自然言語解析装置が搭載された機械翻
訳装置に関する。
【0002】
【従来の技術】従来、機械翻訳装置等の自然言語を解析
する必要がある装置においては、自然言語が有する係り
受けの曖昧性に対して次のような方法によって対処して
いる。
【0003】1.構文解析の結果得られた複数の構文構
造候補に対して意味情報を用いた意味解析を実施し、意
味解析の結果に基づいて複数の構文構造候補の中から最
も確からしい構文構造候補を選択して入力文の構文構造
とする。 2.装置の次候補表示機能を用いて構文解析の結果得ら
れた複数の構文構造候補を確からしさの順に表示し、オ
ペレータは一つの構文構造候補をマニュアル選択する。 3.装置が解釈した係り受け関係を表示し、オペレータ
によって変更/選択された係り受け関係を用いて構文解
析を実施して入力文の構文構造を得る。 4.オペレータによって装置の前処理機能を用いて予め
係り受けが指示され、この指示を理解して構文解析を実
施して入力文の構文構造を得る。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の係り受けの曖昧性に対する対処方法には次のような
問題がある。すなわち、意味解析の結果に基づいて最も
確からしい構文構造を選択する対処方法の場合には、一
般常識等の知識や文脈を用いた意味解析でなければ係り
受けには曖昧性が残り、しかも知識や文脈を用いた意味
解析によって係り受けの曖昧性を除去する方法は未だ実
用段階には達していない。
【0005】また、次候補表示機能を用いて構文構造候
補を表示する対処方法や、装置が解釈した係り受け関係
を表示する対処方法や、前処理機能を用いて予め係り受
けを指示する対処方法の場合には、装置とインタラクテ
ィブに作業が実施されるために大量処理の場合には非常
に効率が落ちる。
【0006】そこで、この発明の目的は、自然言語によ
る入力文に対して正しい係り受け解析を実施でき、且つ
大量の入力文を処理可能な自然言語解析装置、および、
その自然言語解析装置を搭載した機械翻訳装置を提供す
ることにある。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、請求項1に係る発明は、入力部から入力された自然
言語による入力文の形態素解析を形態素解析部によって
行い、形態素解析結果に基づいて構文解析部によって入
力文の構文を解析する自然言語解析装置において、上記
形態素解析部による形態素解析に先立って、入力文中に
おける係り受け関係にある文節に付加されて係り受け関
係にあることを表している係り受け記号を検出する係り
受け記号検出部と、上記係り受け記号検出部で検出され
た係り受け記号を当該入力文の文字の属性として記憶す
ることによって,当該入力文の係り受けの関係を記憶す
る係り受け記憶部と、上記構文解析部によって得られた
当該入力文の構文解析結果のうち,上記係り受け記憶部
に記憶された係り受けの関係を満たす構文解析結果を当
該入力文の構文構造として出力する係り受け処理部を備
えると共に、上記形態素解析部は、入力文を複数の文節
に分割するに際して上記係り受け記号記憶部に記憶され
た係り受け記号で示される箇所を優先的に分割位置とす
る分割手段を有することを特徴としている。
【0008】また、請求項2に係る発明は、請求項1に
係る発明の自然言語解析装置において、上記係り受け記
号検出部は、係り受け関係にある2つの文節の夫々に付
加されて文節の範囲と係り受けの関係にあることとを表
す特定の係り受け記号を検出する検出手段を備えたこと
を特徴としている。
【0009】また、請求項3に係る発明は、請求項1あ
るいは請求項2に係る発明の自然言語解析装置におい
て、上記係り受け記号検出部は、係り受け関係にある2
つの文節の夫々の直後に付加されて係り受け関係にある
ことを表す特定の係り受け記号を検出する検出手段を備
えたことを特徴としている。
【0010】また、請求項4に係る発明は、変換部によ
って自然言語による入力文の内部構造をターゲット言語
による内部構造に変換し、この得られたターゲット言語
による内部構造に基づいて生成部によって翻訳文を生成
する機械翻訳装置において、請求項1乃至請求項3の何
れか一つに記載の自然言語解析装置を備えて、上記変換
部および生成部は、上記自然言語解析装置における係り
受け処理部から出力された自然言語による入力文の構文
構造に基づいて、上記入力文の翻訳文を生成することを
特徴としている。
【0011】
【作用】請求項1に係る発明では、入力部から入力され
た自然言語による入力文を形態素解析部によって形態素
解析するに先立って、係り受け記号検出部によって、入
力文中における係り受け関係にある文節に付加されてい
る係り受け記号が検出される。こうして検出された係り
受け記号が当該入力文の文字の属性として係り受け記憶
部によって記憶されることによって、当該入力文の係り
受けの関係が記憶される。そして、上記形態素解析部に
よる形態素解析の際に分割手段によって入力文を複数の
文節に分割する場合には、上記係り受け記憶部に記憶さ
れた係り受け記号で示される箇所を優先的に分割位置と
して分割される。
【0012】こうして分割された文節に基づく上記形態
素解析部による形態素解析結果に基づいて、構文解析部
によって入力文の構文が解析される。そして、係り受け
処理部によって、上記構文解析部からの構文解析結果の
うち上記係り受け記憶部に記憶された係り受けの関係を
満たす構文解析結果が当該入力文の構文構造として出力
される。
【0013】こうして、予めオペレータによって上記係
り受け記号で示された箇所が反映されて入力文が文節に
分割され、オペレータによって指示された係り受け関係
を満たす構文構造が得られるのである。
【0014】また、請求項2に係る発明では、形態素解
析するに先立って、上記係り受け記号検出部の検出手段
によって、入力文における係り受け関係にある2つの文
節の夫々に付加されて文節の範囲と係り受けの関係にあ
ることとを表している特定の係り受け記号が検出され
る。こうして、オペレータによって適確に指示された入
力文における係り受け関係にある文節に従って、オペレ
ータの意図する係り受け関係を最もよく反映している構
文構造が得られる。
【0015】また、請求項3に係る発明では、形態素解
析するに先立って、上記係り受け記号検出部の検出手段
によって、入力文における係り受け関係にある2つの文
節の夫々の直後に付加されて係り受けの関係にあること
を表している特定の係り受け記号が検出される。こうし
て、オペレータによって指示された入力文における係り
受け関係にある箇所の終了位置に従って、オペレータの
意図する係り受け関係を最もよく反映している構文構造
が得られる。
【0016】また、請求項4に係る発明では、上記自然
言語解析装置の入力部に自然言語による入力文が入力さ
れると係り受け処理部から当該入力文の構文構造が出力
される。そうすると、この出力された当該入力文の構文
構造に基づいて、変換部によって、当該入力文の内部構
造がターゲット言語による内部構造に変換される。さら
に、この得られたターゲット言語による内部構造に基づ
いて、生成部によって翻訳文が生成される。こうして、
オペレータによって指示された入力文における係り受け
関係を理解して翻訳処理が実施されるのである。
【0017】
【実施例】以下、この発明を図示の実施例により詳細に
説明する。尚、本実施例においては、この発明の自然言
語解析装置を機械翻訳装置に搭載した場合を例に説明す
る。図1は本実施例の自然言語解析装置が搭載された機
械翻訳装置の構成の一例を示す図である。
【0018】図1において、1はCPU(中央演算処理
装置)、2はメインメモリ、3はCRT(カソード・レイ・
チューブ)、4はキーボード、5は翻訳モジュール、6
は翻訳用の辞書,文法規則,木構造変換規則等が格納され
た外部記憶部、7はデータバスである。尚、翻訳モジュ
ール5は後に詳述するように与えられたソース言語をタ
ーゲット言語に翻訳する。また、キーボード4には、機
械翻訳装置を駆動するためのスタートキー,テンキー,文
字キーおよびその他翻訳を実行するためのキーが設けら
れている。
【0019】上記CPU1の制御に基づいて、キーボー
ド4から入力されたソース言語による入力文は翻訳モジ
ュール5に送出され、外部記憶部6に格納された辞書や
文法規則や木構造変換規則等を用いてターゲット言語に
変換される。こうして得られた翻訳文はメインメモリ2
に格納されると共に、CRT3に表示される。
【0020】図2は、上記翻訳モジュール5の構成の一
例を示すブロック図である。上述のようにして入力され
たソース言語による入力文は辞書引き形態素解析部8に
よる形態素解析処理によってソース言語の形態素に分割
されて品詞等の情報が得られる。構文解析部9は、外部
記憶部6に格納された文法規則を用いて辞書引き形態素
解析部8からの形態素解析結果に基づいて入力文の構文
を解析して構文解析結果を得る。そうすると、係り受け
処理部10は、構文解析部9によって得られた構文解析
結果に対して、後に詳述するような係り受け処理を実施
して入力文の構文構造を特定する。変換部11は、外部
記憶部6に格納された木構造変換規則を用いて、ソース
言語の構文構造をターゲット言語による構文構造に変換
する。そして、生成部12によって、上述のようにして
得られたターゲット言語の構文構造からターゲット言語
の文を生成する。
【0021】すなわち、本実施例においては、上記入力
部をキーボード4で構成し、上記記憶部を外部記憶部6
で構成する。そして、上記入力部,記憶部,辞書引き形態
素解析部8,構文解析部9,係り受け処理部10およびC
PU1で上記自然言語解析装置を構成するのである。
【0022】ところで、日本文「 私は双眼鏡で走っている生徒を見た。」「 私は運動場で走っている生徒を見た。」 では、「双眼鏡で」や「運動場で」が「走っている」に係るの
か「見た」に係るのかは構文解析部9では判定できず、構
文に曖昧性を有している。そこで、本実施例において
は、記号“*"及び“*#"をエスケープ文字とし、この
エスケープ文字で表記される係り受け記号を設定する。
そして、以下に例示するように、入力文における互いに
係り受け関係にある2つの文節の夫々の前に係り受け記
号“*”を付加する一方、後ろには係り受け記号“*
#"を付加するのである。尚、係り受け記号“*"の直後
に付加された番号は係り受け関係にある文節同士である
ことを表し、同じ番号が付加された文節同士は係り受け
関係にある。
【0023】したがって、次のように係り受け記号が付
加され場合には、 (イ) 「私は *1双眼鏡で*# 走っている 生徒を
1見た*#。」 (ロ) 「私は *1運動場で*# *1走っている*#
徒を 見た。」 例文(イ)では、係り受け記号“*1"と“*#"とに挟ま
れた文節「双眼鏡で」と文節「見た」とが係り受け関係にあ
り、文節「双眼鏡で」が文節「見た」に係ること意味する。
同様に、例文(ロ)では、係り受け記号“*1"と“*#"
とに挟まれた文節「運動場で」と文節「走っている」とが係
り受け関係にあり、文節「運動場で」が文節「走っている」
に係ること意味する。
【0024】また、例文(ハ) (ハ) 「*1昨日*# *2運動場で*# *2走ってい
る*#生徒を *1見た*#。」 の場合には、係り受け記号“*1"と“*#"とに挟まれ
ている文節「昨日」と文節「見た」とが係り受け関係にあ
り、係り受け記号“*2"と“*#"とに挟まれた文節
「運動場で」と文節「走っている」とが係り受け関係にあ
る。そして、文節「昨日」が文節「見た」に係り、文節「運
動場で」が文節「走っている」に係ること意味するのであ
る。
【0025】上記係り受け記号は、本自然言語解析装置
における辞書引き形態素解析部8で形態素解析処理を実
施する前に翻訳対象文中にマニュアル挿入される。した
がって、翻訳対象文に係り受け記号を付加する際には、
オペレータは当該自然言語解析システムにおける“文
節"の定義を把握しておく必要がある。
【0026】品詞の分け方や文節の定義付けには種々の
説があり、さらに、自然言語の解析処理を必要とする各
装置では、個々に都合のよいように品詞や文節の設定方
法を定義付けている。そこで、上述のように係り受け記
号を用いて係り受け関係を指示する際には、オペレータ
は当該自然言語解析システムにおける品詞や文節の定義
を理解しておかないと適確な位置に係り受け記号を付加
できないのである。
【0027】例えば、次のような例文(ニ)を考える。 (ニ) 「私は双眼鏡を使って走っている生徒を見た。」 その際に、「を使って」を助詞のように扱う自然言語解析
システムの場合には、「双眼鏡を使って」を1文節として
扱い、例文(イ)の場合のように、文節「双眼鏡を使って」
が文節「見た」に係ると係り受け関係を解析する。これに
対して、「双眼鏡を使って」を、文節「双眼鏡を」と文節
「使って」の2文節として扱う自然言語解析システムもあ
る。
【0028】ところが、オペレータは必ずしも使用する
自然言語解析システムにおける文節の定義を理解してい
るとは限らない。そこで、本実施例においては、そのよ
うなオペレータでも容易に入力文における係り受け関係
にある箇所を指示できるように、次のような係り受け記
号の付加をも可能ならしめるのである。
【0029】すなわち、上記例文(ニ)の場合には、 (ホ) 「私は双眼鏡を使って*1走っている生徒を見
*1。」 のように、係り受け関係にある箇所の終了位置を係り受
け記号“*"で指示するのである。尚、上述の場合と同
様に、係り受け記号“*"の直後に番号を付加して同じ
番号は係り受け関係にある文節の終位置同士であること
を示す。このようにして係り受け関係を指示することに
よって、オペレータは使用する自然言語解析システムに
おける文節の定義を理解していなくとも、係り記号(前
方に位置する係り受け記号“*1")の直前の「て」で終了
している文節(この文節の範囲は特に問わない)が受け記
号(後方に位置する係り受け記号“*1")の直前の「た」
で終了している文節(この文節の範囲は特に問わない)に
係ることを指示できるのである。以下、前者のような文
節範囲を指定する係り受け記号を付加する処理を“通常
付加処理"と呼び、後者のような文節の終了位置のみを
指定する係り受け記号を付加する処理を“簡易付加処
理"と呼ぶ。
【0030】尚、本実施例における上記係り受け記号
“*"および“*#"の入力文への付加処理は、本機械翻
訳装置によらなくとも、例えば文書処理装置等の係り受
け記号“*"および“*#"を入力可能な装置によっても
実施できる。また、本実施例における係り受け記号付加
処理は本機械翻訳装置と非インタラクティブに実施でき
る。したがって、本機械翻訳装置による翻訳処理に先立
って、本機械翻訳装置やワードプロセッサ等によって係
り受け記号付加処理を実施しておけば、翻訳処理を効率
良く実施できるのである。
【0031】以下、上記構成の機械翻訳装置によって日
英翻訳を実施する場合を例に、この発明の自然言語解析
装置を用いた機械翻訳装置の処理動作について詳細に説
明する。図3は、上記CPU1の制御の下に実施される
本機械翻訳装置による日英翻訳処理のフローチャートで
ある。以下、図3に従って日英翻訳処理動作について説
明する。
【0032】上記係り受け記号が付加された日本語によ
る翻訳対象の文章がキーボード4等から入力されてメイ
ンメモリ2に一旦格納されて、日英翻訳処理動作がスタ
ートする。ステップS1で、上記メインメモリ2に格納
された日本語文章から1文が読み出されて、翻訳モジュ
ール5内の原文バッファ(図示せず)に図4に示すように
格納される。但し、図4(a)は、上記通常付加処理によ
って文節の開始位置と終了位置とを示す係り受け記号の
組“*"−“*#"が付加された入力文の例である。一
方、図(b)は、上記簡易付加処理によって文節の終了位
置のみを示す係り受け記号“*"が付加された入力文の
例である。ステップS2で、上記原文バッファに格納さ
れた1文中に上記係り受け記号が存在するか否かが判断
される。その結果存在すればステップS3に進み、存在
しなければステップS12に進む。
【0033】ステップS3で、上記1文中に存在する係
り受け記号の種類が、文節の開始位置と終了位置とを示
す係り受け記号の組“*"−“*#"であるか、文節の終
了位置のみを示す係り受け記号“*"であるかが判断さ
れる。そして、判断結果を表すフラグ(図示せず)がセッ
トされる。ここで、上記係り受け記号の種類の判断は、
例えば、次のようにして実施される。すなわち、上記通
常付加処理を実施する第1のモードと上記簡易付加処理
を実施する第2のモードとを設定し、予め上述の係り受
け記号付加処理時に上記第1のモードあるいは第2のモ
ードを表すコードを入力文に付けておく。そして、本ス
テップで上記コードによってモードを判別することによ
って係り受け記号の種類を判断するのである。あるい
は、入力文中における文節の終位置を示す係り受け記号
“*#"の有無によって係り受け記号の種類を判断して
もよい。
【0034】ステップS4で、入力文中に混在している
係り受け記号が入力文から取り出され、図5に示すよう
に、バッファにおける当該係り受け記号が付加されてい
る文字の位置にその文字の属性として当該係り受け記号
の一部がセットされる。その際に、上記ステップS3に
おいてセットされたフラグの内容に応じて、係り受け記
号の組“*"−“*#"が付加された入力文の場合には図
5(a)に示すようにセットされる。一方、終了位置のみ
を示す係り受け記号“*"が付加された入力文の場合に
は図5(b)に示すようにセットされる。
【0035】ステップS5で、以下のようにして入力文
に対して形態素解析処理が実行される。すなわち、先ず
前処理として、図5に示すようにバッファに格納されて
いる入力文の文字列に対して、係り受け記号で示される
箇所に区切りが入れられる。その際に、図5(a)に示す
ような係り受け記号の組“*"−“*#"が付加された入
力文の場合には、係り受け記号の“番号"によって指示
される文節開始位置と記号“#"によって指示される文
節終了位置とで区切る。その結果を図6[1](a)に示
す。尚、以後の処理では文節終了位置の情報は必要とは
しないので、終了位置を示す記号“#"は消去される。
一方、図5(b)に示すような文節の終了位置のみを示す
係り受け記号“*"が付加された入力文の場合には、係
り受け記号の“番号"によって指示される文節終了位置
で区切る。その結果を図6[1](b)に示す。
【0036】こうした前処理が終了すると、辞書引き形
態素解析部8によって外部記憶部6に格納された辞書を
引いて形態素解析処理が実行される。その際に、形態素
に分割する際には次のようにして上記前処理で得られた
区切りの箇所を反映させる。すなわち、上記入力文に対
して、辞書引き形態素解析部8によって従来の形態素解
析を実施して文節候補を得る。その後、得られた総ての
文節候補に対してオペレータによる指示内容が満たされ
ているか否かをチェックするのである。
【0037】上記チェックは次のように実施する。図4
(a)に示す例文のように、係り受け記号の組“*"−“*
#"が付加されて文節の開始位置および終了位置の両方
が指示された入力文では、その指示された位置間の文字
列「昨日」,「運動場で」,「走っている」,「見た」のうち本自
然言語解析システムの定義によって文節になり得るもの
を優先して文節として採用する。また、図4(b)に示す
例文のように、係り受け記号“*"が付加されて文節の
終了位置のみが指示された入力文では、その指示された
位置である「日」と「運」との間,「で」と「走」との間,「る」と
「生」との間が文節の区切りとなるような本自然言語解析
システムの定義による文節を優先して文節として採用す
る。こうして得られた入力文の文節を図6[2]に示す。
この文節は、図4(a)あるいは図4(b)に示すように、オ
ペレータによって係り受け記号で指示された文節位置に
相反してはいない。
【0038】ステップS6で、オペレータによって指示
された文節の範囲あるいは係り受け箇所の終了位置のな
かに、上記ステップS5において得られた文節の区切り
位置に適合しない位置が存在するか否かが判別される。
その結果存在する場合にはステップS7に進み、存在し
ない場合には、ステップS7をスキップする。ステップ
S7で、オペレータによって指示された文節区切り位置
に相反する(つまり、係り受け記号に対応しない)文節が
存在するので、その旨をCRT3に表示して通常の処理
に移行するか、エラー扱いにするか、入力文あるいは係
り受け記号付加箇所の変更を促すかの処理が実施され
る。
【0039】ステップS8で、上記外部記憶部6に格納
された文法規則を用いて構文解析部9によって構文解析
処理が実行される。その結果、得られた複数の構文解析
結果が総て出力される。図7に、上記得られた構文解析
結果としての構文解析木の構造およびその構文解析木に
よる係り受け構造を示す。本実施例の入力文によっては
3通りの係り受け構造が得られる。但し、その場合にお
ける構文解析処理のアルゴリズムは特に限定するもので
はない。尚、図7に示す構文解析木では、係り受け関係
にある文節のうちの係り文節が受け文節の1段下に記さ
れている。
【0040】ステップS9で、上記係り受け処理部10
によって、上記ステップS8において得られた係り受け
構造の候補のなかにオペレータによって指示された係り
受けの構造に適合する係り受け構造が存在するか否か
が、図6[2]の下段に示す係り受け指示情報に基づいて
判別される。その結果存在しない場合にはステップS10
に進み、存在する場合にはステップS10をスキップす
る。ステップS10で、さらに、オペレータによって指示
された係り受け指示情報に相反しない(つまり、係り受
け記号に対応する)係り受け構造が得られないので、そ
の旨をCRT3に表示して通常の処理に移行するか、エ
ラー扱いにするか、入力文あるいは係り受け記号付加箇
所の変更を促すかの処理が実施される。ステップS11
で、さらに、上記係り受け指示情報に適合した係り受け
構造を有する構文解析木が変換部11に送出される。
【0041】ステップS12で、上記ステップS2におい
て入力文中に係り受け記号が付加されていないと判定さ
れたので通常処理に移行する。そして、先ず辞書引き形
態素解析部8によって、外部記憶部6に格納された辞書
を用いて形態素解析処理が実行される。ステップS13
で、上記構文解析部9によって、辞書引き形態素解析部
8による形態素解析結果に基づいて、外部記憶部6に格
納された文法規則を用いて構文解析処理が実行される。
そして、得られた構文解析木が変換部11に送出され
る。
【0042】ステップS14で、上記変換部11によっ
て、外部記憶部6に格納された木構造変換規則を用い
て、係り受け処理部10からの構文解析木あるいは構文
解析部9からの構文解析木がターゲット言語(英語)の内
部構造に変換される。そして、さらに生成部12によっ
て、上記変換されて得られた英語の内部構造に基づいて
英語の文が生成される。尚、その際における上記変換部
11による変換処理および生成部12による生成処理の
アルゴリズムは特に限定されるものではない。
【0043】ステップS15で、上記ステップS14におい
て生成された入力文に対応する翻訳文がCRT3に表示
されると共に、メインメモリ2のバッファ(図示せず)内
に格納される。ステップS16で、上記メインメモリ2内
に未翻訳処理の次文が在るか否かが判別される。その結
果、在ればステップS1に戻って未翻訳処理の次の1文
が読み込まれて次文の翻訳処理に入る。一方、無ければ
日英翻訳処理動作を終了する。
【0044】このように、本実施例においては、自然言
語解析装置に係り受け処理部10を設けると共に、入力
文における係り受け関係にある文節に文節開始位置を示
す係り受け記号“*"と文節終了位置を示す係り受け記
号“*#"を付加する。あるいは、入力文における係り
受け関係にある箇所の終端に終了位置を示す係り受け記
号“*"を付加する。そして、上記辞書引き形態素解析
部8による形態素解析時には、係り受け記号“*",“*
#"が付加された位置を反映させて入力文を文節に分割
する。したがって、オペレータが所望する係り文節およ
び受け文節を反映して文節に分割できる。さらに、上記
係り受け処理部10によって、構文解析部9による構文
解析処理の結果得られた構文解析木の候補の中からオペ
レータが所望する係り受け関係を満足する構文解析木を
入力文の構文構造として出力する。したがって、入力文
の構文解析に際してオペレータの指示に即して正しく係
り受け解析を実施できるのである。
【0045】また、上記入力文に対する係り受け記号
“*",“*#"の付加は、本機械翻訳装置によって又は
別体の文書処理装置等によって非インタラクティブに実
施可能である。したがって、翻訳処理動作を妨害するこ
となく大量の文に付加可能である。すなわち、本実施例
によれば、大量の文書の機械翻訳処理を実施することが
可能である。
【0046】上記実施例における日英翻訳処理動作のア
ルゴリズムは、図3に示すフローチャートに限定される
ものではない。また、上記係り受け記号は、記号“*"
および“*#"に限定されるものではない。
【0047】また、上記実施例においては、この発明の
自然言語解析装置を機械翻訳装置に搭載している。つま
り、上記係り受け処理部10によって特定された構文解
析木を変換部11に入力して英語の内部構造を得、生成
部12で英語による翻訳文を生成するようにしている。
しかしながら、この発明はこれに限定されるものではな
い。すなわち、上記係り受け処理部10からの構文解析
木を他の外部装置に送出するようにすれば、文章理解シ
ステム等の自然言語によってコンピュータへの指示を行
うようなシステムに適用可能である。
【0048】
【発明の効果】以上より明らかなように、請求項1に係
る発明の自然言語解析装置は、形態素解析部の分割手段
によって入力文を複数の文節に分割する際には、係り受
け記号検出部によって検出されて係り受け記憶部に記憶
された当該入力文における係り受け記号で示される箇所
を優先的に分割位置とし、係り受け処理部によって、構
文解析部からの当該入力文の構文解析結果のうち上記係
り受け記憶部に記憶された係り受け関係を満たす構文解
析結果を当該入力文の構文構造として出力するので、オ
ペレータによって上記係り受け記号で予め指示された係
り受けの関係を満たす構文構造を得ることができる。し
たがって、この発明によれば、自然言語による入力文に
対して正しい係り受け解析を実施できる。
【0049】さらに、上記係り受け記号の付加は本自然
言語解析装置と非インタラクティブに実施できるので、
この発明によれば大量の入力文の解析処理が可能であ
る。
【0050】また、請求項2に係る自然言語解析装置の
係り受け記号検出部は、係り受け関係にある2つの文節
の夫々に付加されて文節の範囲と係り受けの関係にある
こととを表す特定の係り受け記号を検出手段によって検
出するので、形態素解析部によって入力文を文節に分割
する際に、オペレータによって指示された係り受けの関
係にある文節を正しく反映されて分割できる。したがっ
て、この発明によれば、自然言語による入力文に対して
オペレータによる指示に従ってより正しく係り受け解析
を実施できる。
【0051】また、請求項3に係る自然言語解析装置の
係り受け記号検出部は、係り受け関係にある2つの文節
の夫々の直後に付加されて係り受けの関係にあることを
表す特定の係り受け記号を検出手段によって検出するの
で、オペレータが入力文における係り受けの関係にある
文節の範囲を指示しなくとも、係り受けの関係にある箇
所の終了位置に基づいて、その終了位置を反映させて係
り受けの関係にある文節に正しく分割することができ
る。したがって、この発明によれば、文節の定義を知ら
ないオペレータであっても入力文における係り受けの関
係にある箇所の終了位置さえ指示すれば、自動的に自然
言語による入力文に対して正しく係り受け解析を実施で
きる。
【0052】また、請求項4に係る機械翻訳装置は、上
記自然言語解析装置における係り受け処理部から出力さ
れるオペレータによって指示された係り受けの関係を満
たすような構文構造に基づいて、変換部および生成部に
よって入力文の翻訳文を生成するので、オペレータによ
って指示された係り受けの関係を正しく理解して自然な
翻訳文を生成できる。その際におけるオペレータによる
係り受けの関係の指示は、上記係り受け記号を用いて本
機械翻訳装置と非インタラクティブに実施できるので、
この発明によれば大量の入力文の翻訳処理が可能であ
る。
【図面の簡単な説明】
【図1】この発明の自然言語解析装置が搭載された機械
翻訳装置におけるブロック図である。
【図2】図1における翻訳モジュールのブロック図であ
る。
【図3】日英翻訳処理動作のフローチャートである。
【図4】係り受け記号が挿入された入力文の一例を示す
図である。
【図5】入力文から取り出された係り受け記号の一部が
バッファへ格納されたようすを示す図である。
【図6】入力文を係り受け記号に基づいて文節に分割し
たようすを示す図である。
【図7】図2における構文解析部による構文解析処理の
結果得られた構文解析木およびその係り受け構造を示す
図である。
【符号の説明】
1…CPU、 2…メインメモ
リ、3…CRT、 4…キーボ
ード、5…翻訳モジュール、 6…外部
記憶装置、8…辞書引き形態素解析部、 9…
構文解析部、10…係り受け処理部、 1
1…変換部、12…生成部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力部から入力された自然言語による入
    力文の形態素解析を形態素解析部によって行い、形態素
    解析結果に基づいて構文解析部によって入力文の構文を
    解析する自然言語解析装置において、 上記形態素解析部による形態素解析に先立って、入力文
    中における係り受け関係にある文節に付加されて係り受
    け関係にあることを表している係り受け記号を検出する
    係り受け記号検出部と、 上記係り受け記号検出部で検出された係り受け記号を当
    該入力文の文字の属性として記憶することによって、当
    該入力文の係り受けの関係を記憶する係り受け記憶部
    と、 上記構文解析部によって得られた当該入力文の構文解析
    結果のうち、上記係り受け記憶部に記憶された係り受け
    の関係を満たす構文解析結果を当該入力文の構文構造と
    して出力する係り受け処理部を備えると共に、 上記形態素解析部は、入力文を複数の文節に分割するに
    際して、上記係り受け記憶部に記憶された係り受け記号
    で示される箇所を優先的に分割位置とする分割手段を有
    することを特徴とする自然言語解析装置。
  2. 【請求項2】 請求項1に記載の自然言語解析装置にお
    いて、 上記係り受け記号検出部は、係り受け関係にある2つの
    文節の夫々に付加されて文節の範囲と係り受けの関係に
    あることとを表す特定の係り受け記号を検出する検出手
    段を備えたことを特徴とする自然言語解析装置。
  3. 【請求項3】 請求項1あるいは請求項2に記載の自然
    言語解析装置において、 上記係り受け記号検出部は、係り受け関係にある2つの
    文節の夫々の直後に付加されて係り受けの関係にあるこ
    とを表す特定の係り受け記号を検出する検出手段を備え
    たことを特徴とする自然言語解析処理装置。
  4. 【請求項4】 変換部によって自然言語による入力文の
    内部構造をターゲット言語による内部構造に変換し、こ
    の得られたターゲット言語による内部構造に基づいて生
    成部によって翻訳文を生成する機械翻訳装置において、 請求項1乃至請求項3の何れか一つに記載の自然言語解
    析装置を備えて、上記変換部および生成部は、上記自然
    言語解析装置における係り受け処理部から出力された自
    然言語による入力文の構文構造に基づいて、上記入力文
    の翻訳文を生成することを特徴とする機械翻訳装置。
JP11945593A 1993-05-21 1993-05-21 自然言語解析装置および機械翻訳装置 Expired - Lifetime JP3197110B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11945593A JP3197110B2 (ja) 1993-05-21 1993-05-21 自然言語解析装置および機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11945593A JP3197110B2 (ja) 1993-05-21 1993-05-21 自然言語解析装置および機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH06332938A true JPH06332938A (ja) 1994-12-02
JP3197110B2 JP3197110B2 (ja) 2001-08-13

Family

ID=14761802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11945593A Expired - Lifetime JP3197110B2 (ja) 1993-05-21 1993-05-21 自然言語解析装置および機械翻訳装置

Country Status (1)

Country Link
JP (1) JP3197110B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ITPD20040014A1 (it) 2004-01-22 2004-04-22 Geox Spa Calzatura con suola e tomaia traspiranti ed impermeabili

Also Published As

Publication number Publication date
JP3197110B2 (ja) 2001-08-13

Similar Documents

Publication Publication Date Title
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
US5005127A (en) System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
JPH077419B2 (ja) 機械翻訳装置における略称付き固有名詞処理方法
JPH0644296A (ja) 機械翻訳装置
JPH0261763A (ja) 機械翻訳装置
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JP2632806B2 (ja) 言語解析装置
JP2719453B2 (ja) 機械翻訳装置
JP3353873B2 (ja) 機械翻訳装置
JP2856736B2 (ja) 辞書参照装置及び辞書参照方法
JPH0350668A (ja) 文字処理装置
JPH09179866A (ja) 機械翻訳装置
JPH0785057A (ja) 構文解析方法及び装置
JP3253311B2 (ja) 言語処理装置および言語処理方法
JPH05225232A (ja) テキスト自動前編集装置
JPH08235180A (ja) 機械翻訳装置
JPS62271054A (ja) 翻訳装置における形態素解析結果修正方式
JPH07200592A (ja) 文章処理装置
JPH07141382A (ja) 外国語文書作成支援装置
JPH04296969A (ja) 機械翻訳装置
JPH0512332A (ja) 翻訳処理装置
JPH07230461A (ja) 構文解析装置及び機械翻訳装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JPH05342260A (ja) 単語綴りチェック装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090608

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100608

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100608

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110608

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120608

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120608

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130608

Year of fee payment: 12

EXPY Cancellation because of completion of term