JP3339006B2

JP3339006B2 - 機械翻訳装置における並列名詞句処理装置

Info

Publication number: JP3339006B2
Application number: JP22101392A
Authority: JP
Inventors: 庸男野田
Original assignee: 株式会社シーエスケイ
Priority date: 1992-08-20
Filing date: 1992-08-20
Publication date: 2002-10-28
Anticipated expiration: 2017-10-28
Also published as: JPH0668131A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、機械翻訳装置におい
て、特に並列名詞句の処理が誤り無く行なえるようにし
た機械翻訳装置における並列名詞句処理装置に関するも
のである。

【０００２】

【従来の技術】ある言語（原語）からある言語（訳語）
への翻訳作業を機械によって行う所謂機械翻訳装置にお
いては、単語毎に、対応する訳語のほか、品詞、意味
素、格、属性、文法等の単語情報を保持しており、これ
らの単語情報を有効に使用することにより、きめの細か
い翻訳を行なえるようにしている。

【０００３】この機械翻訳において、例えば「ニューヨ
ーク、ロンドン市場」というように複数の名詞句が並列
的な関係になるようないわゆる並列名詞句の構造を認識
するために、従来は名詞間の意味素によるチェック方法
が用いられていた。即ち、名詞間の意味素によるチェッ
ク方法とは、並列名詞句を構成する各名詞（前記した
「ニューヨーク」及び「ロンドン」）がそれぞれどの意
味素に分類されるかを判断するための手法である。そし
てそのために図８に示す意味素の分類木（ツリー）Ｔを
利用するものである。即ち、分類木Ｔは、「現象」、
「具象物」、「抽象物」、「属性」、「場所」、「時
間」等に分類・設定される意味素から成る第１の階層Ｔ
１と、この第１の階層の各意味素を更に細分化したも
の、つまり「具象物」を例に採れば、「無生物」、「生
物」と分類・設定される意味素から成る第２の階層Ｔ２
と、この第２の階層の各意味素を細分化したもの、つま
り「生物」を例に採れば、「有意志体」、「非有意志
体」と分類・設定される意味素から成る第３の階層Ｔ３
と、この第３の階層の各意味素を細分化したもの、つま
り「非有意志体」を例に採れば、「動物」、「植物」と
分類・設定される意味素からなる第４の階層Ｔ４（以
下、更に必要に応じて階層Ｔｎ…が形成される）により
構成されるものである。そしてこの分類木Ｔにチェック
候補の複数の名詞を当てはめながら共通に該当する意味
素のある階層まで所定の段数を上限として溯ることによ
って並列句を構成する条件を満たしているか否かを判定
していたものである。例えば、一段遡って同じ分類であ
れば、同じ意味の名詞であるとして並列名詞句であると
する。

【０００４】ところで、上記のような名詞間に意味素に
よるチェックを掛けて並列名詞句を構成することが可能
であるか否かを判定する方法では、以下のような問題点
が有った。並列対象候補の複数の名詞どうしの意味素が一致し
ない場合には、実際には並列名詞句であっても、そうで
ないと判断されてしまう。即ち、意味素チェックは各意
味素を階層Ｔ１〜Ｔｎ毎に分類してある分類木Ｔを用
い、下位の階層からチェックをかけていき、所定の段数
（例えば一段）遡って同じ分類であるかを確認するので
あるが、この場合行なわれるチェックは単に各名詞間の
意味素だけであるので、意味素は異なるが意味的に関連
のある名詞が並列にされている場合には全く対処できな
い。

【０００５】溯る段数を多くすると同じ意味とされ
る範囲が広がるため、本来並列にはならない名詞どうし
が並列として処理されてしまう可能性がある。従って溯
る段数の上限を定めるのも困難である。

【０００６】

【発明が解決しようとする課題】本発明は以上のような
問題点を解決するためのものであり、その目的は、機械
翻訳装置における並列名詞句処理において、正しい並列
名詞句の処理を行なえるようにした機械翻訳装置におけ
る並列名詞句処理装置を提供することである。

【０００７】

【発明の開示】上記発明の目的は、入力される原文の形
態素解析を行う形態素解析部と、前記形態素解析部から
出力された語から成分を作成する成分作成部と、前記成
分作成部で作成された単一の語に対応する成分あるいは
係り受け成立後の一連の語を成分として格納する構文解
析スタックと、前記成分作成部で新たに作成された成分
に対して、前記構文解析スタックに既に格納されている
成分が係ることができるか否かを確認すると共に、係る
ことができる場合に両成分を連結したものを新たな成分
として前記構文解析スタックに格納し、更に前の成分と
の間の係り受けの確認を繰り返し実行する係り受け実行
部と、前記係り受け実行部の処理に際して使用され、述
語あるいは体言に対して係っている体言と同じ格あるい
は属性で前記構文解析スタックに既格納の成分に係るこ
とができるか否かを判断し、係ることができる場合、前
記述語あるいは体言に対して係っている体言と前記構文
解析スタックに既格納の成分とが並列名詞句であると認
識する並列名詞句処理規則を有する構文解析規則部とを
備えたことを特徴とする機械翻訳装置における並列名詞
句処理装置によって達成される。

【０００８】即ち、名詞を並列的に使用する場合、発話
者はある共通の事項によって複数の名詞を一まとまりの
ものと考えている。そしてその共通の事項は述語あるい
は修飾される体言に現れる。例えば、「花や人は美し
い」という文では美しいものを一まとまりとしてとらえ
ている。本発明ではかかる点に着目し、述語あるいは修
飾される体言に同じ格あるいは属性で係ることができる
か否かによって、複数の名詞（体言）が発話者の意識し
ている集合に属するか否か、つまり並列名詞句となるか
否かを判断するようにしている。

【０００９】

【作用】即ち、本発明にあっては上記の如く、並列名詞
句の処理にあたり、形態素解析部に入力される原文を形
態素解析して得られた語が順次構文解析部の成分作成部
に入力される。そして、この成分作成部においては形態
素解析部から出力された語から成分が作成される。ま
た、構文解析スタックには成分作成部で作成された単一
の語に対応する成分あるいは係り受け成立後の一連の語
が成分として格納される。係り受け実行部では、成分作
成部で新たに作成された成分に対し、構文解析スタック
に既に格納されている成分が係ることができるか否かが
確認されると共に、係ることができる場合に両成分を連
結したものが新たな成分とされ、更に前の成分との間の
係り受けの確認等が繰り返し実行される。また、この係
り受け実行部の処理に際し、並列名詞句処理規則を含ん
だ構文解析規則が使用される。ここで、並列名詞句処理
規則としては、述語あるいは体言に対して係っている体
言と同じ格あるいは属性で係ることができる構文解析ス
タックに既格納の体言を並列名詞句であると認識すると
いう手順が規定されており、この手順によって並列名詞
句の認識が行なわれる。

【００１０】このように述語あるいは修飾される体言と
の関係において、複数の名詞が同じ格あるいは属性で係
ることができるか否かを判定することによって、誤りの
無い並列名詞句処理を行なうことができる。

【００１１】

【実施例】図１乃至図７は、本発明の機械翻訳装置にお
ける並列名詞句処理方式の一実施例を示すもので、図１
はハード構成図、図２は全体動作概略図、図３は全体フ
ロー図、図４及び図５は要部フロー図、図６及び図７は
並列名詞句の処理動作を示す模式図である。

【００１２】図１中、１は形態素解析部であり入力され
る原文を形態素（語）に分解し、構文解析部２に出力
し、構文解析部２は形態素間の係り受け構造を解析しそ
の構造を示す解析木を出力するものである。（図２の概
略図参照）構文解析部２は、後に詳述する成分作成部
３、構文解析スタック４、係り受け実行部５、構文解析
規則部６及び並列名詞句処理規則６ａを具備するもので
ある。

【００１３】即ち、成分作成部３においては形態素解析
部１によって得られた形態素が先頭から順番に入力さ
れ、成分が作成されものである。構文解析スタック４
は、成分作成部３で作成された単一の語に対応する成分
あるいは係り受け実行部５における係り受け成立後の一
連の語を成分として格納するものである。

【００１４】係り受け実行部５は、構文解析スタック４
に既に成分が格納されている場合にその成分が成分作成
部３で新たに作成された成分に対して係ることができる
か否かを確認し、係ることができる場合に両成分を連結
したものを新たな成分とし、更に前の成分との間の係り
受けの確認等を繰り返し実行するものである。構文解析
規則部６には並列名詞句処理規則６ａが具備され、この
並列名詞句処理規則６ａは係り受け実行部５の処理に際
して使用されるものであり、述語あるいは体言に対して
係っている体言と同じ格あるいは属性で係ることができ
る（構文解析スタック４に格納済の）体言を並列名詞句
であると認識するものである。

【００１５】次に、図３の全体フロー図を用いて本発明
の係り受けの動作の概略の流れを説明する。即ち、形態素解析部１から出力された並列名詞句を含む語
（原文）の入力。（ステップＳ１、Ｓ２）入力語が無い場合：終了入力語が有る場合：成分作成部３にてその入力語に対応
する成分が作成される。

【００１６】（ステップＳ３）構文解析スタック４に成分が格納されていない場
合：（ステップＳ４）ステップＳ３で作成された成分を構文
解析スタック４に格納。（ステップＳ５）構文解析スタック４に成分が格納済の場合：格納されて
いる成分を構文解析スタック４から取り出す。

【００１７】（ステップＳ６）構文解析スタック４から取り出した成分と成分作成
部３で作成された新たな成分との係り受けを構文解析規
則部６を用いて実行する。尚、並列名詞句処理規則６ａ
を用いた係り受けの詳細は後述する。（ステップＳ７）係り受けが成立しない場合：ステップＳ３で作成さ
れた成分を構文解析スタック４に格納。

【００１８】（ステップＳ５）係り受けが成立する場合：係り受け成立後の両成分を連
結してできる一連の語を新たな成分とする。（ステ
ップＳ９）そしてその成分を新たな成分としてステップ
Ｓ４以降を再び実行する。以上の操作を原文の語（成分）について逐次行った
後、並列句処理が終了する。

【００１９】次に、前述した並列名詞句処理規則６ａを
用いた係り受けについて図４及び図５を用いて詳細に説
明する。図４のフロー図を用いて例えば「個人、外人の
買い」や「ニューヨーク、ロンドン市場」といった体言
＋並列類が体言に係る並列名詞句処理規則について説明
する。（１）体言「買い」及び「市場」に係っている体言「外
人」及び「ロンドン」が在るか否か？（ス
テップＳ１１）無い場合：係り受け成立しない。（ステ
ップＳ１２）（２）在る場合：その体言「外人」及び「ロンドン」が
体言「買い」及び「市場」に係っている属性（行為者に
より修飾され得るとか、地名により修飾され得るという
性質）で体言「個人」及び「ニューヨーク」が「買い」
及び「市場」に係れるか？
（ステップＳ１３）係れる場合：係り受け成立。（ステ
ップＳ１４）係れない場合：係り受け成立しない。（ステ
ップＳ１２）図５のフロー図を用いて例えば「Ａ銘柄、Ｂ銘柄が買わ
れた」といった体言＋並列類が述語に係る並列名詞句処
理規則について説明する。（１）述語「買われた」に係っている体言「Ｂ銘柄」が
在るか否か？（ステップＳ２１）無い場合：係り受け成立しない。（ステ
ップＳ２２）（２）在る場合：その体言「Ｂ銘柄」が述語「買われ
た」に係っている格（主格、目的格等）で体言「Ａ銘
柄」が「買われた」に係れるか？（ステップＳ２３）係れる場合：係り受け成立。（ステ
ップＳ２４）係れない場合：係り受け成立しない。（ステ
ップＳ２２）次いで、具体的な文を例にとって並列名詞句処理の動作
の流れを図１、図６及び図７を用いて説明する。

【００２０】原文「Ａ銘柄、Ｂ銘柄や薬品株の一角が上
げる」を形態素解析部１にて形態素（語）「Ａ銘柄」、
「、」、「Ｂ銘柄」、「や」、「薬品株」、「の」、
「一角」、「が」、「上げる」に分解・解析し構文解析
部２に入力し、成分作成部３において先頭から順次各語
に対応した成分が作成される。そして、構文解析スタッ
ク４に既に別の成分が格納されているか否かを確認する
手順を取るのであるが、ここでは成分が格納されていな
い状態から説明する。

【００２１】即ち、ステップａ：入力語「Ａ銘柄」を構文解析スタック４
に格納する。ステップｂ：次の入力語「、」が構文解析スタック４
の中の「Ａ銘柄」に係ることができるので係ける。上記
のように構文解析スタック４に格納されている「Ａ銘
柄」が係る側の成分であり、次に入力されてくる入力語
「、」に対して係り受けの関係が成立するか否かが逐次
確認され、成立する場合には両成分を連結して一連の語
（成分）を形成し新たな成分として構文解析スタック４
に格納するものである。

【００２２】尚、実際には、本来の成分（「体言＋格助
詞」や「動詞＋助動詞」等の約２０種類）につき、成分
作成部３において構文解析スタック４を用いずにテーブ
ル等の使用により成分内の係り受けを認識するように
し、成分として構成できたもののみを後の処理に引き渡
すようにすることがあり、その場合にはステップａの状
態は存在しない。以下の処理における成分についても同
様のことが言える。ステップｃ〜ｆ：同様に係り受けの関係が確認され、入力語
「Ｂ銘柄」と「や」の係り受けが成立し連結した一連の
語「Ｂ銘柄や」及び入力語「薬品株」と「の」の係り受
けが成立し連結した一連の語「薬品株の」が新たな成分
として構文解析スタック４に格納される。ステップｇ：入力語「一角」において、並列名詞句処
理規則６ａを適用する。

【００２３】つまり、「薬品株」が「一角」に係ってい
るものと同じ属性でもって「Ｂ銘柄」に対しても係かれ
るか否かをチェックする。今の例では「一角」とはある
ものの一部を示すものであって、分割可能なものから係
られるものであるため、「Ｂ銘柄」は係ることができ
ず、並列名詞句を構成しないものとして次に進む。ステップｈ：入力語「が」を「一角」につなげて構文
解析スタック４に格納する。ステップｉ：入力語「上げる」を「が」につなげて構
文解析スタック４に格納する。ステップｊ：「Ｂ銘柄」が「一角」（薬品株の意味素
を継承している）と同じ格で動詞「上げる」に係れるか
否かをチェックするものである。

【００２４】上記の例では係れるので係けて新しい解析
木を作る。ステップｋ：前記同様に、「Ａ銘柄」が「一角」と同
じ格関係で動詞「上げる」に係れるか否かをチェックす
るものである。上記の例では係れるので係けて新しい解
析木を作る。これにより構文解析を終了し、原文の構造
を示す解析木を出力する。

【００２５】以上説明してきたように、構文解析スタッ
ク４に格納された成分（単一の語あるいは係り受けが成
立している一連の語）を係る側の成分とし、順次新しく
作成される成分を係られる側の成分と位置付け、両成分
の係り受けを確認する規則として構文解析規則部６が用
いられる。その規則の一部として構文解析規則部６に属
する名詞並列句処理規則６ａが使用される。即ち、述語
あるいは体言に対して係っている体言と同じ格あるいは
属性でもって係ることのできる体言（構文解析スタック
４に格納済の体言）を並列名詞句であると認識するため
の手順が規定されている名詞並列句処理規則６ａを用い
ることによって、正しい並列名詞句のチェックを行なう
ことができる。

【００２６】

【効果】本発明にあっては、上述のように、成分作成部
で新たに作成された成分に対する、構文解析スタックに
格納された単一の語に対応する成分あるいは係り受け成
立後の一連の語よりなる成分の係り受け実行に際し、述
語あるいは体言に対して係っている体言と同じ格あるい
は属性で係ることができる構文解析スタックに既格納の
体言を並列句であると認識するという手順で行なう並列
句処理規則を用いることによって並列句の認識を行なう
ものである。

【００２７】このように述語あるいは修飾される体言と
の関係において、複数の名詞が同じ格あるいは属性で係
ることができるか否かを判定することによって、誤りの
無い並列句処理を行なうことができる。

【図面の簡単な説明】

【図１】本発明におけるハード構成図である。

【図２】本発明における全体動作概略図である。

【図３】本発明の全体フロー図である。

【図４】本発明の要部フロー図である。

【図５】本発明の要部フロー図である。

【図６】本発明の並列名詞句の処理動作を示す模式図で
ある。

【図７】本発明の並列名詞句の処理動作を示す図６に続
く模式図である。

【図８】従来例において利用する分類木を示す図であ
る。

【符号の説明】

１形態素解析部２構文解析部３成分作成部４構文解析スタック５係り受け実行部６構文解析規則部６ａ並列名詞句処理規則

Claims

(57)【特許請求の範囲】

【請求項１】入力される原文の形態素解析を行う形態
素解析部と、前記形態素解析部から出力された語から成分を作成する
成分作成部と、前記成分作成部で作成された単一の語に対応する成分あ
るいは係り受け成立後の一連の語を成分として格納する
構文解析スタックと、前記成分作成部で新たに作成された成分に対して、前記
構文解析スタックに既に格納されている成分が係ること
ができるか否かを確認すると共に、係ることができる場
合に両成分を連結したものを新たな成分として前記構文
解析スタックに格納し、更に前の成分との間の係り受け
の確認を繰り返し実行する係り受け実行部と、前記係り受け実行部の処理に際して使用され、述語ある
いは体言に対して係っている体言と同じ格あるいは属性
で前記構文解析スタックに既格納の成分に係ることがで
きるか否かを判断し、係ることができる場合、前記述語
あるいは体言に対して係っている体言と前記構文解析ス
タックに既格納の成分とが並列名詞句であると認識する
並列名詞句処理規則を有する構文解析規則部とを備えた
ことを特徴とする機械翻訳装置における並列名詞句処理
装置。