JP3339006B2 - 機械翻訳装置における並列名詞句処理装置 - Google Patents

機械翻訳装置における並列名詞句処理装置

Info

Publication number
JP3339006B2
JP3339006B2 JP22101392A JP22101392A JP3339006B2 JP 3339006 B2 JP3339006 B2 JP 3339006B2 JP 22101392 A JP22101392 A JP 22101392A JP 22101392 A JP22101392 A JP 22101392A JP 3339006 B2 JP3339006 B2 JP 3339006B2
Authority
JP
Japan
Prior art keywords
component
parallel
dependency
noun
noun phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP22101392A
Other languages
English (en)
Other versions
JPH0668131A (ja
Inventor
庸男 野田
Original Assignee
株式会社シーエスケイ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社シーエスケイ filed Critical 株式会社シーエスケイ
Priority to JP22101392A priority Critical patent/JP3339006B2/ja
Publication of JPH0668131A publication Critical patent/JPH0668131A/ja
Application granted granted Critical
Publication of JP3339006B2 publication Critical patent/JP3339006B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳装置におい
て、特に並列名詞句の処理が誤り無く行なえるようにし
た機械翻訳装置における並列名詞句処理装置に関するも
のである。
【0002】
【従来の技術】ある言語(原語)からある言語(訳語)
への翻訳作業を機械によって行う所謂機械翻訳装置にお
いては、単語毎に、対応する訳語のほか、品詞、意味
素、格、属性、文法等の単語情報を保持しており、これ
らの単語情報を有効に使用することにより、きめの細か
い翻訳を行なえるようにしている。
【0003】この機械翻訳において、例えば「ニューヨ
ーク、ロンドン市場」というように複数の名詞句が並列
的な関係になるようないわゆる並列名詞句の構造を認識
するために、従来は名詞間の意味素によるチェック方法
が用いられていた。即ち、名詞間の意味素によるチェッ
ク方法とは、並列名詞句を構成する各名詞(前記した
「ニューヨーク」及び「ロンドン」)がそれぞれどの意
味素に分類されるかを判断するための手法である。そし
てそのために図8に示す意味素の分類木(ツリー)Tを
利用するものである。即ち、分類木Tは、「現象」、
「具象物」、「抽象物」、「属性」、「場所」、「時
間」等に分類・設定される意味素から成る第1の階層T
1と、この第1の階層の各意味素を更に細分化したも
の、つまり「具象物」を例に採れば、「無生物」、「生
物」と分類・設定される意味素から成る第2の階層T2
と、この第2の階層の各意味素を細分化したもの、つま
り「生物」を例に採れば、「有意志体」、「非有意志
体」と分類・設定される意味素から成る第3の階層T3
と、この第3の階層の各意味素を細分化したもの、つま
り「非有意志体」を例に採れば、「動物」、「植物」と
分類・設定される意味素からなる第4の階層T4(以
下、更に必要に応じて階層Tn…が形成される)により
構成されるものである。そしてこの分類木Tにチェック
候補の複数の名詞を当てはめながら共通に該当する意味
素のある階層まで所定の段数を上限として溯ることによ
って並列句を構成する条件を満たしているか否かを判定
していたものである。例えば、一段遡って同じ分類であ
れば、同じ意味の名詞であるとして並列名詞句であると
する。
【0004】ところで、上記のような名詞間に意味素に
よるチェックを掛けて並列名詞句を構成することが可能
であるか否かを判定する方法では、以下のような問題点
が有った。 並列対象候補の複数の名詞どうしの意味素が一致し
ない場合には、実際には並列名詞句であっても、そうで
ないと判断されてしまう。即ち、意味素チェックは各意
味素を階層T1〜Tn毎に分類してある分類木Tを用
い、下位の階層からチェックをかけていき、所定の段数
(例えば一段)遡って同じ分類であるかを確認するので
あるが、この場合行なわれるチェックは単に各名詞間の
意味素だけであるので、意味素は異なるが意味的に関連
のある名詞が並列にされている場合には全く対処できな
い。
【0005】 溯る段数を多くすると同じ意味とされ
る範囲が広がるため、本来並列にはならない名詞どうし
が並列として処理されてしまう可能性がある。従って溯
る段数の上限を定めるのも困難である。
【0006】
【発明が解決しようとする課題】本発明は以上のような
問題点を解決するためのものであり、その目的は、機械
翻訳装置における並列名詞句処理において、正しい並列
名詞句の処理を行なえるようにした機械翻訳装置におけ
る並列名詞句処理装置を提供することである。
【0007】
【発明の開示】上記発明の目的は、入力される原文の形
態素解析を行う形態素解析部と、前記形態素解析部から
出力された語から成分を作成する成分作成部と、前記成
分作成部で作成された単一の語に対応する成分あるいは
係り受け成立後の一連の語を成分として格納する構文解
析スタックと、前記成分作成部で新たに作成された成分
に対して、前記構文解析スタックに既に格納されている
成分が係ることができるか否かを確認すると共に、係る
ことができる場合に両成分を連結したものを新たな成分
として前記構文解析スタックに格納し、更に前の成分と
の間の係り受けの確認を繰り返し実行する係り受け実行
部と、前記係り受け実行部の処理に際して使用され、述
語あるいは体言に対して係っている体言と同じ格あるい
は属性で前記構文解析スタックに既格納の成分に係るこ
とができるか否かを判断し、係ることができる場合、前
記述語あるいは体言に対して係っている体言と前記構文
解析スタックに既格納の成分とが並列名詞句であると認
識する並列名詞句処理規則を有する構文解析規則部とを
備えたことを特徴とする機械翻訳装置における並列名詞
句処理装置によって達成される。
【0008】即ち、名詞を並列的に使用する場合、発話
者はある共通の事項によって複数の名詞を一まとまりの
ものと考えている。そしてその共通の事項は述語あるい
は修飾される体言に現れる。例えば、「花や人は美し
い」という文では美しいものを一まとまりとしてとらえ
ている。本発明ではかかる点に着目し、述語あるいは修
飾される体言に同じ格あるいは属性で係ることができる
か否かによって、複数の名詞(体言)が発話者の意識し
ている集合に属するか否か、つまり並列名詞句となるか
否かを判断するようにしている。
【0009】
【作用】即ち、本発明にあっては上記の如く、並列名詞
句の処理にあたり、形態素解析部に入力される原文を形
態素解析して得られた語が順次構文解析部の成分作成部
に入力される。そして、この成分作成部においては形態
素解析部から出力された語から成分が作成される。ま
た、構文解析スタックには成分作成部で作成された単一
の語に対応する成分あるいは係り受け成立後の一連の語
が成分として格納される。係り受け実行部では、成分作
成部で新たに作成された成分に対し、構文解析スタック
に既に格納されている成分が係ることができるか否かが
確認されると共に、係ることができる場合に両成分を連
結したものが新たな成分とされ、更に前の成分との間の
係り受けの確認等が繰り返し実行される。また、この係
り受け実行部の処理に際し、並列名詞句処理規則を含ん
だ構文解析規則が使用される。ここで、並列名詞句処理
規則としては、述語あるいは体言に対して係っている体
言と同じ格あるいは属性で係ることができる構文解析ス
タックに既格納の体言を並列名詞句であると認識すると
いう手順が規定されており、この手順によって並列名詞
句の認識が行なわれる。
【0010】このように述語あるいは修飾される体言と
の関係において、複数の名詞が同じ格あるいは属性で係
ることができるか否かを判定することによって、誤りの
無い並列名詞句処理を行なうことができる。
【0011】
【実施例】図1乃至図7は、本発明の機械翻訳装置にお
ける並列名詞句処理方式の一実施例を示すもので、図1
はハード構成図、図2は全体動作概略図、図3は全体フ
ロー図、図4及び図5は要部フロー図、図6及び図7は
並列名詞句の処理動作を示す模式図である。
【0012】図1中、1は形態素解析部であり入力され
る原文を形態素(語)に分解し、構文解析部2に出力
し、構文解析部2は形態素間の係り受け構造を解析しそ
の構造を示す解析木を出力するものである。(図2の概
略図参照)構文解析部2は、後に詳述する成分作成部
3、構文解析スタック4、係り受け実行部5、構文解析
規則部6及び並列名詞句処理規則6aを具備するもので
ある。
【0013】即ち、成分作成部3においては形態素解析
部1によって得られた形態素が先頭から順番に入力さ
れ、成分が作成されものである。構文解析スタック4
は、成分作成部3で作成された単一の語に対応する成分
あるいは係り受け実行部5における係り受け成立後の一
連の語を成分として格納するものである。
【0014】係り受け実行部5は、構文解析スタック4
に既に成分が格納されている場合にその成分が成分作成
部3で新たに作成された成分に対して係ることができる
か否かを確認し、係ることができる場合に両成分を連結
したものを新たな成分とし、更に前の成分との間の係り
受けの確認等を繰り返し実行するものである。構文解析
規則部6には並列名詞句処理規則6aが具備され、この
並列名詞句処理規則6aは係り受け実行部5の処理に際
して使用されるものであり、述語あるいは体言に対して
係っている体言と同じ格あるいは属性で係ることができ
る(構文解析スタック4に格納済の)体言を並列名詞句
であると認識するものである。
【0015】次に、図3の全体フロー図を用いて本発明
の係り受けの動作の概略の流れを説明する。即ち、 形態素解析部1から出力された並列名詞句を含む語
(原文)の入力。 (ステップS1、S2) 入力語が無い場合:終了 入力語が有る場合:成分作成部3にてその入力語に対応
する成分が作成される。
【0016】(ステップS3) 構文解析スタック4に成分が格納されていない場
合: (ステップS4)ステップS3で作成された成分を構文
解析スタック4に格納。 (ステップS5) 構文解析スタック4に成分が格納済の場合:格納されて
いる成分を構文解析スタック4から取り出す。
【0017】(ステップS6) 構文解析スタック4から取り出した成分と成分作成
部3で作成された新たな成分との係り受けを構文解析規
則部6を用いて実行する。尚、並列名詞句処理規則6a
を用いた係り受けの詳細は後述する。 (ステップS7) 係り受けが成立しない場合:ステップS3で作成さ
れた成分を構文解析スタック4に格納。
【0018】(ステップS5) 係り受けが成立する場合:係り受け成立後の両成分を連
結してできる一連の語を新たな成分とす る。 (ステ
ップS9)そしてその成分を新たな成分としてステップ
S4以降を再び実行する。 以上の操作を原文の語(成分)について逐次行った
後、並列句処理が終了する。
【0019】次に、前述した並列名詞句処理規則6aを
用いた係り受けについて図4及び図5を用いて詳細に説
明する。図4のフロー図を用いて例えば「個人、外人の
買い」や「ニューヨーク、ロンドン市場」といった体言
+並列類が体言に係る並列名詞句処理規則について説明
する。 (1)体言「買い」及び「市場」に係っている体言「外
人」及び「ロンドン」が 在るか否か? (ス
テップS11) 無い場合: 係り受け成立しない。 (ステ
ップS12) (2)在る場合:その体言「外人」及び「ロンドン」が
体言「買い」及び「市場」に係っている属性(行為者に
より修飾され得るとか、地名により修飾され得るという
性質)で体言「個人」及び「ニューヨーク」が「買い」
及び「市場」に係れるか?
(ステップS13) 係れる場合: 係り受け成立。 (ステ
ップS14) 係れない場合: 係り受け成立しない。 (ステ
ップS12) 図5のフロー図を用いて例えば「A銘柄、B銘柄が買わ
れた」といった体言+並列類が述語に係る並列名詞句処
理規則について説明する。 (1)述語「買われた」に係っている体言「B銘柄」が
在るか否か? (ステップS21) 無い場合: 係り受け成立しない。 (ステ
ップS22) (2)在る場合:その体言「B銘柄」が述語「買われ
た」に係っている格(主格、目的格等)で体言「A銘
柄」が「買われた」に係れるか? (ステップS23) 係れる場合: 係り受け成立。 (ステ
ップS24) 係れない場合: 係り受け成立しない。 (ステ
ップS22) 次いで、具体的な文を例にとって並列名詞句処理の動作
の流れを図1、図6及び図7を用いて説明する。
【0020】原文「A銘柄、B銘柄や薬品株の一角が上
げる」を形態素解析部1にて形態素(語)「A銘柄」、
「、」、「B銘柄」、「や」、「薬品株」、「の」、
「一角」、「が」、「上げる」に分解・解析し構文解析
部2に入力し、成分作成部3において先頭から順次各語
に対応した成分が作成される。そして、構文解析スタッ
ク4に既に別の成分が格納されているか否かを確認する
手順を取るのであるが、ここでは成分が格納されていな
い状態から説明する。
【0021】即ち、 ステップa: 入力語「A銘柄」を構文解析スタック4
に格納する。 ステップb: 次の入力語「、」が構文解析スタック4
の中の「A銘柄」に係ることができるので係ける。上記
のように構文解析スタック4に格納されている「A銘
柄」が係る側の成分であり、次に入力されてくる入力語
「、」に対して係り受けの関係が成立するか否かが逐次
確認され、成立する場合には両成分を連結して一連の語
(成分)を形成し新たな成分として構文解析スタック4
に格納するものである。
【0022】尚、実際には、本来の成分(「体言+格助
詞」や「動詞+助動詞」等の約20種類)につき、成分
作成部3において構文解析スタック4を用いずにテーブ
ル等の使用により成分内の係り受けを認識するように
し、成分として構成できたもののみを後の処理に引き渡
すようにすることがあり、その場合にはステップaの状
態は存在しない。以下の処理における成分についても同
様のことが言える。 ステップ c〜f: 同様に係り受けの関係が確認され、入力語
「B銘柄」と「や」の係り受けが成立し連結した一連の
語「B銘柄や」及び入力語「薬品株」と「の」の係り受
けが成立し連結した一連の語「薬品株の」が新たな成分
として構文解析スタック4に格納される。 ステップg: 入力語「一角」において、並列名詞句処
理規則6aを適用する。
【0023】つまり、「薬品株」が「一角」に係ってい
るものと同じ属性でもって「B銘柄」に対しても係かれ
るか否かをチェックする。今の例では「一角」とはある
ものの一部を示すものであって、分割可能なものから係
られるものであるため、「B銘柄」は係ることができ
ず、並列名詞句を構成しないものとして次に進む。 ステップh: 入力語「が」を「一角」につなげて構文
解析スタック4に格納する。 ステップi: 入力語「上げる」を「が」につなげて構
文解析スタック4に格納する。 ステップj: 「B銘柄」が「一角」(薬品株の意味素
を継承している)と同じ格で動詞「上げる」に係れるか
否かをチェックするものである。
【0024】上記の例では係れるので係けて新しい解析
木を作る。 ステップk: 前記同様に、「A銘柄」が「一角」と同
じ格関係で動詞「上げる」に係れるか否かをチェックす
るものである。上記の例では係れるので係けて新しい解
析木を作る。これにより構文解析を終了し、原文の構造
を示す解析木を出力する。
【0025】以上説明してきたように、構文解析スタッ
ク4に格納された成分(単一の語あるいは係り受けが成
立している一連の語)を係る側の成分とし、順次新しく
作成される成分を係られる側の成分と位置付け、両成分
の係り受けを確認する規則として構文解析規則部6が用
いられる。その規則の一部として構文解析規則部6に属
する名詞並列句処理規則6aが使用される。即ち、述語
あるいは体言に対して係っている体言と同じ格あるいは
属性でもって係ることのできる体言(構文解析スタック
4に格納済の体言)を並列名詞句であると認識するため
の手順が規定されている名詞並列句処理規則6aを用い
ることによって、正しい並列名詞句のチェックを行なう
ことができる。
【0026】
【効果】本発明にあっては、上述のように、成分作成部
で新たに作成された成分に対する、構文解析スタックに
格納された単一の語に対応する成分あるいは係り受け成
立後の一連の語よりなる成分の係り受け実行に際し、述
語あるいは体言に対して係っている体言と同じ格あるい
は属性で係ることができる構文解析スタックに既格納の
体言を並列句であると認識するという手順で行なう並列
句処理規則を用いることによって並列句の認識を行なう
ものである。
【0027】このように述語あるいは修飾される体言と
の関係において、複数の名詞が同じ格あるいは属性で係
ることができるか否かを判定することによって、誤りの
無い並列句処理を行なうことができる。
【図面の簡単な説明】
【図1】本発明におけるハード構成図である。
【図2】本発明における全体動作概略図である。
【図3】本発明の全体フロー図である。
【図4】本発明の要部フロー図である。
【図5】本発明の要部フロー図である。
【図6】本発明の並列名詞句の処理動作を示す模式図で
ある。
【図7】本発明の並列名詞句の処理動作を示す図6に続
く模式図である。
【図8】従来例において利用する分類木を示す図であ
る。
【符号の説明】
1 形態素解析部 2 構文解析部 3 成分作成部 4 構文解析スタック 5 係り受け実行部 6 構文解析規則部 6a 並列名詞句処理規則

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力される原文の形態素解析を行う形態
    素解析部と、 前記形態素解析部から出力された語から成分を作成する
    成分作成部と、 前記成分作成部で作成された単一の語に対応する成分あ
    るいは係り受け成立後の一連の語を成分として格納する
    構文解析スタックと、 前記成分作成部で新たに作成された成分に対して、前記
    構文解析スタックに既に格納されている成分が係ること
    ができるか否かを確認すると共に、係ることができる場
    合に両成分を連結したものを新たな成分として前記構文
    解析スタックに格納し、更に前の成分との間の係り受け
    の確認を繰り返し実行する係り受け実行部と、 前記係り受け実行部の処理に際して使用され、述語ある
    いは体言に対して係っている体言と同じ格あるいは属性
    で前記構文解析スタックに既格納の成分に係ることがで
    きるか否かを判断し、係ることができる場合、前記述語
    あるいは体言に対して係っている体言と前記構文解析ス
    タックに既格納の成分とが並列名詞句であると認識する
    並列名詞句処理規則を有する構文解析規則部とを備えた
    ことを特徴とする機械翻訳装置における並列名詞句処理
    装置
JP22101392A 1992-08-20 1992-08-20 機械翻訳装置における並列名詞句処理装置 Expired - Fee Related JP3339006B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22101392A JP3339006B2 (ja) 1992-08-20 1992-08-20 機械翻訳装置における並列名詞句処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22101392A JP3339006B2 (ja) 1992-08-20 1992-08-20 機械翻訳装置における並列名詞句処理装置

Publications (2)

Publication Number Publication Date
JPH0668131A JPH0668131A (ja) 1994-03-11
JP3339006B2 true JP3339006B2 (ja) 2002-10-28

Family

ID=16760114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22101392A Expired - Fee Related JP3339006B2 (ja) 1992-08-20 1992-08-20 機械翻訳装置における並列名詞句処理装置

Country Status (1)

Country Link
JP (1) JP3339006B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5295576B2 (ja) * 2008-01-24 2013-09-18 ヤフー株式会社 自然言語解析装置、自然言語解析方法および自然言語解析プログラム

Also Published As

Publication number Publication date
JPH0668131A (ja) 1994-03-11

Similar Documents

Publication Publication Date Title
Ge et al. A statistical semantic parser that integrates syntax and semantics
JPH0242572A (ja) 共起関係辞書生成保守方法
JPS62163173A (ja) 機械翻訳方法
Chen et al. Automated extraction of tree-adjoining grammars from treebanks
JPS6318458A (ja) 感情情報抽出装置
Phillips et al. GPSGP—a parser for generalized phrase structure grammars
Arwidarasti et al. Converting an Indonesian constituency treebank to the Penn treebank format
JP3339006B2 (ja) 機械翻訳装置における並列名詞句処理装置
Wang et al. Evaluation of spoken language grammar learning in the ATIS domain
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Varshini et al. A recognizer and parser for basic sentences in telugu using cyk algorithm
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Osborne et al. Learning unification-based grammars using the Spoken English Corpus
JP4039282B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Kübler et al. Adding context information to part of speech tagging for dialogues
Hein A chart-based framework for grammar checking. initial studies
Nouar et al. Deep Semantic Parsing Method to Capture the Structure of Multi-Relation Questions over Linked Data.
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2000259631A (ja) 機械翻訳校正装置
JP4114580B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4036172B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPS6344276A (ja) 生成文法自動生成装置
JPH0157829B2 (ja)
Helzerman et al. Parallel parsing of spoken language
JP2003281137A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees