JPH1063664A - 自然言語の翻訳方法及び装置 - Google Patents

自然言語の翻訳方法及び装置

Info

Publication number
JPH1063664A
JPH1063664A JP8223849A JP22384996A JPH1063664A JP H1063664 A JPH1063664 A JP H1063664A JP 8223849 A JP8223849 A JP 8223849A JP 22384996 A JP22384996 A JP 22384996A JP H1063664 A JPH1063664 A JP H1063664A
Authority
JP
Japan
Prior art keywords
word
natural language
string
phonogram
phonetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8223849A
Other languages
English (en)
Inventor
Yoshihiro Matsuo
義博 松尾
Satoshi Shirai
諭 白井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP8223849A priority Critical patent/JPH1063664A/ja
Publication of JPH1063664A publication Critical patent/JPH1063664A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 本発明は、未知の表音文字単語の翻訳不能
と、複合語をなす表音文字単語の誤訳とが回避された自
然言語の翻訳方法及び装置の提供を目的とする。 【解決手段】 本発明の装置は、第1言語の文を形態素
解析する手段と、形態素列から、表音文字列と非表音文
字列を別個に出力する手段と、表音文字列を、複合語又
は未知語と、それ以外の表音文字列とに分離する手段
と、第2言語の単語が第1言語の表音文字で表記された
表音語辞書を用いて、複合語又は未知語に対応する第2
言語で表された単語列を生成する手段と、非表音文字列
と上記複合語又は未知語以外の表音文字列とを第2言語
の文に翻訳し、単語列を挿入することにより、第2の文
を生成する手段とからなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自然言語を別の自
然言語に翻訳する自然言語の自動翻訳方法及び装置に関
する。
【0002】
【従来の技術】従来の自然言語の自動翻訳方法によれ
ば、例えば、日本語のカタカナのような表音文字で表さ
れた表音文字単語は、第1自然言語の非表音文字の単語
と同様に辞書登録され、翻訳される。文中に表音文字単
語として表わされる単語には、外来語が多く、新語が頻
繁に登場する。この従来の方法では、辞書登録されてい
ない表音文字単語は、翻訳の際に未登録語として扱わ
れ、未登録の表音文字単語の翻訳は不能である。
【0003】また、上記の如く、表音文字単語が未登録
語として扱われた場合に、その表音文字単語の表記か
ら、第1自然言語とは別の第2自然言語における綴字を
推定し、推定された綴字を訳語とする方法が特許出願第
3−211669号明細書により周知である。
【0004】
【発明が解決しようとする課題】従来技術の自動翻訳方
法の場合に、外来語が多く、新語が頻繁に登場する表音
文字単語を網羅的に辞書登録することが困難であり、辞
書登録されていない表音文字単語を翻訳すると未知語と
して取り扱われ、翻訳不能になるという問題がある。
【0005】また、未登録語とした扱われた部分だけの
綴字を推定して翻訳する方法では、未登録語ではない表
音文字単語が複合語になった場合に、誤訳される可能性
がある。日英翻訳装置を例にとると、日本語の「センタ
ー」が"center field"(野球のセンターの意)として辞
書登録され、「インフォメーション」が"information"
として辞書登録されている場合に、複合語の「インフォ
メーションセンター」が"information center field"の
ように誤訳される問題がある。
【0006】或いは、上記の表音文字単語の表記から第
2自然言語における綴字を推定して翻訳する方法は、綴
字の推定の精度に問題がある。従って、本発明は、上記
従来技術の問題点を解決するため、未知の表音文字単語
の翻訳不能と、複合語を形成する表音文字単語の誤訳と
が回避された自然言語の翻訳方法及び装置の提供を目的
とする。
【0007】更に、第1自然言語の第1の文を第2自然
言語の第2の文に翻訳する際に、第1の文に含まれてい
る表音文字列が、第1自然言語及び第2自然言語以外の
第3言語の語を表わす場合には、適切な翻訳が行えない
という問題点がある。本発明の更なる目的は、第1自然
言語から第2自然言語への翻訳の際に、第3言語の語に
対応する表音文字の翻訳が可能な自然言語の翻訳方法及
び装置を提供することである。
【0008】
【課題を解決するための手段】上記目的を達成するた
め、本発明の自然言語の翻訳方法は、第1自然言語の辞
書に登録されていない表音文字列及び複合語を構成する
表音文字列を第2自然言語の語に翻訳する際に、第2自
然言語の単語を第1自然言語の表音文字で表記した表音
語辞書を用いることを特徴とする。
【0009】図1は、第1自然言語で表された第1の文
を第2自然言語で表された第2の文に翻訳する本発明の
自然言語の翻訳方法の原理説明図であり、同図に示され
ているように本発明の方法は、上記第1の文を形態素列
の形に単語分割する形態素解析段階(ステップ1)と、
上記形態素列から、表音文字列と、表音文字以外で表記
された非表音文字列とを抽出する表音文字列抽出段階
(ステップ2)と、上記表音文字列が複合語であるか、
又は、上記表音文字列が未知語であるかどうかを判定す
る表音文字列判定段階(ステップ3)とからなる。本発
明の方法は、上記表音文字列が複合語であるか、又は、
上記表音文字列が未知語である場合に、表音語辞書から
上記第1自然言語で表された上記表音文字列に対応する
上記第2自然言語で表された第1の単語列を生成する表
音語翻訳段階(ステップ4)と、上記第2の文を得るよ
う、上記表音文字列抽出段階で得られた上記非表音文字
列と、上記表音文字列判定段階で上記複合語又は上記未
知語であると判定された上記表音文字列とから、上記第
2自然言語で表された訳文を生成し、上記表音語翻訳段
階で生成された第1の単語列を上記訳文に挿入する段階
(ステップ5)とを更に有する。
【0010】上記本発明の更なる目的は、上記表音語翻
訳段階(ステップ4)において、上記表音語辞書から上
記第1自然言語で表された上記表音文字列に対応する上
記第2自然言語で表された第1の単語列が生成されたか
とうかを判定し、上記第1の単語列が生成されなかった
場合に、上記第1自然言語及び上記第2自然言語以外の
他言語表音語辞書から上記表音文字列に対応する上記第
1の単語列を検索することにより実現される。
【0011】
【発明の実施の形態】図2は上記本発明の自然言語の翻
訳方法を実行する自然言語の翻訳装置の原理構成図であ
る。図2に示されているように、本発明の自然言語の翻
訳装置2は、上記第1の文を単語分割し、形態素列を出
力する形態素解析手段10と、上記形態素解析手段10
に接続され、上記形態素列から表音文字列を抽出し、上
記表音文字列と、表音文字以外で表記された非表音文字
列とを出力する表音文字抽出手段20と、上記表音文字
抽出手段20に接続され、上記表音文字列を、複合語又
は未知語と、複合語又は未知語以外の表音文字列とに分
離し、分離された上記表音文字列を出力する表音文字列
判定手段30とからなる。上記翻訳装置2は、上記表音
文字列判定手段30に接続され、上記複合語又は上記未
知語を受け、上記第2自然言語の単語が上記第1自然言
語の表音文字で表記された表音語辞書50を用いて、受
けられた上記複合語又は上記未知語に対応する上記第2
自然言語で表された第1の単語列を生成する表音語翻訳
手段40と、上記表音文字抽出手段20と、上記表音文
字判定手段30と、上記表音語翻訳手段40とに接続さ
れ、上記表音文字抽出手段20から得られた非表音文字
列と、上記表音文字判定手段30から得られた上記複合
語又は上記未知語以外の上記表音文字列とを上記第2自
然言語の文に翻訳し、上記表音語翻訳手段40から得ら
れた上記第1の単語列を上記文に挿入することにより、
上記第2の文を生成する翻訳手段60とを更に有する。
【0012】図3は、上記表音文字判定部30の第1の
構成例を表している。同図に示すように、上記表音文字
列判定手段30は、上記表音文字抽出手段30に接続さ
れ、上記表音文字抽出手段30から上記表音文字列を受
け、上記表音文字列が上記複合語であるかどうかを判定
し、複合語を表わす表音文字列を上記表音語翻訳手段4
0に供給し、複合語以外の非複合語を表わす表音文字列
を更に出力する複合語抽出部32からなる。上記表音文
字列判定手段30は、上記複合語抽出部32に接続され
て、上記複合語抽出部32から上記非複合語を受け、上
記非複合語が未知語であるかどうかを判定し、未知語を
表わす表音文字列を上記表音語翻訳手段40に供給し、
未知語ではない非未知語、即ち、複合語でも未知語でも
ない非複合語/未知語を上記翻訳手段60に供給する未
知語抽出部34を更に有する。
【0013】一方、図4は、上記表音文字判定部30の
第2の構成例を表している。同図に示すように、上記表
音文字列判定手段30は、上記表音文字抽出手段30に
接続され、上記表音文字抽出手段30から上記表音文字
列を受け、上記表音文字列が上記未知語であるかどうか
を判定し、未知語を表わす表音文字列を上記表音語翻訳
手段40に供給し、未知語以外の非未知語を表わす表音
文字列を更に出力する未知語抽出部34からなる。上記
表音文字列判定手段30は、上記未知語抽出部34に接
続されて、上記未知語抽出部34から上記非未知語を受
け、上記非未知語が複合語であるかどうかを判定し、複
合語を表わす表音文字列を上記表音語翻訳手段40に供
給し、複合語ではない非未知語、即ち、未知語でも複合
語でもない非複合語/未知語を上記翻訳手段60に供給
する複合語抽出部34を更に有する。
【0014】
【実施例】以下、図面を用いて本発明の実施例を説明す
る。図5は、本発明の一実施例の自然言語自動翻訳シス
テムの構成図である。形態素解析部10は、翻訳される
べき第1自然言語の文を受け、文の単語分割を行うこと
により文を形態素列に解析し、形態素列を表音文字抽出
部20に供給する。形態素解析部10は、解析結果の形
態素列の中で辞書登録されていない未知語には、未知語
であることを示す表示を付与する。表音文字抽出部20
は、上記形態素列の中から、表音文字のみで表記された
語の列を抽出し、抽出された表音文字列を複合語抽出部
32に供給し、上記第1自然言語の文の中で表音文字列
以外で表記された部分を翻訳部60に供給する。表音文
字列は、形態素解析部10で得られた単一の単語に対応
する単一の表音語、又は、複数の単語に対応する複数の
表音語、即ち、複合語の何れかを表わす。
【0015】複合語抽出部32は、上記供給された表音
文字列が複合語であるかどうかを判定し、複合語であれ
ば、上記表音文字列を表音語翻訳部40に供給し、複合
語以外であれば、上記表音文字列を未知語抽出部34に
供給する。未知語抽出部34は、上記供給された表音文
字列の中に、未知語であることを示す表示が付与された
語が含まれているかどうかを検査し、含まれている場合
に、上記表音文字列が未知語であると判定し、含まれて
いない場合に、上記表音文字列が未知語ではないと判定
する。上記未知語抽出部34は、未知語であると判定さ
れた表音文字列を表音翻訳部40に供給し、未知語以外
であると判定された表音文字列を翻訳部60に供給す
る。
【0016】上記複合語抽出部32からの複合語又は上
記未知語抽出部34からの未知語である表音文字列を供
給された表音語翻訳部40は、表音語辞書50から上記
供給された表音文字列に含まれる語を検索し、上記表音
文字列中の全ての語が表音語辞書50の中に登録されて
いるかどうかを判定する。
【0017】図6は、本発明の一実施例の表音語辞書5
0の説明図である。表音語辞書50には、第2自然言語
の単語100と、第1自然言語におけるその単語100
に対応する表音表記110とが含まれる。一つの単語に
対応した表音表記が複数個存在する場合には、全ての表
音表記が記載される。例えば、第1自然言語が日本語、
第2自然言語が英語の場合には、第2自然言語の単語1
00は英単語であり、第1自然言語の表音表記110
は、その英単語のカタカナ表記である。このような表音
語辞書50は、例えば、英和辞典又は英英辞典等に含ま
れる各単語にカタカナ表記を付与することにより作成さ
れる。
【0018】表音語翻訳部40は、上記表音文字列中の
全ての語が表音語辞書50に登録されていると判定され
たならば、表音文字列に該当する第2自然言語の単語列
を生成し、生成された単語列を翻訳部60に供給する。
翻訳部60は、例えば、特開昭第61−232826号
明細書に記載されているような周知の翻訳方法に従っ
て、表音文字抽出部20からの上記第1自然言語の文の
中で表音文字列以外で表記された部分と、未知語抽出部
34からの未知語以外であると判定された表音文字列の
訳文を生成する。表音語翻訳部40から供給された第2
自然言語の単語列は、上記生成された訳文中の該当する
箇所に挿入され、第2自然言語の第2の文が生成され
る。
【0019】上記本発明の一実施例の自然言語の翻訳装
置4において、表音文字判定部30は、図3に示された
ような第1の構成からなるが、図4に示されたような表
音文字判定部の第2の構成でも構わない。上記本発明の
一実施例の自然言語の翻訳装置4は、表音言語翻訳部4
0と、翻訳部60との間に接続された他言語表音語翻訳
部70を更に有する。他言語表音語翻訳部70は、表音
翻訳部40において、上記表音文字列の中に表音語辞書
50に登録されていない単語が存在すると判定された場
合に、表音語翻訳部40から対応する単語列が生成され
なかった上記複合語又は上記未知語を受け、上記第1自
然言語及び上記第2自然言語以外の他言語の表音語辞書
80から上記表音文字列に対応する単語列を検索し、検
索により得られた上記単語列を翻訳部60に供給する。
【0020】図7は上記本発明の一実施例の他言語表音
語辞書80の説明図である。他言語表音語辞書80に
は、第1自然言語及び第2自然言語以外の他の言語の単
語が第2自然言語で表された表音表記410と、その単
語の第1自然言語での表音表記420とが記載されてい
る。複数の表音表記がある場合には、全ての表音表記が
第2自然言語での表音表記410と第1自然言語での表
音表記420に記載されている。例えば、第1自然言語
が日本語であり、第2自然言語が英語である場合に、他
の言語の単語とは、日本語、英語以外の言語、例えば、
フランス語、中国語等の言語の単語である。従って、他
言語表音語辞書80の第2言語での表音表記410と
は、フランス語、中国語等の他の言語の単語の英単語表
記であり、第1言語での表音表記420とは、フランス
語、中国語等の他の言語の単語のカタカナ表記である。
図7に示された例において、〔英語=design,日
本語=デザイン〕の項は、“design”というフラ
ンス語の英語及び日本語での表音表記である。〔英語=
biennalle,日本語=ビエンナーレ〕の項は、
“biennale”というフランス語の英語及び日本
語での表音表記である。このような他言語表音語辞書8
0は、仏和辞典等に記載された各単語にカタカナ表記と
英語表記を付与することにより作成される。
【0021】図8は本発明の一実施例の自然言語の自動
翻訳システムの動作フローチャートである。以下、図8
を参照して、例えば、第1自然言語が日本語、第2自然
言語が英語であり、第1自然言語の日本語の文「政府は
インフォメーションセンターを開設した」を翻訳する場
合における本発明の一実施例の動作を説明する。
【0022】形態素解析部10は、入力文「政府はイン
フォメーションセンターを開設した」を「政府/は/イ
ンフォメーション/センター/を/開設した」に形態素
解析する(ステップ10)。表音文字抽出部20は、形
態素列「政府/は/インフォメーション/センター/を
/開設した」から表音文字列「インフォメーション/セ
ンター」を抽出し、表音文字列を複合語抽出部32に送
り、入力文中の表音文字列以外の部分「政府/は/を/
開設した」を翻訳部60に送る(ステップ12)。
【0023】複合語抽出部32は、表音文字列「インフ
ォメーション/センター」が複合語であると判定し、表
音文字列「インフォメーション/センター」を表音語翻
訳部40に送る(ステップ14)。表音語翻訳部40
は、「インフォメーション」及び「センター」が共に図
6に示された表音語辞書50の中に登録されているかど
うかを判定する(ステップ16)。「インフォメーショ
ン」及び「センター」が共に表音語辞書50の中に登録
されている場合に、処理がステップ18に進み、表音語
翻訳部40は表音文字列「インフォメーション/センタ
ー」から訳語列“information cente
r”を得、得られた訳語列を翻訳部60に送る(ステッ
プ18)。次いで、翻訳部60は、日本語の文「政府/
は/〔インフォメーションセンター〕/を/開設した」
を英語に翻訳する。ここで、括弧〔 〕で表された〔イ
ンフォメーションセンター〕は、この部分が表音語翻訳
部40から送られた訳語列であることを示している。翻
訳部60は、日本語の文「政府/は/〔インフォメーシ
ョンセンター〕/を/開設した」の中で、括弧〔 〕で
表された〔インフォメーションセンター〕以外の部分の
訳文、例えば、“government opened
〔インフォメーションセンター〕”を生成し、次に、
この訳文と、〔インフォメーションセンター〕の訳語列
“information center”とを合成す
ることにより、日本語の文の英語の翻訳文である“Th
e government opened an in
formation center.”を得て(ステッ
プ20)、自動翻訳を終了する。
【0024】一方、「インフォメーション」又は「セン
ター」が表音語辞書50の中に登録されていない場合
に、処理がステップ22に進み、翻訳部60は、「政府
/は/インフォメーション/センター/を/開設した」
の全文を英語に翻訳し、例えば、翻訳文“The go
vernment opened an inform
ation center field.”を生成し
(ステップ22)、自動翻訳を終了する。
【0025】図9は本発明の一実施例の自然言語の自動
翻訳システムの別の動作フローチャートである。以下、
図9を参照して、例えば、第1自然言語が日本語、第2
自然言語が英語であり、第1自然言語の日本語の文「あ
なたのアカウントは削除されました」を翻訳する場合に
おける本発明の一実施例の別の動作を説明する。
【0026】形態素解析部10は、入力文「あなたのア
カウントは削除されました」を「あなた/の/アカウン
* /は/削除されました」に形態素解析する(ステッ
プ30)。ここで、記号* は、単語「アカウント」が未
知語であることを示している。
【0027】表音文字抽出部20は、形態素列「あなた
/の/アカウント* /は/削除されました」から表音文
字列「アカウント* 」を抽出し、表音文字列を複合語抽
出部32に送り、入力文中の表音文字列以外の部分「あ
なた/の/は/削除されました」を翻訳部60に送る
(ステップ32)。
【0028】複合語抽出部32は、表音文字列「アカウ
ント* 」が複合語ではないと判定し、表音文字列「アカ
ウント* 」を未知語抽出部34に送る(ステップ3
4)。未知語抽出部34は、表音文字列「アカウン
* 」が未知語であると判定して、表音文字列「アカウ
ント* 」を表音語翻訳部40に送る(ステップ36)。
表音語翻訳部40は、図6に示したような表音語辞書5
0に登録されている「アカウント」の訳語列として“a
ccount”を取得して、翻訳部60に送る(ステッ
プ38)。
【0029】翻訳部60は、日本語の文「あなた/の/
〔アカウント〕/は/削除されました」の中で、括弧
〔 〕で表された〔アカウント〕以外の部分の訳文、例
えば、“your 〔アカウント〕 has been
deleted”を生成し、次に、この訳文と、〔ア
カウント〕の訳語列“account”とを合成するこ
とにより、日本語の文の英語の翻訳文である“Your
account has been delete
d.”を得て(ステップ40)、自動翻訳を終了する。
【0030】図10は本発明の一実施例の自然言語の自
動翻訳システムの更に別の動作フローチャートである。
以下、図10を参照して、例えば、第1自然言語が日本
語、第2自然言語が英語であり、第1自然言語の日本語
の文「日本でデザインビエンナーレが開催された」を翻
訳する場合における本発明の一実施例の更に別の動作を
説明する。
【0031】形態素解析部10は、入力文「日本でデザ
インビエンナーレが開催された」を形態素列「日本/で
/デザイン/ビエンナーレ/が/開催された」に分割
し、表音文字抽出部20に送る(ステップ50)。表音
文字抽出部20は、形態素列「日本/で/デザイン/ビ
エンナーレ/が/開催された」から表音文字列「デザイ
ン/ビエンナーレ」を抽出し、表音文字列を複合語抽出
部32に送り、入力文中の表音文字列以外の部分「日本
/で/が/開催された」を翻訳部60に送る(ステップ
52)。
【0032】複合語抽出部32は、表音文字列「デザイ
ン/ビエンナーレ」が複合語であると判定し、表音文字
列「デザイン/ビエンナーレ」を表音語翻訳部40に送
る(ステップ54)。表音語翻訳部40は、「デザイ
ン」及び「ビエンナーレ」が共に図6に示された表音語
辞書50の中に登録されているかどうかを検索すると、
「デザイン」及び「ビエンナーレ」が表音語辞書50の
中に登録されていないので、表音文字列「デザイン/ビ
エンナーレ」の訳語列の生成に失敗し、表音文字列「デ
ザイン/ビエンナーレ」を他言語表音語翻訳部70に送
る(ステップ56)。
【0033】他言語表音語翻訳部70は、図7に示され
た他言語表音語辞書80の中から、第1自然言語の「デ
ザイン」及び「ビエンナーレ」に対応する第2自然言語
の表音表記として“design”及び“bienna
le”を検索し、表音文字列「デザイン/ビエンナー
レ」の訳語列として、“design biennal
e”を得て、翻訳部60に送る(ステップ58)。
【0034】翻訳部60は、日本語の文「日本/で/
〔デザインビエンナーレ〕/が/開催された」の中で、
括弧〔 〕で表された〔デザインビエンナーレ〕以外の
部分の訳文、例えば、“〔デザインビエンナーレ〕 w
as held in Japan”を生成し、次に、
この訳文と、〔デザインビエンナーレ〕の訳語列“de
sign biennale”を合成することにより、
日本語の文の英語の翻訳文である“The desig
n biennale was held inJap
an.”を得て、英語の文として出力し(ステップ6
0)、自動翻訳を終了する。
【0035】図11は本発明の他の実施例の自然言語自
動翻訳システムの構成図である。同図に示されているよ
うに、他言語表音語辞書は、1種類の言語に限定される
ことはない。検索順序が予め定められた複数の種類の他
言語表音語辞書を他言語表音語処理翻訳部70に接続し
て表音語翻訳を行うことにより、表音語翻訳を効果的に
実行することが可能である。
【0036】図12は本発明の更に別の実施例の自然言
語自動翻訳システムの構成図である。同図に示された自
然言語自動翻訳システムは、図4に示されたような表音
語判定部30の構成を有する点で、図3に示されたよう
な表音語判定部30の構成を有する図5に示された本発
明の一実施例の自然言語自動翻訳システムと相違してい
る。
【0037】例えば、図8を参照して説明したような第
1自然言語が日本語、第2自然言語が英語であり、第1
自然言語の日本語の文「政府はインフォメーションセン
ターを開設した」を翻訳する場合における上記本発明の
更に別の実施例の動作を説明する。
【0038】形態素解析部10は、入力文「政府はイン
フォメーションセンターを開設した」を「政府/は/イ
ンフォメーション/センター/を/開設した」に形態素
解析する。表音文字抽出部20は、形態素列「政府/は
/インフォメーション/センター/を/開設した」から
表音文字列「インフォメーション/センター」を抽出
し、表音文字列を未知語抽出部34に送り、入力文中の
表音文字列以外の部分「政府/は/を/開設した」を翻
訳部60に送る。
【0039】未知語抽出部34は、表音文字列「インフ
ォメーション/センター」には未知語が含まれていない
と判定し、表音文字列「インフォメーション/センタ
ー」を複合語抽出部32に送る。複合語抽出部32によ
る処理は、図8に示されたステップ14の動作と同様で
あり、以下、図8に示されたステップ16、ステップ1
8、ステップ20、ステップ22を実行する。従って、
上記例の場合に、図5及び図8を用いて説明した例と同
様に、第2自然言語の文“The governmen
t opened an information c
enter.”が得られる。
【0040】更に、例えば、第1自然言語が日本語、第
2自然言語が英語であり、第1自然言語の日本語の文
「あなたのアカウントは削除されました」を翻訳する場
合にも、図5及び図9を参照して説明した動作と同様に
翻訳文“Your account has been
deleted.”が得られる。
【0041】図13には、文法解析を行う本発明の表音
語翻訳部40の一例の動作フローチャートが示されてい
る。以下、同図を参照して表音語翻訳部40の動作を詳
細に説明する。表音語翻訳部40に入力された表音文字
列は、表音語辞書50を用いて、第2自然言語の列に変
換され、表音語辞書50の中に複数の候補がある場合に
は、その全ての組み合わせが候補とされる(ステップ1
10)。次に、候補が得られたかどうかが判定され(ス
テップ120)、候補が得られていない場合には、ステ
ップ170に進み、翻訳失敗の処理を行い、表音語翻訳
部40の処理が終了する。
【0042】候補が得られた場合、第2自然言語の列の
候補の中から一つの候補が取り出され(ステップ13
0)、その取り出された候補を上記第2自然言語の文法
に従って解析する(ステップ140)。解析の結果が成
功したかどうかが判定され(ステップ150)、解析が
失敗した場合には、ステップ120に戻り、次の候補の
解析を始める。一方、解析が成功した場合には、ステッ
プ160に進み、その候補を訳とし、第2自然言語の列
を出力し(ステップ160)、表音語翻訳部40の処理
が終了する。
【0043】図14は、上記文法解析を行う表音語翻訳
部40が利用する表音語辞書50の説明図である。表音
語辞書50には、第2自然言語の単語を表わす第2言語
単語700と、その単語の第1自然言語における表音表
記である第1言語表音表記710と、その単語の第2自
然言語における文法の属性を表わす第2言語文法属性7
20とが含まれる。例えば、第1自然言語が日本語、第
2自然言語が英語である場合には、第2言語単語700
は英単語であり、表音表記710はその英単語に対応す
るカタカナ表記であり、文法属性720は英単語の品詞
である。
【0044】例えば、第1自然言語が日本語、第2自然
言語が英語であり、「エアーポートイン」を含む日本語
の文を英語に翻訳する場合を想定する。図14に示され
た辞書に基づいて「エアーポートイン」を変換すると、
“airport in”と、“airport in
n”の二つの候補が得られる(ステップ110)。候補
が得られたので、ステップ130に進み、最初の候補
“airport in”を取り出す。次いで、取り出
された候補“airport in”を英文法で解析す
る。例えば、 S → NP NP → N NP NP → N NP → NP PP PP → P NP の句構造文法で解析すると(ステップ140)、“ai
rport in”の解析が失敗し(ステップ15
0)、ステップ120に戻り、次の候補“airpor
t inn”を取り出す。この候補を上記句構造文法で
解析すると(ステップ140)、解析に成功し(ステッ
プ150)、候補“airport inn”が訳語と
なり出力され(ステップ160)、表音語翻訳部40の
動作が終了する。
【0045】
【発明の効果】以上述べたように、本発明によれば、第
1自然言語の文を別の第2自然言語の文に翻訳する際
に、第2自然言語の単語、或いは、第1及び第2自然言
語以外の第3言語の単語を、第1自然言語の表音文字で
表記した表音語辞書を用いることにより、従来未登録語
として扱われ、翻訳不能となっていた表音文字表記語を
第2自然言語の語に正しく訳出できるようになる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の原理構成図である。
【図3】本発明の表音語判定手段の第1の構成図であ
る。
【図4】本発明の表音語判定手段の第2の構成図であ
る。
【図5】本発明の一実施例の自然言語の自動翻訳システ
ムの構成図である。
【図6】本発明の一実施例の表音言語辞書の説明図であ
る。
【図7】本発明の一実施例の表音言語辞書の説明図であ
る。
【図8】本発明の一実施例の自動翻訳システムの動作フ
ローチャートである。
【図9】本発明の一実施例の自動翻訳システムの別の動
作フローチャートである。
【図10】本発明の一実施例の自動翻訳システムの更に
別の動作フローチャートである。
【図11】本発明の他の実施例の自然言語の自動翻訳シ
ステムの構成図である。
【図12】本発明の更に別の実施例の自然言語の自動翻
訳システムの構成図である。
【図13】文法解析を行う本発明の表音語翻訳部の一例
の動作フローチャートである。
【図14】文法解析を行う表音語翻訳部が利用する表音
語辞書の説明図である。
【符号の説明】
2 自然言語の翻訳装置 10 形態素解析手段 20 表音文字抽出手段 30 表音文字判定手段 40 表音語翻訳手段 50 表音語辞書 60 翻訳手段

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 第1自然言語で表された第1の文を第2
    自然言語で表された第2の文に翻訳する自然言語の翻訳
    方法において、 上記第1の文を形態素列の形に単語分割する形態素解析
    段階と、 上記形態素列から、表音文字列と、表音文字以外で表記
    された非表音文字列とを抽出する表音文字列抽出段階
    と、 上記表音文字列が複合語であるか、又は、上記表音文字
    列が未知語であるかどうかを判定する表音文字列判定段
    階と、 上記表音文字列が複合語であるか、又は、上記表音文字
    列が未知語である場合に、表音語辞書から上記第1自然
    言語で表された上記表音文字列に対応する上記第2自然
    言語で表された第1の単語列を生成する表音語翻訳段階
    と、 上記第2の文を得るよう、上記表音文字列抽出段階で得
    られた上記非表音文字列と、上記表音文字列判定段階で
    上記複合語又は上記未知語であると判定された上記表音
    文字列とから、上記第2自然言語で表された訳文を生成
    し、上記表音語翻訳段階で生成された第1の単語列を上
    記訳文に挿入する段階とからなる自然言語の翻訳方法。
  2. 【請求項2】 上記表音語翻訳段階は、 上記表音語辞書から上記第1自然言語で表された上記表
    音文字列に対応する上記第2自然言語で表された第1の
    単語列が生成されたかとうかを判定する段階と、 上記第1の単語列が生成されなかった場合に、上記第1
    自然言語及び上記第2自然言語以外の言語表音語辞書か
    ら上記表音文字列に対応する上記第1の単語列を検索す
    る段階とを更に有する請求項1記載の自然言語の翻訳方
    法。
  3. 【請求項3】 上記表音文字列判定段階は、 上記表音文字列が上記複合語であるかどうかを判定する
    複合語抽出段階と、 上記表音文字列が上記複合語ではないと判定された場
    合、上記表音文字列が未知語であるかどうかを判定する
    未知語抽出段階とからなる請求項1又は2記載の自然言
    語の翻訳方法。
  4. 【請求項4】 上記表音文字列判定段階は、 上記表音文字列が上記未知語であるかどうかを判定する
    未知語抽出段階と、 上記表音文字列が上記未知語ではないと判定された場
    合、上記表音文字列が複合語であるかどうかを判定する
    複合語抽出段階とからなる請求項1又は2記載の自然言
    語の翻訳方法。
  5. 【請求項5】 第1自然言語で表された第1の文を第2
    自然言語で表された第2の文に翻訳する自然言語の翻訳
    装置において、 上記第1の文を単語分割し、形態素列を出力する形態素
    解析手段と、 上記形態素解析手段に接続され、上記形態素列から表音
    文字列を抽出し、上記表音文字列と、表音文字以外で表
    記された非表音文字列とを出力する表音文字抽出手段
    と、 上記表音文字抽出手段に接続され、上記表音文字列を、
    複合語又は未知語と、複合語又は未知語以外の表音文字
    列とに分離し、分離された上記表音文字列を出力する表
    音文字列判定手段と、 上記表音文字列判定手段に接続され、上記複合語又は上
    記未知語に対応する上記表音文字列を受け、上記第2自
    然言語の単語が上記第1自然言語の表音文字で表記され
    た表音語辞書を用いて、上記受けられた表音文字列に対
    応する上記第2自然言語で表された第1の単語列を生成
    する表音語翻訳手段と、 上記表音文字抽出手段と、上記表音文字判定手段と、上
    記表音語翻訳手段とに接続され、上記表音文字抽出手段
    から得られた非表音文字列と、上記表音文字判定手段か
    ら得られた上記複合語又は上記未知語以外の上記表音文
    字列とを上記第2自然言語の文に翻訳し、上記表音語翻
    訳手段から得られた上記第1の単語列を上記文に挿入す
    ることにより、上記第2の文を生成する翻訳手段とから
    なる自然言語の翻訳装置。
  6. 【請求項6】 上記表音語翻訳手段と上記翻訳手段の間
    に接続され、上記表音語翻訳手段から上記表音文字列を
    受け、上記第1自然言語及び上記第2自然言語以外の言
    語表音語辞書から上記表音文字列に対応する上記第1の
    単語列を検索し、検索により得られた上記第1の単語列
    を上記翻訳手段に供給する他言語表音語翻訳手段を更に
    有する請求項5記載の自然言語の翻訳装置。
  7. 【請求項7】 上記表音語翻訳手段は、上記表音語辞書
    を用いて、上記受けられた表音文字列を上記第2自然言
    語の候補列に変換する手段と、 上記候補列を上記第2自然言語の文法に従って解析する
    文法解析手段と、 上記解析の結果が成功した上記候補列を上記表音文字列
    の上記第2自然言語の訳として出力する手段とを有する
    請求項5又は6記載の自然言語の翻訳装置。
JP8223849A 1996-08-26 1996-08-26 自然言語の翻訳方法及び装置 Pending JPH1063664A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8223849A JPH1063664A (ja) 1996-08-26 1996-08-26 自然言語の翻訳方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8223849A JPH1063664A (ja) 1996-08-26 1996-08-26 自然言語の翻訳方法及び装置

Publications (1)

Publication Number Publication Date
JPH1063664A true JPH1063664A (ja) 1998-03-06

Family

ID=16804688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8223849A Pending JPH1063664A (ja) 1996-08-26 1996-08-26 自然言語の翻訳方法及び装置

Country Status (1)

Country Link
JP (1) JPH1063664A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007193166A (ja) * 2006-01-20 2007-08-02 Kenwood Corp 対話装置、対話方法及びプログラム
JP2021009717A (ja) * 2016-09-22 2021-01-28 セールスフォース ドット コム インコーポレイティッド ポインタセンチネル混合アーキテクチャ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007193166A (ja) * 2006-01-20 2007-08-02 Kenwood Corp 対話装置、対話方法及びプログラム
JP2021009717A (ja) * 2016-09-22 2021-01-28 セールスフォース ドット コム インコーポレイティッド ポインタセンチネル混合アーキテクチャ

Similar Documents

Publication Publication Date Title
US6442524B1 (en) Analyzing inflectional morphology in a spoken language translation system
JP3971373B2 (ja) ルールベース方式と翻訳パターン方式とを混合したハイブリッド自動翻訳装置
JPH0344764A (ja) 機械翻訳装置
JP4476609B2 (ja) 中国語解析装置、中国語解析方法および中国語解析プログラム
JPH1063664A (ja) 自然言語の翻訳方法及び装置
KR940022311A (ko) 기계번역장치 및 방법
Lin et al. A Mandarin to Taiwanese Min Nan Machine Translation System with Speech Synthesis of Taiwanese Min Nan
WO2009139240A1 (ja) 情報処理装置および情報処理方法ならびに記録媒体
KR100204068B1 (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
JP2994539B2 (ja) 機械翻訳装置
JP2947554B2 (ja) 機械翻訳装置
JP2856736B2 (ja) 辞書参照装置及び辞書参照方法
JP2002297585A (ja) 英文名詞句の区分方法,英文構文情報生成方法および装置
JPH01213750A (ja) 機械翻訳用の構文解析におけるサルベージ方法
KR20120105063A (ko) 문장 자질 정보에 기반한 생략 성분 복원 방법 및 이를 위한 장치
JPH04282764A (ja) 非文訳出装置
JP2002197086A (ja) 自然言語変換システム
JPH08278973A (ja) 並列句解析装置および学習データ作成装置
JPH0778166A (ja) 翻訳方法及び機械翻訳装置
WO2000045289A1 (en) A method and apparatus for example-based spoken language translation with examples having grades of specificity
JPH0816910B2 (ja) 言語解析装置
KR19990079824A (ko) 하이픈으로 연결된 복합어 처리에 적합한 형태소 해석장치와 방법 및 그 장치를 구비한 언어 번역장치
Sadigh et al. A rule-based approach to farsi language text-to-phoneme conversion.
JPH0432961A (ja) 自然言語解析装置
JPH02110771A (ja) 電訳機