JPH035882A - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JPH035882A JPH035882A JP1140038A JP14003889A JPH035882A JP H035882 A JPH035882 A JP H035882A JP 1140038 A JP1140038 A JP 1140038A JP 14003889 A JP14003889 A JP 14003889A JP H035882 A JPH035882 A JP H035882A
- Authority
- JP
- Japan
- Prior art keywords
- language
- electronic dictionary
- translation
- concept
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 61
- 230000002596 correlated effect Effects 0.000 abstract 1
- 230000014616 translation Effects 0.000 description 50
- 238000010586 diagram Methods 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241001582325 Raphia frater Species 0.000 description 1
- 241001122767 Theaceae Species 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概要〕
第1言語と第2言語との間で機械翻訳を行う機械翻訳装
置において、前言語間を概念単位でリンクをはった電子
化#書を用いて、第1言語の電子化辞書中の翻訳元の見
出し語の概念に対応する第2言語の電子化辞書から該当
する概念を持つ見出し語をリンクを辿って取り出し、訳
文を生成するようにしている。
置において、前言語間を概念単位でリンクをはった電子
化#書を用いて、第1言語の電子化辞書中の翻訳元の見
出し語の概念に対応する第2言語の電子化辞書から該当
する概念を持つ見出し語をリンクを辿って取り出し、訳
文を生成するようにしている。
例えば日本語は「兄」、「第」を年長、年少の概念で区
別する。しかし、英語の“brother”には、この
区別ばない。従って、日本語の「兄」に対して”eld
er brother r第」に対して’youn
ger brother”を訳語として翻訳しな(、こ
れら両者について上位の概念であるbrother″を
訳語として出力するようにしている。
別する。しかし、英語の“brother”には、この
区別ばない。従って、日本語の「兄」に対して”eld
er brother r第」に対して’youn
ger brother”を訳語として翻訳しな(、こ
れら両者について上位の概念であるbrother″を
訳語として出力するようにしている。
本発明は、第1言語と第2言語との間に概念単位でリン
クを持たせて翻訳を行う機械翻訳装置に関するものであ
る。
クを持たせて翻訳を行う機械翻訳装置に関するものであ
る。
従来、コンピュータを利用して翻訳を行う種々の機械翻
訳装置が提案されている。一般に機械翻訳装置は、第1
言語を形態素解析して単語に分割し、更に構文解析など
によって語(単語)または句(文節)からなる所定の処
理単位に区分する。
訳装置が提案されている。一般に機械翻訳装置は、第1
言語を形態素解析して単語に分割し、更に構文解析など
によって語(単語)または句(文節)からなる所定の処
理単位に区分する。
この区分した処理単位毎に辞書を検索して対応する訳語
または訳語句を見い出し、これらを所定の訳文規則に従
って結合することにより、第2言語に翻訳するようにし
ていた。
または訳語句を見い出し、これらを所定の訳文規則に従
って結合することにより、第2言語に翻訳するようにし
ていた。
従来の機械翻訳装置は、第11語の単語の持つ概念の区
分規定をそのまま保持して第2言語の訳語(単語)を選
択するため、ぎこちない不適切な翻訳結果しか得られな
いという問題があった0例えば (1)私には、兄と第がいます。
分規定をそのまま保持して第2言語の訳語(単語)を選
択するため、ぎこちない不適切な翻訳結果しか得られな
いという問題があった0例えば (1)私には、兄と第がいます。
という日本語(第1言語)を、英語(第2言語)に翻訳
する場合、日本語には兄、第の概念の区別があるため、
これらの概念の区分規定をそのまま保持して英語の”e
lder brother youBer br。
する場合、日本語には兄、第の概念の区別があるため、
これらの概念の区分規定をそのまま保持して英語の”e
lder brother youBer br。
ther’″という単語を選択し、
f21 r have an elder brot
her and a youngerbrother。
her and a youngerbrother。
という翻訳結果を得ていた。
本発明は、第1言語と第2言語との間で概念単位でリン
クすることによって関連をつけた第1言語電子化辞書お
よび第2言語電子化辞言を予め作成しておき、翻訳時に
リンクを辿って概念単位で適切な訳語を取り出し、翻訳
精度を高めることを目的としている0例えば上記(I)
の日本語に対応する英語の訳文として、 (3) I have two t+rothers
。
クすることによって関連をつけた第1言語電子化辞書お
よび第2言語電子化辞言を予め作成しておき、翻訳時に
リンクを辿って概念単位で適切な訳語を取り出し、翻訳
精度を高めることを目的としている0例えば上記(I)
の日本語に対応する英語の訳文として、 (3) I have two t+rothers
。
の生成を可能にすることを目的としている。
第1図を参照して課題を解決する手段を説明する。
第1図において、第1言語電子化辞書3−1および第2
言語電子化辞書3−2は、ユニークな単語見出し番号に
対応づけて、見出し語、この見出し語の概念見出し、訳
語区分、および概念単位で相手言語の見出し番号をポイ
ントする訳語リンクを予め登録して作成した辞書である
。
言語電子化辞書3−2は、ユニークな単語見出し番号に
対応づけて、見出し語、この見出し語の概念見出し、訳
語区分、および概念単位で相手言語の見出し番号をポイ
ントする訳語リンクを予め登録して作成した辞書である
。
本発明は、第1図に示すように、翻訳元の第1言語電子
化辞書3−1 (あるいは第2言語電子化辞書3−2)
の見出し語の概念見出しに対する訳語リンクから取り出
した相手言語の見出し番号をもとに、翻訳元の第2言語
電子化辞書3−2(あるいは第1言語電子化辞書3−1
)から見出し語を取り出し、訳文を生成するようにして
いる。
化辞書3−1 (あるいは第2言語電子化辞書3−2)
の見出し語の概念見出しに対する訳語リンクから取り出
した相手言語の見出し番号をもとに、翻訳元の第2言語
電子化辞書3−2(あるいは第1言語電子化辞書3−1
)から見出し語を取り出し、訳文を生成するようにして
いる。
従って、翻訳時に第1言語電子化辞書3−1および第2
言語電子化辞書3−2の間でリンクを辿って概念単位で
相手言語の概念世界に沿った適切な訳語を取り出すこと
が可能となり、翻訳精度を高めることができる。
言語電子化辞書3−2の間でリンクを辿って概念単位で
相手言語の概念世界に沿った適切な訳語を取り出すこと
が可能となり、翻訳精度を高めることができる。
次に、第1図から第5図を用いて本発明の1実施例の構
成および動作を順次詳細に説明する。以下日本語と英語
との間の翻訳について説明する。
成および動作を順次詳細に説明する。以下日本語と英語
との間の翻訳について説明する。
第1図において、入力部1は、キーボードなどであって
、翻訳元の原文などを入力するものである。
、翻訳元の原文などを入力するものである。
原文記憶部2ば、入力部1から入力された翻訳元の原文
を記憶したり、あるいはこの入力部1から指示された図
示外の入力原文ファイルから取り出した翻訳元の原文を
記憶するものである。
を記憶したり、あるいはこの入力部1から指示された図
示外の入力原文ファイルから取り出した翻訳元の原文を
記憶するものである。
電子化辞書3は、第1言語電子化辞書3−1および第2
言語電子化辞書3−2から構成され、文の構文構造を把
握するための手掛りとなる文法的特性を定義し、その単
語で表現し得る概念を定義する単語辞書3aと、概念間
の関係を定義する概念辞書3bと、解析・生成などの翻
訳処理を手続き的に定義する文法辞書3Cなどから構成
されている。本実施例は、第2図および第5図に示すよ
うに、見出し番号、見出し語、概念見出し、訳語区分、
訳語などを1つのレコードとし、複数のものを格納する
ようにしている。
言語電子化辞書3−2から構成され、文の構文構造を把
握するための手掛りとなる文法的特性を定義し、その単
語で表現し得る概念を定義する単語辞書3aと、概念間
の関係を定義する概念辞書3bと、解析・生成などの翻
訳処理を手続き的に定義する文法辞書3Cなどから構成
されている。本実施例は、第2図および第5図に示すよ
うに、見出し番号、見出し語、概念見出し、訳語区分、
訳語などを1つのレコードとし、複数のものを格納する
ようにしている。
翻訳処理部4は、電子化辞書3を参照して人力原文であ
る例えば日本語を英語に翻訳するものである。
る例えば日本語を英語に翻訳するものである。
訳文記憶部5ば、翻訳処理部4で8M訳された英語など
の訳文を記憶するものである。
の訳文を記憶するものである。
表示制御部6ば、原文および訳文などを表示部(デイス
プレィなど)7に表示するものである。
プレィなど)7に表示するものである。
印刷部8ば、原文および訳文などを印刷するものである
。
。
jJl集制御部9ば、全体を制御するものである。
第2図は、本発明に係わる電子化辞書例(同義、上位例
)を示す、第2図(イ)は日本語の第1言語電子化辞書
例を示し、第2図(ロ)は英語の第2言語電子化辞書例
を示す。
)を示す、第2図(イ)は日本語の第1言語電子化辞書
例を示し、第2図(ロ)は英語の第2言語電子化辞書例
を示す。
第2図(イ)、(ロ)において、見出し番号は、ユニー
クな番号であって、該当する見出し語を検索するために
付与された番号である。
クな番号であって、該当する見出し語を検索するために
付与された番号である。
見出し語は、電子化辞書に格納する語(句)である。
概念見出しは、見出し語で表現し得る概念を定義したも
のである0例えば見出し語「兄第」の概念見出しは、「
親が同じ間からの人」という概念を予め登録したもので
ある。
のである0例えば見出し語「兄第」の概念見出しは、「
親が同じ間からの人」という概念を予め登録したもので
ある。
訳語区分は、同義、上位、下位、類義の4つがあり、第
1言語の概念見出しの表す意味と、訳語(第2言語)の
概念見出しの表す意味との関係を示す。
1言語の概念見出しの表す意味と、訳語(第2言語)の
概念見出しの表す意味との関係を示す。
(1)同mば、第1言語の概念見出しく例えば見出し語
「兄第」の概念見出し「親が同じ間からの人」)の表す
意味が、対応する訳語(例えば訳語′″EOO100’
のリンクを辿って第2言語電子化辞書の見出し番号“E
OOloo”の見出し語″brother″)を用いて
そのまま表すことができる場合である。tlltすれば
、概念見出しに対応する見出し語(91えば「兄第」)
がその訳語(例えば“brother”)を用いて、意
味を限定する他の語を用いず、しかも意味の拡張なしに
翻訳できる場合である。この例として他に、 犬/犬という動物/同義/dog がある。
「兄第」の概念見出し「親が同じ間からの人」)の表す
意味が、対応する訳語(例えば訳語′″EOO100’
のリンクを辿って第2言語電子化辞書の見出し番号“E
OOloo”の見出し語″brother″)を用いて
そのまま表すことができる場合である。tlltすれば
、概念見出しに対応する見出し語(91えば「兄第」)
がその訳語(例えば“brother”)を用いて、意
味を限定する他の語を用いず、しかも意味の拡張なしに
翻訳できる場合である。この例として他に、 犬/犬という動物/同義/dog がある。
(2)上位は、第1言語の概念見出しの表す意味より、
その訳語のもつ概念見出しの意味の方が広い場合である
。換言すれば、概念見出しに対応する見出し語が、その
訳語のもつ意味を限定して翻訳できる場合である。この
例として、 薄い/液体の濃度が薄い/上位/ weak (tea
)がある。
その訳語のもつ概念見出しの意味の方が広い場合である
。換言すれば、概念見出しに対応する見出し語が、その
訳語のもつ意味を限定して翻訳できる場合である。この
例として、 薄い/液体の濃度が薄い/上位/ weak (tea
)がある。
(3)下位ば、第1言語の概念見出しの表す意味の方が
、その訳語のもつ概念見出しの意味よりも広い場合であ
る。換言すれば、概念見出しに対応する見出し語が、そ
の訳語を用いて特定の場面で翻訳できる場合である。こ
の例として、27年上の男きょうだい/下位/ (el
der) brothがある。
、その訳語のもつ概念見出しの意味よりも広い場合であ
る。換言すれば、概念見出しに対応する見出し語が、そ
の訳語を用いて特定の場面で翻訳できる場合である。こ
の例として、27年上の男きょうだい/下位/ (el
der) brothがある。
+41 @義は、上位および下位が複合された場合で
あって、第1j語の概念見出しの表す意味と、その訳語
(第2言語)のもつ概念見出しの意味とがずれている場
合である。この例として、第5図のものがある。
あって、第1j語の概念見出しの表す意味と、その訳語
(第2言語)のもつ概念見出しの意味とがずれている場
合である。この例として、第5図のものがある。
次に、第3図フローチャートに示すステップの1@序に
従い、第2図電子化辞書例を用いて本発明の1実施例の
構成の動作を具体的に説明する。
従い、第2図電子化辞書例を用いて本発明の1実施例の
構成の動作を具体的に説明する。
第3図において、ステップ51は、見出しの同定を行う
、これは、翻訳の対象とする原文の単語例えば「兄」を
同定し、第2図(イ)第1言語電子化詮書を検索して見
出し番号JOO200の見出し語「兄」を見つけ出す。
、これは、翻訳の対象とする原文の単語例えば「兄」を
同定し、第2図(イ)第1言語電子化詮書を検索して見
出し番号JOO200の見出し語「兄」を見つけ出す。
ステップ52ば、ステップ51で見つけた見出し語の概
念見出しの数が1以上か否かを調べる。
念見出しの数が1以上か否かを調べる。
ここでは、「兄」の概念見出しの数が1であるので、ス
テップ53で当該m念見出しを同定し、ステ、ブ54を
行う。
テップ53で当該m念見出しを同定し、ステ、ブ54を
行う。
ステップ54は、訳語区分が本例では「上位」であり、
このときの訳語リンク“EOOloo”を辿り、ステッ
プ55を行う。
このときの訳語リンク“EOOloo”を辿り、ステッ
プ55を行う。
ステップ55は、見出し語の同定、即ち第2図(ロ)第
2言語電子化辞書の見出し番号EOO100の見出し語
“bro ther”を取り出す。
2言語電子化辞書の見出し番号EOO100の見出し語
“bro ther”を取り出す。
以上の処理によって、日本語の第1言語電子化辞凹の見
出し語「兄」−概念見出し一上位一訳語リンク“EOO
loo”−第2言語電子化辞書の見出し番号EOOI0
0の見出し語″brother’を取り出すようにして
いる。同様に、「第」についても、第2言語電子化辞書
の見出し番号1ootooの見出し語“brother
“を取り出す。このようにして取り出した英語の見出し
語および文法情報を用いて、第4図(11「私は兄と第
がいます、」を第4図(2)“T havetwo b
rothers、“に翻訳することが可能となる。
出し語「兄」−概念見出し一上位一訳語リンク“EOO
loo”−第2言語電子化辞書の見出し番号EOOI0
0の見出し語″brother’を取り出すようにして
いる。同様に、「第」についても、第2言語電子化辞書
の見出し番号1ootooの見出し語“brother
“を取り出す。このようにして取り出した英語の見出し
語および文法情報を用いて、第4図(11「私は兄と第
がいます、」を第4図(2)“T havetwo b
rothers、“に翻訳することが可能となる。
第5図は、本発明に係わる電子化辞書例(類義例〉を示
す。
す。
第5図(イ)において、見出し語rものほしざお」の概
念見出し「洗濯物を干す棒」の訳語区分は「類義」とな
る。これの訳語リンク“EOO200″を辿って第5図
(ロ)の見出し番号!!00200の見出し語″clo
thes−t ins″を得ることができる。同様に、
見出し語「ものほしひも」の概念見出し「洗濯物を干す
ひも」の訳語区分は「同義」となる、これの訳語リンク
W″EOO200”を辿って第5図(ロ)の見出し番号
EOO200の見出し語”clothes−1ine’
を得ることができる。また、英語の第2言語電子化辞書
の見出し語’clothes−1ine”の概念見出し
の訳語区分は′同義”であって、訳語リンク“JOO5
00″を辿って、日本語の第1言語電子化辞書の見出し
語「ものほしひも」を得る。このように言語間の概念が
ずれていても、類義という訳語区分によって相手言語の
世界の該当する訳文を探すことが可能となる。
念見出し「洗濯物を干す棒」の訳語区分は「類義」とな
る。これの訳語リンク“EOO200″を辿って第5図
(ロ)の見出し番号!!00200の見出し語″clo
thes−t ins″を得ることができる。同様に、
見出し語「ものほしひも」の概念見出し「洗濯物を干す
ひも」の訳語区分は「同義」となる、これの訳語リンク
W″EOO200”を辿って第5図(ロ)の見出し番号
EOO200の見出し語”clothes−1ine’
を得ることができる。また、英語の第2言語電子化辞書
の見出し語’clothes−1ine”の概念見出し
の訳語区分は′同義”であって、訳語リンク“JOO5
00″を辿って、日本語の第1言語電子化辞書の見出し
語「ものほしひも」を得る。このように言語間の概念が
ずれていても、類義という訳語区分によって相手言語の
世界の該当する訳文を探すことが可能となる。
以上説明したように、本発明によれば、翻訳時に第1言
語電子化辞書3−1および第2言語電子化詐書3−2の
間でリンクを辿って概念単位で相手言語の概念世界に沿
った訳語を取り出し得る構成を採用しているため、言語
間の概念が異なっていても適切な訳語を取り出し、翻訳
精度を高めることができる。特に、翻訳先の言語に同義
(概念が同じ)の見出し語(訳語)がない場合であって
も、上位概念、類義概念などの見出し語を取り出すこと
ができ、綜訳精度を著しく高めることができる。
語電子化辞書3−1および第2言語電子化詐書3−2の
間でリンクを辿って概念単位で相手言語の概念世界に沿
った訳語を取り出し得る構成を採用しているため、言語
間の概念が異なっていても適切な訳語を取り出し、翻訳
精度を高めることができる。特に、翻訳先の言語に同義
(概念が同じ)の見出し語(訳語)がない場合であって
も、上位概念、類義概念などの見出し語を取り出すこと
ができ、綜訳精度を著しく高めることができる。
第1図は本発明の1実施例構成図、第2図、第5図は本
発明に係わる電子化辞書例、第3図は本発明の動作説明
フローチャート、第4図は本発明に係わる訳文例を示す
。 図中、3は電子化辞書、3−1は第1言語電子化辞書、
3−2は第2言語電子化辞書、4は翻訳処理部を表す。 本発明の1実施例構成図 第 1 図
発明に係わる電子化辞書例、第3図は本発明の動作説明
フローチャート、第4図は本発明に係わる訳文例を示す
。 図中、3は電子化辞書、3−1は第1言語電子化辞書、
3−2は第2言語電子化辞書、4は翻訳処理部を表す。 本発明の1実施例構成図 第 1 図
Claims (1)
- 第1言語と第2言語との間に概念単位でリンクを持たせ
て翻訳を行う機械翻訳装置において、ユニークな単語見
出し番号に対応づけて、見出し語、この見出し語の概念
見出し、訳語区分、および概念単位で相手言語の見出し
番号をポイントする訳語リンクを登録する第1言語電子
化辞書(3−1)および第2言語電子化辞書(3−2)
)を備え、翻訳元の第1言語電子化辞書(3−1)(あ
るいは第2言語電子化辞書(3−2))の見出し語の概
念見出しに対応する訳語リンクから取り出した相手言語
の見出し番号をもとに、翻訳先の第2言語電子化辞書(
3−2)(あるいは第1言語電子化辞書(3−1))か
ら見出し語を取り出し、訳文を生成するように構成した
ことを特徴とする機械翻訳装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1140038A JPH035882A (ja) | 1989-06-01 | 1989-06-01 | 機械翻訳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1140038A JPH035882A (ja) | 1989-06-01 | 1989-06-01 | 機械翻訳装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH035882A true JPH035882A (ja) | 1991-01-11 |
Family
ID=15259520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1140038A Pending JPH035882A (ja) | 1989-06-01 | 1989-06-01 | 機械翻訳装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH035882A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6834523B2 (en) | 2002-03-28 | 2004-12-28 | Kabushiki Kaisha Kobe Seiko Sho | Method for producing seamless tube with grooved inner surface |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6162975A (ja) * | 1984-09-05 | 1986-03-31 | Fujitsu Ltd | 辞書索引処理装置 |
-
1989
- 1989-06-01 JP JP1140038A patent/JPH035882A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6162975A (ja) * | 1984-09-05 | 1986-03-31 | Fujitsu Ltd | 辞書索引処理装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6834523B2 (en) | 2002-03-28 | 2004-12-28 | Kabushiki Kaisha Kobe Seiko Sho | Method for producing seamless tube with grooved inner surface |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Elhadad et al. | Sentence alignment for monolingual comparable corpora | |
KR101130444B1 (ko) | 기계번역기법을 이용한 유사문장 식별 시스템 | |
KR20160060253A (ko) | 자연어 질의 응답 시스템 및 방법 | |
JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
JP2004118740A (ja) | 質問応答システム、質問応答方法、質問応答プログラム | |
JPH05314166A (ja) | 電子化辞書および辞書検索装置 | |
Abolhassani et al. | Information extraction and automatic markup for XML documents | |
JPH035882A (ja) | 機械翻訳装置 | |
JP2003323425A (ja) | 対訳辞書作成装置、翻訳装置、対訳辞書作成プログラム、および翻訳プログラム | |
JP2005025659A (ja) | ゼロ代名詞解消方法、解消装置、解消プログラムおよびプログラムを記録した記録媒体 | |
Malema et al. | Parts of speech tagging: A Setswana relative | |
Jaruskulchai | An automatic indexing for Thai text retrieval | |
Chalabi | MT-based transparent Arabization of the internet TARJIM. COM | |
Galicia-Haro | Using electronic texts for an annotated corpus building | |
JP5633844B2 (ja) | 言い換え関係集合取得装置、言い換え関係集合取得方法、及びプログラム | |
Lee et al. | Interlingua-based broad-coverage Korean-to-English translation in CCLINC | |
JP2521435B2 (ja) | 日本語生成装置 | |
Liu et al. | Fast-syntax-matching-based Japanese-Chinese limited machine translation | |
JPH0561902A (ja) | 機械翻訳システム | |
JP3906820B2 (ja) | 翻訳支援装置および翻訳支援プログラム | |
Klang et al. | Overview of the Ugglan entity discovery and linking system | |
JP2003308319A (ja) | 訳語選択装置、翻訳装置、訳語選択プログラム、及び翻訳プログラム | |
Chancharoen et al. | Pattern-based machine translation for English-Thai | |
JPS63109572A (ja) | 派生語処理方式 | |
Estigarribia | Automatic detection of syntactic patterns from texts with application to Spanish clitic doubling |