JPH035882A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH035882A
JPH035882A JP1140038A JP14003889A JPH035882A JP H035882 A JPH035882 A JP H035882A JP 1140038 A JP1140038 A JP 1140038A JP 14003889 A JP14003889 A JP 14003889A JP H035882 A JPH035882 A JP H035882A
Authority
JP
Japan
Prior art keywords
language
electronic dictionary
translation
concept
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1140038A
Other languages
English (en)
Inventor
Hisahiro Adachi
安達 久博
Akira Kumano
明 熊野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NIPPON DENSHIKA JISHO KENKYUSHO KK
Original Assignee
NIPPON DENSHIKA JISHO KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NIPPON DENSHIKA JISHO KENKYUSHO KK filed Critical NIPPON DENSHIKA JISHO KENKYUSHO KK
Priority to JP1140038A priority Critical patent/JPH035882A/ja
Publication of JPH035882A publication Critical patent/JPH035882A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 第1言語と第2言語との間で機械翻訳を行う機械翻訳装
置において、前言語間を概念単位でリンクをはった電子
化#書を用いて、第1言語の電子化辞書中の翻訳元の見
出し語の概念に対応する第2言語の電子化辞書から該当
する概念を持つ見出し語をリンクを辿って取り出し、訳
文を生成するようにしている。
例えば日本語は「兄」、「第」を年長、年少の概念で区
別する。しかし、英語の“brother”には、この
区別ばない。従って、日本語の「兄」に対して”eld
er brother   r第」に対して’youn
ger brother”を訳語として翻訳しな(、こ
れら両者について上位の概念であるbrother″を
訳語として出力するようにしている。
〔産業上の利用分野〕
本発明は、第1言語と第2言語との間に概念単位でリン
クを持たせて翻訳を行う機械翻訳装置に関するものであ
る。
〔従来の技術〕
従来、コンピュータを利用して翻訳を行う種々の機械翻
訳装置が提案されている。一般に機械翻訳装置は、第1
言語を形態素解析して単語に分割し、更に構文解析など
によって語(単語)または句(文節)からなる所定の処
理単位に区分する。
この区分した処理単位毎に辞書を検索して対応する訳語
または訳語句を見い出し、これらを所定の訳文規則に従
って結合することにより、第2言語に翻訳するようにし
ていた。
〔発明が解決しようとする課題〕
従来の機械翻訳装置は、第11語の単語の持つ概念の区
分規定をそのまま保持して第2言語の訳語(単語)を選
択するため、ぎこちない不適切な翻訳結果しか得られな
いという問題があった0例えば (1)私には、兄と第がいます。
という日本語(第1言語)を、英語(第2言語)に翻訳
する場合、日本語には兄、第の概念の区別があるため、
これらの概念の区分規定をそのまま保持して英語の”e
lder brother   youBer br。
ther’″という単語を選択し、 f21  r have an elder brot
her and a youngerbrother。
という翻訳結果を得ていた。
本発明は、第1言語と第2言語との間で概念単位でリン
クすることによって関連をつけた第1言語電子化辞書お
よび第2言語電子化辞言を予め作成しておき、翻訳時に
リンクを辿って概念単位で適切な訳語を取り出し、翻訳
精度を高めることを目的としている0例えば上記(I)
の日本語に対応する英語の訳文として、 (3)  I have two t+rothers
の生成を可能にすることを目的としている。
〔課首を解決する手段〕
第1図を参照して課題を解決する手段を説明する。
第1図において、第1言語電子化辞書3−1および第2
言語電子化辞書3−2は、ユニークな単語見出し番号に
対応づけて、見出し語、この見出し語の概念見出し、訳
語区分、および概念単位で相手言語の見出し番号をポイ
ントする訳語リンクを予め登録して作成した辞書である
〔牛用〕
本発明は、第1図に示すように、翻訳元の第1言語電子
化辞書3−1 (あるいは第2言語電子化辞書3−2)
の見出し語の概念見出しに対する訳語リンクから取り出
した相手言語の見出し番号をもとに、翻訳元の第2言語
電子化辞書3−2(あるいは第1言語電子化辞書3−1
)から見出し語を取り出し、訳文を生成するようにして
いる。
従って、翻訳時に第1言語電子化辞書3−1および第2
言語電子化辞書3−2の間でリンクを辿って概念単位で
相手言語の概念世界に沿った適切な訳語を取り出すこと
が可能となり、翻訳精度を高めることができる。
〔実施例〕
次に、第1図から第5図を用いて本発明の1実施例の構
成および動作を順次詳細に説明する。以下日本語と英語
との間の翻訳について説明する。
第1図において、入力部1は、キーボードなどであって
、翻訳元の原文などを入力するものである。
原文記憶部2ば、入力部1から入力された翻訳元の原文
を記憶したり、あるいはこの入力部1から指示された図
示外の入力原文ファイルから取り出した翻訳元の原文を
記憶するものである。
電子化辞書3は、第1言語電子化辞書3−1および第2
言語電子化辞書3−2から構成され、文の構文構造を把
握するための手掛りとなる文法的特性を定義し、その単
語で表現し得る概念を定義する単語辞書3aと、概念間
の関係を定義する概念辞書3bと、解析・生成などの翻
訳処理を手続き的に定義する文法辞書3Cなどから構成
されている。本実施例は、第2図および第5図に示すよ
うに、見出し番号、見出し語、概念見出し、訳語区分、
訳語などを1つのレコードとし、複数のものを格納する
ようにしている。
翻訳処理部4は、電子化辞書3を参照して人力原文であ
る例えば日本語を英語に翻訳するものである。
訳文記憶部5ば、翻訳処理部4で8M訳された英語など
の訳文を記憶するものである。
表示制御部6ば、原文および訳文などを表示部(デイス
プレィなど)7に表示するものである。
印刷部8ば、原文および訳文などを印刷するものである
jJl集制御部9ば、全体を制御するものである。
第2図は、本発明に係わる電子化辞書例(同義、上位例
)を示す、第2図(イ)は日本語の第1言語電子化辞書
例を示し、第2図(ロ)は英語の第2言語電子化辞書例
を示す。
第2図(イ)、(ロ)において、見出し番号は、ユニー
クな番号であって、該当する見出し語を検索するために
付与された番号である。
見出し語は、電子化辞書に格納する語(句)である。
概念見出しは、見出し語で表現し得る概念を定義したも
のである0例えば見出し語「兄第」の概念見出しは、「
親が同じ間からの人」という概念を予め登録したもので
ある。
訳語区分は、同義、上位、下位、類義の4つがあり、第
1言語の概念見出しの表す意味と、訳語(第2言語)の
概念見出しの表す意味との関係を示す。
(1)同mば、第1言語の概念見出しく例えば見出し語
「兄第」の概念見出し「親が同じ間からの人」)の表す
意味が、対応する訳語(例えば訳語′″EOO100’
のリンクを辿って第2言語電子化辞書の見出し番号“E
OOloo”の見出し語″brother″)を用いて
そのまま表すことができる場合である。tlltすれば
、概念見出しに対応する見出し語(91えば「兄第」)
がその訳語(例えば“brother”)を用いて、意
味を限定する他の語を用いず、しかも意味の拡張なしに
翻訳できる場合である。この例として他に、 犬/犬という動物/同義/dog がある。
(2)上位は、第1言語の概念見出しの表す意味より、
その訳語のもつ概念見出しの意味の方が広い場合である
。換言すれば、概念見出しに対応する見出し語が、その
訳語のもつ意味を限定して翻訳できる場合である。この
例として、 薄い/液体の濃度が薄い/上位/ weak (tea
)がある。
(3)下位ば、第1言語の概念見出しの表す意味の方が
、その訳語のもつ概念見出しの意味よりも広い場合であ
る。換言すれば、概念見出しに対応する見出し語が、そ
の訳語を用いて特定の場面で翻訳できる場合である。こ
の例として、27年上の男きょうだい/下位/ (el
der) brothがある。
+41  @義は、上位および下位が複合された場合で
あって、第1j語の概念見出しの表す意味と、その訳語
(第2言語)のもつ概念見出しの意味とがずれている場
合である。この例として、第5図のものがある。
次に、第3図フローチャートに示すステップの1@序に
従い、第2図電子化辞書例を用いて本発明の1実施例の
構成の動作を具体的に説明する。
第3図において、ステップ51は、見出しの同定を行う
、これは、翻訳の対象とする原文の単語例えば「兄」を
同定し、第2図(イ)第1言語電子化詮書を検索して見
出し番号JOO200の見出し語「兄」を見つけ出す。
ステップ52ば、ステップ51で見つけた見出し語の概
念見出しの数が1以上か否かを調べる。
ここでは、「兄」の概念見出しの数が1であるので、ス
テップ53で当該m念見出しを同定し、ステ、ブ54を
行う。
ステップ54は、訳語区分が本例では「上位」であり、
このときの訳語リンク“EOOloo”を辿り、ステッ
プ55を行う。
ステップ55は、見出し語の同定、即ち第2図(ロ)第
2言語電子化辞書の見出し番号EOO100の見出し語
“bro ther”を取り出す。
以上の処理によって、日本語の第1言語電子化辞凹の見
出し語「兄」−概念見出し一上位一訳語リンク“EOO
loo”−第2言語電子化辞書の見出し番号EOOI0
0の見出し語″brother’を取り出すようにして
いる。同様に、「第」についても、第2言語電子化辞書
の見出し番号1ootooの見出し語“brother
“を取り出す。このようにして取り出した英語の見出し
語および文法情報を用いて、第4図(11「私は兄と第
がいます、」を第4図(2)“T havetwo b
rothers、“に翻訳することが可能となる。
第5図は、本発明に係わる電子化辞書例(類義例〉を示
す。
第5図(イ)において、見出し語rものほしざお」の概
念見出し「洗濯物を干す棒」の訳語区分は「類義」とな
る。これの訳語リンク“EOO200″を辿って第5図
(ロ)の見出し番号!!00200の見出し語″clo
thes−t ins″を得ることができる。同様に、
見出し語「ものほしひも」の概念見出し「洗濯物を干す
ひも」の訳語区分は「同義」となる、これの訳語リンク
W″EOO200”を辿って第5図(ロ)の見出し番号
EOO200の見出し語”clothes−1ine’
を得ることができる。また、英語の第2言語電子化辞書
の見出し語’clothes−1ine”の概念見出し
の訳語区分は′同義”であって、訳語リンク“JOO5
00″を辿って、日本語の第1言語電子化辞書の見出し
語「ものほしひも」を得る。このように言語間の概念が
ずれていても、類義という訳語区分によって相手言語の
世界の該当する訳文を探すことが可能となる。
〔発明の効果〕
以上説明したように、本発明によれば、翻訳時に第1言
語電子化辞書3−1および第2言語電子化詐書3−2の
間でリンクを辿って概念単位で相手言語の概念世界に沿
った訳語を取り出し得る構成を採用しているため、言語
間の概念が異なっていても適切な訳語を取り出し、翻訳
精度を高めることができる。特に、翻訳先の言語に同義
(概念が同じ)の見出し語(訳語)がない場合であって
も、上位概念、類義概念などの見出し語を取り出すこと
ができ、綜訳精度を著しく高めることができる。
【図面の簡単な説明】
第1図は本発明の1実施例構成図、第2図、第5図は本
発明に係わる電子化辞書例、第3図は本発明の動作説明
フローチャート、第4図は本発明に係わる訳文例を示す
。 図中、3は電子化辞書、3−1は第1言語電子化辞書、
3−2は第2言語電子化辞書、4は翻訳処理部を表す。 本発明の1実施例構成図 第  1   図

Claims (1)

    【特許請求の範囲】
  1. 第1言語と第2言語との間に概念単位でリンクを持たせ
    て翻訳を行う機械翻訳装置において、ユニークな単語見
    出し番号に対応づけて、見出し語、この見出し語の概念
    見出し、訳語区分、および概念単位で相手言語の見出し
    番号をポイントする訳語リンクを登録する第1言語電子
    化辞書(3−1)および第2言語電子化辞書(3−2)
    )を備え、翻訳元の第1言語電子化辞書(3−1)(あ
    るいは第2言語電子化辞書(3−2))の見出し語の概
    念見出しに対応する訳語リンクから取り出した相手言語
    の見出し番号をもとに、翻訳先の第2言語電子化辞書(
    3−2)(あるいは第1言語電子化辞書(3−1))か
    ら見出し語を取り出し、訳文を生成するように構成した
    ことを特徴とする機械翻訳装置。
JP1140038A 1989-06-01 1989-06-01 機械翻訳装置 Pending JPH035882A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1140038A JPH035882A (ja) 1989-06-01 1989-06-01 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1140038A JPH035882A (ja) 1989-06-01 1989-06-01 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH035882A true JPH035882A (ja) 1991-01-11

Family

ID=15259520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1140038A Pending JPH035882A (ja) 1989-06-01 1989-06-01 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH035882A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6834523B2 (en) 2002-03-28 2004-12-28 Kabushiki Kaisha Kobe Seiko Sho Method for producing seamless tube with grooved inner surface

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6162975A (ja) * 1984-09-05 1986-03-31 Fujitsu Ltd 辞書索引処理装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6162975A (ja) * 1984-09-05 1986-03-31 Fujitsu Ltd 辞書索引処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6834523B2 (en) 2002-03-28 2004-12-28 Kabushiki Kaisha Kobe Seiko Sho Method for producing seamless tube with grooved inner surface

Similar Documents

Publication Publication Date Title
Elhadad et al. Sentence alignment for monolingual comparable corpora
KR101130444B1 (ko) 기계번역기법을 이용한 유사문장 식별 시스템
KR20160060253A (ko) 자연어 질의 응답 시스템 및 방법
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
JP2004118740A (ja) 質問応答システム、質問応答方法、質問応答プログラム
JPH05314166A (ja) 電子化辞書および辞書検索装置
Abolhassani et al. Information extraction and automatic markup for XML documents
JPH035882A (ja) 機械翻訳装置
JP2003323425A (ja) 対訳辞書作成装置、翻訳装置、対訳辞書作成プログラム、および翻訳プログラム
JP2005025659A (ja) ゼロ代名詞解消方法、解消装置、解消プログラムおよびプログラムを記録した記録媒体
Malema et al. Parts of speech tagging: A Setswana relative
Jaruskulchai An automatic indexing for Thai text retrieval
Chalabi MT-based transparent Arabization of the internet TARJIM. COM
Galicia-Haro Using electronic texts for an annotated corpus building
JP5633844B2 (ja) 言い換え関係集合取得装置、言い換え関係集合取得方法、及びプログラム
Lee et al. Interlingua-based broad-coverage Korean-to-English translation in CCLINC
JP2521435B2 (ja) 日本語生成装置
Liu et al. Fast-syntax-matching-based Japanese-Chinese limited machine translation
JPH0561902A (ja) 機械翻訳システム
JP3906820B2 (ja) 翻訳支援装置および翻訳支援プログラム
Klang et al. Overview of the Ugglan entity discovery and linking system
JP2003308319A (ja) 訳語選択装置、翻訳装置、訳語選択プログラム、及び翻訳プログラム
Chancharoen et al. Pattern-based machine translation for English-Thai
JPS63109572A (ja) 派生語処理方式
Estigarribia Automatic detection of syntactic patterns from texts with application to Spanish clitic doubling