JPS635470A - 翻訳学習方式 - Google Patents

翻訳学習方式

Info

Publication number
JPS635470A
JPS635470A JP61150379A JP15037986A JPS635470A JP S635470 A JPS635470 A JP S635470A JP 61150379 A JP61150379 A JP 61150379A JP 15037986 A JP15037986 A JP 15037986A JP S635470 A JPS635470 A JP S635470A
Authority
JP
Japan
Prior art keywords
translation
data
bilingual
expression
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61150379A
Other languages
English (en)
Inventor
Kazushi Muraki
一至 村木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61150379A priority Critical patent/JPS635470A/ja
Publication of JPS635470A publication Critical patent/JPS635470A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔座業上の利用分野〕 本発明は翻訳学習方式、特に対訳辞書を自動生成する翻
訳学習方式に関する。
〔従来の技術〕
従来翻訳システムのMW能化に対して辞書を改良する場
合には全て人の手によって任されてきた。
その時辞書の項目数を増加する方針としては、高頻度に
出現する長単位の表現を膨大に拾い出しそれの対訳を人
手によって付加し登録するというものであった。
ところが、その膨大な登録項目にたいして訳を付加する
には複数作業者の共同作業が必要でなかなか均質な対訳
を付けることが出来なかった。
例えば、以下の2つの表現は 超高速計算機装置 ultra high speed
computer、・・・・・・・・・高速計算機装置
  high 5peed computersyst
em、・・・・・・・・・・・・全く同じ部分語列を持
っているにもがかわらず、その対応する語列に対する対
訳が均一になる保証を付けることが困難であった。これ
ら二つが、同−文章の中で出現する時入力文の情報、す
なわち同じ事を言いたいという筆者の意図を正確に伝え
られないことが起こり得るという欠点がある。
〔発明が解決しようとする問題点〕
本発明が解決しようとする問題点、換言すれば本発明の
目的は入力表現と出力表現の対応する部分を自動的に抽
出して表現間の対訳関係を自動的に翻訳辞書に追加登録
することによって上記の欠点を改善した翻訳学習方式を
提供することにある。
〔問題点を解決するための手段〕
本発明の翻訳学習方式は、第一の言語の表現を入力し第
二の言語の表現を生成して出力する翻訳手段と、前記翻
訳手段への入力表現と前記入力表現に対応する前記翻訳
手段からの出力表現との対訳対応を抽出して対訳データ
として送出する対訳抽出手段と、前記対訳データを翻訳
辞書に追加して登録する翻訳辞書格納手段と分有し、前
記翻訳手段は前記対訳データを追加した前記翻訳辞書を
検索して翻訳するようにして実現される。
〔実施例〕
以下、本発明による翻訳学習方式について図面を参照し
ながら説明する。
第1図は、本発明の一実施例をしめずブロック図である
。本発明は基本的にどの様な二言語についての翻訳用辞
書開発にも適用可能であるが、ここでは日本語から英語
への翻訳機能を例に両言語の名詞句に関する対訳辞書自
動学習について説明する。
同図において翻訳学習方式は日本語の入力データ10を
入力し英語の翻訳出力11を送出する翻訳手段3と、翻
訳出力11と入力データ10との対訳対応を抽出して対
訳データ12を送出する対訳抽出手段2と、対訳データ
12を本来の翻訳辞書に追加登録して蓄積する翻訳辞書
格納手段1とを含んでいろ。なお翻訳手段3は翻訳辞書
格納手段1からの検索データ13を参照しながら翻訳出
力11を生成する。
第2図は上記の入力データ10と翻訳出力11との対応
を示す例である。すなわち同図(a)または(b)にお
いて入力原文(日本語)はそれぞれ出力目的文(英語)
に対応している。同図(a)において翻訳手段3は入力
原文の名詞を主要素とする日本語名詞句の入力部分構造
jnp 1およびjnp 2に対する翻訳結果を、出力
目的文に示すenp 1及びenp2という1ndex
に依ってその対応を生成目的表現中に付加して出力する
。その時、その1ndexによる対応表現を付加する条
件は入力文中の一連の単語列、例えRjWLjw2.j
w3(enpl)およびjw4゜jw5.jw6(en
p2)が目的英語表現の中で以下の条件で纏まっている
ことである。
四 日本語名詞句jnpiを構成する単語jwlからj
wnまでが英語名詞句(最終的に一つの名詞を修飾する
構造)enpiに写像される時(Bl  enpi中の
単語ewlからewmが全て人力jWl〜jwnの各々
の対訳辞書から生成されたか若しくは、jwl−jwn
O内の複数の単語の組合わせに対する対訳規則ないし対
訳辞書により生成されたものである。
なおここで、jWiは翻訳辞書格納手段1内にその時点
で保持されている単語見出しくその各々にそれぞれ対訳
が記されている)を意味する。
また同図(blにおいても上記と同様な条件に従って入
力原文のjnp 3およびjnp 4がそれぞれ出力目
的文のenp 3およびenp 4に対応している。
上記のような翻訳手段3は、例えば日経エレクトロニク
ス1984年12月17日号PP195−220「知識
ベースと、言語に独立の中間表現とを用いた日英機械翻
訳システム」に示されるような機械翻訳システムを用い
て構成することができる。同翻訳システムにおいて各中
間構造中の名詞句(体言句ともいう)ノードとそれに対
応する入力表現と対応付ける情報を保持する機構と、訳
出時の対応する英語名詞句にその入力表現を付加する機
構を設けることにより所望の機能をうることかできる。
第3図は上記の対訳抽出手段2の処理平頭を説明する流
れ図である。対訳抽出手段2は、第2図(a)または(
blに示す出力目的文にたいして以下の処理を行う。先
ず出力より、日本語対応表現を持つ英語部分表現をその
対応するベアデータとして収集する。その後で対応表現
を一定のデータ形式に変換して、出力する。
さらに翻訳辞書格納手段1は前記対訳抽出手段2より得
られた対訳データを日本語表現jnpiを辞書検索見出
しとし、その対訳enpiを格納保持する。
〔発明の効果〕
以上、詳細に説明したように本発明による翻訳学習方式
によれば、機械翻訳手段用の単語辞書を用意するのみで
、限シなく多様な表現の対訳辞書が自動的に得られる。
その自動生成された新規対訳辞書項目はその項目が入力
される文の翻訳に於ては恰も翻訳用の単語にみなせ、そ
の単語(自動的に登録された長単位表現である場合も)
の訳に一関しては何時も均質な訳が得られる。また、処
理時間に関しては短単位の単語から解析訳出表現をうる
のに比し長単位に自動登録された辞書引きを行うだけで
翻訳が可能になるという意味で、処理コストが軽減され
ると同時に、既に長単位単語に割シ当てた品詞などの構
造的な情報解析については誤ることがないという意味で
高品質性を実現できる。
【図面の簡単な説明】
第1図は本発明による翻訳学習方式を説明するブロック
図、第2図は翻訳手段における入力データおよび出力デ
ータの形式を説明する説明図、第3図は対訳抽出手段の
処理手順を説明する説明図である。 1・・・・・・翻訳辞書格納手段、2・・・・・・対訳
抽出手段、3・・・・・・翻訳手段。 ゛を 代理人 弁理士  内 原   晋 、ツ151 図 10−−−一人カテ゛′−夕 ff−a欽呂力 t2−−−一対歓デニタ /3−−−・オ廻″素プ゛ニタ 箭Z 回 (η) (ト2

Claims (1)

  1. 【特許請求の範囲】 第一の言語の表現を入力し第二の言語の表現を生成して
    出力する翻訳手段と、 前記翻訳手段への入力表現と前記入力表現に対応する前
    記翻訳手段からの出力表現との対訳対応を抽出して対訳
    データとして送出する対訳抽出手段と、 前記対訳データを翻訳辞書に追加して登録する翻訳辞書
    格納手段とを有し、 前記翻訳手段は前記対訳データを追加した前記翻訳辞書
    を検索して翻訳することを特徴とする翻訳学習方式。
JP61150379A 1986-06-25 1986-06-25 翻訳学習方式 Pending JPS635470A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61150379A JPS635470A (ja) 1986-06-25 1986-06-25 翻訳学習方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61150379A JPS635470A (ja) 1986-06-25 1986-06-25 翻訳学習方式

Publications (1)

Publication Number Publication Date
JPS635470A true JPS635470A (ja) 1988-01-11

Family

ID=15495708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61150379A Pending JPS635470A (ja) 1986-06-25 1986-06-25 翻訳学習方式

Country Status (1)

Country Link
JP (1) JPS635470A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58192173A (ja) * 1982-05-07 1983-11-09 Hitachi Ltd 機械翻訳装置
JPS6118072A (ja) * 1984-07-04 1986-01-25 Hitachi Ltd 辞書デ−タの自動登録方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58192173A (ja) * 1982-05-07 1983-11-09 Hitachi Ltd 機械翻訳装置
JPS6118072A (ja) * 1984-07-04 1986-01-25 Hitachi Ltd 辞書デ−タの自動登録方式

Similar Documents

Publication Publication Date Title
EP0399533B1 (en) Machine translation system and method of machine translation
US7707026B2 (en) Multilingual translation memory, translation method, and translation program
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JPH03278174A (ja) 異言語交信用翻訳方法およびシステム
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH0261763A (ja) 機械翻訳装置
Salam et al. Developing the bangladeshi national corpus-a balanced and representative bangla corpus
JPS635470A (ja) 翻訳学習方式
JP2546245B2 (ja) 自然言語文生成方法
JP2626722B2 (ja) 日本語生成装置
KR100194798B1 (ko) 개념 구조를 이용한 다국어 번역시스템에서 단일의미단어 통합 처리 방법
JPH0561902A (ja) 機械翻訳システム
JP2947554B2 (ja) 機械翻訳装置
JP2608384B2 (ja) 機械翻訳装置及びその方法
JP2752025B2 (ja) 機械翻訳装置
JPS6386071A (ja) 自然言語翻訳方式
JPH02208775A (ja) 機械翻訳方式
JPH02294779A (ja) 機械翻訳システム
JPH03116273A (ja) 対訳文テンプレート対を用いた機械翻訳システム
JPH09146959A (ja) 機械翻訳システム
JPH10320395A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPS63223963A (ja) 意味・文脈処理システム
JPH0443462A (ja) 翻訳後校正支援システム
JPH02110771A (ja) 電訳機
JPH02140869A (ja) 文章の構造解析方法