JPS63261467A - 翻訳方法および装置 - Google Patents

翻訳方法および装置

Info

Publication number
JPS63261467A
JPS63261467A JP62095122A JP9512287A JPS63261467A JP S63261467 A JPS63261467 A JP S63261467A JP 62095122 A JP62095122 A JP 62095122A JP 9512287 A JP9512287 A JP 9512287A JP S63261467 A JPS63261467 A JP S63261467A
Authority
JP
Japan
Prior art keywords
translation
dictionary
list
user
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62095122A
Other languages
English (en)
Inventor
Atsushi Okajima
岡島 惇
Fumiyuki Yamano
山野 文行
Noriyuki Yamazaki
山崎 紀之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP62095122A priority Critical patent/JPS63261467A/ja
Publication of JPS63261467A publication Critical patent/JPS63261467A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、辞書を具備して行なう自然言語処理に関し、
特に機械翻訳において、基本語が連語として頻繁に使わ
れるような文書の翻訳に好適な翻訳方法および装置に関
する。
〔従来の技術〕
従来の翻訳装置において、辞書に情報がない場合につい
ては、いわゆる未知語(辞書に該単語の見出し語がない
、)の問題が最大の関心事であった。そこで、翻訳以前
に、未知語かどうかを辞書検索を行なうことによって知
り、未知語であることをユーザに知らせて辞書を保守す
るといった方法や、システムが、自動的に構文情報等を
推定し、翻訳を行なう方法等があった0例えば後者とし
ては、特開昭60−181973号公報等が知られてい
る。
〔発明が解決しようとする問題点〕
上記従来技術は、未知語を翻訳以前に既知語に変えてお
くことにより、翻訳精度を上げることができるが、既知
語に対する配慮がされていなかった。翻訳システムにお
いては、辞書が充実されるのに伴い、基本語が未知語で
あることは、減って来る。又、医学文書の病名のような
専門語は、専門家が翻訳システムを使うような場合は、
翻訳せず原語のままで良いといった場合もあり、必らず
しも辞書が完備している必要がないこともある。
一方、翻訳システム側からみると、翻訳を難しくしてい
るのは、上記の病名のような専門語でなく、各単語は既
知なのに単語になって別の意味や構文的性質をもったも
のであることが多い0例えば、英語では、動詞を含む連
語(例えばrhousingstart :住宅着工(
数)」1日本語では1名詞連#1(例えば「自然言語処
理装置」)のような、品詞や修飾関係が圧縮された表現
である。これらは、各単語が既知である為、かえって別
品側等に取り違えられる可能性が多いという問題があっ
た。
本発明の目的は、上記のような既知単語の連語的特性を
利用して、翻訳の質を向上させる翻訳方法および装置を
提供することにある。
〔問題点を解決するための手段〕
上記目的を達成するために、本発明では、連語としての
特性を浮び上らせ、これをユーザに示すことと、その結
果を見て、ユーザが更新した辞書に従って翻訳を行なう
ことに特徴がある。
〔作用〕
本発明では、翻訳対象となるテキストを読み込み1字面
の連り単位に連語リストを、表示する。
このリストにより、対象テキストに何回も同じ連なりで
現われるものがユーザに明示され、これによってユーザ
は、辞書を更新することができる。
この操作を翻訳実行以前にしておくことによって、対象
テキスト特有の連語や、単語としては既知である基本語
の多義性を絞り込むことが可能となる為、翻訳精度の向
上を図ることができる。
〔実施例〕
以下、本発明の一実施例を図面に基づいて説明する。以
下、英日9日英の翻訳システムについて説明するが、他
の言語対に対しても、又、翻訳以外の自然言語処理にお
いても、本発明は適用可能である。
第2図は、本発明の一実施例による翻訳装置のブロック
図である。
第2図において、1は第1の言語の入力や辞書更新情報
等を入力するための入力装置、2は翻訳文や連語リスト
等を表示する表示装置、3は、翻訳テキストの入力、翻
訳文の表示、連語リストの作成および表示、ユーザの更
新in報による辞書の更新、および翻訳の実行等を指示
する制御部、4は対象テキストを制御部3の指示により
統計処理し、連語リストを作成する連語リスト作成部、
5は制御部3の指示により辞書ファイル6を使用して翻
訳を実行する翻訳部、6はあらかじめ用意され、さらに
ユーザの更新情報により更新され、翻訳部によって翻訳
に使用される辞書ファイル、7は、対象テキストや連語
リスト作成の際の作業領域を格納するメインメモリであ
る。
次に本実施例の処理動作について第1図に従い説明する
。翻訳を実行するにあたり、ユーザは、まず対象テキス
トの範囲を指定する(処理101)。
範囲指定にあたっては、入力時に範囲の始めと終りを示
すコードを入力するといった方法でも良いが、あらかじ
めメインメモリに入力済のテキストを表示装置2に表示
し、これをユーザが見ながら、カーソルやタッチパネル
等の手段で範囲を示す方法が望ましい。又、範囲は、テ
キストの翻訳単位でも良いが、統計的に意味のあるデー
タを取るためには1本文と図で特徴が異なっているとい
った場合は、本文のみ、図のみといったように範囲を指
定してもよい0次に、範囲の対象テキス1〜をメインメ
モリ7から読み込み、連語リスト作業部4により連語リ
ストを作成する(処理102)、連語リストは、2語、
 3Tr!I、 4語といった長さ単位の同一字面のも
のが、テキスト中にどのように出現するかを一覧表にし
て表示する、いわゆるK W I C(Keyすord
 in Context:見出し語をはさんで、どんな
文脈が成立するかを表示するもの)リストで良い、その
一実施例を第3図に示すKWICリストの作成は、まず
見出しとなる文字列を含むテキストの部分を切出し、こ
れを見出し語毎に表示する。さらに同一見出し語を含む
テキスト部分が多量になる場合は、その前の文字でソー
トする(図−文字のものをまとめ整列する)等により見
易いリストを作るが、KWICリストの方式は本実施例
では特に規定しない、KWICリストはメインメモリ7
に格納しても良いし、多量の場合は、見出し語毎に処理
して、見出し語単位でのみメインメモリ7に格納するよ
うにして必要メモリ量を減らしてもよい。ただし実用上
は、単純なKWICリストだと、出現単語(延べ語)数
×連語長分の例文リストが出ることと、第3図の1語解
析」といった無駄な表示が出やすいといった問題がある
ので、最長一致で、含むものに名寄せする(例えば、第
3図のr言 語解析」は「言語解析」に、又、「自然言
 語解析」は「言語解析」やさらに「自然言語解析」に
名寄せする。)方式が望ましい、この為、さらに、連語
として辞書を作成すべきものは、出現頻度が多いと考え
られることから、出現頻度をあらかじめ指定するとか、
出現頻度の頭から何語かのみをユーザに表示する等の限
定として、ユーザの見たり更新したりする負担より辞書
更新の効果の方が優位であるようにするのが望ましい。
さらに、第4図のroperatingthe fir
mJのような一般には連語とは考えられないものでも、
対象文書上、1文的多義が発生せず、良い訳が得られる
場合は、訳語を設定するといった方法も可能である。
連語リストがメインメモリ7中に作られると、第3図に
示すような連語リストを表示装置2を通してユーザに表
示する(処理105)。この際、辞書に既に連語リスト
中の見出し語がある場合で。
この辞書引きの時間をかけても良いと考えられる場合は
、n書を使うことをユーザが指定し、この指定に従って
、辞書に連語として登録されているものを検索し、その
白表示する(処理103゜104)。
連語リストがユーザに表示されると、ユーザはこの内、
連語として訳や構文情報として辞書登録しておくことが
望ましいものについて、辞書を更新する(処理106)
、n書の更新は、該翻訳システムが持っている標準的辞
書更新方式でも良いが、連語リストの該当する見出し語
をユーザがカーソル等により指示し、訳や翻訳に必要な
情報を、ユーザが、表示装置2上にあらかじめ設けられ
た入カニリアを通して入力することにより行なうのが望
ましい。上記の操作により作られた連語リストが、図の
みとか、本文のみといった範囲に限定されており、かつ
他の対象テキスト範囲について連語リストを採る必要が
ある場合は、上記処理を必要なテキスト範囲に対して繰
り返す(処理107)。
対象テキスト範囲によって連語の使われ方や、訳が異な
る場合は1分野や文書を示すコードをユーザが入力し、
その連語や訳にコードを付与する。
こうすることにより、対象テキストが全体としては、複
数個の性質の異なるテキストタイプのもので構成されて
いても、各テキストタイプ別に用意された連語や訳の合
致するものを採ることができる。入力されたテキストの
テキストタイプの判別は、ユーザが個々教える形でもよ
いし、さらにテキストの配置的特徴によって制御部3が
判定する(例えば、図や見出し部等は、前後の空白で判
定できる)方式でもよい、辞書更新が終了したと判断さ
れた場合は、更新された辞書を使用して翻訳部が対象テ
キストを翻訳する(処理108)。
〔発明の効果〕
本発明によれば、あらかじめ準備するのが困難であり、
かつ、単語自体は既知語であるため、未知語のように、
ユーザに警告となるメツセージや訳の特徴(例えば、原
語のままの訳出)も表示せず誤訳をまねく、既知語を含
む連語に対し、翻訳実行以前に、連語の可能性のあるも
のを表示し。
ユーザに辞書更新させることにより、対象テキストだけ
とか、更に、出現頻度の多いものだけといった限定範囲
での辞書更新に限ることにより、比較的少ない労力で、
高品質の翻訳を実現することが可能となる。さらに、一
般には成立しないテキスト固有の表現に対しても、連記
として訳を設定することにより他のテキストに悪影響を
及ぼすことなく適訳を設定することも可能にできる。
【図面の簡単な説明】
第1図は本発明の方法の一実施例を示すフローチャート
、第2図は本発明の一実施例による翻訳装置のブロック
図、第3図は、第1言語が日本語である場合の連語リス
トの一表示例を示す図、第4図は、第1言語が英語であ
る場合の連語リストの一表示例を示す図である。 111.入力装置、2・・・表示装置、3・・・制御部
、4・・・連語リスト作成部、5・・・翻訳部、6・・
・辞書ファイル、7・・・メインメモリ。 又 、′ 、−7+ 稟 112I

Claims (1)

  1. 【特許請求の範囲】 1、第1言語から第2言語への翻訳処理において、翻訳
    処理を実行する以前に、翻訳対象となるテキストの連語
    リストを採り、これを表示し、既知単語を含む連語の辞
    書情報を更新させ、該更新済の辞書を使用して翻訳を行
    なうことを特徴とする翻訳方法。 2、対象テキストの連語リストを作成する手段と、対象
    テキストおよび辞書更新情報を入力する手段と、対象テ
    キスト翻訳結果および連語リストを表示する手段と、翻
    訳に使用されかつ連語リストの結果により入力された情
    報により更新される辞書ファイルと、上記辞書を使用し
    て翻訳を行なう手段と、上記全体を制御する手段とを設
    けたことを特徴とする翻訳装置。
JP62095122A 1987-04-20 1987-04-20 翻訳方法および装置 Pending JPS63261467A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62095122A JPS63261467A (ja) 1987-04-20 1987-04-20 翻訳方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62095122A JPS63261467A (ja) 1987-04-20 1987-04-20 翻訳方法および装置

Publications (1)

Publication Number Publication Date
JPS63261467A true JPS63261467A (ja) 1988-10-28

Family

ID=14129026

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62095122A Pending JPS63261467A (ja) 1987-04-20 1987-04-20 翻訳方法および装置

Country Status (1)

Country Link
JP (1) JPS63261467A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0637804A3 (en) * 1993-08-03 1995-08-23 Ibm Method and device for facilitating the understanding of online documents.
US5682543A (en) * 1994-05-16 1997-10-28 Matsushita Electric Industrial Co. Ltd. Dictionary editing apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0637804A3 (en) * 1993-08-03 1995-08-23 Ibm Method and device for facilitating the understanding of online documents.
US5682543A (en) * 1994-05-16 1997-10-28 Matsushita Electric Industrial Co. Ltd. Dictionary editing apparatus

Similar Documents

Publication Publication Date Title
CA1235817A (en) Method and apparatus for natural language processing
JP3717730B2 (ja) 電子辞書
EP0645720B1 (en) Dictionary creation supporting system
KR910008456B1 (ko) 기계번역처리장치
JPS62163173A (ja) 機械翻訳方法
JPS6244874A (ja) 機械翻訳装置
JPS63261467A (ja) 翻訳方法および装置
JP2621999B2 (ja) 文書処理装置
JPH06266770A (ja) 文書情報検索装置及び検索装置及び機械翻訳装置及び文書作成装置
JPH05151256A (ja) 機械翻訳方法および機械翻訳装置
JPS62163174A (ja) 機械翻訳装置
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JP2806352B2 (ja) 機械翻訳用辞書メンテナンス装置
JP2002183134A (ja) 翻訳装置
JPS6174069A (ja) 翻訳方式
JPH0713822B2 (ja) 翻訳方法
JPS6190268A (ja) 翻訳方式
JPS63136264A (ja) 機械翻訳装置
JPH01152573A (ja) 翻訳処理方式
JPH01207869A (ja) 日本語文章処理方式
JPH06295310A (ja) 機械翻訳装置
JPH01240976A (ja) 電子辞書
JPH01204174A (ja) 文字処理装置
JPH01197876A (ja) 電子辞書
JPH027167A (ja) 翻訳方法及び装置