JPH04306766A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH04306766A
JPH04306766A JP3071090A JP7109091A JPH04306766A JP H04306766 A JPH04306766 A JP H04306766A JP 3071090 A JP3071090 A JP 3071090A JP 7109091 A JP7109091 A JP 7109091A JP H04306766 A JPH04306766 A JP H04306766A
Authority
JP
Japan
Prior art keywords
word
character string
kana
roman
english
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3071090A
Other languages
English (en)
Other versions
JP3194529B2 (ja
Inventor
Keizo Sato
圭三 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP07109091A priority Critical patent/JP3194529B2/ja
Publication of JPH04306766A publication Critical patent/JPH04306766A/ja
Application granted granted Critical
Publication of JP3194529B2 publication Critical patent/JP3194529B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、英語等の外国語と日本
語との間の機械翻訳装置に関する。
【0002】
【従来の技術】従来、既存の機械翻訳装置は、単語辞書
に未登録であった単語はその単語の意味情報が分からな
いため、基本的にはそのままの文字列を出力するという
形でしか処理されていない。
【0003】図4は一例として従来の英日機械翻訳装置
の機能ブロック図である。図において、1は入力手段、
2は入力記憶部、3は単語辞書部、4は翻訳実行制御部
、5は未知語記憶部、9は訳文記憶部、10は訳文表示
部である。
【0004】英文の文字列を入力手段1より入力し該文
字列を入力記憶部2に記憶する。翻訳実行制御部4は英
文に対応した日本語訳を記憶している単語辞書部3を用
いて英文を翻訳し、英文に対応した日本語訳がない場合
は、未知語記憶部5に原語のまま記憶し、両者を合わせ
た翻訳文を訳文記憶部9に記憶し翻訳結果を訳文表示部
10に表示する。
【0005】この装置を使い、例えば、次の英文に対し
、 「I know a man whose name 
is Yamamoto. 」を日本語訳に翻訳する場
合、「Yamamoto」という単語は人名であり、単
語辞書には登録されていない。そうすると既存の機械翻
訳装置では、 「私は、Yamamotoという名前の男を知っている
。」と言う具合に翻訳結果を出力する。
【0006】
【発明が解決しようとする課題】単語辞書部に登録され
ていない単語の翻訳処理を行えば、出力された訳文は原
語のまま表示され翻訳文の質の低下につながる。例えば
、固有名詞のような人名や日本特有のものを表す語「y
amada」、「sushi」、「kimono」、「
shinkansen」などの文字列をそのまま翻訳文
中(ここでは日本語文)に残すことは、日本語の文とし
ては不自然であり、文の読み難くさという結果を招く。
【0007】そこで、このような辞書未登録語を辞書へ
登録しようとしても、有限である記憶領域にすべてを記
憶させることは不可能である。つまり、辞書未登録語は
後修正で人手により処理するということになり、翻訳に
計算機を用いて如何に人手を介さずに翻訳処理を行うか
ということの意に反する。
【0008】本発明は、このような外国語から日本語に
翻訳する際、日本語の文としての不自然さを除き、後修
正をなくすことを目的とする。
【0009】
【課題を解決するための手段】本発明は、英文等の文字
列を入力する入力手段と、該入力手段により入力された
文字列を記憶する入力記憶部と、英文字列等の単語に対
応した日本語訳を記憶した単語辞書部と、該単語辞書部
を用いて英文等を翻訳する翻訳実行制御部と、該翻訳実
行制御部により前記単語辞書部未登録であった語を記憶
する未知語記憶部と、訳文記憶部と、訳文表示部とを備
えた機械翻訳装置において、ローマ字とかなが1対1に
対応したローマ字かなテーブルと、ローマ字をかなに置
き換えるローマ字かな変換部と、前記未知語記憶部中の
未知語をローマ字の文字列として認識し、該文字列を分
割した文字列がかなへ置き換えられるかどうかの判定を
行うローマ字認識制御部とを備えたことを特徴とする。
【0010】
【作用】辞書未登録語である日本特有の語をローマ字と
見なしてかなで置き換えることにより翻訳文中に辞書未
登録語として英文字列等が現われる数は減少する。また
、翻訳結果に現われる辞書未登録語をエディタを用いて
修正する必要はなくなり、辞書に登録されていない日本
特有の語を辞書に登録しなくてもよい。
【0011】
【実施例】以下、本発明の一実施例として英日機械翻訳
装置の機能ブロック図である図1を参照しながら説明を
行う。図において、6はローマ字かなテーブル、7はロ
ーマ字かな変換部、8はローマ字認識制御部であり、他
の各部は図4と同じで同じ符号で示す。英文の文字列を
入力手段1より入力し該文字列を入力記憶部2に記憶し
、翻訳実行制御部4を動作させ、翻訳の実行を行う。
【0012】この翻訳の処理過程においては、入力の該
英文列を構成するそれぞれの単語について、英文に対応
した日本語訳を記憶している単語辞書部3を検索する。 この際、単語辞書部3に登録されている単語については
従来の翻訳処理を継続して行い、単語辞書部3に登録さ
れていなかった単語については、未知語記憶部5に記憶
して、辞書未登録語処理へ移す。
【0013】入力した英文が未知語記憶部5に記憶され
た未知語の場合には、ローマ字認識制御部8はローマ字
とかなが1対1に対応したローマ字かなテーブル6の助
けを借り、ローマ字かな変換部7によりローマ字からか
なに変換の制御を行い、翻訳文を訳文記憶部9に記憶し
翻訳結果を訳文表示部10に表示する。
【0014】図2は辞書未登録語のローマ字かな変換処
理の動作のフローチャートである。A,B,・・・は各
ステップを表す。図3は実施例のローマ字かなテーブル
図である。
【0015】先ず、ステップAで翻訳実行制御部4によ
る翻訳処理が実行され、その際、ステップBで単語辞書
部3の検索を行う。次に、ステップCで単語が辞書に登
録されているかどうか判定する。単語辞書部3に検索さ
れる単語が登録されていればステップDへ、そうでなけ
ればステップEへ進む。ステップDでは単語辞書部3か
らその単語に関する情報を取り出し単語に付与した後、
ステップHへ進む。
【0016】ステップEでは単語辞書に登録されていな
い単語について、英単語つまりアルファベットの文字列
がローマ字のパターンにマッチするかどうかをローマ字
認識制御部8で判定する。つまり、該ローマ字認識制御
部8は文字列をローマ字かなテーブル6を用いて母音1
文字または子音で始まる2文字か3文字の文字列に分割
し、うまく分割できればローマの文字列であると判断し
、ステップFへ進む。ステップFではローマ字かな変換
部7は、ステップEの結果、英単語の文字列がローマ字
のパターンにマッチすると判断された文字列をローマ字
かなテーブル6のローマ字に対応するかなに置き換え、
ステップHへ進む。
【0017】ステップEで英単語の文字列がローマ字の
パターンにマッチしないと判断されたならば、ステップ
Gに進み、その単語はそのまま辞書未登録語とし、翻訳
処理の文字列を英文字列のまま翻訳文中に残し、従来の
未登録語の処理を行う。
【0018】ステップHでは単語辞書部3を更に検索す
るかどうかの判定を行う。単語辞書部3を検索する必要
がなければ辞書未登録語処理が終了し、そうでなければ
ステップAに戻り単語辞書部3を検索する。
【0019】更に、従来の技術の所で述べた具体例を挙
げて実際の処理を詳しく説明する。
【0020】次の英文に対し、翻訳要求があったとする
【0021】「I know a man whose
 name is Yamamoto. 」 「Yamamoto」という単語は人名であり、単語辞
書には登録されていない。そうすると既存の機械翻訳装
置では、「私は、Yamamotoという名前の男を知
っている。」と言う具合に翻訳結果を出力する。ここで
、この「Yamamoto」という文字列がローマ字と
して認識できるかどうか判定してみる。つまり、この文
字列は「Ya」、「ma」、「mo」、「to」に分割
でき、ローマ字かなテーブル6のローマ字のパターンに
マッチする。この分割されたそれぞれの文字列をローマ
字かなテーブル6により、かなへ変換し合成すれば「や
まもと」というかな文字列として表すことができ、結果
としての翻訳文は、「私は、やまもとという名前の男を
知っている。」が出力される。
【0022】また、別の例として、以下の英文を考える
【0023】「I watch the TV pro
gram of NHK. 」この文の翻訳結果として
、 「私は、NHKのテレビ番組を見ている。」を出力する
。ここで、「NHK」は辞書未登録語であり、翻訳結果
には「NHK」というそのままの英文字列を出力する。 「NHK」という文字列はローマ字のパターンにマッチ
しない。つまり文字列を母音1文字、または子音2、あ
るいは3文字へ分割することはできず、既存の機械翻訳
装置の辞書未登録語処理を行うことが可能である。そし
て、このような「NHK」という語は、日本語の文の表
現上でも「NHK」という文字列がそのまま文中に現れ
ることが期待される。
【0024】
【発明の効果】以上説明したように本発明の機械翻訳装
置は、上記のように、機械翻訳装置において辞書未登録
語と判断された英単語のアルファベット文字列をローマ
と見なしてローマ字かな変換することにより、未登録語
として翻訳文中に現われる原文のままのアルファベット
の文字列が減少し、翻訳文の質の向上へとつながる。
【0025】以上は英日翻訳の場合について説明したが
、これに限定されるものではなく、他の外国語について
も本発明を実施できることは容易である。
【図面の簡単な説明】
【図1】本発明の一実施例における英日機械翻訳装置の
機能ブロック図である。
【図2】図1の実施例におけ未登録語のローマ字かな変
換処理の動作を表すフローチャートである。
【図3】図1の実施例におけるローマ字かなテーブルで
ある。
【図4】従来の英日機械翻訳装置の機能ブロック図であ
る。
【符号の説明】
1…入力手段、  2…入力記憶部、  3…単語辞書
部、  4…翻訳実行制御部、5…未知語記憶部、  
6…ローマ字かなテーブル、  7…ローマ字かな変換
部、  8…ローマ字認識制御部、  9…訳文記憶部
、  10…訳文表示部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  英文等の文字列を入力する入力手段と
    、該入力手段により入力された文字列を記憶する入力記
    憶部と、英文字列等の単語に対応した日本語訳を記憶し
    た単語辞書部と、該単語辞書部を用いて英文等を翻訳す
    る翻訳実行制御部と、該翻訳実行制御部により前記単語
    辞書部未登録であった語を記憶する未知語記憶部と、訳
    文記憶部と、訳文表示部とを備えた機械翻訳装置におい
    て、ローマ字とかなが1対1に対応したローマ字かなテ
    ーブルと、ローマ字をかなに置き換えるローマ字かな変
    換部と、前記未知語記憶部中の未知語をローマ字の文字
    列として認識し、該文字列を分割した文字列がかなへ置
    き換えられるかどうかの判定を行うローマ字認識制御部
    とを備えたことを特徴とする機械翻訳装置。
JP07109091A 1991-04-03 1991-04-03 機械翻訳装置 Expired - Fee Related JP3194529B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07109091A JP3194529B2 (ja) 1991-04-03 1991-04-03 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07109091A JP3194529B2 (ja) 1991-04-03 1991-04-03 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH04306766A true JPH04306766A (ja) 1992-10-29
JP3194529B2 JP3194529B2 (ja) 2001-07-30

Family

ID=13450491

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07109091A Expired - Fee Related JP3194529B2 (ja) 1991-04-03 1991-04-03 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP3194529B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000010579A (ja) * 1998-06-19 2000-01-14 Nec Corp 音声合成装置及びコンピュータ可読記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000010579A (ja) * 1998-06-19 2000-01-14 Nec Corp 音声合成装置及びコンピュータ可読記録媒体

Also Published As

Publication number Publication date
JP3194529B2 (ja) 2001-07-30

Similar Documents

Publication Publication Date Title
US5214583A (en) Machine language translation system which produces consistent translated words
KR900006671B1 (ko) 언어생성장치
KR900008402B1 (ko) 기계번역장치
JPH04306766A (ja) 機械翻訳装置
JP4843596B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JPH0350668A (ja) 文字処理装置
KR100204068B1 (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
JPH0528179A (ja) 機械翻訳装置
JP2894064B2 (ja) 機械翻訳装置
JP2864691B2 (ja) 学習支援装置
JPS59103136A (ja) カナ漢字変換処理装置
JPS59121425A (ja) 「へい」音漢字変換装置
JP3048793B2 (ja) 文字変換装置
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JPH06119379A (ja) ふりがな機能つき機械翻訳装置および方法
JPH07141382A (ja) 外国語文書作成支援装置
JPS59153232A (ja) 文字変換装置
JPS6190268A (ja) 翻訳方式
JPS5998236A (ja) 日本文入力装置
JPS5932032A (ja) 日本語情報処理装置
JPH01197876A (ja) 電子辞書
JPS5911435A (ja) カナ漢字変換装置
JPS60247787A (ja) 文章変換装置
JPH0232460A (ja) 文書処理装置
JPH05266073A (ja) 機械翻訳機

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees