JPH07121542A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH07121542A
JPH07121542A JP5266004A JP26600493A JPH07121542A JP H07121542 A JPH07121542 A JP H07121542A JP 5266004 A JP5266004 A JP 5266004A JP 26600493 A JP26600493 A JP 26600493A JP H07121542 A JPH07121542 A JP H07121542A
Authority
JP
Japan
Prior art keywords
translation
proper noun
sentence
word
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5266004A
Other languages
English (en)
Inventor
Hiroko Nozawa
裕子 野沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP5266004A priority Critical patent/JPH07121542A/ja
Publication of JPH07121542A publication Critical patent/JPH07121542A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 仮名で表された読みをローマ字に変換し対
訳語として翻訳に用いることにより、効率の良い辞書登
録を可能にし、ミスを防ぐことを目的とする。 【構成】 入力された翻訳対象文を形態素解析し(S
1)、続いて構文解析部13bにおいて文中の単語の接
続関係を解析し、文中に固有名詞のが存在するか否かが
判断される。固有名詞であると判断されると(S2:y
es)、変換部13cでは、固有名詞と判断された単語
について固有名詞辞書14bを参照して(S4)、表記
に対応する読みの情報が得る。その後、読みと仮名ロー
マ字変換表14cとの照会が行われ(S5)、その結
果、読みをローマ字化した文字列が得られる。そして、
この文字列がその単語の対訳語として与えられる(S
6)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、翻訳対象文である第1
言語文を翻訳目標言語文である第2言語文に翻訳する機
能を備えた機械翻訳装置に関するものであり、特に、所
定の固有名詞の翻訳に関わるものである。
【0002】
【従来の技術】従来、機械翻訳装置において用いられる
単語辞書では、どの様な語であろうとも、必ず対訳語が
必要であった。従って、例えば、日英翻訳の場合、
「紙」に対して”paper”,「日本」に対して”J
apan”というように一語一語、対訳語を辞書に登録
させておかねばならない。
【0003】尚、翻訳語が特種な固有名詞等であって、
単語辞書に登録されていないものである場合には、人手
でローマ字表記に直して対訳語として入力する必要があ
った。
【0004】
【発明が解決しようとする課題】しかしながら、日本語
のある特定の固有名詞に関しては、読みをそのまま規則
的にローマ字に変換すれば対訳として用いることが可能
である。例えば、都市名「名古屋」に対して”Nago
ya”、人名「鈴木」に対して”Suzuki”等があ
る。
【0005】このように、規則的に置き換えられる固有
名詞の対訳語を、いちいち人手で対訳語として入力する
のは非効率的であるうえ、入力ミスの虞もある。
【0006】また、単語辞書に、これら全ての固有名詞
に対応するローマ字表記の対訳語まで含めて記憶させて
おくのでは、辞書のサイズが大きくなってしまい、記憶
容量の増大やこの辞書を用いた解析処理の速度の低下等
を引き起こし、好ましくない。
【0007】従って、本発明の機械翻訳装置は、対訳語
を持つ代わりに、人名・書名・地名・企業名等の固有名
詞の読みから第2言語の表記に変換し、その生成語を対
訳語として翻訳に用いることにより、単語辞書のメモリ
の節約が可能であり、また、入力ミスを防ぐことの出来
る機械翻訳装置を提供することを目的とする。
【0008】
【課題を解決するための手段】この目的を達成するため
に本発明の機械翻訳装置は、図1に示すように、日本語
で表現された翻訳対象文を第2言語文で表現された目標
言語文に翻訳するものであり、更に、日本語の固有名詞
の表記毎にその対応する読み情報が仮名により登録され
ている固有名詞辞書と、前記固有名詞辞書に基づいて翻
訳対象文中の固有名詞を対応する読み情報に変換する読
み変換手段と、仮名文字に対応する第2言語の表記が登
録されているアルファベット変換表と、前記読み変換手
段により変換された固有名詞の読み情報を前記アルファ
ベット変換表とのマッチングにより第2言語による表記
を形成する翻訳手段とを備えている。
【0009】尚、前記機械翻訳装置は日英翻訳を行うも
のであり、前記アルファベット変換表は仮名に対応する
ローマ字が登録されている仮名ローマ字変換表であって
もよい。
【0010】
【作用】上記の構成を有する本発明の機械翻訳装置は、
入力された翻訳対象文中の所定の固有名詞を固有名詞検
出手段により検出し、読み変換手段により、その検出さ
れた固有名詞を固有名詞辞書を参照して読み仮名に変換
させる。そして、翻訳手段により、その変換された読み
仮名は仮名ローマ字変換表に基づいて対応する第2言語
のアルファベット表記に変換される。
【0011】
【実施例】以下、本発明を具体化した一実施例を図面を
参照して説明する。
【0012】図2は、本実施例に関する機械翻訳装置の
ハードウェア構成を機能的に示すブロック図である。本
実施例の機械翻訳装置1は日英翻訳を行うものである。
同図に示されるように、この機械翻訳装置1は、計算機
で構成されたデータ処理部10と、キーボード等で構成
された入力部11と、CRT等で構成された表示部15
と、走査型プリンタ等で構成された印刷部16とから構
成されている。
【0013】そして、データ処理部10内には、入力文
又は翻訳結果文を必要に応じて編集する編集部12、翻
訳処理を実行する翻訳部13の他、ハードディスク、光
ディスク等に格納された辞書14が内蔵されている。翻
訳部13は入力文を形態素に分割する形態素解析部13
a、入力文の構文的な構造を明らかにする構文解析部1
3b、入力文を目標言語文に変換する変換部13c、目
標言語文の構造を生成する構文生成部13d、目標言語
文を形態的に整える形態素生成部13eから構成されて
いる。
【0014】本実施例の日英機械翻訳装置1において、
辞書14は翻訳辞書14aと固有名詞辞書14bとを備
えている。翻訳辞書14aには、単語見出しに対応して
対訳語と、品詞・様式などの属性と、接続情報などが記
憶されている。図4は、固有名詞辞書14bの構成を示
した図である。固有名詞辞書14bには、ある所定の固
有名詞の表記に対応して、仮名で表わされたその固有名
詞の読みが与えられている。
【0015】例えば、翻訳辞書14aには「森」が対訳
語”woods”や意味属性[場所を示す語]・品詞
[普通名詞]等の単語情報と共に登録されており、一
方、固有名詞辞書14bには、固有名詞の表記「名古
屋」と読み「なごや」とを対応付けられて登録されてい
る。
【0016】また、翻訳辞書14には仮名ローマ字変換
表14cが備えられ、図5に示すように、それには仮名
文字毎にそれに相当する読みを有すローマ字綴りが対応
付けられて記憶されている。
【0017】尚、上記した形態素解析部13a及び構文
解析部13bが本発明の固有名詞検出手段に相当し、変
換部13cが本発明の読み変換手段及び翻訳手段に相当
する。また、仮名ローマ字変換表14cが本発明の変換
表に相当する。
【0018】ここで、本発明の一実施例である日英機械
翻訳装置1において、日本語入力文を英語生成文に翻訳
する場合を例に取って説明する。但し、一般的な機械翻
訳処理については、特開昭61−265672号公報に
記載の明細書および図面に開示されているので、ここで
はその詳細な説明は省略し、本実施例の機械翻訳装置1
の一連の動作については概略的に説明する。
【0019】入力部11から入力された翻訳対象文は編
集部12により一文毎に分割され、主部、述部が明確な
文章になるように、省略された語を追加や、語順の並び
替え等が行われる。そうして、翻訳し易い文章に整えら
れた翻訳対象文は、一文ずつ翻訳部13へと送られる。
【0020】翻訳部13に送られた翻訳対象文は、形態
素解析部13aにおいて形態素解析される。文章は単語
毎に分解され、各単語の必要な情報が辞書14から読み
出される。ここでは、各単語に対応しそうな登録単語の
意味情報及び品詞などの文法情報を全て読み出す。
【0021】更には構文解析部13bにおいて、翻訳対
象文は構文解析されて単語間の係り受けなど文章の構造
が一義的に決定される。すると、先の形態素解析で挙げ
られた解析結果から構文的に正しいものとそうでないも
のが判別され、正しい解析結果は変換部13cに送られ
る。
【0022】変換部13cでは、解析された日本語の翻
訳対象文を構成する各単語は辞書14から対応する英単
語に変換される。
【0023】変換部13cにおいて変換された英単語を
羅列した文は、構文生成部13dにおいて第2言語文の
文法規則に基づいて正しい構文に生成された後、形態素
生成部13eにおいて、人称・時制・数にあわせた動詞
や名詞の語形の変形化を行う。
【0024】以上の一連の処理を繰り返し行うことで、
全翻訳対象文の翻訳文が完成される。
【0025】また、編集部12によって、求められた英
文はその分脈や主題に沿った形で文章の加工(代名詞化
・省略化・指示詞の付加など)が行われ、読み易く自然
な英文が生成される。そして、その英文は表示部15に
表示されたり、印刷部16によってハードコピーで出力
されたりする。
【0026】図3は、本実施例の日英機械翻訳装置1の
翻訳部13における固有名詞翻訳処理のフローチャート
の一例である。入力文が「私は昨日青森に行った。」で
ある時、入力文は形態素解析部13aにより、図7に示
すように、単語毎(「私」、「は」、「昨日」…)に解
析され、更に構文解析部13bにより、単語の接続関係
が求められる。ここで「青森」について品詞種別が[固
有名詞]と与えられいるので(S2:yes)固有名詞
辞書14bが参照される(S4)。その他の単語におい
ては翻訳辞書14aが参照される(S3)。
【0027】変換部13cでは、固有名詞と判断された
「青森」について固有名詞辞書14bが参照され(S
4)、表記「青森」の読みが「あおもり」であるという
情報が得られる。その後、「あおもり」と図5に示す仮
名ローマ字変換表14cとを照合し、対応するアルファ
ベット表記に変換される(S5)。「あ」には”a”
が、「お」には”o”が、「も」には”mo”が、
「り」には”ri”が対応されており、その結果、”a
omori”という文字列が得られる。そして、この”
aomori”という文字列が「青森」の対訳語として
与えられる(S6)。
【0028】その他の単語は変換部13cにおいて、翻
訳辞書14aにより「私(は)」→”I”、「昨日」
→”yesterday”、「(に)行く」→”go
(to)”と対訳語が与えられる。
【0029】その後、入力文は構文生成部13d、形態
素生成部13eに送られる。ここで固有名詞である”a
omori”については語頭の大文字化が行われ”Ao
mori”となる。そして、語順・時制等を正して、英
語文"I went to Aomori yesterday." が生成され(S
7)、表示部15に表示される。
【0030】以上、詳述したように本実施例において
は、所定の固有名詞の日本語表記と英語表記を対にして
登録しなくても、仮名で表された日本語の読みにより仮
名ローマ字変換表14cとの照合によりローマ字に変換
し、その変換結果を対訳語として利用することができ
る。また、それにより翻訳辞書14aのサイズも不必要
に大きくならない。
【0031】さらに、ローマ字綴りといってもヘボン式
・日本式と訓令式での綴り方の違い、例えば”si”
と”shi”,”ti”と”chi”が存在するため、
人手で固有名詞の対訳語の入力を行うと入力者毎に異な
った表記になりがちである。しかし、本実施例の機械翻
訳装置1を用いれば統一されたローマ字表記の対訳語を
出力することができる。
【0032】また、上記実施例の機械翻訳装置1は、固
有名詞の対訳語として与えられたローマ字表記の中で同
じ母音が続く表記、則ち”aa”,”ii”,”u
u”,”ee”,”oo”又は”ou”が存在するとき
は、それらの表記を一つの母音で代用するように固有名
詞のローマ字表記を変換する手段を持っていてもよい。
つまり、先の”aa”に対しては”a”を、”ii”に
対しては”i”を、”uu”に対しては”u”を、”e
e”に対しては”e”を、”oo”及び”ou”に対し
ては”o”を当てはめて代用させる。これにより、例え
ば「東京」の対訳語”Toukyou”が”Toky
o”と表記できる。但し、”Toukyou”と”To
kyo”のどちらの表記で出力させるかは、使用者が自
由に選択できるようにするのがよい。
【0033】また、翻訳に用いられる変換表は仮名ロー
マ字変換表に限定されず、日露翻訳を行う機械翻訳装置
であれば、変換表は図6に示すような仮名とロシア語表
記とを対応付けた変換表となることは言うまでもない。
即ち変換表は、仮名と機械翻訳装置が翻訳を行う言語と
の対応を記したものであればよい。
【0034】
【発明の効果】以上、詳述したことから明らかなよう
に、本発明の機械翻訳装置によれば、規則的に置き換え
られる固有名詞の対訳語を、その固有名詞の読みから変
換表を基に第二言語による表記に変換して得ることによ
り、いちいち人手で対訳語として入力するという非効率
的な作業をなくし、また、入力ミスを防ぐことが可能と
なる。また、辞書のサイズも不必要に大きくならない。
また、本発明の固有名詞の翻訳は、変換表の変更を行う
だけで他言語への変換にも手軽に対応できる。
【図面の簡単な説明】
【図1】本発明の構成を示す図である。
【図2】本実施例に関わる機械翻訳装置のハードウェア
構成を機能的に示すブロック図である。
【図3】本実施例の翻訳処理の流れを示すフローチャー
トである。
【図4】本実施例の固有名詞辞書の構成を示す図であ
る。
【図5】本実施例の仮名ローマ字変換表の構成を示す図
である。
【図6】本発明のもう一つの実施例の変換表の構成を示
す図である。
【図7】本実施例の機械翻訳装置の形態素解析及び構文
解析の結果を示す図である。
【符号の説明】
1 機械翻訳装置 10 データ処理部 13 翻訳部 13a 形態素解析部 13b 構文解析部 13c 変換部記憶部 14 辞書 14b 固有名詞辞書 14c 仮名ローマ字変換表

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 日本語で表現された翻訳対象文を第2言
    語文で表現された目標言語文に翻訳する機械翻訳装置に
    おいて、 日本語の所定の固有名詞の表記毎にその対応する読み情
    報が仮名により登録されている固有名詞辞書と、 翻訳対象文中に前記所定の固有名詞が存在するか否かを
    判別する固有名詞検出手段と、 前記固有名詞辞書に基づいて翻訳対象文中の所定の固有
    名詞を対応する読み情報に変換する読み変換手段と、 仮名文字に対応する第2言語の表記が登録されている変
    換表と、 前記読み変換手段により変換された固有名詞の読み情報
    を前記変換表に基づいて第2言語の表記に変換する翻訳
    手段とを備えることを特徴とする機械翻訳装置。
  2. 【請求項2】 前記機械翻訳装置は日英翻訳を行うもの
    であり、 前記変換表は仮名に対応するローマ字が登録されている
    仮名ローマ字変換表であることを特徴とした請求項1に
    記載の機械翻訳装置。
JP5266004A 1993-10-25 1993-10-25 機械翻訳装置 Pending JPH07121542A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5266004A JPH07121542A (ja) 1993-10-25 1993-10-25 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5266004A JPH07121542A (ja) 1993-10-25 1993-10-25 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH07121542A true JPH07121542A (ja) 1995-05-12

Family

ID=17425036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5266004A Pending JPH07121542A (ja) 1993-10-25 1993-10-25 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH07121542A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014099106A (ja) * 2012-11-15 2014-05-29 Zenrin Datacom Co Ltd 情報処理装置、情報処理方法、及びプログラム
JP2015185116A (ja) * 2014-03-26 2015-10-22 株式会社ゼンリンデータコム 翻訳装置、翻訳方法及び翻訳プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014099106A (ja) * 2012-11-15 2014-05-29 Zenrin Datacom Co Ltd 情報処理装置、情報処理方法、及びプログラム
JP2015185116A (ja) * 2014-03-26 2015-10-22 株式会社ゼンリンデータコム 翻訳装置、翻訳方法及び翻訳プログラム

Similar Documents

Publication Publication Date Title
KR100259407B1 (ko) 중국어 텍스트 입력키보드, 중국어 텍스트 처리 컴퓨터 시스템, 중국어 텍스트 입력장치, 음성 중국어의 음절 및 단어 저장방법
JPH096787A (ja) 訳振り機械翻訳装置
US5475586A (en) Translation apparatus which uses idioms with a fixed and variable portion where a variable portion is symbolic of a group of words
WO2003065245A1 (fr) Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur
US4860206A (en) Translation system allowing user designation of postpositional words
JPH07121542A (ja) 機械翻訳装置
JP2003178087A (ja) 外国語電子辞書検索装置および方法
JP3285149B2 (ja) 外国語電子辞書検索方法及び装置
JP2938897B2 (ja) 文書作成処理装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JP3244286B2 (ja) 翻訳処理装置
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JP3353873B2 (ja) 機械翻訳装置
JPH06119379A (ja) ふりがな機能つき機械翻訳装置および方法
JP2802369B2 (ja) かな漢字変換装置
JP3253311B2 (ja) 言語処理装置および言語処理方法
JPH0696117A (ja) 文書変更支援システム
JPH03129568A (ja) 文書処理装置
JPH07200592A (ja) 文章処理装置
JPH06251009A (ja) 文章校正支援装置
JPH10269221A (ja) 未登録語処理方式
JPH07122876B2 (ja) 機械翻訳装置
JPH0332105B2 (ja)
JPH05181854A (ja) 文章校正装置および文章処理装置、ならびに漢字仮名変換装置
JPS63136264A (ja) 機械翻訳装置