JPH0528179A - Machine translation device - Google Patents

Machine translation device

Info

Publication number
JPH0528179A
JPH0528179A JP3179339A JP17933991A JPH0528179A JP H0528179 A JPH0528179 A JP H0528179A JP 3179339 A JP3179339 A JP 3179339A JP 17933991 A JP17933991 A JP 17933991A JP H0528179 A JPH0528179 A JP H0528179A
Authority
JP
Japan
Prior art keywords
translation
word
katakana
character string
roman
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3179339A
Other languages
Japanese (ja)
Inventor
Keizo Sato
圭三 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3179339A priority Critical patent/JPH0528179A/en
Publication of JPH0528179A publication Critical patent/JPH0528179A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To prevent a character string written in a foreign language from appearing in a translation and to improve the translation by recognizing a character string written in Roman letters as a character string and replacing it by KATAKANA (cursive form of Japanese syllabary writing) when an unregistered word in a dictionary appears during the translation. CONSTITUTION:When an unregistered word appears during the machine translation of a foreign word character string inputted by an input means 1, whether or not a Roman letter recognition display part 8 can recognize the foreign word character string stored in an unknown word storage part 5 as a Roman letter is judged. If it is recognized as a Roman letter, a Roman letter/ KATAKANA conversion part 7 performs KATAKANA conversion using a Roman letter KATAKANA table 6, and outputs the translation result.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、外国語から日本語への
間の機械翻訳装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation device from a foreign language to Japanese.

【0002】[0002]

【従来の技術】従来、機械翻訳装置において単語辞書に
未登録であった単語はその単語の意味情報が分からない
ため、基本的にはそのままの文字列を出力するという形
でしか処理されていなかった。
2. Description of the Related Art Conventionally, in a machine translation device, a word that has not been registered in a word dictionary cannot be understood as the semantic information of the word, so basically, it is processed only by outputting a character string as it is. It was

【0003】[0003]

【発明が解決しようとする課題】単語辞書に登録されて
いない単語をそのままにして翻訳処理を行えば、出力さ
れた翻訳文の質の低下につながる。
If the translation processing is performed while leaving the words that are not registered in the word dictionary as they are, the quality of the output translated sentence will be deteriorated.

【0004】たとえば、次のような外来語「Shinkanse
n」,「Karaoke」,「Fujiyama」などの文字列をそのま
ま翻訳された文の中(ここでは日本語文)に残すこと
は、日本語の文としては不自然であり、文の読みにくさ
という結果を招く。そこで、このような辞書未登録語を
辞書へ登録しようとしても、有限である記憶領域にすべ
てを登録させることは不可能である。つまり、辞書未登
録語は後修正で人手により処理するしかなかったのであ
る。しかし、人手により処理するということは、翻訳に
計算機を用いていかに人手を介さずに翻訳処理を行うか
ということの意に反する。
For example, the following foreign words "Shinkanse"
It is unnatural for a Japanese sentence to leave a character string such as “n”, “Karaoke”, “Fujiyama” in the translated sentence as it is (in this case, the Japanese sentence), and it is difficult to read the sentence. Bring results. Therefore, even if an attempt is made to register such unregistered words in the dictionary, it is impossible to register all of them in a limited storage area. In other words, the unregistered words in the dictionary had to be manually processed by post-correction. However, manual processing goes against the intention of using a computer for translation and performing the translation processing without human intervention.

【0005】本発明は、上記従来の問題点を解決し、質
の高い翻訳文を出力する機械翻訳装置の提供を目的とす
る。
SUMMARY OF THE INVENTION It is an object of the present invention to solve the above conventional problems and provide a machine translation device that outputs a high quality translated sentence.

【0006】[0006]

【課題を解決するための手段】この目的を達成するため
に本発明の自動翻訳装置は、外国語文の文字列を入力す
る入力手段と、前記入力手段により入力された文字列を
記憶する入力記憶部と、外国語文字列に対応した日本語
訳を記憶した単語辞書部と、前記単語辞書部を用いて外
国語文を翻訳する翻訳実行制御部と、前記翻訳実行制御
部で前記単語辞書部に未登録であった語を記憶する未知
語記憶部と、ローマ字とカタカナが一対一に対応したロ
ーマ字カタカナテーブルと、ローマ字をカタカナに置き
換えるローマ字カタカナ変換部と、前記未知語記憶部中
の未知語をローマ字の文字列として認識しカタカナへ置
き換えるかどうかの制御を行うローマ字認識制御部と、
訳文を記憶する訳文記憶部と、訳文を表示する訳文表示
部とを備えた構成となっている。
In order to achieve this object, an automatic translation apparatus of the present invention has an input means for inputting a character string of a foreign language sentence and an input memory for storing the character string input by the input means. Section, a word dictionary section that stores a Japanese translation corresponding to a foreign language character string, a translation execution control section that translates a foreign language sentence using the word dictionary section, and a translation execution control section that stores the word dictionary section. An unknown word storage unit that stores unregistered words, a Roman character Katakana table in which Roman characters and Katakana correspond one-to-one, a Roman character Katakana conversion unit that replaces Roman characters with Katakana, and an unknown word in the unknown word storage unit. A Roman character recognition control unit that recognizes as a Roman character string and controls whether to replace with Katakana,
The configuration includes a translated text storage unit that stores translated texts, and a translated text display unit that displays translated texts.

【0007】[0007]

【作用】本発明は上記の構成により、辞書未登録語であ
る日本特有の語をローマ字と見なしてカタカナで置き換
えることにより翻訳文中に辞書未登録語としてアルファ
ベット文字列が現われる数は減少する。
With the above structure, the present invention reduces the number of alphabetic character strings appearing as unregistered words in a translated sentence by considering Japanese words that are not registered in the dictionary as Roman letters and replacing them with katakana.

【0008】[0008]

【実施例】以下、本発明の一実施例について図面を参照
しながら説明を行う。図1は本発明の一実施例の機械翻
訳装置の機能ブロック図である。同図において、1は外
国語文の文字列を入力する入力手段、2は入力手段1か
ら入力された外国語文字列を記憶する入力記憶部、3は
外国語文に対応した日本語訳を記憶している単語辞書
部、4は3の単語辞書部を用いて外国語文を翻訳する翻
訳実行制御部、5は翻訳実行制御部4で単語辞書部3に
未登録であった語を記憶する未知語記憶部、6はローマ
字とカタカナが一対一に対応したローマ字カタカナテー
ブル、7はローマ字をカタカナに置き換えるローマ字カ
タカナ変換部、8は5の未知語記憶部中の未知語がロー
マ字であるかどうか認識し未知語をカタカナへ置き換え
るかどうかの制御を行うローマ字認識制御部、9は翻訳
文を記憶する訳文記憶部、10は翻訳結果を表示する訳
文表示部である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a functional block diagram of a machine translation device according to an embodiment of the present invention. In the figure, 1 is an input means for inputting a character string of a foreign language sentence, 2 is an input storage unit for storing the foreign language character string input from the input means 1, and 3 is a Japanese translation corresponding to the foreign language sentence. A word dictionary unit 4, a translation execution control unit that translates a foreign language sentence using the word dictionary unit 3 and an unknown word 5 that stores words that have not been registered in the word dictionary unit 3 by the translation execution control unit 4. A memory unit, 6 is a Roman character Katakana table in which Roman characters and Katakana correspond one-to-one, 7 is a Roman character Katakana conversion unit that replaces Roman characters with Katakana, and 8 recognizes whether an unknown word in the unknown word storage unit of 5 is a Roman character. A Roman character recognition control unit that controls whether or not to replace an unknown word with katakana, a translated text storage unit 9 that stores a translated text, and a translated text display unit that displays a translation result.

【0009】上記の構成要素よりなる機械翻訳装置にお
いて、以下、この装置の動作について説明する。実例と
して英語を日本語に翻訳する場合について説明する。
In the machine translation device having the above components, the operation of this device will be described below. As an example, the case of translating English into Japanese is explained.

【0010】まず、入力手段1により入力された英文字
列に対し、翻訳実行制御部4を動作させ、翻訳の実行を
行う。この翻訳の処理過程においては、入力の英文字列
を構成するそれぞれの単語について単語辞書3を検索す
る。この際、単語辞書に登録されている単語については
翻訳処理を継続して行い、単語辞書に登録されていなか
った単語については辞書未登録処理へはいる。
First, the translation execution control unit 4 operates the English character string input by the input means 1 to execute translation. In the process of this translation, the word dictionary 3 is searched for each word that constitutes the input English character string. At this time, the translation processing is continuously performed for the words registered in the word dictionary, and the dictionary unregistered processing is performed for the words not registered in the word dictionary.

【0011】以下、図2のフローチャートを参照しなが
ら単語辞書引きの際に行う辞書未登録語処理の説明を行
う。
Hereinafter, the dictionary unregistered word processing performed when the word dictionary is looked up will be described with reference to the flowchart of FIG.

【0012】まずステップAで翻訳処理が実行され、そ
の際ステップBで単語辞書の検索を行う。つぎにステッ
プCで単語が辞書に登録されているかどうかを判定す
る。単語辞書に検索する単語が登録されていればステッ
プDへ、そうでなれけばステップEへ進む。ステップD
では単語辞書からその単語に関する情報を取り出し、単
語に付与した後ステップHへ進む。ステップEでは単語
辞書に登録されていない単語について、英単語つまりア
ルファベットの文字列がローマ字のパターンにマッチす
るかどうかを判定する。つまり、文字列を図3のローマ
字カタカナテーブルを用いて母音1文字または子音では
じまる2文字か3文字の文字列に分割し、うまく分割で
きればローマ字の文字列であると判断し、ステップFへ
進む。ステップFでは、ステップEの結果英単語の文字
列がローマ字のパターンにマッチすると判断された文字
列を図3のローマ字カタカナテーブルのローマ字に対応
するカタカナに置き換え、ステップHへ進む。ステップ
GではステップEで英単語の文字列がローマ字のパター
ンにマッチしないと判断されたならば、その単語はその
まま辞書未登録語とし、翻訳処理の既存の未登録語の処
理を行う。ステップHでは単語辞書を検索するかどうか
の判定を行う。単語辞書を検索する必要がなければ辞書
未登録語処理を終了し、そうでなければステップAにも
どり単語辞書を検索する。
First, a translation process is executed in step A, and a word dictionary is searched in step B at that time. Next, in step C, it is determined whether the word is registered in the dictionary. If the word to be searched is registered in the word dictionary, go to step D, and if not, go to step E. Step D
Then, information on the word is taken out from the word dictionary, added to the word, and then the process proceeds to step H. In step E, it is determined whether or not an English word, that is, a character string of an alphabet, matches a Roman character pattern for a word that is not registered in the word dictionary. That is, the character string is divided into two or three character strings starting with one vowel character or consonant using the Roman alphabet katakana table of FIG. . In step F, the character string determined to match the English character string as a result of step E is replaced with the Katakana character corresponding to the Roman character in the Roman character Katakana table of FIG. 3, and the process proceeds to Step H. In step G, if it is determined in step E that the character string of the English word does not match the Roman alphabet pattern, the word is left as it is as a dictionary unregistered word, and the existing unregistered word in the translation process is processed. In step H, it is determined whether to search the word dictionary. If it is not necessary to search the word dictionary, the dictionary unregistered word processing is terminated. If not, the procedure returns to step A to search the word dictionary.

【0013】さらに、具体例を挙げて実際の処理を詳し
く説明する。次のような英文に対し、翻訳要求があった
とする。
Further, the actual processing will be described in detail with a specific example. Suppose there is a translation request for the following English text.

【0014】「She likes to sing karaoke.」この例で
「Karaoke」という単語が辞書に登録されていなかった
とする。そうすると既存の機械翻訳装置では、「彼女
は、Karaokeを歌うのが好きである。」という翻訳結果
を出力する。ここで、この「Karaoke」という文字列が
ローマ字として認識できるかどうか判定してみる。つま
り、この文字列は「ka」,「ra」,「o」,「ke」に分割で
き、図3のローマ字カタカナ変換テーブルのローマ字の
パターンにマッチする。この分割されたそれぞれの文字
列を図3のローマ字カタカナ変換テーブルにより、カタ
カナへ変換し合成すれば「カラオケ」というカタカナ文
字列として表わすことができ、結果としての翻訳文は、
「彼女は、カラオケを歌うのが好きである。」が出力さ
れる。
"She likes to sing karaoke." It is assumed that the word "Karaoke" is not registered in the dictionary in this example. Then, the existing machine translation device outputs the translation result "She likes to sing Karaoke." Here, it is judged whether or not the character string "Karaoke" can be recognized as a Roman character. That is, this character string can be divided into "ka", "ra", "o", and "ke", and matches the Roman character pattern of the Roman character Katakana conversion table in FIG. If each of the divided character strings is converted into katakana by the Roman character katakana conversion table of FIG. 3 and synthesized, it can be expressed as a katakana character string of “karaoke”, and the resulting translated sentence is
"She likes to sing karaoke." Is output.

【0015】また、別の例として、以下の英文を考え
る。「I watch the TV program of NHK.」この文の翻訳
結果として、「私は、NHKのテレビ番組を見ている。」
を出力する。ここで、「NHK」は辞書未登録語であり、
翻訳結果には「NHK」というそのままの英文字列を出力
する。「NHK」という文字列はローマ字のパターンにマ
ッチしない。つまり文字列を母音1文字、または子音
2、あるいは3文字へ分割することはできず、既存の機
械翻訳装置の辞書未登録語処理を行うことが可能であ
る。そして、このような「NHK」という語は、日本語の
文の表現上でも「NHK」という文字列がそのまま文中に
現われることが期待される。
As another example, consider the following English sentence. "I watch the TV program of NHK." As a result of translating this sentence, "I am watching a NHK TV program."
Is output. Here, "NHK" is a dictionary unregistered word,
The translated English string "NHK" is output as the translation result. The string "NHK" does not match the Roman pattern. That is, the character string cannot be divided into one vowel character, two consonant characters, or three characters, and the dictionary unregistered word processing of the existing machine translation device can be performed. It is expected that such a word "NHK" will appear as it is in the text even in the expression of a Japanese sentence.

【0016】なお、上記の実施例で英語から日本語への
翻訳の例をあげたが、辞書未登録語をローマ字と見なし
て、カタカナへ変換する動作に支障のない外国語であれ
ば英語に限定されずに応用が可能なものである。
Although an example of translation from English to Japanese has been given in the above embodiment, if a foreign language that does not hinder the operation of considering unregistered words as Roman letters and converting them to Katakana, it is converted to English. It is applicable without limitation.

【0017】[0017]

【発明の効果】上記のように、本発明の機械翻訳装置に
よれば、辞書未登録語と判断された外国語単語のアルフ
ァベット文字列をローマ字と見なしてカタカナへ変換す
ることにより、未登録語として翻訳文中に現われるアル
ファベットの文字列が減少し、翻訳文は読み易くなる。
また、翻訳結果に現われる辞書未登録語をエディタを用
いて修正する必要はなくなり、辞書に登録されていない
外来語を辞書に登録しなくてもよい。
As described above, according to the machine translation device of the present invention, an unregistered word is converted by converting an alphabetic character string of a foreign language word determined to be a dictionary unregistered word into a Roman character and converting it into katakana. As a result, the character strings of the alphabet appearing in the translated text are reduced, and the translated text becomes easier to read.
In addition, it is not necessary to correct an unregistered word that appears in the translation result using an editor, and it is not necessary to register a foreign word that is not registered in the dictionary in the dictionary.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例における機械翻訳装置の機能
ブロック図
FIG. 1 is a functional block diagram of a machine translation device according to an embodiment of the present invention.

【図2】同実施例における未登録語のローマ字カタカナ
変換処理の動作を表わすフローチャート
FIG. 2 is a flowchart showing the operation of Roman character katakana conversion processing for unregistered words in the embodiment.

【図3】同実施例におけるローマ字カタカナテーブルFIG. 3 is a romaji katakana table in the same embodiment.

【符号の説明】[Explanation of symbols]

1 入力手段 2 入力記憶部 3 単語辞書部 4 翻訳実行制御部 5 未知語記憶部 6 ローマ字カタカナテーブル 7 ローマ字カタカナ変換部 8 ローマ字認識制御部 9 訳文記憶部 10 訳文表示部 1 input means 2 input storage unit 3 word dictionary unit 4 translation execution control unit 5 unknown word storage unit 6 Romaji katakana table 7 Romaji katakana conversion unit 8 Romaji recognition control unit 9 translation sentence storage unit 10 translation display unit

Claims (1)

【特許請求の範囲】 【請求項1】外国語文の文字列を入力する入力手段と、
前記入力手段により入力された文字列を記憶する入力記
憶部と、外国語文字列に対応した日本語訳を記憶した単
語辞書部と、前記単語辞書部を用いて外国語文を翻訳す
る翻訳実行制御部と、前記翻訳実行制御部で前記単語辞
書部に未登録であった語を記憶する未知語記憶部と、ロ
ーマ字とカタカナが一対一に対応したローマ字カタカナ
テーブルと、ローマ字をカタカナに置き換えるローマ字
カタカナ変換部と、前記未知語記憶部中の未知語をロー
マ字の文字列として認識しカタカナへ置き換えるかどう
かの制御を行うローマ字認識制御部と、訳文を記憶する
訳文記憶部と、訳文を表示する訳文表示部とを備えた機
械翻訳装置。
[Claims] [Claim 1] Input means for inputting a character string of a foreign language sentence,
An input storage unit that stores a character string input by the input unit, a word dictionary unit that stores a Japanese translation corresponding to a foreign language character string, and a translation execution control that translates a foreign language sentence using the word dictionary unit. Section, an unknown word storage section that stores words that have not been registered in the word dictionary section in the translation execution control section, a Roman character katakana table in which Roman characters and Katakana correspond one-to-one, and Roman character katakana that replaces Roman characters with katakana. A conversion unit, a Roman character recognition control unit that controls whether to recognize an unknown word in the unknown word storage unit as a Roman character string and replace it with katakana, a translation storage unit that stores a translation, and a translation that displays the translation. A machine translation device having a display unit.
JP3179339A 1991-07-19 1991-07-19 Machine translation device Pending JPH0528179A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3179339A JPH0528179A (en) 1991-07-19 1991-07-19 Machine translation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3179339A JPH0528179A (en) 1991-07-19 1991-07-19 Machine translation device

Publications (1)

Publication Number Publication Date
JPH0528179A true JPH0528179A (en) 1993-02-05

Family

ID=16064114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3179339A Pending JPH0528179A (en) 1991-07-19 1991-07-19 Machine translation device

Country Status (1)

Country Link
JP (1) JPH0528179A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013254258A (en) * 2012-06-05 2013-12-19 Fuji Xerox Co Ltd Information processor and information processing program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013254258A (en) * 2012-06-05 2013-12-19 Fuji Xerox Co Ltd Information processor and information processing program

Similar Documents

Publication Publication Date Title
US5214583A (en) Machine language translation system which produces consistent translated words
KR100259407B1 (en) Keyboard for a system and method for processing chinese language text
US5835924A (en) Language processing apparatus and method
KR100930185B1 (en) Electronic device and dictionary input method with dictionary function
WO2003065245A1 (en) Translating method, translated sentence outputting method, recording medium, program, and computer device
KR900006671B1 (en) Language forming system
KR900008402B1 (en) Machine translation system
JPH0528179A (en) Machine translation device
JP4843596B2 (en) Machine translation apparatus and machine translation program
JP3194529B2 (en) Machine translation equipment
JP2010073177A (en) Globally compatible japanese input system
KR100204068B1 (en) Language translation modified method
JP3814000B2 (en) Character string conversion apparatus and character string conversion method
JPH0350668A (en) Character processor
JPS59100941A (en) Kana (japanese syllabary)-kanji (chinese character) converter
JPH10198664A (en) Japanese language input system and medium for recorded with japanese language input program
JPH08272780A (en) Processor and method for chinese input processing, and processor and method for language processing
JP2023146547A (en) Extraction program, device, and method
JPS63316162A (en) Document preparing device
JPH04313158A (en) Machine translation device
JPH11232275A (en) Natural language translating device
JPH04158477A (en) Machine translation device
JPH07152763A (en) Machine translation system and its translating method
JPH0991278A (en) Document preparation device
JPH01197876A (en) Electronic dictionary