JPH02110771A - 電訳機 - Google Patents

電訳機

Info

Publication number
JPH02110771A
JPH02110771A JP63264984A JP26498488A JPH02110771A JP H02110771 A JPH02110771 A JP H02110771A JP 63264984 A JP63264984 A JP 63264984A JP 26498488 A JP26498488 A JP 26498488A JP H02110771 A JPH02110771 A JP H02110771A
Authority
JP
Japan
Prior art keywords
language
word
english
information
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63264984A
Other languages
English (en)
Inventor
Masataka Yoshikawa
吉川 昌隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP63264984A priority Critical patent/JPH02110771A/ja
Publication of JPH02110771A publication Critical patent/JPH02110771A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は、第1の言語(たとえば日本語)から第2の言
語(たとえば英語)に翻訳する場合に使用される電訳機
に関する。
〈従来の技術〉 電訳機を使用して第1の言語から第2の言語に翻訳する
場合には、従来、次の手順によって行われる。たとえば
、日本語から英語に翻訳する場合を例にとって説明すれ
ば、第5図に示すように、まず、日本語の文章が入力さ
れると(ステップ■)、次に、形態素解析が行われる(
ステップ■)。この形態素解析では、単語を切り出して
システムが所有する辞書と照らし合わせ、各単語の品詞
の特定化等の処理を行う。続いて、形態素解析で得られ
た情報に基づいて構文解析を行う(ステップ■)。
すなわち、どの部分が主語で、どの部分が述語であるか
などを決定する。引き続いて、構文解析で得られた結果
に基づいて、日本語の構文から英語の構文に変換するい
わゆる構文変換を行う(ステップ■)。さらに、各単語
ごとに対訳を付け(ステップ■)、その結果を出力する
(ステップ■)。
〈発明が解決しようとする課題〉 ところで、現今では日本語で書かれた文章中に英語の略
語や造語をアルファベットでそのまま表記することが多
々ある。たとえば、第5図に示した例において、オペレ
ーティングシステムは“O8”、ユニックスは“UN 
I X”というように、アルファベット表記されること
がある。したがって、「計算機はO8にUNIXを採用
した。」という文章をそのまま翻訳にかける場合が生じ
る。
しかしながら、英語の略語や造語をアルファベットで表
記した言葉は、特に先端技術分野で多用される傾向にあ
ることから、システムの辞書に未登録であることが多い
。このため、従来では、上記のような“O6″ UNI
X″等のアルファベット表記の言葉が日本語の文章中に
含まれている場合には、そのままでは翻訳不可能となる
ので、これらの言葉を翻訳に先立って事前に、あるいは
翻訳途中でシステムの辞書に登録する作業が必要であっ
た。
しかし、辞書登録されいないアルファベット表記の言葉
がでてくるたびにその都度これを辞書登録するのは登録
作業が極めて煩雑であり、しかも、出現頻度の少ない言
葉まで全て辞書に登録するのは、過剰なメモリ容量が必
要となるため好ましくない。
本発明は、このような事情に鑑みてなされたものであっ
て、翻訳対象となる第1の言語の文章中に第2の言語で
綴った単語が含まれている場合でも、その綴りの単語を
殊更辞書登録しなくても翻訳が自動的に行なえるように
することを目的とする。
〈課題を解決するための手段〉 本発明は、上記の目的を達成するために、第1の言語を
第2の言語に翻訳する電訳機において、次の構成を採る
すなわち、本発明の電訳機では、第1の言語の入力文中
に含まれる第2の言語を検索する検索手段と、この検索
手段で検索された第2言語の単語に対して、第2言語で
あることを示す言語情報ならびに既存の品詞情報を付加
する情報付加手段と、前記第2言語に付加される前記言
語情報の有無を判別し、言語情報が含まれている場合に
は対訳せずに第2言語をそのまま生成する指令を与える
判別手段とを備えることを特徴としている。
く作用〉 上記構成において、翻訳対象となる第1の言語で書かれ
た文章が入力されると、検索手段は、第1の言語の入力
文中に含まれる第2の言語を検索する。第2の言語が検
索されると、情報付加手段が検索された第2言語の単語
に対して、第2言語であることを示す言語情報ならびに
既存の品詞情報(たとえば固有名詞であることのコード
)を付加する。したがって、この第2言語は、以降の構
文解析や構文変換等のデータ処理においては、従来と同
様、一つの品詞として取り扱われる。
そして、対訳生成段階になると、判別手段が第2言語に
付加された言語情報の有無を判別する。
この場合、言語情報が含まれている場合には対訳せずに
第2言語をそのまま生成する指令を与える。
このため、第1言語の文章に予め含まれていた第2言語
は、辞書に登録しなくても訳文中に元の表記のまま移さ
れることになる。
〈実施例〉 、この実施例では、日本語を英語に翻訳する場合につい
て説明する。
第1図はこの実施例に係る電訳機のブロック構成図であ
る。同図において、符号1は電訳機の全体を示し、2は
キーボード、プリンタ等からなる入出力部、4は入力文
章を編集する編集部、6は日本語を英語に翻訳する翻訳
部である。この翻訳部6は、文章を単語に区切って各単
語の品詞を特定化する等の処理を行う形態素解析部8、
この形態素解析部8で得られた情報に基づいて構文解析
を行う構文解析部lO1この構文解析部IOで得られた
結果に基づいて日本語の構文から英語の構文に変換する
構文変換部12および各単語ごとに対訳を付ける生成部
14を備えており、これらの構成は従来の場合と同様で
ある。
この実施例の電訳機lの特徴は、日本語の入力文中に含
まれるアルファベットで表記された英単語を検索する検
索手段16と、この検索手段16で検索された英単語に
対して、英単語であることを示す言語情報ならびに既存
の品詞情報を付加する情報付加手段18と、英単語に付
加される言語情報の有無を判別して言語情報が含まれて
いる場合には対訳せずに英単語をそのまま生成する指令
を与える判別手段20とを備えていることである。
次に、上記構成の電訳機lの翻訳処理手順について、第
2図ないし第4図に示す各フローヂャートを参照して説
明する。
まず、入出力部2から翻訳対象となる文章を人力する。
本例では、「計算機はO8にUNIXを採用した。」と
いう文章が入力されるものとする。
すると、この文章は編集部4で編集された後、翻訳部6
に転送される。第3図に示すように、翻訳部6の形態素
解析部8は、最初に、文章の終わりまでデータ処理が行
われたか否かを判別しくステップ■)、処理が未終了で
あれば、次に、単語を切り出して各単語をシステムが所
有する辞書と照らし合わせて辞書登録されている単語に
一致するか否かを判別する(ステップ■)。辞書と一致
する単語が存在する場合には、続いて、その単語の品詞
を特定化して品詞情報を付加した後、ステップ■に戻る
。たとえば、“計算機”という単語が存在すれば、この
単語に名詞であることの情報を付加する。
ステップ■で辞書と一致する単語が存在しなければ、次
に、情報付加手段18が、アルファベット表記の英単語
か否かを判別する(ステップ■)。
これは、文字コードを調べることで検索することができ
る。すなわち、JISx020Bコードを使用している
場合には、(2341)〜(237A)のコード範囲が
大文字・小文字を含むアルファベットの表記を示してい
るので、このコード列が存在すれば、アルファベット表
記で綴られた英単語であり、それ以外のコードはひら、
かな、漢字のコードと判断することができる。そして、
英単語である場合には、そのコード列に対して英単語で
ある旨の言語情報を付加するとともに(ステップ■)、
既存の品詞情報を付加する(ステップ■)。本例では、
“O8″ “UNIX”に対してそれぞれ英単語である
ことを示すコードを付加され、さらに、この単語が固有
名詞である旨のコードが付加される。
したがって、これらの英単語は、以降のデータ処理では
、一つの品詞(この例では固有名詞)として取り扱われ
ることになる。なお、ステップ■において、単語がアル
ファベット表記でない場合には、翻訳不能の情報を付加
した後(ステップ■)、ステップ■に戻る。
そして、一つの文章の形態素解析が終了すれば、次に、
構文解析部lOにおいて、先の形態素解析部8で得られ
た情報に基づいて文章の構文解析を行う。すなわち、ど
の部分が主語で、どの部分が述語であるかなどを決定す
る。引き続いて、構文変換部12において、構文解析部
10で得られた結果に基づいて、日本語の構文から英語
の構文に変換する。
次に、第4図に示すように、判別手段20が英単語に付
加された言語情報の有無を判別する(ステップ[相])
。その際、言語情報が含まれている場合には対訳せずに
英単語をそのまま生成する指令を生成部14に与える。
このため、入力された日本譜の文章に予め含まれていた
アルファベット表記の英単語は、辞書に登録しなくても
訳文中に元の綴りのまま移されることになる。この例で
は、“OS”UNIX”の単語は、日本語の文章で入力
したのとそのままのかたちで英文中に表記される。また
、ステップ[相]で言語情報が付加されていない場合に
は、生成部14で従来と同様の対訳処理を行い、処理後
の訳文が編集部4を介して入出力部2に出力される。
なお、この実施例では、日本語から英語に翻訳する場合
について説明したが、これに限定されるものではなく、
使用する文字が異なる言語間で翻訳する場合に本発明を
広く適用することができるのは勿論である。
〈発明の効果〉 本発明によれば、翻訳対象となる第1の言語の文章中に
第2の言語で綴った単語が含まれている場合でも、その
綴りの単語を殊更辞書登録しなく翻訳が自動的に行われ
るようになる。このため、従来のような辞書登録の作業
の煩雑が解消される等の優れた効果が発揮される。
【図面の簡単な説明】
第1図ないし第4図は本発明の実施例を示すもので、第
1図は電訳機のブロック構成図、第2図は翻訳手順の全
体の流れを示すフローチャート、第3図は形態素解析中
のデータ処理手順を示すフローチャート、第4図は対訳
生成中のデータ処理手順を示すフローチャートである。 また、第5図は従来の翻訳手順を示すフローチャートで
ある。 ■・・・電訳機、6・・・翻訳部、8・・・形態素解析
部、10・・・構文解析部、12・・・構文変換部、1
4・・・生成部、16・・・検索手段、18・・・情報
付加手段、20・・・判別手段。

Claims (1)

    【特許請求の範囲】
  1. (1)第1の言語を第2の言語に翻訳する電訳機におい
    て、 第1の言語の入力文中に含まれる第2の言語を検索する
    検索手段と、 この検索手段で検索された第2言語の単語に対して、第
    2言語であること示す言語情報ならびに既存の品詞情報
    を付加する情報付加手段と、前記第2言語に付加される
    前記言語情報の有無を判別し、言語情報が含まれている
    場合には対訳せずに第2言語をそのまま生成する指令を
    与える判別手段と、 を含むことを特徴とする電訳機。
JP63264984A 1988-10-20 1988-10-20 電訳機 Pending JPH02110771A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63264984A JPH02110771A (ja) 1988-10-20 1988-10-20 電訳機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63264984A JPH02110771A (ja) 1988-10-20 1988-10-20 電訳機

Publications (1)

Publication Number Publication Date
JPH02110771A true JPH02110771A (ja) 1990-04-23

Family

ID=17410948

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63264984A Pending JPH02110771A (ja) 1988-10-20 1988-10-20 電訳機

Country Status (1)

Country Link
JP (1) JPH02110771A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04256161A (ja) * 1991-02-08 1992-09-10 Nec Software Ltd 外国人名データ判定方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04256161A (ja) * 1991-02-08 1992-09-10 Nec Software Ltd 外国人名データ判定方式

Similar Documents

Publication Publication Date Title
US5890103A (en) Method and apparatus for improved tokenization of natural language text
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
EP1111514B1 (en) Phrase translation method and system
JP3356536B2 (ja) 機械翻訳装置
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JPH0644296A (ja) 機械翻訳装置
JPS6211932A (ja) 情報検索方法
JPH02110771A (ja) 電訳機
JPS61248160A (ja) 文書情報登録方式
JPH08329059A (ja) 汎用参照装置
JPS6395573A (ja) 日本語文形態素解析における未知語処理方法
JPH0561902A (ja) 機械翻訳システム
JPH0232467A (ja) 機械翻訳方式
JP2972212B2 (ja) 機械翻訳方法及びシステム
JP2608384B2 (ja) 機械翻訳装置及びその方法
JPH0320866A (ja) テキストベース検索方式
JP3233283B2 (ja) 日本文文章解析装置
JPH0816910B2 (ja) 言語解析装置
JPH0778166A (ja) 翻訳方法及び機械翻訳装置
JPH05225232A (ja) テキスト自動前編集装置
JPH04262459A (ja) 機械翻訳装置
JPH05197752A (ja) 機械翻訳装置
JPH10105552A (ja) 機械翻訳システム
JPS6395572A (ja) 日本語文形態素解析における未知語処理方法
JPH0443464A (ja) 辞書検索処理方式