JPH0452763A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH0452763A
JPH0452763A JP2155718A JP15571890A JPH0452763A JP H0452763 A JPH0452763 A JP H0452763A JP 2155718 A JP2155718 A JP 2155718A JP 15571890 A JP15571890 A JP 15571890A JP H0452763 A JPH0452763 A JP H0452763A
Authority
JP
Japan
Prior art keywords
translation
sentence
translated
original text
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2155718A
Other languages
English (en)
Inventor
Yoshihisa Oguro
慶久 大黒
Yoshitoku Arai
荒井 良徳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2155718A priority Critical patent/JPH0452763A/ja
Publication of JPH0452763A publication Critical patent/JPH0452763A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 肢生分互 本発明は、機械翻訳装置に関し、より詳細には、音声認
識による翻訳結果の編集機能を有する機械翻訳装置に関
する。
従来技術 現在の自然言語処理技術では、全ての原文を正しく機械
翻訳することは不可能であり、正確な訳文を得るために
は翻訳処理の過程で何らかの校正が必要である。従来、
翻訳処理に関する校正としては、原文に対して行う前編
集と、生成された訳文に対して行う後編集がよく知られ
ている。しかしながら、前編集を行うには当該原文を理
解・解釈しなければならず、機械翻訳をするまでもなく
、前編集実行者は訳文を得ることになり、人手による翻
訳と比較して必ずしも効率的ではなかった。
また、機械翻訳の結果に対して後編集をする場合におい
でも、後編集実行者は原文を理解・解釈し、かつ訳文を
校正する能力(例えば、訳文を理解して校正結果を入力
する能力)が要求され、後編集に適した操作者は非常に
限られている。
一方、音声認識技術においても、不特定話者の制限のな
い自然言語の認識は不可能な状態であり、話者・諸費・
発声内容・環境などに対する制限の下で研究が進められ
ているが、ある特定の制限の中では実用に耐え得る性能
をもつシステムも現れ始めている。
l−一的 本発明は、上述のごとき実情に鑑みてなされたもので、
音声認識技術を利用し25機機械翻訳装置後編集におい
て操作者が校正結果を読み」−げることによって容易か
つ迅速に訳文の修正・入力を行える機能を有する機械翻
訳装置を提供することを目的としてなされたものである
構−一−−戊− 本発明は、上記目的登達成するために、(])少なくと
も対象言語の原文を入力するための入力手段と、該入力
手段りこより入力された原文を記憶する記憶手段と、言
語解析に必要な知識を記憶している解析辞書と、前記記
憶手段に記憶された対象言語の原文を、前記解析辞書を
用いて目的言語に翻訳する翻訳手段と、前記入力手段に
より入力さ九た原文と前記翻訳手段により翻訳された翻
訳結果登表示するための表示手段と、原文からの翻訳結
果に規定される諸費を認識対象として音声認識する音声
認識手段とを有すること、更には、(2)前記音声認識
手段が、原文からの翻訳結果に規定される格構造を有す
る文を音声認識するものであること、更には、(3)前
記音声認識手段が、原文からの翻訳結果に規定される統
語構造を有する文を音声認識するものであることを特徴
としたものである。すなわち、本発明では後編集におい
で利用する音声認識系の対象とする諸費・発声内容を、
機械翻訳系での原文で規定される翻訳結果に限定するこ
とによって、認識性能の向上を図ることを特徴としたも
のである。以下5本発明の実施例に基づいて説明する。
まず第2図に基づき、英日機械翻訳装置の一実施例につ
いて説明する。図中、]1は形態素解析部、]2は辞書
、13は屈折語形ファイル、14は情報ファイル1.1
5は構文解析部、16は文法規則、コアは解析ルール1
.18は英語構造同定部、コ−9は情報ファイル2.2
0は解析ルール2.21は情報ファイル3.22は変換
部、23は情報ファイル4.24は構文生成部、25は
形態素生成部である。機械翻訳システム装置中の辞書1
2には、語形、活用形、品詞、訳語などが記述さatて
いる。
入力された英文は、まず形態素解析部11で一つ〜つの
単語として認定され、称号十姓や数字千単位などの特別
な文字列は句としてまとめられる。
構文解析部]5で人力英文の構造が解析される。
入力文に対して辞書記述内容と文法ルールを適用するこ
とによjJ文構造を決定していく。例えば、前置詞十冠
詞十名詞が副詞句と解析される。
英語構造同定部18では、係り受は関係等を明らかにす
るために動詞ノードを親とする木構造が作られ、副詞句
の係り先等が決まる。次に、共起条件の成立が調べら、
tll、妥当な訳語が取られる。
前記本構造は変換部22で日本語の言い回しを表わし易
い中間構造に変換される。構文生成部24では文節単位
で日本語を生成した後、形態素生成部25で助詞の並び
を決定し、たり、用言の活用形を整える。
第3図は、第2図に示した英日機械翻訳の動作を説明す
るためのフローチャー1−である。以下、各ステップに
従って順に説明する。
ste、pl−;対象言語の原文を入力手段、例えばタ
イプ入力やOCR(光学式文字認識装置)などの入力手
段により入力する。
且(吐、2−;原文に対して翻訳するための前編隻浸行
う。
共町−褐;対象言語の原文(ここでは英語)を目的言語
(ここでは日本語)に翻訳する。
5tep4 ;生成された訳文に対して後編集を行う。
社t9■−可;訳文を出力する。
次に具体例を示す。
I  saw  a  girl  in  the 
 park+文末から一語ずつ取り出して辞書引きをす
る。
構文解析部15で文末から始めて右から左に、辞書記述
内容と文法ルールを適用することにより文構造が次のよ
うに決定される。
SNT (文)−> S(主語)+V(他動詞)+O(
直接目的語)+前置詞句+ピリオド この文構造をもとに英語構造同定部18では、係り受は
関係を表わす本構造が次のTree 1とTree 2
のように複数個作られる。なお、S:主語、v:動詞、
A:冠詞、P:前置詞、○:目的語であり、/  /内
は注である。
Tree  1 十−(V) saw/他動詞/ 十−(S)I/代名詞/ 十−(0) girl/名詞/ 十−(A)a/冠詞/ 十−(P)in/前置詞/ 十−(0) park/名詞/ +−−(A) the/冠詞/ Tree  2 +−−(V) saw +−(S)I +−−(○) girl +−−(A) a +−−(P) in /Treelの場合と係り先が異なる/+−(○) p
ark +−−(A) the Tree 1.とTree 2.の木構造の情報と辞書
記述を参照して共起条件の検査を行い、訳語、助詞類を
選ぶことによって訳文への変換が行われる。
変換1− A / Tree 1より/V >see会
う + S>  I  私[がコ (以下余白) 変換1−B  / Tree 2より /V >see
見る + 変換I  C/ Tree 1より /−Visa%l
のこぎりで切る + 変換2 / Tree 2より / V >sep会う 十 + −P)park公園[のコ 上記のような解析の結果を形態素生成部25に送り、該
形態素生成部25で次のような日本語文を完成させる。
変換1−Aより 「私は公園で少女に会った。」 変換1−Bより 「私は公園で少女を見た。」 変換1−Cより 「私は公園で少女をのこぎりで切る。」変換2より 「私は公園の少女に会った。」 最終的に以下の訳文が得られる。
〈〈後編集〉〉 I saw a girl in the park。
1、私は公園で少女を見た。
2、私は公園で少女に会った。
3、私は公園で少女をのこぎりで切る。
4、私は公園の少女に会った。
後編集実行者は所望の訳文が得られたならば訳文を確定
する。所望の訳文が得られなかった場合(解析が不可能
、誤った解析、不適当な訳語・語順など)には、原文に
対する正しい訳文を読み上げる。この発声を音声認識系
に入力して発声内容を認識する。この時発声される訳文
の構造及び含まれる語常は、機械翻訳系における訳文変
換時で求めた構造及び諸費であることが予想される。す
なわち変換1−A、変換1−B、変換]2−C5変換2
における訳文の構造及び諸費である。
現在の連続音声認識技術では、なめらかに発声された制
限のない自然S語文を正しく認識することは非常に困離
である。したがって認識対象を機械翻訳の過程で求めた
訳文変換時の構造または諸費に限定することは、連続音
声認識の性能を著しく向ゴニさせる。
さらに日本語の場合、語順は比較的自由であるが、格構
造によりある程度助詞を決定することが可能なため、日
本語の連続音声認識の内でも特に認識が難しい格助詞の
問題を回避することができて都合がよい。
第1図は、本発明による機械翻訳装置の一実施例を説明
するための構成図で、図中、]−は原文人力部、2は前
編集部、3は形態素解析部、4は構文解析部、5は変換
生成部、6は音声認識対象の規定部、7は音声認識部、
8は辞書/文法規則、9aは機械翻訳系、9bは音声認
識系、10は訳文出力部である。
機械翻訳系9aは前編集部2、形態素解析部3゜構文解
析部4、変換生成部5から成り、前記形態素解析部3は
入力された原文から形態素を抽出し、該抽出された形態
素がどのように結合して語を形成しているかを解析し認
定する。前記構文解析部4は、前記形態素解析部3によ
り形態素解析されて得られた品詞情報などをもとに原文
の結語構造を求める。前記変換生成部5は対象言語の原
文を目的言語の訳文に変換し、訳文を生成する。
次に、音声認識系9bは、音声認識対象の規定部6と音
声認識部7から成り、該音声認識対象の規定部6は、原
文からの翻訳結果による訳文に対し、格構造や統語構造
の言語的制約を適用する。
前記音声認識部7は言語的制約を利用し、単語や文の認
識を行う。
以下、上述した原文”I saw a girl j、
n thepark、 ”に対する訳文を、[公園にお
いて私が女の子を見ました。」に訂正する場合における
認識過程を説明する。
■ 換結果に基づく!!識対象の規定 前記変換1−Aより認識対象語常は 11 I IJ    「私/ watasi/ J 
 rは/wa/」11park” 「公園/ kooe
N / J  rで/de/」11g1rlPl  「
少女/ 5yoozyo / J  rに/ni/J”
5aii”   r会った/ aQta / Jである
。ここで//内は発声内容を記述したもので、/N/は
撥音「んJを/Q/は促音「っJを表す。
さらに以上に加え、原文中の単語を辞書引きすることに
よって、これらの語句の言い替えを求める。なお実際は
、変換後には既にこの結果は求められている場合が多い
次の言い替え語句が得られたとする。
“1″「私/ watak+rsi / J  「が/
ga/J11park++  (「公園」)「において
/n1oite/J「の中で/ nonakade/ 
J ″gjr1″「女の子/ oNnanoko / J 
 (rに」)SaW   r会いました/ aimas
ita / J同様に 変換1−Bより 「私」 「は」 「公園」 「で」 「少女」 「を」
「見た」 変換1−Cより 「私」 「は」 「公園」 「で」 「少女」 「を」
「のこぎり」 「で」 「切る」 変換2より 「私」 「はJ 「公園」 「の」 「少女」 「に」
「会った」 などの語句が得られ、変換1−Aと同じく言い替え語句
も求められる。
■認識用標準パターンの作成 前記■で求めた認識対象語夕の標準パターンを作成する
。連続音声認識システムにおいては、認識する最小単位
は音韻・音節などである場合が多く、対象語句の発音表
記から単語単位の標準パターンを作成することは容易で
ある。
■単語・文の認識 入力音声と前記■で求めた標準パターンを照合すること
により単語の認識を行う。この時、訳文変換時に求めら
れた訳文の言語的制約を適用することも可能である。言
語的制約とは格構造や統語構造(係り受は関係含む)な
どである。
例えば主格である「私」に関して、 ○「私は」 「私が」 は許されるが、 ×「私で」 「私に」 は許されない(格構造的制約)。
また日本語においては普通述語は文末にくるため。
○「〜会いました。」 「〜見た。」 は許されるが ×「会いました、私は〜」 「公園で見た、少女を〜」 は許されない(統語構造的制約)。
また原文の係り受は関係により ○[私は公園の少女を見た。」 ○「公園の少女を私は見た。j は許されるが、 ×「公園の私は少女を見た。」 は許されない(統語構造的制約)。
さらに原文“I saw a girl in the
 parkyesterday、−訳文「私は昨日公園
の少女を見た。」の場合には、係り受は規則における非
交差条件が適用でき、 ○「昨日私は公園の少女を見た。」 ○「私は公園の少女を昨日見た。」 は許されるが O「私は公園の昨日少女を見た。」 は許されない(統語構造的制約)。
結果の確定 所望の訳文「公園において私が女の子を見ました。」は
、前記■■■の諸費や言語的制約を満たしているため認
識される。
以上示したように、機械翻訳系の訳文変換時に得られる
諸費や言語的制約を利用すれば、音声認識対象を限定す
ることができるため、現在の不十分な音声認識技術を用
いたとしても、所望の訳文を認識することは十分可能で
ある。
本発明は以上の実施例に限定されるものではなく、原文
における言語的制約を訳文に適するよう変換し、この制
限に基づき音声認識対象を規定し、音声による翻訳結果
の編集機能を有する機械翻訳システムを提供することに
本質がある。
然−一來 以上の説明から明らかなように、本発明によると、以下
のような効果がある。
(1)請求項1に対応する効果;音声認識技術を利用し
、機械翻訳結果の後編集において操作者が校正結果を読
み上げることによって容易かつ迅速な訳文の修正や入力
を行える機能を有するので、言語的制約のないある程度
自由な訳文編集が可能である。
(2)請求項2,3に対応する効果;対象言語の原文か
らの翻訳結果に規定され、格構造や統語構造を有する文
を音声認識するようにしたので、音声認識対象を限定す
ることができ、高精度の認識が期待できる。
【図面の簡単な説明】
第1図は、本発明による機械翻訳装置の一実施例を説明
するための構成図、第2図は、英日機械翻訳装置の一実
施例を説明するための構成図、第3図は、英日機械翻訳
装置の動作を説明するためのフローチャートである。 1・・・原文人力部、2・・・前編集部、3・・・形態
素解析部、4・・構文解析部、5・・・変換生成部、6
・・・音声認識対象の規定部、7・・・音声認識部、8
・・・辞書/文法規則、9a・・・機械翻訳系、9b・
・・音声認識系、1o・・・訳文出力部。 第 ] 図 第 区 入力テキスト(英文) ■ 出力テキスト(日本文)

Claims (1)

  1. 【特許請求の範囲】 1、少なくとも対象言語の原文を入力するための入力手
    段と、該入力手段により入力された原文を記憶する記憶
    手段と、言語解析に必要な知識を記憶している解析辞書
    と、前記記憶手段に記憶された対象言語の原文を、前記
    解析辞書を用いて目的言語に翻訳する翻訳手段と、前記
    入力手段により入力された原文と前記翻訳手段により翻
    訳された翻訳結果を表示するための表示手段と、原文か
    らの翻訳結果に規定される語彙を認識対象として音声認
    識する音声認識手段とを有することを特徴とする機械翻
    訳装置。 2、前記音声認識手段が、原文からの翻訳結果に規定さ
    れる格構造を有する文を音声認識するものであることを
    特徴とする請求項1記載の機械翻訳装置。 3、前記音声認識手段が、原文からの翻訳結果に規定さ
    れる統語構造を有する文を音声認識するものであること
    を特徴とする請求項1記載の機械翻訳装置。
JP2155718A 1990-06-14 1990-06-14 機械翻訳装置 Pending JPH0452763A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2155718A JPH0452763A (ja) 1990-06-14 1990-06-14 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2155718A JPH0452763A (ja) 1990-06-14 1990-06-14 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH0452763A true JPH0452763A (ja) 1992-02-20

Family

ID=15611972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2155718A Pending JPH0452763A (ja) 1990-06-14 1990-06-14 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH0452763A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5848516A (en) * 1994-09-12 1998-12-15 Canon Kabushiki Kaisha Method of manufacturing a toner bottle

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5848516A (en) * 1994-09-12 1998-12-15 Canon Kabushiki Kaisha Method of manufacturing a toner bottle

Similar Documents

Publication Publication Date Title
JPH0782498B2 (ja) 機械翻訳システム
WO2010046782A2 (en) Hybrid machine translation
Wang et al. MUXING: a telephone-access Mandarin conversational system.
JPS6318458A (ja) 感情情報抽出装置
WO2003017251A1 (en) Prosodic boundary markup mechanism
JP3441400B2 (ja) 言語変換規則作成装置、及びプログラム記録媒体
Anto et al. Text to speech synthesis system for English to Malayalam translation
JPH0452763A (ja) 機械翻訳装置
Maziarz et al. Chunking of Polish: guidelines, discussion and experiments with Machine Learning
JPH08190562A (ja) 機械翻訳装置
Bennett The relevance of linguistics for machine translation
Gibbon et al. Spoken Language Characterization
Matlatipov et al. Designing a tree-based model for analyzing the syntax of uzbek language sentences
Huang An evaluation of POS taggers for the CHILDES corpus
Kager et al. Deriving prosodic sentence structure without exhaustive syntactic analysis.
JP3972699B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Matsuoka et al. Natural language processing in a Japanese text-to-speech system for written-style texts
Gokhale et al. A Survey of Morphological Analysis for Marathi Language
JP4033012B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Dzenisiuk Automatic Generation of Intonation Marks and Prosodic Segmentation for Belarusian NooJ Module
Hoffmann A data-driven model for the generation of prosody from syntactic sentence structures
JPH1166069A (ja) 機械翻訳装置
JP4033088B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Kui et al. The court interpreters’ office
Fry et al. Semantic annotation of a Japanese speech corpus