JP2769919B2 - 変換主導型機械翻訳方法 - Google Patents

変換主導型機械翻訳方法

Info

Publication number
JP2769919B2
JP2769919B2 JP2318672A JP31867290A JP2769919B2 JP 2769919 B2 JP2769919 B2 JP 2769919B2 JP 2318672 A JP2318672 A JP 2318672A JP 31867290 A JP31867290 A JP 31867290A JP 2769919 B2 JP2769919 B2 JP 2769919B2
Authority
JP
Japan
Prior art keywords
translation
knowledge
bilingual
viewpoint
driven machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2318672A
Other languages
English (en)
Other versions
JPH04188276A (ja
Inventor
英一郎 隅田
蔵 古瀬
仁 飯田
Original Assignee
株式会社エイ・ティ・アール自動翻訳電話研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社エイ・ティ・アール自動翻訳電話研究所 filed Critical 株式会社エイ・ティ・アール自動翻訳電話研究所
Priority to JP2318672A priority Critical patent/JP2769919B2/ja
Publication of JPH04188276A publication Critical patent/JPH04188276A/ja
Application granted granted Critical
Publication of JP2769919B2 publication Critical patent/JP2769919B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は機械翻訳方法に関し、特に、解析処理など
の各処理単位が要求駆動で変換処理から起動されるよう
な変換主導型機械翻訳方法に関する。
[従来の技術および発明が解決しようとする課題] 電子計算機による機械翻訳のシステムは、ますますそ
の需要が高まり、研究開発が盛んに行なわれている。特
に、最近では、技術文書だけでなく、医者と患者との会
話や目的指向の電話会話の翻訳など、多様な分野への適
用も行なわれるようになった。
第4図は従来の解析主導型機械翻訳方式と称される電
子計算機による機械翻訳の手順を説明するためのフロー
図である。第4図において、従来の機械翻訳システム
は、入力部から入力された原言語文が解析部で解析処理
され、変換部で変換処理され、生成部で生成処理されて
目的言語文に翻訳される。このうち、解析処理がシステ
ム全体の能力(速度,訳の質)を決定していた。
しかしながら、解析主導型機械翻訳方式では、解析処
理が翻訳と独立に設計され、翻訳に必要十分な情報を得
られないことが多い。換言すれば、翻訳のために不十分
な情報しか得られず、翻訳の質が悪くなったり、翻訳に
不必要な処理が常時行なわれ、解析処理の速度は遅くな
ることによって翻訳全体の速度が極端に遅くなったりし
ていた。
しかも、解析主導型機械翻訳方式では、解析が単語か
ら構成的に行なわれ、換言すれば単語の品詞,品詞およ
び文法範疇から新たに文法範疇を構成する規則の適用の
履歴としての木構造を変換の基礎にするために、大局的
な対応を実現するのが困難であり、特に日本語と英語の
ように言葉の成立、したがって、語彙,文法が著しく違
う場合に良質の翻訳は得られなかった。
それゆえに、この発明の主たる目的は、翻訳速度およ
び翻訳の質の向上を実現できるような変換主導型機械翻
訳方法を提供することである。
[課題を解決するための手段] この発明は入力された原言語文を類似度に従って最適
な目的言語文に翻訳する機械翻訳方法であって、単語
列,句,文型,構造などに対応したn段階からなり、原
言語と目的言語の対応が1対多であり、目的言語を選択
するための条件を記述した対訳変換知識データベースか
ら検索した、入力された原言語文に関連した対訳変換知
識に従って変換を行ない、変換過程での負荷の少ない対
訳変換知識のみでは翻訳できない場合のみ負荷が次に少
ない解析処理が起動される。
[作用] この発明に係る変換主導型機械翻訳方法では、解析を
中心とすることなく、単語列,句,文型,構造などに対
応したn段階からなり、原言語と目的言語の対応が1対
多であり、目的言語を選択するための条件を記述した対
訳変換知識に基づいて変換を行ない、変換過程での負荷
の少ない対訳変換知識のみでは翻訳できない場合にの
み、負荷が次に少ない解析処理を起動することにより、
翻訳速度,翻訳の質の向上を実現できる。
[発明の実施例] 第1図はこの発明の一実施例の概略ブロック図であ
る。第1図を参照して、入力部1はキーボードや文字認
識装置や音声認識装置などからなり、原言語文が入力さ
れて同時に単語ごとに分割され、品詞などの情報が辞書
に従って付与される。入力された原言語文は変換機構2
に与えられる。変換機構2は原言語の単語列または要求
駆動で作られた原言語の解析結果の部分(全体も含む)
に関連した対訳変換知識を対訳変換知識データベース7
から検索部3によって検索し、その関連した対訳変換知
識と入力(原言語の単語列または解析結果)とを類似度
計算部4によって照合し、最も近い対訳変換知識に従っ
て、部分的な翻訳をつくり出す。このことを再帰的に繰
り返す。
一方、解析部5は上述の変換過程で負荷の低い対訳変
換知識のみでは翻訳できない場合にのみ起動される。こ
の点が従来の解析主導機械翻訳との明確な相違である。
変換機構2の出力は出力部6に与えられ、活用変化,語
尾変化などが行なわれ、表示装置,印刷装置,音声合成
装置などによって、目的言語文が出力される。
第2図は従来の変換方式とこの発明の一実施例による
複数の観点から整理された知識を使った変換方式との相
違を説明するための図である。
まず、簡単な例で基本的な翻訳過程を説明する。
{1J}日本の首都は東京です。
{1E}Capital of Japan is Tokyo. {1J}から{1E}の翻訳を得るために、検索部3は対訳
変換知識データベース7から次の対訳変換知識を検索す
る。
A は B です→A is B C の D→ D of C 日本→Japan 首都→Capital 東京→Tokyo この検索は再帰的に、入力と対訳変換知識データベー
ス7の対訳変換知識との最大照合(最も大きな範囲をカ
バーする照合)によって検索部3が行なう。変換は検索
と同時に、トップダウンに行なわれる。この例文の場合 A is B、D of C is B、 Capital of Japan is Tokyoとなる。
次に、高度な例で基本的な翻訳過程について説明す
る。前述の{1J}と同じ文型の次の例文{2J}は従来方
式である単語から要素構成原理によって翻訳する解析主
導型機械翻訳方式では翻訳が困難であるが、この発明の
一実施例では簡単に良質の翻訳{2E}が得られることを
示す。
{2J}料金は現金です。
{2E}Payment should be made by cash. A は B です→A is B 料金→charge 現金→cash 以上の3つの対訳変換知識から得られる英文でcharge
is cashは誤った翻訳である。この例文は、単語から要
素構成原理によって翻訳する解析主導型機械翻訳でも誤
ってしまう。しかし、この発明の一実施例では、適切な
対訳変換知識と類似度算によって良質の翻訳が得られ
る。日本語文{2J}の場合、後述の対訳変換知識例で示
される対訳変換知識を用いて、英語文{2E}が得られ
る。
次に、対訳変換知識について説明する。対訳変換知識
の一般形は原言語表現SEに対応する目的言語表現TEとそ
の対応が成立するときの条件Cからなり、この発明の一
実施例では以下の表記法を用いる。
SE→TE(C) 入力文の条件Cinputの下で原言語表現SEに対応する目
的言語表現を求めるとき、次の2つの場合がある。
原言語表現SEに対応する目的言語表現が1通りの場
合、すぐTEが出力される。
同じ原言語表現SEに対応する目的言語表現が異なる
2つ、TE1,TE2とあり、それぞれの条件がC1,C2であった
とする。このとき、CinputとC1,C2の類似度計算によっ
て訳の選択が行なわれる。条件Cinput,C1,C2は文脈(よ
り広い範囲の表現)に関することもある。
次に、要求駆動について説明する。対訳変換知識は複
数の観点から構成されている。この実施例では、簡単の
ため、単語列,文型,依存構造の3つの観点を取上げ
る。左から右に順に、深くなる(負荷が多くなる)。変
換主導型機械翻訳は、第2図(b)に示すように浅い知
識が優先される。第2図(a)に示すような従来の解析
主導型機械翻訳とは異なり、浅い観点で適合する知識が
ない場合のみ解析部5が起動される。
次に、対訳変換知識例について説明する。
目的言語表現TEが1通りの場合、すぐTEが出力され
る。
ありがとう ございます→thank you わからない点→a question 目的言語表現TEが複数の場合 (1)TEが原言語の類似度(CinputがC1,C2のいずれに
類似しているか)によって選択される。
AはBです→Payment should be made by B. ((A,B)〜(料金、現金)) AはBです→This is B ((A,B)〜(こちら、事務局)) AはBです→A is B ((A,B)〜(名前、<固有名詞>)、…) (2)TEが文脈によって選択される。
はい→yes (前文がYN疑問文) はい→hello (入力が最初の発話) はい→yes,please (前文が「お聞きしたいことがあるのですが」と類似) 検索部3は索引によって高速化される。以下に例示す
るような原言語表現SEそのものまたはその要素の単語の
集合など種々のものが索引の見出しとして有効である。
単語列 もしもし、ありがとう ございます、わからない 点 この索引は特に定型表現に適している。
文型(機能語列) 〜は〜です、〜たい の です が 基本的な入力の多くがこの観点で処理されるので、こ
の索引は特に重要である。
構造(部分依存構造) (名詞 (連体形の動詞…)) この索引は連体形埋込み文の翻訳などのように、一般
的な対訳変換知識規則のために有効である。
第3図は比較的複雑な例文の翻訳過程を模式的に示し
た図である。
{3J}わからない点がございましたらいつでもお聞きく
ださい {3E}If you have a question please ask us at anyt
ime。
入力と最大照合する対訳変換知識を選択する。入力
と「〜たら〜ください」という原言語表現SEを持つ対訳
変換知識がステップ(1)で最大照合し、その対訳変換
知識の目的言語表現TE「If〜please〜」に従って、ステ
ップ(1′)で部分的に翻訳される。
単語列,文型など浅い観点の知識で適合するものがな
い場合は、解析部5が起動され、その結果と構想の観点
の知識とを照合する。たとえば「分から ない 点」は
浅い対訳変換知識に照合するので、解析部5は起動され
ないが、「分から ない ない 本」は浅い対訳変換知
識に照合しないので解析部5が起動され、連体形埋込み
文のための構造の観点での対訳変換知識によって翻訳さ
れる。
「〜」に適合した入力の部分に対して再帰的に同じ手
続が適用され、必要な場合は文脈が参照される。
[発明の効果] 以上のように、この発明によれば、解析処理を中心と
することなく、要求駆動で変換処理から解析処理を起動
することにより、翻訳速度および翻訳の質の向上を実現
する。より具体的には、単語から要素構成原理によって
翻訳するのではなく、単語列,文型,構造など大局的な
翻訳知識によって良質の翻訳を実現でき、要求駆動によ
る高速な翻訳を実現でき、システムの知識の作成,改良
が容易となる。
【図面の簡単な説明】
第1図はこの発明の一実施例の概略ブロック図である。
第2図は従来の変換方式とこの発明の一実施例による複
数の観点から整理された知識を使った変換方式との相違
を説明するための図である。第3図は比較的複雑な文を
変換主導型機械翻訳方式で翻訳する過程を模式的に示し
た図である。第4図は従来の解析主導型機械翻訳方式の
手順を示すフロー図である。 図において、1は入力部、2は変換機構、3は検索部、
4は類似度計算部、5は解析部、6は出力部、7は対訳
変換知識データベースを示す。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 飯田 仁 京都府相楽郡精華町大字乾谷小字三平谷 5番地 株式会社エイ・ティ・アール自 動翻訳電話研究所内 (56)参考文献 特開 昭63−86071(JP,A) 中村俊、「テンプレートを用いた翻訳 機構」、情報処理学会第39回(平成元年 後期)全国大会講演論文集(▲I▼). P.704(1989) 佐藤理史、長尾真、「実例に基づいた 翻訳」、情報処理学会第38回(昭和64年 前期)全国大会講演論文集(▲I▼). P.333−P.334(1989) (58)調査した分野(Int.Cl.6,DB名) G06F 17/20 G06F 17/27 G06F 17/28 JICSTファイル(JOIS)

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された原言語文を類似度に従って最適
    な目的言語文に翻訳する機械翻訳方法であって、 単語列,句,文型,構造などに対応したn段階からな
    り、原言語と目的言語の対応が1対多であり、目的言語
    を選択するための条件を記述した対訳変換知識データベ
    ースから検索した、前記入力された原言語文に関連した
    対訳変換知識に従って変換を行ない、 前記変換過程で負荷の少ない対訳変換知識のみでは翻訳
    できない場合にのみ、負荷が次に少ない解析処理が起動
    されることを特徴とする、変換主導型機械翻訳方法。
  2. 【請求項2】前記対訳変換知識は複数の観点から構成さ
    れていることを特徴とする、請求項第1項記載の変換主
    導型機械翻訳方法。
  3. 【請求項3】前記各観点ごとに入力をその観点の表現に
    写像する解析処理が存在することを特徴とする、請求項
    第2項記載の変換主導型機械翻訳方法。
  4. 【請求項4】前記各解析処理の負荷が少ない方から多い
    方へ各観点ごとに対訳変換知識が構造化されていること
    を特徴とする、請求項第3項記載の変換主導型機械翻訳
    方法。
  5. 【請求項5】前記各観点ごとに構造化された対訳変換知
    識は負荷が少ない方から順に使用され、観点nで入力と
    照合する知識がない場合のみ観点(n+1)の表現に写
    像する解析処理を起動して、負荷の多い観点(n+1)
    の対訳変換知識を使用することを特徴とする、請求項第
    4項記載の変換主導型機械翻訳方法。
JP2318672A 1990-11-21 1990-11-21 変換主導型機械翻訳方法 Expired - Fee Related JP2769919B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2318672A JP2769919B2 (ja) 1990-11-21 1990-11-21 変換主導型機械翻訳方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2318672A JP2769919B2 (ja) 1990-11-21 1990-11-21 変換主導型機械翻訳方法

Publications (2)

Publication Number Publication Date
JPH04188276A JPH04188276A (ja) 1992-07-06
JP2769919B2 true JP2769919B2 (ja) 1998-06-25

Family

ID=18101744

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2318672A Expired - Fee Related JP2769919B2 (ja) 1990-11-21 1990-11-21 変換主導型機械翻訳方法

Country Status (1)

Country Link
JP (1) JP2769919B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2588167B2 (ja) * 1986-01-14 1997-03-05 株式会社東芝 機械翻訳装置
JPS6386071A (ja) * 1986-09-30 1988-04-16 Nippon Telegr & Teleph Corp <Ntt> 自然言語翻訳方式

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中村俊、「テンプレートを用いた翻訳機構」、情報処理学会第39回(平成元年後期)全国大会講演論文集(▲I▼).P.704(1989)
佐藤理史、長尾真、「実例に基づいた翻訳」、情報処理学会第38回(昭和64年前期)全国大会講演論文集(▲I▼).P.333−P.334(1989)

Also Published As

Publication number Publication date
JPH04188276A (ja) 1992-07-06

Similar Documents

Publication Publication Date Title
US6243669B1 (en) Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6266642B1 (en) Method and portable apparatus for performing spoken language translation
US6282507B1 (en) Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6278968B1 (en) Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
JP4439431B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US6442524B1 (en) Analyzing inflectional morphology in a spoken language translation system
JP4050755B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US20020198713A1 (en) Method and apparatus for perfoming spoken language translation
Nishimura et al. Multi-source neural machine translation with missing data
Sak et al. Morpholexical and discriminative language models for Turkish automatic speech recognition
JP2000353161A (ja) 自然言語生成における文体制御方法及び装置
KR100853173B1 (ko) 통계적 자동 번역 방식에 기반한 음성 자동 통역 시스템 및그에 적용되는 번역 처리 방법 및 그 훈련방법
Milde et al. Multitask sequence-to-sequence models for grapheme-to-phoneme conversion.
Jabaian et al. Comparison and combination of lightly supervised approaches for language portability of a spoken language understanding system
CN111553157A (zh) 一种基于实体替换的对话意图识别方法
Yaseen et al. Building Annotated Written and Spoken Arabic LRs in NEMLAR Project.
JP2769919B2 (ja) 変換主導型機械翻訳方法
Spiegel Proper name pronunciations for speech technology applications
Arisoy et al. Lattice extension and vocabulary adaptation for Turkish LVCSR
Shukla et al. A Framework of Translator from English Speech to Sanskrit Text
JP4643183B2 (ja) 翻訳装置および翻訳プログラム
JP2001117583A (ja) 音声認識装置および音声認識方法、並びに記録媒体
JP2902343B2 (ja) 言語解析システムおよび方法
Lakshmi et al. State-of-the-art automatic machine transliteration systems for Indic scripts: a comparative report
Batsukh Sentence Structure and Boundary for Deep Neural Machine Translation Alignment Model

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees