JPH10247194A - 自動通訳装置 - Google Patents

自動通訳装置

Info

Publication number
JPH10247194A
JPH10247194A JP9048766A JP4876697A JPH10247194A JP H10247194 A JPH10247194 A JP H10247194A JP 9048766 A JP9048766 A JP 9048766A JP 4876697 A JP4876697 A JP 4876697A JP H10247194 A JPH10247194 A JP H10247194A
Authority
JP
Japan
Prior art keywords
translation
character string
sentence
target language
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9048766A
Other languages
English (en)
Other versions
JP3059398B2 (ja
Inventor
Hideki Mima
秀樹 美馬
Hitoshi Iida
仁 飯田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR ONSEI HONYAKU TSUSHIN KENKYUSHO KK
ATR Interpreting Telecommunications Research Laboratories
Original Assignee
ATR ONSEI HONYAKU TSUSHIN KENKYUSHO KK
ATR Interpreting Telecommunications Research Laboratories
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR ONSEI HONYAKU TSUSHIN KENKYUSHO KK, ATR Interpreting Telecommunications Research Laboratories filed Critical ATR ONSEI HONYAKU TSUSHIN KENKYUSHO KK
Priority to JP9048766A priority Critical patent/JP3059398B2/ja
Publication of JPH10247194A publication Critical patent/JPH10247194A/ja
Application granted granted Critical
Publication of JP3059398B2 publication Critical patent/JP3059398B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 既翻訳の誤り発話意図などの違いに対して適
切な用例を検索して文全体としての整合性を保って翻訳
して音声合成することができる自動通訳装置を提供す
る。 【解決手段】 発話内容調整部6は、翻訳生成部5から
出力される目的言語の翻訳結果の文字列と、前の段階で
確定されて音声合成部7に出力されて出力結果記憶部1
4に記憶された、目的言語の翻訳結果の文字列とを比較
して、語順や発話意図において違いがあるときに、対訳
用例記憶部14内の複数の対訳用例を参照して、対応す
る対訳用例を検索し、文全体として整合性を保持するこ
とができるように、翻訳生成部5から出力される目的言
語の翻訳結果の文字列の発話内容を調整しかつ確定して
出力する。発話内容調整部6は、翻訳生成部5から出力
される目的言語の翻訳結果の文字列と、上記検索された
対応する対訳用例との意味的距離が最小となりかつ語順
及び発話意図において整合性がとれるように調整する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力される原言語
の発声音声文からなる文字列を目的言語の文字列に翻訳
した後、翻訳後の文字列を音声合成する自動通訳装置に
関する。
【0002】
【従来の技術及び発明が解決しようとする課題】従来、
言語翻訳や対話システム等で文を生成する場合、文単位
で処理を行うことがほとんどであった(例えば、森元
逞,“自動翻訳電話の実現に向かって”,情報処理,V
ol.35,No.1,1994年1月参照)。しかし
ながら、自動通訳装置などのように入力が時系列に与え
られる場合、文単位の処理では、発話が終了するまで処
理を開始することができず、発話の伝達に遅延が生じて
しまう。その結果、以下のような問題点があった。 (1)発話間の結束性が壊れてしまう。 (2)処理時間が増加してしまう。 ユーザーが自動通訳装置を利用する理由は、通常の対話
を行うのと同程度の負担で、自分の目的を達成すること
が可能になるからである。従って、本来の目的以外の大
きな負担をユーザに与えてしまう上記の問題点を解決す
ることは、実用的な自動通訳装置の構築にとって非常に
重要である。
【0003】以上の問題点を解決するために、特開平8
−263499号公報において、従来例に比較して短時
間で翻訳することができ、しかも文全体として意味が通
るように自然な文に翻訳することができる自動翻訳装置
及び自動通訳装置(以下、従来例という。)が開示され
ている。しかしながら、当該従来例においては、既に翻
訳された句や節に対する翻訳内容が誤っていた場合や、
目的言語に適した語順と著しく違っていた場合などにお
いて、翻訳の整合性を保つことができないという問題点
があった。
【0004】本発明の目的は以上の問題点を解決し、既
翻訳の誤り、発話意図などの違いに対して、適切な用例
を検索して、文全体としての整合性を保って翻訳して音
声合成することができる自動通訳装置を提供することに
ある。
【0005】
【課題を解決するための手段】本発明に係る請求項1記
載の自動通訳装置は、入力される原言語の発声音声文か
らなる文字列を目的言語の文字列に翻訳した後、翻訳後
の文字列を音声合成する自動通訳装置において、入力さ
れる原言語の発声音声の音声信号に基づいて、上記発声
音声を音声認識することにより、原言語の文字列に変換
して出力する音声認識手段と、原言語の発声音声文にお
ける複数の分割パターンを予め記憶する第1の記憶手段
と、上記音声認識手段から出力される原言語の発声音声
文からなる文字列を、上記記憶手段に記憶された複数の
分割パターンを参照して、上記文字列を分割する原文分
割手段と、上記原文分割手段によって分割された文字列
を、分割された単位毎に目的言語の翻訳結果の文字列に
翻訳を行う部分翻訳手段と、上記入力される原言語の発
声音声文からなる文字列を分割せずに、目的言語の翻訳
結果の文字列に翻訳を行う全翻訳手段と、上記部分翻訳
手段による翻訳結果の文字列と、上記全翻訳手段による
翻訳結果の文字列とを比較して、冗長な表現の省略を行
うように目的言語の翻訳結果の文字列を決定して出力す
る翻訳生成手段と、上記翻訳生成手段から出力される目
的言語の翻訳結果の文字列と、前の段階で発話内容調整
手段によって確定された目的言語の翻訳結果の文字列と
を比較して、語順や発話意図において違いがあるとき
に、所定の複数の対訳用例を参照して、対応する対訳用
例を検索し、文全体として整合性を保持することができ
るように、上記翻訳生成手段から出力される目的言語の
翻訳結果の文字列の発話内容を調整しかつ確定して出力
する発話内容調整手段と、上記発話内容調整手段から出
力される目的言語の翻訳結果の文字列を音声信号に変換
して出力する音声合成手段を備えたことを特徴とする。
【0006】また、請求項2記載の自動通訳装置は、請
求項1記載の自動通訳装置において、上記発話内容調整
手段は、上記翻訳生成手段から出力される目的言語の翻
訳結果の文字列と、上記検索された対応する対訳用例と
の意味的距離が最小となりかつ語順及び発話意図におい
て整合性がとれるように、上記翻訳生成手段から出力さ
れる目的言語の翻訳結果の文字列の発話内容を調整する
ことを特徴とする。
【0007】
【発明の実施の形態】以下、図面を参照して本発明に係
る実施形態について説明する。
【0008】図1に本発明に係る一実施形態の自動通訳
装置のブロック図を示す。この実施形態の自動通訳装置
は、入力される原言語の発声音声文からなる文字列の音
声信号を目的言語の文字列に翻訳した後、翻訳結果の文
字列を音声合成して音声信号に変換する自動通訳装置で
あって、図1に示すように、(a)入力される原言語の
発声音声を音声信号に変換するマイクロホン10と、
(b)入力される原言語の発声音声の音声信号に基づい
て、上記発声音声を音声認識することにより、原言語の
文字列に変換して原文分割手段に出力する音声認識部1
と、(c)原言語の発声音声文における複数の分割パタ
ーンを予め記憶する分割パターン記憶部11と、(d)
音声認識部1から出力される原言語の発声音声文からな
る文字列を、上記記憶手段に記憶された複数の分割パタ
ーンを参照して、上記文字列を分割する原文分割部2
と、(e)原文分割部2によって分割された文字列を、
分割された単位毎に目的言語の翻訳結果の文字列に翻訳
を行う部分翻訳部3と、(f)上記原言語の発声音声文
からなる文字列を分割せずに、目的言語の翻訳結果の文
字列に翻訳を行う全翻訳部4と、(g)部分翻訳部3に
よる翻訳結果の文字列と、全翻訳部4による翻訳結果の
文字列とを比較して、冗長な表現の省略を行うように目
的言語の翻訳結果の文字列を決定して出力する翻訳生成
部5と、(h)翻訳生成部5から出力される目的言語の
翻訳結果の文字列を記憶する出力結果記憶部12と、
(i)複数の対訳用例を記憶する対訳用例記憶部13
と、(j)発話内容調整部6によって確定されて音声合
成部7に出力された目的言語の翻訳結果の文字列を記憶
する出力結果記憶部14と、(k)翻訳生成部5から出
力される目的言語の翻訳結果の文字列と、前の段階で発
話内容調整部6によって確定されて音声合成部7に出力
されて出力結果記憶部14に記憶された、目的言語の翻
訳結果の文字列とを比較して、語順や発話意図において
違いがあるときに、対訳用例記憶部14内の複数の対訳
用例を参照して、対応する対訳用例を検索し、文全体と
して整合性を保持することができるように、翻訳生成部
5から出力される目的言語の翻訳結果の文字列の発話内
容を調整しかつ確定して出力する発話内容調整部6と、
(l)上記発話内容調整部6から出力される目的言語の
翻訳結果の文字列を音声信号に変換して出力する音声合
成部7と、(m)音声合成部7から出力される音声信号
を音声に変換して出力するスピーカ8とを備える。ここ
で、発話内容調整部6は、翻訳生成部5から出力される
目的言語の翻訳結果の文字列と、上記検索された対応す
る対訳用例との意味的距離が最小となりかつ語順及び発
話意図において整合性がとれるように、翻訳生成部5か
ら出力される目的言語の翻訳結果の文字列の発話内容を
調整することを特徴とする。
【0009】本実施形態においては、「ホテルを予約す
る際の対話」のように目的が明確な対話における英語か
ら日本語への翻訳を例に、同時通訳的な処理を行った際
の漸進的な文生成方式を示す。すなわち、接続詞のよう
な区切りとなる表現をトリガーとして、入力された発話
を句や節といった単位で英日変換し、その部分的な変換
結果の日本語表現を順次確定していきながら、文全体と
して意味の通る自然な日本語文を生成する翻訳方法を示
す。
【0010】自動通訳における、文単位の処理と漸進的
な処理との処理時間を図2に示す。発話の結束性を保
ち、処理時間を短縮させるためには、出力開始までの時
間を短縮し、かつ出力終了までの時間を短縮する必要が
ある。図2に示すように、文単位の処理では、「出力開
始までの時間=発話時間+翻訳処理時間」である。ま
た、現状の多くの翻訳装置では、処理時間は高速になっ
てきており、「発話時間≫翻訳処理時間」が成り立つ。
従って、翻訳処理時間を短縮することは、出力を開始す
るまでの時間を短縮させることにあまり寄与しない。一
方、漸進的な処理を行えば、入力の発話が終了する前
に、翻訳処理や出力を行うことで、出力開始までの時
間、及び出力終了までの時間を大幅に短縮することが可
能である。
【0011】英文から漸進的に日本語対話文を生成する
ためには、従来の書き言葉の生成が対象としてきた「文
法的に適格な文」を生成するだけの能力では不十分であ
る。書き言葉では「不適格文」とされるが、日本語の対
話では、頻繁に用いられるものとして、「繰り返し」、
「倒置」等がある。本実施形態においては、これらを使
うことで生成能力を高めることを考える。以下に、「繰
り返し」と「倒置」について、簡単に説明する。
【0012】人間の発話では、繰り返しを用いること
で、すでに言った語句に新たな情報を追加したり、不的
確な表現を訂正することがある。例えば、「電話番号
を、あなたに連絡がとれる電話番号を教えてください」
というように、「電話番号」を繰り返すことで、すでに
言った語句(「電話番号」)に対して新たな情報(「あ
なたに連絡がとれる」)を追加することができる。
【0013】日本語文では、「節(又は文)の主動詞
は、文末に表れなければならない」と言われる。しかし
ながら、実際の対話では、語順が倒置したものが頻繁に
見られる。ここでは、この現象を前記の繰り返しと同様
の枠組で扱うために、語順が倒置したものではなく、文
の繰り返しと省略によって、生じたものであると考え
る。例えば、「それは4000円です、あなたが来月登
録すれば」という文は、まず、「それは4000円で
す」が条件を省略した文として生成され、次に、この文
の条件をはっきりさせるために、条件を文末で繰り返す
ことによってこの文が生成されたと考える。
【0014】上記の日本語対話文の特徴を生成に取り入
れ、かつ、生成文の了解性の低下を避けるために、本実
施形態においては、以下のような方法で翻訳生成を行
う。 (a)文の了解性の確保を確保するために、係り受けの
語順は、必ず係り元から係り先にする。 (b)係り受けの語順が逆転する場合は、その部分を繰
り返すことで文を自己修復する。 (c)出力時間を短縮するために、繰り返しにおける冗
長な表現を省略する。
【0015】上記の翻訳生成方法を用いた自動通訳装置
のブロック図を図1に示す。図1において、原言語の発
声音声はマイクロホン10に入力されて音声信号に変換
されて音声認識部1に入力される。音声認識部1は、入
力される原言語の発声音声の音声信号に基づいて、例え
ば音素コンテキスト依存型音素隠れマルコフモデル(音
素HMM)を参照して音素照合を実行して尤度を計算
し、最尤の音声認識結果を選択して、上記発声音声を音
声認識することにより、原言語の文字列に変換して原文
分割部2に出力する。一方、分割パターン記憶部11に
は、例えば表1に示すように、原言語の発声音声文にお
ける複数の分割パターンを予め記憶する。
【0016】
【表1】 英日翻訳のときの英文の節のパターンと、翻訳結果である日本文パターン ───────────────────────────── 節の種類 英文パターン 日本文パターン ───────────────────────────── 文頭 By the way/X ところで/X’ 文頭 no/X いいえ/X’ 並列節 X/but Y X’/しかし Y’ 従属節 X/if Y Y’ならば/X’ 従属節 if X/[CN-PRON] Y Y’ならば/X’ 引用節 X think [V-PRON]/Y X’はY’と思う 関係節 X/where Y Y’[連体]/X’ ─────────────────────────────
【0017】ここで、/は分割点を示す。また、[CN
−PRON]は、[CN−PRON]の前の単語の品詞
が普通名詞であり、かつ、後ろの単語の品詞が代名詞で
あることを意味し、[V−PRON]は、[V−PRO
N]の前の単語の品詞が動詞であり、かつ、後ろの単語
の品詞が代名詞であることを意味する。さらに、[連
体]は、前の単語の活用形が連体形であることを意味す
る。
【0018】本実施形態においては、原言語表現である
英文を分割する単位を、(1)意味的なまとまりがあ
り、英語と日本語の間で(すなわち、原言語と目的言語
との間で)対応が取れやすい、(2)英文に分割のため
の比較的明確なマーカー(接続詞等)が現れる、という
理由から、節とした。また、英文を節に分割するための
パターンとして、用例ベースの翻訳装置で使用している
パターンを利用した。代表的な英文のパターンを表1に
示している。この英文パターンは、表層表現(「bu
t」、「if」等)及び品詞列の並び([CN−PRO
N]等)をキーとして、文を節に分割する。なお、表1
において、レベルの数字は分割の結合度の強さを示し、
XとYは英語表現を示し、X’とY’は英語表現X,Y
にそれぞれ対応する日本語の訳を示す。
【0019】そして、原文分割部2は、音声認識部1か
ら出力される原言語の発声音声文からなる文字列を、上
記記憶手段に記憶された複数の分割パターンを参照し
て、上記文字列を適切な単位に分割する。さらに、部分
翻訳部3は、原文分割部2によって分割された文字列
を、分割された単位毎に順次、目的言語の翻訳結果の文
字列に翻訳を行う一方、全翻訳部4は、上記原言語の発
声音声文からなる文字列を分割せずに、目的言語の翻訳
結果の文字列に翻訳を行う。次いで、翻訳生成部5は、
部分翻訳部3による翻訳結果の文字列と、全翻訳部4に
よる翻訳結果の文字列とを比較して、冗長な表現の省略
を行うように、必要であれば繰り返しを行って適切な語
順で、目的言語の翻訳結果の文字列を決定して出力す
る。そして、出力記憶部12は、翻訳生成部5から出力
される目的言語の翻訳結果の文字列を記憶する。
【0020】次いで、発話内容調整部6は、翻訳生成部
5から出力される目的言語の翻訳結果の文字列と、前の
段階で発話内容調整部6によって確定されて音声合成部
7に出力されて出力結果記憶部14に記憶された、目的
言語の翻訳結果の文字列とを比較して、語順や発話意図
において違いがあるときに、対訳用例記憶部14内の複
数の対訳用例を参照して、対応する対訳用例を検索し、
文全体として整合性を保持することができるように、翻
訳生成部5から出力される目的言語の翻訳結果の文字列
の発話内容を調整しかつ確定して出力する。ここで、発
話内容調整部6は、翻訳生成部5から出力される目的言
語の翻訳結果の文字列と、上記検索された対応する対訳
用例との意味的距離が最小となりかつ語順及び発話意図
において整合性がとれるように、翻訳生成部5から出力
される目的言語の翻訳結果の文字列の発話内容を調整す
る。
【0021】さらに、音声合成部7は、例えば、パルス
発生器と雑音発生器と可変増幅度増幅器とフィルタとを
備えた公知の音声合成装置で構成され、発話内容調整部
6から出力される目的言語の翻訳結果の文字列を音声信
号に変換してスピーカ8に出力して、音声に変換して出
力する。
【0022】部分翻訳部3と全翻訳部4は、例えば対訳
用例を利用した公知の対話文翻訳システムを用いて構成
することができる。このシステムでは、(「I wou
ldlike to 〜」→「〜たいのですが」)、
(「〜 for …」→「…に対する 〜」)のような
比較的細かな単位で用例を用意し、それを組み合わせる
ことで1文の変換を行うことを可能としている。
【0023】入力文SがCL1,…,CLi,…,CLj
(1≦i≦j)の節に分割された場合、以下の方法で文
を翻訳生成する。ただし、CLjは、図3に示すよう
に、現時点の入力での右端の節であり、CLiは、CLj
を含む最大の節の開始の節である。また、英語のCLの
目的言語への翻訳結果をtrans(CL)とする。
【0024】部分翻訳部3と全翻訳部4と翻訳生成部5
とは、以下の示す処理を発話の終了まで繰り返す。部分
翻訳部3は、部分翻訳結果trans(CL)を求めて
翻訳生成部5に出力する一方、全翻訳部4は、全翻訳結
果trans(CLi,…,CLj)を求めて翻訳生成部
5に出力する。そして、翻訳生成部5は、図5に示す翻
訳生成処理を以下のごとく実行する。
【0025】まず、ステップS1において、翻訳結果t
rans(CLj)が翻訳結果trans(CLi,…,
CLj)と等しいか否か判断され、等しい場合、すなわ
ち、i=jの場合、ステップS11において、翻訳結果
trans(CLi,…,CLj)を翻訳結果として出力
して当該翻訳生成処理を終了する。一方、ステップS1
でi≠jの場合、ステップS2において、翻訳結果tr
ans(CLi,…,CLj-1)・trans(CLj
が翻訳結果(CLi,…,CLj)と等しいか否かが判断
され、等しい場合、すなわち語順が等しい場合、ステッ
プS12において、翻訳結果trans(CLj)を翻
訳結果として出力して当該翻訳生成処理を終了する。一
方、ステップS2で語順が異なる場合、ステップS3に
おいて、翻訳結果trans(CLj)・trans
(CLi,…,CLj-1)が翻訳結果trans(C
i,…,CLj)と等しいか否かが判断され、等しい場
合、すなわち語順が逆の場合、ステップS13におい
て、翻訳結果trans(CLi,…,CLj)を翻訳結
果として、繰り返しの共通部分(冗長な表現)を省略し
て出力して当該翻訳生成処理を終了する。一方、ステッ
プS3で等しくない場合、翻訳結果trans(C
i,…,CLj)を翻訳結果として出力して当該翻訳生
成処理を終了する。
【0026】次いで、対訳用例記憶部13内の対訳用例
について説明する。原言語表現と目的言語表現の対応関
係は必ずしも一対一ではない。原言語表現は訳し分けの
鍵となる部分を持ち、この部分を具体化する語句によっ
て対訳が決定される。そこで、原言語表現の訳し分けの
鍵となる部分の用例と、対応する目的言語表現との関係
を実際の言語表現から獲得し、変換知識として次式のよ
うに対訳用例記憶部13に格納する。対訳用例記憶部1
3に記憶される対訳用例の一例を表2に示す。
【数1】原言語表現→ 目的言語表現1(E11,E12,…), 目的言語表現2(E21,E22,…), ………… ………… 目的言語表現n(En1,En2,…).
【0027】
【表2】 対訳用例の一例 ─────────────────────────────────── [対訳用例1]X as only as Y→Y’のみX’(open,evening) [対訳用例2]X as only as Y→X’、しかし、Y’しかX’ していません(open, morning) [対訳用例3]Xでしょうか?→X’,isn't it?(okay) [対訳用例4]Xが、Y?→X’,but Y’? ([ホテルに関する]利用できる、[予約が]一杯)→ (default(available−usually, not(have))) ………… ………… ───────────────────────────────────
【0028】対訳用例における上記数1の記述は、目的
言語表現にn通りの可能性があり、用例がEijである
時、対訳は目的言語表現iとなることを示す。Eijは語
句の組である。本実施形態の変換処理において、通常の
翻訳では入力表現の語句とベストマッチする用例を意味
的距離計算により求め、ベストマッチした用例の目的言
語表現を、対訳として選択する。入力表現の語句に最も
意味的に近い用例がEijであれば、目的言語表現iを原
言語表現の対訳として選択する。このように用例は原言
語表現の訳し分け条件となる。
【0029】次いで、意味的距離計算について説明す
る。入力文の語句と用例の間の意味的な近さを求める方
法として、自動通訳装置は、隅田らの意味的距離計算を
採用している。この方法では、まず、シソーラス(類語
辞典に準拠する。)の概念階層における意味概念間の位
置関係によって、入力文の単語iと用例の単語eの間の
意味的距離dist(i,e)を計算する。意味的距離
は、0から1までを値域とし、0に近いほど単語iと用
例eは意味的に類似していることを示す。意味的距離は
シソーラスの与え方によって値が変わるが、本実施形態
で現在使用しているシソーラスに基づいた意味的距離の
次に示す。
【数2】dist(会議事務局、事務局)=0.00, dist(こちら、私)=0.44, dist(会議事務局、鈴木)=1.00。
【0030】原言語表現の訳し分けの鍵となる部分につ
いての入力文の表現と用例を、それぞれ、IとEとす
る。表現Iと用例Eの間の意味的距離は、表現Iと用例
Eを構成する単語間の意味的距離を基にして計算する。
表現I及び用例Eが、次のようにt個の語句の組として
構成されているとする。
【0031】
【数3】I=(i1,…,it)。 E=(e1,…,et)。
【0032】このとき、表現Iと用例Eの間の意味的距
離を次のように計算する。
【0033】
【数4】
【0034】ここで、wkは、翻訳におけるk番目の要
素の重みを示し、0から1までを値域とする。次いで、
パターンレベルの変換知識を使った対訳決定処理につい
て説明する。本実施形態では言語表現の表現形式により
変換知識を、ストリング、パターン、文法の3つのレベ
ルに分類し、入力文の性質に応じて、これらのレベルの
変換知識を使い分けて翻訳処理を行なう。本実施形態の
翻訳で用例に基づく枠組みを最も活用するのは、パター
ンレベルの変換知識を使った対訳決定処理である。パタ
ーンレベルの変換知識は、文法属性を表現しないXのよ
うな記号(以下、可変部という。)と表層語句とにより
言語表現を表わす。可変部は訳し分けの鍵となる部分で
あり、可変部を具体化する用例を訳し分け条件として記
述する。例えば、次の変換知識は、「XはYです」に様
々な英語表現が対応することを示す。
【0035】
【数5】 XはYです → X’ be Y’((私,鈴木),(ここ,事務局),…)、 X’ may be paid by Y’((費用,現金),…)、 X’ will be done by Y’((講演,様),…)、 ……… ………
【0036】X’は原言語表現Xに対応する目的言語表
現を、(私,鈴木)は、X=「私」、Y=「鈴木」とい
う用例を表わす。「私は鈴木です」の場合、「XはYで
す」に対する目的言語表現は“X’ be Y’”である。
可変部X、Yを具体化する入力文の語句の組をIとす
る。例えば、入力文が「こちらは会議事務局です」の場
合、Iは(こちら、会議事務局)となる。
【0037】ここで、重みwkの値を一律に0.5とす
ると、表現Iと用例(私,鈴木)の間の意味的距離は次
式のようになる。
【数6】 dist((こちら,会議事務局),(私,鈴木)) =dist(こちら,私)・w1+dist(会議事務局,鈴木)・w2 =0.44×0.5+1.00×0.5 =0.72
【0038】表現Iと各用例との距離が以下のようにな
っており、Iとの意味的距離が最小の用例は(ここ,事
務局)であるとする。
【0039】
【数7】 dist((こちら,会議事務局),(私,鈴木))=0.72 dist((こちら,会議事務局),(ここ,事務局))=0.25 ……… dist((こちら,会議事務局),(費用、現金))=0.89 ……… d((こちら,会議事務局),(講演,様))=1.00
【0040】(ここ、事務局)を用例として持つ“X’
be Y’”が、最尤の目的言語表現として選択され、
「こちらは会議事務局です」の翻訳結果として“this i
s theconference office.”を得ることができる。一般
的に、用例の追加は訳し分けの条件を詳細化し、変換処
理の精度の向上につながる。
【0041】さらに、発話調整処理における用例の利用
について述べる。通常の用例に基づいた翻訳処理におい
ては意味的距離計算によりベストマッチで検索された用
例が対訳の決定に利用されるのに対し、本発明での発話
調整処理では、先に発話され語彙系列(CLi)との語
順及び発話意図における整合性を基準として用例を検索
し、検索された用例においてより意味的距離の近いもの
を利用することに特徴がある。
【0042】図6は、図1の発話内容調整部6によって
実行される発話内容調整処理を示すフローチャートであ
る。図6において、
【数8】trans(CLi)=X123…Xn, trans(CLij)=Y1234…Ym(n≦
m) であるときに、まず、ステップS21で任意のkにおい
て1<k≦n,Xk=Yk(ここで、Xkは翻訳結果tr
ans(CLi)におけるk番目の構成語彙であり、Y
kは翻訳結果trans(CLij)におけるk番目の
構成語彙である。)であるか否か、すなわち、翻訳結果
trans(CLij)が前の段階で確定された翻訳結
果trans(CLi)の拡張された集合であるか、
(言い換えれば、別の節が追加された集合であるか否
か)が判断され、拡張された集合であるときは、ステッ
プS22で翻訳結果trans(CLij)−翻訳結果
trans(CLi)を音声合成部7に出力するととも
に、翻訳結果trans(CLij)を確定して出力結
果記憶部14に記憶した後、ステップS21に戻って、
次の翻訳結果の処理を実行する。一方、拡張された集合
でないときは、ステップS23で節CLjにおける類似
用例{Ej:1<Order(Ej)<T}を対訳用例
記憶部13で検索する。
【0043】次いで、ステップS24で節CLijにお
ける類似用例{Eij:1<Order(Ej)<T}
を対訳用例記憶部13で検索する。そして、ステップS
25で、{Ej},{Eij}を利用した翻訳候補{t
rans(CLij)}の上位のものより任意のkにお
いて1<k≦n,Xk=Ykを満たすものがあるか否かが
判断され、YESのときは、ステップS26で最尤の翻
訳候補trans(CLij)に対して、翻訳結果tr
ans(CLij)−翻訳結果(CLi)を音声合成部
7に出力するとともに、翻訳結果trans(CLi
j)を確定して出力結果記憶部14に追加して記憶す
る。そして、ステップS21に戻って、次の翻訳結果の
処理を実行する。一方、ステップS25で、NOのとき
は、ステップS27で言い直し処理を実行する。すなわ
ち、「No」又は「しかし」の間投詞の出力後、先の翻
訳結果trans(CLij)と翻訳結果trans
(CLi)の節頭から共通部分を除いたフレーズを音声
合成部12に出力するとともに、翻訳結果(CLi)を
確定して出力結果記憶部14に追加して記憶する。そし
て、ステップS21に戻って次の翻訳結果の処理を実行
する。
【0044】ここで、Order(E)は節CLiと用
例Eとの意味的距離の節CLiに適用可能なすべての用
例に対する順位を表わす。例えば、ある用例Eにおい
て、Order(E)が1であるときは、節CLiにベ
ストマッチする用例であることを表わす。ここでのしき
い値Tは発話内容処理における用例検索のしきい値を表
わす。
【0045】
【実施例】以下、本実施形態における発話内容調整部6
によって実行される発話内容調整処理の実施例について
説明する。
【0046】<実施例1>図4は、実施例1の処理内容
を示す図である。“That restaurant is open as only
as in the evening.”の入力において、文脈等からの予
測により、“That restaurant is
open...までの入力に対し、「そのレストランは
オープンしています」と発話しており、その後、...
as only as in the evenin
g.”が入力された時点では、その翻訳は、通常の対訳
用例である: [対訳用例1]X as only as Y→Y’のみX’(ope
n,evening) を適用し、「夜のみオープンしています。」の部分翻訳
結果が得られるが、既に「オープンしています」は出力
されているため、出力結果比較部によりその語順の違い
がステップS22で検出され、その結果、発話内容調整
部6の発話内容調整処理が起動される。
【0047】上記対訳用例において、1以下、X、Y等
の文字は任意の表現とのマッチングを表し、’による修
飾はその対訳表現を表す。つまり、Xが“open”であれ
ば、X’は“オープンする”に対応する。“X is Y
“等の言語パターンに対して、訳し分けの鍵となるX等
の表現を続く()内で表す。例えば、”X is Y→X’
はY’(room, available)”では、「room is availab
le」等に類似する表現(例:Twin room is available)
に対して適用可能なパターン及びその用例であることを
示している。
【0048】発話内容調整処理における発話内容回復処
理においては、さらに“X as onlyas Y”の翻訳パター
ンが適用可能な対訳用例の中で、既に発話されたX’に
対して翻訳の続行が可能である、 [対訳用例2]X as only as Y→X’、しかし、Y’
しかX’していません(open, morning) の対訳用例を検索し、続く翻訳結果として、「しかし、
夜しかオープンしていません」が出力される。これは、
図6におけるステップS26に対応する。
【0049】<実施例2>次いで、“何も問題はありま
せんーでしょうか?”のような発話に対して、通常では
「Is everything all right?」と翻訳すべきであるが、
文脈処理や、対話管理処理等では予期できない発話であ
った場合、「Everything is all right」と結果を出力
することも考えられる。このような場合も同様に、 [対訳用例3]Xでしょうか?→X’,isn't it?(oka
y) の対訳用例により、付加疑問文への翻訳による発話調整
処理を行う。
【0050】<実施例3>また、“ツインルームは利用
できますが、本日はご利用になれません”のような発話
意図を複数持つ入力に対し、一文全体としての翻訳で
は、「We have twin rooms,but they are not availabl
e today.」のように訳し分けることが考えられるが、
“ツインルームは利用できます。”に対して既に「Twin
room is available...」と出力していた場合、 [対訳用例4]Xが、Y?→X’,but Y’?([ホテ
ルに関する]利用できる、[予約が]一杯)→(defaul
t(available−usually, not(have))) の対訳用例の適用により、文全体として、「Twin room
is available ... usually,but,we do not have twin r
ooms available today.」のような整合性を持つ発話内
容への調整を行う。
【0051】特定の用例の適用において、デフォルトで
その対訳を指定する場合、用例に続く’→(default’
により記述する。例えば、([ホテルに関する]利用で
きる、[予約が]一杯)→(default(available-usual
ly,not(have)))では、“部屋は利用できるが、今晩
は一杯である“に類する原言語表現の場合、available-
usually, not(have)の語彙を用いた“A room is avai
lable usually,but wedo not have ...”のような目的
言語表現を生成することを示す。
【0052】以上の説明したように、本実施形態によれ
ば、翻訳生成部5から出力される目的言語の翻訳結果の
文字列と、前の段階で発話内容調整部6によって確定さ
れて音声合成部7に出力されて出力結果記憶部14に記
憶された、目的言語の翻訳結果の文字列とを比較して、
語順や発話意図において違いがあるときに、対訳用例記
憶部14内の複数の対訳用例を参照して、対応する対訳
用例を検索し、文全体として整合性を保持することがで
きるように、翻訳生成部5から出力される目的言語の翻
訳結果の文字列の発話内容を調整しかつ確定して出力す
る発話内容調整部6を備え、発話内容調整部6は、翻訳
生成部5から出力される目的言語の翻訳結果の文字列
と、上記検索された対応する対訳用例との意味的距離が
最小となりかつ語順及び発話意図において整合性がとれ
るように、翻訳生成部5から出力される目的言語の翻訳
結果の文字列の発話内容を調整する。従って、既翻訳の
誤り、発話意図などの違いに対して、適切な用例を検索
して、文全体としての整合性を保って翻訳して音声合成
することができる。
【0053】以上の実施形態においては、英語から日本
語への翻訳について説明しているが、本発明はこれに限
らず、日本語からから英語への翻訳、互いに異なる2つ
の言語間での翻訳に適用することができる。
【0054】なお、以上の実施形態における、音声認識
部1と、原文分割部2と、部分翻訳部3と、全翻訳部4
と、翻訳生成部5と、発話内容調整部6と、音声合成部
7とは、例えばディジタル計算機によって構成される。
【0055】以上の実施形態においては、原文である英
文を分割する単位を節を用いているが、本発明はこれに
限らず、原言語の文を分割する単位として、単語や句や
節など任意の単位、及び、それらの組み合わせであって
もよい。
【0056】
【発明の効果】以上詳述したように本発明に係る請求項
1記載の自動通訳装置によれば、入力される原言語の発
声音声文からなる文字列を目的言語の文字列に翻訳した
後、翻訳後の文字列を音声合成する自動通訳装置におい
て、入力される原言語の発声音声の音声信号に基づい
て、上記発声音声を音声認識することにより、原言語の
文字列に変換して出力する音声認識手段と、原言語の発
声音声文における複数の分割パターンを予め記憶する第
1の記憶手段と、上記音声認識手段から出力される原言
語の発声音声文からなる文字列を、上記記憶手段に記憶
された複数の分割パターンを参照して、上記文字列を分
割する原文分割手段と、上記原文分割手段によって分割
された文字列を、分割された単位毎に目的言語の翻訳結
果の文字列に翻訳を行う部分翻訳手段と、上記入力され
る原言語の発声音声文からなる文字列を分割せずに、目
的言語の翻訳結果の文字列に翻訳を行う全翻訳手段と、
上記部分翻訳手段による翻訳結果の文字列と、上記全翻
訳手段による翻訳結果の文字列とを比較して、冗長な表
現の省略を行うように目的言語の翻訳結果の文字列を決
定して出力する翻訳生成手段と、上記翻訳生成手段から
出力される目的言語の翻訳結果の文字列と、前の段階で
発話内容調整手段によって確定された目的言語の翻訳結
果の文字列とを比較して、語順や発話意図において違い
があるときに、所定の複数の対訳用例を参照して、対応
する対訳用例を検索し、文全体として整合性を保持する
ことができるように、上記翻訳生成手段から出力される
目的言語の翻訳結果の文字列の発話内容を調整しかつ確
定して出力する発話内容調整手段と、上記発話内容調整
手段から出力される目的言語の翻訳結果の文字列を音声
信号に変換して出力する音声合成手段を備える。従っ
て、従って、既翻訳の誤り、発話意図などの違いに対し
て、適切な用例を検索して、文全体としての整合性を保
って翻訳して音声合成することができる。
【0057】また、請求項2記載の自動通訳装置におい
ては、請求項1記載の自動通訳装置において、上記発話
内容調整手段は、上記翻訳生成手段から出力される目的
言語の翻訳結果の文字列と、上記検索された対応する対
訳用例との意味的距離が最小となりかつ語順及び発話意
図において整合性がとれるように、上記翻訳生成手段か
ら出力される目的言語の翻訳結果の文字列の発話内容を
調整する。従って、既翻訳の誤り、発話意図などの違い
に対して、適切な用例を検索して、文全体としての整合
性を保って翻訳して音声合成することができる。
【図面の簡単な説明】
【図1】 本発明に係る一実施例である自動通訳装置の
ブロック図である。
【図2】 文単位処理方式と漸進的処理方式における処
理時間の違いを示す図である。
【図3】 図1の翻訳生成部における節の処理を示す図
である。
【図4】 図1の発話内容調整部における処理を示す図
である。
【図5】 図1の翻訳生成部によって実行される翻訳生
成処理を示すフローチャートである。
【図6】 図1の発話内容調整部によって実行される発
話内容調整処理を示すフローチャートである。
【符号の説明】
1…音声認識部、 2…原文分割部、 3…部分翻訳部、 4…全翻訳部、 5…翻訳生成部、 6…発話内容調整部、 7…音声合成部、 8…スピーカ、 10…マイクロホン、 11…分割パターン記憶部、 12,14…出力結果記憶部、 13…対訳用例記憶部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力される原言語の発声音声文からなる
    文字列を目的言語の文字列に翻訳した後、翻訳後の文字
    列を音声合成する自動通訳装置において、 入力される原言語の発声音声の音声信号に基づいて、上
    記発声音声を音声認識することにより、原言語の文字列
    に変換して出力する音声認識手段と、 原言語の発声音声文における複数の分割パターンを予め
    記憶する第1の記憶手段と、 上記音声認識手段から出力される原言語の発声音声文か
    らなる文字列を、上記記憶手段に記憶された複数の分割
    パターンを参照して、上記文字列を分割する原文分割手
    段と、 上記原文分割手段によって分割された文字列を、分割さ
    れた単位毎に目的言語の翻訳結果の文字列に翻訳を行う
    部分翻訳手段と、 上記入力される原言語の発声音声文からなる文字列を分
    割せずに、目的言語の翻訳結果の文字列に翻訳を行う全
    翻訳手段と、 上記部分翻訳手段による翻訳結果の文字列と、上記全翻
    訳手段による翻訳結果の文字列とを比較して、冗長な表
    現の省略を行うように目的言語の翻訳結果の文字列を決
    定して出力する翻訳生成手段と、 上記翻訳生成手段から出力される目的言語の翻訳結果の
    文字列と、前の段階で発話内容調整手段によって確定さ
    れた目的言語の翻訳結果の文字列とを比較して、語順や
    発話意図において違いがあるときに、所定の複数の対訳
    用例を参照して、対応する対訳用例を検索し、文全体と
    して整合性を保持することができるように、上記翻訳生
    成手段から出力される目的言語の翻訳結果の文字列の発
    話内容を調整しかつ確定して出力する発話内容調整手段
    と、 上記発話内容調整手段から出力される目的言語の翻訳結
    果の文字列を音声信号に変換して出力する音声合成手段
    を備えたことを特徴とする自動通訳装置。
  2. 【請求項2】 上記発話内容調整手段は、上記翻訳生成
    手段から出力される目的言語の翻訳結果の文字列と、上
    記検索された対応する対訳用例との意味的距離が最小と
    なりかつ語順及び発話意図において整合性がとれるよう
    に、上記翻訳生成手段から出力される目的言語の翻訳結
    果の文字列の発話内容を調整することを特徴とする請求
    項1記載の自動通訳装置。
JP9048766A 1997-03-04 1997-03-04 自動通訳装置 Expired - Lifetime JP3059398B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9048766A JP3059398B2 (ja) 1997-03-04 1997-03-04 自動通訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9048766A JP3059398B2 (ja) 1997-03-04 1997-03-04 自動通訳装置

Publications (2)

Publication Number Publication Date
JPH10247194A true JPH10247194A (ja) 1998-09-14
JP3059398B2 JP3059398B2 (ja) 2000-07-04

Family

ID=12812411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9048766A Expired - Lifetime JP3059398B2 (ja) 1997-03-04 1997-03-04 自動通訳装置

Country Status (1)

Country Link
JP (1) JP3059398B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1093059A2 (en) * 1999-10-15 2001-04-18 Sony Corporation Translating apparatus and method, and recording medium
JP2002006876A (ja) * 2000-06-26 2002-01-11 Nippon Telegr & Teleph Corp <Ntt> 音声合成装置、音声合成方法および音声合成プログラムを記憶した記憶媒体
JP2002321177A (ja) * 2001-04-23 2002-11-05 Sony Corp 脚式移動ロボット及びその制御方法
ES2180392A1 (es) * 2000-09-26 2003-02-01 Crouy-Chanel Pablo Grosschmid Sistema dispositivo e instalacion de interpretacion simultanea mecanizada de idiomas.
CN100359907C (zh) * 2003-03-27 2008-01-02 雅马哈株式会社 便携式终端装置
CN103365837A (zh) * 2012-03-29 2013-10-23 株式会社东芝 机器翻译装置、方法和计算机可读媒体
US9588967B2 (en) 2015-04-22 2017-03-07 Kabushiki Kaisha Toshiba Interpretation apparatus and method
US10423700B2 (en) 2016-03-16 2019-09-24 Kabushiki Kaisha Toshiba Display assist apparatus, method, and program

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1093059A2 (en) * 1999-10-15 2001-04-18 Sony Corporation Translating apparatus and method, and recording medium
EP1093059A3 (en) * 1999-10-15 2005-05-04 Sony Corporation Translating apparatus and method, and recording medium
JP2002006876A (ja) * 2000-06-26 2002-01-11 Nippon Telegr & Teleph Corp <Ntt> 音声合成装置、音声合成方法および音声合成プログラムを記憶した記憶媒体
ES2180392A1 (es) * 2000-09-26 2003-02-01 Crouy-Chanel Pablo Grosschmid Sistema dispositivo e instalacion de interpretacion simultanea mecanizada de idiomas.
JP2002321177A (ja) * 2001-04-23 2002-11-05 Sony Corp 脚式移動ロボット及びその制御方法
CN100359907C (zh) * 2003-03-27 2008-01-02 雅马哈株式会社 便携式终端装置
CN103365837A (zh) * 2012-03-29 2013-10-23 株式会社东芝 机器翻译装置、方法和计算机可读媒体
US9170994B2 (en) 2012-03-29 2015-10-27 Kabushiki Kaisha Toshiba Machine translation apparatus, method and computer readable medium
US9588967B2 (en) 2015-04-22 2017-03-07 Kabushiki Kaisha Toshiba Interpretation apparatus and method
US10423700B2 (en) 2016-03-16 2019-09-24 Kabushiki Kaisha Toshiba Display assist apparatus, method, and program

Also Published As

Publication number Publication date
JP3059398B2 (ja) 2000-07-04

Similar Documents

Publication Publication Date Title
US5832428A (en) Search engine for phrase recognition based on prefix/body/suffix architecture
KR100996817B1 (ko) 문자 대 음성 변환을 위한 상호 정보 기준을 이용한 큰 그라포넴 단위의 생성
US8224645B2 (en) Method and system for preselection of suitable units for concatenative speech
US10163436B1 (en) Training a speech processing system using spoken utterances
CN107705787A (zh) 一种语音识别方法及装置
JP2001100781A (ja) 音声処理装置および音声処理方法、並びに記録媒体
WO2000058943A1 (fr) Systeme et procede de synthese de la parole
GB2557714A (en) Determining phonetic relationships
US5706397A (en) Speech recognition system with multi-level pruning for acoustic matching
US20020087317A1 (en) Computer-implemented dynamic pronunciation method and system
Hori et al. A statistical approach to automatic speech summarization
US6980954B1 (en) Search method based on single triphone tree for large vocabulary continuous speech recognizer
JP2013125144A (ja) 音声認識装置およびそのプログラム
JP3059398B2 (ja) 自動通訳装置
Kayte et al. Implementation of Marathi Language Speech Databases for Large Dictionary
US20040006469A1 (en) Apparatus and method for updating lexicon
Bulyko et al. Efficient integrated response generation from multiple targets using weighted finite state transducers
JP2758851B2 (ja) 自動翻訳装置及び自動通訳装置
Pellegrini et al. Automatic word decompounding for asr in a morphologically rich language: Application to amharic
JP3576066B2 (ja) 音声合成システム、および音声合成方法
US6772116B2 (en) Method of decoding telegraphic speech
JP2004252121A (ja) 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体
JP2003162524A (ja) 言語処理装置
JP2001117921A (ja) 翻訳装置および翻訳方法、並びに記録媒体
Sakti et al. Rapid development of initial Indonesian phoneme-based speech recognition using the cross-language approach

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080421

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090421

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090421

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100421

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110421

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110421

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120421

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130421

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130421

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140421

Year of fee payment: 14

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term