JPH0793331A - 対話文翻訳装置 - Google Patents

対話文翻訳装置

Info

Publication number
JPH0793331A
JPH0793331A JP5237810A JP23781093A JPH0793331A JP H0793331 A JPH0793331 A JP H0793331A JP 5237810 A JP5237810 A JP 5237810A JP 23781093 A JP23781093 A JP 23781093A JP H0793331 A JPH0793331 A JP H0793331A
Authority
JP
Japan
Prior art keywords
translation
sentence
language
expression
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5237810A
Other languages
English (en)
Inventor
Yasuhiro Sobajima
康博 側嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR ONSEI HONYAKU TSUSHIN KENKYUSHO KK
ATR Interpreting Telecommunications Research Laboratories
Original Assignee
ATR ONSEI HONYAKU TSUSHIN KENKYUSHO KK
ATR Interpreting Telecommunications Research Laboratories
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR ONSEI HONYAKU TSUSHIN KENKYUSHO KK, ATR Interpreting Telecommunications Research Laboratories filed Critical ATR ONSEI HONYAKU TSUSHIN KENKYUSHO KK
Priority to JP5237810A priority Critical patent/JPH0793331A/ja
Publication of JPH0793331A publication Critical patent/JPH0793331A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 翻訳すべき対話文の文字列を、従来例に比較
してより高い精度で別の言語に翻訳することができる対
話文翻訳装置を提供する。 【構成】 対話文で話される文字列からなる入力された
文又は独立節を翻訳する対話文翻訳装置であって、予め
決められた複数の対話文の用例における互いに隣接する
2つの文又は独立節である表現の組み合わせと、用例中
におけるその組み合わせの頻度の回数とを参照し、複数
の翻訳候補の表現に対する翻訳の正確さを示す得点を、
入力された文又は独立節の直前に隣接する文又は独立節
の翻訳された表現と、用例中の複数の翻訳候補の直前に
隣接する表現との間の対応の可能性を示す近さの度合い
と、用例中の複数の翻訳候補の直前に隣接する表現と複
数の翻訳候補の表現との間の組み合わせの用例中の頻度
の回数とに基づいて計算し、最大の得点を有する翻訳候
補を、入力された文又は独立節の翻訳の表現として決定
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文脈を判断しながら対
話文で話される文又は独立節を、例えば日本語から英語
又は英語から日本語に翻訳する対話文翻訳装置に関す
る。
【0002】
【従来の技術】従来の機械翻訳装置においては、翻訳す
べき文字列の単語からなる文章を解析辞書を用いて単語
に分解して解析した後、解析結果を異言語間の変換辞書
を用いて別の言語に翻訳している。
【0003】また、音声認識装置を用いた対話システム
における文脈情報に基づく絞り込み処理が、例えば、山
岡孝行ほか,“階層型プラン認識モデルを利用した次発
話予測手法”,電子情報通信学会論文誌D−II,Vo
l.J76−D−II,No.6,pp.1203−1
215,1993年6月に開示されている。この処置に
おいては、日本語の対話文を対象として、特に話し手の
意図を表わす表現についての音声認識結果のあいまい性
を解消するために、以下の処理を実行している。 (a)あいまい点の検出:音声認識結果として複数の候
補を有する単語の位置を検出し、文中の自立語、文中の
付属語、及び最終文節(文末の表現)の3つの位置で区
別する。 (b)利用情報の決定:上記あいまい点により利用する
予測情報を決定する。すなわち、あいまい点が最終文節
であれば、情報伝達行為のタイプに関する予測情報、自
立語であれば命題内容に関する情報を利用する。 (c)表層表現の選択:最後に、予測情報に対応づけら
れる表層表現を候補の中から選択する。予測情報と表層
表現の対応知識は、表層テーブルを用いて管理し、これ
らの知識の具体値は所定の語用論的知識を表した書き換
え規則に基づいて決定する。
【0004】
【発明が解決しようとする課題】しかしながら、前者の
従来の機械翻訳装置においては、文脈に関する処理を行
っていないために、文脈に依存した表現を訳し分けする
ことは困難であり、正しく翻訳することができなかっ
た。また、後者の対話システムにおける処理において
は、単一の言語における対話文の音声認識処理に適用す
ることができるが、翻訳処理に適用することはできなか
った。
【0005】本発明の目的は以上の問題点を解決し、翻
訳すべき対話文の文字列を、従来例に比較してより高い
精度で別の言語に翻訳することができる対話文翻訳装置
を提供することにある。
【0006】
【課題を解決するための手段】本発明に係る請求項1記
載の対話文翻訳装置は、対話文で話される文字列からな
る入力された文又は独立節を翻訳する対話文翻訳装置で
あって、所定の言語変換辞書を参照して、上記入力され
た文又は独立節の翻訳候補となる複数の翻訳候補の表現
の文字列を検索して出力する言語生成手段と、予め決め
られた複数の対話文の用例における互いに隣接する2つ
の文又は独立節である第1の言語の表現の組み合わせ
と、上記用例中におけるその組み合わせの頻度の回数を
格納する記憶手段と、上記記憶手段に記憶された内容を
参照し、上記言語生成手段から出力された複数の翻訳候
補の表現に対する翻訳の正確さを示す得点を、上記入力
された文又は独立節の直前に隣接する文又は独立節の翻
訳された第1の言語の表現と、上記用例中の上記複数の
翻訳候補の直前に隣接する表現との間の対応の可能性を
示す近さの度合いと、上記用例中の上記複数の翻訳候補
の直前に隣接する表現と上記複数の翻訳候補の表現との
間の組み合わせの上記用例中の頻度の回数とに基づいて
計算し、最大の得点を有する翻訳候補を、上記入力され
た文又は独立節の翻訳の表現として決定する翻訳処理手
段とを備えたことを特徴とする。
【0007】また、請求項2記載の対話文翻訳装置は、
請求項1記載の対話文翻訳装置において、上記入力され
た文又は独立節の直前に隣接する文又は独立節の翻訳さ
れた言語の表現は欠けていることを特徴とする。さら
に、請求項3記載の対話文翻訳装置は、請求項1又は2
記載の対話文翻訳装置において、上記記憶手段はさら
に、予め決められた複数の対話文の用例における互いに
隣接する2つの文又は独立節である第2の言語の表現の
組み合わせと、上記用例中におけるその組み合わせの頻
度の回数を格納し、上記入力された文又は独立節を、上
記第1の言語への翻訳に加えて、上記第2の言語への翻
訳を実行することを特徴とする。
【0008】
【作用】本発明に係る対話文翻訳装置においては、上記
言語生成手段は、所定の言語変換辞書を参照して、上記
入力された文又は独立節の翻訳候補となる複数の翻訳候
補の表現の文字列を検索して出力する。そして、上記翻
訳処理手段は、上記記憶手段に記憶された内容を参照
し、上記言語生成手段から出力された複数の翻訳候補の
表現に対する翻訳の正確さを示す得点を、上記入力され
た文又は独立節の直前に隣接する文又は独立節の翻訳さ
れた第1の言語の表現と、上記用例中の上記複数の翻訳
候補の直前に隣接する表現との間の対応の可能性を示す
近さの度合いと、上記用例中の上記複数の翻訳候補の直
前に隣接する表現と上記複数の翻訳候補の表現との間の
組み合わせの上記用例中の頻度の回数とに基づいて計算
し、最大の得点を有する翻訳候補を、上記入力された文
又は独立節の翻訳の表現として決定する。
【0009】
【実施例】以下、図面を参照して本発明に係る実施例に
ついて説明する。図1は、本発明に係る一実施例である
日英双方向対話文翻訳装置のブロック図である。
【0010】本実施例の対話文翻訳装置は、2者が行う
目的指向型の対話文で話される文字列からなる文を、独
立節又は文の単位(以下、翻訳単位という。)で、日本
語から英語に翻訳し(以下、日英翻訳という。)、もし
くは英語から日本語に翻訳(以下、英日翻訳という。)
する翻訳装置であって、従来の装置に比較して、以下の
装置部分を備えたことを特徴としている。 (a)日英翻訳用メモリ100に英語局所文脈辞書メモ
リ103を備えるとともに、英日翻訳用メモリ200に
日本語局所文脈辞書メモリ203を備える。ここで、局
所文脈辞書メモリ103,203は、多数の対話文の用
例における隣接する2つの文又は独立節(翻訳単位)の
組み合わせと、その組み合わせの頻度の回数を格納して
いる。 (b)バッファメモリ14と局所文脈処理部15とバッ
ファメモリ16とを備え、バッファメモリ14は出力言
語生成部13によって生成される言語変換後の翻訳単位
の複数の翻訳候補を一時的に格納する一方、バッファメ
モリ16は局所文脈処理部15から出力される翻訳決定
された翻訳単位の文字列データを一時的に格納する。こ
こで、局所文脈処理部15は、多数の対話文の用例にお
ける隣接する翻訳単位の組み合わせを格納する局所文脈
辞書メモリ103(日英翻訳のとき)又は203(英日
翻訳のとき)を参照して現在翻訳中の翻訳単位の表現を
決定するときに、先に決定されてバッファメモリ16に
格納された文字列データのうち、上記翻訳中の翻訳単位
の表現の直前の翻訳単位の文字列データを読み出し、当
該読み出した文字列データの表現と、用例中における複
数の翻訳候補の直前の表現との間の対応の可能性を示す
近さの度合いと、用例中における複数の翻訳候補の直前
の表現と複数の翻訳候補との間の組み合わせの頻度の回
数とに基づいて、上記複数の翻訳候補について各々詳細
後述する所定の方法で翻訳の正確さを示す得点の計算を
行い、最大の得点の翻訳候補を翻訳結果として選択して
バッファメモリ16を介して文字列出力部17に出力す
る。なお、その他の装置部分1,2,3,11乃至1
3,17,101,102,201,202は従来技術
と同様の装置部分である。以下、第1の言語(翻訳した
い元の言語)から第2の言語(生成される側の言語)へ
の翻訳について述べる。
【0011】上記翻訳用辞書メモリ100,200に格
納した用例は、2者が行う目的指向型の対話文の会話で
あって、具体的には、例えば、国際会議に関する問い合
わせを日英の各言語をそれぞれ母国語とするオペレータ
が翻訳者を介してキーボードを用いて対話を行った模擬
会話の実験結果(177会話)である。
【0012】上記用例中に含まれる対話文における文字
列データは、表1における発話の構成に示すように、発
話ごとに表2に示す各行ごとに独立節又は文の翻訳単位
で対応づけを行い、さらに、信号、接続、内容の各要素
に分割する。ここで、信号波発話先頭の呼びかけや応答
の語であって、接続は句読点を含む接続(助)詞類に対
応する。また、内容は接続要素に挟まれた意味伝達部分
である。
【0013】
【表1】 日本語:{信号}<接続>(内容)<接続>(内容)<
接続> 英語:{signal}<joint>(message)<joint>(mes
sage)<joint>
【表2】 日本語:{はい、}<それでは>(用紙をお送りしま
す)<ので、> 英語:{Okay,}<then>(I'll send it out soon)
<.> 日本語:(ご住所をお願いします)<。> 英語:(Could you give me your address)<?>
【0014】上記用例中に含まれる模擬会話の実験結果
(177会話)において、1つの内容が対象言語の1内
容に対応しないものも7%存在するが、簡便のために、
2言語で対応する複数個を1つの内容と扱い、信号と接
続とを含めたこのセット(文又は独立節)を翻訳単位
(TU)と設定する。すなわち、翻訳単位は、信号、
(前置)接続、内容、(後置)接続の各要素で構成され
る。上記177会話のキーボード模擬会話(日本語45
17文、英語4738文、TU数5419)すべてにつ
いて、この対応記述を行い、各内容に次の表3に示す2
0分類の発話行為タイプ(IFT)を付与する。
【0015】
【表3】 (1)情報提供 (1−1)事象 A1 過去 A2 現在 A3 未来 (1−2)心情 B1 感謝歓迎 B2 陳謝危惧 B3 希望要望 B4 その他 B5 別れ挨拶 (1−3)判断 C1 理解受諾 C2 正誤肯否 C3 決意選択 C4 義務必要 C5 可能許可 (2)要求 (2−1)情報 X1 選択疑問 X2 提供依頼 (2−2)判断 Y1 YES,NO疑問 Y2 確認 (2−3)行為 Z1 依頼 Z2 禁止 Z3 許可 (3)空 N1 空(翻訳候補の直前の表現に限る;
詳細後述。)
【0016】以下、図1を参照して、本実施例の対話文
翻訳装置の構成及び動作について説明する。
【0017】キーボード1は、翻訳すべき対話文の文字
列を入力する装置である。入力された文字列は文字入力
処理部11に入力されて対話文の文字列データを変換さ
れた後、入力言語解析部12に出力される。日英翻訳用
メモリ100は、日本語解析辞書メモリ101と日英変
換辞書メモリ102と英語局所文脈辞書メモリ103と
を備える一方、英日翻訳用メモリ200は英語解析辞書
201と英日変換辞書202と日本語局所文脈辞書20
3とを備える。キーボード1を用いて翻訳方向の切り換
えが指示されたときは、文字入力処理部11はスイッチ
SW1,SW2,SW3をそれぞれa側(日英翻訳のと
き)又はb側(英日翻訳のとき)に選択的に切り換え
る。ここで、メモリ100,200は例えばハードディ
スクメモリであって、各辞書メモリ101乃至,201
乃至203はそれぞれ別のメモリであってもよいし、同
一のメモリであってもよい。後者の場合、スイッチSW
1乃至SW3の切り換えは、メモリのアドレスに応じて
切り換えるように構成される。なお、キーボード1の代
わりに例えばメモリ上に記憶された文字列ファイルの中
の文字列データを直接に文字入力処理部11に入力して
もよい。
【0018】次いで、入力言語解析部12は、日本語解
析辞書メモリ101又は英語解析辞書メモリ102内の
解析辞書を参照して、入力された第1の言語の対話文の
解析を行う。具体的には、上述のように、入力された対
話文の文字列データについて、独立節又は文の単位で対
応づけを行い、さらに、信号、接続、内容の各要素を付
与する。翻訳単位で解析完了の場合、文字列データにそ
のデータを付加して出力言語生成部13に出力する。さ
らに、出力言語解析部13は、日英変換辞書メモリ10
2又は英日変換辞書メモリ202内の辞書を参照して、
入力される解析結果のデータについて翻訳処理を実行
し、翻訳可能な第2の言語の複数の翻訳候補を翻訳単位
で検索して、その複数の翻訳候補を上記入力された第1
の言語の文字列データとともに、バッファメモリ14を
介して局部文脈処理部15に出力する。
【0019】局所文脈処理部15は、バッファメモリ1
6から翻訳決定済みの直前の表現の文字列データを読み
出すとともに、英語局所文脈辞書メモリ103又は日本
語局所文脈辞書203を参照して、出力言語生成部13
からバッファメモリ14を介して入力された翻訳単位の
複数の翻訳候補の各々について詳細後述するように、翻
訳の正確さを示す得点を計算して、最大得点の翻訳候補
を翻訳決定の翻訳表現としてその文字列データを、少な
くとも1つの前の直前の翻訳表現の文字列データを格納
するバッファメモリ16を介して文字列出力部17に出
力する。文字列出力部17は、第2の言語が英語である
ときは大文字や小文字の整形を行う一方、第2の言語が
日本語であるときはそのまま、翻訳表現からなる翻訳結
果の文字列データをスッチSW4を介してCRTディス
プレイ2又はプリンタ3に出力して表示又は印字する。
【0020】局所文脈処理部15の処理は具体的には以
下のようにして行われる。すなわち、第1の言語の表現
Aに対する用例中の第2の言語の翻訳候補A’1
A’2,…,A’nから最適な解を決定するために、上記
各翻訳候補の得点a1,a2,…,anを計算した後、最
高得点の翻訳候補の表現を翻訳結果として採用する。こ
こで、入力された対話文においていま翻訳中の翻訳単位
の表現の直前の翻訳済みの第2の言語の表現Xと、用例
中の第2の言語の翻訳候補A’i(i=1,2,…,
n)の直前の表現Yj(j=1,2,…,m)との間の
対応の可能性の度合いを示す近さを次の数1で定義す
る。
【0021】
【数1】近さ関数FN(X,Yj)=u・(Cv+1) ここで、Cは予め決められた正の定数であり、本実施例
においては、好ましくはC=200である。
【数2】u=1,XとYjの各IFTが一致したとき =0,XとYjの各IFTが不一致のとき
【数3】 v=1,XとYjの各形態パターンが一致したとき =0,XとYjの各形態パターンが不一致のとき ここで、形態パターンとは、上述のように、信号、接
続、内容から判断される当該文章の形態のパターンであ
る。
【0022】そして、翻訳の正確さを示す翻訳候補A’
jに対する得点SC(A’j)、すなわち得点ajは、次
の数4で定義される。
【数4】 得点aj=SC(A’j)=Σj{FN(X,Yj)・f} ここで、fは、上記用例中において、表現Yjと翻訳候
補A’jが隣接した頻度(回数)である。
【0023】本実施例における局所文脈解析の特徴は、
各翻訳候補の得点が、生成される言語側すなわち第2の
言語側で決定されることである。例えば、「そちらは会
議事務局ですか。」(Is this the conference office
?)の次の「はい、そうです。」という入力があった場
合、その翻訳候補 (a)yes,it is. (b)we are. (c)okey,I’ll do so.… の各々について、上記数4に基づいて得点計算を実行す
る。ここでは、「そうです」の処理について以下に説明
する。
【0024】「Is this …」の質問に対する回
答である「そうです」の翻訳候補(当該翻訳候補は、出
力言語生成部13から出力されバッファメモリ14に格
納されているが、その一例を表4に示す。表4で、最初
の数字は、局所文脈処理部15において得点計算された
得点を示す。なお、表4乃至表6において、「M」はメ
ッセージを示し、それに続く2文字、例えば「C2」は
IFTである。また、[ ]内は品詞、活用を示す番
号、その位置を示す。
【0025】
【表4】 ( 2)M I do MC2│is this [N15] MY1 ( 1) M can I help you MY1│is this [N15] MY1 ( 0) M correct MC2│is this [N15] MY1 ( 1414) M it is MC2│is this [N15] MY1 ( 1) M it will MC2│is this [N15] MY1 ( 0) M sir^, that is correct MC2│is this [N15] MY1 ( 0) M that is correct MC2│is this [N15] MY1 ( 0) M that is right MC2│is this [N15] MY1 ( 202) M that^'^s correct MC2│is this [N15] MY1 ( 1) M that^'^s right MC2│is this [N15] MY1 ( 1) M the official language is English MA3│is this [N15] MY1 ( 1) M the one and the same MC2│is this [N15] MY1 ( 1) M they are MC2│is this [N15] MY1 ( 0) M this is THE Dr^. Pederson MA2│is this [N15] MY1 ( 224) M yes MC2│is this [N15] MY1
【0026】表4から明らかなように、「そうです」の
翻訳候補として、 (a)I do (b)can I help you (c)correct (d)it isなどが存在し、局所文脈処理部15
は、「そうです」に関係する英語局所文脈辞書メモリ1
03内の辞書(その一例を次の表5に示す。)を参照し
て、上記数4で示す得点の計算を実行し、その得点計算
の結果を表4の最初部分に示す。なお、表5及び表6の
各文の最後部の数字は上記頻度fを示す。当該得点計算
のときの特徴は、数1及び数4に示すように、(a)入
力された対話文においていま翻訳中の翻訳単位の表現の
直前の翻訳済みの第2の言語の表現Xと、用例中の第2
の言語の翻訳候補A’iの直前の表現Yjとの間の対応の
可能性の度合いを示す近さと、(b)上記用例中におい
て、表現Yjと翻訳候補A’jが隣接した頻度(回数)f
とに基づいて実行することである。次の表5において各
行の最初の英文が翻訳候補A’jであり、その次の英文
が表現Yjであり、最後の数字が頻度fである。
【0027】
【表5】 it is [A17] MC5│is it possible to pay in [N13] MY1│1 it is [N13] MA2│give us [N13] MX2│1 it is [N16] MA2│how much is [N16] MX1│1 it is not true MC2│I would like to ask if it is really true that [N11] will be giving [N18] MB3│1 it is okay to [V19]^,isn^'^t it MY2│I will [V19] MC3│1 it is MC2│I would like to ask if this is [N15] MB3│1 it is MC2│is it possible to [V19] MY1│1 it is MC2│is this [N15] MY1│4 it is MC2│is this possible MY1│1
【0028】従って、局所文脈処理部15は、表4の第
4行目の得点から明らかなように、「そうです」に対す
る翻訳表現として「it is」を決定して、その文字
列データをバッファメモリ16を介して文字列出力部1
7に出力する。
【0029】本実施例においては、上述のように、“i
s this…”の後に「そうです」の翻訳表現である
“yes,it is.”が英語局所文脈辞書メモリ1
03内にあるので、最高の得点を得て選択されることに
なる。もし、同一の形態パターンが無い場合でも、IF
Tが等しかったものが選択されるために、当該翻訳装置
は頑強さを保って翻訳処理を実行することができる。
【0030】さらに、日本語局所文脈辞書メモリ203
に格納された辞書の一例を表6に示す。表6は英日翻訳
に用いることができる。
【表6】 そうです MC2│[N15]でしょうか MY1│1 そうです MC2│[N15]ですか MY1│3 そうです MC2│[N19]だけでですか MY1│1 そうです MC2│[V19]せてもらってよろしいですね MY2
│1 そうです MC2│[V98]訳ですね MY2│1 そうです MC2│申し込み用紙は[N13]ですか MY1│1
【0031】以上の翻訳の一例では話者Aが話者Bと対
話しているときに、話者Aの質問に対して話者Bが応答
した場合の話者Bの発声内容の翻訳動作、いわゆる「応
答」の場合の翻訳動作について述べているが、本発明は
これに限らず、上記表2に示すように、話者Aが話者B
と対話しているときに、例えば一方の話者Aが連続して
発声する、互いに連続する複数の文又は独立節について
も、上記局所文脈処理部15の処理を同様に実行するこ
とができる。またさらに、対話文の冒頭の文又は独立節
についても以下のようにして翻訳することができる。こ
の場合は、直前の表現が欠落している場合であって、表
3に示すように、IFTとしてN1(空)を付与する。
【0032】いま、表7に示すような入力文があったと
き、入力言語解析部12の解析結果は次のようになる。
【表7】 入力:もしもし、通訳電話国際会議事務局ですか 解析結果:{もしもし、}([N15 通訳電話国際会議事
務局]ですか)<。>
【0033】次いで、出力言語生成部13は、日英変換
辞書メモリ102内の辞書を参照して翻訳処理すること
によって、上記「[N15]ですか」の翻訳候補として次の
表8に示すように、2つの翻訳候補を得て、バッファメ
モリ14を介して局所文脈処理部15に出力する。
【表8】 (翻訳候補1)I would like to ask if this is [N15]
MB3 (翻訳候補2)is this [N15] MY1
【0034】一方、英語局所部脈辞書メモリ103内の
辞書には、次の表9に示す辞書の一例が格納されてい
る。
【表9】 (翻訳候補1)I would like to ask if this is [N15]
MB3│ MN1│1 (翻訳候補2)is this [N15] MY1│ MN1│4
【0035】ここで、局所文脈処理部15は、上述と同
様に、数4を用いて得点を計算する。上記表9の各翻訳
候補について得点を計算すると以下のようになる。 (a)翻訳候補1の場合:XもY1も「空」なので形態
パターンもIFTも一致するので、u=v=1である。
従って、 近さ関数FN(X,Y1)=1×(200×1+1)=
201 得点(翻訳候補1=A’1)=201×1=201とな
る。 (b)候補2の場合:XもY2も「空」なので形態パタ
ーンもIFTも一致するので、u=v=1である。従っ
て、 近さ関数FN(X,Y2)=1×(200×1+1)=
201 得点(翻訳候補2=A’2)=201×4=804とな
る。
【0036】従って、翻訳候補2の得点が大きいため、
“is this [N15]"が選択され、結果的に、“is this th
e Secretariat for the International Conference on
Interpreting Telephony" という翻訳が生成されて文字
列出力部17に出力される。以上説明したように、対話
文における直前の表現が欠落している場合であって、I
FTとしてN1(空)を付与した後、局所文脈処理部1
5によって上述の得点計算を行うことにより、より正確
な翻訳を実行することができる。
【0037】従来の用例主導の翻訳装置では、用例に同
一のものがあれば距離0(これは、本実施例における無
限大の得点に相当する。)を与えるために、訳し分けが
困難であったが、本発明に係る実施例においては、有限
の値を頻度fに乗じて加算し、隣接条件で訳し分けが可
能となるという特有の利点を有する。
【0038】以上の実施例において、日英双方向の対話
文翻訳装置について説明しているが、本発明はこれに限
らず、他の言語間の対話文の翻訳装置に適用することが
できる。
【0039】
【発明の効果】以上詳述したように本発明によれば、対
話文で話される文字列からなる入力された文又は独立節
を翻訳する対話文翻訳装置であって、予め決められた複
数の対話文の用例における互いに隣接する2つの文又は
独立節である第1の言語の表現の組み合わせと、上記用
例中におけるその組み合わせの頻度の回数とを参照し、
複数の翻訳候補の表現に対する翻訳の正確さを示す得点
を、上記入力された文又は独立節の直前に隣接する文又
は独立節の翻訳された第1の言語の表現と、上記用例中
の上記複数の翻訳候補の直前に隣接する表現との間の対
応の可能性を示す近さの度合いと、上記用例中の上記複
数の翻訳候補の直前に隣接する表現と上記複数の翻訳候
補の表現との間の組み合わせの上記用例中の頻度の回数
とに基づいて計算し、最大の得点を有する翻訳候補を、
上記入力された文又は独立節の翻訳の表現として決定す
るようにしたので、文脈に依存して訳し分けすることが
でき、高い精度で別の言語に翻訳することができるとい
う利点がある。
【図面の簡単な説明】
【図1】 本発明に係る一実施例である日英双方向対話
文翻訳装置のブロック図である。
【符号の説明】
1…キーボード、 2…CRTディスプレイ、 3…プリンタ、 11…文字入力処理部、 12…入力言語解析部、 13…出力言語生成部、 14,16…バッファメモリ、 15…局所文脈処理部、 17…文字列出力部、 100…日英翻訳用メモリ、 101…日本語解析辞書メモリ、 102…日英変換辞書メモリ、 103…英語局所文脈辞書メモリ 200…英日翻訳用メモリ、 201…英語解析辞書メモリ、 202…英日変換辞書メモリ、 203…日本語局所文脈辞書メモリ、 SW1,SW2,SW3,SW4…スイッチ。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 対話文で話される文字列からなる入力さ
    れた文又は独立節を翻訳する対話文翻訳装置であって、 所定の言語変換辞書を参照して、上記入力された文又は
    独立節の翻訳候補となる複数の翻訳候補の表現の文字列
    を検索して出力する言語生成手段と、 予め決められた複数の対話文の用例における互いに隣接
    する2つの文又は独立節である第1の言語の表現の組み
    合わせと、上記用例中におけるその組み合わせの頻度の
    回数を格納する記憶手段と、 上記記憶手段に記憶された内容を参照し、上記言語生成
    手段から出力された複数の翻訳候補の表現に対する翻訳
    の正確さを示す得点を、上記入力された文又は独立節の
    直前に隣接する文又は独立節の翻訳された第1の言語の
    表現と、上記用例中の上記複数の翻訳候補の直前に隣接
    する表現との間の対応の可能性を示す近さの度合いと、
    上記用例中の上記複数の翻訳候補の直前に隣接する表現
    と上記複数の翻訳候補の表現との間の組み合わせの上記
    用例中の頻度の回数とに基づいて計算し、最大の得点を
    有する翻訳候補を、上記入力された文又は独立節の翻訳
    の表現として決定する翻訳処理手段とを備えたことを特
    徴とする対話文翻訳装置。
  2. 【請求項2】 上記入力された文又は独立節の直前に隣
    接する文又は独立節の翻訳された言語の表現は欠けてい
    ることを特徴とする請求項1記載の対話文翻訳装置。
  3. 【請求項3】 上記記憶手段はさらに、予め決められた
    複数の対話文の用例における互いに隣接する2つの文又
    は独立節である第2の言語の表現の組み合わせと、上記
    用例中におけるその組み合わせの頻度の回数を格納し、
    上記入力された文又は独立節を、上記第1の言語への翻
    訳に加えて、上記第2の言語への翻訳を実行することを
    特徴とする請求項1又は2記載の対話文翻訳装置。
JP5237810A 1993-09-24 1993-09-24 対話文翻訳装置 Pending JPH0793331A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5237810A JPH0793331A (ja) 1993-09-24 1993-09-24 対話文翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5237810A JPH0793331A (ja) 1993-09-24 1993-09-24 対話文翻訳装置

Publications (1)

Publication Number Publication Date
JPH0793331A true JPH0793331A (ja) 1995-04-07

Family

ID=17020748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5237810A Pending JPH0793331A (ja) 1993-09-24 1993-09-24 対話文翻訳装置

Country Status (1)

Country Link
JP (1) JPH0793331A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008234645A (ja) * 2007-03-21 2008-10-02 Toshiba Corp 訳文生成方法及び装置並びに機械翻訳
CN102053958A (zh) * 2009-10-27 2011-05-11 Sdl有限公司 上下文准确匹配
JP2011095841A (ja) * 2009-10-27 2011-05-12 Sdl Plc 文脈内正確(ice)一致
US10198438B2 (en) 1999-09-17 2019-02-05 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10248650B2 (en) 2004-03-05 2019-04-02 Sdl Inc. In-context exact (ICE) matching
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10198438B2 (en) 1999-09-17 2019-02-05 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10216731B2 (en) 1999-09-17 2019-02-26 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10248650B2 (en) 2004-03-05 2019-04-02 Sdl Inc. In-context exact (ICE) matching
JP2008234645A (ja) * 2007-03-21 2008-10-02 Toshiba Corp 訳文生成方法及び装置並びに機械翻訳
CN102053958A (zh) * 2009-10-27 2011-05-11 Sdl有限公司 上下文准确匹配
JP2011095841A (ja) * 2009-10-27 2011-05-12 Sdl Plc 文脈内正確(ice)一致
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US11321540B2 (en) 2017-10-30 2022-05-03 Sdl Inc. Systems and methods of adaptive automated translation utilizing fine-grained alignment
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11475227B2 (en) 2017-12-27 2022-10-18 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Similar Documents

Publication Publication Date Title
RU2070734C1 (ru) Устройство для перевода фраз из нескольких слов с первого языка на второй
US5384701A (en) Language translation system
EP0849723A2 (en) Speech recognition apparatus equipped with means for removing erroneous candidate of speech recognition
KR20090066067A (ko) 한영 자동번역 방법 및 장치
KR19980042248A (ko) 음성인식 시스템
JP2001100781A (ja) 音声処理装置および音声処理方法、並びに記録媒体
JP2000353161A (ja) 自然言語生成における文体制御方法及び装置
KR100853173B1 (ko) 통계적 자동 번역 방식에 기반한 음성 자동 통역 시스템 및그에 적용되는 번역 처리 방법 및 그 훈련방법
CN110931006A (zh) 基于情感分析的智能问答方法及相关设备
US20220180864A1 (en) Dialogue system, dialogue processing method, translating apparatus, and method of translation
Ueberla Analysing a simple language model· some general conclusions for language models for speech recognition
JPH0793331A (ja) 対話文翻訳装置
JP2000200273A (ja) 発話意図認識装置
Liu et al. Use of statistical N-gram models in natural language generation for machine translation
JP3566977B2 (ja) 自然言語処理装置及びその方法
JP3441400B2 (ja) 言語変換規則作成装置、及びプログラム記録媒体
JP4733436B2 (ja) 単語・意味表現組データベースの作成方法、音声理解方法、単語・意味表現組データベース作成装置、音声理解装置、プログラムおよび記憶媒体
JP2001100788A (ja) 音声処理装置および音声処理方法、並びに記録媒体
Ramaswamy et al. Hierarchical feature-based translation for scalable natural language understanding
KR20180054236A (ko) 음성기호 기반 사전 유사 탐색을 활용한 자동 통번역 시스템 및 그 방법
JP2001117583A (ja) 音声認識装置および音声認識方法、並びに記録媒体
JP2001325254A (ja) 表現変換方法及び表現変換装置
KR20030010979A (ko) 의미어단위 모델을 이용한 연속음성인식방법 및 장치
Bellegarda Multilingual Transliteration for Pan-Indic Keyboard Input
JP2817406B2 (ja) 連続音声認識方式