JP2001117921A

JP2001117921A - 翻訳装置および翻訳方法、並びに記録媒体

Info

Publication number: JP2001117921A
Application number: JP29387499A
Authority: JP
Inventors: Junichi Yamashita; 潤一山下; Hironaga Tsutsumi; 洪長包
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1999-10-15
Filing date: 1999-10-15
Publication date: 2001-04-27

Abstract

(57)【要約】【課題】翻訳精度を向上させる。【解決手段】ドメイン推定部４０では、音声認識部１
の音声認識結果から、音声翻訳システムが使用されてい
るドメインが推定され、そのドメインを表すドメイン情
報が、音声認識結果とともに、機械翻訳部２に供給され
る。機械翻訳部２では、複数のドメインについて、各ド
メインごとに、翻訳用のデータを記憶しており、ドメイ
ン推定部４０からの音声認識結果を、同じくドメイン推
定部４０からのドメイン情報が表すドメインに対応する
翻訳用のデータを参照して翻訳する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、翻訳装置および翻
訳方法、並びに記録媒体に関し、特に、翻訳を、短時間
で、かつ精度良く行うことができるようにする翻訳装置
および翻訳方法、並びに記録媒体に関する。

【０００２】

【従来の技術】例えば、日本語と英語等の、異なる言語
による発話を行うユーザどうしがコミュニケーションを
図るためのツールとして、音声認識装置、翻訳装置、お
よび音声合成装置から構成される音声翻訳システムがあ
る。音声翻訳システムでは、音声認識装置において、例
えば、日本語の発話が音声認識され、翻訳装置におい
て、その音声認識結果が英語に翻訳される。そして、音
声合成装置において、その翻訳結果が、合成音で出力さ
れる。また、音声認識装置において、英語の発話が音声
認識され、翻訳装置において、その音声認識結果が日本
語に翻訳される。そして、音声合成装置において、その
翻訳結果が、合成音で出力される。従って、英語の話者
（ユーザ）は、日本語の話者の発話を、英語で聞くこと
ができ、また、日本語の話者は、英語の話者の発話を、
日本語で聞くことができ、相互に、相手の発話を理解し
て対話を行うことができる。

【０００３】

【発明が解決しようとする課題】ところで、翻訳装置に
おいては、単語辞書や文法規則等のデータを参照して、
翻訳が行われるが、翻訳装置の中には、そのシステムが
使用される、例えば、レストランや、空港、ホテルとい
った、あるドメイン（シチュエーション）（場面）用の
データだけを有するものがある。

【０００４】このような翻訳装置によれば、あるドメイ
ンについてだけの単語辞書や文法規則等のデータを参照
して、翻訳が行われるため、比較的短時間で、かつ、そ
のドメインにおいては、精度の高い翻訳結果を得ること
ができる。

【０００５】しかしながら、あるドメインについてだけ
の単語辞書や文法規則等のデータを参照して翻訳を行う
翻訳装置では、他のドメインにおける翻訳精度が悪化す
る。

【０００６】そこで、各種のドメインすべてについての
単語辞書や文法規則等のデータを参照して翻訳を行う方
法があるが、この方法では、翻訳時に参照するデータが
多くなり、翻訳結果を得るのに長時間を要することとな
る。

【０００７】本発明は、このような状況に鑑みてなされ
たものであり、翻訳を、短時間で、かつ精度良く行うこ
とができるようにするものである。

【０００８】

【課題を解決するための手段】本発明の翻訳装置は、入
力文を翻訳する翻訳手段と、入力文から、所定の情報を
抽出する抽出手段と、入力文から抽出された情報に基づ
いて、翻訳手段による前記入力文の翻訳を制御する制御
手段とを備えることを特徴とする。

【０００９】翻訳手段には、翻訳時に参照する参照デー
タを記憶している記憶手段を設け、制御手段には、入力
文から抽出された情報に基づいて、その入力文の翻訳時
に参照すべき参照データを指定させることができる。

【００１０】抽出手段には、入力文から、その入力文の
文型、言語、またはキーワードを抽出させることができ
る。

【００１１】翻訳手段には、翻訳時に参照する参照デー
タを、文型ごとに記憶している記憶手段を設け、制御手
段には、入力文の文型に対応する参照データを参照する
ように、翻訳手段を制御させることができる。

【００１２】また、翻訳手段には、翻訳時に参照する参
照データを、ドメインごとに記憶している記憶手段を設
け、制御手段には、入力文から抽出されたキーワードに
基づいて、入力文が入力されたドメインを推定させ、そ
のドメインに対応する参照データを参照するように、翻
訳手段を制御させることができる。

【００１３】さらに、翻訳手段には、翻訳時に参照する
参照データを、翻訳対象の言語ごとに記憶している記憶
手段を設け、制御手段には、入力文の言語に対応する参
照データを参照するように、翻訳手段を制御させること
ができる。

【００１４】本発明の翻訳装置には、音声を認識し、そ
の音声認識結果を、入力文として出力する音声認識手段
をさらに設けることができる。

【００１５】本発明の翻訳方法は、入力文を翻訳する翻
訳ステップと、入力文から、所定の情報を抽出する抽出
ステップと、入力文から抽出された情報に基づいて、翻
訳ステップによる入力文の翻訳を制御する制御ステップ
とを備えることを特徴とする。

【００１６】本発明の記録媒体は、入力文を翻訳する翻
訳ステップと、入力文から、所定の情報を抽出する抽出
ステップと、入力文から抽出された情報に基づいて、翻
訳ステップによる入力文の翻訳を制御する制御ステップ
とを備えるプログラムが記録されていることを特徴とす
る。

【００１７】本発明の翻訳装置および翻訳方法、並びに
記録媒体においては、入力文から、所定の情報が抽出さ
れ、その情報に基づいて、入力文の翻訳が制御される。

【００１８】

【発明の実施の形態】図１は、本発明が適用される音声
翻訳システム（システムとは、複数の装置が論理的に集
合した物をいい、各構成の装置が同一筐体中にあるか否
かは問わない）の構成例を示している。

【００１９】この音声翻訳システムでは、例えば、日本
語による音声が入力されると、その音声が英語に翻訳さ
れて出力され、また、英語による音声が入力されると、
その音声が日本語に翻訳されて出力されるようになって
おり、これにより、日本語のユーザ（話者）と、英語の
ユーザとが、対話を行うことができるようになってい
る。

【００２０】即ち、音声認識部１には、ユーザが発話し
た音声が入力されるようになっており、音声認識部１
は、入力された音声を音声認識し、その音声認識結果と
してのテキスト、その他付随する情報を、機械翻訳部２
や、表示部４などに、必要に応じて出力する。

【００２１】機械翻訳部２は、音声認識部１が出力する
音声認識結果を解析し、入力された音声を、その音声の
言語以外の言語に機械翻訳し（本実施の形態では、日本
語は英語に、英語は日本語に、それぞれ翻訳される）、
その翻訳結果としてのテキスト、その他付随する情報
を、音声合成部３や、表示部４などに、必要に応じて出
力する。音声合成部３は、音声認識部１や機械翻訳部２
などの出力に基づいて音声合成処理を行い、これによ
り、例えば、入力された音声の、他の言語への翻訳結果
としての合成音等を出力する。

【００２２】表示部４は、例えば、液晶ディスプレイ等
で構成され、音声認識部１による音声認識結果や、機械
翻訳部２による機械翻訳結果等を、必要に応じて表示す
る。

【００２３】以上のように構成される音声翻訳システム
においては、例えば、日本語の音声が入力されると、そ
の音声が、音声認識部１で音声認識され、機械翻訳部２
に供給される。機械翻訳部２では、音声認識部１による
音声認識結果が、英語に機械翻訳され、音声合成部３に
供給される。音声合成部３では、機械翻訳部２による翻
訳結果に対応する合成音が生成されて出力される。ま
た、英語の音声が入力されると、その音声が、音声認識
部１で音声認識され、機械翻訳部２に供給される。機械
翻訳部２では、音声認識部１による音声認識結果が、日
本語に機械翻訳され、音声合成部３に供給される。音声
合成部３では、機械翻訳部２による翻訳結果に対応する
合成音が生成されて出力される。

【００２４】従って、図１の音声翻訳システムによれ
ば、英語のユーザは、日本語のユーザによる日本語の発
話を理解し、また、日本語のユーザは、英語のユーザに
よる英語の発話を理解することができ、日本語のユーザ
と、英語のユーザとの間で対話を行うことができる。

【００２５】次に、図２は、図１の音声認識部１の構成
例を示している。

【００２６】ユーザの発話は、マイク１１に入力され、
マイク１１では、その発話が、電気信号としての音声信
号に変換される。この音声信号は、ＡＤ(Analog Digita
l)変換部１２に供給される。ＡＤ変換部１２では、マイ
ク１１からのアナログ信号である音声信号がサンプリン
グ、量子化され、ディジタル信号である音声データに変
換される。この音声データは、特徴抽出部１３に供給さ
れる。

【００２７】特徴抽出部１３は、ＡＤ変換部１２からの
音声データについて、適当なフレームごとに、例えば、
スペクトルや、パワー、線形予測係数、ケプストラム係
数、線スペクトル対等の特徴パラメータを抽出し、特徴
量バッファ１４およびマッチング部１５に供給する。特
徴量バッファ１４では、特徴抽出部１３からの特徴パラ
メータが一時記憶される。

【００２８】マッチング部１５は、特徴量抽出部１３か
らの特徴パラメータ、または特徴量バッファ１４に記憶
された特徴パラメータに基づき、音響モデルデータベー
ス１６、辞書データベース１７、および文法データベー
ス１８を必要に応じて参照しながら、マイク１１に入力
された音声（入力音声）を認識する。

【００２９】即ち、音響モデルデータベース１６は、音
声認識する音声の言語における個々の音素や音節などの
音響的な特徴を表す音響モデルを記憶している。ここ
で、音響モデルとしては、例えば、ＨＭＭ(Hidden Mark
ov Model)などを用いることができる。辞書データベー
ス１７は、認識対象の各単語（語句）について、その発
音に関する情報が記述された単語辞書や、音素や音節の
連鎖関係を記述した言語モデルを記憶している。文法デ
ータベース１８は、辞書データベース１７の単語辞書に
登録されている各単語が、どのように連鎖する（つなが
る）かを記述した文法規則を記憶している。ここで、文
法規則としては、例えば、文脈自由文法（ＣＦＧ）や、
統計的な単語連鎖確率（Ｎ−ｇｒａｍ）などに基づく規
則を用いることができる。

【００３０】マッチング部１５は、辞書データベース１
７の単語辞書や言語モデルを参照することにより、音響
モデルデータベース１６に記憶されている音響モデルを
接続することで、単語の音響モデル（単語モデル）を構
成する。さらに、マッチング部１５は、幾つかの単語モ
デルを、文法データベース１８に記憶された文法規則を
参照することにより接続し、そのようにして接続された
単語モデルを用いて、特徴パラメータに基づき、例え
ば、ＨＭＭ法等によって、マイク１１に入力された音声
を認識する。

【００３１】そして、マッチング部１５による音声認識
結果は、例えば、テキスト等で出力される。

【００３２】なお、マッチング部１５は、入力された音
声を対象として、再度、処理を行うことが必要な場合
は、特徴量バッファ１４に記憶された特徴パラメータを
用いて処理を行うようになっており、これにより、ユー
ザに再度の発話を要求せずに済むようになっている。

【００３３】さらに、本実施の形態では、上述したよう
に、日英および英日の翻訳の両方が可能であるため、音
響モデルデータベース１６、辞書データベース１７、お
よび文法データベース１８には、少なくとも、日本語の
音声認識に用いるデータと、英語の音声認識に用いるデ
ータとが記憶されている。

【００３４】次に、図３は、図１の機械翻訳部２の構成
例を示している。

【００３５】テキスト解析部２１には、音声認識部１が
出力する音声認識結果としてのテキスト等が、機械翻訳
の対象として入力されるようになっており、テキスト解
析部２１は、辞書データベース２４や解析用文法データ
ベース２５を参照しながら、そのテキストを解析する。

【００３６】即ち、辞書データベース２４には、各単語
の表記や、解析用文法を適用するために必要な品詞情報
などが記述された単語辞書が記憶されている。また、解
析用文法データベース２５には、単語辞書に記述された
各単語の情報に基づいて、単語連鎖に関する制約等が記
述された解析用文法規則が記憶されている。そして、テ
キスト解析部２１は、その単語辞書や解析用文法規則に
基づいて、そこに入力されるテキスト（入力テキスト）
の形態素解析や、構文解析等を行い、その入力テキスト
を構成する単語や構文の情報等の言語情報を抽出する。
ここで、テキスト解析部２１における解析方法として
は、例えば、正規文法や、文脈自由文法、統計的な単語
連鎖確率を用いたものなどがある。

【００３７】テキスト解析部２１で得られた入力テキス
トの解析結果としての言語情報は、言語変換部２２に供
給される。言語変換部２２は、言語変換データベース２
６を参照し、入力テキストの言語の言語情報を、翻訳結
果の言語の言語情報に変換する。

【００３８】即ち、言語変換データベース２６には、入
力言語（言語変換部２２への入力の言語）の言語情報か
ら、出力言語（言語変換部２２からの出力の言語）の言
語情報への変換パターン（テンプレート）や、入力言語
と出力言語との対訳用例およびその対訳用例と入力言語
との間の類似度の計算に用いられるシソーラス等の、言
語情報を変換するための言語変換データが記憶されてい
る。そして、言語変換部２２では、このような言語変換
データに基づいて、入力テキストの言語の言語情報が、
出力言語の言語情報に変換される。即ち、言語変換部２
２は、例えば、対訳用例と入力言語の言語情報との類似
度を、シソーラスを用いて求め、その類似度の最も大き
い対訳用例を検出する。そして、言語変換部２２は、そ
の対訳用例を用いて、入力言語の言語情報を、出力言語
の言語情報に変換する。

【００３９】言語変換部２２で得られた出力言語の言語
情報は、テキスト生成部２３に供給され、テキスト生成
部２３は、辞書データベース２７および生成用文法デー
タベース２８を参照することにより、出力言語の言語情
報から、入力テキストを出力言語に翻訳したテキストを
生成する。

【００４０】即ち、辞書データベース２７には、出力言
語の文を生成するのに必要な単語の品詞や活用形等の情
報が記述された単語辞書が記憶されており、また、生成
用文法データベース２８には、出力言語の文を生成する
のに必要な単語の活用規則や語順の制約等の生成用文法
規則が記憶されている。そして、テキスト生成部２３
は、これらの単語辞書および生成用文法規則に基づい
て、言語変換部２２からの言語情報を、テキストに変換
して出力する。

【００４１】なお、上述の場合には、言語変換部２２に
おいて、対訳用例と入力言語の言語情報との類似度に基
づいて、翻訳に用いる対訳用例を決定するようにした
が、その他、翻訳に用いる対訳用例の決定は、例えば、
すべての対訳用例を用いて翻訳を行い、その翻訳結果に
ついて、言語モデルを用いてスコアリングを行い、その
スコアに基づいて行うようにすることも可能である。

【００４２】また、本実施の形態では、上述したよう
に、日英および英日の翻訳の両方が可能であるため、辞
書データベース２４、解析用文法データベース２５、言
語変換データベース２６、辞書データベース２７、およ
び生成用文法データベース２８には、日英の翻訳のため
のデータと、英日の翻訳のためのデータとが記憶されて
いる。

【００４３】次に、図４は、図１の音声合成部３の構成
例を示している。

【００４４】テキスト解析部３１には、機械翻訳部２が
出力する翻訳結果としてのテキストが出力するテキスト
が、音声合成処理の対象として入力されるようになって
おり、テキスト解析部３１は、辞書データベース３４や
解析用文法データベース３５を参照しながら、そのテキ
ストを解析する。

【００４５】即ち、辞書データベース３４には、各単語
の品詞情報や、読み、アクセント等の情報が記述された
単語辞書が記憶されており、また、解析用文法データベ
ース３５には、辞書データベース３４の単語辞書に記述
された単語について、単語連鎖に関する制約等の解析用
文法規則が記憶されている。そして、テキスト解析部３
１は、この単語辞書および解析用文法規則に基づいて、
そこに入力されるテキストの形態素解析や構文解析等の
解析を行い、後段の規則合成部３２で行われる規則音声
合成に必要な情報を抽出する。ここで、規則音声合成に
必要な情報としては、例えば、ポーズの位置や、アクセ
ントおよびイントネーションを制御するための情報その
他の韻律情報や、各単語の発音等の音韻情報などがあ
る。

【００４６】テキスト解析部３１で得られた情報は、規
則合成部３２に供給され、規則合成部３２では、音素片
データベース３６を用いて、テキスト解析部３１に入力
されたテキストに対応する合成音の音声データ（ディジ
タルデータ）が生成される。

【００４７】即ち、音素片データベース３６には、例え
ば、ＣＶ(Consonant, Vowel)や、ＶＣＶ、ＣＶＣ等の形
で音素片データが記憶されており、規則合成部３２は、
テキスト解析部３１からの情報に基づいて、必要な音素
片データを接続し、さらに、ポーズ、アクセント、イン
トネーション等を適切に付加することで、テキスト解析
部３１に入力されたテキストに対応する合成音の音声デ
ータ（音声波形）を生成する。

【００４８】この音声データは、ＤＡ変換部３３に供給
され、そこで、アナログ信号としての音声信号に変換さ
れる。この音声信号は、図示せぬスピーカに供給され、
これにより、テキスト解析部３１に入力されたテキスト
に対応する合成音が出力される。

【００４９】次に、図５は、本発明を適用した音声翻訳
システムの第１実施の形態の構成例を示している。な
お、図中、図１における場合と対応する部分について
は、同一の符号を付してあり、以下では、その説明は、
適宜省略する。即ち、図５の音声翻訳システムは、音声
認識部１と機械翻訳部２との間に、ドメイン推定部４０
が新たに設けられている他は、図５における場合と基本
的に同様に構成されている。

【００５０】但し、図５の実施の形態では、機械翻訳部
２（図３）における辞書データベース２４、解析用文法
データベース２５、言語変換データベース２６、辞書デ
ータベース２７、および生成用文法データベース２８に
おける、翻訳時に参照される情報（以下、適宜、参照デ
ータという）が、音声翻訳システムが使用される各ドメ
インに適したものに分けて記憶されている。

【００５１】ドメイン推定部４０は、音声認識部１が出
力する音声認識結果を受信し、その音声認識結果から、
所定のキーワードを抽出する。そして、ドメイン推定部
４０は、その抽出したキーワードから、音声翻訳システ
ムが使用されているドメインを推定し、そのドメインに
対応する参照データを参照して、音声認識部１による音
声認識結果の翻訳を行うように、機械翻訳部２を制御す
る。

【００５２】即ち、図６は、図５のドメイン推定部４０
の構成例を示している。

【００５３】テキスト解析部４１には、音声認識部１が
出力する音声認識結果としてのテキストが入力されるよ
うになっており、テキスト解析部４１は、辞書データベ
ース４４や解析用文法データベース４５を参照しなが
ら、そのテキストを解析する。

【００５４】即ち、辞書データベース４４には、各単語
の表記や、解析用文法を適用するために必要な品詞情報
などが記述された単語辞書が記憶されている。また、解
析用文法データベース４５には、辞書データベース４４
の単語辞書に記述された各単語の情報に基づいて、単語
連鎖に関する制約等が記述された解析用文法規則が記憶
されている。そして、テキスト解析部４１は、その単語
辞書や解析用文法規則に基づいて、そこに入力される音
声認識結果のテキスト（入力テキスト）の形態素解析
や、構文解析等を行い、その入力テキストを構成する単
語や構文の情報等の言語情報を抽出する。ここで、テキ
スト解析部４１における解析方法としては、例えば、正
規文法や、文脈自由文法、統計的な単語連鎖確率を用い
たものなどがある。

【００５５】テキスト解析部４１で得られた入力テキス
トの解析結果としての言語情報は、キーワード抽出部４
２に供給される。キーワード抽出部４２は、辞書データ
ベース４６を参照し、入力テキストの言語の言語情報に
基づいて、その入力テキストに含まれるキーワードを抽
出する。

【００５６】即ち、辞書データベース４６は、キーワー
ドとしての単語が登録されているキーワード辞書を記憶
している。即ち、キーワード辞書には、機械翻訳部２の
辞書データベース２４や２７に記憶されている単語辞書
のすべてまたは一部の単語が、キーワードとして登録さ
れている。

【００５７】そして、キーワード抽出部４２では、入力
テキストから、キーワード辞書に登録されているキーワ
ードと同一の単語がワードスポッティングによって抽出
され、キーワードマッチング部４３に供給される。

【００５８】なお、キーワード抽出部４２には、その
他、例えば、入力テキストから、主語になる得る名詞
や、述語になり得る動詞を、キーワードととして抽出さ
せることも可能である。

【００５９】キーワードマッチング部４３は、辞書デー
タベース４７を参照して、キーワード抽出部４２からの
キーワードに基づいて、システムが使用されているドメ
インを推定する。

【００６０】即ち、辞書データベース４７は、各単語と
その品詞情報とが、単語が使用されるドメインごとに登
録されているドメイン辞書、並びにシソーラスを記憶し
ており、キーワードマッチング部４３は、キーワード抽
出部４３からのキーワードと、各ドメインのドメイン辞
書に登録されている単語との類似度を、シソーラスを用
いて計算し、その類似度を最も高くするドメイン辞書の
ドメインを、システムが使用されているドメインとして
推定する。そして、キーワードマッチング部４３は、そ
の推定されたドメイン（以下、適宜、推定ドメインとい
う）を表すドメイン情報を、音声認識部１からの音声認
識結果とともに、機械翻訳部２に出力し、これにより、
ドメイン情報に対応するドメインに対応する参照データ
を参照して、音声認識結果を翻訳するように、機械翻訳
部２を制御する。

【００６１】次に、図７のフローチャートを参照して、
図５の音声翻訳システムの動作について説明する。

【００６２】ユーザが発話を行うと、音声認識部１は、
ステップＳ１において、その発話を取り込み、ステップ
Ｓ２に進み、その取り込んだ発話を音声認識して、ステ
ップＳ３に進む。ステップＳ３では、音声認識部１は、
ユーザの発話の音声認識結果を、ドメイン推定部４０に
出力し、ステップＳ４に進む。

【００６３】ステップＳ４では、ドメイン推定部４０の
テキスト解析部４１（図６）において、音声認識部１か
らの音声認識結果が解析され、その解析結果が、キーワ
ード抽出部４２に供給される。キーワード抽出部４２で
は、ステップＳ５において、テキスト解析部４１からの
解析結果に基づいて、音声認識部１による音声認識結果
に、キーワードが含まれるかどうかが判定される。

【００６４】ステップＳ５において、音声認識部１によ
る音声認識結果に、キーワードが含まれると判定された
場合、そのキーワードとしての単語が、音声認識結果か
ら抽出され、キーワードマッチング部４３に出力され、
ステップＳ６に進む。ステップＳ６では、キーワードマ
ッチング部４３において、キーワード抽出部４２からの
キーワードと、辞書データベース４７に登録されている
単語との類似度を、上述したようにして計算するキーワ
ードマッチングが行われる。

【００６５】そして、ステップＳ７に進み、キーワード
マッチング部４３は、キーワードマッチングの結果得ら
れた類似度に基づいて、ドメインを推定し、そのドメイ
ンを表すドメイン情報を、機械翻訳部２に供給して、ス
テップＳ９に進む。

【００６６】即ち、例えば、いま、キーワードとして、
「ご飯」および「食べる」が抽出された場合に、辞書デ
ータベース４７のドメイン辞書の中の、ドメイン「レス
トラン」のドメイン辞書についての類似度が最も高くな
ったときには、ドメインが「レストラン」であることが
推定され、その「レストラン」を表すドメイン情報が、
機械翻訳部２に供給される。

【００６７】なお、ここでは、キーワードマッチング部
４３において、最初から類似度を計算し、その類似度に
基づいて、ドメインを推定するようにしたがするように
したが、その他、例えば、キーワード抽出部４２で抽出
されたキーワードに一致する単語が登録されているドメ
イン辞書を検出し、そのようなドメイン辞書が１つだけ
の場合は、そのドメイン辞書のドメインを、音声翻訳シ
ステムが使用されているドメインと推定し、そのような
ドメイン辞書が複数ある場合は、類似度に基づいて、ド
メインを推定するようにしても良い。この場合、例え
ば、キーワードとして「ごはん」が抽出されたとする
と、「ごはん」が登録されているドメイン辞書が、「レ
ストラン」のドメイン辞書だけであれば、ドメインが
「レストラン」であると推定される。また、「ごはん」
が登録されているドメイン辞書が複数ある場合には、上
述したように、類似度に基づいて、ドメインが推定され
る。

【００６８】一方、ステップＳ５において、音声認識部
１による音声認識結果に、キーワードが含まれないと判
定された場合、その旨が、キーワード抽出部４２からキ
ーワードマッチング部４３に供給され、ステップＳ８に
進む。ステップＳ８では、キーワードマッチング部４３
は、標準のドメインを表すドメイン情報を、機械翻訳部
２に供給して、ステップＳ９に進む。

【００６９】ここで、図５の機械翻訳部２は、特定のド
メインごとの参照データの他、標準のドメインに対応す
る参照データも記憶している。なお、標準のドメインに
対応する参照データを用いた翻訳によれば、複数のドメ
インについて、ある程度の精度による翻訳が可能である
が、その翻訳精度は、特定のドメインに対応する参照デ
ータを用いて、その特定のドメインについての翻訳を行
う場合よりも劣化する。

【００７０】ステップＳ９では、機械翻訳部２におい
て、ドメイン推定部４０からのドメイン情報に対応する
ドメインに対応する参照データを参照するように、動作
モードが切り替えられ、ステップＳ１０に進む。

【００７１】ステップＳ１０では、ドメイン推定部４０
は、音声認識部１の音声認識結果を、機械翻訳部２に出
力し、ステップＳ１１に進む。ステップＳ１１では、機
械翻訳部２において、音声認識部１の音声認識結果が、
ドメイン推定部４０からのドメイン情報に対応するドメ
インに対応する参照データを参照することにより翻訳さ
れ、その翻訳結果が、音声合成部３に出力される。

【００７２】音声合成部３では、ステップＳ１２におい
て、機械翻訳部２からの翻訳結果に対応する合成音が生
成され、ステップＳ１３に進み、その合成音が出力され
る。そして、ユーザが次の発話を行うのを待って、ステ
ップＳ１に戻り、以下、同様の処理が繰り返される。

【００７３】以上のように、音声認識結果に含まれるキ
ーワードを抽出し、そのキーワードから、ドメインを推
定して、そのドメインに対応する参照データを用いて翻
訳を行うように、機械翻訳部２を制御するようにしたの
で、機械翻訳部２では、音声認識結果のドメインに適し
た参照データだけを参照して翻訳を行うことができ、そ
の結果、短時間で、かつ精度の良い翻訳を行うことが可
能となる。

【００７４】なお、ドメイン推定部４０は、音声認識部
１または機械翻訳部２と一体的に構成することも可能で
ある。

【００７５】次に、図８は、本発明を適用した音声翻訳
システムの第２実施の形態の構成例を示している。な
お、図中、図５における場合と対応する部分について
は、同一の符号を付してあり、以下では、その説明は、
適宜省略する。即ち、図８の音声翻訳システムは、１つ
の機械翻訳部２に替えて、複数の機械翻訳部２₁乃至２_N
が設けられている他は、図５における場合と同様に構成
されている。

【００７６】機械翻訳部２₁乃至２_Nそれぞれは、図５の
機械翻訳部２と同様に構成されている。但し、図５の実
施の形態では、機械翻訳部２が、参照データを、各ドメ
インごとに分けて記憶していたが、機械翻訳部２₁乃至
２_Nそれぞれは、あるドメインに対応する参照データの
みを記憶している。

【００７７】以上のように構成される音声翻訳システム
では、ドメイン推定部４０は、ドメインを推定すると、
そのドメインに対応する参照データを記憶している機械
翻訳部２_n（ｎは、１乃至Ｎのうちのいずれか）に、音
声認識部１による音声認識結果を出力して翻訳させる。

【００７８】従って、この場合も、図５の実施の形態に
おける場合と同様に、音声認識結果のドメインに適した
参照データだけを参照して翻訳が行われるので、短時間
で、かつ精度の良い翻訳を行うことが可能となる。

【００７９】次に、図９は、本発明を適用した音声翻訳
システムの第３実施の形態の構成例を示している。な
お、図中、図１における場合と対応する部分について
は、同一の符号を付してあり、以下では、その説明は、
適宜省略する。即ち、図９の音声翻訳システムは、音声
認識部１と機械翻訳部２との間に、文型判別部５０が新
たに設けられている他は、図１における場合と基本的に
同様に構成されている。

【００８０】但し、図９の実施の形態では、機械翻訳部
２（図２）における辞書データベース２４、解析用文法
データベース２５、言語変換データベース２６、辞書デ
ータベース２７、および生成用文法データベース２８に
おける、翻訳時に参照される情報（参照データ）が、例
えば、単文や複文、あるいは口語文や文語文といった文
型ごとに適したものに分けて記憶されている。

【００８１】文型判別部５０は、音声認識部１が出力す
る音声認識結果を受信し、その音声認識結果から、その
文型に関する情報を抽出して、その文型を判別する。そ
して、文型判別部５０は、その音声認識結果の文型に対
応する参照データを参照して、音声認識部１による音声
認識結果の翻訳を行うように、機械翻訳部２を制御す
る。

【００８２】即ち、図１０は、図９の文型判別部５０の
構成例を示している。

【００８３】テキスト解析部５１には、音声認識部１が
出力する音声認識結果としてのテキストが入力されるよ
うになっており、テキスト解析部５１は、辞書データベ
ース５３や解析用文法データベース５４を参照しなが
ら、そのテキストを解析する。

【００８４】即ち、辞書データベース５３には、各単語
の表記や、解析用文法を適用するために必要な品詞情報
などが記述された単語辞書が記憶されている。また、解
析用文法データベース５４には、辞書データベース５３
の単語辞書に記述された各単語の情報に基づいて、単語
連鎖に関する制約等が記述された解析用文法規則が記憶
されている。そして、テキスト解析部５１は、その単語
辞書や解析用文法規則に基づいて、そこに入力される音
声認識結果のテキスト（入力テキスト）の形態素解析を
行い、その入力テキストを構成する単語や構文の情報等
の言語情報を抽出する。ここで、テキスト解析部５１に
おける解析方法としては、例えば、正規文法や、文脈自
由文法、統計的な単語連鎖確率を用いたものなどがあ
る。

【００８５】テキスト解析部５１で得られた入力テキス
トの形態素解析結果としての言語情報は、構文解析部５
２に供給される。構文解析部５２は、辞書データベース
５５および解析用文法データベース５６を参照しなが
ら、入力テキストの言語の言語情報を構文解析し、さら
に、その入力テキストに含まれるキーワードを抽出する
ことで、入力テキストの文型を認識する。

【００８６】即ち、辞書データベース５５は辞書データ
ベース５３と、解析用文法データベース５６は解析用文
法データベース５４と、それぞれ同様のデータを記憶し
ており、構文解析部５２は、辞書データベース５５の単
語辞書や、解析用文法データベース５６の解析用文法規
則に基づいて、テキスト解析部５１からの言語情報の構
文解析を行うことで、その構文構造を抽出する。さら
に、構文解析部５２は、抽出した構文構造に基づいて、
入力テキストとしての音声認識結果の文型が、単文であ
るか、または複文であるかの判定（以下、適宜、単文／
複文判定という）を行う。

【００８７】さらに、辞書データベース５５における単
語辞書には、口語と文語とによる文末表現を表す単語
（例えば、「ですか」や、「なの」等）が、口語／文語
判別キーワードとして登録されており、構文解析部５２
は、入力テキストとしての音声認識結果の文末部分を対
象に、口語／文語判別キーワードを抽出するためのワー
ドスポッティングを行う。そして、構文解析部５２は、
そのワードスポッティング結果から、音声認識結果の文
型が、口語文であるか、または文語文であるかの判定
（以下、適宜、口語／文語判定という）を行う。

【００８８】そして、構文解析部５２は、単文／複文判
定および口語／文語判定の結果を、音声認識結果の文型
を表す文型情報として、音声認識結果とともに、機械翻
訳部２に出力し、これにより、文型情報が表す文型に対
応する参照データを参照して、音声認識結果を翻訳する
ように、機械翻訳部２を制御する。

【００８９】次に、図１１のフローチャートを参照し
て、図９の音声翻訳システムの動作について説明する。

【００９０】ユーザが発話を行うと、音声認識部１は、
ステップＳ２１において、その発話を取り込み、ステッ
プＳ２２に進み、その取り込んだ発話を音声認識して、
ステップＳ２３に進む。ステップＳ２３では、音声認識
部１は、ユーザの発話の音声認識結果を、文型判別部５
０に出力し、ステップＳ２４に進む。

【００９１】ステップＳ２４では、文型判別部５０のテ
キスト解析部５１（図１０）において、音声認識部１か
らの音声認識結果が形態素解析され、その形態素解析結
果が、構文解析部５２に供給される。構文解析部５２で
は、テキスト解析部５１からの形態素解析結果に基づい
て、音声認識部１による音声認識結果が構文解析され、
その構文構造が認識される。

【００９２】そして、構文解析部５２は、ステップＳ２
５に進み、ステップＳ２４で得られた構文構造から、音
声認識結果が、単文であるか否かを判定する。ステップ
Ｓ２５において、音声認識結果が単文であると判定され
た場合、ステップＳ２６に進み、構文解析部５２は、音
声認識結果について、口語／文語判別キーワードのワー
ドスポッティングを行い、そのワードスポッティング結
果に基づいて、音声認識結果が、文語文または口語文の
うちのいずれであるかを判定する。

【００９３】ステップＳ２６において、音声認識結果
が、文語文であると判定された場合、ステップＳ２７に
進み、構文解析部５２は、音声認識結果が、単文であ
り、かつ文語文である旨の文型情報を、機械翻訳部２に
出力し、ステップＳ３６に進む。

【００９４】また、ステップＳ２６において、音声認識
結果が、口語文であると判定された場合、ステップＳ２
８に進み、構文解析部５２は、音声認識結果が、単文で
あり、かつ口語文である旨の文型情報を、機械翻訳部２
に出力し、ステップＳ３６に進む。

【００９５】一方、ステップＳ２５において、音声認識
結果が単文でないと判定された場合、ステップＳ２９に
進み、構文解析部５２は、ステップＳ２４で得られた構
文構造から、音声認識結果が複文であるか否かを判定す
る。ステップＳ２９において、音声認識結果が複文であ
ると判定された場合、ステップＳ３０に進み、ステップ
Ｓ２６における場合と同様にして、音声認識結果が、文
語文または口語文のうちのいずれであるかが判定され
る。

【００９６】ステップＳ３０において、音声認識結果
が、文語文であると判定された場合、ステップＳ３１に
進み、構文解析部５２は、音声認識結果が、複文であ
り、かつ文語文である旨の文型情報を、機械翻訳部２に
出力し、ステップＳ３６に進む。

【００９７】また、ステップＳ３０において、音声認識
結果が、口語文であると判定された場合、ステップＳ３
２に進み、構文解析部５２は、音声認識結果が、複文で
あり、かつ口語文である旨の文型情報を、機械翻訳部２
に出力し、ステップＳ３６に進む。

【００９８】一方、ステップＳ２９において、音声認識
結果が複文でないと判定された場合、即ち、音声認識結
果が、単文および複文のいずれでもない場合、ステップ
Ｓ３３に進み、ステップＳ２６における場合と同様にし
て、音声認識結果が、文語文または口語文のうちのいず
れであるかが判定される。

【００９９】ステップＳ３３において、音声認識結果
が、文語文であると判定された場合、ステップＳ３４に
進み、構文解析部５２は、音声認識結果が、単文および
複文のいずれでもないが、文語文である旨の文型情報
を、機械翻訳部２に出力し、ステップＳ３６に進む。

【０１００】また、ステップＳ３３において、音声認識
結果が、口語文であると判定された場合、ステップＳ３
５に進み、構文解析部５２は、音声認識結果が、単文お
よび複文のいずれでもないが、口語文である旨の文型情
報を、機械翻訳部２に出力し、ステップＳ３６に進む。

【０１０１】ステップＳ３６では、機械翻訳部２におい
て、文型判別部５０からの文型情報が表す文型に対応す
る参照データを参照するように、動作モードが切り替え
られ、ステップＳ３７に進む。

【０１０２】ステップＳ３７では、文型判別部５０は、
音声認識部１の音声認識結果を、機械翻訳部２に出力
し、ステップＳ３８に進む。ステップＳ３８では、機械
翻訳部２において、音声認識部１の音声認識結果が、文
型判別部５０からの文型情報が表す文型に対応する参照
データを参照することにより翻訳され、その翻訳結果
が、音声合成部３に出力される。

【０１０３】音声合成部３では、ステップＳ３９におい
て、機械翻訳部２からの翻訳結果に対応する合成音が生
成され、ステップＳ４０に進み、その合成音が出力され
る。そして、ユーザが次の発話を行うのを待って、ステ
ップＳ２１に戻り、以下、同様の処理が繰り返される。

【０１０４】以上のように、音声認識結果の文型を抽出
し、その文型に対応する参照データを用いて翻訳を行う
ように、機械翻訳部２を制御するようにしたので、機械
翻訳部２では、音声認識結果の文型に適した参照データ
だけを参照して翻訳を行うことができ、その結果、短時
間で、かつ精度の良い翻訳を行うことが可能となる。

【０１０５】なお、文型判別部５０は、音声認識部１ま
たは機械翻訳部２と一体的に構成することも可能であ
る。

【０１０６】また、上述の場合には、単文と複文の区別
を行うようにしたが、それらに加えて、例えば、重文の
区別も行うようにすることが可能である。

【０１０７】次に、図１２は、本発明を適用した音声翻
訳システムの第４実施の形態の構成例を示している。な
お、図中、図９における場合と対応する部分について
は、同一の符号を付してあり、以下では、その説明は、
適宜省略する。即ち、図１２の音声翻訳システムは、１
つの機械翻訳部２に替えて、複数の機械翻訳部２₁乃至
２_Nが設けられている他は、図９における場合と同様に
構成されている。

【０１０８】機械翻訳部２₁乃至２_Nそれぞれは、図９の
機械翻訳部２と同様に構成されている。但し、図９の実
施の形態では、機械翻訳部２が、参照データを、各文型
ごとに分けて記憶していたが、機械翻訳部２₁乃至２_Nそ
れぞれは、ある文型に対応する参照データのみを記憶し
ている。

【０１０９】以上のように構成される音声翻訳システム
では、文型判別部５０は、音声認識結果の文型を得る
と、その文型に対応する参照データを記憶している機械
翻訳部２_n（ｎは、１乃至Ｎのうちのいずれか）に、音
声認識部１による音声認識結果を出力して翻訳させる。

【０１１０】従って、この場合も、図９の実施の形態に
おける場合と同様に、音声認識結果の文型に適した参照
データだけを参照して翻訳が行われるので、短時間で、
かつ精度の良い翻訳を行うことが可能となる。

【０１１１】次に、上述したように、図１の音声翻訳シ
ステムにおいては、日英と英日との翻訳を行うことがで
きるようになっているが、この場合、音声認識部１に
は、日本語の音声が入力される場合と、英語の音声が入
力される場合がある。また、音声翻訳システムを、日本
語および英語以外の言語の翻訳を行うように拡張した場
合には、さらに他の言語の音声が入力される場合もあ
る。このように、複数種類の言語の音声が入力される可
能性がある場合においては、ユーザは、自身が発話する
音声の言語を、例えば、所定の操作を行うこと等によ
り、音声翻訳システムに認識させる必要があるが、音声
翻訳システムを使用するごとに、そのような操作を行う
のは面倒である。

【０１１２】そこで、図１３は、図１の音声認識部１の
他の構成例を示している。なお、図中、図２における場
合と対応する部分については、同一の符号を付してあ
り、以下では、その説明は、適宜省略する。即ち、図１
３の音声認識部１は、１つのマイク１１に替えて、２つ
のマイク１１Ａおよび１１Ｂが設けられている他は、図
２における場合と基本的に同様に構成されている。

【０１１３】ユーザの発話は、マイク１１Ａおよび１１
Ｂで取り込まれ、以下、基本的には、図２における場合
と同様に処理される。

【０１１４】即ち、ユーザの発話は、マイク１１Ａおよ
びＢに入力され、ＡＤ変換部１２を介することにより、
ディジタル信号である音声データに変換される。この音
声データは、特徴抽出部１３に供給される。

【０１１５】特徴抽出部１３は、ＡＤ変換部１２からの
音声データを音響分析することで、特徴パラメータを抽
出し、特徴量バッファ１４およびマッチング部１５に供
給する。特徴量バッファ１４では、特徴抽出部１３から
の特徴パラメータが一時記憶される。

【０１１６】マッチング部１５は、特徴量抽出部１３か
らの特徴パラメータ、または特徴量バッファ１４に記憶
された特徴パラメータに基づき、音響モデルデータベー
ス１６、辞書データベース１７、および文法データベー
ス１８を参照しながら、マイク１１Ａおよび１１Ｂに入
力された音声（入力音声）を認識する。

【０１１７】即ち、図１３の実施の形態では、マッチン
グ部１５は、音響モデルデータベース１６、辞書データ
ベース１７、および文法データベース１８に記憶されて
いる日本語の音声を認識するための、上述したような音
響モデルその他のデータ（以下、適宜、日本語用データ
という）と、英語の音声を認識するための、上述したよ
うな音響モデルその他のデータ（以下、英語用データと
いう）との両方を参照して、マイク１１Ａおよび１１Ｂ
に入力された音声を認識する。

【０１１８】さらに、マッチング部１５は、その音声認
識結果から、その音声認識結果の言語、即ち、マイク１
１Ａおよび１１Ｂに入力された音声の言語を抽出する。

【０１１９】即ち、マッチング部１５は、得られた音声
認識結果を構成する各単語の言語情報を調査し、最も数
の多い言語の単語（ここでは、日本語の単語か、英語の
単語）を検出する。そして、マッチング部１５は、その
単語の言語を、音声認識結果の言語、即ち、入力言語と
して特定し、その言語を表す言語特定情報を、音声認識
結果とともに、機械翻訳部２に出力し、これにより、言
語特定情報が表す言語に対応する参照データを参照し
て、音声認識結果を翻訳するように、機械翻訳部２を制
御する。

【０１２０】なお、音響モデル、言語モデルを結合して
音声認識を行う方法については、例えば、"Prallel Jap
anese/English Speech Recognition in ATRSPREC Harol
d Singer", ATR, p.p167-168, 1999,03 日本音響学会講
演論文集等に、その詳細が記載されている。

【０１２１】ここで、図１３の音声認識部１では、例え
ば、二人のユーザが対話をしている場合に、マイク１１
Ａと１１Ｂへの音声の入力方向に基づいて、その二人の
ユーザのうちのいずれが発話を行っているのかを推定す
ることができるようになっているものとする。

【０１２２】従って、二人のユーザのうち、いま発話を
行っているユーザの音声の言語が特定されれば、他方の
ユーザの発話は、その特定された言語に翻訳すれば良い
こととなる。

【０１２３】次に、図１４のフローチャートを参照し
て、音声認識部１が図１３に示したように構成される場
合の、図１の音声翻訳システムの動作について説明す
る。

【０１２４】ユーザが発話を行うと、音声認識部１は、
ステップＳ５１において、その発話を取り込み、ステッ
プＳ５２に進む。ステップＳ５２では、音声認識部１の
特徴抽出部１３において、取り込んだ発話から、特徴パ
ラメータが抽出され、マッチング部１５に供給される。
マッチング部１５では、ステップＳ５３において、特徴
抽出部１３からの特徴パラメータを用いて、日本語用デ
ータと英語用データの両方を参照しながら、発話が音声
認識される。

【０１２５】さらに、マッチング部１５では、ステップ
Ｓ５４において、音声認識結果から、上述したようにし
て、その音声認識結果の言語が特定（抽出）され、その
言語を表す言語特定情報が、機械翻訳部２に出力され
る。

【０１２６】機械翻訳部５５では、ステップＳ５５にお
いて、音声認識部１（マッチング部１５）からの言語特
定情報が表す言語に対応する参照データを参照するよう
に、動作モードが切り替えられ、ステップＳ５６に進
む。

【０１２７】ステップＳ５６では、音声認識部１は、ス
テップＳ５３で得られた音声認識結果を、機械翻訳部２
に出力し、ステップＳ５７に進む。ステップＳ５７で
は、機械翻訳部２において、音声認識部１からの音声認
識結果が、同じく音声認識部１からの言語特定情報が表
す言語に対応する参照データを参照することにより翻訳
され、その翻訳結果が、音声合成部３に出力される。

【０１２８】なお、機械翻訳部２において、言語特定情
報が表す言語を翻訳する場合に、その言語（入力言語）
を、どの言語（出力言語）に翻訳するのかが問題となる
が、出力言語は、例えば、ユーザが、音声翻訳システム
を操作することにより、あらかじめ設定されているもの
とする。

【０１２９】音声合成部３では、ステップＳ５８におい
て、機械翻訳部２からの翻訳結果に対応する合成音が生
成され、ステップＳ５９に進み、その合成音が出力さ
れ、処理を終了する。

【０１３０】なお、以上のようにして、一方のユーザの
音声の言語が特定され、あらかじめ設定されている言語
（以下、適宜、設定言語という）に翻訳された後は、機
械翻訳部２では、その一方のユーザの音声は、特定され
た言語を設定言語に翻訳するための参照データを参照し
て翻訳される。また、この場合、他方のユーザの音声に
ついては、その言語は、設定言語であり、その設定言語
を、ステップＳ５４で特定された言語に翻訳すれば良い
ので、機械翻訳部２では、そのような翻訳を行うための
参照データを参照して翻訳が行われる。ここで、この場
合、一方のユーザが発話しているのか、または他方のユ
ーザが発話しているのかが問題となるが、いずれのユー
ザが発話しているかは、上述したように、図１３の音声
認識部１で推定することができるようになっている。

【０１３１】以上のように、音声認識結果から、音声の
言語を抽出し、その言語に対応する参照データを用いて
翻訳を行うように、機械翻訳部２を制御するようにした
ので、ユーザは、自身が発話する言語を、音声翻訳シス
テムを操作する等して設定する必要がない。

【０１３２】なお、上述したような、いわば言語別の処
理は、方言にも適用可能である。即ち、音声認識結果か
ら、ユーザの発話の方言を抽出し、機械翻訳部２におい
て、その方言用の参照データを参照して処理を行うよう
にすることが可能である。

【０１３３】また、図１の音声翻訳システムは、日本語
用データと英語用データを記憶している音声認識部１の
替わりに、日本語用データのみを記憶している音声認識
部と、英語用データのみを記憶している音声認識部とを
設けて構成することも可能である。

【０１３４】さらに、ここでは、日英および英日の翻訳
を対象としたが、上述した処理は、その他の言語間の翻
訳にも適用可能である。

【０１３５】また、上述の場合には、２つのマイク１１
Ａと１１Ｂを設けて、いずれのユーザが発話を行ってい
るのかを推定するようにしたが、マイクは、複数設ける
のではなく、１つであっても良い。

【０１３６】次に、図１５は、本発明を適用した音声翻
訳システムの第５の実施の形態の構成例を示している。
なお、図中、図１における場合と対応する部分について
は、同一の符号を付してあり、以下では、その説明は、
適宜省略する。即ち、図１５の音声翻訳システムは、１
つの機械翻訳部２に替えて、複数の機械翻訳部２₁乃至
２_Nが設けられている他は、図１における場合と同様に
構成されている。

【０１３７】但し、図１５の実施の形態においては、音
声認識部１は、図１３に示したように構成されている。

【０１３８】機械翻訳部２₁乃至２_Nそれぞれは、図１の
機械翻訳部２と同様に構成されている。但し、図１５の
実施の形態では、機械翻訳部２が、参照データを、各言
語ごとに分けて記憶していたが、機械翻訳部２₁乃至２_N
それぞれは、ある言語に対応する参照データのみを記憶
している。

【０１３９】以上のように構成される音声翻訳システム
では、音声認識部１は、ユーザの発話の言語を得ると、
その言語に対応する参照データを記憶している機械翻訳
部２ _n（ｎは、１乃至Ｎのうちのいずれか）に、音声認
識部１による音声認識結果を出力して翻訳させる。

【０１４０】従って、この場合も、図１３に示したよう
に構成される音声認識部１を有する、図１の音声翻訳シ
ステムと同様に、ユーザは、自身が発話する言語を、音
声翻訳システムを操作する等して設定する必要がない。

【０１４１】次に、図１６は、機械翻訳部２の他の構成
例を示している。なお、図中、図３における場合と対応
する部分については、同一の符号を付してあり、以下で
は、その説明は、適宜省略する。即ち、図１６の機械翻
訳部２は、１つの言語変換部２２に替えて、複数の言語
変換部２２₁乃至２２_Nが設けられているとともに、１つ
の言語変換データベース２６に替えて、複数の言語変換
データベース２６₁乃至２６_Nが設けられている他は、図
３における場合と基本的に同様に構成されている。

【０１４２】言語変換データベース２６₁乃至２６_Nそれ
ぞれは、ある特定のドメイン用の、上述したような言語
変換データ（異なるドメインごとの言語変換データ）を
記憶しており、言語変換部２２_n（ｎ＝１，２，・・
・，Ｎ）は、テキスト解析部２１が出力する入力言語の
言語情報を、言語変換データベース２６_nに記憶された
言語変換データを参照することで、出力言語の言語情報
に変換するようになっている。

【０１４３】次に、図１７のフローチャートを参照し
て、機械翻訳部２が図１６に示したように構成される場
合の、図１の音声翻訳システムの動作について説明す
る。

【０１４４】ユーザが発話を行うと、音声認識部１は、
ステップＳ６１において、その発話を取り込み、ステッ
プＳ６２に進み、その取り込んだ発話を音声認識して、
ステップＳ６３に進む。ステップＳ６３では、音声認識
部１は、ユーザの発話の音声認識結果を、機械翻訳部２
に出力し、ステップＳ６４に進む。

【０１４５】ステップＳ６４では、機械翻訳部（図１
６）のテキスト解析部２１において、音声認識部１から
の音声認識結果が形態素解析、構文解析等され、ステッ
プＳ６５に進み、その解析結果としての入力言語の言語
情報が、言語変換部２２₁乃至２２_Nに供給される。

【０１４６】言語変換部２２₁乃至２２_Nそれぞれでは、
言語変換データベース２６₁乃至２６_Nそれぞれにおける
各ドメイン用の言語変換データに基づいて、入力テキス
トの言語の言語情報が、出力言語の言語情報に変換され
る。即ち、言語変換部２２ ₁乃至２２_Nそれぞれは、ステ
ップＳ６６において、例えば、各ドメイン用の対訳用例
と入力言語の言語情報との類似度を、シソーラスを用い
て、並列に求め、ステップＳ６７に進む。そして、ステ
ップＳ６７では、最も大きい類似度が得られた言語変換
部２２_m（ｍは、１乃至Ｎのうちのいずれか）におい
て、その最も大きい類似度が得られた対訳用例を用い
て、入力言語の言語情報が、出力言語の言語情報に変換
される。

【０１４７】言語変換部２２ｍで得られた出力言語の言
語情報は、テキスト生成部２３に供給される。テキスト
生成部２３は、ステップＳ６８において、辞書データベ
ース２７および生成用文法データベース２８を参照する
ことにより、出力言語の言語情報から、入力テキストを
出力言語に翻訳したテキストを生成し、ステップＳ６９
に進み、そのテキストとしての翻訳結果を、音声合成部
３に出力する。

【０１４８】音声合成部３では、ステップＳ７０におい
て、機械翻訳部２（テキスト生成部２３）からの翻訳結
果に対応する合成音が生成され、ステップＳ７１に進
み、その合成音が出力される。そして、ユーザが次の発
話を行うのを待って、ステップＳ６１に戻り、以下、同
様の処理が繰り返される。

【０１４９】以上の処理によれば、ユーザが、音声翻訳
システムが使用されているドメインを気にしなくても、
そのドメインに適した翻訳が行われることになる。

【０１５０】なお、図１７の実施の形態においても、上
述した場合と同様に、翻訳に用いる対訳用例の決定は、
言語変換データベース２６₁乃至２６_Nに記憶されている
すべての対訳用例を用いて翻訳を行い、その翻訳結果に
ついて、言語モデルを用いてスコアリングを行い、その
スコアに基づいて行うようにすることが可能である。

【０１５１】また、図１の音声翻訳システムは、図１６
の機械翻訳部２の替わりに、言語変換部２２_nと言語変
換データベース２６_nとの組を１つずつ有するＮ個の機
械翻訳部を設けて構成することが可能である。

【０１５２】さらに、図１６の実施の形態では、言語変
換データベース２６₁乃至２６_Nに、ドメイン別に言語変
換データを記憶させるようにしたが、その他、例えば、
文型別に言語変換データを記憶させることも可能であ
る。

【０１５３】次に、上述した一連の処理は、ハードウェ
アにより行うこともできるし、ソフトウェアにより行う
こともできる。一連の処理をソフトウェアによって行う
場合には、そのソフトウェアを構成するプログラムが、
汎用のコンピュータ等にインストールされる。

【０１５４】そこで、図１８は、上述した一連の処理を
実行するプログラムがインストールされるコンピュータ
の一実施の形態の構成例を示している。

【０１５５】プログラムは、コンピュータに内蔵されて
いる記録媒体としてのハードディスク１０５やＲＯＭ１
０３に予め記録しておくことができる。

【０１５６】あるいはまた、プログラムは、フロッピー
ディスク、CD-ROM(Compact Disc Read Only Memory)，M
O(Magneto optical)ディスク，DVD(Digital Versatile
Disc)、磁気ディスク、半導体メモリなどのリムーバブ
ル記録媒体１１１に、一時的あるいは永続的に格納（記
録）しておくことができる。このようなリムーバブル記
録媒体１１１は、いわゆるパッケージソフトウエアとし
て提供することができる。

【０１５７】なお、プログラムは、上述したようなリム
ーバブル記録媒体１１１からコンピュータにインストー
ルする他、ダウンロードサイトから、ディジタル衛星放
送用の人工衛星を介して、コンピュータに無線で転送し
たり、LAN(Local Area Network)、インターネットとい
ったネットワークを介して、コンピュータに有線で転送
し、コンピュータでは、そのようにして転送されてくる
プログラムを、通信部１０８で受信し、内蔵するハード
ディスク１０５にインストールすることができる。

【０１５８】ここで、本明細書において、コンピュータ
に各種の処理を行わせるためのプログラムを記述する処
理ステップは、必ずしもフローチャートとして記載され
た順序に沿って時系列に処理する必要はなく、並列的あ
るいは個別に実行される処理（例えば、並列処理あるい
はオブジェクトによる処理）も含むものである。

【０１５９】また、プログラムは、１のコンピュータに
より処理されるものであっても良いし、複数のコンピュ
ータによって分散処理されるものであっても良い。さら
に、プログラムは、遠方のコンピュータに転送されて実
行されるものであっても良い。

【０１６０】コンピュータは、CPU(Central Processing
Unit)１０２を内蔵している。CPU１０２には、バス１
０１を介して、入出力インタフェース１１０が接続され
ており、CPU１０２は、入出力インタフェース１１０を
介して、ユーザによって、キーボードやマウス等で構成
される入力部１０７が操作されることにより指令が入力
されると、それにしたがって、ROM(Read Only Memory)
１０３に格納されているプログラムを実行する。あるい
は、また、CPU１０２は、ハードディスク１０５に格納
されているプログラム、衛星若しくはネットワークから
転送され、通信部１０８で受信されてハードディスク１
０５にインストールされたプログラム、またはドライブ
１０９に装着されたリムーバブル記録媒体１１１から読
み出されてハードディスク１０５にインストールされた
プログラムを、RAM(Random Access Memory)１０４にロ
ードして実行する。これにより、CPU１０２は、上述し
たフローチャートにしたがった各種の処理を実行する。
そして、CPU１０２は、その処理結果を、必要に応じ
て、例えば、入出力インタフェース１１０を介して、LC
D(Liquid CryStal Display)やスピーカ等で構成される
出力部１０６から出力、あるいは、通信部１０８から送
信、さらには、ハードディスク１０５に記録等させる。

【０１６１】なお、本実施の形態では、音声認識部１に
よる音声認識結果を、機械翻訳部２に入力するようにし
たが、機械翻訳部２には、その他、例えば、キーボード
等を操作して入力を与えることも可能である。

【０１６２】また、翻訳結果は、合成音で出力するので
はなく、表示部４に表示させることが可能である。

【０１６３】

【発明の効果】本発明の翻訳装置および翻訳方法、並び
に記録媒体によれば、入力文から、所定の情報が抽出さ
れ、その情報に基づいて、入力文の翻訳が制御される。
従って、翻訳精度を向上させることが可能となる。

【図面の簡単な説明】

【図１】本発明が適用される音声翻訳システムの構成例
を示すブロック図である。

【図２】音声認識部１の構成例を示すブロック図であ
る。

【図３】機械翻訳部２の構成例を示すブロック図であ
る。

【図４】音声合成部３の構成例を示すブロック図であ
る。

【図５】本発明を適用した音声翻訳システムの第１の実
施の形態の構成例を示すブロック図である。

【図６】ドメイン推定部４０の構成例を示すブロック図
である。

【図７】図５の音声翻訳システムの動作を説明するため
のフローチャートである。

【図８】本発明を適用した音声翻訳システムの第２の実
施の形態の構成例を示すブロック図である。

【図９】本発明を適用した音声翻訳システムの第３の実
施の形態の構成例を示すブロック図である。

【図１０】文型判別部５０の構成例を示すブロック図で
ある。

【図１１】図９の音声翻訳システムの動作を説明するた
めのフローチャートである。

【図１２】本発明を適用した音声翻訳システムの第４の
実施の形態の構成例を示すブロック図である。

【図１３】音声認識部１の他の構成例を示すブロック図
である。

【図１４】音声認識部１が図１３のように構成される場
合の、図１の音声翻訳システムの動作を説明するための
フローチャートである。

【図１５】本発明を適用した音声翻訳システムの第５の
実施の形態の構成例を示すブロック図である。

【図１６】機械翻訳部２の他の構成例を示すブロック図
である。

【図１７】機械翻訳部２が図１６のように構成される場
合の、図１の音声翻訳システムの動作を説明するための
フローチャートである。

【図１８】本発明を適用したコンピュータの一実施の形
態の構成例を示すブロック図である。

【符号の説明】１音声認識部，２，２₁乃至２_N 機械翻訳部，３
音声合成部，４表示部，１１、１１Ａ，１１Ｂ
マイク（マイクロフォン），１２ＡＤ変換部，１
３特徴抽出部，１４特徴量バッファ，１５マ
ッチング部，１６音響モデルデータベース，１７
辞書データベース，１８文法データベース，２１
テキスト解析部，２２，２２₁乃至２２_N 言語変換
部，２３テキスト生成部，２４辞書データベー
ス，２５解析用文法データベース，２６，２６₁
乃至２６_N 言語変換データベース，２７辞書デー
タベース，２８生成用文法データベース，３１
テキスト解析部，３２規則合成部，３３ＤＡ変換
部，３４辞書データベース，３５解析用文法デ
ータベース，３６音素片データベース，４０ド
メイン推定部，４１テキスト解析部，４２キーワ
ード抽出部，４３キーワードマッチング部，４４
辞書データベース，４５解析用文法データベー
ス，４６，４７辞書データベース，５０文型判
別部，５１テキスト解析部，５２構文解析部，
５３辞書データベース，５４解析用文法データベ
ース，５５辞書データベース，５６解析用文法
データベース，１０１バス，１０２ CPU，１０
３ ROM，１０４ RAM，１０５ハードディスク，
１０６出力部，１０７入力部，１０８通信
部，１０９ドライブ，１１０入出力インタフェー
ス，１１１リムーバブル記録媒体

───────────────────────────────────────────────────── フロントページの続きＦターム(参考） 5B091 AA05 AA06 AB20 BA03 BA04 CA02 CA21 CB12 CB32 CC01 EA17 5D015 AA04 KK02 KK04 5D045 AA07 AB03 9A001 HH14 HZ17 HZ18

Claims

【特許請求の範囲】

【請求項１】入力文を翻訳する翻訳装置であって、前記入力文を翻訳する翻訳手段と、前記入力文から、所定の情報を抽出する抽出手段と、前記入力文から抽出された情報に基づいて、前記翻訳手
段による前記入力文の翻訳を制御する制御手段とを備え
ることを特徴とする翻訳装置。
【請求項２】前記翻訳手段は、翻訳時に参照する参照
データを記憶している記憶手段を有し、前記制御手段は、前記入力文から抽出された情報に基づ
いて、その入力文の翻訳時に参照すべき参照データを指
定することを特徴とする請求項１に記載の翻訳装置。
【請求項３】前記抽出手段は、前記入力文から、その
入力文の文型、言語、またはキーワードを抽出すること
を特徴とする請求項１に記載の翻訳装置。
【請求項４】前記翻訳手段は、翻訳時に参照する参照
データを、文型ごとに記憶している記憶手段を有し、前記制御手段は、前記入力文の文型に対応する参照デー
タを参照するように、前記翻訳手段を制御することを特
徴とする請求項３に記載の翻訳装置。
【請求項５】前記翻訳手段は、翻訳時に参照する参照
データを、ドメインごとに記憶している記憶手段を有
し、前記制御手段は、前記入力文から抽出されたキーワード
に基づいて、前記入力文が入力されたドメインを推定
し、そのドメインに対応する参照データを参照するよう
に、前記翻訳手段を制御することを特徴とする請求項３
に記載の翻訳装置。
【請求項６】前記翻訳手段は、翻訳時に参照する参照
データを、翻訳対象の言語ごとに記憶している記憶手段
を有し、前記制御手段は、前記入力文の言語に対応する参照デー
タを参照するように、前記翻訳手段を制御することを特
徴とする請求項３に記載の翻訳装置。
【請求項７】音声を認識し、その音声認識結果を、前
記入力文として出力する音声認識手段をさらに備えるこ
とを特徴とする請求項１に記載の翻訳装置。
【請求項８】入力文を翻訳する翻訳方法であって、前記入力文を翻訳する翻訳ステップと、前記入力文から、所定の情報を抽出する抽出ステップ
と、前記入力文から抽出された情報に基づいて、前記翻訳ス
テップによる前記入力文の翻訳を制御する制御ステップ
とを備えることを特徴とする翻訳方法。
【請求項９】入力文を翻訳する翻訳処理を、コンピュ
ータに行わせるプログラムが記録されている記録媒体で
あって、前記入力文を翻訳する翻訳ステップと、前記入力文から、所定の情報を抽出する抽出ステップ
と、前記入力文から抽出された情報に基づいて、前記翻訳ス
テップによる前記入力文の翻訳を制御する制御ステップ
とを備えるプログラムが記録されていることを特徴とす
る記録媒体。