JP2000010977A

JP2000010977A - 翻訳装置

Info

Publication number: JP2000010977A
Application number: JP10171235A
Authority: JP
Inventors: Yoshiaki Kitatsume; 吉明北爪; Makoto Tanaka; 田中　　誠; Toshihisa Tsukada; 俊久塚田
Original assignee: Hitachi Ltd; Hitachi ULSI Systems Co Ltd
Current assignee: Hitachi Ltd; Hitachi Solutions Technology Ltd
Priority date: 1998-06-18
Filing date: 1998-06-18
Publication date: 2000-01-14

Abstract

(57)【要約】【課題】翻訳効率を向上させるめの技術を提供するこ
とにある。【解決手段】音声認識結果の翻訳前に音声認識結果を
上記出力手段から出力させる第１制御手段（１４）と、
音声認識結果の正しいことが確認された後に翻訳手段
（１３）での翻訳動作を開始させる第２制御手段（１
４）とを含んで翻訳装置を構成する。第１制御手段は、
音声認識結果の翻訳前に音声認識結果を上記出力手段か
ら出力させ、第２制御手段は、上記音声認識結果の正し
いことが確認された後に翻訳手段での翻訳動作を開始さ
せる。このことが、音声認識結果が不適切であった場合
の無駄な翻訳を排除して翻訳効率の向上を達成する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、翻訳技術に関し、
例えば携帯型自動翻訳装置に適用して有効な技術に関す
る。

【０００２】

【従来の技術】例えば、特開平８−３２９０８８号公報
に記載されているように、マイクロフォンから入力され
た第１言語の音声信号を音声認識手段で認識し、その認
識信号を第２言語に翻訳して、その結果を音声合成して
スピーカから出力するようにした翻訳装置が知られてい
る。

【０００３】また、音声認識においては音響照合処理が
行われる。この処理は、辞書に登録されている単語と入
力情報とを照合するもので、この照合には動的計画法に
おける最適化処理による照合、あるいはＨＭＭ（Ｈｉｄ
ｄｅｎＭａｒｋｏｖＭｏｄｅｌ）を用いた確率累積
による照合が行われる。

【０００４】

【発明が解決しようとする課題】従来の翻訳装置につい
て本願発明者が検討したところ、音声認識手段で正確に
音声認識が行われたか否かにかかわらず、その認識結果
に従って翻訳が行われるようにすると、音声認識結果が
不適切であった場合に、無駄な翻訳が行われてしまい、
翻訳効率の低下を招来する。

【０００５】また、翻訳効率を上げるために音声認識処
理、翻訳処理、及び音声合成処理が複雑になると、第１
言語による音声を入力してから、第２言語による翻訳結
果が音声で出力されるまでに時間がかかってしまい、実
用的でないことが見いだされた。

【０００６】本発明の目的は、翻訳効率を向上させるめ
の技術を提供することにある。

【０００７】

【課題を解決するための手段】本願において開示される
発明のうち代表的なものの概要を簡単に説明すれば下記
の通りである。

【０００８】すなわち、第１言語の音声を入力するため
の入力手段（１１）と、入力された音声信号を認識用辞
書に基づいて認識する音声認識手段（１２）と、音声認
識結果を翻訳用辞書に基づいて第２言語に翻訳する翻訳
手段（１３）と、上記翻訳手段の翻訳結果に対応する音
声を音源データに基づいて合成する音声合成手段（１
５）と、上記音声合成手段の音声合成結果を出力する出
力手段（１６）と、上記音声認識結果の翻訳前に音声認
識結果を上記出力手段から出力させる第１制御手段（１
４）と、上記音声認識結果の正しいことが確認された後
に上記翻訳手段での翻訳動作を開始させる第２制御手段
（１４）とを含んで翻訳装置を構成する。

【０００９】上記した手段によれば、第１制御手段は、
音声認識結果の翻訳前に音声認識結果を上記出力手段か
ら出力させ、第２制御手段は、上記音声認識結果の正し
いことが確認された後に上記翻訳手段での翻訳動作を開
始させる。このことが、音声認識結果が不適切であった
場合の無駄な翻訳を排除して、翻訳効率の向上を達成す
る。

【００１０】このとき、上記認識用辞書、翻訳用辞書、
及び音源データは、カード化されて翻訳装置本体（１
０）に着脱自在に形成された記憶媒体に格納することが
できる。

【００１１】また、第１言語の音声を入力するための入
力手段（１１）と、入力された音声信号を認識用辞書に
基づいて認識する音声認識手段（１２０）と、音声認識
結果を第２言語に翻訳する翻訳手段（１３０）と、翻訳
手段の出力信号に対応する音声を音原データに基づいて
合成するための音声合成手段（１５０）と、上記音声合
成手段の音声合成結果を出力する出力手段（１６）とを
含んで翻訳装置が構成されるとき、翻訳手段は、上記音
声認識結果に対応する第２言語を出力するルックアップ
テーブルを含んで構成することができる。上記認識用辞
書、ルックアップテーブル、及び音原データがカード化
されて翻訳装置本体に着脱自在に形成された記憶媒体に
格納することができる。

【００１２】音声合成手段は、音声をサンプリングして
得た音声データを記録する記憶手段（１９０）の記憶デ
ータに基づいて音声出力を行うように構成することがで
きる。

【００１３】

【発明の実施の形態】図１には本発明にかかる翻訳装置
の一例である携帯型自動翻訳装置が示される。

【００１４】図１に示される携帯型自動翻訳装置１０
は、特に制限されないが、マイクロフォン１１、音声認
識部１２、翻訳部１３、音声合成部１５、スピーカ１
６、認識用辞書記憶部１７、翻訳用辞書記憶部１８、及
び音源記憶部１９を含む。

【００１５】上記マイクロフォン１１、音声認識部１
２、翻訳部１３、音声合成部１５、スピーカ１６は、携
帯型自動翻訳装置１０の本体に内蔵される。認識用辞書
記憶部１７、翻訳用辞書記憶部１８、及び音源記憶部１
９は、特に制限されないが、カード化されて翻訳装置本
体に着脱自在に形成された記憶媒体とされる。この記憶
媒体は、特に制限されないが、不揮発性記憶媒体とされ
る。

【００１６】音声認識部１２は、マイクロフォン１１を
介して入力された第１言語による音声信号から音声を認
識する機能を有し、この音声認識において認識用辞書記
憶部１７に格納された認識用辞書が参照される。特に制
限されないが、第１言語は日本語とされる。翻訳部１３
は、上記音声認識部１２での認識結果を第２言語に翻訳
する。特に制限されないが、第２言語は英語とされる。
音声合成部１５は上記翻訳部１３の翻訳結果を、音源記
憶部１９に格納された音源データに基づいて音声合成す
る機能を有する。音源データは、特に制限されないが、
翻訳用辞書記憶部１８の翻訳用辞書に対応して英語とさ
れる。そして、上記音声合成部１５での音声合成結果は
後段のスピーカ１６を介して音響出力される。

【００１７】また、制御部１４が設けられ、この制御部
１４によって本携帯型翻訳装置１０の全体の動作制御が
行われる。

【００１８】ここで、操作者が発した音声が音声認識部
１２によって正しく認識され無かった場合を考えてみ
る。音声認識が正しく行われなかった場合、その誤った
音声認識結果に基づいて翻訳処理が行われ、さらにその
翻訳結果に基づいて音声合成されてそれがスピーカ１６
から出力されるおそれがある。そこで、図１に示される
装置１０では、翻訳前に音声認識内容の確認を行うこと
ができるようになっている。すなわち、操作者が発した
音声がマイクロフォン１１で電気信号に変換され、音声
認識部１２に入力されると、この音声認識部１２におい
て、認識用辞書記憶部１７の認識用辞書を参照すること
で音声認識が行われるが、この音声認識が行われた後、
翻訳部１３での翻訳動作が開始される前に、上記音声認
識結果が音声合成部１５へ伝達され、そこで音声合成さ
れてスピーカ１６から出力される。スピーカ１６から出
力された音声（第１言語による）を聞いて、操作者は上
記音声認識部１２での音声認識が正しく行われたか否か
を確認することができる。このとき、制御部１４の制御
により、音声認識結果に続けて、「ですか」なる音声を
付加するようにするとよい。例えば、マイクロフォン１
２から入力された音声が、「私は東京へ行った」である
なら、それの音声認識結果に、「ですか」が付加され
て、「私は東京へ行った、ですか」となる。これは、携
帯型自動翻訳装置１０から操作者に対して、音声認識結
果が正しいか否かの問い合わせを意味する。この問い合
わせに対して、音声認識結果が正しい場合には、操作者
はマイクロフォン１１に向かって、「はい」と答える。
上記制御部１４における第２制御手段は、上記「です
か」の付加の後に、音声認識部１２において、「はい」
が認識されると、先の認識結果（上記の例では「私は東
京へ行った」）が正しかったことを認識し、翻訳部１３
に対して翻訳動作を開始させる。また、上記携帯型自動
翻訳装置１０から操作者への問い合わせに対して、音声
認識結果が正しく無い場合には、「いいえ」と答える。
これにより、制御部１４における第２制御手段は翻訳部
１３に対して翻訳動作を開始させない。そしてその場
合、音声認識部１２での認識結果は破棄される。

【００１９】このように操作者は、スピーカ１６から出
力された音声を聞いて、先に自分の発した音声が音声認
識部１２で正しく認識されたことを確認することがで
き、それに基づいて翻訳部１３での翻訳動作が開始され
るようになっているので、不所望な音声認識結果につい
て無駄な翻訳が行われるのが回避されて翻訳効率の向上
を図ることができる。

【００２０】また、認識用辞書記憶部１７、翻訳用辞書
記憶部１８、音源記憶部１９がカード化され、本体に着
脱自在とされるので、このカードを差し替えることによ
り、言語の変更を容易に行うことができる。そして、認
識用辞書記憶部１７、翻訳用辞書記憶部１８、音源記憶
部１９の記憶内容を、航空、ホテル、レストラン、病
院、ショッピング等の応用に応じてそれぞれ専用化し
て、場面に応じてカードを差し替えることにより翻訳効
率をさらに上げることができる。

【００２１】次に各部の詳細な構成について説明する。

【００２２】図２には音声認識部１２の構成例が示され
る。

【００２３】図２に示されるように音声認識部１２は、
マイクロフォン１１から入力されたアナログ信号をディ
ジタル信号に変換するためのＡ／Ｄ（アナログ／ディジ
タル）変換部１２１、このＡ／Ｄ変換部１２１の出力信
号から音声分析を行う音声分析部１２２、この音声分析
部１２２の出力信号を認識用辞書記憶部１７内の認識用
辞書と音響照合するための音響照合部１２３、この音響
照合部１２３の出力信号を判定する判定処理部１２５を
含んで成る。

【００２４】上記音声分析部１２２では、人間の音声に
含まれる特徴の抽出が行われる。一般的な特徴抽出方法
としては、バンドパスフィルタ（ＢＰＦ）方式あるいは
線形予測計数（ＬＰＣ）方式が知られている。

【００２５】バンドパスフィルタ方式では、音声帯域を
１６チャンネルに分割して人間の音声に含まれている特
徴の抽出が行われる。具体的には、次式で示される計算
が１６チャンネル分行われることにより、特徴点の抽出
が行われる。

【００２６】

【数１】

【００２７】ここで、ｙｎは時点ｔ＝ｔｎでのフィルタ
出力、ｙｎ−１、ｙｎ−２はそれぞれ時点ｔ＝ｔｎ−
１、ｔ＝ｔｎ−２でのフィルタ出力、ｘｎは時点ｔ＝ｔ
ｎでのフィルタ入力、ｘｎ−１は時点ｔ＝ｔｎ−１での
フィルタ入力、ａｉ（ｉ＝１〜４）はフィルタ係数（周
波数帯域によって異なる）である。

【００２８】また、線形予測係数方式では、次式で示さ
れる計算が行われることにより、特徴点の抽出が行われ
る。

【００２９】

【数２】

【００３０】上記においてｙｎは過去のデータｙｎ−１
からｙｎ−ｐまでのｐ個の値から求められる時点ｎの予
測値である。これは音声波形の各時点のデータに強い相
関があるという統計的事実から成立する。尚、係数α１
〜αｐはｙｎを予測するときの線形予測誤差の二乗平均
値を最小とする条件で求められる。

【００３１】例えば駅名の認識で東京（ＴＯＫＹＯ）の
場合、Ｔ，Ｏ，Ｋ，Ｙ，Ｏそれぞれの音素に対応したフ
ィルタ出力あるいは線形予測係数が求められる。

【００３２】そして、音響照合部１２３では、予め辞書
に認識対象として登録されている単語と、発声された入
力音声との照合がとられる。ここで、認識用辞書記憶部
１７に格納された認識用辞書は、音素の特徴そのものを
持つ辞書と、認識対象単語の綴りを持つ辞書とを含む。
実際の認識時には、綴りに対応した音素の系列が音響照
合部１２３へ送出される。

【００３３】音響照合部１２３では、動的計画法におけ
る最適化処理による照合、あるいはＨＭＭ（Ｈｉｄｄｅ
ｎＭａｒｋｏｖＭｏｄｅｌ）を用いた確率累積によ
る照合が行われる。動的計画法における最適化処理は次
式で示される。

【００３４】

【数３】

【００３５】ここで、Ｄ（ｉ，ｊ）は入力音声ｉフレー
ム、登録単語ｊフレームでの照合値、ｄ（ｉ，ｊ）は入
力音声ｉフレーム、登録単語ｊフレームの特徴量の間の
距離である。つまり、この方法では、入力と登録単語と
の各時点毎の距離の累積が最小となるように照合をとる
方法である。尚、この方法で処理する場合は、分析処理
としてバンドパスフィルタが用いられる。

【００３６】また、ＨＭＭを用いた確率累積による音響
照合でも動的計画法が適用されるが、特徴量としてＬＰ
Ｃ係数が用いられているので、最適化処理に用いられる
尺度は、ＢＰＦのときの距離尺度ではなく、事後確率
（尤度）となる。この場合、最適化処理は、最大値選択
処理となる。つまり、この方法は、入力に対して各時点
毎に登録単語に対応したＨＭＭ音韻系列との確率照合を
行い、最大確率を示す系列を認識結果とする。このよう
な音響照合について詳細に記載された文献の例として
は、「認識工学（パタン認識とその応用）テレビジョン
学会教科書シリーズ９，Ｐ２８〜Ｐ２９（コロナ
社）」、「パターン情報処理、電子情報通信学会編、電
子情報通信学会大学シリーズ１〜４、Ｐ１０６〜Ｐ１０
９」、「改訂音声、Ｐ１０３（コロナ社）」がある。

【００３７】次に、判定処理部１２５では、上記音響照
合部１２３での照合結果を受けてそれぞれの単語に対す
る照合値を元に、どの単語と最も良く照合しているかを
決定する。この判定処理部１２５の出力データはテキス
トデータとされる。また、任意の文章の認識を可能とす
るには、主語となる名詞、述語となる動詞、そしてそれ
らを関係付ける形容詞、助詞などをネットワークの単位
として持ち、それらを結合する処理を判定処理部１２５
に追加するとよい。

【００３８】図３には上記翻訳部１３の構成例が示され
る。

【００３９】図３に示されるように翻訳部１３は、特に
制限されないが、形態素解析部１３１、構文解析部１３
２、構文生成部１３３を含んで成る。

【００４０】形態素解析部１３１は、入力されたテキス
トデータを形態素に分割する。例えば、入力されたテキ
ストデータが「私は東京へ行った。」の場合、単語に分
割することにより、「私」、「は」、「東京」、
「へ」、「行っ」、「た」に分けられる。この分割に
は、各種の漢字表記、品詞種類を記憶している辞書が参
照される。そのような辞書は翻訳用辞書に含まれ、翻訳
用辞書記憶部１８に格納されている。そして、上記構文
解析部１３２では、文の構造を解析して、述語動詞であ
る「行っ」、「た」にかかる部分が主語である「私」、
「は」であり、そして、目的語である「東京」、「へ」
であることが明らかにされる。このように、構文解析部
１３２では、日本語、英語の言語に依存しない構造が解
析される。

【００４１】そして、後段の構文生成部１３３では、文
法に則った順序で、翻訳用辞書内の日本語に対応する英
単語が組み合わされて、「ＩｗｅｎｔｔｏＴｏｋ
ｙｏ．」などのように、英語の文章が生成される。生成
された文章データはテキストデータ１３４とされる。

【００４２】図４には音声合成部１５の構成例が示され
る。

【００４３】図４に示されるように、この音声合成部１
５は、特に制限されないが、入力されたテキストデータ
１３４に基づいて音源記憶部１９をアクセスするための
音源アクセス部１５１と、この音源アクセス部１５１の
出力信号をアナログ信号に変換するためのＤ／Ａ（ディ
ジタル／アナログ）変換部１５２、及びこのＤ／Ａ変換
部１５２の出力信号を増幅するためのアンプ１５３を含
む。上記音源記憶部１９には出力すべき音声がＰＣＭ
（ＰｕｌｓｅＣｏｄｅＭｏｄｕｌａｔｉｏｎ）デー
タとして予め記憶されており、それが上記音源アクセス
部１５１によって選択されるようになっている。例え
ば、上記音源記憶部１９には、「Ｉｗｅｎｔｔｏ
Ｔｏｋｙｏ．」なる音源や、「Ｗｈｅｒｅｉｓｔｈ
ｅｐａｒｋ？」などの音源が記録されており、その中
から、テキストデータ１３４に対応する音源が選択さ
れ、それが、アナログ信号に変換され、スピーカ１６か
ら出力される。音源記憶部１９内のＰＣＭデータは、ネ
イティブスピーカが発した音声をサンプリングしたもの
とすることができる。

【００４４】別の構成例について説明する。

【００４５】図５には、音声合成部１５の別の構成例が
示される。

【００４６】図５に示される音声合成部１５は、入力さ
れたテキストデータ１３４にも基づいてアクセント記号
を生成するためのアクセント記号変換部１５５、このア
クセント記号変換部１５５の出力信号に対して実時間に
よるディジタルフィルタ処理を施すことにより５母音波
形などを合成するためのフォルマント合成部１５４、こ
のフォルマント合成部１５４の出力信号をアナログ信号
に変換するためのＤ／Ａ変換部１５２、及びこのＤ／Ａ
変換部１５２の出力信号を増幅してスピーカ１６を駆動
するためのアンプ１５３を含む。実時間によるディジタ
ルフィルタ処理により、５母音波形などを合成するよう
にしているので、音声合成のために参照される音源記憶
部（図１参照）は不要となる。

【００４７】また、「ｓｙｓ」と「ｔｅｍ」とを組み合
わせて、「ｓｙｓｔｅｍ」とするように、英吾の音節の
組み合わせにより音声合成するようにしても良い。この
場合、「ｓｙｓ」と「ｔｅｍ」などの音節データを音源
記憶部１９に格納しておき、それを音声合成部１５で参
照する。

【００４８】さらに、図６には上記音声合成部１５の別
の構成例が示される。

【００４９】図６に示される音声合成部１５は、形態素
解析部１５６、読みアクセント付与部１５７、規則合成
部１５８、Ｄ／Ａ変換部１５２、及びアンプ１５３を含
む。

【００５０】形態素解析部１５６では、単語（名詞）／
助詞等の単位に分割され、読みアクセント付与部１５７
で、その単語にふさわしい読み・アクセント付与が行わ
れ、その出力信号が後段の規則合成部１５８に伝達され
る。規則合成部１５８では、与えられた読みに沿って音
源（あ、い、う、え、お、か、き、く、け、こ）の音源
（波形）を組み合わせて所定の単語音声が合成される。
音源データは音源記憶部１６０に格納されている。

【００５１】図７には翻訳装置のさらに別の構成例が示
される。

【００５２】図７に示される翻訳装置は、音声認識部１
２０、翻訳部１３０、音声合成部１５０、認識用辞書記
憶部１７０、及び音源記憶部１９０を含む。

【００５３】音声認識部１２０は、文章を名詞、助詞、
述語等のように細かく分けて認識するのではなく、例え
ば、「公園は」という単語と、「どこですか」という単
語との組み合わせで、「公園はどこですか？」という文
章を認識する。そのため、認識用辞書記憶部１７０に
は、文節認識のための単語情報が記憶されている。文節
認識のための単語情報は、操作者を限定しないよう、不
特定話者の音響モデルによる情報とされる。

【００５４】上記音声認識部１２０の認識結果は後段の
翻訳部１３０に伝達される。上記音声認識部１２０で定
型文認識が行われるため、この定型文認識結果に１対１
で対応付けられた英語音声を出力するため、上記翻訳部
１３０は英語音声ルックアップテーブルを含んで成る。
このテーブルにより、定型文認識結果が入力されると、
それに対応する英語音声が速やかに読み出される。

【００５５】また、音源記憶部１９０には、英語音声ル
ックアップテーブルの出力情報に対応した英語音声情報
がＰＣＭデータとして記憶されている。この英語音声情
報は、ネイティブスピーカが発生した音声をサンプリン
グして得たものを適用することができる。

【００５６】ここで、上記認識用辞書記憶部１７０、翻
訳部１３０である英語音声ルックアップテーブル、及び
音源記憶部１９０をカード化することにより、本体に着
脱自在に形成するようにしても良い。そしてこのカード
を、航空、ホテル、レストラン、病院、ショッピング等
の応用に応じてそれぞれ専用化して、場面に応じてカー
ドを差し替えることにより翻訳効率をさらに上げること
ができる。

【００５７】このように、図７に示される構成例では、
音声認識部１２０において、長い音声単位で認識するた
め、手がかりとなる情報が多く、認識率が高い、という
利点がある。また、翻訳部１３０は、英語音声ルックア
ップテーブルを有し、定型文認識結果に１対１で対応付
けられた英語音声を出力するようになっているため、翻
訳誤りが皆無に近い。さらに、ネイティブスピーカが発
した音声をサンプリングして得たものを音声合成に使用
することで、ネイティブスピーカのきれいな発音で音声
出力を得ることができる。

【００５８】以上本発明者によってなされた発明を実施
例に基づき具体的に説明したが、本発明は上記実施例に
限定されるものではなく、その要旨を逸脱しない範囲で
種々変更可能であることはいうまでもない。

【００５９】例えば、認識用辞書記憶部１７、翻訳用辞
書記憶部１８、及び音源記憶部１９をそれぞれ別々の辞
書カードとして形成しても良い。この場合、認識用辞
書、翻訳用辞書、及び音源データをそれぞれ個別的に交
換することができる。この場合、翻訳用辞書記憶部１８
が形成された辞書カードを差し替えるだけで言語の切り
換えを行うことができる。

【００６０】また、第１言語は日本語以外の言語とする
ことができ、第２言語は第１言語以外の言語とすること
ができる。

【００６１】以上の説明では主として本発明者によって
なされた発明をその背景となった利用分野である携帯型
自動翻訳装置について説明したが、第１言語を第２言語
に翻訳する翻訳装置に広く適用することができる。

【００６２】本発明は、少なくとも音声信号を認識する
音声認識手段と、この音声認識結果を翻訳する翻訳手段
と、この翻訳結果に対応する音声を合成する音声合成手
段とを含むことを条件に適用することができる。

【００６３】

【発明の効果】本願において開示される発明のうち代表
的なものによって得られる効果を簡単に説明すれば下記
の通りである。

【００６４】すなわち、第１制御手段は、音声認識結果
の翻訳前に音声認識結果を上記出力手段から出力させ、
第２制御手段は、上記音声認識結果の正しいことが確認
された後に上記翻訳手段での翻訳動作を開始させる。そ
れにより、音声認識結果が不適切であった場合の無駄な
翻訳を排除して、翻訳効率の向上を図ることができる。

【００６５】また、翻訳部１３０は、英語音声ルックア
ップテーブルを有し、定型文認識結果に１対１で対応付
けられた英語音声を出力するようになっているため、翻
訳誤りが非常に少なく、翻訳効率の向上を図ることがで
きる。

【図面の簡単な説明】

【図１】本発明にかかる翻訳装置の構成例ブロック図で
ある。

【図２】上記翻訳装置に含まれる音声認識部の構成例ブ
ロック図である。

【図３】上記翻訳装置に含まれる翻訳部の構成例ブロッ
ク図である。

【図４】上記翻訳装置に含まれる音声合成部の構成例ブ
ロック図である。

【図５】上記音声合成部の別の構成例ブロック図であ
る。

【図６】上記音声合成部のさらに別の構成例ブロック図
である。

【図７】本発明にかかる翻訳装置の別の構成例ブロック
図である。

【符号の説明】

１０携帯型自動翻訳装置１１マイクロフォン１２音声認識部１３翻訳部１４制御部１５音声合成部１６スピーカ１７認識用辞書記憶部１８翻訳用辞書記憶部１９音源記憶部１２０音声認識部１２１Ａ／Ｄ変換部１２２音声解析部１２３音響照合部１２５判定処理部１２６テキストデータ１３０翻訳部１３１形態素解析部１３２構文解析部１３３構文生成部１３４テキストデータ１５０音声合成部１５１音源アクセス部１５２Ｄ／Ａ変換部１５３アンプ１５４フォルマント合成部１５５アクセント記号変換部１５６形態素解析部１５７読みアクセント付与部１５８規則合成部１５９辞書記憶部１６０音源記憶部１７０認識用辞書記憶部１９０音源記憶部

───────────────────────────────────────────────────── フロントページの続き (72)発明者田中誠東京都小平市上水本町５丁目22番１号株式会社日立超エル・エス・アイ・システムズ内 (72)発明者塚田俊久東京都国分寺市東恋ケ窪一丁目280番地株式会社日立製作所中央研究所内Ｆターム(参考） 5B091 AA05 CB12 CB32 CD01 CD11 CD15 5D015 KK02 KK04 LL06 5D045 AB03 AB30

Claims

【特許請求の範囲】

【請求項１】第１言語の音声を入力するための入力手
段と、入力された音声信号を認識用辞書に基づいて認識する音
声認識手段と、音声認識結果を翻訳用辞書に基づいて第２言語に翻訳す
る翻訳手段と、上記翻訳手段の翻訳結果に対応する音声を音源データに
基づいて合成する音声合成手段と、上記音声合成手段の音声合成結果を出力する出力手段
と、上記音声認識結果の翻訳前に音声認識結果を上記出力手
段から出力させる第１制御手段と、上記音声認識結果の正しいことが確認された後に上記翻
訳手段での翻訳動作を開始させる第２制御手段と、を含むことを特徴とする翻訳装置。
【請求項２】上記認識用辞書、翻訳用辞書、及び音源
データが、カード化されて翻訳装置本体に着脱自在に形
成された記憶媒体に格納されて成る請求項１記載の翻訳
装置。
【請求項３】第１言語の音声を入力するための入力手
段と、入力された音声信号を認識用辞書に基づいて認識する音
声認識手段と、音声認識結果を第２言語に翻訳する翻訳手段と、上記翻訳手段の翻訳結果に対応する音声を音源データに
基づいて合成する音声合成手段と、上記音声合成手段の音声合成結果を出力する出力手段
と、を含み、上記翻訳手段は、上記音声認識結果に対応する第２言語
を出力するルックアップテーブルを含んで成ることを特
徴とする翻訳装置。
【請求項４】上記認識用辞書、ルックアップテーブ
ル、及び音原データが、カード化されて翻訳装置本体に
着脱自在に形成された記憶媒体に格納されて成る請求項
３記載の翻訳装置。
【請求項５】上記音声合成手段は、音声をサンプリン
グして得た音声データを記録する記憶手段の記憶データ
に基づいて音声を合成する請求項１乃至４のいずれか１
項記載の翻訳装置。