JPH04110900A

JPH04110900A - 音声入出力装置

Info

Publication number: JPH04110900A
Application number: JP2228194A
Authority: JP
Inventors: Kenichi Hirayama; 健一平山; Takanori Murata; 村田　隆憲; Waichiro Tsujita; 辻田　和一郎
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1990-08-31
Filing date: 1990-08-31
Publication date: 1992-04-13

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は入力された音声（例えば日本語）を認識して他
国語（例えば英語）に翻訳し、翻訳結果を音声出力する
音声入出力装置に関する。

（従来の技術）近年、国際化が進み、外国人と接触する機会が増大して
いる。そこで、外国人と簡単な会話ができる音声入出力
装置が従来より種々開発されてきている。その一つに以
下に説明するような音声入出力装置がある。先づ相手に
伝えたい会話文に対応した“キーとなる単語”を認識コ
ード番号と対応させ、予め音声入出力装置の使用者の音
声で標準音声パータンとしてメモリに登録してお（。

又、その認識コード番号と°゛相手伝えたい会話文”と
を対応させた音声合成データをメモリに記憶してお（。

外国人にその会話文を伝えたいとき音声入出力装置のモ
ード選択スイッチを運用モードにして“キーとなる単語
”をマイクロフォン（以後マイクと記す）から入力する
と、音声区間切り出し部が音声区間の切り出しを行う。

続いて音声認識部がスペクトル分析、標準音声パターン
とのマツチングを行い、最も類似度の高い標準パターン
に対応した認識コード番号を選択する。制御部はその認
識コード番号を読み出し、認識コード番号に対応した、
音声合成データを音声合成部に音声として合成させ出力
させる。

（発明が解決しようとする課題）従来の音声入出力装置にあっては、運用モードにしてし
まうと音声の切り出し、認識及び合成動作に入る。従っ
て、自分の声よりも相手の声が大きいと、相手の声を認
識し、その音声に最も近い音声パータンに対応する会話
文を合成音として出力してしまうことがあるので、相手
の声が認識されないようにその都度マイクを相手の声が
入らないように遠ざける等の動作を必要とし、操作性が
悪いという問題点があった。

本発明は、相手の声が大きくても相手の音声は認識され
ず、マイクを相手の声から遠ざける等の動作を不必要と
する音声入出力装置を提供することを目的とする。

（課題を解決するための手段）上記目的を達成するために、本発明の音声入出力装置に
おいては、音声区間の切り出し開始信号を発生する音声
区間切り出し開始信号発生手段と、その切り出し開始信
号を入力して音声区間切り出し開始指示を音声区間切り
出し部に出力する音声区間切り出し開始指示手段とを備
えたものである。

（作　用）上記のように構成された音声入出力装置の音声区間切り
出し開始信号発生手段から音声区間切り出し開始指示手
段に切り出し開始信号が入力されると、音声区間切り出
し部に音声区間切り出し開始指示が出力されて音声区間
の切り出しが始まる。

従って、本発明の音声入出力装置によれば、相手の声が
大きくても音声入出力装置の使用者が切り出し開始信号
を発生させない限り、音声区間切り出し部は相手の音声
の音声区間切り出しを行なわないので、マイクを相手の
声から遠ざける等の動作を不必要とするのである。

（実施例）本発明の実施例について図面を参照しながら説明する。

なお、各図面に共通な要素には同一符号を付す。

第１図は本発明の一実施例を示す概略構成ブロック図で
ある。音声入出力装置全体を制御する制御部１は中央処
理装置２（以後ＣＰＵ２と記す）とメインメモリ３（以
後メモリ３と記す）とからなる。ＣＰＵ２はメモリ３と
ライ：ノ４で接続してあり、音声区間切り出し部５（以
後切り出し部５と記す）、音声認識部６（以後認識部６
と記す）、音声合成部７（以後合成部７と記す）とライ
ン８で接続しである。又、ＣＰＵ２の割込み端子２ａは
音声区間切り出し開始指示信号を発生させるオペレーシ
ョンスイッチ９を介して接地しである。割込み端子２ａ
とオペレーションスイッチ９との間は抵抗を介して＋５
■にプルアップしである。又、ＣＰＵ２の割込み端子２
ｂ、２ｃはモード選択スイッチ１０を介して接地しであ
る。

割込み端子２ｂ、２ｃ）モード選択スイッチ１゜との間
は抵抗を介して＋５■にプルアップしである。又、ＣＰ
Ｕ２の電源端子は電源１１に直接接続してあり、常にオ
ンの状態にある。

メモリ３には制御プログラムが格納しである。

又、切り出し部５はマイク１２、認識部６とそれぞれラ
イン１３．１４で接続しである。又、認識部６は音声パ
ターンを登録しておく標準パターン用ランダムアクセス
メモリ１５（以後標準パターン用ＲＡＭ１５と記す）と
ライン１６で接続しである。又、合成部７は音声合成デ
ータを格納しである音声合成データメモリカード１７（
以後メモリカード１７と記す）、スピーカアンプ１９の
入力部とそれぞれライン１８．２０で接続しである。ス
ピーカアンプ１９の出力部としてスピーカ２１とはライ
ン２２で接続しである。

尚、第１図におけるライン端の矢印はラインを通じて流
れる信号の向きを示す。

第２図は本発明の一実施例の外観斜視図であり、同図（
ａ）は表側を示し、同図（ｂ）は裏側で示す。ケース２
３の側面には音声区間切り出し開始指示信号を発生させ
るオベーレーションスイッチ９及びモード選択スイッチ
１０が設けである。

又、ケース２３の内部には制御部１、切り出し部５、認
識部６、標準パターン用ＲＡＭ１５、合成部７を搭載し
たプリント基板２４が設けである。

又、表側の乾電池蓋２５を取外すと電源である乾電池１
１を装着できる。又、音声入力部２６の内側にはマイク
１２が設けである。又、裏側の下部にはメモリカード挿
入口２７が設けてあり、メモリカード１７を挿入できる
。又、裏面の上部の音声出力部２８内側にはスピーカ２
１が設けである。

次に動作について第３図をも加えて説明する。

第３図は翻訳処理に係る割込み処理のフローチャートで
ある。

先づ使用者は、予め、会話文の中で“キーになる単語”
を自分の声で登録するために、モード選択スイッチ１０
を“登録”側にスライドさせ、標準パターン用ＲＡＭ１
５に登録しておく。又、“キーとなる単語”に対応する
会話文を音声にする音声合成データを記憶させたメモリ
カード１７（例えば英会話用）を挿入してお（。そして
今、使用者は外国の喧嘩な市場で買物をしていであるも
のを買いたいと思い、店主に値段を聞こうとする。使用
者は音声入出力装置のモード選択スイッチ１０を°°運
用パ側にスライドさせる。ＣＰＵ２は割込み端子２ｂが
接地されて運用モードに入る。続いて使用者はオペレー
ションスイッチ９を押す。ＣＰＵ２は割込み端子２ａが
接地されて翻訳処理に入る。翻訳処理は第３図のフロー
チャートに従う。ＣＰＵ２はステップＳ１で音声区間切
り已し開始コマンドを切り出し部５に出力し、ステップ
Ｓ２で切り出し部５からの音声区間切り出し終了信号を
待つ。その間、切り出し部５は音声区間切りだし時期状
態に入る。そして、使用者はマイク２１に向って“い（
ら”というと、切り出し部５はマイク２１から音声信号
を入力し、音声区間切り出し条件を満した音声信号を認
識部６に出力すると同時にＣＰＵ２に音声区間切り出し
終了信号を出力する。認識部６は音声信号を公知技術で
ある線形予測符号化分析法を用いてデジタル変換して記
憶しておく。ＣＰＵ２は音声区間切り出し終了信号を入
力するとステップｓ３に移り、認識部６に音声認識開始
コマンドを出力し、ステップＳ４で認識部６がらの音声
認識終了信号を待つ。その間認識部６は認識動作に入り
、音声の特徴量と標準パターン用ＲＡＭ１５に登録しで
ある音声パターンの特徴量とをこれも公知技術であるダ
イナミックプログラミング法を用いてパターンマツチン
グを行う。そして最も類似度の高い音声パターンに対応
する認識コード番号を選択するとともに、ＣＰＵ２に認
識終了信号を出力する。ＣＰＵ２は認識終了信号を入力
すると、ステップＳ６に移り、認識部６がら認識コード
番号を読み出す。ステップｓ６でＣＰＵ２は合成部７に
音声合成開始コマンドを８カする。合成部７は音声合成
開始コマンドに基づいて音声合成動作に入る。ステップ
Ｓ、でＣＰＵ２は合成部７に認識コード番号を出力する
と、合成部７は認識コード番号に対応する会話文“Ｈｏ
ｗ　ｍｕｃｈ”の音声合成データをメモリカード１７が
ら選択し、音声合成処理を行いアナログ音声信号に変換
してスピーカアンプ１９に出力する。スピーカアンプ１
９はアナログ音声信号を増幅してスピーカ２１に出力し
、翻訳処理は終了する。

（発明の効果）本発明は以上説明したように構成されているので、以下
に記載される効果を奏する。

音声の切り出しを切り出し開始信号で行なわせる音声区
間切り出し開始信号発生手段を設け、相手が発声してい
るときは切り出し開始信号を発生させず、音声入出力装
置の使用者が発声するとき切り出し開始信号を発生する
ようにしたので、相手の音声を入力して誤った会話文を
音声出力することはなくなる。

【図面の簡単な説明】

第１図は本発明の一実施例を示す構成ブロック図、第２
図は本発明の一実施例の外観斜視図、第３図は割込み処
理のフローチャートである。本発明の一実施例の外観斜視図第２図割込み処理のフロ第３図チャト

Claims

【特許請求の範囲】音声区間の切り出し部が音声区間の切り出しを行ったの
ちスペクトル分析を行い、予め登録済みの標準音声パタ
ーンと類似度を比較し、最も類似度の高い標準音声パー
タンに対応した会話文を合成音として出力する音声入出
力装置において、音声区間の切り出し開始信号を発生す
る音声区間切り出し開始信号発生手段と、その切り出し開始信号を入力して音声区間切り出し開始
指示を上記音声区間切り出し部に出力する音声区間切り
出し開始指示手段とを備えたことを特徴とする音声入出
力装置。