JPH04110900A - 音声入出力装置 - Google Patents
音声入出力装置Info
- Publication number
- JPH04110900A JPH04110900A JP2228194A JP22819490A JPH04110900A JP H04110900 A JPH04110900 A JP H04110900A JP 2228194 A JP2228194 A JP 2228194A JP 22819490 A JP22819490 A JP 22819490A JP H04110900 A JPH04110900 A JP H04110900A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- recognition
- section
- signal
- segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000011218 segmentation Effects 0.000 claims abstract 9
- 238000010183 spectrum analysis Methods 0.000 claims description 2
- 230000015572 biosynthetic process Effects 0.000 description 18
- 238000003786 synthesis reaction Methods 0.000 description 18
- 238000000605 extraction Methods 0.000 description 7
- 238000000034 method Methods 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 101100325756 Arabidopsis thaliana BAM5 gene Proteins 0.000 description 1
- 101150046378 RAM1 gene Proteins 0.000 description 1
- 101100476489 Rattus norvegicus Slc20a2 gene Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は入力された音声(例えば日本語)を認識して他
国語(例えば英語)に翻訳し、翻訳結果を音声出力する
音声入出力装置に関する。
国語(例えば英語)に翻訳し、翻訳結果を音声出力する
音声入出力装置に関する。
(従来の技術)
近年、国際化が進み、外国人と接触する機会が増大して
いる。そこで、外国人と簡単な会話ができる音声入出力
装置が従来より種々開発されてきている。その一つに以
下に説明するような音声入出力装置がある。先づ相手に
伝えたい会話文に対応した“キーとなる単語”を認識コ
ード番号と対応させ、予め音声入出力装置の使用者の音
声で標準音声パータンとしてメモリに登録してお(。
いる。そこで、外国人と簡単な会話ができる音声入出力
装置が従来より種々開発されてきている。その一つに以
下に説明するような音声入出力装置がある。先づ相手に
伝えたい会話文に対応した“キーとなる単語”を認識コ
ード番号と対応させ、予め音声入出力装置の使用者の音
声で標準音声パータンとしてメモリに登録してお(。
又、その認識コード番号と°゛相手伝えたい会話文”と
を対応させた音声合成データをメモリに記憶してお(。
を対応させた音声合成データをメモリに記憶してお(。
外国人にその会話文を伝えたいとき音声入出力装置のモ
ード選択スイッチを運用モードにして“キーとなる単語
”をマイクロフォン(以後マイクと記す)から入力する
と、音声区間切り出し部が音声区間の切り出しを行う。
ード選択スイッチを運用モードにして“キーとなる単語
”をマイクロフォン(以後マイクと記す)から入力する
と、音声区間切り出し部が音声区間の切り出しを行う。
続いて音声認識部がスペクトル分析、標準音声パターン
とのマツチングを行い、最も類似度の高い標準パターン
に対応した認識コード番号を選択する。制御部はその認
識コード番号を読み出し、認識コード番号に対応した、
音声合成データを音声合成部に音声として合成させ出力
させる。
とのマツチングを行い、最も類似度の高い標準パターン
に対応した認識コード番号を選択する。制御部はその認
識コード番号を読み出し、認識コード番号に対応した、
音声合成データを音声合成部に音声として合成させ出力
させる。
(発明が解決しようとする課題)
従来の音声入出力装置にあっては、運用モードにしてし
まうと音声の切り出し、認識及び合成動作に入る。従っ
て、自分の声よりも相手の声が大きいと、相手の声を認
識し、その音声に最も近い音声パータンに対応する会話
文を合成音として出力してしまうことがあるので、相手
の声が認識されないようにその都度マイクを相手の声が
入らないように遠ざける等の動作を必要とし、操作性が
悪いという問題点があった。
まうと音声の切り出し、認識及び合成動作に入る。従っ
て、自分の声よりも相手の声が大きいと、相手の声を認
識し、その音声に最も近い音声パータンに対応する会話
文を合成音として出力してしまうことがあるので、相手
の声が認識されないようにその都度マイクを相手の声が
入らないように遠ざける等の動作を必要とし、操作性が
悪いという問題点があった。
本発明は、相手の声が大きくても相手の音声は認識され
ず、マイクを相手の声から遠ざける等の動作を不必要と
する音声入出力装置を提供することを目的とする。
ず、マイクを相手の声から遠ざける等の動作を不必要と
する音声入出力装置を提供することを目的とする。
(課題を解決するための手段)
上記目的を達成するために、本発明の音声入出力装置に
おいては、音声区間の切り出し開始信号を発生する音声
区間切り出し開始信号発生手段と、その切り出し開始信
号を入力して音声区間切り出し開始指示を音声区間切り
出し部に出力する音声区間切り出し開始指示手段とを備
えたものである。
おいては、音声区間の切り出し開始信号を発生する音声
区間切り出し開始信号発生手段と、その切り出し開始信
号を入力して音声区間切り出し開始指示を音声区間切り
出し部に出力する音声区間切り出し開始指示手段とを備
えたものである。
(作 用)
上記のように構成された音声入出力装置の音声区間切り
出し開始信号発生手段から音声区間切り出し開始指示手
段に切り出し開始信号が入力されると、音声区間切り出
し部に音声区間切り出し開始指示が出力されて音声区間
の切り出しが始まる。
出し開始信号発生手段から音声区間切り出し開始指示手
段に切り出し開始信号が入力されると、音声区間切り出
し部に音声区間切り出し開始指示が出力されて音声区間
の切り出しが始まる。
従って、本発明の音声入出力装置によれば、相手の声が
大きくても音声入出力装置の使用者が切り出し開始信号
を発生させない限り、音声区間切り出し部は相手の音声
の音声区間切り出しを行なわないので、マイクを相手の
声から遠ざける等の動作を不必要とするのである。
大きくても音声入出力装置の使用者が切り出し開始信号
を発生させない限り、音声区間切り出し部は相手の音声
の音声区間切り出しを行なわないので、マイクを相手の
声から遠ざける等の動作を不必要とするのである。
(実施例)
本発明の実施例について図面を参照しながら説明する。
なお、各図面に共通な要素には同一符号を付す。
第1図は本発明の一実施例を示す概略構成ブロック図で
ある。音声入出力装置全体を制御する制御部1は中央処
理装置2(以後CPU2と記す)とメインメモリ3(以
後メモリ3と記す)とからなる。CPU2はメモリ3と
ライ:ノ4で接続してあり、音声区間切り出し部5(以
後切り出し部5と記す)、音声認識部6(以後認識部6
と記す)、音声合成部7(以後合成部7と記す)とライ
ン8で接続しである。又、CPU2の割込み端子2aは
音声区間切り出し開始指示信号を発生させるオペレーシ
ョンスイッチ9を介して接地しである。割込み端子2a
とオペレーションスイッチ9との間は抵抗を介して+5
■にプルアップしである。又、CPU2の割込み端子2
b、2cはモード選択スイッチ10を介して接地しであ
る。
ある。音声入出力装置全体を制御する制御部1は中央処
理装置2(以後CPU2と記す)とメインメモリ3(以
後メモリ3と記す)とからなる。CPU2はメモリ3と
ライ:ノ4で接続してあり、音声区間切り出し部5(以
後切り出し部5と記す)、音声認識部6(以後認識部6
と記す)、音声合成部7(以後合成部7と記す)とライ
ン8で接続しである。又、CPU2の割込み端子2aは
音声区間切り出し開始指示信号を発生させるオペレーシ
ョンスイッチ9を介して接地しである。割込み端子2a
とオペレーションスイッチ9との間は抵抗を介して+5
■にプルアップしである。又、CPU2の割込み端子2
b、2cはモード選択スイッチ10を介して接地しであ
る。
割込み端子2b、2c)モード選択スイッチ1゜との間
は抵抗を介して+5■にプルアップしである。又、CP
U2の電源端子は電源11に直接接続してあり、常にオ
ンの状態にある。
は抵抗を介して+5■にプルアップしである。又、CP
U2の電源端子は電源11に直接接続してあり、常にオ
ンの状態にある。
メモリ3には制御プログラムが格納しである。
又、切り出し部5はマイク12、認識部6とそれぞれラ
イン13.14で接続しである。又、認識部6は音声パ
ターンを登録しておく標準パターン用ランダムアクセス
メモリ15(以後標準パターン用RAM15と記す)と
ライン16で接続しである。又、合成部7は音声合成デ
ータを格納しである音声合成データメモリカード17(
以後メモリカード17と記す)、スピーカアンプ19の
入力部とそれぞれライン18.20で接続しである。ス
ピーカアンプ19の出力部としてスピーカ21とはライ
ン22で接続しである。
イン13.14で接続しである。又、認識部6は音声パ
ターンを登録しておく標準パターン用ランダムアクセス
メモリ15(以後標準パターン用RAM15と記す)と
ライン16で接続しである。又、合成部7は音声合成デ
ータを格納しである音声合成データメモリカード17(
以後メモリカード17と記す)、スピーカアンプ19の
入力部とそれぞれライン18.20で接続しである。ス
ピーカアンプ19の出力部としてスピーカ21とはライ
ン22で接続しである。
尚、第1図におけるライン端の矢印はラインを通じて流
れる信号の向きを示す。
れる信号の向きを示す。
第2図は本発明の一実施例の外観斜視図であり、同図(
a)は表側を示し、同図(b)は裏側で示す。ケース2
3の側面には音声区間切り出し開始指示信号を発生させ
るオベーレーションスイッチ9及びモード選択スイッチ
10が設けである。
a)は表側を示し、同図(b)は裏側で示す。ケース2
3の側面には音声区間切り出し開始指示信号を発生させ
るオベーレーションスイッチ9及びモード選択スイッチ
10が設けである。
又、ケース23の内部には制御部1、切り出し部5、認
識部6、標準パターン用RAM15、合成部7を搭載し
たプリント基板24が設けである。
識部6、標準パターン用RAM15、合成部7を搭載し
たプリント基板24が設けである。
又、表側の乾電池蓋25を取外すと電源である乾電池1
1を装着できる。又、音声入力部26の内側にはマイク
12が設けである。又、裏側の下部にはメモリカード挿
入口27が設けてあり、メモリカード17を挿入できる
。又、裏面の上部の音声出力部28内側にはスピーカ2
1が設けである。
1を装着できる。又、音声入力部26の内側にはマイク
12が設けである。又、裏側の下部にはメモリカード挿
入口27が設けてあり、メモリカード17を挿入できる
。又、裏面の上部の音声出力部28内側にはスピーカ2
1が設けである。
次に動作について第3図をも加えて説明する。
第3図は翻訳処理に係る割込み処理のフローチャートで
ある。
ある。
先づ使用者は、予め、会話文の中で“キーになる単語”
を自分の声で登録するために、モード選択スイッチ10
を“登録”側にスライドさせ、標準パターン用RAM1
5に登録しておく。又、“キーとなる単語”に対応する
会話文を音声にする音声合成データを記憶させたメモリ
カード17(例えば英会話用)を挿入してお(。そして
今、使用者は外国の喧嘩な市場で買物をしていであるも
のを買いたいと思い、店主に値段を聞こうとする。使用
者は音声入出力装置のモード選択スイッチ10を°°運
用パ側にスライドさせる。CPU2は割込み端子2bが
接地されて運用モードに入る。続いて使用者はオペレー
ションスイッチ9を押す。CPU2は割込み端子2aが
接地されて翻訳処理に入る。翻訳処理は第3図のフロー
チャートに従う。CPU2はステップS1で音声区間切
り已し開始コマンドを切り出し部5に出力し、ステップ
S2で切り出し部5からの音声区間切り出し終了信号を
待つ。その間、切り出し部5は音声区間切りだし時期状
態に入る。そして、使用者はマイク21に向って“い(
ら”というと、切り出し部5はマイク21から音声信号
を入力し、音声区間切り出し条件を満した音声信号を認
識部6に出力すると同時にCPU2に音声区間切り出し
終了信号を出力する。認識部6は音声信号を公知技術で
ある線形予測符号化分析法を用いてデジタル変換して記
憶しておく。CPU2は音声区間切り出し終了信号を入
力するとステップs3に移り、認識部6に音声認識開始
コマンドを出力し、ステップS4で認識部6がらの音声
認識終了信号を待つ。その間認識部6は認識動作に入り
、音声の特徴量と標準パターン用RAM15に登録しで
ある音声パターンの特徴量とをこれも公知技術であるダ
イナミックプログラミング法を用いてパターンマツチン
グを行う。そして最も類似度の高い音声パターンに対応
する認識コード番号を選択するとともに、CPU2に認
識終了信号を出力する。CPU2は認識終了信号を入力
すると、ステップS6に移り、認識部6がら認識コード
番号を読み出す。ステップs6でCPU2は合成部7に
音声合成開始コマンドを8カする。合成部7は音声合成
開始コマンドに基づいて音声合成動作に入る。ステップ
S、でCPU2は合成部7に認識コード番号を出力する
と、合成部7は認識コード番号に対応する会話文“Ho
w much”の音声合成データをメモリカード17が
ら選択し、音声合成処理を行いアナログ音声信号に変換
してスピーカアンプ19に出力する。スピーカアンプ1
9はアナログ音声信号を増幅してスピーカ21に出力し
、翻訳処理は終了する。
を自分の声で登録するために、モード選択スイッチ10
を“登録”側にスライドさせ、標準パターン用RAM1
5に登録しておく。又、“キーとなる単語”に対応する
会話文を音声にする音声合成データを記憶させたメモリ
カード17(例えば英会話用)を挿入してお(。そして
今、使用者は外国の喧嘩な市場で買物をしていであるも
のを買いたいと思い、店主に値段を聞こうとする。使用
者は音声入出力装置のモード選択スイッチ10を°°運
用パ側にスライドさせる。CPU2は割込み端子2bが
接地されて運用モードに入る。続いて使用者はオペレー
ションスイッチ9を押す。CPU2は割込み端子2aが
接地されて翻訳処理に入る。翻訳処理は第3図のフロー
チャートに従う。CPU2はステップS1で音声区間切
り已し開始コマンドを切り出し部5に出力し、ステップ
S2で切り出し部5からの音声区間切り出し終了信号を
待つ。その間、切り出し部5は音声区間切りだし時期状
態に入る。そして、使用者はマイク21に向って“い(
ら”というと、切り出し部5はマイク21から音声信号
を入力し、音声区間切り出し条件を満した音声信号を認
識部6に出力すると同時にCPU2に音声区間切り出し
終了信号を出力する。認識部6は音声信号を公知技術で
ある線形予測符号化分析法を用いてデジタル変換して記
憶しておく。CPU2は音声区間切り出し終了信号を入
力するとステップs3に移り、認識部6に音声認識開始
コマンドを出力し、ステップS4で認識部6がらの音声
認識終了信号を待つ。その間認識部6は認識動作に入り
、音声の特徴量と標準パターン用RAM15に登録しで
ある音声パターンの特徴量とをこれも公知技術であるダ
イナミックプログラミング法を用いてパターンマツチン
グを行う。そして最も類似度の高い音声パターンに対応
する認識コード番号を選択するとともに、CPU2に認
識終了信号を出力する。CPU2は認識終了信号を入力
すると、ステップS6に移り、認識部6がら認識コード
番号を読み出す。ステップs6でCPU2は合成部7に
音声合成開始コマンドを8カする。合成部7は音声合成
開始コマンドに基づいて音声合成動作に入る。ステップ
S、でCPU2は合成部7に認識コード番号を出力する
と、合成部7は認識コード番号に対応する会話文“Ho
w much”の音声合成データをメモリカード17が
ら選択し、音声合成処理を行いアナログ音声信号に変換
してスピーカアンプ19に出力する。スピーカアンプ1
9はアナログ音声信号を増幅してスピーカ21に出力し
、翻訳処理は終了する。
(発明の効果)
本発明は以上説明したように構成されているので、以下
に記載される効果を奏する。
に記載される効果を奏する。
音声の切り出しを切り出し開始信号で行なわせる音声区
間切り出し開始信号発生手段を設け、相手が発声してい
るときは切り出し開始信号を発生させず、音声入出力装
置の使用者が発声するとき切り出し開始信号を発生する
ようにしたので、相手の音声を入力して誤った会話文を
音声出力することはなくなる。
間切り出し開始信号発生手段を設け、相手が発声してい
るときは切り出し開始信号を発生させず、音声入出力装
置の使用者が発声するとき切り出し開始信号を発生する
ようにしたので、相手の音声を入力して誤った会話文を
音声出力することはなくなる。
第1図は本発明の一実施例を示す構成ブロック図、第2
図は本発明の一実施例の外観斜視図、第3図は割込み処
理のフローチャートである。 本発明の一実施例の外観斜視図 第2図 割込み処理のフロ 第3図 チャ ト
図は本発明の一実施例の外観斜視図、第3図は割込み処
理のフローチャートである。 本発明の一実施例の外観斜視図 第2図 割込み処理のフロ 第3図 チャ ト
Claims (1)
- 【特許請求の範囲】 音声区間の切り出し部が音声区間の切り出しを行ったの
ちスペクトル分析を行い、予め登録済みの標準音声パタ
ーンと類似度を比較し、最も類似度の高い標準音声パー
タンに対応した会話文を合成音として出力する音声入出
力装置において、音声区間の切り出し開始信号を発生す
る音声区間切り出し開始信号発生手段と、 その切り出し開始信号を入力して音声区間切り出し開始
指示を上記音声区間切り出し部に出力する音声区間切り
出し開始指示手段とを備えたことを特徴とする音声入出
力装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2228194A JPH04110900A (ja) | 1990-08-31 | 1990-08-31 | 音声入出力装置 |
EP19910114073 EP0472193A3 (en) | 1990-08-23 | 1991-08-22 | Translation device based on voice recognition and voice synthesis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2228194A JPH04110900A (ja) | 1990-08-31 | 1990-08-31 | 音声入出力装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04110900A true JPH04110900A (ja) | 1992-04-13 |
Family
ID=16872682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2228194A Pending JPH04110900A (ja) | 1990-08-23 | 1990-08-31 | 音声入出力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04110900A (ja) |
-
1990
- 1990-08-31 JP JP2228194A patent/JPH04110900A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7260529B1 (en) | Command insertion system and method for voice recognition applications | |
CN100403828C (zh) | 一种便携式数字移动通讯设备及其语音控制方法和系统 | |
JP2667408B2 (ja) | 翻訳通信システム | |
EP0472193A2 (en) | Translation device based on voice recognition and voice synthesis | |
JPH04110900A (ja) | 音声入出力装置 | |
JPH11110389A (ja) | 携帯型翻訳機 | |
Halle | Speech sounds and sequences | |
JPS607514A (ja) | ワ−ドプロセツサ | |
JP2020086977A (ja) | 翻訳装置 | |
JPH086589A (ja) | 電話回線音声入力システム | |
JPH08297673A (ja) | 音声入力翻訳装置 | |
JPH04167070A (ja) | 音声翻訳装置 | |
JPH05313685A (ja) | 文章読み上げ装置 | |
JPH0443297B2 (ja) | ||
JPH0195323A (ja) | 音声入力装置 | |
JP3136038B2 (ja) | 通訳装置 | |
KR200254375Y1 (ko) | 단어 검색 장치 및 이를 이용한 단어 검색 헤드셋 | |
JPH07129620A (ja) | 音声電子ブック | |
JPH04106658A (ja) | 外部メモリ式音声翻訳機 | |
JPS58109931A (ja) | デ−タ処理装置 | |
JPS61262967A (ja) | 音声ワ−ド・プロセサ | |
KR19980014924A (ko) | 음성출력 키보드 시스템 | |
JPH01160249A (ja) | 翻訳通信方式 | |
JP2001175275A (ja) | サブワード音響モデル生成方法および音声認識装置 | |
JPH05289608A (ja) | ろうあ者用会話補助装置及び翻訳用会話補助装置 |