JPS649769B2 - - Google Patents
Info
- Publication number
- JPS649769B2 JPS649769B2 JP62142010A JP14201087A JPS649769B2 JP S649769 B2 JPS649769 B2 JP S649769B2 JP 62142010 A JP62142010 A JP 62142010A JP 14201087 A JP14201087 A JP 14201087A JP S649769 B2 JPS649769 B2 JP S649769B2
- Authority
- JP
- Japan
- Prior art keywords
- volume
- output
- voice
- circuit
- latch means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000001514 detection method Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 3
- 238000000034 method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000003321 amplification Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 235000010678 Paulownia tomentosa Nutrition 0.000 description 3
- 240000002834 Paulownia tomentosa Species 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 239000003990 capacitor Substances 0.000 description 2
- 230000007257 malfunction Effects 0.000 description 2
- 235000002222 Irvingia smithii Nutrition 0.000 description 1
- 244000308605 Irvingia smithii Species 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Landscapes
- Control Of Amplification And Gain Control (AREA)
Description
【発明の詳細な説明】
本発明は、テレビジヨン受像機等の音声による
制御装置に係り、特に音声によつて音量の段階的
制御を、手動によつて音量の連続的制御を行うも
のに関する。 指令者〔或は操作者、以下、肉声を原情報とし
て被制御装置(例えばテレビジヨン受像機等)を
遠隔的に制御する者を指す。〕の指令(或は指示)
内容(音声信号)を標本化し且つ量子化すること
によつて標準(デジタル信号)パターンとして予
め記憶しておき、後に発せられる音声指示内容
(音声信号)を標本化した後量子化し、必要に応
じて時間軸の調整を行つてデジタル化した後
RAM等のメモリに一時的に記憶し、前記標準パ
ターンとの比較により、一定の許容値をもつて合
致した時、オン・オフ制御を行うことが提唱され
ている。 このような音声認識手段としては例えば第1図
の如く、入力音声を電気信号に変換する音響―電
気信号変換器(例えばマイクロフオン)を含む入
力部1、音声信号の特徴を抽出する、特徴抽出部
2、あらかじめ登録された音声特徴の標準パター
ンを記憶する、標準パターン記憶部3、入力音声
から抽出された特徴パターンと標準パターンとを
比較し、入力音声を特定する認識処理部4、認識
結果にもとづき例えばテレビ受信機の電源、チヤ
ンネル、音量等を制御する出力制御部5を主な構
成要素とし、これに認識率を向上させる為の入力
信号振巾正規化回路6、時間軸調整部7、あらか
じめ音声特徴の標準パターンを登録する為の登録
制御部8が付加される。 音声の特徴を抽出するパラメータとしては、周
波数スペクトル分布、相関関数、零交差数、フオ
ルマント周波数或いは線型予測係数など多くの方
法が考えられるが、これらのうち音声の周波数ス
ペクトルを複数の周波数フイルタにより分離抽出
し標準パターンとの相関を調べるいわゆるフイル
タバンク方式は比較的簡単な構成で高い認識率を
得ることが出来る方法としてよく用いられてい
る。このような音声による制御装置の制御内容と
しては電源の入切、チヤンネルや局番の変更指
定、音量の変更などがあり、例えば電源について
は「デンゲン・イリ(キリ)」などと発声制御で
きるが音量についてはもともとアナログ的な連続
可変制御である為音声による適当な制御方法が提
案されていない。 本発明は、このようなアナログ量である音量
を、音声にて数値指示し、その内容を音声識別装
置によつて判別して、例えば10進値として取り出
し、複数の可変減衰器或は可変利得増巾器等の組
み合せを変更することによつて前記音量のレベル
を段階的に制御出来、且つボリユームにより連続
的に制御出来るものである。 以下、本発明の詳細を要部回路ブロツクダイア
グラムを表わす第2図及び第3図を参照しつつ説
明する。 この実施例においては、音声認識のための特徴
パラメータとしてフイルタバンク方式(周波数ス
ペクトル方式)を採用した音声認識装置を組込ん
だテレビジヨン受信機の音声による制御装置を例
に採つて説明するが、被制御量がアナログ量であ
れば、被制御装置は選ばない。 通常機器の前面に取りつけられる入力部1は有
指向性及び無指向性の2つのマイクロフオン10
と11の図示の如き差動接続と増巾器12により
構成される。即ち有指向性マイクロフオン10に
対し無指向性マイクロフオン11は逆位相接続さ
れており、従つて指向特性範囲外からの音声信
号、即ち制御命令音声以外の信号は相殺され、指
向特性範囲内の制御命令音声のSN比はこれによ
つて高められる。その際、TV受像機等のスピー
カから流れる音声中の指令類似語による誤動作を
防止するために、重要語(最頗度語)「デンゲン」
或は「パワー」、「チヤンネル」、「オンリヨー」又
は「ボリユーム」等の指令(注、これらの用語に
ついては、識別のための許容値を大きく取つてあ
る)が識別された際には、第3図に別途要部回路
図として開示せる如きいわゆる初期ミユーテイン
グ回路を設けておき、一時的にスピーカ出力を断
つか若しくは大巾に減衰せしめる。この点につい
ては後に詳述する。振巾正規化機能を併せ特徴抽
出部2は、複数個のフイルタ13―1,13―2
…13―N及び入力信号の全振巾を検知するレベ
ル検出回路14、各フイルタの出力をデジタル信
号に変換するA―D(アナログ―デジタル)変換
器15、該A―D変換器に前置され前記各フイル
タ出力と前記レベル検出回路14出力との比をと
ることにより、フイルタ出力振巾を正規化するア
ナログ割算器等によつて構成された振巾正規化回
路16、更に該振巾正規化回路と前記フイルタ群
との間に挿入され、該フイルタの各出力の接続を
切り替えるマルチプレクサ17によつて構成され
る。斯る構成により前記入力部1から入力した音
声信号の各フイルタ成分が適当な時間間隔(多く
の場合10ミリ秒前後)で順次サンプリング標本化
され、更に各サンプリング値を量子化することに
よつてデジタルコードに変換された後、マイクロ
コンピユータ若しくは中央処理装置(CPU)1
8のI/Oポート(図示せず)を経て、記憶メモ
リー19(通常RAM:ランダムアクセスメモ
リ)に記憶される。 前記A―D変換の過程において、標本化された
各量を量子化する際、一様量子化することもでき
るが、別途手動調整手段を設ける際には、段階的
にその調整器の制御指示量(例えばボリユームの
回転角)と制御レベルとの関係に合わせて非直線
的に量子化を計ることもできる。 CPU(中央処理装置)18には別の標準パター
ンメモリ3が接続されており、予め指令者の音声
指令(制御命令が、標本化され量子化された形で
その制御内容を指定するコードと共に記憶されて
いる。制御命令音声(音声による指令)の標準パ
ターンメモリへの登録は、例えばテレビ受信機の
制御の場合には次の様に行なう。第4図はテレビ
受信機のコントロールパネルの1例であり、入力
マイク20、登録モードスイツチ21指令者を選
択する指令者(話者)番号指定スイツチ1,22
―1同2,22―2…、制御命令指定スイツチ電
源のオン、オフ切替、音量変更、チヤンネル切替
に各対応してそれぞれ「電源」指定スイツチ23
「音量」指定スイツチ24「チヤンネル」指定ス
イツチ25として、又音量及びチヤンネル指定を
行なう数字ボタン26―1,26―2,26―
3,…26―11,26―12が各対応する表示
ランプ27―1,27―2,…27―12と共に
配設されている。又下部の「OK」表示ランプ2
8は認識又は登録が良好に完了したとき、
「REPEAT」表示ランプ29は同じく不良であつ
たときそれぞれ点灯表示するものである。かかる
登録制御部30を用いて標準パターンを登録する
には、まず登録スイツチ21を押して登録モード
とし、次に話者番号を同指定スイツチ22―1又
は22―2…にて指定した上で、以下順次「電
源」スイツチ23を押して例えば「デンゲン」あ
るいは「パワー(POWER)」、「音量」スイツチ
24を押して「オンリヨー」又は「ポリユーム」
と発声する「チヤンネル」スイツチ25を押す
と、第2図登録制御回路8は、モード切替信号a
を出力し、チヤンネル押ボタンスイツチ回路31
の出力を切替回路32を経て前記登録制御回路側
に切替える。これにより前記スイツチ回路31に
含まれる数値指定ボタン26―1,26―2…
(第4図)を押して「イチ」「ニ」…と発声する
と、それぞれの音声は入力部1、特徴抽出部2を
経て各制御内容(電源、音量チヤンネル1,2,
3,…)に対応するコードと共に標準パターンメ
モリー3に記憶される。 さて通常の認識モードでは、前述の制御音声が
入力し、特徴抽出フイルタ13―1,13―2…
13―Nにより抽出されたデジタル化された信号
列はRAM等の記憶メモリ19に記憶され、次い
でCPU18はこの記憶パターンと標準パターン
との差を、全ての標準パターンについて計算しそ
の差が最も小さい標準パターンを決定することに
より入力音声を特定する。一般に人間の話声は同
じ言語で発声してもその時間軸推移は常に同等と
は限らない為、第1図に示すが如き何らかの時間
軸調整回路が付加されなければならないことは周
知の通りである。第2図に於ては説明の都合上か
かる時間軸調整回路は省略している。 認識モードに於ける音声の取り込みは常時行な
われており、入力音声が途切れたとき即ちポーズ
期間に前述の認識計算が実行されそれ以前の入力
音声、パターンマツチング法により特定される。
この時入力音声について特定が可能となつた時、
即ち入力音声が何らかの標準パターンに許容され
得る誤差の範囲内で一致した時、CPU18は出
力制御回路33に対し、テレビ受信機の各該当制
御要素を制御すべく指示出力する。例えば「デン
ゲン・イリ(キリ)」という入力音声を認識した
とき出力制御回路33はテレビ受信機の電源回路
34をON―OFF制御する。又、「チヤンネル・
※※」(※※は1〜12までの数字)という入力音
声を認識したとき、出力制御回路33はチヤンネ
ル切替回路35に出力し、これによりチユーナ3
6を切替制御する。 ところで、音量の調整の為に本発明装置の被制
御音声機器はあらかじめ音量を数値表示する可視
的な表示器を備えていなければならない。連続可
変される音量を段階的数値表示(即ち、デジタル
表示)に替えるに適当なステツプ数は10前後であ
ろう。具体的な表示器としては、例えば7セグメ
ントの数値表示素子、あるいはステツプ数と同数
の発光素子(LEDなど)の一次元的配列などが
考えられる。ここではテレビ受信機の場合を例と
し、第4図に図示したチヤンネル表示ランプ27
―1,27―2…27―12を音量表示に兼用す
る方法を採用している。 図に於ける数字表示LED27―1,27―2,
…,27―12は第4図中にチヤンネル表示ラン
プとして図示されており通常チヤンネル切替回路
35の出力に応じANDゲード37―1,37―
2又は37―12、ORゲート38―1,38―
2…、又は38―12及び抵抗39―1,39―
2,…又は39―12を経ていずれか1つの
LEDが点灯、チヤンネル表示を行なつている。
即ち出力制御回路の音量レベル表示コントロール
信号b(詳細後述)は通常デジタル“0”レベル
であり、従がつて各ANDゲート37―1,37
―2…37―12を制御する。インバータ40の
出力はデジタル“1”レベルである。次に前述の
如く音声認識装置が例えば、「音量」に相当する
制御命令音声信号を認識した時、出力制御回路3
3は音量レベル表示コントロール信号bを一定期
間(数秒間)デジタル“1”レベル(今後Hレベ
ルと略す)とし、ゲート37―1,37―2…、
及び37―12を閉じると同時にANDゲート4
1―1,41―2及び41―12を開いて、ラツ
チ回路であるD―FF(D型フリツプフロツプ回
路)42―1,42―2…,42―4のQ出力の
B―D(2進―10進)変換回路43出力にもとず
き前記数字表示LED27―1、又は27―2、
…、又は27―12のいずれかを点灯させる。後
述するようにラツチ回路42―1,42―2,…
42―4は、その時点での音量レベルを2進表示
で保持している。従つてLED27―1,27―
2、…又は27―12はこの時点灯個数で音量レ
ベルを数値表示することになるもちろん7セグメ
ント表示を行つてもよいことは言を俟たない。引
き続き、音声認識装置が、音量レベルを1〜12ま
での段階の命令音声を認識したとき、出力制御回
路33は通常デジタル“0”レベル(以後Lレベ
ルと略す)である音量レベルラツチコントロール
信号cを短時間(D―FFがラツチ動作するのに
充分な時間)Hレベルとし、ORゲート44―
1,44―2…,44―4を経て前述のD―FF
42―1,42―2…,42―4をクロツクす
る。同時に、出力制御回路33は、CPU18に
て比較認識した音量レベルを2進コードで、音量
レベル信号d1,d2,…,d4として出力し、前述の
音量レベルラツチコントロール信号により開く
ANDゲート45―1,45―2,…,45―4、
及び、ORゲート46―1,46―2,…,46
―4及びラツチ回路42或は50がクロツクの立
下りをD入力としてラツチすることを確実にする
ためのインバータ47―1,47―2,…47―
4,48―1,48―2,…,48―4を経てD
―FF42―1,42―2,…又は42―4にD
入力せしめる。音量レベル信号d1,d2,…,d4の
出力状態を保持したラツチ回路D―FF,42―
1,42―2,…又は42―4のQ出力によつ
て、前述の如く音声認識した音量レベルが数字表
示LED27―1,27―2,…又は27―12
により点灯表示される。音量レベルラツチコント
ロール信号cは、同様にORゲート49を経て状
態保持回路であるD―FF50にクロツク入力す
るが、この時ORゲート51の出力がLレベルで
あれば、ワンシヨツト回路52の出力もLレベル
であるのでインバータ47―5と48―5を経た
D入力端子はLレベルであり、従がつて該D―
FFのQ出力は0、(=1)となる。この結果ア
ナログスイツチ53が閉じ、D―FF50の出
力が1なのでANDゲート54―1,54―2,
…54―12が前記2進変換回路43の出力であ
る音量レベルに応じてアナログスイツチ55―
1,55―2,…,又は55―12のいずれかが
開く。一方、テレビ受信機の音声FM復調回路5
6の出力は初段の音声増巾回路57、可変抵抗器
58を経てその可変端子出力が更に音量調整ボリ
ユーム59又は抵抗器60―1,60―2,…6
0―11より成る分圧回路(或は減衰回路若しく
は可変利得回路でも可)、アナログスイツチ53
又はアナログスイツチ55―1,55―2,…5
5―12のいずれかを経由し、音声出力増巾器6
1より増巾せられスピーカ等音声出力器62より
音声出力するよう構成されているので、前述のア
ナログスイツチ55―1,55―2…,55―1
2のいずれかが開く場合には、それより抵抗器6
0―1,60―2,…,60―11により分圧さ
れた適当な音量レベルが設定される。音量レベル
コントロール信号bは数秒後(指令者が制御完了
を確認できる時間経過後)Lレベルに復帰し、従
がつて数字表示LED27―1,27―2,…,
27―12は音量レベル表示よりチヤンネル表示
に復帰するが、音量レベルはラツチ回路42―
1,42―2,…42―4の出力状態に対応する
レベルを維持する。前記可変抵抗器58は音量の
可変範囲を決めるものである。次に、音量調整ボ
リユーム59が手動で操作された時には、これと
連動し、一定電圧電源VRとアース間に接続され
た可変抵抗器63の出力変化を抵抗64、コンデ
ンサ65及び該抵抗器の両端が図示の如く両入力
端子に接続されたコンパレータ66により検出
し、続くマニユアル操作検出回路67が、マニユ
アル操作信号eを、ボリユーム調整操作が続いて
いる間中Hレベルで出力する。該信号の立上りに
より、ORゲート51を介してワンシヨツト回路
52が動作しパルスを発生するが、これを前述の
ラツチ回路50が保持し、Q=1(=0)とな
りアナログスイツチ53を開いて音量調整ボリユ
ーム59で決まる音量レベルにて音声出力増巾器
61はスピーカ62を駆動する。D―FF50の
Q=0出力よりANDゲート54―1,54―2,
…54―12は全て閉じ、従つてアナログスイツ
チ55―1,55―2,…,55―12が全べて
閉じることは明らかであろう。前記マニユアル操
作信号eにより、図示の通りANDゲート68―
1,68―2,68―4が開き定電圧VRにバイ
アスされたA―D変換器69の出力である音量レ
ベル(2進コード)を該e信号の立下りで前記ラ
ツチ回路42―1,42―2,…,42―4によ
り記憶保持する。これにより、音量調整ボリユー
ムで調整決定された音量レベルがデジタル化され
て該ラツチ回路に保持記憶される。前記ORゲー
ト51の入力の一方は、前記テレビ受信機の電源
回路34が出力する電源投入信号fに接続されて
おり、電源投入後一定時間発生するパルス信号f
により同様な音量レベルのラツチ保持とアナログ
スイツチ53による音声増巾回路の利得の決定が
行なわれる。 次に、前述の初期ミユーテイング回路の詳細に
ついて第3図を参照しつつ説明する。なお、第3
図において、第2図と共通部分には同じ符号(図
番)を付し、その説明を省略する。 上述の如く、音声指令認識モードにおける音声
信号の取り込みは、指令継続中常時行なわれてお
り入力音声が途切れたとき、即ち一定の指令単位
の間隔(ポーズ期間)にCPU18によつて認識
計算が実行され、それまでの入力音声指令がパタ
ーンマツチング法によつて特定される。 上述の如く、被制御機器であるTV受信機のス
ピーカ出力その他指令者以外の発する類似音によ
る誤動作をさけるために、最頗度指令語について
は、多少パターンマツチングの比較許容度を大き
くとる。 この時、入力音声について特定が可能となつた
時、即ち入力音声が何らかの標準パターンに許容
され得る誤差の範囲内で一致した時、CPU18
は出力制御回路33を制御してテレビ受信機の音
声出力を一定時間ミユーテイングさせる。第3図
の場合、出力制御回路33はテレビ受信機の音声
復調増巾回路56の出力増巾トランジスタ57の
バイアスを落すことにより、該トランジスタのコ
レクタよりコンデンサ70を介して接続されたス
ピーカ62の音声出力を停止させる。尚、前記音
声回路56の出力側に接続されたイヤホーン60
回路に対してはミユーテイングは不必要である。
通常制御命令言語は例えば「デンゲン」・「イリ」、
「デンゲン」・「キリ」、「チヤンネル」・「イチ」、
「チヤンネル」・「ニ」のように複数の単語の連続
により構成されているので、例えば「チヤンネ
ル」という入力音声を認識したときスピーカ音声
はミユーテイングされ以後の「イチ」又は「ニ」
の音声入力はテレビ受信機が発生する音が無くな
るためSN比はきわめて向上し、認識率はきわめ
て向上する。電源の入・切チヤンネル変更、音量
変更いずれの制御内容からも、かかる音声のミユ
ーテイングは機能上の欠点とはならない。尚第3
図の具体例では音量の変更は、「オンリヨー」・
「サン」(音量3)などのようにチヤンネル同様12
段階指定すること(従つてチヤンネル表示装置を
一時的に音量表示装置として併用すること)も可
能である。入力音声認識の結果にもとづき出力制
御回路33はテレビ受信機の電源回路34、チヤ
ンネル切替回路35又は音声回路56にそれぞれ
制御出力することは言うまでも無い。 第3図の実施例を併用すれば音声認識装置を備
えたテレビ受信機等音声機器の音声出力回路に該
音声認識装置の出力制御回路が作用して、入力音
声を感知した時音声機器の出力音声を適当なレベ
ルにまで減衰させることにより以後の入力音声の
SN比を増大させるものであり、従つてこの種音
声認識装置の認識率を向上せしめるにきわめて有
効である。 本発明に依れば、音声指令によつて音量の段階
的制御が可能となる。また、音量調整ボリユーム
により手動制御を行うと音声指令による音量の段
階的制御を中断して音量を連続的に制御すること
が出来る。
制御装置に係り、特に音声によつて音量の段階的
制御を、手動によつて音量の連続的制御を行うも
のに関する。 指令者〔或は操作者、以下、肉声を原情報とし
て被制御装置(例えばテレビジヨン受像機等)を
遠隔的に制御する者を指す。〕の指令(或は指示)
内容(音声信号)を標本化し且つ量子化すること
によつて標準(デジタル信号)パターンとして予
め記憶しておき、後に発せられる音声指示内容
(音声信号)を標本化した後量子化し、必要に応
じて時間軸の調整を行つてデジタル化した後
RAM等のメモリに一時的に記憶し、前記標準パ
ターンとの比較により、一定の許容値をもつて合
致した時、オン・オフ制御を行うことが提唱され
ている。 このような音声認識手段としては例えば第1図
の如く、入力音声を電気信号に変換する音響―電
気信号変換器(例えばマイクロフオン)を含む入
力部1、音声信号の特徴を抽出する、特徴抽出部
2、あらかじめ登録された音声特徴の標準パター
ンを記憶する、標準パターン記憶部3、入力音声
から抽出された特徴パターンと標準パターンとを
比較し、入力音声を特定する認識処理部4、認識
結果にもとづき例えばテレビ受信機の電源、チヤ
ンネル、音量等を制御する出力制御部5を主な構
成要素とし、これに認識率を向上させる為の入力
信号振巾正規化回路6、時間軸調整部7、あらか
じめ音声特徴の標準パターンを登録する為の登録
制御部8が付加される。 音声の特徴を抽出するパラメータとしては、周
波数スペクトル分布、相関関数、零交差数、フオ
ルマント周波数或いは線型予測係数など多くの方
法が考えられるが、これらのうち音声の周波数ス
ペクトルを複数の周波数フイルタにより分離抽出
し標準パターンとの相関を調べるいわゆるフイル
タバンク方式は比較的簡単な構成で高い認識率を
得ることが出来る方法としてよく用いられてい
る。このような音声による制御装置の制御内容と
しては電源の入切、チヤンネルや局番の変更指
定、音量の変更などがあり、例えば電源について
は「デンゲン・イリ(キリ)」などと発声制御で
きるが音量についてはもともとアナログ的な連続
可変制御である為音声による適当な制御方法が提
案されていない。 本発明は、このようなアナログ量である音量
を、音声にて数値指示し、その内容を音声識別装
置によつて判別して、例えば10進値として取り出
し、複数の可変減衰器或は可変利得増巾器等の組
み合せを変更することによつて前記音量のレベル
を段階的に制御出来、且つボリユームにより連続
的に制御出来るものである。 以下、本発明の詳細を要部回路ブロツクダイア
グラムを表わす第2図及び第3図を参照しつつ説
明する。 この実施例においては、音声認識のための特徴
パラメータとしてフイルタバンク方式(周波数ス
ペクトル方式)を採用した音声認識装置を組込ん
だテレビジヨン受信機の音声による制御装置を例
に採つて説明するが、被制御量がアナログ量であ
れば、被制御装置は選ばない。 通常機器の前面に取りつけられる入力部1は有
指向性及び無指向性の2つのマイクロフオン10
と11の図示の如き差動接続と増巾器12により
構成される。即ち有指向性マイクロフオン10に
対し無指向性マイクロフオン11は逆位相接続さ
れており、従つて指向特性範囲外からの音声信
号、即ち制御命令音声以外の信号は相殺され、指
向特性範囲内の制御命令音声のSN比はこれによ
つて高められる。その際、TV受像機等のスピー
カから流れる音声中の指令類似語による誤動作を
防止するために、重要語(最頗度語)「デンゲン」
或は「パワー」、「チヤンネル」、「オンリヨー」又
は「ボリユーム」等の指令(注、これらの用語に
ついては、識別のための許容値を大きく取つてあ
る)が識別された際には、第3図に別途要部回路
図として開示せる如きいわゆる初期ミユーテイン
グ回路を設けておき、一時的にスピーカ出力を断
つか若しくは大巾に減衰せしめる。この点につい
ては後に詳述する。振巾正規化機能を併せ特徴抽
出部2は、複数個のフイルタ13―1,13―2
…13―N及び入力信号の全振巾を検知するレベ
ル検出回路14、各フイルタの出力をデジタル信
号に変換するA―D(アナログ―デジタル)変換
器15、該A―D変換器に前置され前記各フイル
タ出力と前記レベル検出回路14出力との比をと
ることにより、フイルタ出力振巾を正規化するア
ナログ割算器等によつて構成された振巾正規化回
路16、更に該振巾正規化回路と前記フイルタ群
との間に挿入され、該フイルタの各出力の接続を
切り替えるマルチプレクサ17によつて構成され
る。斯る構成により前記入力部1から入力した音
声信号の各フイルタ成分が適当な時間間隔(多く
の場合10ミリ秒前後)で順次サンプリング標本化
され、更に各サンプリング値を量子化することに
よつてデジタルコードに変換された後、マイクロ
コンピユータ若しくは中央処理装置(CPU)1
8のI/Oポート(図示せず)を経て、記憶メモ
リー19(通常RAM:ランダムアクセスメモ
リ)に記憶される。 前記A―D変換の過程において、標本化された
各量を量子化する際、一様量子化することもでき
るが、別途手動調整手段を設ける際には、段階的
にその調整器の制御指示量(例えばボリユームの
回転角)と制御レベルとの関係に合わせて非直線
的に量子化を計ることもできる。 CPU(中央処理装置)18には別の標準パター
ンメモリ3が接続されており、予め指令者の音声
指令(制御命令が、標本化され量子化された形で
その制御内容を指定するコードと共に記憶されて
いる。制御命令音声(音声による指令)の標準パ
ターンメモリへの登録は、例えばテレビ受信機の
制御の場合には次の様に行なう。第4図はテレビ
受信機のコントロールパネルの1例であり、入力
マイク20、登録モードスイツチ21指令者を選
択する指令者(話者)番号指定スイツチ1,22
―1同2,22―2…、制御命令指定スイツチ電
源のオン、オフ切替、音量変更、チヤンネル切替
に各対応してそれぞれ「電源」指定スイツチ23
「音量」指定スイツチ24「チヤンネル」指定ス
イツチ25として、又音量及びチヤンネル指定を
行なう数字ボタン26―1,26―2,26―
3,…26―11,26―12が各対応する表示
ランプ27―1,27―2,…27―12と共に
配設されている。又下部の「OK」表示ランプ2
8は認識又は登録が良好に完了したとき、
「REPEAT」表示ランプ29は同じく不良であつ
たときそれぞれ点灯表示するものである。かかる
登録制御部30を用いて標準パターンを登録する
には、まず登録スイツチ21を押して登録モード
とし、次に話者番号を同指定スイツチ22―1又
は22―2…にて指定した上で、以下順次「電
源」スイツチ23を押して例えば「デンゲン」あ
るいは「パワー(POWER)」、「音量」スイツチ
24を押して「オンリヨー」又は「ポリユーム」
と発声する「チヤンネル」スイツチ25を押す
と、第2図登録制御回路8は、モード切替信号a
を出力し、チヤンネル押ボタンスイツチ回路31
の出力を切替回路32を経て前記登録制御回路側
に切替える。これにより前記スイツチ回路31に
含まれる数値指定ボタン26―1,26―2…
(第4図)を押して「イチ」「ニ」…と発声する
と、それぞれの音声は入力部1、特徴抽出部2を
経て各制御内容(電源、音量チヤンネル1,2,
3,…)に対応するコードと共に標準パターンメ
モリー3に記憶される。 さて通常の認識モードでは、前述の制御音声が
入力し、特徴抽出フイルタ13―1,13―2…
13―Nにより抽出されたデジタル化された信号
列はRAM等の記憶メモリ19に記憶され、次い
でCPU18はこの記憶パターンと標準パターン
との差を、全ての標準パターンについて計算しそ
の差が最も小さい標準パターンを決定することに
より入力音声を特定する。一般に人間の話声は同
じ言語で発声してもその時間軸推移は常に同等と
は限らない為、第1図に示すが如き何らかの時間
軸調整回路が付加されなければならないことは周
知の通りである。第2図に於ては説明の都合上か
かる時間軸調整回路は省略している。 認識モードに於ける音声の取り込みは常時行な
われており、入力音声が途切れたとき即ちポーズ
期間に前述の認識計算が実行されそれ以前の入力
音声、パターンマツチング法により特定される。
この時入力音声について特定が可能となつた時、
即ち入力音声が何らかの標準パターンに許容され
得る誤差の範囲内で一致した時、CPU18は出
力制御回路33に対し、テレビ受信機の各該当制
御要素を制御すべく指示出力する。例えば「デン
ゲン・イリ(キリ)」という入力音声を認識した
とき出力制御回路33はテレビ受信機の電源回路
34をON―OFF制御する。又、「チヤンネル・
※※」(※※は1〜12までの数字)という入力音
声を認識したとき、出力制御回路33はチヤンネ
ル切替回路35に出力し、これによりチユーナ3
6を切替制御する。 ところで、音量の調整の為に本発明装置の被制
御音声機器はあらかじめ音量を数値表示する可視
的な表示器を備えていなければならない。連続可
変される音量を段階的数値表示(即ち、デジタル
表示)に替えるに適当なステツプ数は10前後であ
ろう。具体的な表示器としては、例えば7セグメ
ントの数値表示素子、あるいはステツプ数と同数
の発光素子(LEDなど)の一次元的配列などが
考えられる。ここではテレビ受信機の場合を例と
し、第4図に図示したチヤンネル表示ランプ27
―1,27―2…27―12を音量表示に兼用す
る方法を採用している。 図に於ける数字表示LED27―1,27―2,
…,27―12は第4図中にチヤンネル表示ラン
プとして図示されており通常チヤンネル切替回路
35の出力に応じANDゲード37―1,37―
2又は37―12、ORゲート38―1,38―
2…、又は38―12及び抵抗39―1,39―
2,…又は39―12を経ていずれか1つの
LEDが点灯、チヤンネル表示を行なつている。
即ち出力制御回路の音量レベル表示コントロール
信号b(詳細後述)は通常デジタル“0”レベル
であり、従がつて各ANDゲート37―1,37
―2…37―12を制御する。インバータ40の
出力はデジタル“1”レベルである。次に前述の
如く音声認識装置が例えば、「音量」に相当する
制御命令音声信号を認識した時、出力制御回路3
3は音量レベル表示コントロール信号bを一定期
間(数秒間)デジタル“1”レベル(今後Hレベ
ルと略す)とし、ゲート37―1,37―2…、
及び37―12を閉じると同時にANDゲート4
1―1,41―2及び41―12を開いて、ラツ
チ回路であるD―FF(D型フリツプフロツプ回
路)42―1,42―2…,42―4のQ出力の
B―D(2進―10進)変換回路43出力にもとず
き前記数字表示LED27―1、又は27―2、
…、又は27―12のいずれかを点灯させる。後
述するようにラツチ回路42―1,42―2,…
42―4は、その時点での音量レベルを2進表示
で保持している。従つてLED27―1,27―
2、…又は27―12はこの時点灯個数で音量レ
ベルを数値表示することになるもちろん7セグメ
ント表示を行つてもよいことは言を俟たない。引
き続き、音声認識装置が、音量レベルを1〜12ま
での段階の命令音声を認識したとき、出力制御回
路33は通常デジタル“0”レベル(以後Lレベ
ルと略す)である音量レベルラツチコントロール
信号cを短時間(D―FFがラツチ動作するのに
充分な時間)Hレベルとし、ORゲート44―
1,44―2…,44―4を経て前述のD―FF
42―1,42―2…,42―4をクロツクす
る。同時に、出力制御回路33は、CPU18に
て比較認識した音量レベルを2進コードで、音量
レベル信号d1,d2,…,d4として出力し、前述の
音量レベルラツチコントロール信号により開く
ANDゲート45―1,45―2,…,45―4、
及び、ORゲート46―1,46―2,…,46
―4及びラツチ回路42或は50がクロツクの立
下りをD入力としてラツチすることを確実にする
ためのインバータ47―1,47―2,…47―
4,48―1,48―2,…,48―4を経てD
―FF42―1,42―2,…又は42―4にD
入力せしめる。音量レベル信号d1,d2,…,d4の
出力状態を保持したラツチ回路D―FF,42―
1,42―2,…又は42―4のQ出力によつ
て、前述の如く音声認識した音量レベルが数字表
示LED27―1,27―2,…又は27―12
により点灯表示される。音量レベルラツチコント
ロール信号cは、同様にORゲート49を経て状
態保持回路であるD―FF50にクロツク入力す
るが、この時ORゲート51の出力がLレベルで
あれば、ワンシヨツト回路52の出力もLレベル
であるのでインバータ47―5と48―5を経た
D入力端子はLレベルであり、従がつて該D―
FFのQ出力は0、(=1)となる。この結果ア
ナログスイツチ53が閉じ、D―FF50の出
力が1なのでANDゲート54―1,54―2,
…54―12が前記2進変換回路43の出力であ
る音量レベルに応じてアナログスイツチ55―
1,55―2,…,又は55―12のいずれかが
開く。一方、テレビ受信機の音声FM復調回路5
6の出力は初段の音声増巾回路57、可変抵抗器
58を経てその可変端子出力が更に音量調整ボリ
ユーム59又は抵抗器60―1,60―2,…6
0―11より成る分圧回路(或は減衰回路若しく
は可変利得回路でも可)、アナログスイツチ53
又はアナログスイツチ55―1,55―2,…5
5―12のいずれかを経由し、音声出力増巾器6
1より増巾せられスピーカ等音声出力器62より
音声出力するよう構成されているので、前述のア
ナログスイツチ55―1,55―2…,55―1
2のいずれかが開く場合には、それより抵抗器6
0―1,60―2,…,60―11により分圧さ
れた適当な音量レベルが設定される。音量レベル
コントロール信号bは数秒後(指令者が制御完了
を確認できる時間経過後)Lレベルに復帰し、従
がつて数字表示LED27―1,27―2,…,
27―12は音量レベル表示よりチヤンネル表示
に復帰するが、音量レベルはラツチ回路42―
1,42―2,…42―4の出力状態に対応する
レベルを維持する。前記可変抵抗器58は音量の
可変範囲を決めるものである。次に、音量調整ボ
リユーム59が手動で操作された時には、これと
連動し、一定電圧電源VRとアース間に接続され
た可変抵抗器63の出力変化を抵抗64、コンデ
ンサ65及び該抵抗器の両端が図示の如く両入力
端子に接続されたコンパレータ66により検出
し、続くマニユアル操作検出回路67が、マニユ
アル操作信号eを、ボリユーム調整操作が続いて
いる間中Hレベルで出力する。該信号の立上りに
より、ORゲート51を介してワンシヨツト回路
52が動作しパルスを発生するが、これを前述の
ラツチ回路50が保持し、Q=1(=0)とな
りアナログスイツチ53を開いて音量調整ボリユ
ーム59で決まる音量レベルにて音声出力増巾器
61はスピーカ62を駆動する。D―FF50の
Q=0出力よりANDゲート54―1,54―2,
…54―12は全て閉じ、従つてアナログスイツ
チ55―1,55―2,…,55―12が全べて
閉じることは明らかであろう。前記マニユアル操
作信号eにより、図示の通りANDゲート68―
1,68―2,68―4が開き定電圧VRにバイ
アスされたA―D変換器69の出力である音量レ
ベル(2進コード)を該e信号の立下りで前記ラ
ツチ回路42―1,42―2,…,42―4によ
り記憶保持する。これにより、音量調整ボリユー
ムで調整決定された音量レベルがデジタル化され
て該ラツチ回路に保持記憶される。前記ORゲー
ト51の入力の一方は、前記テレビ受信機の電源
回路34が出力する電源投入信号fに接続されて
おり、電源投入後一定時間発生するパルス信号f
により同様な音量レベルのラツチ保持とアナログ
スイツチ53による音声増巾回路の利得の決定が
行なわれる。 次に、前述の初期ミユーテイング回路の詳細に
ついて第3図を参照しつつ説明する。なお、第3
図において、第2図と共通部分には同じ符号(図
番)を付し、その説明を省略する。 上述の如く、音声指令認識モードにおける音声
信号の取り込みは、指令継続中常時行なわれてお
り入力音声が途切れたとき、即ち一定の指令単位
の間隔(ポーズ期間)にCPU18によつて認識
計算が実行され、それまでの入力音声指令がパタ
ーンマツチング法によつて特定される。 上述の如く、被制御機器であるTV受信機のス
ピーカ出力その他指令者以外の発する類似音によ
る誤動作をさけるために、最頗度指令語について
は、多少パターンマツチングの比較許容度を大き
くとる。 この時、入力音声について特定が可能となつた
時、即ち入力音声が何らかの標準パターンに許容
され得る誤差の範囲内で一致した時、CPU18
は出力制御回路33を制御してテレビ受信機の音
声出力を一定時間ミユーテイングさせる。第3図
の場合、出力制御回路33はテレビ受信機の音声
復調増巾回路56の出力増巾トランジスタ57の
バイアスを落すことにより、該トランジスタのコ
レクタよりコンデンサ70を介して接続されたス
ピーカ62の音声出力を停止させる。尚、前記音
声回路56の出力側に接続されたイヤホーン60
回路に対してはミユーテイングは不必要である。
通常制御命令言語は例えば「デンゲン」・「イリ」、
「デンゲン」・「キリ」、「チヤンネル」・「イチ」、
「チヤンネル」・「ニ」のように複数の単語の連続
により構成されているので、例えば「チヤンネ
ル」という入力音声を認識したときスピーカ音声
はミユーテイングされ以後の「イチ」又は「ニ」
の音声入力はテレビ受信機が発生する音が無くな
るためSN比はきわめて向上し、認識率はきわめ
て向上する。電源の入・切チヤンネル変更、音量
変更いずれの制御内容からも、かかる音声のミユ
ーテイングは機能上の欠点とはならない。尚第3
図の具体例では音量の変更は、「オンリヨー」・
「サン」(音量3)などのようにチヤンネル同様12
段階指定すること(従つてチヤンネル表示装置を
一時的に音量表示装置として併用すること)も可
能である。入力音声認識の結果にもとづき出力制
御回路33はテレビ受信機の電源回路34、チヤ
ンネル切替回路35又は音声回路56にそれぞれ
制御出力することは言うまでも無い。 第3図の実施例を併用すれば音声認識装置を備
えたテレビ受信機等音声機器の音声出力回路に該
音声認識装置の出力制御回路が作用して、入力音
声を感知した時音声機器の出力音声を適当なレベ
ルにまで減衰させることにより以後の入力音声の
SN比を増大させるものであり、従つてこの種音
声認識装置の認識率を向上せしめるにきわめて有
効である。 本発明に依れば、音声指令によつて音量の段階
的制御が可能となる。また、音量調整ボリユーム
により手動制御を行うと音声指令による音量の段
階的制御を中断して音量を連続的に制御すること
が出来る。
第1図は、音声認識装置の要部ブロツク図、第
2図は本発明の要部実施回路図、第3図は初期ミ
ユーテイング回路の一実施例を示す図、第4図は
被制御機器の操作パネルの正面図を表わす。 1…入力部、2…特徴抽出部、3…標準パター
ンメモリ、4…認識処理部、33…出力制御回
路、53…アナログスイツチ、55―1,55―
2…55―12…アナログスイツチ、59…音量
調整ボリユーム、66…コンバレータ(検出部)。
2図は本発明の要部実施回路図、第3図は初期ミ
ユーテイング回路の一実施例を示す図、第4図は
被制御機器の操作パネルの正面図を表わす。 1…入力部、2…特徴抽出部、3…標準パター
ンメモリ、4…認識処理部、33…出力制御回
路、53…アナログスイツチ、55―1,55―
2…55―12…アナログスイツチ、59…音量
調整ボリユーム、66…コンバレータ(検出部)。
Claims (1)
- 【特許請求の範囲】 1 音量を段階的に指令する音量指令音声を入力
し、その入力音声を電気信号に変換する入力部
と、前記電気信号の特徴を抽出する特徴抽出部
と、予め指令者の入力音声の特徴を標準パターン
として記憶する標準パターン記憶部と、前記特徴
抽出部で抽出された特徴パターンと前記標準パタ
ーンとを比較し、前記音量指令音声を特定する認
識処理部と、該認識処理部の認識結果にもとづい
て、音量を段階的に制御する出力制御部とから成
る制御装置において、 前記認識結果にもとづく音量値を保持するラツ
チ手段42―1…42―4と、 このラツチ手段に保持された音量値にもとづい
て音量が設定されるスピーカ62と、 このラツチ手段に保持された音量値を表示する
表示手段27―1,…27―12と、 手動調整され連続的に変動する音量調整ボリユ
ーム59と、 該音量調整ボリユームの出力変化を検出する検
出部67と、 該検出部の出力変化検出信号により前記ラツチ
手段から前記スピーカへの出力を遮断し、前記音
量調整ボリユームの出力による音量制御を可能に
したスイツチ部53,54―1,…,54―12
と、 前記出力変化検出信号により前記音量調整ボリ
ユームの値に略対応する段階的な音量値を前記ラ
ツチ手段が保持するよう設定する設定手段69,
44―1,…44―4と、 を備えることを特徴とするテレビジヨン受像機等
の音声による制御装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62142010A JPS6345908A (ja) | 1987-06-05 | 1987-06-05 | テレビジョン受像機等の音声による制御装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62142010A JPS6345908A (ja) | 1987-06-05 | 1987-06-05 | テレビジョン受像機等の音声による制御装置 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5923579A Division JPS55151234A (en) | 1979-05-14 | 1979-05-14 | Controller by voice of television receiver or the like |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6345908A JPS6345908A (ja) | 1988-02-26 |
| JPS649769B2 true JPS649769B2 (ja) | 1989-02-20 |
Family
ID=15305278
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62142010A Granted JPS6345908A (ja) | 1987-06-05 | 1987-06-05 | テレビジョン受像機等の音声による制御装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6345908A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0686963U (ja) * | 1993-05-27 | 1994-12-20 | 株式会社シーアイエー総合研究所 | 履歴書 |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2781450B2 (ja) * | 1990-07-17 | 1998-07-30 | シャープ株式会社 | 出力値調整装置 |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS4987984A (ja) * | 1972-12-27 | 1974-08-22 | ||
| JPS502401A (ja) * | 1973-05-07 | 1975-01-11 | ||
| JPS511503A (ja) * | 1974-06-27 | 1976-01-08 | Ngk Insulators Ltd | Tasoseramitsukukibanno seizoho |
| JPS5397186A (en) * | 1977-02-03 | 1978-08-25 | Matsushita Electric Ind Co Ltd | Controller |
| JPS53135242A (en) * | 1977-04-28 | 1978-11-25 | Sony Corp | Gain control and level display unit |
-
1987
- 1987-06-05 JP JP62142010A patent/JPS6345908A/ja active Granted
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0686963U (ja) * | 1993-05-27 | 1994-12-20 | 株式会社シーアイエー総合研究所 | 履歴書 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6345908A (ja) | 1988-02-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE4419901C2 (de) | Hörhilfegerät | |
| US7343023B2 (en) | Hearing prosthesis with automatic classification of the listening environment | |
| US6862359B2 (en) | Hearing prosthesis with automatic classification of the listening environment | |
| CA1123514A (en) | Speech analysis and synthesis apparatus | |
| EP0077194B1 (en) | Speech recognition system | |
| EP0031142B1 (en) | Food heating apparatus | |
| US4615680A (en) | Apparatus and method for practicing pronunciation of words by comparing the user's pronunciation with the stored pronunciation | |
| Strope et al. | A model of dynamic auditory perception and its application to robust word recognition | |
| US5199080A (en) | Voice-operated remote control system | |
| US4079199A (en) | Acoustic feedback detector and automatic gain control | |
| DE4029697A1 (de) | Sprachgesteuertes fernbedienungssystem | |
| JPS6117005B2 (ja) | ||
| EP0059650B1 (en) | Speech processing system | |
| US6316713B1 (en) | Sound pickup switching apparatus for a string instrument having a plurality of sound pickups | |
| JPS649769B2 (ja) | ||
| JPS6226480B2 (ja) | ||
| JPS6259927B2 (ja) | ||
| EP0633658A2 (en) | Voice activated transmission coupled AGC circuit | |
| US4158751A (en) | Analog speech encoder and decoder | |
| KR0170140B1 (ko) | 가정자동화기기의 음성인식장치 | |
| RU75074U1 (ru) | Комплексная система автоматического распознавания речевых сигналов | |
| KR20000032269A (ko) | 음향 기기의 음성인식장치 | |
| CN1117345C (zh) | 利用语音指令来控制电子装置的语音处理器 | |
| KR100365271B1 (ko) | 자동차의전화기를이용한음성인식장치및그제어방법 | |
| JPS6211079Y2 (ja) |