JP2000089792A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JP2000089792A JP2000089792A JP10255847A JP25584798A JP2000089792A JP 2000089792 A JP2000089792 A JP 2000089792A JP 10255847 A JP10255847 A JP 10255847A JP 25584798 A JP25584798 A JP 25584798A JP 2000089792 A JP2000089792 A JP 2000089792A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- input
- time
- detection
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Analogue/Digital Conversion (AREA)
Abstract
精度および音声認識精度の向上を図るのに好適な音声認
識装置を提供する。 【解決手段】 音声を入力する音声入力回路120と、
音声入力回路120に音声が入力されたことを検出する
CMOSロジック132と、CMOSロジック132の
検出結果に基づいて音声入力回路120に入力される音
声の認識を開始するCPU130と、を備え、CMOS
ロジック132は、音声入力回路120からの入力信号
が所定レベルを挟んで変化した回数をカウントし、その
カウント回数が所定数以上であるときは、音声入力回路
120に音声が入力されたと判定するようになってい
る。
Description
声認識装置に係り、特に、消費電流の低減化を図るとと
もに、音声検出精度または音声認識精度の向上を図るの
に好適な音声認識装置に関する。
野で実用化されてきている。この種の機器は、スイッチ
を入れて初めて認識動作を開始することで十分な機能を
果たすものがあるが、音声が入力されると、直ちに音声
認識を開始してその認識結果に基づいた動作を行うとい
うように、常に、音声入力を待ち状態としておく必要の
あるものもある。
を問い合わせると現在時刻を応答する時計などがある。
この種の機器は、電池で動作するものがほとんどであ
り、また、機器の小型化、軽量化を考えたとき、電池は
小容量のものを使用することが望ましく、かつ、長時
間、電池交換をしないで済むことが望まれる。
待ち状態としておく必要があるため、待ち状態において
も、常に電流が消費されることになり、その消費電流を
いかに小さく抑えるかが大きな課題である。
くつかの音声認識装置が提案されている。例えば、従来
の音声認識装置としては、特開昭58-55990号公報に開示
されたもの(以下、第1の従来例という。)がある。こ
れは、入力音声をアンプにより増幅して出力する音声入
力回路と、音声入力回路に音声が入力されたことを検出
する音声検出回路と、音声入力回路からの入力音声を認
識する音声認識回路と、を備え、音声検出回路により、
音声入力回路に音声が入力されたと検出されたときは、
音声認識回路に電力を供給するようになっているもので
ある。この音声検出回路では、音声入力回路からの入力
信号が所定レベル以上か否かを判定し、入力信号が所定
レベル以上であると判定したときに、音声入力回路に音
声が入力されたと検出する。
入力されない間は、音声認識回路に電力が供給されない
ので、音声入力待ち状態における消費電流を低減するこ
とができる。
開平1-93794 号公報に開示されたもの(以下、第2の従
来例という。)がある。これは、入力音声をアンプによ
り増幅して出力する音声入力回路と、音声入力回路から
の入力信号が所定レベル以上であるときに信号を出力す
る音声検出回路と、音声検出回路からの信号が入力され
てから所定時間が経過するまでの間信号を出力するタイ
マと、タイマからの信号の発生中オンとなる電源と、電
源からの電力により駆動しかつ音声入力回路からの入力
音声を認識する音声認識回路と、を備えたものである。
入力されてから所定時間が経過するまでの間でしか、音
声認識回路に電力が供給されないので、音声入力待ち状
態における消費電流を低減することができる。
開平7-244494号公報に開示されたもの(以下、第3の従
来例という。)がある。これは、音声認識回路に供給す
るクロック信号の周波数が高いほど消費電流が大きくな
るという点に着目してなされたものであって、入力音声
をアンプにより増幅して出力する音声入力回路と、音声
入力回路からの入力信号における音声区間の特徴量を含
む特徴パターンデータを送出する前処理回路と、送出さ
れた特徴パターンデータと複数の音声に対するあらかじ
め格納済の基準パターンデータとの類似度の比較判定動
作をクロック信号に基づき行う音声認識回路と、音声入
力回路からの入力信号が所定レベル以上であることを検
出する音声検出回路と、音声認識回路の比較結果が所定
の音声候補でない場合もしくは音声検出回路の検出結果
から入力信号が一定時間以上所定レベル以下である場合
にはクロック信号の周波数を基準値よりも低下させるク
ロック制御回路と、を備えたものである。
定の音声候補でない場合や、所定レベル以上の音声信号
が一定時間以上入力されない場合は、音声認識回路に高
い周波数のクロック信号が供給されないので、音声入力
待ち状態における消費電流を低減することができる。
1、第2および第3の従来例にあっては、いずれも次の
ような共通の問題点があった。すなわち、第1、第2お
よび第3の従来例において、音声検出回路では、単に、
音声入力回路からの入力信号が所定レベル以上であるか
否かを判定することによって、音声入力回路に音声が入
力されたことを検出するようになっているため、例え
ば、単発的なノイズや低周波ノイズ、回路ドリフト等の
ハイレベルノイズの影響により、入力信号が所定レベル
以上になったときは、音声以外のものが入力されたにも
かかわらず、音声が入力されたと検出してしまう。した
がって、このような場合は、音声を認識する必要がない
のに認識動作が開始されてしまい、無駄な電流が消費さ
れることになる。
態と音声認識時とによらず、同一特性のアンプを用いて
いるため、こうしたことも、消費電流の増加を招く要因
となっていた。すなわち、音声認識時では、基準音声パ
ターンデータと入力信号とのマッチング処理を行うた
め、入力信号のすべての成分が必要となるのに対し、音
声入力待ち状態では、入力信号が所定レベル以上である
か否かを検出すれば足りるため、例えば、動作点よりも
ハイレベルの信号成分だけあればよく、必ずしも入力信
号のすべての成分を必要としない。したがって、音声認
識時に合わせて入力信号のすべての成分を得ようとし
て、例えば、動作点を電源電圧の1/2に設定してしま
うと、音声入力待ち状態では、不要な電流を消費するこ
とになる。
では、入力信号における必要な周波数帯域が異なる。す
なわち、音声認識時では、上記マッチング処理を行うこ
とから、音声に含まれるすべての周波数成分が必要であ
るのに対し、音声入力待ち状態では、音声が入力された
ことを単に検出すればよいので、音声に含まれる周波数
成分うち基本周波数成分だけがあればよい。したがっ
て、音声入力回路において、同一特性のアンプを用いて
いることは、音声入力待ち状態および音声認識時のいず
れかにおいて処理に最適な入力信号を得ることができ
ず、検出精度または認識精度の低下を招く要因ともなっ
ていた。
を解決することを課題としており、消費電流の低減化を
図るとともに、音声検出精度および音声認識精度の向上
を図るのに好適な音声認識装置を提供することを目的と
している。
載の音声認識装置は、音声認識時には高速のクロックを
用い、音声検出時には低速のクロックのみを用いる音声
認識装置であり、音声信号の処理に、音声認識時にはA
/Dコンバータを用い、音声検出時にはC−MOSロジ
ックを用いることを特徴とする。このような構成によ
り、音声認識時以外はC−MOSロジックを用いるの
で、さらに消費電力を低減することができる。
識装置は、音声認識時には高速のクロックを用い、音声
検出時には低速のクロックのみを用いる音声認識装置で
あり、音声認識時には連続的にマイクと増幅回路を動作
させ、音声検出時には間欠的にマイクと増幅回路を動作
させることを特徴とする。このような構成により、音声
認識時以外は間欠的にしか電力が消費されないので、消
費電力を一層低減することができる。
声がある程度決まった帯域の周波数を有していること、
およびハイレベルノイズが比較的音声帯域外の周波数を
有していることに着目し、音声帯域にある音のみを音声
認識の対象とすれば、音声とハイレベルノイズとをある
程度区別することができることを見いだした。
本発明に係る請求項3記載の音声認識装置は、音声を入
力する音声入力手段と、前記音声入力手段に音声が入力
されたことを検出する音声検出手段と、前記音声検出手
段の検出結果に基づいて前記音声入力手段に入力される
音声の認識を開始する音声認識手段と、を備えた音声認
識装置において、前記音声検出手段は、前記音声入力手
段からの入力信号が所定レベルを挟んで変化した回数に
基づいて、前記音声入力手段に音声が入力されたことを
検出するようになっている。
何らかの音が入力されると、音声検出手段により、音声
入力手段からの入力信号が所定レベルを挟んで変化した
回数に基づいて、音声入力手段に音声が入力されたこと
が検出され、音声認識手段により、音声検出手段の検出
結果に基づいて、音声入力手段に入力される音に対して
音声認識が開始される。
値をもつレベルに限らず、零レベルまたは音声入力手段
の動作点であってもよい。また、「所定レベルを挟んで
変化した」とは、所定レベル以下から所定レベル以上へ
の変化、または所定レベル以上から所定レベル以下への
変化をいう。
認識装置は、請求項3記載の音声認識装置において、前
記音声検出手段は、所定時間内において前記入力信号が
前記所定レベルを挟んで変化した回数をカウントするカ
ウント手段と、前記カウント手段のカウント回数が所定
数以上であるときは前記音声入力手段に音声が入力され
たと判定する判定手段と、を有する。
何らかの音が入力されると、カウント手段により、所定
時間内において音声入力手段からの入力信号が所定レベ
ルを挟んで変化した回数がカウントされる。カウントの
結果、判定手段により、カウント手段のカウント回数が
所定数以上であるときは、音声入力手段に音声が入力さ
れたと判定される。
除去するように、所定時間および所定数を設定すれば、
音声入力手段に音声が入力されると、カウント手段によ
り、所定時間内において入力信号が所定レベルを挟んで
変化した回数がカウントされるが、入力されたものが音
声帯域にある音であるので、カウント手段のカウント回
数が所定数以上となって、判定手段により、音声入力手
段に音声が入力されたと判定される。これに対して、音
声入力手段に音声帯域よりも低い周波数の音が入力され
ると、カウント手段により、所定時間内において入力信
号が所定レベルを挟んで変化した回数がカウントされる
が、入力されたものが音声帯域よりも低い周波数の音で
あるので、カウント手段のカウント回数が所定数以上と
ならず、判定手段により、音声入力手段に音声が入力さ
れたと判定されない。
認識装置は、請求項3記載の音声認識装置において、前
記音声検出手段は、所定時間内において前記入力信号が
前記所定レベルを挟んで変化した回数をカウントするカ
ウント手段と、前記カウント手段のカウント回数が所定
の範囲内であるときは前記音声入力手段に音声が入力さ
れたと判定する判定手段と、を有する。
何らかの音が入力されると、カウント手段により、所定
時間内において音声入力手段からの入力信号が所定レベ
ルを挟んで変化した回数がカウントされる。カウントの
結果、判定手段により、カウント手段のカウント回数が
所定の範囲内であるときは、音声入力手段に音声が入力
されたと判定される。
るように、所定時間および所定の範囲を設定すれば、音
声入力手段に音声が入力されると、カウント手段によ
り、所定時間内において入力信号が所定レベルを挟んで
変化した回数がカウントされるが、入力されたものが音
声帯域にある音であるので、カウント手段のカウント回
数が所定の範囲内となって、判定手段により、音声入力
手段に音声が入力されたと判定される。これに対して、
音声入力手段に音声帯域外の周波数の音が入力される
と、カウント手段により、所定時間内において入力信号
が所定レベルを挟んで変化した回数がカウントされる
が、入力されたものが音声帯域外の周波数の音であるの
で、カウント手段のカウント回数が所定の範囲内となら
ず、判定手段により、音声入力手段に音声が入力された
と判定されない。
段からの入力信号が動作点を離れて電源電圧または接地
電圧に張りついたままの状態となることが稀に発生す
る。請求項3ないし5記載の発明では、音声入力手段か
らの入力信号が所定レベルを挟んで何回変化したかによ
って、音声入力手段に入力される音の周波数を擬似的に
検出するようにしているが、例えば、音声入力手段に高
周波のハイレベルノイズが入力され、その入力信号が所
定時間内の途中で動作点を離れて電源電圧または接地電
圧に張りついたままの状態となった場合であって、しか
もその入力信号が所定レベルを挟んで変化した回数が所
定の範囲内となった場合は、音声認識手段が音声認識を
開始してしまうことになる。したがって、こうした場合
においては、音声以外の入力信号であることが明らかな
ので、音声認識手段が音声認識を開始してしまうのを避
けたい。
源電圧または接地電圧に張りついているために、音声の
入力信号に比較して、所定レベルよりもハイレベルにな
っている時間、または所定レベルよりもローレベルとな
っている時間が長くなるということができる。
決するために、本発明に係る請求項6記載の音声認識装
置は、請求項3ないし5記載の音声認識装置において、
前記音声検出手段は、さらに、前記入力信号が前記所定
レベルよりもハイレベルとなっている時間またはローレ
ベルとなっている時間に基づいて、前記音声入力手段に
音声が入力されたことを検出するようになっている。
何らかの音が入力されると、音声検出手段により、音声
入力手段からの入力信号が所定レベルよりもハイレベル
になっている時間、または所定レベルよりもローレベル
になっている時間に基づいて、音声入力手段に音声が入
力されたことが検出される。
認識装置は、請求項6記載の音声認識装置において、前
記音声検出手段は、前記入力信号が前記所定レベルより
もハイレベルであるかまたはローレベルであるかを所定
周期で検出する検出手段と、所定時間内において前記検
出手段がハイレベルであると検出した回数またはローレ
ベルであると検出した回数をカウントする第2のカウン
ト手段と、前記第2のカウント手段のカウント回数が所
定数以上であるときは前記音声入力手段に音声が入力さ
れていないと判定する第2の判定手段と、を有する。
何らかの音が入力されると、検出手段により、音声入力
手段からの入力信号が所定レベルよりもハイレベルであ
るかまたはローレベルであるかが所定周期で検出される
とともに、第2のカウント手段により、所定時間内にお
いて検出手段がハイレベルであると検出した回数または
ローレベルであると検出した回数がカウントされる。カ
ウントの結果、第2の判定手段により、第2のカウント
手段のカウント回数が所定数以上であるときは、音声入
力手段に音声が入力されていないと判定される。
と、第2のカウント手段により、所定時間内においてハ
イレベルの回数またはローレベルの回数がカウントされ
るが、入力信号が電源電圧または接地電圧に張りついて
いるので、第2のカウント手段のカウント回数が所定数
以上となって、第2の判定手段により、音声入力手段に
音声が入力されていないと判定される。なお、音声入力
手段に音声が入力されると、第1のカウント手段によ
り、所定時間内においてハイレベルの回数またはローレ
ベルの回数がカウントされるが、入力信号が動作点を基
準として振動するので、第2のカウント手段のカウント
回数が所定数以上とならず、第2の判定手段により、音
声入力手段に音声が入力されていないと判定されない。
識装置は、入力した音声を演算増幅器により増幅して出
力する音声入力手段と、前記演算増幅器からの入力信号
に基づいて前記音声入力手段に音声が入力されたことを
検出する音声検出手段と、前記音声検出手段の検出結果
に基づいて前記入力信号に対する音声認識を開始する音
声認識手段と、を備えた音声認識装置において、前記音
声検出手段の検出結果に基づいて、前記演算増幅器の特
性を変更するようになっている。
何らかの音が入力されると、演算増幅器により、入力さ
れた音が増幅されて出力される。そして、音声検出手段
により、演算増幅器の特性に基づき増幅された入力信号
に基づいて、音声入力手段に音声が入力されたことが検
出され、音声検出手段の検出結果に基づいて、演算増幅
器の特性が変更されるとともに、変更された演算増幅器
の特性に基づき増幅された入力信号に対する音声認識が
開始される。したがって、音声検出時と音声認識時とで
は、演算増幅器に対して異なる特性が設定される。
性」とは、動作点、増幅率、時定数等をいう。
認識装置は、請求項8記載の音声認識装置において、前
記音声検出手段の検出結果に基づいて、前記演算増幅器
の動作点を変更するようになっている。
検出結果に基づいて、演算増幅器の動作点が変更され
る。したがって、音声検出時と音声認識時とでは、演算
増幅器に対して異なる動作点が設定される。
声認識装置は、請求項8または9記載の音声認識装置に
おいて、前記音声検出手段の検出結果に基づいて、前記
演算増幅器の増幅率を変更するようになっている。
検出結果に基づいて、演算増幅器の増幅率が変更され
る。したがって、音声検出時と音声認識時とでは、演算
増幅器に対して異なる増幅率が設定される。
声認識装置は、請求項8ないし10記載の音声認識装置
において、前記音声検出手段の検出結果に基づいて、前
記音声検出手段の検出結果に基づいて、前記演算増幅器
の時定数を変更するようになっている。
検出結果に基づいて、演算増幅器の時定数が変更され
る。したがって、音声検出時と音声認識時とでは、演算
増幅器に対して異なる時定数が設定される。
声認識装置は、請求項3ないし11記載の音声認識装置
において、前記音声入力手段を間欠的に駆動するように
なっている。
間欠的に駆動させられる。例えば、0.1秒間を動作状
態として音声入力を可能とし、その後の0.5秒間を非
動作状態とするというように、動作状態と非動作状態と
を繰り返す間欠的な音声入力動作が行われる。このよう
な間欠駆動を行うことにより、音声入力待ち状態におけ
る消費電流が低減される。
を図面を参照しながら説明する。図1は、本発明に係る
音声認識装置の実施の形態を示す概略構成図である。
声認識装置を、図1に示すように、常に音声入力待ち状
態とし、音声が入力されると、直ちに音声認識を開始し
てその認識結果に基づいた動作を行う常時駆動型の音声
認識装置に適用したものである。
音声認識装置100は、マイクロホン110と、マイク
ロホン110が入力した音声をアンプにより増幅して出
力する音声入力回路120と、制御プログラムに基づい
て音声入力回路120からの入力信号を用いた所定の音
声認識処理を実行するCPU130と、所定領域にあら
かじめCPU130の制御プログラム等を格納している
ROM140と、ROM140等から読み出したデータ
やCPU130の演算過程で必要な演算結果を格納する
ためのRAM150と、CPU130からの音声信号を
アンプにより増幅してスピーカ170に出力する音声出
力回路160と、で構成されている。ここで、CPU1
30と、ROM140と、RAM150とは、データを
転送するためのデータバス199によりデータ授受可能
に相互に接続されている。
音声が入力されたことを検出するCMOSロジック13
2と、音声入力回路120からのアナログの入力信号を
ディジタル信号に変換するA/Dコンバータ134と、
音声入力回路120をCMOSロジック132とA/D
コンバータ134とに接続切換するスイッチSWと、C
PU130の処理結果であるディジタル信号をアナログ
信号に変換して音声出力回路160に出力するD/Aコ
ンバータ136と、高速(例えば、20MHz)のクロ
ックを発振する高速クロック発振器138と、低速(例
えば、32KHz)のクロックを発振する低速クロック
発振器139と、CPU130の制御により電源電圧V
DD、接地電圧(GND)、オープン電圧(フローティン
グ)への接続切換を行う制御ポートP1 ,P2 ,P3 ,
MIC-GND と、が設けられている。各制御ポートP1 〜P
3 ,MIC-GND には、後段で詳述するが、音声入力回路1
20における回路素子の一端が接続されている。
20をCMOSロジック132に接続するようにスイッ
チSWが切り換えられる。この状態で、CMOSロジッ
ク132により音声が入力されたと検出されると、音声
入力回路120をA/Dコンバータ134に接続するよ
うにスイッチSWが切り換えられる。そして、A/Dコ
ンバータ134により、音声入力回路120からのアナ
ログの入力信号がディジタル信号に変換されてRAM1
50に格納され、格納されたディジタル信号に基づいて
所定の音声認識処理が実行される。なお、音声認識処理
の結果、その認識結果に基づいた所定の動作として、C
PU130からディジタルの音声信号が出力されると、
D/Aコンバータ136によりこれがアナログ信号に変
換されて音声出力回路160に出力される。
いて説明する。まず、通常は音声検出動作をしており、
マイクロフォン110および音声入力回路120の後述
するオペアンプAp は間欠動作をしている。そして、マ
イクロフォン110に音が入力されると、オペアンプA
p の出力が、一定期間内にC−MOSロジック132の
閾値を超えた回数が、規定の回数の範囲内かどうかを調
べ、規定の範囲内なら音声が入力されたと判定し、音声
認識動作を起動する。規定の範囲外なら音声は入力され
なかったと判定し、音声検出動作に戻る。音声認識動作
を起動するには、高速クロックを起動し、制御ポートを
音声認識動作に切り換える。音声認識動作中に、一定期
間内に音声の入力があれば、その音声を用いて音声認識
を行い、必要な動作をした後、さらに音声の入力を待
つ。音声認識動作中に、一定期間内に音声の入力がなけ
れば、制御ポートを音声検出動作に切り換え、高速クロ
ックを停止し、音声検出動作に戻る。
図面を参照しながら説明する。図3は、音声入力回路1
20の構成を示す回路図である。
に、マイクロホン110からの音声信号を増幅するオペ
アンプAP と、マイクロホン110の一端および電源電
圧VDDに両端を接続した抵抗R1 と、オペアンプAP の
非反転入力端子とマイクロホン110の一端との間に介
挿されたコンデンサC1 と、オペアンプAP の非反転入
力端子に一端を接続した抵抗R3 ,R2 と、オペアンプ
AP の反転端子に一端を接続したコンデンサC2 ,C3
および抵抗R4 と、コンデンサC2 の他端に一端を接続
した抵抗R5 と、コンデンサC3 の他端に一端を接続し
た抵抗R6 と、オペアンプAP の負帰還ループに介挿さ
れた抵抗R7 と、で構成されている。
抵抗R3 ,R6 の他端は、制御ポートMIC-GND に、抵抗
R2 の他端は、制御ポートP1 に、抵抗R4 の他端は、
制御ポートP2 に、抵抗R5 の他端は、制御ポートP3
に、それぞれ接続されている。なお、オペアンプAP の
電源入力端子は、それぞれ電源VDDおよび制御ポートMI
C-GND に接続されている。また、抵抗R2 ,R3 は、い
ずれも同抵抗値である。
詳細な構成を図面を参照しながら説明する。図4は、制
御ポートP1 〜P3 ,MIC-GND の切換制御の状態を示す
タイムチャートである。
声入力回路120がCMOSロジック132に接続され
ている音声検出時と、音声入力回路120がA/Dコン
バータ134に接続されている音声認識時とに応じて、
電源電圧VDD、GND、フローティングへの接続切換を
行うようになっている。音声検出時では、後段で詳述す
るが、音声入力回路120を間欠的に駆動するため、音
声入力回路120をオンにする音声入力回路オン時と、
音声入力回路120をオフにする音声入力回路オフ時
と、が存在する。したがって、各制御ポートP1 〜
P3 ,MIC-GND は、音声検出時において、さらに、音声
入力回路オン時と、音声入力回路オフ時とに応じて、上
記接続切換を行うようになっている。
示すように、音声入力回路オフ時では電源電圧VDDに、
音声入力回路オン時および音声認識時ではGNDに、そ
れぞれ接続切換するようになっており、制御ポートP1
は、音声入力回路オフ時および音声認識時では電源電圧
VDDに、音声入力回路オン時ではGNDに、それぞれ接
続切換するようになっている。また、制御ポートP2 ,
P3 は、音声入力回路オフ時では電源電圧VDDに、音声
入力回路オン時ではGNDに、音声認識時ではフローテ
ィングに、それぞれ接続切換するようになっている。
入力回路120は、音声入力回路オン時では図5に示す
ように、また音声認識時では図6に示すようになる。
入力回路120は、図5に示すように、オペアンプAP
と、抵抗R1 ,R7 と、コンデンサC1 〜C3 と、GN
Dに他端を接続した抵抗R2 〜R6 と、で構成される。
なお、マイクロホン110の他端は、GNDに接続され
ている。このとき、動作点VQ 、増幅率Af 、および時
定数Tk は、下式(1)〜(3)で示される。なお、下
式で、Rm ‖Rn は、Rm とRn の並列抵抗値を意味す
る。
6の値の小さいほうが時定数として支配
的になるという意味である。
0は、図6に示すように、オペアンプAP と、抵抗
R1 ,R7 と、コンデンサC1 ,C3 と、GNDに他端
を接続した抵抗R3 ,R6 と、電源電圧VDDに他端を接
続した抵抗R2 と、で構成される。なお、マイクロホン
110の他端は、GNDに接続されている。このとき、
動作点VQ 、増幅率Af 、および時定数Tk は、下式
(4)〜(6)で示される。 VQ = VDDR3 /(R2 +R3 ) = VDD/2 ∵R2 =R3 (4) Af ≒ (R6 +R7 )/R6 (5) Tk = C3 R6 (6) このように、音声検出時と音声認識時とでは、動作点V
Q 、増幅率Af 、および時定数Tk がそれぞれ異なる値
で設定可能となるので、抵抗R1 〜R7 およびコンデン
サC1 〜C3 の値は、音声検出時および音声認識時の両
方において最適な入力信号が得られるような値に設定し
ておく。なお、音声認識時でも、場面によって増幅率A
f や時定数Tk を変えたい場合は、C3 +R6 にC2 +
R5 を並列に接続することにより、それぞれの場面で最
適な特性を得ることができる。また、音声検出時でも、
いくつかのCRの組み合わせが考えられ、C2 +R5 は
使用せず、C3 +R6 にR4 を並列に接続するだけでも
よいし、R4 は使用せず、C3 +R6 にC2 +R5 を並
列に接続するだけでもよい。
タイムチャートである。この間欠動作では、一定の期間
ごとに各制御ポートP1 〜P3 ,MIC-GND は、電源電圧
VDD(プルアップ)、GND(プルダウン)への接続を
繰り返す。オペアンプAP 出力の基準動作点は0Vであ
るため、マイクロホン110がONのときのオペアンプ
AP の出力は0Vになる。オペアンプAP の出力は、回
路内の時定数Tk のため若干応答が遅れる。
声認識動作への切り換えを示すタイムチャートである。
間欠動作でマイクロフォン110がONのときに、規定
の音声入力があると、音声認識動作に切り換わる。その
とき、制御ポートMIC-GND はGND、制御ポートP1 は
電源電圧VDDに接続され、制御ポートP2 ,P3 は切り
離されるため、音声入力回路120は、図5に示すよう
な回路になる。オペアンプAP 出力の基準動作点は、電
源電圧VDDの1/2となる。
図である。音声認識時では、電源電圧VDDの1/2を中
心に、入力波形を歪みなく増幅した波形を出力する。こ
の波形をA/Dコンバータ134でA/D変換し、音声
認識に用いる。音声検出時では、0Vを基準に、入力波
形が半波整流された波形を出力する。この波形が、一定
期間内にC−MOSロジック132の閾値を越えた回数
を調べ、有効な音声かどうか判定する。
参照しながら説明する。図10および図11は、CPU
130で実行される処理を示すフローチャートである。
ユニットMPU等からなり、音声入力回路120に音声
が入力されたことを検出するときは、ROM140の所
定領域に格納されている所定のプログラムを起動させ、
図10のフローチャートに示す音声検出処理を実行する
一方、図11のフローチャートに示す間欠駆動処理を所
定周期で実行し、音声入力回路120を、所定時間(例
えば70ms)オンにし、所定時間(例えば、300m
s)オフにする動作を周期的に繰り返すことにより、間
欠的に駆動させるようになっている。
説明する。まず、CPU130において音声入力回路オ
ン時になると、ステップS100に移行して、低速クロ
ック発振器139を起動させることによりCPU130
を低速のクロックで動作させ、ステップS102に移行
して、音声入力回路120をCMOSロジック132に
接続するようにスイッチSWを切り換え、ステップS1
04に移行して、整数型の変数COUNT ,HIGH,LOW に
“0”を設定し、ステップS106に移行するようにな
っている。
0からの入力信号が所定レベルを挟んで変化したか否か
を判定し、所定レベルを挟んで変化したと判定されたと
き(Yes) は、ステップS108に移行して、変数COUNT
の値に“1”を加算し、ステップS110に移行する
が、そうでないと判定されたとき(No) は、そのままス
テップS110に移行する。このステップS106で
は、音声入力回路120からの入力信号を所定周期(例
えば、70ms中256点をとる周期、すなわち365
7Hz)でサンプリングし、1サンプリング前の値と現
在の値とを比較して、1サンプリング前の値が所定レベ
ル以上でありかつ現在の値が所定レベル以下であると
き、または1サンプリング前の値が所定レベル以下であ
りかつ現在の値が所定レベル以上であるときは、音声入
力回路120からの入力信号が所定レベルを挟んで変化
したと判定するようになっている。
回路120からの入力信号が所定レベルよりもハイレベ
ルであるか否かを判定し、所定レベルよりもハイレベル
であると判定されたとき(Yes) は、ステップS112に
移行して、変数HIGHに“1”を加算するが、そうでない
と判定されたとき(No) は、ステップS114に移行し
て、変数LOW に“1”を加算し、その後はいずれもステ
ップS116に移行するようになっている。このステッ
プS110では、ステップS106と同様に、音声入力
回路120からの入力信号を所定周期でサンプリング
し、現在の値が所定レベルよりもハイレベルであるか否
かを判定するようになっている。
回路120をオンにする所定時間(上記、70ms)が
経過したか否か、所定時間が経過したと判定されたとき
(Yes) は、ステップS118に移行して、変数COUNT の
値が所定数(例えば、32)以上であるか否かを判定
し、所定数以上であると判定されたとき(Yes) は、ステ
ップS120に移行するようになっている。このステッ
プS118では、例えば、音声入力回路120に音声が
入力されたときの変数COUNT の値を、所定数として設定
しておく。
定数以下であるか否かを判定し、所定数以下であると判
定されたとき(Yes) は、ステップS122に移行して、
変数LOW の値が所定数以下であるか否かを判定し、所定
数以下であると判定されたとき(Yes) は、ステップS1
24に移行するようになっている。このステップS12
0,S122では、例えば、音声入力回路120に音声
が入力されたときの変数HIGHまたは変数LOW の値を、所
定数として設定しておく。
器138を起動させることによりCPU130を高速の
クロックで動作させ、ステップS126に移行して、音
声入力回路120をA/Dコンバータ134に接続する
ようにスイッチSWを切り換え、ステップS128に移
行して、音声認識時の切換パターンとなるように各制御
ポートP1 〜P3 ,MIC-GND を接続切換し、ステップS
130に移行するようになっている。
0からの入力信号が所定時間内に少なくとも1回は所定
レベルよりもハイレベルとなったか否かを判定し、所定
時間内に所定レベルよりもハイレベルとなったと判定さ
れたとき(Yes) は、ステップS132に移行して、音声
入力回路120からの入力信号を用いた所定の音声認識
処理を実行し、一連の処理を終了して元の処理に復帰さ
せるが、そうでないと判定されたとき(No) は、そのま
ま一連の処理を終了して元の処理に復帰させるようにな
っている。このステップS130は、音声入力回路12
0からの入力信号が所定時間内に1回も所定レベルより
もハイレベルとならないときは、音声入力回路120に
音声が入力されていないものと判定するための処理であ
る。
数COUNT の値が所定数以上でないと判定されたとき(N
o) 、ステップS120の判定の結果、変数HIGHの値が
所定数以下でないと判定されたとき(No) 、ステップS
122の判定の結果、変数LOWの値が所定数以下でな
いと判定されたとき(No) はいずれも、ステップS
104に戻るようになっている。
果、音声入力回路120をオンにする所定時間が経過し
ていないと判定されたとき(No) は、ステップS106
に戻るようになっている。
ついて説明する。まず、CPU130において間欠駆動
処理が実行されると、ステップS200に移行して、ス
イッチSWの状態に基づいて現在が音声検出時であるか
否かを判定し、音声検出時であると判定されたとき(Ye
s) は、ステップS202に移行して、音声入力回路1
20をオンにする切換パターンとなるように各制御ポー
トP1 〜P3 ,MIC-GNDを接続切換し、ステップS20
4に移行するようになっている。
0をオンにする所定時間(上記、70ms)が経過した
か否かを判定し、所定時間が経過したと判定されたとき
(Yes) は、ステップS206に移行して、音声入力回路
120をオフにする切換パターンとなるように各制御ポ
ートP1 〜P3 ,MIC-GND を接続切換し、ステップS2
08に移行するようになっている。しかし、ステップS
204の判定の結果、所定時間が経過していないと判定
されたとき(No) は、ステップS204で所定時間が経
過するまで待機するようになっている。
0をオフにする所定時間(上記、300ms)が経過し
たか否かを判定し、所定時間が経過したと判定されたと
き(Yes) は、一連の処理を終了して元の処理に復帰させ
るが、所定時間が経過していないと判定されたとき(N
o) は、ステップS208で所定時間が経過するまで待
機するようになっている。
声検出時でないと判定されたとき(No) は、一連の処理
を終了して元の処理に復帰させるようになっている。
を参照しながら説明する。図12は、音声入力回路12
0からの入力信号を示すタイムチャートである。
れると、ステップS100において、低速のクロックで
CPU130が駆動させられ、ステップS102におい
て、音声入力回路120がCMOSロジック132に接
続されるとともに、ステップS200〜S208におい
て、音声入力回路120が間欠的に駆動させられる。こ
の間欠駆動中に音声入力回路オン時となると、制御ポー
トP1 〜P3 ,MIC-GND がいずれもGNDに接続切換さ
れる。
イクロホン110に音声が入力されると、オペアンプA
P により、マイクロホン110からの音声信号が、音声
検出時用に設定された動作点VQ 、増幅率Af 、時定数
TK に基づいて増幅され、CMOSロジック132に入
力される。例えば、動作点VQ についていえば、マイク
ロホン110からの音声信号は、動作点0Vを基準とし
て増幅される。なお、音声入力回路オン時と音声入力回
路オフ時とが切り換わる際は、抵抗R4 により、コンデ
ンサC2 ,C3 に充電された電荷が放電させられるの
で、高い応答性をもって動作点VQ が切り換わる。
路120がオンにされている所定時間内において、音声
入力回路120からの入力信号が所定レベルを挟んで変
化した回数(COUNT 値)、入力信号が所定レベルよりも
ハイレベルとなった回数(HIGH値)、および入力信号が
所定レベルよりもローレベルとなった回数(LOW 値)が
それぞれカウントされるが、マイクロホン110に音声
が入力されたことにより入力信号が音声帯域にあるの
で、図12(a)に示すように、入力信号が所定レベル
を挟んで変化した回数が所定数以上となり、かつ、入力
信号が所定レベルよりもハイレベルとなった回数および
所定レベルよりもローレベルとなった回数も所定数以下
となる。
入力されたと判定され、音声認識時となるので、ステッ
プS124において、高速のクロックでCPU130が
駆動させられ、ステップS126において、音声入力回
路120がA/Dコンバータ134に接続されるととも
に、制御ポートP1 が電源電圧VDDに、制御ポート
P2 ,P3 がフローティングに、制御ポートMIC-GND が
GNDに、それぞれ接続される。
アンプAP により、マイクロホン110からの音声信号
が、音声認識時用に設定された動作点VQ 、増幅率
Af 、時定数TK に基づいて増幅され、A/Dコンバー
タ134に入力される。例えば、動作点VQ についてい
えば、マイクロホン110からの音声信号は、動作点V
DD/2を基準として増幅される。なお、音声入力回路オ
ン時と音声認識時とが切り換わる際は、抵抗R4 によ
り、コンデンサC2 ,C3 に充電された電荷が放電させ
られるので、高い応答性をもって動作点VQ が切り換わ
る。
路120からのアナログの入力信号がディジタル信号に
変換され、RAM150に格納される。CPU130で
は、ステップS132において、RAM150に格納さ
れたディジタル信号に基づいて所定の音声認識処理が実
行される。音声認識処理の結果、その認識結果に基づい
た所定の動作として、CPU130からディジタルの音
声信号が出力されると、D/Aコンバータ136により
これがアナログ信号に変換され、音声出力回路160を
介してスピーカ170から出力される。
ば、マイクロホン110に低周波のハイレベルノイズが
入力されると、CMOSロジック132では、入力信号
が音声帯域よりも低い周波数帯域にあるので、図12
(b)に示すように、入力信号が所定レベルを挟んで変
化した回数が所定数以下となる。したがって、音声入力
回路120に音声が入力されていないと判定され、音声
認識時とならず、音声検出時が継続される。
ば、マイクロホン110に低レベルのノイズが入力され
ると、CMOSロジック132では、入力信号が音声帯
域であっても所定レベル以下であるので、図12(c)
に示すように、入力信号が所定レベルを挟んで変化した
回数が所定数以下となる。したがって、音声入力回路1
20に音声が入力されていないと判定され、音声認識時
とならず、音声検出時が継続される。
波のハイレベルノイズが入力され、その入力信号が音声
入力回路120がオンにされている所定時間内の途中で
動作点VQ を離れて電源電圧VDDに張りついたままの状
態となった場合であって、しかもその入力信号が所定レ
ベルを挟んで変化した回数が所定数以上となった場合に
ついて説明する。音声入力回路オン時において、マイク
ロホン110にこのような入力があると、CMOSロジ
ック132では、図12(d)に示すように、入力信号
が所定レベルを挟んで変化した回数が所定数以上となる
が、入力信号が所定レベルよりもハイレベルとなった回
数が所定数以上となる。したがって、音声入力回路12
0に音声が入力されていないと判定され、音声認識時と
ならず、音声検出時が継続される。なお、入力信号が所
定時間内の途中で動作点VQ を離れてGNDに張りつい
たままの状態となった場合は、CMOSロジック132
において、入力信号が所定レベルよりもローレベルとな
った回数が所定数以上となるので、同様に、音声認識時
とならず、音声検出時が継続される。
回路120と、音声入力回路120に音声が入力された
ことを検出するCMOSロジック132と、CMOSロ
ジック132の検出結果に基づいて音声入力回路120
に入力される音声の認識を開始するCPU130と、を
備え、CMOSロジック132は、音声入力回路120
からの入力信号が所定レベルを挟んで変化した回数をカ
ウントし、そのカウント回数が所定数以上であるとき
は、音声入力回路120に音声が入力されたと判定する
ようにしたから、入力信号が所定レベル以下となるとき
はもとより、低周波のハイレベルノイズの影響により入
力信号が所定レベル以上となっても、音声入力回路12
0に音声が入力されていないと判定される。したがっ
て、このような場合に、音声認識動作が開始されてしま
うのを防止することができるので、従来に比して、無駄
な電流の消費を抑制することにより、消費電流を低減す
ることができる。
が所定レベルを挟んで変化したか否かを検出することに
より、音声入力回路120からの入力信号の周波数を擬
似的に検出するようにしたから、CMOSロジック13
2を用いた簡易な構成とすることができ、音声検出精度
を向上しながらもコストの上昇を比較的抑えることがで
きる。
ベルよりもハイレベルであるかまたは所定レベルよりも
ローレベルであるかを所定周期で検出し、所定時間内に
おいて所定レベルよりもハイレベルであると検出した回
数および所定レベルよりもローレベルであると検出した
回数をカウントし、そのカウント回数が所定数以上であ
るときは、音声入力回路120に音声が入力されていな
いと判定するようにしたから、音声入力回路120から
の入力信号が動作点VQ を離れて電源電圧VDDまたはG
NDに張りついたままの状態となっても、音声入力回路
120に音声が入力されていないと判定される。したが
って、このような場合に、音声認識動作が開始されてし
まうのを防止することができるので、従来に比して、無
駄な電流の消費を抑制することにより、消費電流を低減
することができる。
をディジタル的に処理するために、A/Dコンバータ1
34が必要だが、A/Dコンバータ134は消費電流が
大きい。音声検出動作では、入力された信号が規定のレ
ベル以上かどうかを判定すればよいので、A/Dコンバ
ータ134の代わりに、C−MOSロジック132を用
いることにより、消費電力を減らすことができる。
10とオペアンプAP をOFFにするには、マイクロフ
ォン110のグランド側(MIC-GND)および各制御ポート
P1〜P3 を電源電圧VDDにプルアップすることによ
り、消費電力を減らすことができる。
は、オペアンプAP の抵抗とコンデンサを、CPU13
0の制御ポートP1 〜P3 により制御することにより行
う。この制御は、CPU130の制御ポートP1 〜P3
で直接制御しないくても、アナログスイッチ等で制御す
ることもできる。CPU130の制御ポートP1 〜P3
で直接制御する場合は、アナログスイッチ等が不要にな
るので、コストを安くすることができる。
果に基づいて、オペアンプAP の特性を変更するように
したから、音声検出時および音声認識時の両方において
最適な入力信号が得られるので、消費電流をさらに低減
することができるとともに、従来に比して、音声検出精
度および音声認識精度を向上することができる。
果に基づいて、オペアンプAP の動作点VQ を変更する
ようにしたから、消費電流をさらに低減することができ
る。さらに、CMOSロジック132の検出結果に基づ
いて、オペアンプAP の増幅率Af および時定数Tk を
変更するようにしたから、音声検出精度および音声認識
精度をさらに向上することができる。
いて音声入力回路120を間欠的に駆動するようにした
から、従来に比して、音声入力待ち状態における消費電
流を低減することができる。
振器139を起動させ、音声認識時では、高速クロック
発振器138を起動させるようにしたから、音声入力待
ち状態における消費電流を低減することができる。
コンデンサC2 ,C3 に、抵抗R4を並列接続して設け
たから、音声入力回路オン時と音声入力回路オフ時とを
切り換える際、または音声入力回路オン時と音声認識時
とを切り換える際に、高い応答性をもって動作点VQ を
切り換えることができる。
参照しながら説明する。図13は、本発明の第2の実施
の形態である音声入力回路120の構成を示す回路図で
ある。なお、上記第1の実施の形態と同一の部分につい
ては、同一の符号を付して説明を省略する。
声認識装置を、音声入力回路120におけるオペアンプ
AP の動作点VQ を上記第1の実施の形態とは異なる値
に設定する場合について適用したものである。
20は、図13に示すように、オペアンプAP と、マイ
クロホン110の一端および電源電圧VDDに両端を接続
した抵抗R1 と、オペアンプAP の非反転入力端子とマ
イクロホン110の一端との間に介挿されたコンデンサ
C1 と、オペアンプAP の非反転入力端子に一端を接続
した抵抗R2 ,R3 と、オペアンプAP の反転端子に一
端を接続したコンデンサC2 ,C3 および抵抗R4 と、
コンデンサC2 の他端に一端を接続した抵抗R5 と、コ
ンデンサC3 の他端に一端を接続した抵抗R6 と、オペ
アンプAP の負帰還ループに介挿された抵抗R7 と、で
構成されている。
に、マイクロホン110の他端および抵抗R6 の他端
は、制御ポートMIC-GND に、抵抗R2 の他端は、制御ポ
ートP1 に、抵抗R4 の他端は、制御ポートP2 に、抵
抗R5 の他端は、制御ポートP3 に、それぞれ接続され
ている。なお、抵抗R2 ,R3 は、いずれも同抵抗値で
ある。
詳細な構成を図面を参照しながら説明する。図14は、
制御ポートP1 〜P3 ,MIC-GND の切換制御の状態を示
すタイムチャートである。
に、音声入力回路オフ時では電源電圧VDDに、音声入力
回路オン時および音声認識時ではGNDに、それぞれ接
続切換するようになっており、制御ポートP1 は、音声
入力回路オフ時および音声入力回路オン時では電源電圧
VDDに、音声認識時ではGNDに、それぞれ接続切換す
るようになっている。また、制御ポートP2 は、音声入
力回路オフ時および音声入力回路オン時では電源電圧V
DDに、音声認識時ではフローティングに、それぞれ接続
切換するようになっており、制御ポートP3 は、音声入
力回路オフ時では電源電圧VDDに、音声入力回路オン時
ではGNDに、音声認識時ではフローティングに、それ
ぞれ接続切換するようになっている。
入力回路オン時では、音声入力回路120は、オペアン
プAP と、抵抗R1 ,R3 ,R7 と、コンデンサC1 〜
C3と、GNDに他端を接続した抵抗R5 ,R6 と、電
源電圧VDDに他端を接続した抵抗R2 ,R4 と、で構成
される。なお、マイクロホン110の他端は、GNDに
接続されている。このとき、動作点VQ 、増幅率Af 、
および時定数Tk は、下式(7)〜(9)で示される。
ンプAP と、抵抗R1,R3 ,R7 と、コンデンサ
C1 ,C3 と、GNDに他端を接続した抵抗R2 ,R6
と、で構成される。なお、マイクロホン110の他端
は、GNDに接続されている。このとき、動作点VQ 、
増幅率Af 、および時定数Tk は、下式(10)〜(12)
で示される。
Q 、増幅率Af 、および時定数Tk がそれぞれ異なる値
で設定可能となるので、抵抗R1 〜R7 およびコンデン
サC1 〜C3 の値は、音声検出時および音声認識時の両
方において最適な入力信号が得られるような値に設定し
ておく。
する。
のタイムチャートである。第1の実施の形態のポート制
御(図7)とは、制御ポートP1 ,P2 が常に電源電圧
VDDに接続されている点が異なる。オペアンプAp 出力
の基準動作点は、電源電圧VDDと等しくなるため、マイ
クロフォン110がONの時もオペアンプAp の出力
は、電源電圧VDDと等しくなる。したがって、見かけ
上、オペアンプAp の出力は、常に電源電圧VDDのよう
に見える。
音声認識動作への切り換えを示すタイムチャートであ
る。間欠動作でマイクロフォン110がONのときに、
規定の音声入力があると、音声認識動作に切り換わる。
そのとき、制御ポートMIC-GNDはGND、制御ポートP
1 はGNDに接続され、制御ポートP2 ,P3 は切り離
されるため、オペアンプAp 出力の基準動作点は、電源
電圧VDDの1/2となる。
す図である。音声認識時は、第1の実施の形態と同様で
ある。音声検出時では、電源電圧VDDを基準に、入力波
形が半波整流された波形を出力する。この波形が、一定
期間内にC−MOSロジック132の閾値を超えた回数
を調べ、有効な音声かどうか判定する。
れると、ステップS200〜S208において、音声入
力回路120が間欠的に駆動させられる。この間欠駆動
中に音声入力回路オン時となると、制御ポートP1 ,P
2 が電源電圧VDDに、制御ポートP3 ,MIC-GND がGN
Dに、それぞれ接続切換される。
イクロホン110に音声が入力されると、オペアンプA
P により、マイクロホン110からの音声信号が、音声
検出時用に設定された動作点VQ 、増幅率Af 、時定数
TK に基づいて増幅され、CMOSロジック132に入
力される。例えば、動作点VQ についていえば、マイク
ロホン110からの音声信号は、動作点VDDを基準とし
て増幅される。なお、音声入力回路オン時と音声入力回
路オフ時とが切り換わる際は、抵抗R4 により、コンデ
ンサC2 ,C3 に充電された電荷が放電させられるの
で、高い応答性をもって動作点VQ が切り換わる。
ン110に音声が入力されたことにより入力信号が音声
帯域にあるので、入力信号が所定レベルを挟んで変化し
た回数が所定数以上となり、かつ、入力信号が所定レベ
ルよりもハイレベルとなった回数および所定レベルより
もローレベルとなった回数も所定数以下となる。したが
って、音声入力回路120に音声が入力されたと判定さ
れ、音声認識時となるので、制御ポートP1 ,MIC-GND
がGNDに、制御ポートP2 ,P3 がフローティング
に、それぞれ接続される。
アンプAP により、マイクロホン110からの音声信号
が、音声認識時用に設定された動作点VQ 、増幅率
Af 、時定数TK に基づいて増幅され、A/Dコンバー
タ134に入力される。例えば、動作点VQ についてい
えば、マイクロホン110からの音声信号は、動作点V
DD/2を基準として増幅される。なお、音声入力回路オ
ン時と音声認識時とが切り換わる際は、抵抗R4 によ
り、コンデンサC2 ,C3 に充電された電荷が放電させ
られるので、高い応答性をもって動作点VQ が切り換わ
る。
の検出結果に基づいて、オペアンプAP の特性を変更す
るようにしたから、音声検出時および音声認識時の両方
において最適な入力信号が得られるので、消費電流をさ
らに低減することができるとともに、従来に比して、音
声検出精度および音声認識精度を向上することができ
る。
に基づいて、オペアンプAP の動作点VQ を変更するよ
うにしたから、消費電流をさらに低減することができ
る。
果に基づいて、オペアンプAP の増幅率Af および時定
数Tk を変更するようにしたから、音声検出精度および
音声認識精度をさらに向上することができる。
コンデンサC2 ,C3 に、抵抗R4を並列接続して設け
たから、音声入力回路オン時と音声入力回路オフ時とを
切り換える際、または音声入力回路オン時と音声認識時
とを切り換える際に、高い応答性をもって動作点VQ を
切り換えることができる。
参照しながら説明する。図18は、本発明の第3の実施
の形態である音声入力回路120の構成を示す回路図で
ある。なお、上記第1の実施の形態と同一の部分につい
ては、同一の符号を付して説明を省略する。
声認識装置を、音声入力回路120におけるオペアンプ
AP の動作点VQ を上記第1および第2の実施の形態と
は異なる値に設定する場合について適用したものであ
る。
20は、図18に示すように、オペアンプAP と、マイ
クロホン110の一端および電源電圧VDDに両端を接続
した抵抗R1 と、オペアンプAP の非反転入力端子とマ
イクロホン110の一端との間に介挿されたコンデンサ
C1 と、オペアンプAP の非反転入力端子に一端を接続
した抵抗R2 ,R3 ,R8 と、オペアンプAP の反転端
子に一端を接続したコンデンサC2 ,C3 と、コンデン
サC2 の他端に一端を接続した抵抗R5 と、コンデンサ
C3 の他端に一端を接続した抵抗R6 と、オペアンプA
P の負帰還ループに介挿された抵抗R7 と、で構成され
ている。
に、マイクロホン110の他端および抵抗R3 ,R6 の
他端は、制御ポートMIC-GND に、抵抗R2 の他端は、制
御ポートP1 に、抵抗R5 の他端は、制御ポートP
3 に、それぞれ接続されている。なお、抵抗R2 ,R8
は、いずれも抵抗R3 の2倍の抵抗値を有している。
詳細な構成を図面を参照しながら説明する。図19は、
制御ポートP1 〜P3 ,MIC-GND の切換制御の状態を示
すタイムチャートである。
に、音声入力回路オフ時では電源電圧VDDに、音声入力
回路オン時および音声認識時ではGNDに、それぞれ接
続切換するようになっており、制御ポートP1 は、音声
入力回路オフ時および音声認識時では電源電圧VDDに、
音声入力回路オン時ではGNDに、それぞれ接続切換す
るようになっている。また、制御ポートP3 は、音声入
力回路オフ時では電源電圧VDDに、音声入力回路オン時
ではGNDに、音声認識時ではフローティングに、それ
ぞれ接続切換するようになっている。
入力回路オン時では、音声入力回路120は、オペアン
プAP と、抵抗R1 ,R7 ,R8 と、コンデンサC1 〜
C3と、GNDに他端を接続した抵抗R2 ,R3 ,
R5 ,R6 と、で構成される。なお、マイクロホン11
0の他端は、GNDに接続されている。このとき、動作
点VQ 、増幅率Af 、および時定数Tk は、下式(13)
〜(15)で示される。
時の基準動作点と、音声認識時の基準動作点とを任意の
値に設定することができる。R2 =R3 ×2、R8 =R
3 ×2とすると、音声検出時は、制御ポートP1 がGN
Dに接続されるので、抵抗R2 と抵抗R3 とは並列に接
続され、R8 =(R2 ‖R3 )×3となり、オペアンプ
Ap 出力の基準動作点は、電源電圧VDDの1/4とな
る。また、音声認識時は、制御ポートP1 が電源電圧V
DDに接続されるので、抵抗R2 と抵抗R8 とは並列に接
続され、R3 =R2 ‖R8 となり、オペアンプAp 出力
の基準動作点は、電源電圧VDDの1/2となる。
0は、オペアンプAP と、抵抗R1,R7 ,R8 と、コ
ンデンサC1 ,C3 と、GNDに他端を接続した抵抗R
3 ,R6 と、電源電圧VDDに他端を接続した抵抗R
2 と、で構成される。なお、マイクロホン110の他端
は、GNDに接続されている。このとき、動作点VQ 、
増幅率Af 、および時定数Tk は、下式(16)〜(18)
で示される。
Q 、増幅率Af 、および時定数Tk がそれぞれ異なる値
で設定可能となるので、抵抗R1 〜R8 およびコンデン
サC1 〜C3 の値は、音声検出時および音声認識時の両
方において最適な入力信号が得られるような値に設定し
ておく。
する。
作点は、必ずしも電源電圧VDDと等しいかまたは0Vで
ある必要はない。基準動作点が電源電圧VDDの1/2付
近にあると、C−MOSロジック132に大きな電流が
流れたり、微小な入力で音声認識動作が起動したりする
ので、基準動作点は電源電圧VDDの1/2付近を避けれ
ばよい。基準動作点がC−MOSロジック132の閾値
に近ければ、小さな入力でC−MOSロジック132の
閾値を超えるので、音声検出時の感度が高くなり、これ
に対し、基準動作点がC−MOSロジック132の閾値
から離れていれば、大きな入力がないとC−MOSロジ
ック132の閾値を超えないので、音声検出時の感度が
低くなる。したがって、基準動作点を変えることによ
り、増幅率Af を変えることなく、音声検出時の感度を
変えることができる。
のタイムチャートである。第1の実施の形態のポート制
御(図7)とは、制御ポートP2 が使用されない点が異
なる。オペアンプAp 出力の基準動作点は、電源電圧V
DDの1/4であるため、マイクロフォン110がONの
ときのオペアンプAp の出力は、電源電圧VDDの1/4
となる。
音声認識動作への切り換えを示すタイムチャートであ
る。間欠動作でマイクロフォン110がONのときに、
規定の音声入力があると、音声認識動作に切り換わる。
第1の実施の形態のポート制御(図8)とは、制御ポー
トP2 が使用されない点が異なる。オペアンプAp 出力
の基準動作点は、電源電圧VDDの1/4から1/2へ移
動する。
す図である。音声認識時は、第1の実施の形態と同様で
ある。音声検出時では、電源電圧VDDの1/4を基準
に、入力波形のマイナス側が一部欠けた波形を出力す
る。この波形が、一定期間内にC−MOSロジック13
2の閾値を超えた回数を調べ、有効な音声かどうか判定
する。第1および第2の実施の形態よりも、基準動作点
とC−MOSロジック132の閾値との差が小さいの
で、小さな入力でもC−MOSロジック132の閾値を
超えるので、音声検出時の感度が高くなる。
れると、ステップS200〜S208において、音声入
力回路120が間欠的に駆動させられる。この間欠駆動
中に音声入力回路オン時となると、制御ポートP1 ,P
2 ,MIC-GND がいずれもGNDに接続切換される。
イクロホン110に音声が入力されると、オペアンプA
P により、マイクロホン110からの音声信号が、音声
検出時用に設定された動作点VQ 、増幅率Af 、時定数
TK に基づいて増幅され、CMOSロジック132に入
力される。例えば、動作点VQ についていえば、マイク
ロホン110からの音声信号は、動作点VDD/4を基準
として増幅される。
ン110に音声が入力されたことにより入力信号が音声
帯域にあるので、入力信号が所定レベルを挟んで変化し
た回数が所定数以上となり、かつ、入力信号が所定レベ
ルよりもハイレベルとなった回数および所定レベルより
もローレベルとなった回数も所定数以下となる。したが
って、音声入力回路120に音声が入力されたと判定さ
れ、音声認識時となるので、制御ポートP1 が電源電圧
VDDに、制御ポートMIC-GND がGNDに、制御ポートP
3 がフローティングに、それぞれ接続される。
アンプAP により、マイクロホン110からの音声信号
が、音声認識時用に設定された動作点VQ 、増幅率
Af 、時定数TK に基づいて増幅され、A/Dコンバー
タ134に入力される。例えば、動作点VQ についてい
えば、マイクロホン110からの音声信号は、動作点V
DD/2を基準として増幅される。
の検出結果に基づいて、オペアンプAP の特性を変更す
るようにしたから、音声検出時および音声認識時の両方
において最適な入力信号が得られるので、消費電流をさ
らに低減することができるとともに、従来に比して、音
声検出精度および音声認識精度を向上することができ
る。
に基づいて、オペアンプAP の動作点VQ を変更するよ
うにしたから、消費電流をさらに低減することができ
る。
果に基づいて、オペアンプAP の増幅率Af および時定
数Tk を変更するようにしたから、音声検出精度および
音声認識精度をさらに向上することができる。
参照しながら説明する。図23は、本発明に係る音声認
識装置の第4の実施の形態を示す概略構成図である。な
お、上記第1の実施の形態と同一の部分については、同
一の符号を付して説明を省略する。
声認識装置を、図23に示すように、音声入力回路12
0とCPU130とで異なる電源電圧を用いる場合につ
いて適用したものである。
中、音声認識装置100は、上記第1の実施の形態にお
ける音声認識装置100において、CPU130に電源
電圧V DD1 を供給し、音声入力回路120に電源電圧V
DD2 を供給するようになっている。
すように、上記第1の実施の形態における音声入力回路
120の構成に加えて、抵抗R2 と制御端子P1 との間
に介挿されたバッファ122を有している。
100に電源が投入されると、CPU130が電源電圧
VDD1 で駆動させられるとともに、音声入力回路120
が電源電圧VDD2 で駆動させられる。そして、音声認識
時では、制御ポートP1 に接続した抵抗R2 がバッファ
122を介して電源電圧VDD2 に接続される。
PU130とで異なる電源電圧VDD1 ,VDD2 を用いる
構成において、音声入力回路120の抵抗R2 をバッフ
ァ122を介してCPU130の電源電圧VDD1 に接続
するようにしたから、電源電圧VDD1 の電源ノイズが音
声入力回路120に与える影響を低減することができ
る。
の形態において、音声入力回路120は、抵抗R4 を設
けた構成としたが、これに限らず、抵抗R4 を設けない
構成としてもよい。
声入力回路120は、抵抗R4 を設けない構成とした
が、これに限らず、抵抗R4 を設けた構成としてもよ
い。このような構成であれば、音声入力回路オン時と音
声入力回路オフ時とを切り換える際、または音声入力回
路オン時と音声認識時とを切り換える際に、高い応答性
をもって動作点VQ を切り換えることができる。
4の実施の形態においては、ステップS118を、変数
COUNT の値が所定数以上であるか否かを判定するように
構成したが、これに限らず、請求項5記載の判定手段と
して、変数COUNT の値が所定の範囲内であるか否かを判
定するように構成してもよい。このような構成であれ
ば、低周波または高周波のハイレベルノイズの影響によ
り入力信号が所定レベル以上となっても、音声入力回路
120に音声が入力されていないと判定される。したが
って、このような場合に、音声認識動作が開始されてし
まうのを防止することができるので、従来に比して、無
駄な電流の消費を抑制することにより、消費電流を低減
することができる。
20は、請求項3ないし8、または12記載の音声入力
手段に対応し、CMOSロジック132は、請求項3、
4、または6ないし11記載の音声検出手段に対応し、
オペアンプAP は、請求項8ないし11記載の演算増幅
器に対応し、CPU130は、請求項3または8記載の
音声認識手段に対応している。
で、およびS116は、請求項4または5記載のカウン
ト手段に対応し、ステップS118は、請求項4記載の
判定手段に対応し、ステップS110は、請求項7記載
の検出手段に対応し、ステップS104、およびステッ
プS110からステップS116までは、請求項7記載
の第2のカウント手段に対応し、ステップS120また
はS122は、請求項7記載の第2の判定手段に対応し
ている。
項1ないし12記載の音声認識装置によれば、従来に比
して、簡易な構成で消費電流を低減することができると
いう効果が得られる。
識装置によれば、音声入力手段からの入力信号が所定レ
ベル以下となるときはもとより、低周波のハイレベルノ
イズの影響により入力信号が所定レベル以上となって
も、音声認識動作が開始されてしまうのを防止すること
ができるので、無駄な電流の消費を抑制することによ
り、さらに消費電流を低減することができるという効果
も得られる。
認識装置によれば、低周波または高周波のハイレベルノ
イズの影響により音声入力手段からの入力信号が所定レ
ベル以上となっても、音声認識動作が開始されてしまう
のを防止することができるので、無駄な電流の消費を抑
制することにより、さらに消費電流を低減することがで
きるという効果も得られる。
載の音声認識装置によれば、音声入力手段からの入力信
号が動作点を離れて電源電圧または接地電圧に張りつい
たままの状態となっても、音声認識動作が開始されてし
まうのを防止することができるので、無駄な電流の消費
を抑制することにより、さらに消費電流を低減すること
ができるという効果も得られる。
認識装置によれば、音声検出時および音声認識時の両方
において最適な入力信号が得られるので、消費電流をさ
らに低減することができるとともに、従来に比して、音
声検出精度および音声認識精度を向上することができる
という効果も得られる。
認識装置によれば、消費電流をさらに低減することがで
きるという効果も得られる。
1記載の音声認識装置によれば、音声検出精度および音
声認識精度をさらに向上することができるという効果も
得られる。
声認識装置によれば、従来に比して、音声入力待ち状態
における消費電流を低減することができるという効果も
得られる。
概略構成図である。
である。
120の構成を示す回路図である。
状態を示すタイムチャートである。
0の構成を示す回路図である。
を示す回路図である。
示すタイムチャートである。
すフローチャートである。
すフローチャートである。
イムチャートである。
路120の構成を示す回路図である。
の状態を示すタイムチャートである。
を示すタイムチャートである。
路120の構成を示す回路図である。
の状態を示すタイムチャートである。
を示すタイムチャートである。
態を示す概略構成図である。
路120の構成を示す回路図である。
Claims (12)
- 【請求項1】 音声認識時には高速のクロックを用い、
音声検出時には低速のクロックのみを用いる音声認識装
置であり、 音声信号の処理に、音声認識時にはA/Dコンバータを
用い、音声検出時にはC−MOSロジックを用いること
を特徴とする音声認識装置。 - 【請求項2】 音声認識時には高速のクロックを用い、
音声検出時には低速のクロックのみを用いる音声認識装
置であり、 音声認識時には連続的にマイクと増幅回路を動作させ、
音声検出時には間欠的にマイクと増幅回路を動作させる
ことを特徴とする音声認識装置。 - 【請求項3】 音声を入力する音声入力手段と、前記音
声入力手段に音声が入力されたことを検出する音声検出
手段と、前記音声検出手段の検出結果に基づいて前記音
声入力手段に入力される音声の認識を開始する音声認識
手段と、を備えた音声認識装置において、 前記音声検出手段は、前記音声入力手段からの入力信号
が所定レベルを挟んで変化した回数に基づいて、前記音
声入力手段に音声が入力されたことを検出するようにな
っていることを特徴とする音声認識装置。 - 【請求項4】 前記音声検出手段は、所定時間内におい
て前記入力信号が前記所定レベルを挟んで変化した回数
をカウントするカウント手段と、前記カウント手段のカ
ウント回数が所定数以上であるときは前記音声入力手段
に音声が入力されたと判定する判定手段と、を有するこ
とを特徴とする請求項3記載の音声認識装置。 - 【請求項5】 前記音声検出手段は、所定時間内におい
て前記入力信号が前記所定レベルを挟んで変化した回数
をカウントするカウント手段と、前記カウント手段のカ
ウント回数が所定の範囲内であるときは前記音声入力手
段に音声が入力されたと判定する判定手段と、を有する
ことを特徴とする請求項3記載の音声認識装置。 - 【請求項6】 前記音声検出手段は、さらに、前記入力
信号が前記所定レベルよりもハイレベルとなっている時
間又はローレベルとなっている時間に基づいて、前記音
声入力手段に音声が入力されたことを検出するようにな
っていることを特徴とする請求項3乃至5記載の音声認
識装置。 - 【請求項7】 前記音声検出手段は、前記入力信号が前
記所定レベルよりもハイレベルであるか又はローレベル
であるかを所定周期で検出する検出手段と、所定時間内
において前記検出手段がハイレベルであると検出した回
数又はローレベルであると検出した回数をカウントする
第2のカウント手段と、前記第2のカウント手段のカウ
ント回数が所定数以上であるときは前記音声入力手段に
音声が入力されていないと判定する第2の判定手段と、
を有することを特徴とする請求項6記載の音声認識装
置。 - 【請求項8】 入力した音声を演算増幅器により増幅し
て出力する音声入力手段と、前記演算増幅器からの入力
信号に基づいて前記音声入力手段に音声が入力されたこ
とを検出する音声検出手段と、前記音声検出手段の検出
結果に基づいて前記入力信号に対する音声認識を開始す
る音声認識手段と、を備えた音声認識装置において、 前記音声検出手段の検出結果に基づいて、前記演算増幅
器の特性を変更するようになっていることを特徴とする
音声認識装置。 - 【請求項9】 前記音声検出手段の検出結果に基づい
て、前記演算増幅器の動作点を変更するようになってい
ることを特徴とする請求項8記載の音声認識装置。 - 【請求項10】 前記音声検出手段の検出結果に基づい
て、前記演算増幅器の増幅率を変更するようになってい
ることを特徴とする請求項8又は9記載の音声認識装
置。 - 【請求項11】 前記音声検出手段の検出結果に基づい
て、前記演算増幅器の時定数を変更するようになってい
ることを特徴とする請求項8乃至10記載の音声認識装
置。 - 【請求項12】 前記音声入力手段を間欠的に駆動する
ようになっている請求項3乃至11記載の音声認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25584798A JP3911865B2 (ja) | 1998-09-09 | 1998-09-09 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25584798A JP3911865B2 (ja) | 1998-09-09 | 1998-09-09 | 音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000089792A true JP2000089792A (ja) | 2000-03-31 |
JP3911865B2 JP3911865B2 (ja) | 2007-05-09 |
Family
ID=17284427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP25584798A Expired - Fee Related JP3911865B2 (ja) | 1998-09-09 | 1998-09-09 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3911865B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013142860A (ja) * | 2012-01-12 | 2013-07-22 | Roland Corp | 打撃検出装置 |
JP2016526178A (ja) * | 2013-05-07 | 2016-09-01 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ターゲットキーワードを検出するための方法および装置 |
JP2017010214A (ja) * | 2015-06-19 | 2017-01-12 | 株式会社東芝 | 行動判定装置及び行動判定方法 |
JP2017010166A (ja) * | 2015-06-18 | 2017-01-12 | Tdk株式会社 | 会話検出装置及び会話検出方法 |
-
1998
- 1998-09-09 JP JP25584798A patent/JP3911865B2/ja not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013142860A (ja) * | 2012-01-12 | 2013-07-22 | Roland Corp | 打撃検出装置 |
JP2016526178A (ja) * | 2013-05-07 | 2016-09-01 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ターゲットキーワードを検出するための方法および装置 |
JP2017010166A (ja) * | 2015-06-18 | 2017-01-12 | Tdk株式会社 | 会話検出装置及び会話検出方法 |
JP2017010214A (ja) * | 2015-06-19 | 2017-01-12 | 株式会社東芝 | 行動判定装置及び行動判定方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3911865B2 (ja) | 2007-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101673289B1 (ko) | 웨이크업 검출을 갖는 트랜스듀서 시스템을 위한 시스템 및 방법 | |
US11617041B2 (en) | Piezoelectric MEMS device for producing a signal indicative of detection of an acoustic stimulus | |
KR20160010606A (ko) | Vad 탐지 마이크로폰 및 그 마이크로폰을 동작시키는 방법 | |
US20150049884A1 (en) | Microphone with voice wake-up function | |
EP3219109A1 (en) | Reduced microphone power-up latency | |
US8346236B2 (en) | Method for switching call mode of a mobile device and related mobile device capable of switching call mode automatically | |
WO2002007480A2 (en) | Power management for hearing aid device | |
US7834634B2 (en) | Low-power switch state detection circuit and method and mobile telephone incorporating the same | |
US11683653B2 (en) | Monitoring circuitry | |
JP2000089792A (ja) | 音声認識装置 | |
US7319890B2 (en) | Detection method and foldable electronic device thereof | |
US6535724B1 (en) | Receiver portion of a telephone | |
JP2014041464A (ja) | 情報処理装置およびその制御方法 | |
WO2001028287A1 (fr) | Telephone portable a microphone optique | |
EP3112981B1 (en) | Power supply control mechanism, electronic device including the same, hearing aid, and power supply control method | |
JPH04152719A (ja) | 音声検出回路 | |
US6825788B2 (en) | Analog-to-digital and digital-to-analog converter with standby output signal | |
CN116134714A (zh) | 优化可旁路功率转换器中工作模式之间的转换 | |
JPH01227535A (ja) | 無線選択呼出し受信機 | |
JP2707848B2 (ja) | 騒音検出回路 | |
JP2002156997A (ja) | 音声検出制御装置 | |
US11558706B2 (en) | Activity detection | |
JP4765834B2 (ja) | 電子機器及び制御方法 | |
JP3172458B2 (ja) | 無線機 | |
CN113628616A (zh) | 音频采集设备、无线耳机以及电子设备系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050909 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060718 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060908 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20060928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070122 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110209 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110209 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120209 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130209 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130209 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |