JP3726448B2 - 認識対象音声検出方法およびその装置 - Google Patents
認識対象音声検出方法およびその装置 Download PDFInfo
- Publication number
- JP3726448B2 JP3726448B2 JP28067097A JP28067097A JP3726448B2 JP 3726448 B2 JP3726448 B2 JP 3726448B2 JP 28067097 A JP28067097 A JP 28067097A JP 28067097 A JP28067097 A JP 28067097A JP 3726448 B2 JP3726448 B2 JP 3726448B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- input
- determined
- recognition
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
本発明は、入力音声を認識してその認識結果に基づいて何らかの動作を行う音声認識装置において、装置側が入力音声を常に待つ状態となっている場合、入力音声を効率よく検出して消費電流を少なくする認識対象音声検出方法およびその装置に関する。
【0002】
【従来の技術】
最近、音声認識を用いた機器が様々な分野で実用化されてきている。この種の機器は、スイッチを入れて初めて認識動作を開始することで十分な機能を果たすものもあるが、音声が入力されると、直ちに入力音声を認識してその認識結果に基づいた動作を行うというように、常に、入力音声を待ち状態としておく必要のあるものもある。
【0003】
後者の例としては、たとえば、ユーザが時刻を問い合わせると現在時刻を応答する時計などがある。この種の機器は、乾電池で動作するものが殆どであり、また、機器の小型、軽量化を考えたとき、乾電池は小容量のものを使用することが望ましく、かつ、長時間、電池交換をしないで済むことが望まれる。
【0004】
しかし、この種の機器は、常に音声入力を待ち状態にしておく必要があるため、待ち状態においても、常に電流が消費されることになり、その消費電流を如何に小さく抑えるかが大きな課題である。
【0005】
音声を常に待つ状態としておくには、マイクロホンやアンプなどの音声検出回路を常に動作可能状態としておく必要がある。この種の機器に一般的に用いられているコンデンサマイクロホンの消費電流は、500μA程度であり、マイクロホンで入力した音声信号を処理するアンプの消費電流も同様に500μA程度である。
【0006】
したがって、これらの音声検出回路の消費電流は1mA程度となる。この状態を保持するとすれば、一年間に8.76AHr.を消費することになる。この値は、単1のアルカリ電池に相当するものであり、安価な単1マンガン電池の2本分に相当する。
【0007】
機器の小型化、軽量化さらには価格を考えたとき、電池は単3以下を用いるのが望ましいが、上述した例では、電池の寿命はごく短いものとなってしまうという問題があった。
【0008】
これに対処するには、必要なときだけスイッチをオンして音声入力を可能とすることも考えられるが、動作を行わせるためにその都度スイッチを入れるのでは、この種の音声認識を用いた装置としてのメリットが全く失われることになり、現実的な方法ではない。また、他の方法として、特公昭61−54191がある。この従来技術は、アラーム付き電子時計において、アラームセット時刻が到達した以降のアラーム装置の動作を、音声入力によって制御可能としたものである。
【0009】
【発明が解決しようとする課題】
しかしながら、前述の特公昭61−54191で示される技術は、アラーム信号などで音声入力のタイミングを制御するものであり、任意のタイミングで音声入力を行うことができないので、使い勝手が悪い問題があった。
【0010】
そこで、本発明は、入力音声を効率よく検出することで、認識対象音声の入力待ち状態における機器の消費電流を小さく抑え、乾電池を使用する機器においては、小容量の電池で長時間使用することができる認識対象音声検出方法およびその装置を実現することを目的としている。
【0011】
【課題を解決するための手段】
本発明の認識対象音声検出方法は、音入力手段に入力された音声を認識して、前記認識の結果に対して何らかの動作を行う音声認識装置における認識対象音声検出方法であって、前記音入力手段を間欠駆動し、当該間欠駆動される音入力手段が動作状態の間に入力された音に対し、当該入力された音が音声であるかを判定する処理を、複数段階の工程に分けて段階的に行い、現在処理中の工程での処理結果が当該処理中の工程に設定された条件を満たした以降に次の段階の工程が動作し、段階を経るに従って、消費電流が大きく、かつ、前記入力された音が音声であるかの判定確度の上がる処理に移行し、それぞれの工程における処理において、その工程に設定された条件が満たされない場合は、それぞれの工程を非動作状態に戻し、前記複数段階の工程における処理により、前記入力された音が音声であると判定された場合は、前記音入力手段の動作状態を維持し、前記入力された音の認識処理へ移行することを特徴とする。
【0012】
また、本発明の認識対象音声検出方法は、音入力手段に入力された音声を認識してその認識結果に対して何らかの動作を行う音声認識装置における認識対象音声検出方法であって、前記音入力手段を間欠駆動し、間欠駆動される音入力手段が動作状態の間に入力された音のレベルを検出し、そのレベルの大きさから音の有無を判定し、音が無いと判定した場合は、非動作状態に戻る第1の処理工程と、前記第1の処理工程で音が有りと判定された以降に動作を開始し、前記入力された音が雑音であるか音声らしき音であるかを大まかに判定し、音声らしき音ではないと判定した場合は、非動作状態に戻る第2の処理工程と、前記第2段階の処理工程で音声らしき音と判定された以降に動作を開始し、前記音声らしき音と判定された音が音声であるか否かを判定し、音声であると判断した場合は、前記音入力手段の動作状態を維持し、前記音声であると判断された音の音声特徴データを認識部側に渡し、音声でないと判断した場合には、非動作状態に戻る第3の処理工程と、を有したことを特徴とする。
【0013】
そして、前記第1の処理工程は、前記音入力手段が動作状態の間に入力された音の平均パワーを求め、当該求められた平均パワーと基準レベルとを比較して音の有無を判定し、音が無いと判定した場合は、非動作状態に戻るようにしてもよく、また、前記音入力手段が動作状態の間に入力された音を、人間の音声の周波数帯域を含む周波数帯域とそれ以外の周波数帯域に分けて少なくとも一方の周波数帯域の平均パワーを求め、当該求められた平均パワーの値を基に音を判定し、人間の音声ではないと判定した場合は、非動作状態に戻るようにしてもよい。さらに、これらを組み合わせるようにしてもよい。
【0014】
また、前記第2の処理工程は、前記第1の処理工程での設定された条件を満たした音信号に対し、当該音信号の継続時間を計測し、当該計測した継続時間を基に音声らしき音か否かを判定し、音声らしき音ではないと判定した場合は、非動作状態に戻るようにしてもよく、また、前記第1の処理工程での設定された条件を満たした音信号に対し、当該音信号の所定時間内における零交差数を計測し、当該計測した零交差数を基に音声らしき音か否かを判定し、音声らしき音ではないと判定した場合は、非動作状態に戻るようにしてもよい。さらに、これらを組み合わせるようにしてもよい。 また、前記第3の処理工程は、前記第2の処理工程での設定条件を満たした音信号に対し、音声特徴抽出処理を行い、前記音声特徴抽出処理により抽出された音声特徴データを基に、入力音が音声であるか否かを判断して音声であると判断した場合に、前記音声であると判断した音の特徴データを認識部側に渡し、音声でないと判断した場合は、非動作状態に戻るようにしてもよい。
【0015】
さらに、前記認識部では、設定されたキーワードを含む音声特徴データのみを認識処理するようにしてもよい。
【0016】
また、本発明の認識対象音声検出装置は、音入力手段に入力された音声を認識してその認識結果に対して何らかの動作を行う音声認識装置における認識対象音声検出装置であって、前記音入力手段を間欠駆動する間欠駆動制御手段と、前記間欠駆動制御手段により間欠駆動される音入力手段が動作状態の間に入力された音に対し、前記入力された音が音声であるかを判定する処理を、複数段階に分けて段階的に行うそれぞれの処理手段を有し、現在処理中の処理手段による処理結果が、当該処理中の処理手段に設定された条件を満たした以降に、次の段階の処理手段が動作し、段階を経るに従って、消費電流が大きく、かつ、前記入力された音が音声であるかの判定確度の上がる処理に移行し、それぞれの処理手段における処理において、その処理手段に設定された条件が満たされない場合は、それぞれの処理手段を非動作状態に戻し、前記複数段階の処理手段における処理により、前記入力された音が音声であると判定された場合は、前記音入力手段の動作状態を維持し、前記入力された音の認識処理へ移行するようになっていることを特徴とする。
【0017】
また、本発明の認識対象音声検出装置は、音入力手段に入力された音声を認識してその認識結果に対して何らかの動作を行う音声認識装置における認識対象音声検出装置であって、前記音入力手段を間欠駆動する間欠駆動制御手段と、前記間欠駆動制御手段により間欠駆動される音入力手段が動作状態の間に入力された音のレベルを検出し、前記検出した音のレベルの大きさから音の有無を判定し、音が無いと判定した場合は、非動作状態に戻る入力レベル判定手段と、前記入力レベル判定手段で音が有りと判定された以降に動作を開始し、前記入力された音が雑音であるか音声らしき音であるかを大まかに判定し、音声らしき音でないと判定した場合は、非動作状態に戻る音判定手段と、前記音判定手段で前記入力された音が音声らしき音と判定された以降に動作を開始し、前記音声らしき音と判定された音が音声であるか否かを判定し、音声であると判定した場合は、前記音声であると判定された音の音声特徴データを認識部側に渡し、音声でないと判断した場合には、非動作状態に戻る音声判定手段と、を有し、前記音判定手段が音声であると判定した場合には、前記音入力手段の動作状態を維持するようになっていることを特徴とする。
【0018】
そして、前記入力レベル判定手段は、前記音入力手段が動作状態の間に入力された音の平均パワーを求め、当該求められた平均パワーと基準レベルとを比較して音の有無を判定し、音が無いと判定した場合は、非動作状態に戻るようにしてもよく、前記音入力手段が動作状態の間に入力された音を、人間の音声の周波数帯域を含む周波数帯域とそれ以外の周波数帯域に分けて少なくとも一方の周波数帯域の平均パワーを求め、当該求められた平均パワーの値を基に音を判定し、人間の音声ではないと判定した場合は、非動作状態に戻るようにしてもよい。さらに、これらを組み合わせるようにしてもよい。
【0019】
また、前記音判定手段は、前記入力レベル判定手段での設定された条件を満たした音信号に対し、前記音信号の継続時間を計測し、前記計測した継続時間を基に音声らしき音か否かを判定し、音声らしき音ではないと判定した場合は、非動作状態に戻るようにしてもよく、前記入力レベル判定手段での設定された条件を満たした音信号に対し、前記音信号の所定時間内における零交差数を計測し、前記計測した零交差数を基に音声らしき音か否かを判定し、音声らしき音ではないと判定した場合は、非動作状態に戻るようにしてもよい。さらに、これらを組み合わせるようにしてもよい。
【0020】
また、前記音声判定手段は、前記音判定手段での設定された条件を満たした音信号に対し、音声特徴抽出処理を行い、前記音声特徴抽出処理により抽出された音声特徴データを基に入力音が音声であるか否かを判断して音声であると判断した場合に、前記音声であると判断した音の音声特徴データを認識部側に渡し、音声でないと判断した場合は、非動作状態に戻るようにしてもよい。
【0021】
さらに、前記認識部では、設定されたキーワードを含む音声特徴データのみを認識対象音声として認識処理するようにしてもよい。
【0022】
本発明は、認識対象の音声を常に待ち受ける状態にしておき、認識対象音声が入力されると、認識結果に対応した動作を行う音声認識装置に適用されることで効果を発揮するものである。この種の装置にあっては、音声を常に待ち状態としておくために消費電流が大きく、乾電池を電源として用いるものにあっては、消費電流を如何に小さく抑えるかということが大きな課題であった。
【0023】
これを解決するために本発明は、まず、音入力手段を間欠駆動する。具体例としては、たとえば、0.1 秒間を動作状態として音声入力を可能とし、その後の0.4 秒間を非動作状態とするというように動作状態と非動作状態を繰り返す間欠的な音声入力動作を行う。このような間欠駆動を行うことにより、待ち状態における消費電流を小さく抑えることができる。
【0024】
ただし、間欠駆動することによる問題点もある。たとえば、消費電流を小さく抑えるために、たとえば、駆動時間をごく短い時間(たとえば0.1 秒程度)としたとき、マイクロホンの特性上、正常な音声入力動作を行うことができない。これに対処するために、まず、第1段階の処理として、処理時間が短く、しかも電流消費が小さくて済む音の有無検出だけを行い、この第1段階の処理を通過した音信号に対し、第2段階の処理として、その音がどのような音であるかの判定を行い、音声らしいと判定された場合に、第3段階の処理として、人間の音声であるか否かの判定処理を行うというように、幾つかの工程に分けて段階的な処理を行うようにしている。しかも、工程を経るにしたがって、処理時間と消費電流を要する処理とし、それぞれの工程での条件を満たされない場合は、音声入力手段を非動作状態に戻すようにすることで、無駄な電流消費を抑えることができる。また、第1の工程は平均パワーを算出する手段、基準レベルを記憶する手段、比較手段、さらに、場合によっては、周波数フィルタを加える程度で構成でき、簡単に実現可能である。また、第2の工程も、計時手段、継続時間を測定する手段、さらには、零交差数を計測する手段程度で構成でき、第1の工程同様簡単に実現できる。
【0025】
なお、第1の工程において、音声の有無を判定する場合、周波数フィルタを用いた処理を行うことにより、人間の音声とは異なる音を、早い処理段階で除去することも可能となる。つまり、まず、人間の音声の周波数範囲内に一定のパワーを有する音が有るか否かを判定することで、人間の音声とは異なった周波数帯域に大きな平均パワーを有する音を処理対象外とすることができ、処理の効率化が図れる。また、入力レベルの大きさから音の有無を判定する処理と、この周波数フィルタを用いた処理とを組み合わせることにより、より一層、処理の効率化が図れる。
【0026】
また、第2の工程において、零交差数を計測する処理を行うことで、効率よく人間の音声らしき音かそれ以外の音かを判定することができる。また、この零交差数を計測する処理と、所定レベル以上の信号の継続時間を判定する処理を組み合わせることにより、より一層、高精度で効率的な音判定が可能となる。
【0027】
また、第3の工程は、認識装置がもともと持っている音声特徴抽出手段を用いることで実現でき、この処理により人間の音声であるか否かの判定を高精度に行うことができる。
【0028】
さらに、予め設定されたキーワードを含む音声特徴データのみを認識対象音声として受け付けるようにすることにより、無駄な認識動作を行わなくて済み、これによっても消費電流を小さく抑えることができる。
【0029】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照しながら説明する。
【0030】
図1は本発明の実施の形態を説明するブロック図であり、たとえばコンデンサマイクロホンなどの音入力手段1、音入力手段1から入力された音のレベルが一定以上あるか否かを判定する入力レベル判定手段2、入力レベル判定手段2で一定以上のレベルがあると判定された音が音声らしきものであるかそれ以外の雑音であるか否かを判定する音判定手段3、音判定手段3で音声らしきものであると判定された場合、それが音声であるか否かを判定する音声判定手段4、音声判定手段4で音声であると判定された場合、その音声に対して認識動作を行う音声認識手段5、間欠駆動制御手段6などから構成されている。なお、この間欠駆動制御手段6は、前記音入力手段1に対しては、間欠駆動信号(これについては後述する)を与えるとともに、他の手段に対してはそれぞれの手段が動作を行うときに動作電圧を与える。
【0031】
このような構成において、その動作を説明する。間欠駆動制御手段6は、音入力手段1に対して間欠駆動信号を与え、これにより、音入力手段1は周期的に動作状態と非動作状態となる。このように、音声入力手段1が間欠駆動する場合、幾つかの問題点がある。
【0032】
すなわち、音入力手段1が動作状態となる頻度が少ないと、認識すべき音声を入力し損なう可能性がある。逆に、頻度が高すぎると電流消費が大きくなり、低消費電流化に支障がでることになる。これらの点に対しては、ある程度の頻度を有し、かつ、動作状態の時間を短くすることで対処できる。
【0033】
しかし、動作状態の時間を短くしすぎると、音入力手段1の特性上の問題点がある。たとえば、音入力手段1としてコンデンサマイクロホンを用いた場合、入力した音信号を安定した音信号(たとえば認識処理を行うための特徴抽出が可能な音信号)として取り出すには、通常、秒単位の時間を要する。
【0034】
これらの点を考慮して、本発明では、音入力手段1を間欠駆動させ、かつ、音入力手段1が動作状態のときに取り込んだ音信号に対して複数段階の工程に分けて、順次、消費電流が大きく、認識対象音声か否かの判定確度の上がる処理時間の長い処理を行うようにする。以下、この具体的な処理について説明する。
【0035】
この実施の形態においては、前述した点を考慮して、音入力手段1に対し、たとえば、0.1 秒間動作可能状態とし、その後の0.4 秒は動作を休み、その後、再び、0.1 秒間動作可能状態とし、その後の0.4 秒は動作を休むというような間欠駆動信号を間欠駆動制御手段6から出力する。
【0036】
したがって、音声入力手段1は、間欠駆動制御手段6によって間欠的に設定されるる0.1 秒間の動作可能状態のときにのみ音の入力を可能とし、それ以外では音声入力動作やその他の動作を行わない状態(これをここではスリープ状態という)となる。
【0037】
そして、たとえば、ある時刻において音信号が存在し、このとき、音入力手段1が動作可能状態となっていれば、その音は音入力手段1により取り込まれる。この音入力手段1に入力された音信号は、入力レベル判定手段2で、入力レベルの判定が行われる。つまり、この段階では音の有無だけの判定を行う。
【0038】
この入力レベル判定手段2による音の有無検出は、様々な手法により行うことができる。たとえば、図2に示すような例がある。この図2で示す例は、平均パワー算出部211、基準レベル記憶部212、比較部213、入力音判定結果出力部214で構成され、音入力手段1で入力された音信号から平均パワーを算出して、その平均パワーを基準レベルと比較し、その比較結果に基づいて入力音判定結果を出力する。
【0039】
なお、音入力手段1としてコンデンサマイクロホンを用いた場合、前述したように、入力した音信号を安定した音信号とするには、通常、秒単位の時間を要するが、このように、単に音があるか無いかを判定するだけの処理を行うには、0.1 秒程度の時間で実用的には十分である。
【0040】
以上の処理は、本発明の第1段階の処理であり、図3のフローチャートのステップs1〜s3の処理である。つまり、スリープ状態(ステップs1)において、間欠駆動制御手段6から動作開始信号が入ると、音入力手段1が動作状態となり、所定レベル以上の音信号があるか否かを判定する(ステップs2,s3)。そして、所定レベル以上の音信号が存在すると判定されたときは、次の第2段階の処理に移り、もし、所定レベル以上の音信号が無ければ、音は無しと判断してスリープ状態に戻る。
【0041】
音が有りと判断された場合は、第2段階の処理として、音判定手段3によりその音が音声らしき音であるか雑音であるかを判定する。この音声らしき音であるか雑音であるかを判定する手段としては幾つか考えられるが、ここでは、その一例として図4に示すように、所定以上のレベルの音の継続時間を調べて突発的な雑音であるか否かを判定する。
【0042】
図4に示す音判定手段3は継続時間判定部31、計時部32、継続時間記憶部33、音判定結果出力部34などから構成されている。このような構成において、入力レベル判定手段2にて所定レベル以上と判定された信号がどの程度継続しているかを計時部32からの時間信号を用いて計時し、継続時間記憶部33に記憶されている時間に基づいてその入力音が音声らしき音かそれ以外の突発的な雑音かを判定する。
【0043】
つまり、所定レベル以上の入力音の継続時間が継続時間記憶部33に記憶されている時間より短い場合は、少なくとも音声ではなく、たとえば、ドアを閉めたときの音などの突発的な雑音であると判定する。
【0044】
以上の第2段階の処理は、図3のフローチャートのステップs4,s5の処理である。つまり、第1段階の処理(音が有るか否かの判定処理)において、音が有りと判定された場合、まず、音判定処理として、前述したような所定レベル以上の音の継続時間を調べ(ステップs4)、その時間にもとづいて入力音は雑音であるか否かを判定する(ステップs5)。ここで、突発的な雑音でない、つまり、音声の可能性があると判定された場合は、次の第3段階に処理に移り、もし、突発的な雑音であると判定された場合はスリープ状態に戻る。
【0045】
この第2段階の処理において、入力音声が突発的な雑音ではなく、音声である可能性があると判定された場合、第3段階の処理として、音声判定手段4によりその音声らしき音が人間の音声であるか否かを判定する。この音声判定手段4による音声判定処理について以下に説明する。
【0046】
この音声判定手段4が行う処理は、まず、音声らしき音が人間の音声かそれ以外の音かを区別することが必要であるが、これに対しては、入力音を特徴抽出処理(たとえばLPC分析)し、その分析結果に基づいて人間の音声であるか否かを判定する。具体的には、人間の音声生成機構のモデル化による特徴抽出処理を行って、その誤差を求め、誤差の大きさから人間の音声か否かを判定する。たとえば、第2段階の処理で突発的な雑音ではなく音声らしき音と判定された場合でも、音信号をLPC分析による誤差を求めることで明確に判断できる。なお、この音声判定手段4は、音声認識装置がもともと持っている特徴分析手段により行うことができることは勿論である。
【0047】
以上の第3段階の処理は、図3のフローチャートのステップs6,s7の処理である。つまり、第2段階の処理(音声らしい音か否かの判定処理)において、音声らしいと判定された場合、音声判定処理として、特徴抽出を行い(ステップs6)、その結果に基づいて人間の音声であるか否かを判定し、人間の音声であると判定した場合は認識対象音声として(ステップs7)、音声認識手段5にその特徴データを送り、認識処理に移る。もし、ステップs7で、人間の音声でないと判定された場合は、認識対象音声でないとしてスリープ状態に戻る。また、音声認識手段5により認識処理を行い(ステップs8)、認識処理が終了するとスリープ状態に戻る。
【0048】
以上のように本発明は、第1〜第3の三段階の処理を経て、入力された音が人間の音声であると判定された場合に初めて認識処理に入るようにしている。
【0049】
つまり、第1段階では、間欠的に入力音を検出してレベルの大きさから入力音が有るか否かだけの処理を行い、所定レベル以上の入力音が存在した場合に、第2段階の処理を行う。そして、第2段階では、所定レベル以上の入力音が突発的な雑音であるのか音声らしき音であるのかを判定し、音声らしき音である場合にのみ第3段階の処理に入る。この第3段階の処理では、音声らしき音が人間の音声であるか否かを判定し、人間の音声である場合にそれを認識対象として音声認識手段5に特徴データを渡すようにする。
【0050】
なお、第1〜第3の三段階の処理に要する時間は、たとえば「今、何時」というような認識対象音声の発話時間に比べると、ごく短い時間であるので、認識対象音声に対して認識処理を行う上で、実用的には殆ど支障はない。
【0051】
以上説明したように、本発明では、第1段階の動作における音の待ち状態は、この実施の形態では、0.5秒間のうち、0.1 秒の動作を行う間欠動作であるので、常に入力音声を待つ状態としておく場合に比べ、1/5の消費電流ですむ。
【0052】
ちなみに、単1の乾電池は単3の乾電池の4.5倍ほどの容量があるので、消費電流が1/5となれば、単1と同じ電池寿命を得ようとした場合、単3電池で可能となる。
【0053】
また、第1段階から順に段階を経るごとに、消費電流が大きく、動作時間の長い処理に移るようにし、1つの段階に設定された条件を満たしたとき、次の段階に移り、ある段階で条件が満たされないときはスリープ状態に戻るので、無駄な処理を行わなくて済み、これによっても消費電流を抑えることができる。特に、第3段階以降の処理は、実質的な音声認識処理であり、装置としてフル稼働に近い状態となるが、この第3段階に達するまでに、条件が満たされないときは、スリープ状態に戻るため、無駄な認識動作を行わなくて済む。
【0054】
なお、以上説明した例は1つの実施の形態であり、この実施の形態に限定されるものではない。たとえば、間欠駆動制御手段6による音入力手段1に対する駆動は、上述の実施の形態では、0.1 秒間を動作状態とし0.4秒休むというように、0.5 秒間のうち0.1 秒の動作を行うようにしているが、この動作頻度は任意に設定できるものであり、その装置の特性などを考慮して最も適当と思われる動作間隔を設定できるものである。ただし、頻度が少なすぎると、入力音の検出ミスが発生しやすいので、ある程度の頻度は必要である。
【0055】
また、第1段階の処理における入力レベル判定手段2は、図2で示したものでなく、たとえば、図5(a)あるいは図5(b)のような構成としてもよい。
【0056】
図5(a)は、低域通過フィルタ215、平均パワー算出部216、基準レベル記憶部217、比較部218、入力レベル判定結果出力部219から構成されている。低域通過フィルタ215は、ここでは、4KHz以下の周波数成分を通過させるもので、4KHz以下の周波数成分の平均パワーを平均パワー算出部216で算出し、その平均パワーと、基準レベル記憶部217に記憶されている基準レベルとを比較部218で比較し、その比較結果をもとに入力レベル判定結果を出力する。
【0057】
ここで、周波数の基準を4KHzとしたのは、人間の音声は殆どが4KHz以下であるためである。これにより、4KHz以下の周波数成分の平均パワーが、基準レベルより大きい場合には、人間の声である可能性もあると判定できる。言い換えれば、4KHz以上に大きな値の平均パワーを有する音は人間の音声とは異なる音であるとみなすことができるので、このような音は処理対象から除去する。したがって、まず、人間の音声の周波数範囲内に一定のパワーを有する音を判定結果として取り出し、この音に対して第2段階以降の処理を行う。
【0058】
また、図6(b)は、4KHz以下の周波数成分を通過させる低域通過フィルタ215と、4KHzより高い周波数成分を通過させる高域通過フィルタ220と、4KHz以下の周波数成分の平均パワーを算出する平均パワー算出部221、4KHzより高い周波数成分の平均パワーを算出する平均パワー算出部222、これらの平均パワーの差あるいは比をとる比較部223、入力レベル判定結果出力部224から構成されている。
【0059】
このように、高域と低域の2種類の周波数帯域フィルタを設け、その差あるいは比を求めることにより、人間の音声とその他の雑音とをさらに精度よく区別することができる。たとえば、4KHzより高い周波数成分の平均パワーが、4KHz以下の周波数成分の平均パワーよりきわめて大きければ、それは人間の音声ではなく雑音の可能性が高いと判定でき、また、逆に、4KHz以下の周波数成分の平均パワーが4KHzより高い周波数成分の平均パワーよりきわめて大きければ、人間の音声である可能性が有ると判定できる。また、低周波成分と高周波成分の両方にまんべんなくパワーが存在する場合は、両者の比は小さくなり、この場合も、人間の音声以外の雑音であると判定できる。
【0060】
このように、2種類の周波数帯域のフィルタを設け、それぞれのフィルタを通過する周波数成分の平均パワーの大きさに基づいた判定を行うことにより、この第1段階の処理においても、人間の音声かそれ以外の音声かを大まかに判定することができ、その後の処理を、より一層、効率的に行うことが可能となる。
【0061】
なお、入力レベル判定手段2としては、図2で示した手段と図5(a),(b)のいずれかの手段とを組み合わせるようにしてもよい。たとえば、図2で示したものと図5(a)のものとを組み合わせた場合、まず、入力音声の平均パワーを算出して基準レベルと比較し、基準レベル以上の場合に、低域通過フィルタを通して、4KHz以下の周波数成分の平均パワーを算出し、その平均パワーと、基準レベルとを比較し、その比較結果をもとに入力レベル判定結果を出力するようにしてもよい。
【0062】
また、音判定手段3は、前述の実施の形態では、入力レベル判定手段2からの入力レベル判定結果を受けて、所定以上のレベルの音の継続時間を調べて、突発的な雑音を処理対象外とすることで、音声らしき音を検出するようにしたが、この音判定手段3は、たとえば、図6に示すような零交差数計測を行うことで、音声らしき音を検出するようにしてもよい。図6は零交差数計測部35、計時部36、音判定結果出力部37で構成され、音入力手段1に入力される音信号の零交差数を調べることにより、その音が人間の音声であるかそれ以外の音で有るかを大まかに判定する。
【0063】
つまり、ある一定時間における人間の音声の零交差数は予めわかっているので、入力音に対してある一定時間内の零交差数をカウントし、その零交差数を基に音判定を行う。これにより、第1段階における設定条件を満たした音であっても、たとえば、電話の呼び出し音、チャイムの音、楽器の音、機械音などの音を人間の音声と区別することができ、より人間の音声らしき音のみを判定することができる。
【0064】
また、音判定手段3としては、前述の継続時間を調べて突発的な雑音を除去する手段と、図6で示した手段とを併用するようにしてもよい。たとえば、まず最初に、継続時間を判定し、所定の時間以上継続する音であると判定した場合に、入力音声の零交差数を調べ、その零交差数により音声らしき音か雑音かの判定を行うようにする。これにより、入力音が人間の音声らしき音であるか否かを高い精度で判定できる。
【0065】
また、第3段階の処理として、音声判定手段4が行う処理は、LPC分析などの音声特徴抽出により非音声を除去する処理であるが、たとえば、テレビジョンやラジオから流れてくる人間の音声は認識対象の音声と判断してしまうことになる。このような認識対象ではない人間の音声特徴データが音声認識部5に与えられると、音声認識部5ではその音声に反応して訳の分からない応答をすることがある。このような認識対象音声以外の音声を排除するために、その後の音声認識手段5における認識処理をキーワードを用いて認識を行うようにしてもよい。
【0066】
つまり、音声認識手段5における認識可能な登録単語の1つとしてキーワードを予め登録しておき、そのキーワードを含んだ音声を入力することで認識動作が可能とするような設定としておく。
【0067】
たとえば、時刻を問い合わせると現在時刻を応答する時計を考えた場合、キーワードとしてたとえば「太郎」を予め登録しておき、時刻を問い合わせるときに、単に「今何時」というのではなく、たとえば、「太郎、今何時」というように、キーワードを含んだ内容の問いかけを行うようにする。装置側では、キーワードが含まれている場合だけ認識対象音声として受け付けるようにする。これにより、キーワードを含まない音声は、認識対象音声として受け付けないので、前述したように、テレビジョンやラジオから流れてくる人間の音声に装置が反応して訳の分からない応答をするというようなことがなくなり、これによっても、無駄な電流消費を抑えることができる。
【0068】
なお、以上説明した実施の形態は、本発明の好適な実施の形態の例であるが、これに限定されるものではなく、本発明の要旨を逸脱しない範囲で、種々変形実施可能である。
【0069】
なお、本発明の処理を行う処理プログラムは、フロッピィディスク、光ディスク、ハードディスクなどの記憶媒体に記憶させておくことができ、本発明は、それらの記憶媒体をも含むものであり、また、ネットワークからデータを得る形式でもよい。
【0070】
以上説明したように、本発明によれば、音入力手段を間欠駆動させ、音入力手段が動作状態のときのみに音声入力動作を行うことにより、待ち状態における消費電流を小さく抑えることができる。
【0071】
また、本発明では、音入力手段が動作状態のときの処理を幾つかの段階に分けて行う。まず、処理時間が短く、しかも、電流消費が小さくて済む音の有無検出を第1段階の処理として行い、この第1段階の処理を通過した音信号に対し、その音がどのような音であるかの判定を第2段階の処理として行い、この第2段階の処理により音声らしいと判定された場合に、第3段階の処理として、人間の音声であるか否かの判定処理を行うというように、幾つかの工程に分けて処理を行うようにしている。しかも、工程を経るにしたがって、処理時間と消費電流を要する処理とし、それぞれの工程での条件が満たされない場合は、装置を非動作状態に戻し、音声入力手段のみが間欠駆動するモードに戻すようにしている。
【0072】
このように、工程を経るにしたがって、処理時間と消費電流を要する処理とすることにより、音入力手段を間欠駆動することによる様々な問題点に対応することができ、しかも、消費電流を大幅に抑えることが可能となる。
【0073】
これにより、電源として電池を使用する機器の場合、たとえば、単3電池で単1電池と同じ寿命を得ることも可能となり、同じ寿命を得るのに、電池容量を小さなものとすることができ、装置の小型化と軽量化が図れる。また、電池を装置に付加して販売する場合は、電池容量が小さい分、装置の販売価格の低廉化にも寄与することができなど、種々の効果が得られる。
【図面の簡単な説明】
【図1】本発明の実施の形態の基本的な構成を示すブロック図。
【図2】図1で示した入力レベル判定手段の一例を示す図。
【図3】本発明の実施の形態の処理を説明するフローチャート。
【図4】図1で示した音判定手段の一例を示す図。
【図5】図1で示した入力レベル判定手段の他の例を示す図。
【図6】図1で示した音判定手段の他の例を示す図。
【符号の説明】
1 音入力手段
2 入力レベル判定手段
3 音判定手段
4 音声判定手段
5 音声認識手段
6 間欠駆動制御手段
211,216,221,222 平均パワー算出部
212,217 基準レベル記憶部
213,218,223 比較部
214,219,224 入力レベル判定結果出力部
215 低域通過フィルタ
220 高域通過フィルタ
31 継続時間判定部
32,36 計時部
33 継続時間記憶部
34,37 音判定結果出力部
35 零交差数計測部
Claims (16)
- 音入力手段に入力された音声を認識して、前記認識の結果に対して何らかの動作を行う音声認識装置における認識対象音声検出方法であって、
前記音入力手段を間欠駆動し、当該間欠駆動される音入力手段が動作状態の間に入力された音に対し、当該入力された音が音声であるかを判定する処理を、複数段階の工程に分けて段階的に行い、現在処理中の工程での処理結果が当該処理中の工程に設定された条件を満たした以降に次の段階の工程が動作し、段階を経るに従って、消費電流が大きく、かつ、前記入力された音が音声であるかの判定確度の上がる処理に移行し、
それぞれの工程における処理において、その工程に設定された条件が満たされない場合は、それぞれの工程を非動作状態に戻し、
前記複数段階の工程における処理により、前記入力された音が音声であると判定された場合は、前記音入力手段の動作状態を維持し、前記入力された音の認識処理へ移行することを特徴とする認識対象音声検出方法。 - 音入力手段に入力された音声を認識してその認識結果に対して何らかの動作を行う音声認識装置における認識対象音声検出方法であって、
前記音入力手段を間欠駆動し、
間欠駆動される音入力手段が動作状態の間に入力された音のレベルを検出し、
そのレベルの大きさから音の有無を判定し、音が無いと判定した場合は、非動作状態に戻る第1の処理工程と、
前記第1の処理工程で音が有りと判定された以降に動作を開始し、前記入力された音が雑音であるか音声らしき音であるかを大まかに判定し、音声らしき音ではないと判定した場合は、非動作状態に戻る第2の処理工程と、
前記第2段階の処理工程で音声らしき音と判定された以降に動作を開始し、前記音声らしき音と判定された音が音声であるか否かを判定し、音声であると判断した場合は、前記音入力手段の動作状態を維持し、前記音声であると判断された音の音声特徴データを認識部側に渡し、音声でないと判断した場合には、非動作状態に戻る第3の処理工程と、
を有したことを特徴とする認識対象音声検出方法。 - 前記第1の処理工程は、前記音入力手段が動作状態の間に入力された音の平均パワーを求め、当該求められた平均パワーと基準レベルとを比較して音の有無を判定し、音が無いと判定した場合は、非動作状態に戻ることを特徴とする請求項2記載の認識対象音声検出方法。
- 前記第1の処理工程は、前記音入力手段が動作状態の間に入力された音を、人間の音声の周波数帯域を含む周波数帯域とそれ以外の周波数帯域に分けて少なくとも一方の周波数帯域の平均パワーを求め、当該求められた平均パワーの値を基に音を判定し、人間の音声ではないと判定した場合は、非動作状態に戻ることを特徴とする請求項2または3記載の認識対象音声検出方法。
- 前記第2の処理工程は、前記第1の処理工程での設定された条件を満たした音信号に対し、当該音信号の継続時間を計測し、当該計測した継続時間を基に音声らしき音か否かを判定し、音声らしき音ではないと判定した場合は、非動作状態に戻ることを特徴とする請求項2〜4のいずれかに記載の認識対象音声検出方法。
- 前記第2の処理工程は、前記第1の処理工程での設定された条件を満たした音信号に対し、当該音信号の所定時間内における零交差数を計測し、当該計測した零交差数を基に音声らしき音か否かを判定し、音声らしき音ではないと判定した場合は、非動作状態に戻ることを特徴とする請求項2〜5のいずれかに記載の認識対象音声検出方法。
- 前記第3の処理工程は、前記第2の処理工程での設定条件を満たした音信号に対し、音声特徴抽出処理を行い、前記音声特徴抽出処理により抽出された音声特徴データを基に、入力音が音声であるか否かを判断して音声であると判断した場合に、前記音声であると判断した音の特徴データを認識部側に渡し、音声でないと判断した場合は、非動作状態に戻ることを特徴とする請求項2〜6のいずれかに記載の認識対象音声検出方法。
- 前記認識部では、設定されたキーワードを含む音声特徴データのみを認識処理することを特徴とする請求項7記載の認識対象音声検出方法。
- 音入力手段に入力された音声を認識してその認識結果に対して何らかの動作を行う音声認識装置における認識対象音声検出装置であって、
前記音入力手段を間欠駆動する間欠駆動制御手段と、
前記間欠駆動制御手段により間欠駆動される音入力手段が動作状態の間に入力された音に対し、前記入力された音が音声であるかを判定する処理を、複数段階に分けて段階的に行うそれぞれの処理手段を有し、
現在処理中の処理手段による処理結果が、当該処理中の処理手段に設定された条件を満たした以降に、次の段階の処理手段が動作し、段階を経るに従って、消費電流が大きく、かつ、前記入力された音が音声であるかの判定確度の上がる処理に移行し、
それぞれの処理手段における処理において、その処理手段に設定された条件が満たされない場合は、それぞれの処理手段を非動作状態に戻し、
前記複数段階の処理手段における処理により、前記入力された音が音声であると判定された場合は、前記音入力手段の動作状態を維持し、前記入力された音の認識処理へ移行するようになっていることを特徴とする認識対象音声検出装置。 - 音入力手段に入力された音声を認識してその認識結果に対して何らかの動作を行う音声認識装置における認識対象音声検出装置であって、
前記音入力手段を間欠駆動する間欠駆動制御手段と、
前記間欠駆動制御手段により間欠駆動される音入力手段が動作状態の間に入力された音のレベルを検出し、前記検出した音のレベルの大きさから音の有無を判定し、音が無いと判定した場合は、非動作状態に戻る入力レベル判定手段と、
前記入力レベル判定手段で音が有りと判定された以降に動作を開始し、前記入力された音が雑音であるか音声らしき音であるかを大まかに判定し、音声らしき音でないと判定した場合は、非動作状態に戻る音判定手段と、
前記音判定手段で前記入力された音が音声らしき音と判定された以降に動作を開始し、前記音声らしき音と判定された音が音声であるか否かを判定し、音声であると判定した場合は、前記音声であると判定された音の音声特徴データを認識部側に渡し、音声でないと判断した場合には、非動作状態に戻る音声判定手段と、
を有し、
前記音判定手段が音声であると判定した場合には、前記音入力手段の動作状態を維持するようになっていることを特徴とする認識対象音声検出装置。 - 前記入力レベル判定手段は、前記音入力手段が動作状態の間に入力された音の平均パワーを求め、当該求められた平均パワーと基準レベルとを比較して音の有無を判定し、音が無いと判定した場合は、非動作状態に戻ることを特徴とする請求項10記載の認識対象音声検出装置。
- 前記入力レベル判定手段は、前記音入力手段が動作状態の間に入力された音を、人間の音声の周波数帯域を含む周波数帯域とそれ以外の周波数帯域に分けて少なくとも一方の周波数帯域の平均パワーを求め、当該求められた平均パワーの値を基に音を判定し、人間の音声ではないと判定した場合は、非動作状態に戻ることを特徴とする請求項10または11記載の認識対象音声検出装置。
- 前記音判定手段は、前記入力レベル判定手段での設定された条件を満たした音信号に対し、前記音信号の継続時間を計測し、前記計測した継続時間を基に音声らしき音か否かを判定し、音声らしき音ではないと判定した場合は、非動作状態に戻ることを特徴とする請求項10〜12のいずれかに記載の認識対象音声検出装置。
- 前記音判定手段は、前記入力レベル判定手段での設定された条件を満たした音信号に対し、前記音信号の所定時間内における零交差数を計測し、前記計測した零交差数を基に音声らしき音か否かを判定し、音声らしき音ではないと判定した場合は、非動作状態に戻ることを特徴とする請求項10〜13のいずれかに記載の認識対象音声検出装置。
- 前記音声判定手段は、前記音判定手段での設定された条件を満たした音信号に対し、音声特徴抽出処理を行い、前記音声特徴抽出処理により抽出された音声特徴データを基に入力音が音声であるか否かを判断して音声であると判断した場合に、前記音声であると判断した音の音声特徴データを認識部側に渡し、音声でないと判断した場合は、非動作状態に戻ることを特徴とする請求項10〜14のいずれかに記載の認識対象音声検出装置。
- 前記認識部では、設定されたキーワードを含む音声特徴データのみを認識対象音声として認識処理することを特徴とする請求項15記載の認識対象音声検出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP28067097A JP3726448B2 (ja) | 1997-03-12 | 1997-10-14 | 認識対象音声検出方法およびその装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5785697 | 1997-03-12 | ||
JP9-57856 | 1997-03-12 | ||
JP28067097A JP3726448B2 (ja) | 1997-03-12 | 1997-10-14 | 認識対象音声検出方法およびその装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10312194A JPH10312194A (ja) | 1998-11-24 |
JP3726448B2 true JP3726448B2 (ja) | 2005-12-14 |
Family
ID=26398947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP28067097A Expired - Fee Related JP3726448B2 (ja) | 1997-03-12 | 1997-10-14 | 認識対象音声検出方法およびその装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3726448B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10714117B2 (en) | 2013-02-07 | 2020-07-14 | Apple Inc. | Voice trigger for a digital assistant |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4812941B2 (ja) * | 1999-01-06 | 2011-11-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 注目期間を有する音声入力装置 |
US6415258B1 (en) * | 1999-10-06 | 2002-07-02 | Microsoft Corporation | Background audio recovery system |
JP2005196047A (ja) * | 2004-01-09 | 2005-07-21 | Canon Inc | 電子装置および入力設定方法 |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US9514746B2 (en) * | 2006-09-26 | 2016-12-06 | Storz Endoskop Produktions Gmbh | System and method for hazard mitigation in voice-driven control applications |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
JP4981850B2 (ja) * | 2009-06-16 | 2012-07-25 | 日本電信電話株式会社 | 音声認識装置とその方法と、プログラムと記録媒体 |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9992745B2 (en) | 2011-11-01 | 2018-06-05 | Qualcomm Incorporated | Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate |
JP2013114242A (ja) * | 2011-12-01 | 2013-06-10 | Yamaha Corp | 音響処理装置 |
KR20160036104A (ko) | 2011-12-07 | 2016-04-01 | 퀄컴 인코포레이티드 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
KR102117841B1 (ko) * | 2012-10-30 | 2020-06-02 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
US9704486B2 (en) * | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
US20140337031A1 (en) * | 2013-05-07 | 2014-11-13 | Qualcomm Incorporated | Method and apparatus for detecting a target keyword |
US9892729B2 (en) * | 2013-05-07 | 2018-02-13 | Qualcomm Incorporated | Method and apparatus for controlling voice activation |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
KR102179506B1 (ko) | 2013-12-23 | 2020-11-17 | 삼성전자 주식회사 | 전자장치 및 그 제어방법 |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
CN108597507A (zh) * | 2018-03-14 | 2018-09-28 | 百度在线网络技术(北京)有限公司 | 远场语音功能实现方法、设备、系统及存储介质 |
-
1997
- 1997-10-14 JP JP28067097A patent/JP3726448B2/ja not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10714117B2 (en) | 2013-02-07 | 2020-07-14 | Apple Inc. | Voice trigger for a digital assistant |
EP2954514B1 (en) * | 2013-02-07 | 2021-03-31 | Apple Inc. | Voice trigger for a digital assistant |
US10978090B2 (en) | 2013-02-07 | 2021-04-13 | Apple Inc. | Voice trigger for a digital assistant |
US11557310B2 (en) | 2013-02-07 | 2023-01-17 | Apple Inc. | Voice trigger for a digital assistant |
US11636869B2 (en) | 2013-02-07 | 2023-04-25 | Apple Inc. | Voice trigger for a digital assistant |
US11862186B2 (en) | 2013-02-07 | 2024-01-02 | Apple Inc. | Voice trigger for a digital assistant |
US12009007B2 (en) | 2013-02-07 | 2024-06-11 | Apple Inc. | Voice trigger for a digital assistant |
Also Published As
Publication number | Publication date |
---|---|
JPH10312194A (ja) | 1998-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3726448B2 (ja) | 認識対象音声検出方法およびその装置 | |
US7756707B2 (en) | Signal processing apparatus and method | |
US6711536B2 (en) | Speech processing apparatus and method | |
US20200227071A1 (en) | Analysing speech signals | |
JP3423906B2 (ja) | 音声の動作特性検出装置および検出方法 | |
US8874440B2 (en) | Apparatus and method for detecting speech | |
EP1355296A2 (en) | Keyword detection in a speech signal | |
JPH0713584A (ja) | 音声検出装置 | |
JPS62231997A (ja) | 音声認識システム及びその方法 | |
JP2573352B2 (ja) | 音声検出装置 | |
JP2000132181A (ja) | 音声処理装置及び方法 | |
US7475012B2 (en) | Signal detection using maximum a posteriori likelihood and noise spectral difference | |
JP2969862B2 (ja) | 音声認識装置 | |
JP2000122688A (ja) | 音声処理装置及び方法 | |
JP2002258882A (ja) | 音声認識システム及び情報記録媒体 | |
JP3510458B2 (ja) | 音声認識システムおよび音声認識制御プログラムを記録した記録媒体 | |
JPH07307707A (ja) | 音声伝送システム、送信機、移動無線セット及び伝送方法 | |
JP2000163099A (ja) | 雑音除去装置、音声認識装置および記憶媒体 | |
JPH10116097A (ja) | 音声再生装置 | |
JPH10301594A (ja) | 有音検出装置 | |
JP2002359665A (ja) | 音響機器、携帯電話及び音響機器の制御方法 | |
KR102562180B1 (ko) | 웨어러블 음향 변환 장치 | |
JPS6060076B2 (ja) | 音声認識装置 | |
JPH10290498A (ja) | 話速変換機能を有する補聴器 | |
TWI407433B (zh) | 錄音設備及利用該錄音設備進行聲音處理與錄入的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20041124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050216 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050805 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20050815 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050906 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050919 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091007 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101007 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101007 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111007 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121007 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121007 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131007 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |