JPH07244494A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH07244494A
JPH07244494A JP6034580A JP3458094A JPH07244494A JP H07244494 A JPH07244494 A JP H07244494A JP 6034580 A JP6034580 A JP 6034580A JP 3458094 A JP3458094 A JP 3458094A JP H07244494 A JPH07244494 A JP H07244494A
Authority
JP
Japan
Prior art keywords
voice
similarity
input
pattern data
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6034580A
Other languages
English (en)
Inventor
Keiichi Miyamoto
恵一 宮本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP6034580A priority Critical patent/JPH07244494A/ja
Publication of JPH07244494A publication Critical patent/JPH07244494A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 低消費電力動作状態においても音声認識が可
能な音声認識装置を提供する。 【構成】 入力音声信号における音声区間における特徴
量を含む特徴パターンデータと複数の音声に対する予め
格納済の基準パターンデータとの類似度の比較判定動作
をクロック信号に基づき行う類似度比較判定手段30を
備え、入力音声の認識を行う音声認識装置であって、入
出力側が上記類似度比較判定手段に接続され上記類似度
比較判定結果が所定の音声候補である場合若しくは一定
時間以上音声入力がない場合には上記クロック信号の周
波数を基準値よりも低下させる制御手段40を備えた。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声認識装置に関し、
特に音声認識結果に基づき何らかの動作をするものであ
って低消費電力化を効果的に行う音声認識装置に関す
る。
【0002】
【従来の技術】音声認識を利用した機器の中でも、携帯
性を重視したものや、電池駆動を前提としたがん具等
は、その音声認識を行う構成部分の消費電力が問題とさ
れている。一般に音声認識を行う部分は、音声の特徴パ
ターンを抽出する特徴抽出部分と、その特徴パターンが
どの基準(標準)パターンと類似しているかを見出す類似
度演算/判定部と、から構成されている。上記特徴抽出
部分は、信号をアナログ処理する場合にはバンドパスフ
ィルターバンク等、またディジタル処理を行う場合には
A/DコンバーターとDSP等で構成される。上記類似
度演算/判定部は、CPU(中央演算処理装置)が類似
度演算のアルゴリズムにのっとったソフトウエアで実行
する場合や、専用のハードウエアロジックで行う場合が
多い。このような音声認識に係わる部分は一般的に消費
電力が多く、常時動作させていると、電源である電池
(一次、二次)の消耗が激しくなり、実用的でない。よっ
てこのような欠点を克服するために種々の提案がなされ
ている。
【0003】例えば、特開昭62−245296号公
報、特開平3−202899号公報(以下、これら公報
の発明を従来技術1とする)には、一定期間音声の入力
がないと音声認識部への電源供給を停止するものが開示
されている。又、特開昭58−55991号公報(以
下、この公報の発明を従来技術2とする)には従来技術
1に加えて、常時動作している音声検出部が音声を検知
したときに認識部への電源供給を開始することにより、
音声認識機能を再開させようとするものが開示されてい
る。
【0004】
【発明が解決しようとする課題】従来技術1では電源が
切れた後に音声認識動作をさせたいときは別途電源スイ
ッチをオンする等の操作が必要であり煩わしさがある。
又、従来技術2では従来技術1の欠点を克服しているよ
うであるが、実際には低消費電力の音声検出部としては
上記公報に開示されるような非常に簡単な積分器程度の
構成しか期待できないため、雑音による誤動作や、音声
始端の欠落などがあり、その検出結果から切り出した音
声区間を認識対象としたときの認識精度は高くない。ま
た、区間検出後に電源が入る第1回目の発声では音声始
端の欠落はより多くなってしまう。この欠落を避けるに
は、BBD等のアナログ遅延素子を採用すればよいが、
もはや低消費電力を目指した構成とはならない。
【0005】一方、玩具等のアプリケーションでは、音
声認識部分の電源が切れている場合でも何らかの方法に
て音声で動作させたほうが望ましい場合があるが、従来
技術1の構成ではこれに対応できない。又、従来技術2
の構成では通常動作時の高い認識精度が期待できず、
又、低消費電力化が困難である。本発明は上述したよう
な問題点を解決するためになされたもので、低消費電力
動作状態においても音声認識が可能な音声認識装置を提
供することを目的とする。
【0006】
【課題を解決するための手段】本発明は、入力音声が供
給され入力音声信号における音声区間における特徴量を
含む特徴パターンデータを送出する前処理手段と、上記
前処理手段に接続され上記特徴パターンデータと複数の
音声に対する予め格納済の基準パターンデータとの類似
度の比較判定動作をクロック信号に基づき行う類似度比
較判定手段とを備え、入力音声の認識を行う音声認識装
置であって、入力側が上記前処理手段及び上記類似度比
較判定手段に接続されかつ出力側が上記類似度比較判定
手段に接続され上記類似度比較判定結果が所定の音声候
補でない場合若しくは一定時間以上音声入力がない場合
には上記クロック信号の周波数を基準値よりも低下させ
る制御手段を備えたことを特徴とする。
【0007】
【作用】このように構成することで制御手段は、例えば
一定時間以上音声の入力がない場合にはクロック信号の
周波数を基準値より低下させることで、類似度比較判定
手段の動作速度を下げ消費電力の低減を図るように作用
する。又、類似度比較判定手段は、低消費電力時にあっ
ても音声認識を行うように作用する。
【0008】
【実施例】本発明の音声認識装置の一実施例を図を参照
しながら以下に説明する。図1に示すように本実施例の
音声認識装置は以下の構成をなす。本実施例の音声認識
装置は、音声に従い何らかの動作を行う例えばがん具に
使用されるもので、大きく分類すると入力音声の前処理
部10と、入力音声信号から特徴パターンを抽出する特
徴抽出部20と、特徴パターンと基準パターンとの類否
を演算判定する類似度演算判定部30と、類似度演算判
定部30へ供給するクロック信号の周波数を制御するク
ロック制御部40と、動作部50とに区分される。
【0009】前処理部10は、マイク11と、マイク1
1から音声信号が供給される音声入力部12と、音声入
力部12の出力側に接続され音声区間を検出し該音声区
間の開始及び終了に対応する時間情報を送出する音声検
出部13と、入力側が音声入力部12に接続され音声の
音量を判定する音量判定部14とを備える。又、音声検
出部13の出力側は特徴抽出部20及び後述のクロック
制御部40に接続され、音声入力部12の出力側は特徴
抽出部20に接続され、音量判定部14の出力側は後述
の類似度判定部33に接続される。
【0010】特徴抽出部20は、音声検出部13から供
給される上記時間情報に基づき、音声入力部12から供
給される音声信号から音声区間を選択し、該音声区間に
ついて例えば10m秒毎に音声信号の特徴量を抽出す
る。特徴抽出部20の出力側は、類似度演算部32及び
類似度判定部33に接続される。
【0011】類似度演算判定部30は、音声認識辞書部
31と、類似度演算部32と、類似度判定部33とを備
えている。音声認識辞書部31は、複数の音声のそれぞ
れについての特徴パターンを格納している。尚、特徴パ
ターンとは、上述したように例えば特徴抽出部20のよ
うな装置にて抽出された音声の特徴量を集合したもので
ある。類似度演算部32は、入力側に特徴抽出部20の
出力が接続されかつ音声認識辞書部31と入出力が接続
され、特徴抽出部32から供給される特徴量を音声区間
分集合させてなる特徴パターンと音声認識辞書部31か
ら供給される特徴パターンである基準パターンとを比較
し類似度を演算する。類似度判定部33は、類似度演算
部32から供給される類似度情報について所定のしきい
値を基準にして入力音声が音声認識辞書部31に格納す
るいずれの単語と一致又は近似するかを判別する。類似
度判定部33の出力側は、クロック制御部40及び後述
のモータ制御部51に接続される。
【0012】クロック制御部40の出力側は類似度演算
判定部30の各構成部分31ないし33に接続され、ク
ロック制御部40は、類似度演算判定部30の各構成部
分31ないし33に対して選択的にクロック周波数を変
化させ、供給又は非供給するものであり、音声認識結果
が所定の候補である場合もしくは、一定時間以上音声入
力がなかった場合にはクロック周波数を基準値よりも低
下させる。また、この状態において認識結果が前記限ら
れた一部の認識辞書中であらかじめ定められた確度以上
であった場合、クロック周波数を上記基準値まで増加さ
せるように前記クロック制御部を動作するように成し、
同時にそれ以降の認識対象を前記音声認識辞書全体にす
るように成したことを特徴としている。
【0013】動作部50は、可動部53と、該可動部5
3を動作させるモータ/アクチエータ52と、モータ/
アクチエータ52の動作を制御するモータ制御部51と
を備え、モータ制御部51の入力側には類似度判定部3
3の出力が接続される。
【0014】このように構成される本実施例における音
声認識装置の動作を以下に説明する。尚、本実施例の音
声認識装置は図2に示すようなロボットおもちゃに備わ
るとする。音声認識辞書31には、図3に示すように、
予め数語の音声認識特徴量(以下パターン)が登録されて
いるとする。本例においてその特徴パターンは、「めざ
めよ」、「バスター」、「進め」、「やっつけろ」であるとす
る。これらの特徴パターンには順に1,2,3,4と単語
番号が付される。このとき単語番号「1」には目覚めの
動作、単語番号「2」にはそのロボットの名前、単語番
号「3」には前進に対応する言葉、単語番号「4」には
攻撃動作に対応する言葉というように、予め大体の意味
内容との対応が決められているとする。
【0015】まず、音声の一般的な認識動作を説明す
る。マイク11から入力された操作者の音声は、音声入
力部12を介して音声検出部13へ供給されるとともに
特徴抽出部20へ供給される。音声検出部13では、入
力音声情報から音声と判断される区間を選択的に選び出
し(区間検出: セグメンテーション)、その区間の開始及
び終了に関する時間情報を送出する。特徴抽出部20
は、音声入力部12から供給される音声信号と、音声検
出部13から供給される上記区間の開始、終了に関する
時間情報とに基づき、音声が存在する区間から特徴量を
抽出し、該特徴量を類似度演算部32へ送出する。
【0016】該特徴量は類似度演算部32において音声
区間分集合され特徴パターンとなり、該特徴パターンは
音声認識辞書31内のそれぞれの基準パターンと照合さ
れ、各特徴パターン毎に類似度が計算される。類似度判
定部33では、音量判定部14から供給される音量情報
と類似度演算部32から供給される、各特徴パターンに
対する入力音声の類似度情報とに基づき、入力音声が音
声認識辞書31に格納された単語のいずれに最も近いか
を判定し、該判定結果に基づきモータの動かしかたを決
定する。
【0017】モータ制御部51では、類似度判定部33
から供給されるモータの動かしかたの情報を選択し、モ
ータ/アクチェータ52を駆動させる。これによって可
動部53は動作する。尚、本実施例では、可動部53は
図2に示すロボットの腕、首、足である。類似度判定部
33における認識結果が「バスター」ならは、ロボットの
全身をがたがた震わせる、「進め」ならロボットの足を動
かして前進し、「やっつけろ」ならロボットの腕を振る、
等と動作を対応付けておけば楽しい玩具となろう。
【0018】次に、本実施例の音声認識装置におけるク
ロック制御について説明する。主電源(不図示)が投入さ
れた直後には当該音声認識装置全体の動作を制御するシ
ステムコントローラ(不図示)から送出される制御信号
にて、又、予め定められた期間以上発声者が発声しない
場合には音声検出部13から上記時間情報の供給がない
ことを検知することで、クロック制御部40は予め定め
た、基準値よりも低い動作周波数(以下、低クロックと
記す)を類似度演算判定部30を構成する各構成部分3
1ないし33へ送出する。又、同時に、類似度演算部3
2は低クロックの供給を検知することで、認識対象単語
について単語番号1、2のみに限定する。このように類
似度演算部32は、低クロックの供給を検出したときに
は音声認識辞書31に格納される第1番目の単語から所
定数のみを認識対象とすることもできるが、音声認識辞
書31に格納される各単語の基準パターンを示すデータ
に低クロック状態には認識対象となる旨の所定データを
予め付加しておき、上記所定データの有無を判断するこ
とで認識対象の単語を選択するようにしてもよい。
【0019】このように認識対象を限定することで低ク
ロック時でも認識処理に要する時間が長大化することを
防ぐことができる。即ち、低クロック供給状態では、類
似度演算部32に供給された音声情報は、単語番号
「1」の「めざめよ」と、単語番号「2」の「バスター」と
の2単語のみと類似度が演算される。この演算の結果、
類似度判定部33は、認識の確からしさを表す、確度が
予め定められたある閾値以上である場合、即ち、入力音
声を上記単語番号「1」,「2」のいずれかであると認
識できた場合にはクロック制御部40に対して制御信号
を送出する。クロック制御部40は、上記制御信号の供
給に基づき、上記基準値である予め定められた高い動作
周波数(以下、高クロックと記す)を類似度演算判定部3
0の各構成部分31ないし33へ送出し始める。そして
類似度演算部32は、高クロックの供給を判断材料とし
て、以後の認識対象単語を音声認識辞書31に格納する
すべての単語にするように制御する。尚、上記確度が上
記閾値に満たない場合、即ち入力音声を認識できなかっ
た場合には、類似度判定部33は、基本的に、クロック
制御部40に対して制御信号を送出することはなくその
まま低クロックにて動作するが、認識できなかったとは
いえ何等かの音声が入力されたことに変わりはないこと
から、上記制御信号を送出し高クロックにて動作するよ
うにしてもよい。又、類似度判定部33が送出する認識
結果に応じて、入力音声を認識したことを音声発生者に
知らせるために入力音声に対して例えば応答するような
所定の動作を動作部50が完了した後に類似度演算部3
2は以後の認識対象単語を音声認識辞書31に格納する
すべての単語とするようにしてもよい。
【0020】したがって高クロック供給開始以降は、N
(Nは自然数)単語例えば40単語を認識対象としても
十分に速い反応時間を達成することができる。この場合
認識処理のみに着目すれば、対象単語は低クロック供給
時で2単語、高クロック供給時で40単語であるから、
供給するクロックの周波数比は2:40とすることがで
きることがわかる。LSI(大規模集積回路)の主流で
あるCMOSプロセスでは、クロック周波数と消費電流
とがほぼ比例するため、低クロック供給時における周波
数を下げることで消費電力をより低減することができそ
の効果は大きい。又、認識動作を繰り返した後、一定期
間音声入力がなければ、類似度判定部33からクロック
制御部40へ送出される制御信号により再びクロック制
御部40は低クロックを送出し、消費電力を低減する。
【0021】尚、上述した実施例では、低クロック送出
の基準として音声入力のない時間を材料としたが、キー
ワードを決めておきこのキーワードが認識結果となった
ときに、低クロック送出状態に移行するようにしてもよ
い。このようにキーワードを使用した場合、例えば上記
キーワードを「眠れ」とすると、「眠れ」の音声を認識
したときには低クロック状態となり低消費電力状態とす
るようなことが可能となり、例えばがん具に本実施例の
音声認識装置を使用した場合にはよりおもしろい態様を
得ることができる。
【0022】又、本実施例では音声認識のアルゴリズム
や特徴量また可動部および電源制御部の制御方法等につ
いて何ら限定するものではない。
【0023】
【発明の効果】以上詳述したように本発明によれば、例
えば一定時間以上音声の入力がない場合にはクロック信
号の周波数を基準値よりも低下させるようにしたことよ
り、類似度比較判定手段の動作速度を下げ消費電力の低
減を図ることができる。又、このような低消費電力時に
あっても類似度比較判定手段にはクロック信号が供給さ
れているので、音声認識を行うことができる。
【図面の簡単な説明】
【図1】 本発明の音声認識装置の一実施例における構
成を示すブロック図である。
【図2】 図1に示す音声認識装置が使用される一例で
あるがん具を示す図である。
【図3】 図1に示す音声認識辞書に格納される単語等
を示す図である。
【符号の説明】
10…前処理部、12…音声入力部、13…音声検出
部、14…音量判定部、20…特徴抽出部、30…類似
度演算判定部、31…音声認識辞書部、32…類似度演
算部、33…類似度判定部、40…クロック制御部、5
0…作動部、51…モータ制御部、52…モータ/アク
チュエータ、53…可動部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力音声が供給され入力音声信号におけ
    る音声区間における特徴量を含む特徴パターンデータを
    送出する前処理手段と、上記前処理手段に接続され上記
    特徴パターンデータと複数の音声に対する予め格納済の
    基準パターンデータとの類似度の比較判定動作をクロッ
    ク信号に基づき行う類似度比較判定手段とを備え、入力
    音声の認識を行う音声認識装置であって、 入力側が上記前処理手段及び上記類似度比較判定手段に
    接続されかつ出力側が上記類似度比較判定手段に接続さ
    れ上記類似度比較判定結果が所定の音声候補でない場合
    若しくは一定時間以上音声入力がない場合には上記クロ
    ック信号の周波数を基準値よりも低下させる制御手段を
    備えたことを特徴とする音声認識装置。
  2. 【請求項2】 上記類似度比較判定手段は、周波数の低
    下したクロック信号が供給された場合には上記特徴パタ
    ーンデータとの類似度比較判定の対象とする上記基準パ
    ターンデータを所定の基準パターンデータに限定する、
    請求項1記載の音声認識装置。
  3. 【請求項3】 類似度比較判定の対象とする上記基準パ
    ターンデータを所定の基準パターンデータに限定してい
    る状態において類似度比較判定結果が上記限られた基準
    パターン中で所定の確度を有するとき、上記類似度比較
    判定手段は上記制御手段に対して上記クロックの周波数
    を上記基準値へ増加させる信号を送出する、請求項2記
    載の音声認識装置。
  4. 【請求項4】 上記制御手段に対して上記クロックの周
    波数を上記基準値へ増加させる場合、上記類似度比較判
    定手段は以後の類似度比較判定対象を上記基準パターン
    データのすべてとする、請求項3記載の音声認識装置。
JP6034580A 1994-03-04 1994-03-04 音声認識装置 Pending JPH07244494A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6034580A JPH07244494A (ja) 1994-03-04 1994-03-04 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6034580A JPH07244494A (ja) 1994-03-04 1994-03-04 音声認識装置

Publications (1)

Publication Number Publication Date
JPH07244494A true JPH07244494A (ja) 1995-09-19

Family

ID=12418266

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6034580A Pending JPH07244494A (ja) 1994-03-04 1994-03-04 音声認識装置

Country Status (1)

Country Link
JP (1) JPH07244494A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004220437A (ja) * 2003-01-16 2004-08-05 Renesas Technology Corp 情報認識装置
JP2015501450A (ja) * 2011-11-01 2015-01-15 クゥアルコム・インコーポレイテッドQualcomm Incorporated オーディオ特徴データの抽出と分析
JP2016505897A (ja) * 2013-01-04 2016-02-25 コピン コーポレーション 二分岐音声認識
US9564131B2 (en) 2011-12-07 2017-02-07 Qualcomm Incorporated Low power integrated circuit to analyze a digitized audio stream
KR20200060301A (ko) * 2017-10-20 2020-05-29 상하이 캠브리콘 인포메이션 테크놀로지 컴퍼니 리미티드 처리방법 및 장치

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004220437A (ja) * 2003-01-16 2004-08-05 Renesas Technology Corp 情報認識装置
US7315649B2 (en) 2003-01-16 2008-01-01 Renesas Technology Corp. Information recognition device operating with low power consumption
JP2015501450A (ja) * 2011-11-01 2015-01-15 クゥアルコム・インコーポレイテッドQualcomm Incorporated オーディオ特徴データの抽出と分析
US9992745B2 (en) 2011-11-01 2018-06-05 Qualcomm Incorporated Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate
US9564131B2 (en) 2011-12-07 2017-02-07 Qualcomm Incorporated Low power integrated circuit to analyze a digitized audio stream
US10381007B2 (en) 2011-12-07 2019-08-13 Qualcomm Incorporated Low power integrated circuit to analyze a digitized audio stream
US11069360B2 (en) 2011-12-07 2021-07-20 Qualcomm Incorporated Low power integrated circuit to analyze a digitized audio stream
US11810569B2 (en) 2011-12-07 2023-11-07 Qualcomm Incorporated Low power integrated circuit to analyze a digitized audio stream
JP2016505897A (ja) * 2013-01-04 2016-02-25 コピン コーポレーション 二分岐音声認識
KR20200060301A (ko) * 2017-10-20 2020-05-29 상하이 캠브리콘 인포메이션 테크놀로지 컴퍼니 리미티드 처리방법 및 장치

Similar Documents

Publication Publication Date Title
JP3284832B2 (ja) 音声認識対話処理方法および音声認識対話装置
US5983186A (en) Voice-activated interactive speech recognition device and method
US6751595B2 (en) Multi-stage large vocabulary speech recognition system and method
JP3789246B2 (ja) 音声区間検出装置、音声区間検出方法、音声認識装置、音声認識方法および記録媒体
JP2001029649A (ja) 音声認識により音声視覚表示を行うゲーム機
JPH02238495A (ja) 時系列信号認識装置
CN112700782A (zh) 语音处理方法和电子设备
WO2010128560A1 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
JP3611223B2 (ja) 音声認識装置及び方法
EP1376537B1 (en) Apparatus, method, and computer-readable recording medium for recognition of keywords from spontaneous speech
WO2018068422A1 (zh) 一种提高油烟机语音识别率的方法及系统
JP2002215187A (ja) 音声認識方法及びその装置
JPH07244494A (ja) 音声認識装置
JP3446857B2 (ja) 音声認識装置
CN115762521A (zh) 一种关键词识别方法及相关装置
JP2011118290A (ja) 音声認識装置
JPH0830290A (ja) 音声入力可能な情報処理装置およびそれにおける誤処理検出方法
WO2004008433A2 (en) System and method for mandarin chinese speech recognition using an optimized phone set
JP4094255B2 (ja) コマンド入力機能つきディクテーション装置
JP2004151562A5 (ja)
JP2754960B2 (ja) 音声認識装置
JPH0774960B2 (ja) テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
US20060136210A1 (en) System and method for tying variance vectors for speech recognition
JPH01321499A (ja) 音声認識装置
JP2006209077A (ja) 音声対話装置、および方法