JP2002297180A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2002297180A
JP2002297180A JP2001097632A JP2001097632A JP2002297180A JP 2002297180 A JP2002297180 A JP 2002297180A JP 2001097632 A JP2001097632 A JP 2001097632A JP 2001097632 A JP2001097632 A JP 2001097632A JP 2002297180 A JP2002297180 A JP 2002297180A
Authority
JP
Japan
Prior art keywords
voice
recognition
pattern
speaker
invalidation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001097632A
Other languages
English (en)
Inventor
Hiroki Onishi
宏樹 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2001097632A priority Critical patent/JP2002297180A/ja
Publication of JP2002297180A publication Critical patent/JP2002297180A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 話者等が指示しなくても、予め登録していた
認識語を使用できなくする音声認識装置を提供するこ
と。 【解決手段】識別部における識別動作において、標準音
声パターンと特定話者の発する音声とが連続して不対応
であった回数に基づいて(S1、S2)、識別動作の標
準音声パターンのサーチ候補から除外(無効化という)
する(S3)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、特定話者又は不特
定話者を対象とする音声認識装置に関する。
【0002】
【発明が解決しようとする課題】一般的に、音声認識装
置は、以下のような装置である。つまり、複数の認識語
及び文字列が予め登録されており、その後話者が発する
任意の音声がその認識語と対応するかどうか両者を照合
することで識別動作を行い、対応すると識別された場合
には登録された文字列を出力する。
【0003】そして、例えば、かかる音声認識装置を玩
具ロボットに適用した場合には、標準音声パターン及び
玩具ロボットの表現動作を登録しておくことにより、当
該玩具ロボットは特定話者の発する音声に固有の認識表
現動作を行うことで、持ち主(特定話者)の趣味にあっ
た動作を行なってそのものを喜ばせ、おもちゃとしての
価値を高める。
【0004】しかしながら、このような音声認識装置
は、予め特定話者が登録した標準音声パターンは特定話
者が削除指示をしない限り、固定的であり、その結果と
して、玩具ロボット等の表現動作も固定的となる。その
ため、何度教え込んでもなかなか憶えない(知能が低
い)、人の命令をなかなか聞かない(強情、不従順)と
いった自然性が現れない。学習効果を高めてより賢くす
るように構成することはできるものの、時として賢いこ
とは愛着度を増大させる阻害要因となる。
【0005】意思を持たない対象であっても、自然の動
物に近い振舞いを行なわせることができれば、その対象
への愛着度は増すものと考えられ、そのことは、癒しが
求められる今日であれば時代の要請に適うものと言え
る。また、音声認識装置を搭載した携帯電話でも使用者
(特定話者)が予め登録しておいた標準音声パターンを
消去するには使用者が指示しなければならず不便であ
る。
【0006】更に、不特定話者を対象とした音声認識装
置でも、登録しておいて認識語はオペレータの操作がな
ければ消去されることはない。そこで、本発明は、話者
等が指示しなくても、予め登録していた認識語を使用で
きなくする音声認識装置を提供することを目的としてな
されたものである。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、複数の音声パターンを登録する音声パタ
ーン登録手段と、前記音声パターンのうち何れに話者の
発する任意の音声が対応するか否かを識別するする識別
手段とを備えた音声認識装置であって、各音声パターン
が識別手段により話者の発する音声と対応しているもの
と識別されたか否かの履歴情報に基づいて、前記複数の
音声パターンの何れを無効とするかを決定する無効化決
定手段と、前記無効化決定手段の決定に従って、音声パ
ターンを無効化する無効化手段とを含むことを特徴とす
る。
【0008】また、複数の音声パターンを登録する音声
パターン登録手段と、前記音声パターンのうち何れに話
者の発する任意の音声が対応するか否かを識別するする
識別手段とを備えた音声認識装置であって、前記複数の
音声パターンの何れを無効とするかをランダムに決定す
る無効化決定手段と、前記無効化決定手段の決定に従っ
て、音声パターンを無効化する無効化手段とを含むこと
を特徴とする。
【0009】また、文字列又は記号列で表される複数の
認識語を記憶する認識語記憶手段と、前記認識語のうち
何れかに話者の発する任意の音声が対応するか否かを識
別する識別手段とを備えた音声認識装置であって、各認
識語が識別手段により話者の発する音声と対応している
ものと識別されたか否かの履歴情報に基づいて、前記複
数の認識語の何れを無効とするかを決定する無効化決定
手段と、前記無効化決定手段の決定に従って、認識語を
無効化する無効化手段とを含むことを特徴とする。
【0010】また、文字列又は記号列で表される複数の
認識語を記憶する認識語記憶手段と、前記認識語のうち
何れかに話者の発する任意の音声が対応するか否かを識
別する識別手段とを備えた音声認識装置であって、前記
複数の認識語の何れを無効とするかをランダムに決定す
る無効化決定手段と、前記無効化決定手段の決定に従っ
て、認識語を無効化する無効化手段とを含むことを特徴
とする。
【0011】なお、「無効化」とは、識別手段による識別
動作の際に通常は登録手段に登録された全ての音声パタ
ーン及び文字列又は記号列で表される複数の認識語と話
者の発する音声とが逐次照合されるが、そのサーチ候補
から特定の音声パターン及び文字列又は記号列で表され
る複数の認識語を除外することを意味している。
【0012】
【発明の実施の形態】以下に本発明に係る実施の形態に
ついて図面を参照としながら具体的に説明する。 [実施の形態1]図1は、第一実施形態における玩具ロボ
ット、携帯電話などに内蔵される音声認識装置1の構成
を示すブロック図である。
【0013】この音声認識装置1は、複数の標準音声パ
ターンを特定話者(ユーザ)が予め登録を行なってお
き、その後特定話者が発する任意の音声がその標準音声
パターンと対応するかどうか両者を照合することで識別
動作を行い、対応すると識別された場合にはその音声に
特有の表現動作を玩具ロボット等に実行させるものであ
る。
【0014】以下の実施形態では、図15に示すような
犬型玩具ロボットに音声認識装置1を適用した場合を例
示しながら説明する。図1に示すように、音声認識装置
1は、マイク11と、特徴抽出部12と、標準パターン
メモリ13と、回数メモリ14と、識別部15と、標準
音声パターン無効化決定部16と、認識表現動作メモリ
17と、制御部18とから構成されている。
【0015】マイク11は、標準音声パターンの登録及
び識別動作に際してオン状態とされる。そして、当該マ
イクを通じて入力されてくる音声生データD1は、特徴
抽出部12に供給される。特徴抽出部12では、音声生
データD1からその特徴量を抽出する作業を行なう。こ
の特徴量は、周波数の時間的な変動に着眼したものであ
り、以下、周波数特性と呼ぶ。この周波数特性は、一般
的に、所定時間(例えば、10msecに一度サンプリン
グ)毎の周波数の相対変化(例えば、16段階に変化を
読み取ったもの)で表される。この周波数特性によっ
て、所定の音声が発音され始めてから発音が終了するま
での間における各音声が固有に持つ周波数の変化を理解
することができる。
【0016】このように抽出された特徴データD2は、
標準音声パターンの登録に際しては、標準パターンメモ
リ13に供給され標準音声パターンとして格納され、識
別動作に際しては、識別部15に供給され識別動作に供
される。なお、標準パターンメモリ13への供給と、識
別部15への供給との供給先の切り替えは、スイッチ1
9によって行われる。
【0017】標準パターンメモリ13は、図2に示すよ
うな特徴データD2を格納している。なお、このメモリ
には、データを随時書き込み可能なRAMを用いる。図
2に示すように、各音声種毎に標準音声パターンとして
上記した周波数特性が対応付けられて格納されている。
具体的には、「わん」、「おて」、「ふせ」、「ちんちん」とい
う4種類のフレーズの音声のパターン番号(パターン
1、パターン2、パターン3、パターン4)と、それぞ
れに固有の周波数特性が対応付けられて格納されてい
る。なお、この図において各音声に対応した周波数特性
の詳細な図示は省略してあるが周波数の時間的変化を示
す。
【0018】そして、各標準音声パターンには、無効フ
ラグが割り当てられている。この無効フラグは、各標準
音声パターンを識別部での識別動作の際の候補として用
いる(有効)のか用いない(無効)のかを表すものであ
る。そして、デフォルト値としては、「0(有効)」に設
定されており、全ての標準音声パターンが認識動作のサ
ーチの候補として用いられる。無効フラグは、標準音声
パターン無効化決定部16の指示に基づいて設定が変更
される。
【0019】回数メモリ14は、図3に示すように、そ
れぞれの標準音声パターン毎に過去の識別動作において
特定話者の発する音声に連続して対応しなかった回数
(不対応回数)を更新可能に格納している。この内容
は、標準音声パターン無効化決定部16からの各標準音
声パターン毎のカウントデータが格納されたものであ
る。識別部15は、特定話者の発する音声から抽出され
た特徴データD2が何れの標準音声パターンに対応する
ものであるのかを標準音声パターンと逐次照合すること
によって識別判断する。
【0020】具体的には、図4に示すように特定話者が
発する音声が例えば「わん」という言葉であったとする
と、その特徴データD2(周波数特性)と4つの標準音
声パターン(「わん」、「おて」、「ふせ」、「ちんちん」)と
の照合を逐次行ない、一致度を点数評価する。この一致
度を表す点数がもっとも高い標準音声パターンに特定話
者の発した音声は対応すると識別判断する。図では、標
準音声パターン1が95点、パターン2が90点、パタ
ーン3が80点、パターン4が50点であった場合を例
示している。
【0021】そして、この識別判断の結果は、特定話者
の発する音声(ここでは、「わん」)が、標準音声パター
ンの何れかと対応したかを示す対応指示データD3とし
て、標準音声パターン無効化決定部16及び制御部18
に供給される。対応指示データD3のデータ構造を図5
に示す。これに示すように、対応指示データD3は、各
標準音声パターン1乃至4それぞれ毎に対応か不対応か
の何れかを表す。
【0022】標準音声パターン無効化決定部16は、標
準パターンメモリ13に格納されている標準音声パター
ンの何れを無効とするかの意思決定を行なう。無効化の
決定は、標準音声パターンが特定話者の発する音声と連
続して対応しなかった回数を基準として行われる。図6
に示す標準音声パターン無効化決定部16の動作フロー
を併用して具体的に説明する。
【0023】まず、標準音声パターン無効化決定部16
は、上記対応指示データD3の供給を受けて、回数メモ
リ14からそれぞれの標準音声パターンのカウント値を
読み出し、これを対応指示データD3の内容に基づいて
更新する。つまり、対応指示データD3にて対応すると
あるものについては、カウント値をリセットし、その他
について(不対応とあるもの)は、カウント値を1カウ
ントアップする(S1)。このようにして生成されたデ
ータをカウントデータD4と呼ぶ。
【0024】ここで、カウントデータD4のデータ構造
を図7に示す。この図に示すように、回数メモリ14か
ら読み出したデータ(図7(a))にリセット処理及び
カウントアップ処理を施す結果、対応していた「わん」の
標準音声パターンの不対応回数はゼロにリセットされて
おり、「おて」、「ふせ」、「ちんちん」の標準音声パターン
についてはそれぞれ「110010」から「110011」
に、「1111111」から「10000000」に、「1
00101」から「100110」に更新されたものとな
る。
【0025】そして、このカウントデータD4におい
て、カウント値が所定の値を超えているものがあるかど
うかを判断し(S2)、超えているものについては(S
2でY)、それが対応する標準音声パターンは識別動作
にサーチ候補のなかで対応するものとして使用される頻
度が低いものとみなして、その標準音声パターンを当該
サーチ候補からはずす決定、つまり無効化の決定を行な
う(S3)。これにより、標準音声パターンの群の中か
ら無効とする標準音声パターンが抽出されることにな
る。このようにして無効化の決定の対象となり、一旦無
効となった標準音声パターンは、特定話者が再度登録処
理を実行しない限りは自動的に復帰することはない。
【0026】ここで、S2において、回数の判断基準を
「1111111」としておけば、「ふせ」の標準音声パタ
ーンが無効化の意思決定の対象となる。この無効化の決
定は、無効化する標準音声パターンを例えばパターン番
号で示す無効化決定信号S1として、標準パターンメモ
リ13に供給される。標準パターンメモリ13は、この
無効化決定信号S1の供給を受けて、無効化の対象とな
った標準音声パターンにおいて図8に示すように対応す
る標準音声パターンに割り当てられた無効フラグの値を
「1」に反転させる。その結果、例えば、「ふせ」の標準音
声パターンが無効化の対象となっているときには、図8
に示すようにその周波数特性データに割り当てられた無
効フラグが「1」に設定される。
【0027】標準音声パターン無効化決定部16内で生
成されたカウントデータD4は回数メモリ14に読み出
す前のデータに上書して格納される。また、標準音声パ
ターン無効化決定部16は、上記した無効化の決定を行
なうと共に、対応指示データD3の供給を受けて、どの
ような認識表現を行なわせるかをも設定する(S4)。
つまり、表現動作メモリ17内のデータを読み出し表現
動作定義データD5を生成した後当該メモリに格納す
る。
【0028】図9に示すように、表現動作定義データD
5は、標準音声パターン毎に表現動作を定義したもの
で、ここでは、各音声の表現動作を前足1、前足2、後
足1、後足2、しっぽ、口、頭、耳、マイク…などの要
素(駆動系)で定義する。例えば、「わん」の認識表現と
しては、玩具ロボットがおおむ返しにわんと吠え、あた
かも飼い主になついた本物の犬のように振る舞わせるよ
うにしてある。
【0029】制御部18は、識別部15から上記した対
応指示データD3の供給を受けて、認識表現動作メモリ
17から対応したと判断されている音声に固有に定義さ
れた定義データD5を読み出し、この定義データD5の
定義内容に基づいて、認識表現動作装置(玩具ロボッ
ト)の各駆動系を駆動させるように認識表現動作指示信
号S2によって指示を出す。
【0030】上記のような音声認識装置によれば、標準
音声パターン無効化決定部16で無効とする決定の対象
となった標準音声パターンは識別動作の照合候補から外
れる。例えば、図10のように無効とされる前には、特
定話者が「ふせ」という音声を発すると、その標準音声パ
ターン(パターン3)はサーチ候補となっており、認識
表現動作も行われる。
【0031】一方、標準音声パターン無効化決定部16
で無効とする意思決定の対象となった標準音声パターン
は識別動作の照合候補から外れることから、図11のよ
うに、「ふせ」という音声の識別自体ができなくなり、そ
の結果、それに固有の認識表現動作を玩具ロボットは行
なわなくなる。このような現象は、動物の物忘れ、記憶
力が悪い、不従順などの自然な特性を表す結果となり、
玩具ロボットを動物のペットと同等に可愛がっている特
定話者にとってはその玩具ロボットへの愛着をいっそう
増す要因となる。人間は自然性に近いものを好む傾向が
あるからである。
【0032】上記説明では、無効フラグを割り当てて、
その値を反転させることによって無効とする処理を行な
ったが、これに限らず、標準パターンメモリ上から消去
するようにしても構わない。このように消去すれば、メ
モリをそのぶん有効活用することができる。このメモリ
確保の効果は音声認識装置を携帯電話に適用したときに
大である。
【0033】また、上記説明では、標準音声パターン無
効化決定部において何れの標準音声パターンを無効とす
るか否かの判断基準を不対応であった回数としたがこれ
に限られないのは無論であって、例えば、連続して不対
応であった時間(期間)を判断基準とし、この時間が所
定値を超えたものについて無効とするようにすることも
できる。この場合、カウントデータD3には、各音声と
不対応時間とが対応した不対応時間データが対応する。
図12にそのデータ構造を示す。
【0034】この図に示すように、更新前のデータにリ
セット処理及びカウントアップ処理を施す結果、対応し
ていた「わん」の標準音声パターンの不対応時間はゼロに
リセットされており、「おて」、「ふせ」、「ちんちん」の標
準音声パターンについてはそれぞれΔTだけ加算され更
新されるたものとなる。なお、t1、t2、t3、t4
は前回の認識動作の時点で不対応であった時間を示し、
Δtは、前回の認識動作の時刻から現在の認識動作の時
刻の差分を表している。
【0035】[実施の形態2]本実施形態にかかる音声認
識装置100は、基本的な構成・動作は上記実施形態と
ほぼ同様であるので、ここでは、相違点に着目して説明
する。図13に示すように、音声認識装置100は、音
声認識装置1の構成に更に、乱数発生部101を備えて
いる。
【0036】この乱数発生部101は、1〜4の登録さ
れた標準音声パターン数に対応した幅の乱数を発生する
ものである。この乱数発生部101は、識別部15から
識別動作終了信号S3を受け取ってその信号を合図に動
作を開始し乱数値を発生する。そして、発生した特定の
値の乱数が標準音声パターン無効化決定部16に供給さ
れる。図14に示す標準音声パターン無効化決定部16
の動作フローを併用してその動作について具体的に説明
する。
【0037】標準音声パターン無効化決定部16では、
乱数値を受け取ったかどうかを判断し(S11)たの
ち、その乱数値が1〜4の何れの値かを調べる(S1
2)。その結果、乱数値と同じ番号の標準音声パターン
を無効フラグを反転させるように決定を行なう(S1
3)。これにより、標準音声パターンの群の中から無効
とする標準音声パターンが抽出されることになる。
【0038】上記実施形態1では、一旦無効と決定され
たものは、その後、話者が再度登録処理を実行しない限
りは自動的に認識別動作において用いる標準音声パター
ンの候補として復帰することはなかったが、ここでは、
乱数値に対応させて無効フラグを反転させるようにして
いることから、一旦無効と決定されたものでも、話者が
再度登録処理を実行しなくても自動的に復帰する。
【0039】このようにランダムに、無効となったり、
再び認識別動作において用いる標準音声パターンの候補
として復帰すると、よりいっそう、動物の自然な特性を
表す結果となり、玩具ロボットを生き物のペットと同等
に可愛がっている特定話者にとってはその玩具ロボット
への愛着をさらにいっそう増す要因となる。次に、本発
明に係る別な実施の形態として不特定話者音声認識装置
において、同様の効果を得ることができる例を図面を参
照しながら説明する。
【0040】[実施の形態3]本実施の形態は、実施の形
態1或いは実施の形態2において説明したものと略同様
に構成できるので、実施の上での違いについて説明す
る。図16は、特定話者音声認識を対象とした図1の音
声認識装置を不特定話者音声認識に置き換えたものであ
る。なお、この図において、認識語無効化決定部26は
前記標準音声パターン無効化決定部16に対応し、同様
の名称のものは前記各部と同様の機能をもっている。
【0041】図1との違いは、不特定話者の場合は登録
が不要であるので、認識と登録とを切り替えるスイッチ
19が必要ない点にある。認識語記憶手段23には、予
め複数の認識語を文字列或いは記号列で表されたものと
して記憶させておいてもよいし、また、認識語設定手段
29により、外部から文字列或いは記号列を書き込んで
記憶させても良い。この場合、認識語設定手段29とし
ては、液晶表示器とキーボードなどのようなもので実現
できる。また、別の認識語設定手段29としては、外部
通信装置を備えておくことによりパーソナルコンピュー
タなどの外部機器で文字列或いは記号列を入力し、外部
機器から認識語記憶手段23に通信によって記憶させて
も良い。また、別な手段としてはフラッシュメモリなど
の外部メモリインターフェースとすれば、フラッシュメ
モリに予め外部機器で認識語として文字列或いは記号列
を書き込んでおくことでその内容を認識語記憶手段23
に記憶させることも可能であるし、また、認識語設定手
段29と認識語記憶手段23とを同一とすることもでき
る。
【0042】これらの場合、図2の特徴データD2と異
なり、音声周波数特性として表される音声パターンを更
に文字列或いは記号列で表したものとなる。識別部とし
ては、例えば、HMM(Hidden Markov Mode
l)などを用いれば良い。認識語記憶手段23には、図
2に対応して、 認識する言葉、 D2 わん = /wan/ おて = /ote/ ふせ = /fuse/ ちんちん = /chiNchiN/ のような文字列或いは記号列で表される特徴データD2
が記憶される。
【0043】HMMについては、「確率モデルによる音
声認識」(中川聖一著、電子情報通信学会編)などに記
述されている。以上の音声認識装置においては、オペレ
ータが消去する操作を施さなくても登録されていた認識
語は自動的に消去されることになる。
【0044】
【発明の効果】上記のように本発明の音声認識装置によ
れば、登録された認識語は識別動作の照合候補から自動
的に外れることから、話者の意思とは関係なく音声の識
別自体がなされなくなり、その結果、それに固有の表現
動作をそれを組み込む装置が行なわなくなる。
【0045】このような現象は、特定話者を対象とする
認識装置を玩具に組み込んだ場合に、例えば、動物の物
忘れ、記憶力が悪いなどの自然な特性を表す結果とな
り、玩具ロボットを生き物のペットと同等に可愛がって
いる特定話者にとってはその玩具ロボットへの愛着をい
っそう増す要因となる。また、携帯電話に適用した場合
には、使用者が削除する指示を出さなくても自動的に標
準音声パターンを消去させることもできるので便利であ
る。
【図面の簡単な説明】
【図1】第一実施の形態にかかる音声認識装置の構成を
示す図である。
【図2】標準パターンメモリのメモリ構造を示す図であ
る。
【図3】回数メモリのメモリ構造を示す図である。
【図4】識別部による識別動作を具体的に説明する図で
ある。
【図5】対応指示データのデータ構造を示す図である。
【図6】標準音声パターン無効化決定部の動作フローで
ある。
【図7】カウントデータのデータ構成(更新前後)を示
す図である。
【図8】無効化処理後の標準パターンメモリのメモリ構
造を示す図である。
【図9】表現動作定義データのデータ構造を示す図であ
る。
【図10】識別部による識別動作を具体的に説明する図
である。
【図11】識別部による識別動作を具体的に説明する図
である。
【図12】無効化の決定基準の変形例を示す図である。
【図13】第二実施の形態にかかる音声認識装置の構成
を示す図である。
【図14】第二実施形態の標準音声パターン無効化決定
部の動作フローである。
【図15】本発明の音声認識装置を組み込んだ実施形態
に共通の玩具ロボットの外観図である。
【図16】第三実施の形態にかかる音声認識装置の構成
を示す図である。
【符号の説明】
1、100 音声認識装置 11 マイク 12 特徴抽出部 13 標準パターンメモリ 14 回数メモリ 15 識別部 16 標準音声パターン無効化決定部 17 認識表現動作メモリ 18 制御部 19 スイッチ 23 認識語記憶手段 29 認識語設定手段 101 乱数発生部
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/28 G10L 3/00 571C

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 複数の音声パターンを登録する音声パタ
    ーン登録手段と、前記音声パターンのうち何れに話者の
    発する任意の音声が対応するか否かを識別するする識別
    手段とを備えた音声認識装置であって、 各音声パターンが識別手段により話者の発する音声と対
    応しているものと識別されたか否かの履歴情報に基づい
    て、前記複数の音声パターンの何れを無効とするかを決
    定する無効化決定手段と、 前記無効化決定手段の決定に従って、音声パターンを無
    効化する無効化手段とを含むことを特徴とする音声認識
    装置。
  2. 【請求項2】 前記履歴情報は、音声パターンが話者の
    発する音声と連続して不対応であった回数又は連続して
    不対応である時間であることを特徴とする請求項1に記
    載の音声認識装置。
  3. 【請求項3】 複数の音声パターンを登録する音声パタ
    ーン登録手段と、前記音声パターンのうち何れに話者の
    発する任意の音声が対応するか否かを識別するする識別
    手段とを備えた音声認識装置であって、 前記複数の音声パターンの何れを無効とするかをランダ
    ムに決定する無効化決定手段と、 前記無効化決定手段の決定に従って、音声パターンを無
    効化する無効化手段とを含むことを特徴とする音声認識
    装置。
  4. 【請求項4】 前記音声認識装置は、更に、識別手段に
    よって音声パターンに対応するものと識別された音声に
    対応した動作を、動作装置に指示する動作指示手段を含
    むことを特徴とする請求項1乃至3の何れかに記載の音
    声認識装置。
  5. 【請求項5】 文字列又は記号列で表される複数の認識
    語を記憶する認識語記憶手段と、前記認識語のうち何れ
    かに話者の発する任意の音声が対応するか否かを識別す
    る識別手段とを備えた音声認識装置であって、 各認識語が識別手段により話者の発する音声と対応して
    いるものと識別されたか否かの履歴情報に基づいて、前
    記複数の認識語の何れを無効とするかを決定する無効化
    決定手段と、 前記無効化決定手段の決定に従って、認識語を無効化す
    る無効化手段とを含むことを特徴とする音声認識装置。
  6. 【請求項6】 前記履歴情報は、各認識語が話者の発す
    る音声と連続して不対応であった回数又は連続して不対
    応である時間であることを特徴とする請求項5に記載の
    音声認識装置。
  7. 【請求項7】 文字列又は記号列で表される複数の認識
    語を記憶する認識語記憶手段と、前記認識語のうち何れ
    かに話者の発する任意の音声が対応するか否かを識別す
    る識別手段とを備えた音声認識装置であって、 前記複数の認識語の何れを無効とするかをランダムに決
    定する無効化決定手段と、 前記無効化決定手段の決定に従って、認識語を無効化す
    る無効化手段とを含むことを特徴とする音声認識装置。
  8. 【請求項8】 前記音声認識装置は、更に、識別手段に
    よって認識された認識語に対応した動作を、動作装置に
    指示する動作指示手段を含むことを特徴とする請求項5
    乃至7の何れかに記載の音声認識装置。
JP2001097632A 2001-03-29 2001-03-29 音声認識装置 Pending JP2002297180A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001097632A JP2002297180A (ja) 2001-03-29 2001-03-29 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001097632A JP2002297180A (ja) 2001-03-29 2001-03-29 音声認識装置

Publications (1)

Publication Number Publication Date
JP2002297180A true JP2002297180A (ja) 2002-10-11

Family

ID=18951386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001097632A Pending JP2002297180A (ja) 2001-03-29 2001-03-29 音声認識装置

Country Status (1)

Country Link
JP (1) JP2002297180A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007226117A (ja) * 2006-02-27 2007-09-06 Mitsubishi Electric Corp 音声認識装置、音声認識プログラム、及び音声認識方法
CN105845138A (zh) * 2016-03-25 2016-08-10 乐视控股(北京)有限公司 语音信号处理方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007226117A (ja) * 2006-02-27 2007-09-06 Mitsubishi Electric Corp 音声認識装置、音声認識プログラム、及び音声認識方法
CN105845138A (zh) * 2016-03-25 2016-08-10 乐视控股(北京)有限公司 语音信号处理方法及装置

Similar Documents

Publication Publication Date Title
US7228276B2 (en) Sound processing registering a word in a dictionary
JP4444396B2 (ja) 音声認識におけるポジション操作
CN102270450B (zh) 多模型自适应和语音识别装置及其方法
JP4510953B2 (ja) 音声認識におけるノンインタラクティブ方式のエンロールメント
JP2002358095A5 (ja)
US20200058300A1 (en) Proactive command framework
JP3860613B2 (ja) 音声信号中の発声単語列の認識方法及び装置
CN108630200B (zh) 声音关键字检测装置以及声音关键字检测方法
JP7158217B2 (ja) 音声認識方法、装置及びサーバ
US20050203737A1 (en) Speech recognition device
CA2507999A1 (en) Sensor based speech recognizer selection, adaptation and combination
JP2000122691A (ja) 綴り字読み式音声発話の自動認識方法
JP2000315096A5 (ja)
US10783876B1 (en) Speech processing using contextual data
JP2017167270A (ja) 音声処理装置および音声処理方法
JPWO2005062296A1 (ja) 機器制御装置及び機器制御方法
JP4905522B2 (ja) 機器制御装置、機器制御方法及びプログラム
CN114530145B (zh) 语音识别结果纠错方法及装置、计算机可读存储介质
JP2014164261A (ja) 情報処理装置およびその方法
JP2000305589A (ja) 適応型音声認識装置,音声処理装置,及びペット玩具
JP2002297180A (ja) 音声認識装置
JP4440502B2 (ja) 話者認証システム及び方法
Markert et al. Neural associative memories for the integration of language, vision and action in an autonomous agent
CN117223052A (zh) 基于神经网络的关键词检出方法
JP2000352992A (ja) 音声認識装置