JP4784056B2 - 音声認識機能付制御装置 - Google Patents
音声認識機能付制御装置 Download PDFInfo
- Publication number
- JP4784056B2 JP4784056B2 JP2004238741A JP2004238741A JP4784056B2 JP 4784056 B2 JP4784056 B2 JP 4784056B2 JP 2004238741 A JP2004238741 A JP 2004238741A JP 2004238741 A JP2004238741 A JP 2004238741A JP 4784056 B2 JP4784056 B2 JP 4784056B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- acoustic model
- recognition result
- input
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
図1は本実施形態の音声認識機能付制御装置のブロック図であり、この音声認識機能付制御装置Aは、マイク1と、特徴量抽出部2と、音響モデル保存部3と、認識部4と、スイッチ5と、制御部6と、入力音声保存制御部7と、音響モデル学習部8と、タイマ部9とを主要な構成として備えている。尚、タイマ部9を付加した点以外は背景技術で説明した図6の音声認識機能付制御装置Aと略同様であるので、共通する構成要素には同一の符号を付して、その説明は省略する。
本発明の実施形態2を図3に基づいて説明する。図3は本実施形態の音声認識機能付制御装置のブロック図であり、この音声認識機能付制御装置Aは、マイク1と、特徴量抽出部2と、音響モデル保存部3と、認識部4と、スイッチ5と、制御部6と、入力音声保存制御部7と、音響モデル学習部8と、タイマ部9と、制御状態記憶部10とを主要な構成として備えている。尚、制御状態記憶部10を付加した点以外は実施形態1で説明した音声認識機能付制御装置Aと略同様であるので、共通する構成要素には同一の符号を付して、その説明は省略する。
本発明の実施形態3を図4に基づいて説明する。本実施形態の音声認識機能付制御装置は、実施形態1の音声認識機能付制御装置Aにおいて人感センサ11を付加してある。なお、人感センサ11以外の構成は実施形態1で説明した音声認識機能付制御装置Aと同様であるので、共通する構成要素には同一の符号を付して、その説明は省略する。
本発明の実施形態4を図5に基づいて説明する。尚、音声認識機能付制御装置Aの基本的な構成は実施形態1〜3と同様であるので、共通する構成要素には同一の符号を付して、その説明は省略する。
B 照明装置
2 特徴量抽出部
3 音響モデル保存部
4 認識部
5 スイッチ
6 制御部
7 入力音声保存制御部
8 音響モデル学習部
Claims (5)
- 制御対象機器を操作するために人が発した音声または雑音の何れかである音が入力され、入力音を電気信号である音声信号に変換して出力する音変換部と、
前記音声信号より入力音の特徴量を抽出する特徴量抽出部と、
複数の音声および雑音の各々について特徴量をモデル化した音響モデルを保存する音響モデル部と、
前記特徴量抽出部が抽出した特徴量と前記音響モデル部に保存された音響モデルとを比較することによって入力音を認識する認識部と、
前記認識部の認識結果に応じた動作を行わせるための制御信号を制御対象機器に出力する制御部と、
操作に応じた制御信号を制御対象機器に直接出力する操作部と、
前記音声信号と前記認識部の認識結果とを対応付けて保存する入力音声保存部と、
前記入力音声保存部に保存された認識結果と該認識結果に対応する音声信号とを用いて前記認識結果に対応する入力音の音響モデルを再学習し、前記音響モデル部に保存された音響モデルを更新する音響モデル学習部と、
前記認識部から前記制御部へ認識結果が入力された時点より所定の限時時間を限時するタイマ部とを備え、
前記タイマ部の限時動作中に前記認識部の認識結果とは制御内容が異なる制御信号が前記操作部から出力された場合、前記入力音声保存部は、保存している認識結果を、前記操作部から出力された制御信号の内容に基づいて修正し、前記音響モデル学習部が該修正された認識結果と入力音声とを用いて前記修正された認識結果に対応する入力音の音響モデルを再学習し、
制御対象機器がオフしている状態で前記認識部が入力音を雑音と認識してから前記タイマ部の限時動作が終了するまでの間に前記操作部から制御対象機器をオンさせる制御信号が出力されると、前記入力音声保存部は、雑音と認識された認識結果をオン操作のための音声に修正して保存することを特徴とする音声認識機能付制御装置。 - 制御対象機器を操作するために人が発した音声または雑音の何れかである音が入力され、入力音を電気信号である音声信号に変換して出力する音変換部と、
前記音声信号より入力音の特徴量を抽出する特徴量抽出部と、
複数の音声および雑音の各々について特徴量をモデル化した音響モデルを保存する音響モデル部と、
前記特徴量抽出部が抽出した特徴量と前記音響モデル部に保存された音響モデルとを比較することによって入力音を認識する認識部と、
前記認識部の認識結果に応じた動作を行わせるための制御信号を制御対象機器に出力する制御部と、
操作に応じた制御信号を制御対象機器に直接出力する操作部と、
前記音声信号と前記認識部の認識結果とを対応付けて保存する入力音声保存部と、
前記入力音声保存部に保存された認識結果と該認識結果に対応する音声信号とを用いて前記認識結果に対応する入力音の音響モデルを再学習し、前記音響モデル部に保存された音響モデルを更新する音響モデル学習部と、
前記認識部から前記制御部へ認識結果が入力された時点より所定の限時時間を限時するタイマ部とを備え、
前記タイマ部の限時動作中に前記認識部の認識結果とは制御内容が異なる制御信号が前記操作部から出力された場合、前記入力音声保存部は、保存している認識結果を、前記操作部から出力された制御信号の内容に基づいて修正し、前記音響モデル学習部が該修正された認識結果と入力音声とを用いて前記修正された認識結果に対応する入力音の音響モデルを再学習し、
制御対象機器がオフしている状態で前記認識部が入力音をオン操作のための音声と認識してから前記タイマ部の限時動作が終了するまでの間に前記操作部から制御対象機器をオフさせる制御信号が出力されると、前記入力音声保存部はオン操作のための音声と認識された認識結果を雑音に修正して保存することを特徴とする音声認識機能付制御装置。 - 制御対象機器を操作するために人が発した音声または雑音の何れかである音が入力され、入力音を電気信号である音声信号に変換して出力する音変換部と、
前記音声信号より入力音の特徴量を抽出する特徴量抽出部と、
複数の音声および雑音の各々について特徴量をモデル化した音響モデルを保存する音響モデル部と、
前記特徴量抽出部が抽出した特徴量と前記音響モデル部に保存された音響モデルとを比較することによって入力音を認識する認識部と、
前記認識部の認識結果に応じた動作を行わせるための制御信号を制御対象機器に出力する制御部と、
操作に応じた制御信号を制御対象機器に直接出力する操作部と、
前記音声信号と前記認識部の認識結果とを対応付けて保存する入力音声保存部と、
前記入力音声保存部に保存された認識結果と該認識結果に対応する音声信号とを用いて前記認識結果に対応する入力音の音響モデルを再学習し、前記音響モデル部に保存された音響モデルを更新する音響モデル学習部と、
前記認識部から前記制御部へ認識結果が入力された時点より所定の限時時間を限時するタイマ部とを備え、
前記タイマ部の限時動作中に前記認識部の認識結果とは制御内容が異なる制御信号が前記操作部から出力された場合、前記入力音声保存部は、保存している認識結果を、前記操作部から出力された制御信号の内容に基づいて修正し、前記音響モデル学習部が該修正された認識結果と入力音声とを用いて前記修正された認識結果に対応する入力音の音響モデルを再学習し、
制御対象機器の動作状態を記憶する制御状態記憶部を備え、入力音が、前記制御状態記憶部に記憶されている現在の動作状態に制御対象機器を操作するための音声であると前記認識部が認識した場合、前記入力音声保存部は操作のための音声と認識された認識結果を雑音に修正して保存することを特徴とする音声認識機能付制御装置。 - 制御対象機器を操作するために人が発した音声または雑音の何れかである音が入力され、入力音を電気信号である音声信号に変換して出力する音変換部と、
前記音声信号より入力音の特徴量を抽出する特徴量抽出部と、
複数の音声および雑音の各々について特徴量をモデル化した音響モデルを保存する音響モデル部と、
前記特徴量抽出部が抽出した特徴量と前記音響モデル部に保存された音響モデルとを比較することによって入力音を認識する認識部と、
前記認識部の認識結果に応じた動作を行わせるための制御信号を制御対象機器に出力する制御部と、
操作に応じた制御信号を制御対象機器に直接出力する操作部と、
前記音声信号と前記認識部の認識結果とを対応付けて保存する入力音声保存部と、
前記入力音声保存部に保存された認識結果と該認識結果に対応する音声信号とを用いて前記認識結果に対応する入力音の音響モデルを再学習し、前記音響モデル部に保存された音響モデルを更新する音響モデル学習部と、
前記認識部から前記制御部へ認識結果が入力された時点より所定の限時時間を限時するタイマ部とを備え、
前記タイマ部の限時動作中に前記認識部の認識結果とは制御内容が異なる制御信号が前記操作部から出力された場合、前記入力音声保存部は、保存している認識結果を、前記操作部から出力された制御信号の内容に基づいて修正し、前記音響モデル学習部が該修正された認識結果と入力音声とを用いて前記修正された認識結果に対応する入力音の音響モデルを再学習し、
前記音変換部の集音範囲を少なくとも含む検知エリア内で人の存否を検知する人感センサを設け、当該人感センサが人の存在を検知していない状態で、前記認識部が入力音を操作のための音声と認識した場合、前記入力音声保存部は、操作のための音声と認識された認識結果を雑音と修正して保存することを特徴とする音声認識機能付制御装置。 - 制御対象機器を操作するために人が発した音声または雑音の何れかである音が入力され、入力音を電気信号である音声信号に変換して出力する音変換部と、
前記音声信号より入力音の特徴量を抽出する特徴量抽出部と、
複数の音声および雑音の各々について特徴量をモデル化した音響モデルを保存する音響モデル部と、
前記特徴量抽出部が抽出した特徴量と前記音響モデル部に保存された音響モデルとを比較することによって入力音を認識する認識部と、
前記認識部の認識結果に応じた動作を行わせるための制御信号を制御対象機器に出力する制御部と、
操作に応じた制御信号を制御対象機器に直接出力する操作部と、
前記音声信号と前記認識部の認識結果とを対応付けて保存する入力音声保存部と、
前記入力音声保存部に保存された認識結果と該認識結果に対応する音声信号とを用いて前記認識結果に対応する入力音の音響モデルを再学習し、前記音響モデル部に保存された音響モデルを更新する音響モデル学習部と、
前記認識部から前記制御部へ認識結果が入力された時点より所定の限時時間を限時するタイマ部とを備え、
前記タイマ部の限時動作中に前記認識部の認識結果とは制御内容が異なる制御信号が前記操作部から出力された場合、前記入力音声保存部は、保存している認識結果を、前記操作部から出力された制御信号の内容に基づいて修正し、前記音響モデル学習部が該修正された認識結果と入力音声とを用いて前記修正された認識結果に対応する入力音の音響モデルを再学習し、
前記認識部が入力音を音声と認識してから一定時間が経過するまでの間に、前記認識部が新たな入力音を雑音と判断した場合、前記入力音声保存部は雑音と認識された認識結果とこの認識結果に対応する音声信号のデータを削除することを特徴とする音声認識機能付制御装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004238741A JP4784056B2 (ja) | 2004-08-18 | 2004-08-18 | 音声認識機能付制御装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004238741A JP4784056B2 (ja) | 2004-08-18 | 2004-08-18 | 音声認識機能付制御装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006058479A JP2006058479A (ja) | 2006-03-02 |
JP4784056B2 true JP4784056B2 (ja) | 2011-09-28 |
Family
ID=36106004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004238741A Expired - Fee Related JP4784056B2 (ja) | 2004-08-18 | 2004-08-18 | 音声認識機能付制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4784056B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4779000B2 (ja) * | 2008-09-26 | 2011-09-21 | 株式会社日立製作所 | 音声認識による機器制御装置 |
WO2015029362A1 (ja) | 2013-08-29 | 2015-03-05 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 機器制御方法及び機器制御システム |
WO2015029304A1 (ja) * | 2013-08-29 | 2015-03-05 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音声認識方法及び音声認識装置 |
JP6548994B2 (ja) * | 2015-09-04 | 2019-07-24 | 株式会社東芝 | 操作装置、訂正方法およびプログラム |
JP7012250B2 (ja) * | 2017-11-21 | 2022-01-28 | パナソニックIpマネジメント株式会社 | 機器制御システム |
CN109949797B (zh) * | 2019-03-11 | 2021-11-12 | 北京百度网讯科技有限公司 | 一种训练语料的生成方法、装置、设备及存储介质 |
KR102202610B1 (ko) * | 2019-05-14 | 2021-01-14 | 한국전자통신연구원 | 지능형 조명 네트워크 시스템 |
CN110288990B (zh) * | 2019-06-12 | 2021-07-20 | 深圳康佳电子科技有限公司 | 一种语音控制优化方法、存储介质及智能终端 |
WO2022259776A1 (ja) * | 2021-06-07 | 2022-12-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音声認識装置、音声認識方法、及び音声認識プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63153596A (ja) * | 1986-12-17 | 1988-06-25 | 松下電器産業株式会社 | 音声文章入力装置 |
JPH07109560B2 (ja) * | 1990-11-30 | 1995-11-22 | 富士通テン株式会社 | 音声認識装置 |
JP2975772B2 (ja) * | 1992-06-30 | 1999-11-10 | 三洋電機株式会社 | 音声認識装置 |
JP3384165B2 (ja) * | 1995-02-01 | 2003-03-10 | トヨタ自動車株式会社 | 音声認識装置 |
JP3892338B2 (ja) * | 2002-05-08 | 2007-03-14 | 松下電器産業株式会社 | 単語辞書登録装置および単語登録用プログラム |
-
2004
- 2004-08-18 JP JP2004238741A patent/JP4784056B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006058479A (ja) | 2006-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3619707B1 (en) | Customizable wake-up voice commands | |
KR101598948B1 (ko) | 음성 인식 장치, 이를 포함하는 차량 및 음성 인식 방법 | |
JP5467043B2 (ja) | 音声認識装置、音声認識方法および電子機器 | |
US20200066258A1 (en) | Methods and devices for selectively ignoring captured audio data | |
US6594630B1 (en) | Voice-activated control for electrical device | |
US7634401B2 (en) | Speech recognition method for determining missing speech | |
KR101556594B1 (ko) | 신호처리장치 및 신호처리장치에서의 음성 인식 방법 | |
US8306815B2 (en) | Speech dialog control based on signal pre-processing | |
EP1317750B1 (en) | Speech recognition method with a replace command | |
US20090182559A1 (en) | Context sensitive multi-stage speech recognition | |
EP0965978A1 (en) | Non-interactive enrollment in speech recognition | |
KR102029820B1 (ko) | 음성 인식을 이용하여 전원을 제어하는 전자 장치 및 이의 전원 제어 방법 | |
KR101579533B1 (ko) | 차량 및 그 제어 방법 | |
JPH0968994A (ja) | パターンマッチングによる単語音声認識方法及びその方法を実施する装置 | |
JP4784056B2 (ja) | 音声認識機能付制御装置 | |
US20180130467A1 (en) | In-vehicle speech recognition device and in-vehicle equipment | |
KR20010034367A (ko) | 음성 인식에서 무음을 사용한 시스템 | |
JP2005017932A (ja) | 音声認識装置および音声認識用プログラム | |
JPH06236196A (ja) | 音声認識方法および装置 | |
JP2008268517A (ja) | 音声認識機能付き操作器 | |
JPH06214596A (ja) | 音声認識装置および話者適応化方法 | |
KR20080061901A (ko) | 로봇의 입출력 장치에 의한 효율적인 음성인식 방법 및시스템 | |
JP4281369B2 (ja) | 音声認識装置 | |
US20240233718A9 (en) | Semantically conditioned voice activity detection | |
US20240135922A1 (en) | Semantically conditioned voice activity detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070510 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100511 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100705 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110328 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110614 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110627 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140722 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |