JP2009109535A - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JP2009109535A
JP2009109535A JP2007278511A JP2007278511A JP2009109535A JP 2009109535 A JP2009109535 A JP 2009109535A JP 2007278511 A JP2007278511 A JP 2007278511A JP 2007278511 A JP2007278511 A JP 2007278511A JP 2009109535 A JP2009109535 A JP 2009109535A
Authority
JP
Japan
Prior art keywords
control signal
user
control device
control
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007278511A
Other languages
English (en)
Inventor
Akira Baba
朗 馬場
Kiyotaka Takehara
清隆 竹原
Kenji Okuno
健治 奥野
Kenji Nakakita
賢二 中北
Shinpei Hibiya
新平 日比谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Panasonic Electric Works Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Electric Works Co Ltd filed Critical Panasonic Electric Works Co Ltd
Priority to JP2007278511A priority Critical patent/JP2009109535A/ja
Publication of JP2009109535A publication Critical patent/JP2009109535A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】適切な重み付けでユーザの不快感を軽減できる音声認識装置を提供する。
【解決手段】音声認識装置10は、ユーザからの発話音声を入力する音声入力部11aと、登録語彙を複数記憶した登録語彙記憶部12と、音声入力部11aにより入力された発話音声と、登録語彙記憶部12により記憶された複数の登録語彙との認識照合処理を行う認識照合処理部13と、認識照合処理部13による認識照合結果に基づいて制御機器20を制御する制御信号を出力する制御部14と、ユーザの制御機器20の操作指示に伴って変化する制御機器20の動作状態に対応して、複数の登録語彙のうち、当該制御機器20を制御するための登録語彙について、ユーザによって発話される可能性を推定し、推定結果に応じた重み付けを行う重み設定部16と、を備えている。また、認識照合処理部13は、重み設定部16により設定された重み付けを加味して認識照合処理を行う。
【選択図】図1

Description

本発明は、音声認識装置に関する。
近年、ユーザからの発話音声を入力し、入力した発話音声が予め登録された登録語彙に該当すると認識した場合に、認識した登録語彙に応じて対話を行う音声認識装置が知られている。この音声認識装置では、例えばユーザが朝に「おはよう」などの語彙を発話すると予測されることから、時刻に応じて登録語彙に重み付けを行う。例えば、朝の時間帯では「おはよう」について認識され易くなるように重み付けを行い、「こんばんは」について認識され難くなるように重み付けを行う。これにより、音声認識装置は、音声認識性能について向上を図っている(特許文献1参照)。
特開平8−297498号公報
しかし、従来の音声認識装置では、時刻、気温及び気圧などの情報をもとにして重み付けを行っているため、適切な重み付けをできないことがある。例えば、昼過ぎや夜に出勤するような仕事に就いているユーザにとっては、昼前や夕方あたりに起床することが多く、時刻に基づいてユーザが朝に「おはよう」などの語彙を発話すると予測してしまうと、適切な重み付けを行うことができなくなってしまう。また、従来の音声認識装置では、適切な重み付けを行うことができず、ユーザに不快感を与えてしまうことがある。例えば、昼前や夕方あたりに起床するユーザが起床直後に「おはよう」と発話したにも拘わらず、音声認識装置(特許文献1では対話装置)が「こんにちは」で返事をすると、ユーザは不快に感じてしまう。
本発明は、上記問題点を解決するために成されたものであり、その目的とするところは、制御機器を制御するための登録語彙についてより適切な重み付けを行いユーザに与える不快感を軽減することが可能な音声認識装置を提供することである。
本発明に係る音声認識装置は、ユーザからの発話音声を入力し、入力した発話音声が予め登録された登録語彙に該当すると認識した場合に、認識した登録語彙に基づいて制御機器を制御する制御信号を出力するものであって、ユーザからの発話音声を入力する音声入力手段と、登録語彙を複数記憶した登録語彙記憶手段と、音声入力手段により入力された発話音声と、登録語彙記憶手段により記憶された複数の登録語彙との認識照合処理を行う認識照合処理手段と、認識照合処理手段による認識照合結果に基づいて制御機器を制御する制御信号を出力する制御手段と、ユーザの制御機器の操作指示に伴って変化する制御機器の動作状態に対応して、複数の登録語彙のうち、当該制御機器を制御するための登録語彙について、ユーザによって発話される可能性を推定し、推定結果に応じた重み付けを行う重み設定手段と、を備え、認識照合処理手段は、重み設定手段により設定された重み付けを加味して認識照合処理を行う。
この音声認識装置によれば、ユーザの制御機器の操作指示に伴って変化する制御機器の動作状態に対応して、複数の登録語彙のうち、当該制御機器を制御するための登録語彙について、ユーザによって発話される可能性を推定し、推定結果に応じた重み付けを行ったうえで照合処理を行う。このため、例えば現在照明装置が点灯状態である場合、認識照合処理手段は、照明装置を制御するための登録語彙である「ライトを消して」についてユーザに発話される可能性が高く、「ライトをつけて」についてユーザに発話される可能性が低いなどと推定することができる。そして、認識照合処理手段は、「ライトを消して」について認識され易いように重み付けを行い、「ライトをつけて」について認識され難いように重み付けを行うことが可能となる。このように、本発明の音声認識装置は、制御する対象となる制御機器の現在の動作状態から重み付けを行うため、時刻や気圧などによる重み付けと比較して重み付けの確実性が増すこととなる。そして、重み付けの確実性が増すことから、登録語彙について音声認識性能の向上を図ることができ、誤った制御を行う可能性を減じてユーザに与える不快感を軽減することができる。従って、より適切な重み付けを行いユーザに与える不快感を軽減することができる。
また、本発明に係る音声認識装置において、制御機器を制御するために出力された制御信号に基づき、制御機器の動作状態を記憶する動作状態記憶手段をさらに備え、重み設定手段は、動作状態記憶手段から制御機器の動作状態の情報を取得することが好ましい。
この音声認識装置によれば、制御機器を制御するために出力された制御信号に基づき、制御機器の動作状態を記憶する動作状態記憶手段をさらに備え、認識照合処理手段は、動作状態記憶手段から制御機器の動作状態の情報を取得する。このため、制御機器の動作状態を検出するために制御機器にセンサを設ける必要が無く、過去の制御信号から制御機器の動作状態の情報を取得して、構成の簡易化を図ることができる。
また、本発明に係る音声認識装置において、重み設定手段は、制御手段によって直前の制御信号が出力されてからの経過時間に応じて重み付けを変化させることが好ましい。
この音声認識装置によれば、直前の制御信号が出力されてからの経過時間に応じて重み付けを変化させる。ここで、直前の制御信号がテレビの音量をアップさせるものであった場合において、ユーザの望む音量に達していないとすると、ユーザは比較的早く(例えば5秒以内)にテレビの音量をアップさせるように発話する傾向にある。一方、ユーザの望む音量に達した場合において、ユーザは、テレビを視聴した後(例えば1分以上視聴した後)に、テレビの音量をダウンさせるように発話する傾向にある。このように、時間経過に応じて、音量アップ及びダウンに関する発話の可能性が変化することとなり、経過時間に応じて重み付けを行うことで、一層重み付けを適切に行うことができる。
また、本発明に係る音声認識装置において、重み設定手段は、制御機器に対して直前に出力された制御信号と同じ制御信号を出力する登録語彙とについて、認識され易くなるように重み付けを行うことが好ましい。
この音声認識装置によれば、直前に出力された制御信号と同じ制御信号を出力する登録語彙について、認識され易くなるように重み付けを行う。このため、例えば制御機器がテレビなどであり、ユーザが「音量アップ」を直前の登録語彙として発話して制御信号が出力されたとする。この場合、ユーザの望む音量までに達していないとき、ユーザは再度「音量アップ」を発話する可能性が高い。よって、直前に出力された制御信号と同じ制御信号を出力する登録語彙について認識され易くなるように重み付けを行うことで、音声認識性能の向上を図ることができる。
また、本発明に係る音声認識装置において、重み設定手段は、制御機器に対して直前に出力された制御信号と同じ制御信号を出力する登録語彙について、認識され難くなるように重み付けを行うことが好ましい。
この音声認識装置によれば、直前に出力された制御信号と同じ制御信号を出力する登録語彙について、認識され難くなるように重み付けを行う。このため、例えば制御機器が照明装置などであり、ユーザが「ライトをつけて」を直前の登録語彙として発話して制御信号が出力されたとする。この場合、ユーザは再度「ライトをつけて」と発話する可能性は低い。よって、直前に出力された制御信号と同じ制御信号を出力する登録語彙について認識され難くなるように重み付けを行うことで、音声認識性能の向上を図ることができる。
また、本発明に係る音声認識装置において、重み設定手段は、制御機器に対して直前に出力された制御信号と反対の制御を行う制御信号を出力する登録語彙について、直前の制御信号が出力されてから一定時間経過後に認識され易くなるように重み付けを行うことが好ましい。
この音声認識装置によれば、制御機器について直前に出力された制御信号と反対の制御を行う制御信号を出力する登録語彙について、直前の制御信号が出力されてから一定時間経過後に認識され易くなるように重み付けを行う。このため、例えば制御機器がテレビなどであり、ユーザが「テレビをつけて」を直前の登録語彙として発話して制御信号が出力されたとする。この場合、ユーザはテレビを視聴して一定時間経過した後にテレビを消す可能性が高い。よって、一定時間経過後に、反対の意味を有する登録語彙について認識され易くなるように重み付けを行うことで、音声認識性能の向上を図ることができる。
また、本発明に係る音声認識装置において、ユーザからのスイッチ操作を受け付ける操作受付手段をさらに備え、制御手段は、操作受付手段により受け付けられたユーザの操作内容に基づいて制御機器を制御するための制御信号を出力することが好ましい。
この音声認識装置によれば、制御手段は、操作受付手段により受け付けられたユーザの操作内容に基づいて制御機器を制御するための制御信号を出力する。このため、動作状態記憶手段は、ユーザの発話音声に基づく制御信号のみならず、ユーザ操作に基づく制御信号によっても、制御機器の動作状態を把握することができる。
また、本発明に係る音声認識装置において、重み設定手段は、制御機器の動作状態に対応して、ユーザによって発話される可能性の推定結果に応じた重みを記憶したルール記憶手段を有し、ルール記憶手段により記憶される重みに応じて重み付けを行うことが好ましい。
この音声認識装置によれば、ルール記憶手段により記憶される重みに応じて重み付けを行うため、重み付けに際して重みを演算によって算出する必要が無く、複雑な処理を省略して、処理負荷を軽減することができる。
本発明によれば、より適切な重み付けを行いユーザに与える不快感を軽減することができる。
以下、図面を参照して、本発明の実施の形態を説明する。図1は、本発明の実施形態に係る音声認識装置を含む音声認識システムを示す構成図である。音声認識システム1は、ユーザからの発話音声を入力し、入力した発話音声が予め登録された登録語彙に該当すると認識した場合に、認識した登録語彙に基づいて制御機器20を制御するものであって、音声認識装置10と、制御機器20とを備えている。
音声認識装置10は、ユーザから音声及びスイッチ操作による入力を受け付け、受け付けた入力内容に応じて制御機器20を制御するための制御信号を出力するものである。この音声認識装置10は、音声により制御機器20を制御できる音声入力モードと、スイッチ操作により制御機器20を制御できるボタン操作入力モードとが選択可能となっている。音声入力モードにおいて、音声認識装置10は、ユーザからの発話音声を入力して、入力した発話音声が予め登録された登録語彙に該当すると認識した場合に、認識した登録語彙に応じて制御機器20を制御する制御信号を出力する。また、ボタン操作入力モードにおいて、音声認識装置10は、ユーザからのスイッチ操作を入力し、スイッチ操作に該当する内容で制御機器20を制御する制御信号を出力する。
制御機器20は、音声認識装置10からの制御信号の内容に応じて動作する外部機器である。具体的に制御機器20は、照明装置21、テレビ22、浴室装置23、及び換気扇24の4機器からなっており、音声認識装置10からの制御信号に応じて運転したり、運転を停止したりなどする。一例を挙げると、制御機器20の1つであるテレビ22は、音声認識装置10からの制御信号によって、電源がオンされたり、チャンネルが変えられたりする。
図2は、図1に示した音声認識装置10の設置例を示す外観図である。図2に示すように、音声認識装置10は、例えば浴室に設けられる。浴室には、照明装置21、テレビ22、浴室装置23(図2において図示せず)、及び換気扇24が設けられている。さらに、浴室の浴槽30付近には、音声認識装置10の構成要素である後述のコントローラ11が設置されている。
なお、図1及び図2では、照明装置21、テレビ22、浴室装置23、及び換気扇24を制御機器20の一例として挙げたが、これに限らず、制御機器20は、床暖房機器やマッサージ機やパーソナルコンピュータや音響機器など他の機器であってもよい。また、音声認識装置10は浴室に設けられていなくともよく、寝室、リビング、会社のデスク付近及び会議室など、他の箇所に設けられていてもよい。
再度、図1を参照する。図1に示すように、音声認識装置10は、コントローラ11と、登録語彙記憶部(登録語彙記憶手段)12と、認識照合処理部(認識照合処理手段)13と、制御部(制御手段)14とを備えている。コントローラ11は、ユーザから音声及びスイッチ操作による入力を受け付けるものである。
図3は、図1に示したコントローラ11の詳細を示す正面図である。図3に示すように、コントローラ11は、音声入力部(音声入力手段)11aと、操作ボタン(操作受付手段)11bと、表示部11cと、LEDランプ11dとを備えている。なお、表示部11c及びLEDランプ11dは他の要素12〜17,20との接続関係がないため、図1における表示部11c及びLEDランプ11dの図示は省略した。
図3に示す音声入力部11aは、マイク等によって構成され、ユーザからの発話音声を入力するものである。操作ボタン11bは、ユーザからのスイッチ操作を受け付けるものである。表示部11cは、LCDなどによって構成され、各種制御機器20の動作状態等(例えばふろの温度や現在時刻など)を表示するものである。LEDランプ11dは、現在音声入力モードであるか、ボタン操作入力モードであるかをユーザに提示するものである。このLEDランプ11dは、3つのLEDによって構成され、例えば1つが点灯しているときには音声入力モードであり、他の1つが点灯しているときにはボタン操作入力モードであり、残り1つが点灯しているときには双方のモードの併用状態であることを示す構成となっている。
具体的に各種操作ボタン11bを説明する。各種操作ボタン11bは、優先ボタン11b1、追いだきボタン11b2、ふろ自動ボタン11b3、通話ボタン11b4、コントローラオンオフボタン11b5、メニューボタン11b6、確定ボタン11b7、戻るボタン11b8、及び十字キー11b9からなっている。
優先ボタン11b1は、浴室で給湯温度やシャワー温度を設定したいときに使用するボタンである。一般的に水や湯は、浴室以外にも台所等で用いられる。このため、浴室装置23の給湯温度やシャワー温度を設定しても他の箇所で水や湯を使用されると、実際の給湯温度やシャワー温度にズレが生じる可能性がある。そこで、優先ボタン11b1を押下することにより、他の箇所よりも浴室を優先し、実際の給湯温度やシャワー温度にズレが生じ難いようにすることができる。また、優先ボタン11b1が押下されると、表示部11cに優先マーク(不図示)が表示される。
追いだきボタン11b2は、浴槽30内で冷たくなった湯水の温度を高くするときに使用されるボタンである。また、追いだきボタン11b2が押下されると、表示部11cに追いだきマーク(不図示)が表示される。
ふろ自動ボタン11b3は、設定した湯量と温度とで浴槽30内にお湯をはるときに使用されるボタンである。また、ふろ自動ボタン11b3が押下されると、表示部11cに自動マーク(不図示)が表示される。
通話ボタン11b4は、浴室外、例えば台所などに設置される台所用リモコンと通話するときに使用されるボタンである。また、通話ボタン11b4が押下されると、表示部11cに通話マーク(不図示)が表示される。
コントローラオンオフボタン11b5は、コントローラ11自体の電源をオンオフするためのボタンである。コントローラオンオフボタン11b5により電源がオフされた場合、表示部11cの表示は消去することとなる。
メニューボタン11b6は、手入力により制御機器20の動作を設定するためのボタンである。このボタン11b6が押下されると、各制御機器20の動作項目(例えば換気扇オフ、テレビ電源オン、テレビチャンネル+1など)が表示部11cに複数個表示される。ユーザは、これら複数の動作項目から十字キー11b9を操作して1つの動作項目を選択することとなる。
確定ボタン11b7は、十字キー11b9を操作して選択された動作項目の動作を制御機器20に実行させる際に押下されるボタンである。戻るボタン11b8は、表示部11cに表示される画面を1つ前の状態に戻すときなどに使用されるボタンである。例えば、表示部11c上に動作項目を3つ程度しか表示できない場合、十字キー11b9を操作することにより、表示画面を次の画面に移行させて新たな動作項目を表示させることができる。この状態において、戻るボタン11b8を押下すれば、移行した画面を元に戻して、前回画面の動作項目を表示部11cに表示させることができる。
十字キー11b9は、給湯温度やシャワー温度の温度設定、及び湯量の設定などに用いられるボタンである。また、十字キー11b9は、表示部11cにより表示される動作項目の選択にも用いられる。
さらに、本実施形態では、コントローラ11の操作ボタン11bを操作することにより、音声入力モードと、ボタン操作入力モードとを選択可能となっている。具体的にユーザは、メニューボタン11b6を操作し、表示部11cに表示される入力モードを選択することによって、音声入力モードとボタン操作入力モードとを選択することができる。
再度、図1を参照する。登録語彙記憶部12は、登録語彙を複数記憶したものであり、例えば「ライトをつけて」、「ライトを消して」、「テレビをつけて」、「テレビを消して」、「音量アップ」、及び「音量ダウン」などの登録語彙を記憶している。
認識照合処理部13は、音声入力モード中に音声入力部11aにより入力されたユーザからの発話音声と、登録語彙記憶部12により記憶された複数の登録語彙との認識照合処理を行うものである。
具体的に認識照合処理部13は、所定の閾値を有している。そして、認識照合処理部13は、入力した音声の音圧が雑音によるものなど所定の閾値未満である場合、登録語彙に該当するか否かの判断を行わず、入力した音声の音圧が所定の閾値以上である場合、音圧に基づいて登録語彙に該当するか否かを判断する。また、認識照合処理部13は、ユーザの発話音声が登録語彙に該当すると判断した場合、その旨の信号を制御部14に出力する。例えば、ユーザからの発話音声が「テレビをつけて」であり、認識照合処理部13はその発話が「テレビをつけて」の登録語彙に該当すると判断した場合、テレビ22の電源をオンする旨の照合結果情報を制御部14に出力する。
制御部14は、認識照合処理部13による認識照合結果に基づいて制御機器20の動作を制御する制御信号を出力するものである。この制御部14は、例えば認識照合処理部13からテレビ22の電源をオンする旨の照合結果情報を受信した場合、テレビ22に対して電源をオンする制御信号を出力する。これにより、テレビ22の電源はオンすることとなる。さらに、制御部14は、操作ボタン11bにより受け付けられたユーザの操作内容に基づく制御信号についても出力する構成となっている。
さらに、音声認識装置10は、動作状態記憶部(動作状態記憶手段)15と、重み設定部(重み設定手段)16と、タイマー17とを備えている。動作状態記憶部15は、制御機器20を制御するために出力された制御信号に基づき、制御機器20の動作状態を記憶するものである。例えば、動作状態記憶部15は、ユーザによって「テレビをつけて」と発話されて制御信号が出力された場合、テレビ22の現在の動作状態が電源オン状態であると判断し、記憶しておくこととなる。また、本実施形態では、操作ボタン11bにより受け付けられたユーザの操作内容に基づいて制御信号が出力される。このため、動作状態記憶部15は、スイッチ操作に応じて出力される制御信号に基づき、制御機器20の動作状態を記憶する機能も有している。
重み設定部16は、動作状態記憶部15により記憶される制御機器20の動作状態、すなわちユーザの制御機器20の操作指示に伴って変化する制御機器20の動作状態に対応して、複数の登録語彙のうち、当該制御機器20を制御するための登録語彙について、ユーザによって発話される可能性を推定し、推定結果に基づいて重み付けを行うものである。このような重み付けを行うため、認識照合処理部13は、重み設定部16により設定された重み付けを加味して認識照合処理を行うこととなる。すなわち、認識照合処理部13は、重み設定部16により設定された重み付けによって、登録語彙の認識のし易さが変化させられることとなる。
また、重み設定部16は、ルール記憶部(ルール記憶手段)16aを有している。ルール記憶部16aは、制御機器20の動作状態に対応して、ユーザによって発話される可能性の推定結果に応じた重みを記憶したものである。このため、重み設定部16は、ルール記憶部16aにより記憶される重みに応じて重み付けを行うこととなる。ここで、ルール記憶部16aは、図4に示すような内容を記憶している。
図4は、図1に示したルール記憶部16aにより記憶される記憶内容を示す概念図である。具体的に、ルール記憶部16aは、重み付けに関する3つの処理方法を記憶しており、重み設定部16は、3つの処理方法に従って、重み付けを行う。第1の処理として、ルール記憶部16aは、制御機器20に対して直前に出力された制御信号と同じ制御信号を出力する登録語彙について認識され易くなるように重み付けを行う処理方法を記憶している。このため、重み設定部16は、制御機器20に対して直前に出力された制御信号と同じ制御信号を出力する登録語彙について認識され易くなるように重み付けを行うこととなる。一例を挙げると、直前の制御信号がテレビ22の音量をアップさせる制御信号であった場合、重み設定部16は、テレビ22を制御するための登録語彙である「音量アップ」についてユーザによって発話される可能性が高いと推定する。ここで、直前の制御信号がテレビ22の音量をアップさせる制御信号が出力され(例えば「音量アップ」が発話され)、ユーザの望む音量までに達していない場合、ユーザは再度「音量アップ」を発話する可能性が高い。このため、重み設定部16は、直前の制御信号がテレビ22の音量をアップさせる制御信号であった場合、「音量アップ」についてユーザに発話される可能性が高いと推定する。これにより、認識照合処理部13は、「音量アップ」の発話音声を認識し易くなる。
なお、ルール記憶部16aは、「音量アップ」の発話音声を認識し易くするように重み付けすることを記憶しているが、「音量ダウン」については、ユーザに発話される可能性が低いと推定されることから、「音量ダウン」について認識され難いように重み付けを行うように記憶している。このため、重み設定部16は、直前の制御信号がテレビ22の音量をアップさせる制御信号であった場合、「音量ダウン」についてユーザによって発話される可能性が低いと推定し、「音量ダウン」について認識され難いように重み付けを行うこととなる。
同様に、直前の制御信号がテレビ22の音量ダウンさせる制御信号であった場合、重み設定部16は、ルール記憶部16aの記憶内容に従って、「音量ダウン」について発話される可能性が高いと推定し、「音量ダウン」の発話音声を認識し易くする。また、これにあわせて、重み設定部16は、ルール記憶部16aの記憶内容に従い、「音量アップ」についてユーザに発話される可能性が低いと推定し、「音量アップ」について認識され難いように重み付けを行う。
第2の処理方法として、ルール記憶部16aは、制御機器20に対して直前に出力された制御信号と同じ制御信号を出力する登録語彙について認識され難くなるように重み付けを行う処理方法を記憶している。このため、重み設定部16は、制御機器20に対して直前に出力された制御信号と同じ制御信号を出力する登録語彙について認識され難くなるように重み付けを行うこととなる。例えば、直前の制御信号が照明装置21を点灯させる制御信号であった場合、重み設定部16は、照明装置21を制御するための登録語彙である「ライトをつけて」についてユーザによって発話される可能性が低い推定する。すなわち、照明装置21は既に点灯状態であるため、重み設定部16は、「ライトをつけて」についてユーザに発話される可能性が低いと推定する。そして、重み設定部16は、「ライトをつけて」について認識され難いように重み付けを行う。
同様に、直前の制御信号が照明装置21を消灯する制御信号であった場合、重み設定部16は、ルール記憶部16aの記憶内容に従って、「ライトを消して」について発話される可能性が低いと推定し、「ライトを消して」の発話音声を認識し難くする。さらに、直前の制御信号がテレビ22の電源をオンする制御信号であった場合における「テレビをつけて」、及び、直前の制御信号がテレビ22の電源をオフする制御信号であった場合における「テレビを消して」についても同様である。
第3の処理方法として、ルール記憶部16aは、制御機器20に対して直前に出力された制御信号と反対の制御を行う制御信号を出力する登録語彙について、認識され易くなるように重み付けを行う処理方法を記憶している。このため、重み設定部16は、制御機器20に対して直前に出力された制御信号と反対の制御を行う制御信号を出力する登録語彙について、認識され易くなるように重み付けを行うこととなる。例えば、直前の制御信号がテレビ22の電源をオンする制御信号であった場合、重み設定部16は、テレビ22を制御するための登録語彙である「テレビを消して」についてユーザによって発話される可能性が高いと推定する。すなわち、テレビ22の電源は既にオンしているため、重み設定部16は、「テレビを消して」についてユーザに発話される可能性が高いと推定する。そして、重み設定部16は、「テレビを消して」について認識され易いように重み付けを行う。
同様に、直前の制御信号がテレビ22の電源をオフする制御信号であった場合、重み設定部16は、ルール記憶部16aの記憶内容に従って、「テレビをつけて」について発話される可能性が高いと推定し、「テレビをつけて」の発話音声を認識し易くする。さらに、直前の制御信号が照明装置21を点灯する制御信号であった場合における「ライトを消して」、及び、直前の制御信号が照明装置21を消灯する制御信号であった場合における「ライトをつけて」についても同様である。
なお、これらのうち、直前の制御信号が照明装置21を点灯する制御信号であった場合における「ライトを消して」、及び、直前の制御信号がテレビ22の電源をオンする制御信号であった場合における「テレビを消して」の重み付けについては、直前の制御信号が出力されてから一定時間経過後に行われる。一般にユーザは、照明装置21を一定時間使用した後に照明装置21を消灯したり、テレビ22を一定時間視聴した後にテレビを消したりする可能性が高い。よって、重み設定部16は、タイマー17により計測される時間に基づいて、一定時間経過後に重み付けを行う。これにより、適切なタイミングで重み付けを行うことができる。
なお、ルール記憶部16aの記憶内容は図4に示すものに限らず、例えば、制御部14によって直前の制御信号が出力されてからの経過時間に応じて重み付けを変化するようになっていてもよい。これにより、重み設定部16は、制御部14によって直前の制御信号が出力されてからの経過時間に応じて重み付けを変化させることとなり、一層重み付けを適切に行うことができるためである。一例を挙げると、直前の制御信号がテレビ22の音量をアップさせるものであった場合において、ユーザの望む音量に達していないとすると、ユーザは比較的早く(例えば5秒以内)にテレビ22の音量をアップさせるように発話する傾向にある。一方、ユーザの望む音量に達した場合において、ユーザは、テレビ22を視聴した後(例えば1分以上視聴した後)に、テレビ22の音量をダウンさせるように発話する傾向にある。このように、時間経過に応じて、音量アップ及びダウンに関する発話の可能性が変化することとなり、経過時間に応じて重み付けを行うことで、一層重み付けを適切に行うことができる。
次に、本実施形態に係る音声認識装置10の動作の概略を説明する。なお、以下の説明においては、直前の制御信号が出力されてからの経過時間に応じて重み付けを変化する例を除外して説明するが、本発明は、以下の説明に限られるものではない。
まず、音声入力又はスイッチ操作によって制御信号が送信されたとする。このとき、動作状態記憶部15は、制御信号に応じた制御機器20の動作状態を記憶する。そして、重み設定部16は、動作状態記憶部15に記憶される制御機器20の動作状態に基づき、図4に示した3つの法則に従って、重み付けを行う。
その後、音声入力部11aを介して、ユーザからの発話音声が入力されたとする。このとき、音声入力部11aは、発話音声に応じた信号を認識照合処理部13に送信する。そして、認識照合処理部13は、発話音声に応じた信号と、登録語彙記憶部12に記憶される登録語彙とを比較照合する。この際、認識照合処理部13は、重み設定部16により設定された重み情報を入力し、重み情報を加味して認識照合処理を実行する。
そして、認識照合処理部13は、照合結果の情報を制御部14に出力する。次いで、制御部14は、照合結果の情報を入力し、照合結果の情報に応じた制御信号を制御機器20に出力する。これにより、制御機器20は、制御信号に応じた動作等を実行することとなる。
次に、本実施形態に係る音声認識装置10の詳細動作を説明する。図5は、図1に示した音声認識装置10の動作の詳細を示すフローチャートである。なお、図5に示す処理は音声認識装置10の電源がオフされるまで繰り返される。
図5に示すように、まず、認識照合処理部13は、ユーザからの発話音声を入力したか否かを判断する(S1)。この際、認識照合処理部13は、入力した音声の音圧と所定の閾値とに基づいて発話音声が入力したか否かを判断する。ユーザからの発話音声を入力しなかったと判断した場合(S1:NO)、すなわち、所定の閾値未満の音圧を有する音声が入力した場合、音声認識装置10は、操作ボタン11bを介してスイッチ入力があったか否かを判断する(S2)。
スイッチ入力がなかったと判断した場合(S2:NO)、処理はステップS1に移行する。一方、スイッチ入力があったと判断した場合(S2:YES)、処理はステップS6に移行する。
ところで、ユーザからの発話音声を入力したと判断した場合(S1:YES)、認識照合処理部13は、重み設定部16から重み情報を入力する(S3)。そして、認識照合処理部13は、重み設定部16からの重み情報を加味して、認識照合処理を実行する(S4)。
次いで、認識照合処理部13は、発話音声と登録語彙とが照合されたか否かを判断する(S5)。照合されなかったと判断した場合(S5:NO)、図5に示す処理は終了する。一方、照合されたと判断した場合(S5:YES)、認識照合処理部13は照合結果を制御部14に送信し、制御部14は制御機器20に制御信号を送信する(S6)。
その後、動作状態記憶部15は、制御信号に応じて制御機器20の動作状態の情報を記憶する(S7)。そして、重み設定部16は、図4に示す第1〜第3の法則に従って、重み情報を更新する(S8)。その後、図5に示す処理は終了する。
図6は、図5に示した重み情報更新処理(S8)の詳細を示すフローチャートである。図6に示すように、更新処理にあたって重み設定部16は、まず変数nを「1」に初期化する(S10)。ここで、変数nは、最小値が「1」であり、最大値が重み付けを行う登録語彙の個数となっている。例えば、直前の制御信号が照明装置21を点灯させるものである場合、図4に示すように、重み設定部16は、「ライトをつけて」と「ライトを消して」との2つの登録語彙について重み付けを行う必要がある。このため、変数nの最大値は「2」となる。
変数nの初期化後、重み設定部16は、n個目の登録語彙は時間計測を要するものであるか否かを判断する(S11)。例えば、直前の制御信号が照明装置21を点灯させるものであって、n個の登録語彙が「ライトを消して」など時間計測を要するものである場合、重み設定部16は、時間計測を要すると判断する(S11:YES)。そして、音声認識装置10はタイマー17をスタートさせ(S12)、重み設定部16は、一定時間経過後に重み情報を更新する(S13)。その後、処理はステップS15に移行する。
一方、直前の制御信号が照明装置21を点灯させるものであって、n個の登録語彙が「ライトをつけて」など時間計測を要しないものである場合、重み設定部16は、時間計測を要しないと判断する(S11:NO)。そして、重み設定部16は、一定時間の経過を待つことなく重み情報を更新する(S14)。その後、処理はステップS15に移行する。
ステップS15において、重み設定部16は、変数nが最大値に達したか否かを判断する(S15)。変数nが最大値に達していないと判断した場合(S15:NO)、処理はステップS11に移行する。一方、変数nが最大値に達したと判断した場合(S15:YES)、図6に示す処理は終了する。
このようにして、本実施形態に係る音声認識装置10によれば、制御機器20の動作状態から、複数の登録語彙のうち、当該制御機器20を制御するための登録語彙について、ユーザによって発話される可能性を推定し、推定結果に応じた重み付けを行ったうえで照合処理を行う。このため、例えば現在照明装置21が点灯状態である場合、認識照合処理部13は、照明装置21を制御するための登録語彙である「ライトを消して」についてユーザに発話される可能性が高く、「ライトをつけて」についてユーザに発話される可能性が低いなどと推定することができる。そして、認識照合処理部13は、「ライトを消して」について認識され易いように重み付けを行い、「ライトをつけて」について認識され難いように重み付けを行うことが可能となる。このように、本実施形態に係る音声認識装置10は、制御する対象となる制御機器20の現在の動作状態から重み付けを行うため、時刻や気圧などによる重み付けと比較して重み付けの確実性が増すこととなる。そして、重み付けの確実性が増すことから、登録語彙について音声認識性能の向上を図ることができ、誤った制御を行う可能性を減じてユーザに与える不快感を軽減することができる。従って、より適切な重み付けを行いユーザに与える不快感を軽減することができる。
また、制御機器20を制御するために出力された制御信号に基づき、制御機器20の動作状態を記憶する動作状態記憶部15をさらに備え、認識照合処理部13は、動作状態記憶部15から制御機器20の動作状態の情報を取得する。このため、制御機器20の動作状態を検出するために制御機器20にセンサを設ける必要が無く、過去の制御信号から制御機器20の動作状態の情報を取得して、構成の簡易化を図ることができる。
また、直前の制御信号が出力されてからの経過時間に応じて重み付けを変化させる。ここで、直前の制御信号がテレビ22の音量をアップさせるものであった場合において、ユーザの望む音量に達していないとすると、ユーザは比較的早く(例えば5秒以内)にテレビ22の音量をアップさせるように発話する傾向にある。一方、ユーザの望む音量に達した場合において、ユーザは、テレビを視聴した後(例えば1分以上視聴した後)に、テレビの音量をダウンさせるように発話する傾向にある。このように、時間経過に応じて、音量アップ及びダウンに関する発話の可能性が変化することとなり、経過時間に応じて重み付けを行うことで、一層重み付けを適切に行うことができる。
また、直前に出力された制御信号と同じ制御信号を出力する登録語彙について、認識され易くなるように重み付けを行う。このため、例えば制御機器20がテレビ22などであり、ユーザが「音量アップ」を直前の登録語彙として発話して制御信号が出力されたとする。この場合、ユーザの望む音量までに達していないとき、ユーザは再度「音量アップ」を発話する可能性が高い。よって、直前に出力された制御信号と同じ制御信号を出力する登録語彙について認識され易くなるように重み付けを行うことで、音声認識性能の向上を図ることができる。
また、直前に出力された制御信号と同じ制御信号を出力する登録語彙について、認識され難くなるように重み付けを行う。このため、例えば制御機器20が照明装置21などであり、ユーザが「ライトをつけて」を直前の登録語彙として発話して制御信号が出力されたとする。この場合、ユーザは再度「ライトをつけて」と発話する可能性は低い。よって、直前に出力された制御信号と同じ制御信号を出力する登録語彙について認識され難くなるように重み付けを行うことで、音声認識性能の向上を図ることができる。
また、制御機器20について直前に出力された制御信号と反対の制御を行う制御信号を出力する登録語彙について、直前の制御信号が出力されてから一定時間経過後に認識され易くなるように重み付けを行う。このため、例えば制御機器20がテレビ22などであり、ユーザが「テレビをつけて」を直前の登録語彙として発話して制御信号が出力されたとする。この場合、ユーザはテレビ22を視聴して一定時間経過した後にテレビ22を消す可能性が高い。よって、一定時間経過後に、反対の意味を有する登録語彙について認識され易くなるように重み付けを行うことで、音声認識性能の向上を図ることができる。
また、制御部14は、操作ボタン11bにより受け付けられたユーザの操作内容に基づいて制御機器20を制御するための制御信号を出力する。このため、動作状態記憶部15は、ユーザの発話音声に基づく制御信号のみならず、ユーザ操作に基づく制御信号によっても、制御機器20の動作状態を把握することができる。
また、ルール記憶部16aにより記憶される重みに応じて重み付けを行うため、重み付けに際して重みを演算によって算出する必要が無く、複雑な処理を省略して、処理負荷を軽減することができる。
以上、本発明に係る音声認識装置を実施形態に基づいて説明したが、本発明はこれに限定されるものではなく、本発明の趣旨を逸脱しない範囲で、変更を加えてもよい。
例えば、本実施形態では、制御信号から制御機器20の動作状態を把握しているが、これに限らず、制御機器20にセンサを取り付け、センサ信号によって制御機器20の動作状態を把握するようにしてもよい。また、制御機器20から動作状態を示す信号が音声認識装置10に出力され、これによって制御機器20の動作状態を把握するように構成してもよい。
また、本実施形態において、重み設定部16は、第1〜第3の法則に従って重み付けを行っているが、これらに限らず、他の法則に基づいて重み付けを行うようにしてもよい。
また、本実施形態では、操作ボタン11bを操作することにより音声入力モードとボタン操作入力モードと切り替え可能となっているが、これに限らず、音声入力モード中には、発話によりボタン操作入力モードへ移行させるようにしてもよい。
本発明の実施形態に係る音声認識装置を含む音声認識システムを示す構成図である。 図1に示した音声認識装置の設置例を示す外観図である。 図1に示したコントローラの詳細を示す正面図である。 図1に示した重み設定部の処理の詳細を示す概念図である。 図1に示した音声認識装置の動作の詳細を示すフローチャートである。 図5に示した重み情報更新処理(S8)の詳細を示すフローチャートである。
符号の説明
1 音声認識システム
10 音声認識装置
11 コントローラ
11a 音声入力部(音声入力手段)
11b 操作ボタン(操作受付手段)
11c 表示部
11d LEDランプ
12 登録語彙記憶部(登録語彙記憶手段)
13 認識照合処理部(認識照合処理手段)
14 制御部(制御手段)
15 動作状態記憶部(動作状態記憶手段)
16 重み設定部(重み設定手段)
17 タイマー
20 制御機器
21 照明装置
22 テレビ
23 浴室装置
24 換気扇

Claims (8)

  1. ユーザからの発話音声を入力し、入力した発話音声が予め登録された登録語彙に該当すると認識した場合に、認識した登録語彙に基づいて制御機器を制御する制御信号を出力する音声認識装置であって、
    ユーザからの発話音声を入力する音声入力手段と、
    前記登録語彙を複数記憶した登録語彙記憶手段と、
    前記音声入力手段により入力された発話音声と、前記登録語彙記憶手段により記憶された複数の登録語彙との認識照合処理を行う認識照合処理手段と、
    前記認識照合処理手段による認識照合結果に基づいて前記制御機器を制御する制御信号を出力する制御手段と、
    ユーザの制御機器の操作指示に伴って変化する制御機器の動作状態に対応して、前記複数の登録語彙のうち、当該制御機器を制御するための登録語彙について、ユーザによって発話される可能性を推定し、推定結果に応じた重み付けを行う重み設定手段と、を備え、
    前記認識照合処理手段は、前記重み設定手段により設定された重み付けを加味して認識照合処理を行う
    ことを特徴とする音声認識装置。
  2. 前記制御機器を制御するために出力された制御信号に基づき、制御機器の動作状態を記憶する動作状態記憶手段をさらに備え、
    前記重み設定手段は、前記動作状態記憶手段から制御機器の動作状態の情報を取得する
    ことを特徴とする請求項1に記載の音声認識装置。
  3. 前記重み設定手段は、前記制御手段によって直前の制御信号が出力されてからの経過時間に応じて重み付けを変化させる
    ことを特徴とする請求項2に記載の音声認識装置。
  4. 前記重み設定手段は、前記制御機器に対して直前に出力された制御信号と同じ制御信号を出力する登録語彙とについて、認識され易くなるように重み付けを行う
    ことを特徴とする請求項2又は請求項3のいずれかに記載の音声認識装置。
  5. 前記重み設定手段は、前記制御機器に対して直前に出力された制御信号と同じ制御信号を出力する登録語彙について、認識され難くなるように重み付けを行う
    ことを特徴とする請求項2から請求項4のいずれか1項に記載の音声認識装置。
  6. 前記重み設定手段は、前記制御機器に対して直前に出力された制御信号と反対の制御を行う制御信号を出力する登録語彙について、直前の制御信号が出力されてから一定時間経過後に認識され易くなるように重み付けを行う
    ことを特徴とする請求項2から請求項5のいずれか1項に記載の音声認識装置。
  7. ユーザからのスイッチ操作を受け付ける操作受付手段をさらに備え、
    前記制御手段は、前記操作受付手段により受け付けられたユーザの操作内容に基づいて制御機器を制御するための制御信号を出力する
    ことを特徴とする請求項2から請求項6のいずれか1項に記載の音声認識装置。
  8. 前記重み設定手段は、前記制御機器の動作状態に対応して、ユーザによって発話される可能性の推定結果に応じた重みを記憶したルール記憶手段を有し、前記ルール記憶手段により記憶される重みに応じて重み付けを行う
    ことを特徴とする請求項1から請求項7のいずれか1項に記載の音声認識装置。
JP2007278511A 2007-10-26 2007-10-26 音声認識装置 Pending JP2009109535A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007278511A JP2009109535A (ja) 2007-10-26 2007-10-26 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007278511A JP2009109535A (ja) 2007-10-26 2007-10-26 音声認識装置

Publications (1)

Publication Number Publication Date
JP2009109535A true JP2009109535A (ja) 2009-05-21

Family

ID=40778121

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007278511A Pending JP2009109535A (ja) 2007-10-26 2007-10-26 音声認識装置

Country Status (1)

Country Link
JP (1) JP2009109535A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015029304A1 (ja) * 2013-08-29 2015-03-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声認識方法及び音声認識装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015029304A1 (ja) * 2013-08-29 2015-03-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声認識方法及び音声認識装置
JPWO2015029304A1 (ja) * 2013-08-29 2017-03-02 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声認識方法及び音声認識装置
US9865255B2 (en) 2013-08-29 2018-01-09 Panasonic Intellectual Property Corporation Of America Speech recognition method and speech recognition apparatus
US10446151B2 (en) 2013-08-29 2019-10-15 Panasonic Intellectual Property Corporation Of America Speech recognition method and speech recognition apparatus

Similar Documents

Publication Publication Date Title
JP7425349B2 (ja) 機器制御システム
KR102293063B1 (ko) 사용자 정의 가능한 웨이크업 음성 명령
JP2009109587A (ja) 音声認識制御装置
JP2009104020A (ja) 音声認識装置
CN111512365A (zh) 对多个家庭装置进行控制的方法和系统
CN101510425A (zh) 声音识别装置以及用于执行声音识别的方法
KR20150073441A (ko) 전자장치 및 그 제어방법
CN104692198A (zh) 电梯语音呼梯登记装置
CN109210703B (zh) 空调的语音控制方法和语音控制的空调
JP2009087074A (ja) 機器制御システム
JP2009109586A (ja) 音声認識制御装置
JP5016968B2 (ja) 機器制御システム
JP2018207169A (ja) 機器制御装置及び機器制御方法
JP2009109536A (ja) 音声認識システム及び音声認識装置
JP2009101056A (ja) 浴室用音声認識制御装置
JP2009109535A (ja) 音声認識装置
JP6945734B2 (ja) 音声出力装置、機器制御システム、音声出力方法、及び、プログラム
JP2009080183A (ja) 音声認識制御装置
JP2008268517A (ja) 音声認識機能付き操作器
JP2009109585A (ja) 音声認識制御装置
JP4784366B2 (ja) 音声操作装置
JP4915665B2 (ja) 音声認識機能付き操作器
JP2009104025A (ja) 音声認識制御装置
JP2005180786A (ja) 温水システム
JP2006288895A (ja) 浴室システム