JP2003345390A - 音声処理装置及びリモートコントローラ装置 - Google Patents
音声処理装置及びリモートコントローラ装置Info
- Publication number
- JP2003345390A JP2003345390A JP2002148727A JP2002148727A JP2003345390A JP 2003345390 A JP2003345390 A JP 2003345390A JP 2002148727 A JP2002148727 A JP 2002148727A JP 2002148727 A JP2002148727 A JP 2002148727A JP 2003345390 A JP2003345390 A JP 2003345390A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- input
- signal
- user
- sensor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【課題】 プレストークによる発声始端検出のように、
ユーザの発声開始が検出される始端よりも早くなってし
まう場合のために、始端検出以前の適切なタイミングで
入力音声のバッファリングを開始することを目的とす
る。 【解決手段】 傾きセンサ103の入力信号からユーザ
が入力操作を開始しようとしていることを検知する入力
準備検出手段104と、ユーザが音声入力の開始時に押
すプレストークボタン105と、前記傾きセンサ103
の検知信号によりマイク101からの音声信号のバッフ
ァメモリ109への取り込みを開始し、前記プレストー
クボタン105による音声入力の開始指示を受け、前記
バッファメモリ109に記憶された音声信号の認識処理
を行う音声認識処理手段102とを具備するもので、確
実に音声信号を取り込み、認識することができる。
ユーザの発声開始が検出される始端よりも早くなってし
まう場合のために、始端検出以前の適切なタイミングで
入力音声のバッファリングを開始することを目的とす
る。 【解決手段】 傾きセンサ103の入力信号からユーザ
が入力操作を開始しようとしていることを検知する入力
準備検出手段104と、ユーザが音声入力の開始時に押
すプレストークボタン105と、前記傾きセンサ103
の検知信号によりマイク101からの音声信号のバッフ
ァメモリ109への取り込みを開始し、前記プレストー
クボタン105による音声入力の開始指示を受け、前記
バッファメモリ109に記憶された音声信号の認識処理
を行う音声認識処理手段102とを具備するもので、確
実に音声信号を取り込み、認識することができる。
Description
【0001】
【発明の属する技術分野】本発明は、プレストーク方式
により音声入力を扱う音声処理装置及びリモートコント
ローラ装置に関する。
により音声入力を扱う音声処理装置及びリモートコント
ローラ装置に関する。
【0002】
【従来の技術】プレストークを用いて音声の入力を受け
付ける際、ユーザによるプレストークボタンの押し込み
が遅れるために入力音声の始端が取り込めなくなってし
まう現象に対し、ユーザがプレストークボタンを押し込
む前から音声の取り込みを開始しておき、ユーザがプレ
ストークボタンを押し込んだ時点より前からの入力音声
データを使用するという技術が知られている。
付ける際、ユーザによるプレストークボタンの押し込み
が遅れるために入力音声の始端が取り込めなくなってし
まう現象に対し、ユーザがプレストークボタンを押し込
む前から音声の取り込みを開始しておき、ユーザがプレ
ストークボタンを押し込んだ時点より前からの入力音声
データを使用するという技術が知られている。
【0003】音声の取り込みを開始するタイミングに関
しては、ユーザの接近または接触を感知して、装置を節
電モードから通常モードへと切り替える技術が知られて
おり、ここで通常モードに移行する際に音声の取り込み
を開始するようにすることができる。
しては、ユーザの接近または接触を感知して、装置を節
電モードから通常モードへと切り替える技術が知られて
おり、ここで通常モードに移行する際に音声の取り込み
を開始するようにすることができる。
【0004】しかし、装置が家庭内に設置された家電製
品などの場合、ユーザが使用の意図無く偶然装置の近く
に来たりすることも多い。また、TVなどAV機器のリ
モートコントローラの場合、ユーザが長時間手に持った
まま何の操作も行わないことがあるため、単純にユーザ
の接近・接触を感知して機器の電源をオン/オフするだ
けでは不十分である。
品などの場合、ユーザが使用の意図無く偶然装置の近く
に来たりすることも多い。また、TVなどAV機器のリ
モートコントローラの場合、ユーザが長時間手に持った
まま何の操作も行わないことがあるため、単純にユーザ
の接近・接触を感知して機器の電源をオン/オフするだ
けでは不十分である。
【0005】
【発明が解決しようとする課題】プレストークを用いて
音声入力を行う音声認識装置においては、ユーザによる
プレストークボタンの押し込み以前からの音声を使用す
るため、ユーザがこれから音声入力を行いそうな状態を
検知できることが要求されている。
音声入力を行う音声認識装置においては、ユーザによる
プレストークボタンの押し込み以前からの音声を使用す
るため、ユーザがこれから音声入力を行いそうな状態を
検知できることが要求されている。
【0006】本発明は、ユーザがプレストークボタンを
押し込む以前に、音声入力を開始しようとしている状態
を検出し、入力音声のバッファリングを開始することを
目的とする。
押し込む以前に、音声入力を開始しようとしている状態
を検出し、入力音声のバッファリングを開始することを
目的とする。
【0007】
【課題を解決するための手段】本発明は、以上の問題を
鑑みてなされたものであり、傾きセンサの入力によって
ユーザが音声入力を行おうとしていることを検出し、音
声の取り込みを開始するものである。
鑑みてなされたものであり、傾きセンサの入力によって
ユーザが音声入力を行おうとしていることを検出し、音
声の取り込みを開始するものである。
【0008】これにより、ユーザの発声開始がプレスト
ークボタンの押し込みより早かった場合にも入力音声を
発声の始端から使用することができ、また、そのために
必要とされる処理も、常に音声の取り込みを続ける従来
の方法と比べ非常に少ない。
ークボタンの押し込みより早かった場合にも入力音声を
発声の始端から使用することができ、また、そのために
必要とされる処理も、常に音声の取り込みを続ける従来
の方法と比べ非常に少ない。
【0009】
【発明の実施の形態】本発明の請求項1に記載の発明
は、ユーザが音声入力を開始しようとしていることを検
出するための傾きセンサと、前記傾きセンサの入力信号
からユーザが入力操作を開始しようとしていることを検
知する入力準備検出手段と、ユーザが音声入力の開始時
に押すプレストークボタンと、前記傾きセンサの検知信
号によりマイクからの音声信号をバッファメモリに取り
込んで音声認識処理を行う音声認識処理手段を備えた音
声処理装置である。
は、ユーザが音声入力を開始しようとしていることを検
出するための傾きセンサと、前記傾きセンサの入力信号
からユーザが入力操作を開始しようとしていることを検
知する入力準備検出手段と、ユーザが音声入力の開始時
に押すプレストークボタンと、前記傾きセンサの検知信
号によりマイクからの音声信号をバッファメモリに取り
込んで音声認識処理を行う音声認識処理手段を備えた音
声処理装置である。
【0010】本発明の構成を利用することにより、ユー
ザが音声入力を行いそうな場合にのみ音声処理を行い、
確実に音声信号を取り込み、認識することができ、無駄
な処理を減らすようにすることができるという作用を有
する。
ザが音声入力を行いそうな場合にのみ音声処理を行い、
確実に音声信号を取り込み、認識することができ、無駄
な処理を減らすようにすることができるという作用を有
する。
【0011】請求項2に記載の発明は、音声認識処理部
の代わりに、有線もしくは無線によって該音声処理装置
以外の装置に、入力された音声データを送信するための
音声データ送信装置を備えることを特徴とする音声処理
装置である。本発明により、コストの大きな音声処理を
行う部分を装置の外部に設置することができ、確実に音
声認識処理を行うことできるようになるという作用を有
する。
の代わりに、有線もしくは無線によって該音声処理装置
以外の装置に、入力された音声データを送信するための
音声データ送信装置を備えることを特徴とする音声処理
装置である。本発明により、コストの大きな音声処理を
行う部分を装置の外部に設置することができ、確実に音
声認識処理を行うことできるようになるという作用を有
する。
【0012】請求項3に記載の発明は、請求項1及び2
に記載の音声処理装置において、過去の音声入力データ
を保存することができる音声バッファメモリを有し、請
求項1に記載のマイク及び入力準備検出部が該音声バッ
ファメモリに接続し、さらに該音声バッファメモリが請
求項1に記載の音声認識処理部もしくは請求項2に記載
の音声処理部に接続する構成を持つことを特徴とする音
声処理装置である。バッファメモリを音声認識処理部か
ら分離することで、入力準備検出部によって認識準備実
行信号が発行されてからユーザのプレストークボタン押
し込みまでの間、音声データのバッファリングはバッフ
ァメモリに任せ、音声処理装置を節電モードで待機させ
ておくことができる。これにより、音声処理装置に要求
されるスペックの低減や消費電力の低下が期待できると
いう作用を有する。
に記載の音声処理装置において、過去の音声入力データ
を保存することができる音声バッファメモリを有し、請
求項1に記載のマイク及び入力準備検出部が該音声バッ
ファメモリに接続し、さらに該音声バッファメモリが請
求項1に記載の音声認識処理部もしくは請求項2に記載
の音声処理部に接続する構成を持つことを特徴とする音
声処理装置である。バッファメモリを音声認識処理部か
ら分離することで、入力準備検出部によって認識準備実
行信号が発行されてからユーザのプレストークボタン押
し込みまでの間、音声データのバッファリングはバッフ
ァメモリに任せ、音声処理装置を節電モードで待機させ
ておくことができる。これにより、音声処理装置に要求
されるスペックの低減や消費電力の低下が期待できると
いう作用を有する。
【0013】請求項4に記載の発明は、請求項1から3
に記載の音声処理装置において、ユーザが音声入力を開
始しようとしていることを検出するためのセンサとし
て、傾きセンサを含む各種センサのうち1つもしくは複
数を使用することを特徴とする音声処理装置である。ユ
ーザが音声入力を開始しようとしていることの判断基準
として、装置が使用される状況に最も適したセンサを使
用したり複数種類のセンサの入力を用いたりすることに
より、ユーザが音声入力を開始しようとしている状態の
検出をより正確に行うことができるという作用を有す
る。
に記載の音声処理装置において、ユーザが音声入力を開
始しようとしていることを検出するためのセンサとし
て、傾きセンサを含む各種センサのうち1つもしくは複
数を使用することを特徴とする音声処理装置である。ユ
ーザが音声入力を開始しようとしていることの判断基準
として、装置が使用される状況に最も適したセンサを使
用したり複数種類のセンサの入力を用いたりすることに
より、ユーザが音声入力を開始しようとしている状態の
検出をより正確に行うことができるという作用を有す
る。
【0014】請求項5に記載の発明は、請求項1から4
に記載の音声処理装置を、ユーザが入力するコマンドの
認識部として使用するリモートコントローラ装置であ
る。音声認識機能付きのリモートコントローラ装置に本
発明の方式を用いることにより、確実に音声認識が可能
となるという作用を有する。
に記載の音声処理装置を、ユーザが入力するコマンドの
認識部として使用するリモートコントローラ装置であ
る。音声認識機能付きのリモートコントローラ装置に本
発明の方式を用いることにより、確実に音声認識が可能
となるという作用を有する。
【0015】以下、本発明の実施の形態について、図を
用いて説明する。
用いて説明する。
【0016】(実施の形態1)図1に、本発明の実施の
形態1における音声認識処理を用いたリモートコントロ
ーラ装置の基本構成図を示す。
形態1における音声認識処理を用いたリモートコントロ
ーラ装置の基本構成図を示す。
【0017】図1において、100は本発明のリモート
コントローラ装置、101は音声入力のためのマイク、
102はマイク101からの音声信号を認識する音声認
識部107と辞書108から成る音声認識処理部、10
3はリモートコントローラ装置100の傾きを検出する
傾きセンサ、104は傾きセンサ103の信号から傾斜
を検出する入力準備検出部、105は音声入力の開始を
音声認識処理部102に通知するプレストークボタン、
106は音声認識処理部102で認識した命令を電子機
器111に送出する赤外線等を用いた通信インターフェ
ースである。
コントローラ装置、101は音声入力のためのマイク、
102はマイク101からの音声信号を認識する音声認
識部107と辞書108から成る音声認識処理部、10
3はリモートコントローラ装置100の傾きを検出する
傾きセンサ、104は傾きセンサ103の信号から傾斜
を検出する入力準備検出部、105は音声入力の開始を
音声認識処理部102に通知するプレストークボタン、
106は音声認識処理部102で認識した命令を電子機
器111に送出する赤外線等を用いた通信インターフェ
ースである。
【0018】上記のように構成されたリモートコントロ
ーラ装置100の動作を、図2の動作フローを用いて以
下に説明する。
ーラ装置100の動作を、図2の動作フローを用いて以
下に説明する。
【0019】開始状態において、リモートコントローラ
装置100は、使用していない節電モードであるとする
(S21)。今、ユーザがリモートコントローラ装置1
00を手に取ったとする。このとき、傾きセンサ103
は、リモートコントローラ装置100の傾きを検出し、
傾きセンサ103の信号は入力準備検出部104に入力
される(S22)。例えば、リモートコントローラ装置
100が横たわった状態から45°以上の傾きがあった
ことを検出した場合、ユーザがリモートコントローラ装
置100を手に持って使用しているものと判断し、節電
モードから実行モードに変更し、音声認識処理部102
に対し認識準備実行信号を出力する(S23)。
装置100は、使用していない節電モードであるとする
(S21)。今、ユーザがリモートコントローラ装置1
00を手に取ったとする。このとき、傾きセンサ103
は、リモートコントローラ装置100の傾きを検出し、
傾きセンサ103の信号は入力準備検出部104に入力
される(S22)。例えば、リモートコントローラ装置
100が横たわった状態から45°以上の傾きがあった
ことを検出した場合、ユーザがリモートコントローラ装
置100を手に持って使用しているものと判断し、節電
モードから実行モードに変更し、音声認識処理部102
に対し認識準備実行信号を出力する(S23)。
【0020】音声認識処理部102の制御部110は、
ユーザがリモートコントローラ装置100を使用してい
ない間は節電モードになっているが、入力準備検出部1
04からの認識準備実行信号が入力されると、マイク1
01からの音声信号をバッファメモリ109にバッファ
リングを開始する(S25)。この状態で傾きセンサ1
03が20°未満になったことを検出した場合、音声認
識処理部102の制御部110は再度節電モードに移行
する(S26)。また、傾きセンサ103が20°以上
を検出している状態で、ユーザによりプレストークボタ
ン105が押されると(S27)、音声認識処理部10
2の制御部110の指示により、音声認識部107はマ
イク101から入力された音声信号をバッファメモリ1
09から読み出し、読み出された音声信号に対して辞書
108を用いて認識処理を行う。音声認識処理部102
で認識された命令は、通信インターフェース106を介
して電子機器111に送出する(S28)。
ユーザがリモートコントローラ装置100を使用してい
ない間は節電モードになっているが、入力準備検出部1
04からの認識準備実行信号が入力されると、マイク1
01からの音声信号をバッファメモリ109にバッファ
リングを開始する(S25)。この状態で傾きセンサ1
03が20°未満になったことを検出した場合、音声認
識処理部102の制御部110は再度節電モードに移行
する(S26)。また、傾きセンサ103が20°以上
を検出している状態で、ユーザによりプレストークボタ
ン105が押されると(S27)、音声認識処理部10
2の制御部110の指示により、音声認識部107はマ
イク101から入力された音声信号をバッファメモリ1
09から読み出し、読み出された音声信号に対して辞書
108を用いて認識処理を行う。音声認識処理部102
で認識された命令は、通信インターフェース106を介
して電子機器111に送出する(S28)。
【0021】この際、プレストークボタン105が押さ
れた後にマイク101から入力された音声だけでなく、
プレストークボタン105が押される以前にバッファリ
ングされたデータをも利用して認識処理が行われるため
に、音声信号の取り込みミスをすることなく、確実に認
識することができる。
れた後にマイク101から入力された音声だけでなく、
プレストークボタン105が押される以前にバッファリ
ングされたデータをも利用して認識処理が行われるため
に、音声信号の取り込みミスをすることなく、確実に認
識することができる。
【0022】音声認識処理部102で音声認識処理が行
われている間にプレストークボタン105が離されると
(S29)、音声認識処理部102の制御部110は再
度音声信号をバッファメモリ109にバッファリングを
行いながら、傾きセンサ103からの入力とプレストー
クボタン105の状態を監視する。
われている間にプレストークボタン105が離されると
(S29)、音声認識処理部102の制御部110は再
度音声信号をバッファメモリ109にバッファリングを
行いながら、傾きセンサ103からの入力とプレストー
クボタン105の状態を監視する。
【0023】次に、図3に各信号波形を示し、その動作
について説明する。傾きセンサ103の信号から、入力
準備検出部104が45°以上の傾きを検出すると(T
31)、動作モードは節電モードから実行モードに切り
替わり(T32)、マイク101からの音声信号はバッ
ファメモリ109に取り込まれ、ユーザによりプレスト
ークボタン105が押されるのを待機する。待機中にプ
レストークボタン105が押されると(T33)、プレ
ストークボタン105が押される以前からのバッファメ
モリ109に取り込まれた音声信号からの認識処理を開
始する。プレストークボタン105が開放されると(T
34)、認識処理は終了する。T35が音声認識区間と
なる。
について説明する。傾きセンサ103の信号から、入力
準備検出部104が45°以上の傾きを検出すると(T
31)、動作モードは節電モードから実行モードに切り
替わり(T32)、マイク101からの音声信号はバッ
ファメモリ109に取り込まれ、ユーザによりプレスト
ークボタン105が押されるのを待機する。待機中にプ
レストークボタン105が押されると(T33)、プレ
ストークボタン105が押される以前からのバッファメ
モリ109に取り込まれた音声信号からの認識処理を開
始する。プレストークボタン105が開放されると(T
34)、認識処理は終了する。T35が音声認識区間と
なる。
【0024】実行モードにおいて、プレストークボタン
105が開放された状態で、傾きセンサ103の信号か
ら、入力準備検出部104が20°未満の傾きを検出す
ると(T36)、動作モードは節電モードに切り替わる
(T37)。
105が開放された状態で、傾きセンサ103の信号か
ら、入力準備検出部104が20°未満の傾きを検出す
ると(T36)、動作モードは節電モードに切り替わる
(T37)。
【0025】なお、ユーザが入力操作を開始しようとし
ていることを検知するためのセンサは複数あっても良
い。図4に、このためのセンサとして傾きセンサ103
と、赤外線センサ400、加速度センサ401、及び接
触センサ402を備えたリモートコントローラ装置10
0の構成を示す。赤外線センサ400は、ユーザがリモ
ートコントローラ装置100に近付いて喋ろうとしてい
るかどうかを検知し、加速度センサ401は、ユーザが
リモートコントローラ装置100を使用するために手に
取る際の動きや、ユーザがリモートコントローラ装置1
00を手に持っている間の揺れを検出する。また、接触
センサ402はユーザがリモートコントローラ装置10
0を手に取っているかどうかを検出する。
ていることを検知するためのセンサは複数あっても良
い。図4に、このためのセンサとして傾きセンサ103
と、赤外線センサ400、加速度センサ401、及び接
触センサ402を備えたリモートコントローラ装置10
0の構成を示す。赤外線センサ400は、ユーザがリモ
ートコントローラ装置100に近付いて喋ろうとしてい
るかどうかを検知し、加速度センサ401は、ユーザが
リモートコントローラ装置100を使用するために手に
取る際の動きや、ユーザがリモートコントローラ装置1
00を手に持っている間の揺れを検出する。また、接触
センサ402はユーザがリモートコントローラ装置10
0を手に取っているかどうかを検出する。
【0026】この構成において、リモートコントローラ
装置100は、例えば図5のフローチャートに従って動
作すればよい。開始時にリモートコントローラ装置10
0は節電モードにあるが(S501)、傾きセンサ10
3が閾値以上の傾きを検知するか(S502)、加速度
センサ401がリモートコントローラ装置100の移動
を検知するか(S503)、赤外線センサ400がユー
ザの接近を検知するか(S504)、接触センサ402
がユーザの接触を検知すると(S505)、実行モード
に移行する(S506)。
装置100は、例えば図5のフローチャートに従って動
作すればよい。開始時にリモートコントローラ装置10
0は節電モードにあるが(S501)、傾きセンサ10
3が閾値以上の傾きを検知するか(S502)、加速度
センサ401がリモートコントローラ装置100の移動
を検知するか(S503)、赤外線センサ400がユー
ザの接近を検知するか(S504)、接触センサ402
がユーザの接触を検知すると(S505)、実行モード
に移行する(S506)。
【0027】実行モードでは、まずタイマ変数を初期化
し(S507)、マイク101からの音声信号のバッフ
ァリングを行いつつ(S508)タイマ変数をデクリメ
ントし(S509)、タイマ変数が0になったら(S5
10)再び節電モードに移行する(S514)という処
理を行う。また、タイマ変数が0になる前にプレストー
クボタン105が押されたら(S511)、音声認識処
理部102は音声認識処理を行う(S512)。プレス
トークボタン105が離されると(S513)、音声認
識処理は終了し、タイマ変数が再び初期化されてプレス
トークボタン105の入力待ちに戻る。
し(S507)、マイク101からの音声信号のバッフ
ァリングを行いつつ(S508)タイマ変数をデクリメ
ントし(S509)、タイマ変数が0になったら(S5
10)再び節電モードに移行する(S514)という処
理を行う。また、タイマ変数が0になる前にプレストー
クボタン105が押されたら(S511)、音声認識処
理部102は音声認識処理を行う(S512)。プレス
トークボタン105が離されると(S513)、音声認
識処理は終了し、タイマ変数が再び初期化されてプレス
トークボタン105の入力待ちに戻る。
【0028】なお、ユーザが音声入力を行おうとした瞬
間をプレストークボタン押し込みの瞬間と同一視するこ
とで、プレストークボタンを排除することができる。ま
た、プレストーク以外の方法でユーザの発声開始を検出
する音声処理方式にも、検出される発声開始位置が実際
のものと異なる場合、本発明によりユーザが音声入力を
行おうとしている状態を検出して、それを発声開始位置
の推定に利用することが可能である。
間をプレストークボタン押し込みの瞬間と同一視するこ
とで、プレストークボタンを排除することができる。ま
た、プレストーク以外の方法でユーザの発声開始を検出
する音声処理方式にも、検出される発声開始位置が実際
のものと異なる場合、本発明によりユーザが音声入力を
行おうとしている状態を検出して、それを発声開始位置
の推定に利用することが可能である。
【0029】また、本発明は、高ノイズ環境下の音声認
識処理において、ユーザが音声入力を行おうとしている
状態を検出して、ユーザが発声を行っていそうな音声区
間を大まかに切り出す用途にも使用できる。
識処理において、ユーザが音声入力を行おうとしている
状態を検出して、ユーザが発声を行っていそうな音声区
間を大まかに切り出す用途にも使用できる。
【0030】以上のように、本発明では、ユーザが音声
入力を開始しようとしていることを検出するための傾き
センサあるいは他のセンサとの組み合わせで検知し、ユ
ーザが音声入力の開始時に押すプレストークボタンと、
前記傾きセンサの検知信号によりマイクからの音声信号
をバッファメモリに取り込んで音声認識処理を行うこと
により、確実に音声信号を取り込み認識することができ
る。
入力を開始しようとしていることを検出するための傾き
センサあるいは他のセンサとの組み合わせで検知し、ユ
ーザが音声入力の開始時に押すプレストークボタンと、
前記傾きセンサの検知信号によりマイクからの音声信号
をバッファメモリに取り込んで音声認識処理を行うこと
により、確実に音声信号を取り込み認識することができ
る。
【0031】(実施の形態2)図6に、本発明の実施の
形態2における音声処理を用いたリモートコントローラ
装置の構成図を示し、説明する。実施の形態2は、入力
された音声データを外部の音声認識処理部を有したAV
機器に送信する構成を示す以外は実施の形態1の構成と
同じである。実施の形態1と異なる部分を中心に説明す
る。
形態2における音声処理を用いたリモートコントローラ
装置の構成図を示し、説明する。実施の形態2は、入力
された音声データを外部の音声認識処理部を有したAV
機器に送信する構成を示す以外は実施の形態1の構成と
同じである。実施の形態1と異なる部分を中心に説明す
る。
【0032】音声処理部600の制御部110は、入力
準備検出部104からの認識準備実行信号を受けて、通
信インターフェース106を介してマイク101からの
音声信号をバッファメモリ109から読み出して、電子
機器111に送信する。
準備検出部104からの認識準備実行信号を受けて、通
信インターフェース106を介してマイク101からの
音声信号をバッファメモリ109から読み出して、電子
機器111に送信する。
【0033】一方、電子機器111では、リモートコン
トローラ装置100から通信インターフェース601を
介して音声信号を受信する。受信した音声信号は、音声
認識処理部102において、音声認識部107で辞書1
08を用いて音声認識される。機器制御部602は、音
声認識処理部102で認識されたリモートコントローラ
装置100からの命令を、それぞれの命令に応じた機器
制御を行うものである。
トローラ装置100から通信インターフェース601を
介して音声信号を受信する。受信した音声信号は、音声
認識処理部102において、音声認識部107で辞書1
08を用いて音声認識される。機器制御部602は、音
声認識処理部102で認識されたリモートコントローラ
装置100からの命令を、それぞれの命令に応じた機器
制御を行うものである。
【0034】なお、通信インターフェースの伝送媒体
は、特に限定するものではなく赤外線等による無線方式
や有線方式でも良い。
は、特に限定するものではなく赤外線等による無線方式
や有線方式でも良い。
【0035】これにより、音声認識処理等の負荷のかか
る処理をリモートコントローラ装置100から切り離
し、例えばコントロールを受けるAV機器側に組み込ま
れた音声認識処理部102により音声認識処理を行うこ
とにより、リモートコントローラ装置100の負荷を軽
減するとともに確実に音声認識処理を行うことできる。
る処理をリモートコントローラ装置100から切り離
し、例えばコントロールを受けるAV機器側に組み込ま
れた音声認識処理部102により音声認識処理を行うこ
とにより、リモートコントローラ装置100の負荷を軽
減するとともに確実に音声認識処理を行うことできる。
【0036】なお、音声信号のバッファメモリ109
は、バッファが一杯になった時点で時刻の若い方のデー
タから順次電子機器111に送信するようにしても良い
し、電子機器111から音声信号の送信を要求されて始
めてデータを送信するようにもできる。
は、バッファが一杯になった時点で時刻の若い方のデー
タから順次電子機器111に送信するようにしても良い
し、電子機器111から音声信号の送信を要求されて始
めてデータを送信するようにもできる。
【0037】また、電子機器111が、リモートコント
ローラ装置100の音声信号のバッファメモリ109の
持つ任意の時刻のデータを要求できるようにすることに
よって、ユーザの音声入力から認識処理までのタイムラ
グを小さくすることができる。
ローラ装置100の音声信号のバッファメモリ109の
持つ任意の時刻のデータを要求できるようにすることに
よって、ユーザの音声入力から認識処理までのタイムラ
グを小さくすることができる。
【0038】
【発明の効果】以上のように本発明によれば、ユーザが
音声入力を行おうとしている状態を検出し、プレストー
クの際にユーザのプレストークボタン押し込みが遅れて
も、常に音声のバッファリングを行う方法と比較して小
さなコストで、プレストークボタン押し込み以前の適切
な時点からの音声情報を利用することができるという有
利な効果が得られる。
音声入力を行おうとしている状態を検出し、プレストー
クの際にユーザのプレストークボタン押し込みが遅れて
も、常に音声のバッファリングを行う方法と比較して小
さなコストで、プレストークボタン押し込み以前の適切
な時点からの音声情報を利用することができるという有
利な効果が得られる。
【図1】本発明の実施の形態1におけるリモートコント
ローラ装置の基本構成を示すブロック図
ローラ装置の基本構成を示すブロック図
【図2】図1のリモートコントローラ装置の動作を示す
フローチャート
フローチャート
【図3】図2のフローチャートにおける、各種信号の状
態を表すタイミング図
態を表すタイミング図
【図4】図1のリモートコントローラ装置に、入力準備
検出のためのセンサをさらに追加した構成を示すブロッ
ク図
検出のためのセンサをさらに追加した構成を示すブロッ
ク図
【図5】図4のリモートコントローラ装置の動作を示す
フローチャート
フローチャート
【図6】本発明の実施の形態2における音声処理部を介
して外部の電子機器に音声データを送る構成を示すブロ
ック図
して外部の電子機器に音声データを送る構成を示すブロ
ック図
100 リモートコントローラ装置
101 マイク
102 音声認識処理部
103 傾きセンサ
104 入力準備検出部
105 プレストークボタン
106 通信インターフェース
107 音声認識部
108 辞書
109 バッファメモリ
110 制御部
111 電子機器
400 赤外線センサ
401 加速度センサ
402 接触センサ
600 音声処理部
601 通信インターフェース
602 機器制御部
─────────────────────────────────────────────────────
フロントページの続き
(72)発明者 中藤 良久
大阪府門真市大字門真1006番地 松下電器
産業株式会社内
(72)発明者 森井 景子
大阪府門真市大字門真1006番地 松下電器
産業株式会社内
Fターム(参考) 5D015 KK01 LL10
Claims (5)
- 【請求項1】 ユーザが音声入力を開始しようとしてい
ることを検出するための傾きセンサと、前記傾きセンサ
の入力信号からユーザが入力操作を開始しようとしてい
ることを検知する入力準備検出手段と、ユーザが音声入
力の開始時に押すプレストークボタンと、前記傾きセン
サの検知信号によりマイクからの音声信号のバッファメ
モリへの取り込みを開始し、前記プレストークボタンに
よる音声入力の開始指示を受け、前記バッファメモリに
記憶された音声信号の認識処理を行う音声認識処理手段
とを具備することを特徴とする音声処理装置。 - 【請求項2】 ユーザが音声入力を開始しようとしてい
ることを検出するための傾きセンサと、前記傾きセンサ
の入力信号からユーザが入力操作を開始しようとしてい
ることを検知する入力準備検出手段と、ユーザが音声入
力の会指示に押すプレストークボタンと、マイクからの
音声信号を入力する音声信号入力手段と、前記入力準備
検出手段からの検知信号、前記音声信号入力手段からの
音声信号及びプレストークボタンによる音声入力の開始
指示信号を有線あるいは無線により送出する送信部と、
前記送信部からの信号を受け、前記傾きセンサの検知信
号によりマイクからの音声信号のバッファメモリへの取
り込みを開始し、前記プレストークボタンによる音声入
力の開始指示を受け、前記バッファメモリに記憶された
音声信号の認識処理を行う音声認識処理手段とを具備す
ることを特徴とする音声処理装置。 - 【請求項3】 マイクからの音声信号を一旦保存する音
声バッファメモリを有し、前記プレストークボタンによ
る音声入力の開始指示または音声認識処理手段からの指
示を受け、この音声バッファメモリが保存した音声信号
を出力することを特徴とする請求項1または2記載の音
声処理装置。 - 【請求項4】 ユーザが音声入力を開始しようとしてい
ることを検出するためのセンサは、傾きセンサ、加速度
センサ、接触センサまたは赤外線センサのいずれか1つ
またはそれらの組み合わせであることを特徴とする請求
項1から3に記載の音声処理装置。 - 【請求項5】 請求項1から4のいずれかの音声処理装
置で認識された命令を送出するリモートコントローラ装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002148727A JP2003345390A (ja) | 2002-05-23 | 2002-05-23 | 音声処理装置及びリモートコントローラ装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002148727A JP2003345390A (ja) | 2002-05-23 | 2002-05-23 | 音声処理装置及びリモートコントローラ装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003345390A true JP2003345390A (ja) | 2003-12-03 |
Family
ID=29767161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002148727A Pending JP2003345390A (ja) | 2002-05-23 | 2002-05-23 | 音声処理装置及びリモートコントローラ装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003345390A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004051947A1 (ja) | 2002-11-29 | 2004-06-17 | Freebit Co.,Ltd. | クライアント機器への接続をルーティングするためのサーバ |
JP2006091130A (ja) * | 2004-09-21 | 2006-04-06 | Nissan Motor Co Ltd | 音声認識装置および音声認識方法 |
WO2011125995A1 (ja) * | 2010-04-06 | 2011-10-13 | 船井電機株式会社 | 携帯情報表示端末 |
JP2013025605A (ja) * | 2011-07-22 | 2013-02-04 | Sony Corp | 情報処理装置、情報処理方法及びプログラム |
JP2013080015A (ja) * | 2011-09-30 | 2013-05-02 | Toshiba Corp | 音声認識装置および音声認識方法 |
WO2014109344A1 (ja) * | 2013-01-10 | 2014-07-17 | Necカシオモバイルコミュニケーションズ株式会社 | 端末、ロック解除方法およびプログラム |
WO2015034723A1 (en) | 2013-09-03 | 2015-03-12 | Amazon Technologies, Inc. | Smart circular audio buffer |
JP2015194766A (ja) * | 2015-06-29 | 2015-11-05 | 株式会社東芝 | 音声認識装置および音声認識方法 |
CN105788230A (zh) * | 2016-02-04 | 2016-07-20 | 深圳前海勇艺达机器人有限公司 | 一种可定时遥控家电的装置及其工作方式 |
EP4220632A1 (en) * | 2012-01-09 | 2023-08-02 | Samsung Electronics Co., Ltd. | Image display apparatus and method of controlling the same |
-
2002
- 2002-05-23 JP JP2002148727A patent/JP2003345390A/ja active Pending
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004051947A1 (ja) | 2002-11-29 | 2004-06-17 | Freebit Co.,Ltd. | クライアント機器への接続をルーティングするためのサーバ |
JP2006091130A (ja) * | 2004-09-21 | 2006-04-06 | Nissan Motor Co Ltd | 音声認識装置および音声認識方法 |
WO2011125995A1 (ja) * | 2010-04-06 | 2011-10-13 | 船井電機株式会社 | 携帯情報表示端末 |
US9268524B2 (en) | 2011-07-22 | 2016-02-23 | Sony Corporation | Information processing apparatus, information processing method, and computer readable medium |
CN103021410A (zh) * | 2011-07-22 | 2013-04-03 | 索尼公司 | 信息处理装置、信息处理方法和计算机可读介质 |
JP2013025605A (ja) * | 2011-07-22 | 2013-02-04 | Sony Corp | 情報処理装置、情報処理方法及びプログラム |
JP2013080015A (ja) * | 2011-09-30 | 2013-05-02 | Toshiba Corp | 音声認識装置および音声認識方法 |
US12033635B2 (en) | 2012-01-09 | 2024-07-09 | Samsung Electronics Co., Ltd. | Image display apparatus and method of controlling the same |
EP4220632A1 (en) * | 2012-01-09 | 2023-08-02 | Samsung Electronics Co., Ltd. | Image display apparatus and method of controlling the same |
WO2014109344A1 (ja) * | 2013-01-10 | 2014-07-17 | Necカシオモバイルコミュニケーションズ株式会社 | 端末、ロック解除方法およびプログラム |
JPWO2014109344A1 (ja) * | 2013-01-10 | 2017-01-19 | 日本電気株式会社 | 端末、ロック解除方法およびプログラム |
US10147420B2 (en) | 2013-01-10 | 2018-12-04 | Nec Corporation | Terminal, unlocking method, and program |
US10134392B2 (en) | 2013-01-10 | 2018-11-20 | Nec Corporation | Terminal, unlocking method, and program |
EP3028111A1 (en) * | 2013-09-03 | 2016-06-08 | Amazon Technologies, Inc. | Smart circular audio buffer |
JP2016535312A (ja) * | 2013-09-03 | 2016-11-10 | アマゾン・テクノロジーズ、インコーポレイテッド | 高性能循環オーディオバッファ |
EP3028111A4 (en) * | 2013-09-03 | 2017-04-05 | Amazon Technologies, Inc. | Smart circular audio buffer |
US9633669B2 (en) | 2013-09-03 | 2017-04-25 | Amazon Technologies, Inc. | Smart circular audio buffer |
CN106030440A (zh) * | 2013-09-03 | 2016-10-12 | 亚马逊技术公司 | 智能循环音频缓冲器 |
CN106030440B (zh) * | 2013-09-03 | 2019-06-11 | 亚马逊技术公司 | 智能循环音频缓冲器 |
WO2015034723A1 (en) | 2013-09-03 | 2015-03-12 | Amazon Technologies, Inc. | Smart circular audio buffer |
JP2015194766A (ja) * | 2015-06-29 | 2015-11-05 | 株式会社東芝 | 音声認識装置および音声認識方法 |
CN105788230A (zh) * | 2016-02-04 | 2016-07-20 | 深圳前海勇艺达机器人有限公司 | 一种可定时遥控家电的装置及其工作方式 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8862466B2 (en) | Speech input device, speech recognition system and speech recognition method | |
US10531540B2 (en) | Intelligent lamp holder and usage method applied therein | |
EP1909532B1 (en) | Conference audio system | |
EP3133474B1 (en) | Gesture detector using ultrasound | |
JP2003345390A (ja) | 音声処理装置及びリモートコントローラ装置 | |
CN109712621B (zh) | 一种语音交互控制方法及终端 | |
US6560469B1 (en) | Microphone/speaker-contained wireless remote control system for internet device and method for controlling operation of remote controller therein | |
US7665104B2 (en) | Content transmission system | |
EP1085500A2 (en) | Timing between commands of a voice controlled device | |
CN101521722A (zh) | 一种语音识别电视机及其实现方法 | |
WO2013174324A1 (zh) | 通过光线感应耳机操控电子设备的方法和光线感应耳机 | |
JP2008187221A (ja) | 携帯端末装置、その通話切替方法、その通話切替プログラム、及び通話切替プログラムを格納した記録媒体 | |
KR101192813B1 (ko) | 대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법 | |
CN109473097B (zh) | 一种智能语音设备及其控制方法 | |
JP6682365B2 (ja) | 通信装置、通信装置の制御方法、及び、プログラム | |
US9489833B2 (en) | Remote control and communication method for remote control | |
KR101161444B1 (ko) | 로봇 폰 및 로봇 폰에서 수신자 전환 방법 | |
CN102215334A (zh) | 拍摄装置及其拍摄方法 | |
US7065590B2 (en) | Apparatus, method and computer program product for controlling routing of a request in an image input apparatus | |
JP7024281B2 (ja) | 被制御装置、通信制御方法、及びプログラム | |
KR100664150B1 (ko) | 휴대폰의 동작모드 설정 방법 | |
US20080169933A1 (en) | Sound control system with an automatic sound receiving function | |
JP5366374B2 (ja) | ユーザインタフェース装置、及びその制御方法 | |
CN113628616A (zh) | 音频采集设备、无线耳机以及电子设备系统 | |
WO2022222714A1 (zh) | 一种控制方法及电子设备 |