JP5322208B2 - 音声認識装置及びその方法 - Google Patents

音声認識装置及びその方法 Download PDF

Info

Publication number
JP5322208B2
JP5322208B2 JP2008170047A JP2008170047A JP5322208B2 JP 5322208 B2 JP5322208 B2 JP 5322208B2 JP 2008170047 A JP2008170047 A JP 2008170047A JP 2008170047 A JP2008170047 A JP 2008170047A JP 5322208 B2 JP5322208 B2 JP 5322208B2
Authority
JP
Japan
Prior art keywords
voice
output
notification sound
input
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008170047A
Other languages
English (en)
Other versions
JP2010008854A (ja
Inventor
武秀 屋野
皇 天田
和範 井本
幸一 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008170047A priority Critical patent/JP5322208B2/ja
Priority to US12/423,209 priority patent/US8364484B2/en
Publication of JP2010008854A publication Critical patent/JP2010008854A/ja
Application granted granted Critical
Publication of JP5322208B2 publication Critical patent/JP5322208B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Description

本発明は、音声認識装置に係わり、特にユーザに音声入力を促す報知音を出力する音声認識装置及びその方法に関する。
音声認識処理を用いてユーザの音声入力によって機器を操作する音声認識装置においては、ユーザに音声入力が可能な状態であることや、ユーザに音声入力を促すことを目的として報知音を出力するものがあった(特許文献1参照)。
特許第3654045号公報
しかしながら、従来の音声認識装置では、報知音を出力する前にユーザが音声入力を開始していても、発声途中で報知音が出力されてしまう。
このようにユーザが発声している途中に報知音が出力されると、ユーザは報知音に戸惑い、発声が淀んでしまったり、発声を中断してしまったりする場合がある。
その結果として、音声認識処理に適さない音声入力がなされ、誤認識してしまい、それにより誤動作が生じるためにユーザの満足度を下げてしまう。または、発声中の報知音が音声信号と混在させると音声認識に影響を与え、誤認識の原因となる。
すなわち、従来の音声認識装置では、報知音を出力する前にユーザが音声入力を開始していても、発声途中で報知音が出力されることにより、誤動作が生じるためにユーザの満足度を下げてしまうという問題点があった。
そこで本発明は、上記従来技術の問題点を解決するためになされたものであって、ユーザの発声を妨げない報知音の発生が可能な音声認識装置及びその方法を提供することを目的とする。
本発明は、ユーザの音声を入力する入力部と、入力された前記音声を音声入力待機状態開始後に抽出する音声抽出部と、抽出した前記音声を認識する音声認識部と、前記音声入力待機状態開始時から予め設定した出力設定時間後に、前記ユーザに対し前記音声の入力を促す報知音を出力する出力部と、前記音声入力待機状態の開始時からの経過時間を計時する計時部と、(1)前記出力設定時間までに前記音声の入力がないときは、前記音声の入力を促すために、前記報知音を出力するように前記出力部を制御し、(2)前記出力設定時間前に前記音声の入力があったときは、前記音声入力の妨げにならないようにするために、前記報知音の出力の停止、前記報知音の音量を基準音量より低下、前記報知音の周波数を基準周波数から変更、または、前記報知音の出力時間長を基準出力時間長より短くするように前記出力部を制御する制御部と、を有し、前記制御部は、今回の音声認識における前記音声入力の入力時の前記経過時間Tsに基づいて次回の音声認識における前記報知音の出力の有無、音量、周波数、または、出力時間長のパラメータを決定して記憶部に記憶させ、前記次回の音声認識における前記報知音の前記パラメータを前記記憶部から呼び出して、前記呼び出したパラメータに基づいて前記報知音を前記出力部で出力するように制御する、音声認識装置である。
また、本発明は、ユーザの音声を入力する入力部と、入力された前記音声を音声入力待機状態開始後に抽出する音声抽出部と、抽出した前記音声を認識する音声認識部と、前記音声入力待機状態開始時から予め設定した出力設定時間後に、前記ユーザに対し前記音声の入力を促す報知音を出力する出力部と、前記音声入力待機状態の開始時からの経過時間を計時する計時部と、(1)前記出力設定時間までに前記音声の入力がないときは、前記音声の入力を促すために、前記報知音を出力するように前記出力部を制御し、(2)前記出力設定時間前に前記音声の入力があったときは、前記音声入力の妨げにならないようにするために、前記報知音の出力の停止、前記報知音の音量を基準音量より低下、前記報知音の周波数を基準周波数から変更、または、前記報知音の出力時間長を基準出力時間長より短くするように前記出力部を制御する制御部と、を有し、前記制御部は、今回の音声認識における前記検出時の前記経過時間が短いほど、次回の音声認識における前記出力設定時間を短くする、音声認識装置である。
本発明によれば、音声入力を検出するタイミングに基づき報知音を抑制することにより、ユーザの発声を妨げない動作が可能となる。
以下、本発明の一実施形態の音声認識装置について図面に基づいて説明する。
(第1の実施形態)
本発明の第1の実施形態に係わる音声認識装置について図1と図2に基づいて説明する。
図1は、本実施形態に係わる音声認識装置を示すブロック図である。
この音声認識装置は、マイクから入力される入力信号からユーザの音声を抽出する音声抽出部101と、ユーザの音声を認識し音声認識結果を出力する音声認識部102と、音声認識結果に応じて音声認識装置を制御する制御部103と、報知音を出力する時刻を通知する計時部104と、制御部103からの出力をユーザに提示するスピーカなどの出力部105とを備えている。
なお、音声認識装置の各部101、102、103、104の機能は、コンピュータに伝達または格納されたプログラムによって実現してもよい。
音声抽出部101は、制御部103から音声入力待機状態開始の通知をうけて、すなわち、待機開始信号が入力して音声入力待機状態を開始する。音声抽出の処理方法は既存の方法が利用できる。音声入力待機状態中にユーザからの音声入力の開始を検出した時には、制御部103に音声入力開始のイベントを通知する。また、ユーザの音声入力開始から音声入力終了までの期間の音声信号を音声認識部102に出力する。なお、音声入力待機状態は制御部103からの通知が無くとも開始しても良い。制御部103が抽出処理開始の通知をしていない状況での音声入力開始のイベントが通知された時は、制御部103はそのイベントが無効であると判断する。
音声認識部102は、音声抽出部101から出力される音声入力信号を音声認識処理し、音声認識結果を制御部103に出力する。音声認識の処理方法は既存の方法が利用できる。
制御部103は、音声抽出部101に音声入力待機状態開始を示す待機開始信号を出力すると共に計時部104に経過時間Tsの計時を依頼する。計時部104から音声入力待機状態開始からの経過時間Tsが出力設定時間T1を経過したことを通知されると、ユーザに入力を促す報知音を出力部105から出力する。但し、経過時間Tsが出力設定時間T1を経過する前に音声抽出部101から音声入力開始イベントが通知されると、出力設定時間T1を経過しても報知音を出力しないように動作する。
制御部103が音声抽出部101に音声入力待機状態開始を通知するタイミングは、例えばユーザが音声入力開始を通知するボタンが押された時や、ユーザに対して出力している応答が終了する時、等が挙げられる。または、これらのタイミングから所定の時間移動したタイミングでも良い。
計時部104は、制御部103から音声入力待機状態開始を始めたことを示す待機開始信号を受けると経過時間Tsの計時を開始し、この経過時間Tsが出力設定時間T1を経過した時に、制御部103に出力設定時間T1が経過したことを通知する。
出力部105は、制御部103から報知音出力の通知を受けると報知音を出力する。
次に、図1及び図2を用いて、本実施形態に係わる音声認識装置の動作について説明する。なお、図2は、音声認識装置の動作を示すフローチャートである。
まず、制御部103は、音声入力待機状態の開始を示す待機開始信号を音声抽出部101に出力すると共に、計時部104に経過時間Tsの計時の開始を依頼する(ステップS101)。
音声抽出部101がユーザの音声を検出すれば(ステップS102のYes)、音声抽出部101は制御部103に音声入力開始イベントを通知し、音声認識部102は音声認識処理を開始する(ステップS105)。この場合に報知音は出力されない。
音声抽出部101がユーザの音声を検出しない状態で(ステップS102のNo)、計時部104から制御部103に対し、経過時間Tsが出力設定時間T1を経過したことを通知されると(ステップS103のYes)、制御部103は出力部105を利用して報知音を出力する(ステップS104)。
その後に音声抽出部101がユーザからの音声を検出すれば(ステップS102のYes)、音声認識部102は音声認識処理を行う(ステップS105)。
このように本実施形態では、ユーザの音声入力開始が検出され、音声認識処理を開始すると報知音を出力しないように制御することで、ユーザの音声入力中に報知音を出力せず、ユーザの音声入力を妨げない。
(変更例)
(1)変更例1
本実施形態においては、音声抽出部101が音声入力待機状態を開始した後に報知音を出力することよって、音声抽出部101がこの報知音が音声入力開始と誤って判定する可能性がある。この誤動作を防止するために次のような動作の変更例も考えられる。
音声抽出部101が、音声抽出部101に入力された信号をフーリエ変換等で周波数分析し、入力信号が報知音と類似するものであれば音声入力開始と判断しないようにする。
この判断処理のときには、音声抽出部101は、出力部105から出力する報知音のパラメータを参照する。
また、報知音を出力する時刻の情報を制御部103から音声抽出部101が取得すれば、より厳密に入力された信号が報知音であることを認識することが可能となる。
(2)変更例2
報知音の出力が長く続く場合、報知音の出力中にユーザの音声入力を検出することもある。このような場合には、報知音の出力を中断しても良い。
(3)変更例3
本実施形態ではユーザに対して入力を促す方法として報知音のみを採用しているが、報知音に加えて、その他の報知信号を利用してもよい。
例えば、光やディスプレイ等で視覚的に入力を促したり、機器の振動等によって触覚的に入力を促したりする方法を報知信号として利用する。
これらの報知信号を利用する場合でも、出力設定時間T1の前に音声入力を検出すると報知信号の出力を取りやめれば、ユーザの音声入力を妨げない。
(第2の実施形態)
次に、本発明の第2の実施形態の音声認識装置について図3及び図4に基づいて説明する。第2の実施形態では、ユーザの音声入力タイミングに基づいて、報知音を修正する。
本実施形態の音声認識装置の構成図を図3に示す。なお、図3において第1の実施形態と共通のものには図1と同じ参照符号を記載している。本実施形態では報知音修正部206が追加されたことと、それに伴い制御部103と計時部104の動作が異なる。以下、音声認識装置について説明する。
制御部103は、音声入力待機状態開始から出力設定時間T1が経過するまでに音声抽出部101から音声入力開始が通知されると、計時部104から音声入力待機状態開始から音声入力の開始までの経過時間Tsを取得し、経過時間Tsに基づく報知音の修正を報知音修正部206に依頼する。また、制御部103は、音声抽出部101から音声入力開始イベントが通知された後に計時部104より音声入力待機状態開始から出力設定時間T1が経過したことが通知されると、報知音修正部206によって修正された報知音を出力する。
計時部104は、音声入力待機状態開始から音声入力開始イベントまでの経過時間Tsを計時し、制御部103に出力する。また、音声入力待機状態開始からの出力設定時間T1が音声入力待機状態開始から経過したことを制御部103に出力する。
報知音修正部206は、音声入力待機状態開始から音声入力開始イベントまでの経過時間Tsに基づいて報知音を修正する。報知音修正部206は、経過時間Tsが短くなるに従い、ユーザの発声を妨げないように報知音のパラメータを大きく修正する。経過時間Tsが出力設定時間T1より大きくなった場合は既に報知音が出力された後なのでパラメータの修正を行わない。
報知音のパラメータとして音量、出力時間長、周波数がある。修正するパラメータはこれらの中から一つを選択しても、複数を同時に修正しても良い。
以下、報知音修正部206における修正方法について述べる。
第1の修正方法について説明する。
ユーザが音声入力待機状態開始直後に音声入力を開始するようであれば、音声入力を促す報知音の必要性は小さい。
したがって、報知音修正部206は経過時間Tsが小さくなるに従い、報知音の音量を小さくするようにパラメータを修正する。音量は振幅値や対数パワーなどで指定することができ、例えば次の(1)式で音量Volumeを制御する。

Volume=V*Ts/T1 ・・・(1)

但し、Vは基準音量を表す正の定数である。
第2の修正方法について説明する。
ユーザが音声入力待機状態開始直後に音声入力を開始するようであれば、音声入力を促す報知音の必要性は小さい。
したがって、報知音修正部206は経過時間Tsが小さくなるに従い、報知音の出力時間長を短くするようにパラメータを修正する。例えば次の(2)式で出力時間長Durationを制御する。

Duration=D*Ts/T1 ・・・(2)

但し、Dは基準出力時間長を表す正の定数である。
第3の修正方法について説明する。
ユーザが音声入力待機状態開始直後に音声入力を開始するようであれば、音声入力を促す報知音の必要性は小さい。
したがって、報知音修正部206は経過時間Tsが小さくなるに従い、報知音の周波数を非可聴域に近づけるように修正する。この処理における近づけるシフト量Shiftは例えば次の(3)式で制御する。

Shift=S*c*(T1−Ts) (但し、T1>Tsである)
=0 (但し、T1<=Tsである)

・・・(3)

但し、Sは基準周波数からの移動量を表す正の定数、cは修正の度合いを示す正の定数である。
以上の(1)〜(3)式のパラメータは、経過時間Tsの大きさに対して単調に変化するものであれば良く、例えば経過時間Tsがある閾値よりも小さくなったときに大きく変化するステップ関数のようなものを用いても良い。
次に、図3及び図4を用いて、本実施形態に係わる音声認識装置の動作について説明する。なお、図4は、音声認識装置の動作を示すフローチャートである。なお、図4においても第1の実施形態と共有できるステップにおいては図2と同じステップ番号を記載している。
まず、制御部103は、音声入力待機状態の開始を示す待機開始信号を音声抽出部101に出力すると共に、計時部104に経過時間Tsの計時の開始を依頼する(ステップS101)。
そして、音声抽出部101が、ユーザの音声を検出しない状態で(ステップS102のNo)、計時部104から制御部103に対し、経過時間Tsが出力設定時間T1を経過したことを通知されると(ステップS103のYes)、制御部103は出力部105を利用して報知音を出力する(ステップS104)。
一方、音声抽出部101が、ユーザの音声を検出すれば(ステップS102のYes)、音声抽出部101は制御部103に音声入力開始イベントを通知する。
次に、制御部103は、計時部104から経過時間Tsを取得し(ステップS211)、報知音修正部206は制御部103から得た経過時間Tsに基づいて報知音の修正を行う(ステップS206)。この修正方法は上記の通りである。
次に、音声認識部102は音声抽出部101から入力される音声信号に対して音声認識処理を開始する(ステップS207)。
次に、音声認識部102は、音声認識処理を開始後に、音声抽出開始からの出力設定時間T1が経過した場合(ステップS208のYes)にも、制御部103は出力部105を介してユーザに対して報知音を出力する(ステップS209)。ここで出力される報知音は、報知音制御部206によって修正された報知音であるので、ユーザの入力を妨げにくい。
最後に、音声認識部102による音声認識処理が終了すると(ステップS210のYes)、制御部103は音声認識結果を得る(End)。
このように本実施形態では、ユーザの音声入力開始が検出されると、音声入力開始のタイミングに基づき報知音を修正する。報知音は音声入力開始の検出が早ければユーザの音声入力を妨げないように修正される。
(変更例)
(1)変更例1
報知音の一形態として、発話ボタンを押してから「入力して下さい」といった文章を出力するものもある。このような形態において、報知音の出力時間長を短くすることを目的として文章を「どうぞ」や「はい」といった短いものに変更してもよい。
(2)変更例2
本実施形態ではユーザに対して入力を促す方法として報知音を採用しているが、報知音に加えてその他の報知信号を採用してもよい。
例えば、光やディスプレイ等で視覚的に入力を促したり、機器の振動等によって触覚的に入力を促したりする方法も考えられる。これらの方法であっても報知信号のパラメータを次のように修正すれば良い。
視覚的なフィードバックについては、経過時間Tsの短さに応じて出力の強度を弱めたり、表示時間を縮めたり、不可視領域の周波数へと修正を加えていくことでユーザの発声を妨げないように報知信号を抑制することが可能となる。
特に、出力の強度を弱める方法としては、出力する光の強さを弱めたり、光の方向をユーザとは違う方向に変更したりすることや、ディスプレイを利用する場合は表示領域を小さくしたり、背景色に近い色合いを選択したりすることで、ユーザの音声入力を妨げない報知信号を出力することが可能となる。
触覚的なフィードバックについては、経過時間Tsの短さに応じて振動の強さを弱めたり、振動時間を縮めたり、振動の周波数を小さくしたりすることで、ユーザの発声を妨げないように報知信号を抑制することが可能となる。
(第3の実施形態)
次に、本発明の第3の実施形態の音声認識装置について図5と図6に基づいて説明する。第3の実施形態ではユーザの音声入力タイミングに基づいて、次回の入力時に報知音を出力するかどうかを決定する。
本実施形態の音声認識装置の構成図を図5に示す。なお、図5において第1の実施形態と共通のものには図1と同じ参照符号を記載している。
本実施形態では第1の実施形態に対して報知音パラメータ記憶部307が追加されたことと、それに伴い制御部103の動作が修正されている。
以下、音声認識装置について詳細に説明する。
制御部103は、今回の音声入力待機状態開始からの出力設定時間T1までに、音声抽出部101から音声入力開始イベントが通知されると、次回の報知音出力を行わないと決定し、そうでなければ次回の報知音出力を行うと決定する。次回に報知音を出力するかどうかのフラグ情報は報知音パラメータ記憶部307に記憶させる。制御部103は、経過時間Tsが出力設定時間T1を経過したときに、報知音パラメータ記憶部307にあるフラグ情報を参照して報知音を出力するかどうかを決定する。
報知音パラメータ記憶部307は、報知音を出力するか否かを表すフラグ情報を記憶する。
なお、制御部103は、音声入力待機状態開始後から音声入力を検出するまでの経過時間Tsに基づいて報知音の出力を決定しても良い。この場合は経過時間Tsが所定の時間より小さければ次回の報知音を出力しないと決定する。
また、制御部103は、音声抽出開始から音声入力を検出するまでの経過時間Tsの履歴に基づいて報知音の出力を決定しても良い。
報知音の決定方法には、以下のような方法がある。
第1の決定方法について説明する。
最初から今回までの音声認識の全入力における経過時間Tsを参照して決定する。例えば、今回までの全入力において経過時間Tsが出力設定時間T1より小さかった回数が、経過時間Tsが出力設定時間T1より大きかった回数より多ければ次回の報知音を出力しないと決定する。
また、最初から今回までの全入力における経過時間Tsの平均値が所定の時間より小さければ次回の報知音を出力しないと決定する。
この第1の決定方法では、これまでの音声入力開始タイミングの傾向を重視した報知音の出力決定が可能となる。
また、これらの履歴をユーザ毎に記憶しておいてもよく、この場合はユーザの傾向に応じた出力決定が可能となる。
第2の決定方法について説明する。
今回の音声認識から所定回数nだけ遡った入力における経過時間Tsを参照して決定する。例えば、今回の音声認識から所定回数nだけ遡った入力において経過時間Tsが出力設定時間T1より小さかった回数aが、経過時間Tsが出力設定時間T1より大きかった回数bより多ければ次回の報知音を出力しないと決定する。
また、今回の音声認識から所定回数nだけ遡った入力における経過時間Tsの平均値が所定の時間より小さければ次回の報知音を出力しないと決定する。
この第2の決定方法では、ユーザの音声入力開始タイミングの変動を考慮した報知音の出力決定ができる。
これらの履歴をユーザ毎に記憶しておいてもよく、この場合はユーザの傾向に応じた出力決定が可能となる。
次に、図5及び図6を用いて、本実施形態に係わる音声認識装置の動作について説明する。なお、図6は、音声認識装置の動作を示すフローチャートである。なお、図6においても第1の実施形態、第2の実施形態と共有できるステップにおいては図2、図4と同じステップ番号を記載している。
まず、制御部103は、今回の音声認識における音声入力待機状態の開始を示す待機開始信号を音声抽出部101に出力すると共に、計時部104に経過時間Tsの計時の開始を依頼する(ステップS101)。
そして、音声抽出部101がユーザの音声を検出しない状態(ステップS102のNo)で、計時部104から制御部103に対し、経過時間Tsが出力設定時間T1を経過したことを通知されると(ステップS103のYes)、制御部103は、前回までの情報で決定された報知音パラメータ記憶部307の情報を参照して報知音の出力の有無を決定し(ステップS312)、報知音を出力するとした場合(ステップS312のYes)は出力部105を利用して報知音を出力する(ステップS104)。
一方、音声抽出部101がユーザの音声を検出すれば(ステップS102のYes)、音声抽出部101は制御部103に音声入力開始イベントを通知する。
次に、制御部103は、計時部104から経過時間Tsを取得する(ステップS211)。
次に、音声認識部102は、音声抽出部101から入力される音声信号に対して音声認識処理を開始する(ステップS207)。
次に、音声認識部102が今回の音声認識処理を開始後に、音声入力待機状態開始後からの経過時間Tsが出力設定時間T1を経過した場合(ステップS208のYes)にも、制御部103は、前回までの情報で決定された報知音パラメータ記憶部307の情報を参照して報知音の出力の有無を決定し(ステップS313)、報知音を出力するとした場合(ステップS313のYes)は出力部105を介してユーザに対して報知音を出力する(ステップS209)。
最後に、音声認識部102による音声認識処理が終了すると(ステップS210のYes)、制御部103はステップS211で取得していた経過時間Tsを元に次回の報知音出力を行うかどうかの上記方法で判定を行い、判定結果を報知音パラメータ記憶部307に記憶させる(ステップS314)。この判定結果が次回の音声認識におけるステップS312とS313で利用される。
このように本実施形態では、ユーザの音声入力開始が検出されると、音声入力開始のタイミングに基づき次回の報知音を出力するかどうかを上記方法に基づいて決定する。音声入力開始のタイミングが早い傾向にあるユーザ、または、音声入力開始のタイミングが報知音出力と同時刻となりやすい傾向にあるユーザに対して音声入力を妨げないように報知音を制御することが可能となる。
(変更例)
(1)変更例1
制御部103においては、次回の報知音出力の決定を音声認識処理開始前に行っても、音声認識処理終了後に行っても良い。
音声認識処理終了後に報知音出力を決定する場合は、有効な音声認識結果(音声認識のスコアが一定値より高い結果)が得られたときのみ次回の報知音出力を決定することも可能である。
音声抽出部101が誤って音声入力を検出した場合、有効な音声認識結果ではなくなる可能性が高まる。有効な音声認識結果を得たときに限り報知音の抑制を行うことによって、音声抽出部101の誤動作の影響を軽減できる。
(2)変更例2
制御部103においては、報知音を出力していない状態で音声入力待機状態開始から所定の時間T2(T2>T1)が経過したときにユーザに入力を促すための報知音を出力すると決定しても良い。
また、ユーザに報知音の出力を初期状態に戻させるような操作を許可しても良い。
なお、本実施形態ではユーザに対して入力を促す方法として報知音を採用しているが、報知音に加えてその他の報知信号を利用してもよい。
(第4の実施形態)
次に、本発明の第4の実施形態の音声認識装置について図7と図8に基づいて説明する。第4の実施形態ではユーザの音声入力タイミングに基づいて、次回の入力時に出力する報知音を修正する。
本実施形態の音声認識装置の構成図を図7に示す。なお、図7において第2、第3の実施形態と共通のものには図3、図5と同じ参照符号を記載をしている。
本実施形態では、第3の実施形態に対して報知音修正部206が追加されたことと、それに伴い制御部103と、計時部104の動作が修正されている。
以下、音声認識装置の詳細に説明する。
制御部103は、音声抽出部101から音声入力の開始が通知されると、計時部104から音声入力待機状態開始から音声入力の開始までの経過時間Tsを取得し、経過時間Tsに基づく報知音の修正を報知音修正部206に依頼する。報知音修正部206によって修正された報知音のパラメータは報知音パラメータ記憶部307に記憶させる。修正された報知音は次回以降の入力の際に出力される。また、制御部103は、計時部104より音声入力待機状態開始から出力設定時間T1が経過したことが通知されると、報知音パラメータ記憶部307に記憶されているパラメータの報知音を出力する。
計時部104は、音声入力待機状態開始から音声入力開始イベントまでの経過時間Tsを計時し、制御部103に出力する。また、音声入力待機状態開始からの出力設定時間T1が音声入力待機状態開始から経過したことを制御部103に出力する。
報知音パラメータ記憶部307は、制御部103が出力すると決定した報知音のパラメータを記憶する。
報知音修正部206は、音声入力待機状態開始から音声入力開始イベントまでの経過時間Tsに基づいて報知音を修正する。報知音修正部206は、経過時間Tsが短くなるに従い、ユーザの発声を妨げないように報知音のパラメータを大きく修正する。報知音のパラメータとして、報知音を出力するまでの出力設定時間T1、音量、出力時間長、周波数がある。修正するパラメータはこれらの中から一つを選択しても、複数を同時に修正しても良い。報知音のパラメータ修正方法については後述する。
本実施形態では報知音を出力するまでの出力設定時間T1も修正される可能性がある。そのために報知音パラメータ記憶部307は修正された出力設定時間T1も記憶する。制御部103は報知音パラメータ記憶部307に記憶されている出力設定時間T1を参照し、計時部104に計時を依頼する。計時部104は修正された出力設定時間T1が経過したことを制御部103に通知する。
次に、報知音パラメータ修正部206におけるパラメータ修正方法について述べる。
第1の修正方法について説明する。
ユーザが報知音出力前に音声入力を開始するようであれば、次回以降は音声入力を促す報知音を出力するタイミングを早めれば、ユーザの発声前に報知音を出力することができ、ユーザの発声を妨げないようにすることができる。
したがって報知音修正部206は経過時間Tsが小さくなるに従い、報知音を出力するタイミングを前にシフトするように出力設定時間T1を小さくする。例えば次の(4)式で出力設定時間T1を制御する。

T1=Ts−t ・・・(4)

但し、tは正の定数である。

第2の修正方法について説明する。
ユーザが音声入力待機状態開始直後に音声入力を開始するようであれば、音声入力を促す報知音の必要性は小さい。したがって報知音修正部206は経過時間Tsが小さくなるに従い、報知音の音量を小さくするようにパラメータを修正する。音量は振幅値や対数パワーなどで指定することができ、例えば次の(5)式で音量Volumeを制御する。

Volume=V*Ts/T1 ・・・(5)

但し、Vは基準音量を表す正の定数である。
第3の修正方法について説明する。
ユーザが音声入力待機状態開始直後に音声入力を開始するようであれば、音声入力を促す報知音の必要性は小さい。したがって報知音修正部206は経過時間Tsが小さくなるに従い、報知音の出力時間長を短くするようにパラメータを修正する。例えば次の(6)式で出力時間長Durationを制御する。

Duration=D*Ts/T1 ・・・(6)

但し、Dは基準出力時間長を表す正の定数である。
第4の修正方法について説明する。
ユーザが音声入力待機状態開始直後に音声入力を開始するようであれば、音声入力を促す報知音の必要性は小さい。したがって報知音修正部206は経過時間Tsが小さくなるに従い、報知音の周波数を非可聴域に近づけるように修正する。この処理における近づけるシフト量Shiftは、例えば次の(7)式で制御する。

Shiht=S*c*(T1−Ts) (但し、T1>Tsである)
=0 (但し、T1<=Tsである)

・・・(7)

但し、Sは基準周波数からの移動量を表す正の定数、cは修正の度合いを示す正の定数である。
以上の(4)〜(7)式のパラメータは、経過時間Tsの大きさに対して単調に変化するものであれば良く、例えば経過時間Tsがある閾値よりも小さくなったときに大きく変化するステップ関数のようなものを用いても良い。
報知音修正部206においては、音声抽出開始から音声入力を検出するまでの経過時間Tsの履歴に基づいて報知音の修正内容を決定しても良い。以下のような決定方法が考えられる。
現在までの全入力における経過時間Tsを参照して報知音のパラメータを決定する。
例えば、全入力における経過時間Tsの平均値を報知音のパラメータを修正する際の経過時間Tsとして採用する。この決定方法では、これまでの音声入力開始タイミングの傾向を重視した報知音の出力決定が可能となる。これらの履歴をユーザ毎に記憶しておいてもよく、この場合はユーザの傾向に応じた出力決定が可能となる。
また、履歴に基づく修正方法としては、現在から所定回数遡った入力における経過時間Tsを参照して報知音のパラメータを決定する。
例えば、現在から所定回数遡った入力における経過時間Tsの平均値を報知音のパラメータを修正する際の経過時間Tsとして採用する。この決定方法では、ユーザの音声入力開始タイミングの変動を考慮した報知音の出力決定ができる。これらの履歴をユーザ毎に記憶しておいてもよく、この場合はユーザの傾向に応じた出力決定が可能となる。
次に、図7及び図8を用いて、本実施形態に係わる音声認識装置の動作について説明する。なお、図8は、音声認識装置の動作を示すフローチャートである。なお、図8においても第3の実施形態と共有できるステップにおいては図6と同じステップ番号を記載している。
まず、制御部103は、今回の音声入力待機状態の開始を音声抽出部101に通知すると共に、計時部104に経過時間Tsの計時の開始を依頼する(ステップS101)。
次に、音声抽出部101がユーザの音声を検出しない状態で(ステップS102のNo)、計時部104から制御部103に対し、経過時間Tsが出力設定時間T1を経過したことを通知されると(ステップS103のYes)、制御部103は、前回までの情報で決定された報知音パラメータ記憶部307の情報から報知音のパラメータを取得し、出力部105を利用して取得したパラメータの報知音を出力する(ステップS104)。
一方、音声抽出部101がユーザの音声を検出すれば(ステップS102のYes)、音声抽出部101は制御部103に音声入力開始イベントを通知する。
次に、音声認識部102は音声抽出部101から入力される音声信号に対して今回の音声認識処理を開始する(ステップS207)。
次に、音声認識部102が今回の音声認識処理を開始後に、音声入力待機状態開始からの経過時間Tsが出力設定時間T1を経過した場合(ステップS208のYes)にも、制御部103は出力部105を介してユーザに対して報知音を出力する(ステップS209)。ここで出力される報知音も、前回までの情報で決定された報知音パラメータ記憶部307に記憶されているパラメータの報知音である。
最後に、音声認識部102による音声認識処理が終了すると(ステップS210のYes)、制御部103は次回の報知音のパラメータを上記方法で修正し、新たなパラメータを報知音パラメータ記憶部307に記憶させる(ステップS412)。この記憶したパラメータが次回の音声認識におけるステップS104とS206のパラメータに利用される。
このように本実施形態では、ユーザの音声入力開始が検出されると、音声入力開始のタイミングに基づき次回以降の報知音を修正する。報知音は音声入力開始の検出が早ければユーザの音声入力を妨げないように修正される。音声入力開始のタイミングが早い傾向にあるユーザ、或いは音声入力開始のタイミングが報知音出力と同時刻となりやすい傾向にあるユーザに対して音声入力を妨げないように報知音を抑制することが可能となる。
(変更例)
(1)変更例1
制御部103においては、次回の報知音出力の決定を音声認識処理開始前に行っても、音声認識処理終了後に行っても良い。音声認識処理終了後に報知音出力を決定する場合は、有効な音声認識結果(音声認識のスコアが一定値より高い結果)が得られたときのみ次回の報知音出力を決定することも可能である。
音声抽出部101が誤って音声入力を検出した場合、有効な音声認識結果ではなくなる可能性が高まる。有効な音声認識結果を得たときに限り報知音の制御を行うことによって、音声抽出部101の誤動作の影響を軽減できる。
(2)変更例2
制御部103においては、音声入力待機状態開始から所定の時間T2(T2>T1)が経過したときにユーザに入力を促すための報知音を出力すると決定しても良い。この場合の報知音のパラメータは初期のものを採用する。また、ユーザに報知音のパラメータを初期状態に戻させるような操作を許可しても良い。
(3)変更例3
報知音の一形態として、発話ボタンを押してから「入力して下さい」といった文章を出力するものもある。
このような形態において、報知音の出力時間長を短くすることを目的として文章を「どうぞ」や「はい」といった短いものに変更することもできる。
(4)変更例4
本実施形態ではユーザに対して入力を促す方法として報知音を採用しているが、報知音に加えてその他の光や触覚に関する報知信号を利用してもよい。
(第5の実施形態)
次に、本発明の第5の実施形態の音声認識装置について説明する。第5の実施形態では報知音だけでなく、別の手段を用いた報知信号も利用する方法について述べる。
本実施形態の構成図は図2である。本発明では第2の実施形態に対して出力部105と、報知音修正部206の動作が修正されている。以下詳細に説明する。
本実施形態における出力部105は、ユーザに対して音声入力を促す手段として音だけではなく、別の手段も備えている。例えば、光(ライト)やディスプレイを利用した視覚的な信号による報知信号や、振動することによって触覚的な信号による報知信号を備える。
報知音修正部206は、音声抽出部101の音声入力待機状態開始からユーザの音声入力開始までの経過時間Tsに基づき、2回目以降に出力する報知信号の種類を変更する。例えば、音声入出力を行う装置では、ユーザの注意は主に音情報に向けられると考えられる。ユーザの音声入力中に報知音を出力するよりも、視覚的、触覚的な報知信号を採用した方が音声入力の妨げにならない報知信号を出力できる。したがって、報知音修正部206は、経過時間Tsが小さくなれば報知音出力から視覚的、触覚的な報知信号を出力すると変更する。
制御部103は選択された種類の報知信号を出力するように出力部105に通知する。
なお、報知音修正部206においては、様々なパラメータの聴覚的、視覚的、触覚的な報知信号をユーザの音声入力の妨げにならないように順序付け、経過時間Tsの短さに応じて音声入力を妨げないパラメータの報知信号を選択してもよい。
本実施形態であっても、2回目以降の報知信号を変更することによって、ユーザの発声を妨げない動作が可能となる。
(変更例)
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
本発明の第1の実施形態の音声認識装置の構成を示すブロック図である。 同じく音声認識装置のフローチャートである。 第2の実施形態の音声認識装置の構成を示すブロック図である。 同じく音声認識装置のフローチャートである。 第3の実施形態の音声認識装置の構成を示すブロック図である。 同じく音声認識装置のフローチャートである。 第4の実施形態の音声認識装置の構成を示すブロック図である。 同じく音声認識装置のフローチャートである。
符号の説明
101 音声抽出部
102 音声認識部
103 制御部
104 計時部
105 出力部

Claims (10)

  1. ユーザの音声を入力する入力部と、
    入力された前記音声を音声入力待機状態開始後に抽出する音声抽出部と、
    抽出した前記音声を認識する音声認識部と、
    前記音声入力待機状態開始時から予め設定した出力設定時間後に、前記ユーザに対し前記音声の入力を促す報知音を出力する出力部と、
    前記音声入力待機状態の開始時からの経過時間を計時する計時部と、
    (1)前記出力設定時間までに前記音声の入力がないときは、前記音声の入力を促すために、前記報知音を出力するように前記出力部を制御し、(2)前記出力設定時間前に前記音声の入力があったときは、前記音声入力の妨げにならないようにするために、前記報知音の出力の停止、前記報知音の音量を基準音量より低下、前記報知音の周波数を基準周波数から変更、または、前記報知音の出力時間長を基準出力時間長より短くするように前記出力部を制御する制御部と、
    を有し、
    前記制御部は、今回の音声認識における前記音声入力の入力時の前記経過時間Tsに基づいて次回の音声認識における前記報知音の出力の有無、音量、周波数、または、出力時間長のパラメータを決定して記憶部に記憶させ、前記次回の音声認識における前記報知音の前記パラメータを前記記憶部から呼び出して、前記呼び出したパラメータに基づいて前記報知音を前記出力部で出力するように制御する、
    音声認識装置。
  2. ユーザの音声を入力する入力部と、
    入力された前記音声を音声入力待機状態開始後に抽出する音声抽出部と、
    抽出した前記音声を認識する音声認識部と、
    前記音声入力待機状態開始時から予め設定した出力設定時間後に、前記ユーザに対し前記音声の入力を促す報知音を出力する出力部と、
    前記音声入力待機状態の開始時からの経過時間を計時する計時部と、
    (1)前記出力設定時間までに前記音声の入力がないときは、前記音声の入力を促すために、前記報知音を出力するように前記出力部を制御し、(2)前記出力設定時間前に前記音声の入力があったときは、前記音声入力の妨げにならないようにするために、前記報知音の出力の停止、前記報知音の音量を基準音量より低下、前記報知音の周波数を基準周波数から変更、または、前記報知音の出力時間長を基準出力時間長より短くするように前記出力部を制御する制御部と、
    を有し、
    前記制御部は、今回の音声認識における前記検出時の前記経過時間が短いほど、次回の音声認識における前記出力設定時間を短くする、
    音声認識装置。
  3. 前記制御部は、前記音声の検出時における前記経過時間が、前記出力設定時間後のときは、前記報知音の音量を前記基準音量で出力、前記報知音を前記基準周波数で出力、または、前記報知音を前記基準出力時間長で出力するように前記出力部を制御する
    ことを特徴とする請求項1又は2記載の音声認識装置。
  4. 前記制御部は、前記報知音の周波数を、可聴帯域にある前記基準周波数から非可聴帯域に近づける
    ことを特徴とする請求項1又は2記載の音声認識装置。
  5. 前記出力部は、前記ユーザに対し、視覚、または、触覚によって前記音声入力を促す報知部を更に有し、前記制御部は、前記報知音の出力に加えて前記報知部も動作させる
    ことを特徴とする請求項1又は2記載の音声認識装置。
  6. 前記制御部は、前記音声抽出部が前記音声入力待機状態の開始を行うための待機開始信号を前記音声抽出部へ出力する
    ことを特徴とする請求項1又は2記載の音声認識装置。
  7. ユーザの音声を入力する入力ステップと、
    入力された前記音声を音声入力待機状態開始後に抽出する音声抽出ステップと、
    抽出した前記音声を認識する音声認識ステップと、
    前記音声入力待機状態開始時から予め設定した出力設定時間後に、前記ユーザに対し前記音声の入力を促す報知音を出力部によって出力する出力ステップと、
    前記音声入力待機状態の開始時からの経過時間を計時する計時ステップと、
    (1)前記出力設定時間までに前記音声の入力がないときは、前記音声の入力を促すために、前記報知音を出力するように前記出力部を制御し、(2)前記出力設定時間前に前記音声の入力があったときは、前記音声入力の妨げにならないようにするために、前記報知音の出力の停止、前記報知音の音量を基準音量より低下、前記報知音の周波数を基準周波数から変更、または、前記報知音の出力時間長を基準出力時間長より短くするように前記出力部を制御する制御ステップと、
    を有し、
    前記制御ステップにおいて、今回の音声認識における前記音声入力の入力時の前記経過時間Tsに基づいて次回の音声認識における前記報知音の出力の有無、音量、周波数、または、出力時間長のパラメータを決定して記憶部に記憶させ、前記次回の音声認識における前記報知音の前記パラメータを前記記憶部から呼び出して、前記呼び出したパラメータに基づいて前記報知音を前記出力部で出力するように制御する、
    音声認識方法
  8. ユーザの音声を入力する入力ステップと、
    入力された前記音声を音声入力待機状態開始後に抽出する音声抽出ステップと、
    抽出した前記音声を認識する音声認識ステップと、
    前記音声入力待機状態開始時から予め設定した出力設定時間後に、前記ユーザに対し前記音声の入力を促す報知音を出力部によって出力する出力ステップと、
    前記音声入力待機状態の開始時からの経過時間を計時する計時ステップと、
    (1)前記出力設定時間までに前記音声の入力がないときは、前記音声の入力を促すために、前記報知音を出力するように前記出力部を制御し、(2)前記出力設定時間前に前記音声の入力があったときは、前記音声入力の妨げにならないようにするために、前記報知音の出力の停止、前記報知音の音量を基準音量より低下、前記報知音の周波数を基準周波数から変更、または、前記報知音の出力時間長を基準出力時間長より短くするように前記出力部を制御する制御ステップと、
    を有し、
    前記制御ステップにおいて、今回の音声認識における前記検出時の前記経過時間が短いほど、次回の音声認識における前記出力設定時間を短くする、
    音声認識方法。
  9. ユーザの音声を入力する入力機能と、
    入力された前記音声を音声入力待機状態開始後に抽出する音声抽出機能と、
    前記抽出した前記音声を認識する音声認識機能と、
    前記音声入力待機状態開始時から予め設定した出力設定時間後に、前記ユーザに対し前記音声の入力を促す報知音を出力部によって出力する出力機能と、
    前記音声入力待機状態の開始時からの経過時間を計時する計時機能と、
    (1)前記出力設定時間までに前記音声の入力がないときは、前記音声の入力を促すために、前記報知音を出力するように前記出力部を制御し、(2)前記出力設定時間前に前記音声の入力があったときは、前記音声入力の妨げにならないようにするために、前記報知音の出力の停止、前記報知音の音量を基準音量より低下、前記報知音の周波数を基準周波数から変更、または、前記報知音の出力時間長を基準出力時間長より短くするように前記出力部を制御する制御機能と、
    をコンピュータに実現させ、
    前記制御機能は、今回の音声認識における前記音声入力の入力時の前記経過時間Tsに基づいて次回の音声認識における前記報知音の出力の有無、音量、周波数、または、出力時間長のパラメータを決定して記憶部に記憶させ、前記次回の音声認識における前記報知音の前記パラメータを前記記憶部から呼び出して、前記呼び出したパラメータに基づいて前記報知音を前記出力部で出力するように制御する、
    音声認識プログラム。
  10. ユーザの音声を入力する入力機能と、
    入力された前記音声を音声入力待機状態開始後に抽出する音声抽出機能と、
    前記抽出した前記音声を認識する音声認識機能と、
    前記音声入力待機状態開始時から予め設定した出力設定時間後に、前記ユーザに対し前記音声の入力を促す報知音を出力部によって出力する出力機能と、
    前記音声入力待機状態の開始時からの経過時間を計時する計時機能と、
    (1)前記出力設定時間までに前記音声の入力がないときは、前記音声の入力を促すために、前記報知音を出力するように前記出力部を制御し、(2)前記出力設定時間前に前記音声の入力があったときは、前記音声入力の妨げにならないようにするために、前記報知音の出力の停止、前記報知音の音量を基準音量より低下、前記報知音の周波数を基準周波数から変更、または、前記報知音の出力時間長を基準出力時間長より短くするように前記出力部を制御する制御機能と、
    をコンピュータに実現させ、
    前記制御機能は、今回の音声認識における前記検出時の前記経過時間が短いほど、次回の音声認識における前記出力設定時間を短くする、
    音声認識プログラム。
JP2008170047A 2008-06-30 2008-06-30 音声認識装置及びその方法 Expired - Fee Related JP5322208B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008170047A JP5322208B2 (ja) 2008-06-30 2008-06-30 音声認識装置及びその方法
US12/423,209 US8364484B2 (en) 2008-06-30 2009-04-14 Voice recognition apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008170047A JP5322208B2 (ja) 2008-06-30 2008-06-30 音声認識装置及びその方法

Publications (2)

Publication Number Publication Date
JP2010008854A JP2010008854A (ja) 2010-01-14
JP5322208B2 true JP5322208B2 (ja) 2013-10-23

Family

ID=41448511

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008170047A Expired - Fee Related JP5322208B2 (ja) 2008-06-30 2008-06-30 音声認識装置及びその方法

Country Status (2)

Country Link
US (1) US8364484B2 (ja)
JP (1) JP5322208B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102376304B (zh) * 2010-08-10 2014-04-30 鸿富锦精密工业(深圳)有限公司 文本朗读系统及其文本朗读方法
KR101992676B1 (ko) 2012-07-26 2019-06-25 삼성전자주식회사 영상 인식을 이용하여 음성 인식을 하는 방법 및 장치
CN103871401B (zh) * 2012-12-10 2016-12-28 联想(北京)有限公司 一种语音识别的方法及电子设备
US9202463B2 (en) * 2013-04-01 2015-12-01 Zanavox Voice-activated precision timing
JP6960716B2 (ja) * 2015-08-31 2021-11-05 株式会社デンソーテン 入力装置、表示装置、入力装置の制御方法およびプログラム
CN105469794B (zh) * 2015-12-08 2019-09-24 联想(北京)有限公司 信息处理方法及电子设备
CN109564757A (zh) 2016-08-17 2019-04-02 索尼公司 对话控制装置和方法
JP6646001B2 (ja) 2017-03-22 2020-02-14 株式会社東芝 音声処理装置、音声処理方法およびプログラム
JP2018159759A (ja) * 2017-03-22 2018-10-11 株式会社東芝 音声処理装置、音声処理方法およびプログラム
JP7202853B2 (ja) * 2018-11-08 2023-01-12 シャープ株式会社 冷蔵庫
JP7192477B2 (ja) * 2018-12-18 2022-12-20 コニカミノルタ株式会社 画像形成装置、画像形成装置の制御方法およびプログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS561653A (en) * 1979-06-19 1981-01-09 Hitachi Ltd Aural reply system
US6487277B2 (en) * 1997-09-19 2002-11-26 Siemens Information And Communication Networks, Inc. Apparatus and method for improving the user interface of integrated voice response systems
US6154465A (en) * 1998-10-06 2000-11-28 Vertical Networks, Inc. Systems and methods for multiple mode voice and data communications using intelligenty bridged TDM and packet buses and methods for performing telephony and data functions using the same
US6587822B2 (en) * 1998-10-06 2003-07-01 Lucent Technologies Inc. Web-based platform for interactive voice response (IVR)
US6477492B1 (en) * 1999-06-15 2002-11-05 Cisco Technology, Inc. System for automated testing of perceptual distortion of prompts from voice response systems
GB9928420D0 (en) * 1999-12-02 2000-01-26 Ibm Interactive voice response system
US6941269B1 (en) * 2001-02-23 2005-09-06 At&T Corporation Method and system for providing automated audible backchannel responses
US7089184B2 (en) * 2001-03-22 2006-08-08 Nurv Center Technologies, Inc. Speech recognition for recognizing speaker-independent, continuous speech
EP1345207B1 (en) * 2002-03-15 2006-10-11 Sony Corporation Method and apparatus for speech synthesis program, recording medium, method and apparatus for generating constraint information and robot apparatus
JP2005037615A (ja) * 2003-07-18 2005-02-10 Omron Corp クライアント装置、音声認識サーバ、分散型音声認識システム、音声認識プログラム、およびコンピュータ読み取り可能な記録媒体
US20060200350A1 (en) * 2004-12-22 2006-09-07 David Attwater Multi dimensional confidence
US7565289B2 (en) * 2005-09-30 2009-07-21 Apple Inc. Echo avoidance in audio time stretching
JP4296181B2 (ja) * 2006-02-28 2009-07-15 パイオニア株式会社 地図検索装置及び地図検索方法等

Also Published As

Publication number Publication date
US20090326944A1 (en) 2009-12-31
US8364484B2 (en) 2013-01-29
JP2010008854A (ja) 2010-01-14

Similar Documents

Publication Publication Date Title
JP5322208B2 (ja) 音声認識装置及びその方法
US20240112669A1 (en) Methods and devices for selectively ignoring captured audio data
WO2017032030A1 (zh) 一种音量调节方法及用户终端
US10109294B1 (en) Adaptive echo cancellation
JP2009192942A (ja) 音声対話装置及び支援方法
JP2013080015A (ja) 音声認識装置および音声認識方法
JP5431282B2 (ja) 音声対話装置、方法、プログラム
WO2010084881A1 (ja) 音声対話装置、対話制御方法及び対話制御プログラム
CN106971704B (zh) 一种音频处理方法及移动终端
WO2017032012A1 (zh) 一种音量调节方法及用户终端
JP2014191029A (ja) 音声認識システムおよび音声認識システムの制御方法
US9558758B1 (en) User feedback on microphone placement
TWI639153B (zh) 電子裝置及其透過語音辨識喚醒的方法
CN108924344B (zh) 终端振动方法、装置、存储介质及电子设备
JP5863928B1 (ja) 音声調整装置
KR100567828B1 (ko) 향상된 음성인식 장치 및 방법
JP5375423B2 (ja) 音声認識システム、音声認識方法および音声認識プログラム
JP2008003517A (ja) 音声対話装置、音声対話方法、およびプログラム
JP2007071448A (ja) 加熱装置
CN109168098B (zh) 一种手机蓝牙耳机离开耳边自动控制暂停打开系统及其控制方法
JPH0635497A (ja) 音声入力装置
JP2015194766A (ja) 音声認識装置および音声認識方法
JP2002073061A (ja) 音声認識装置及びその方法
JP2014090350A (ja) 音声処理装置、通信装置、音声制御方法、及びプログラム
JPWO2017085815A1 (ja) 困惑状態判定装置、困惑状態判定方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110318

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120327

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120522

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130111

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130205

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130402

TRDD Decision of grant or rejection written
A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A073

Effective date: 20130604

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130618

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130711

LAPS Cancellation because of no payment of annual fees