JP2009229899A - 音声認識装置および音声認識方法 - Google Patents
音声認識装置および音声認識方法 Download PDFInfo
- Publication number
- JP2009229899A JP2009229899A JP2008076275A JP2008076275A JP2009229899A JP 2009229899 A JP2009229899 A JP 2009229899A JP 2008076275 A JP2008076275 A JP 2008076275A JP 2008076275 A JP2008076275 A JP 2008076275A JP 2009229899 A JP2009229899 A JP 2009229899A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- microphone
- speech
- input
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims description 25
- 238000001514 detection method Methods 0.000 claims abstract description 40
- 238000010438 heat treatment Methods 0.000 claims 2
- 230000001629 suppression Effects 0.000 claims 2
- 230000002093 peripheral effect Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 238000001816 cooling Methods 0.000 description 3
- 230000007257 malfunction Effects 0.000 description 3
- 238000004378 air conditioning Methods 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
【課題】音声認識を用いて機器を操作する場合においてノイズによる認識ミスを減らす。
【解決手段】マイク1からの入力音声を認識する音声認識装置である。マイク1からの入力音声を取得する音声取得部2と、入力音声に基づいて発話開始時刻と発話終了時刻とを検出する音声区間検出部3と、入力音声を識別する音声識別処理部4と、電気的ノイズ源となる可能性があってマイク1とユーザ10との距離を測定する赤外光を発生する測距センサ11と、音声区間検出部3で検出した発話開始時刻から発話終了時刻までの間、一時的に、測距センサ11の動作を止めてマイク1に達する電気的ノイズ源からのノイズ発生を抑制するノイズ発生抑制手段と、を有する。測距センサ11によって測定されたマイク1とユーザ10との距離に応じてマイク1のゲインが調整される。
【選択図】図6
【解決手段】マイク1からの入力音声を認識する音声認識装置である。マイク1からの入力音声を取得する音声取得部2と、入力音声に基づいて発話開始時刻と発話終了時刻とを検出する音声区間検出部3と、入力音声を識別する音声識別処理部4と、電気的ノイズ源となる可能性があってマイク1とユーザ10との距離を測定する赤外光を発生する測距センサ11と、音声区間検出部3で検出した発話開始時刻から発話終了時刻までの間、一時的に、測距センサ11の動作を止めてマイク1に達する電気的ノイズ源からのノイズ発生を抑制するノイズ発生抑制手段と、を有する。測距センサ11によって測定されたマイク1とユーザ10との距離に応じてマイク1のゲインが調整される。
【選択図】図6
Description
本発明は、音声認識を用いて機器を操作するための音声認識方法およびその装置に関する。
近年、家電の多様化・情報化に伴い、テレビ・ビデオ・DVDプレイヤー・ハードディスクレコーダなどを初めとするAV機器や、照明・エアコン・扇風機などの住宅設備機器・空調機器など多くの家電が遠隔から操作できるように赤外線などを使ったリモートコントローラ(以下リモコン)を備え、多くのリモコンが家庭内に存在している。また、これら機器がネットワークに接続されて、ネットワークを経由した操作も可能となってきている。このように遠隔から操作できる機器が多くなり、またそれぞれの機器自体も情報技術(IT)の進展に伴い多くの機能を持つようになり、操作ボタンが増え、操作手順も複雑になってきている。ユーザはそれらを機器に応じて複数のリモコンを持ち、また、それぞれの操作ボタンの意味を理解しなければ使えなくなっている。
このように煩雑な操作の困難を解決するために、動作の意味と操作の対応が理解しやすい音声で指示ができるように、家庭内での音声認識を使ったインタフェースが注目されている。しかし、音声認識は、周囲雑音による認識エラーが多く、認識率が低いのが問題となっている。
音声認識は、一般に、音声の音声区間(発話区間)を検出する音声区間検出処理と、検出した音声区間内の音声を語彙として認識する音声識別処理からなる。音声区間検出処理は音声パワーの閾値により処理する方法が一般的であり、周囲雑音よりも発話音声が大きければよく、音声区間検出処理は比較的ノイズに強い。一方、音声識別は、多くの認識語彙とのマッチングを行なうため、比較的ノイズ対して弱い。また、音声区間検出の課題として周囲雑音に反応し、音声識別でも偶然、認識語彙とマッチングし、音声発話がないのに誤反応、誤動作する場合がある。
これを避けるために、別途押しボタンスイッチを設け、発話時にボタンを押すPush-to-Talkと言われる方法や、口唇の動きを検出して検出する方法(特許文献1)、ユーザとの距離に応じて区間を検出し音響モデルセットを変更するという方法(特許文献2)が知られている。これらは無発話時の誤認識を避ける以外にも音声区間検出の精度を上げる効果もある。
また一方、装置側から発生するノイズを発話と誤認識し、誤操作することを防ぐために、ノイズ発生中には音声認識処理を停止する方法が知られている(特許文献3、特許文献4)。このうち、特許文献3は、車両操作中は処理停止するものであり、特許文献4はロボットのノイズ発生中は処理停止するものである。
特開平4−184495号公報
特開2003−131683号公報
特開平4−24696号公報
特開2002−116794号公報
音声認識において、音声識別の方が音声区間検出よりノイズに弱いため、音声区間は検出されるが音声識別でノイズが多く認識できない場合がある。また、音声区間検出の成否は音声区間検出時にLEDを点灯することなどによりユーザに示すことができ、区間検出が成功するように再度、音量を変える、騒音を止めるなどして発話をやり直せる。一方、音声識別の成否は、操作されるまで分からず、またユーザの方でも対処しようがない。よって音声識別の識別率を上げる必要があり、そのためには音声識別時の音声をクリアに取得することが必要となる。
先に示したPush-to-Talkでは、ユーザが音声認識装置の近くにいてボタンを操作する、もしくはリモコンなどの操作ボタンを持つ必要がある。音声区間検出において口唇を検出する方法はヘッドセット以外では難しい。ノイズ発生中に音声認識処理を停止する方法は、冷却ファンや区間検出など常に動作が必要でノイズ源となるものの場合には、音声認識処理自体が行なわれなくなるので採用できない。
本発明は、上記事情に鑑みてなされたものであって、音声認識を用いて機器を操作する場合においてノイズによる認識ミスを減らすことを目的とする。
上記目的を達成するために、本発明に係る音声認識装置は、マイクからの入力音声を取得する音声取得部と、前記音声取得部で取得した入力音声に基づいて発話開始時刻と発話終了時刻とを検出する音声区間検出部と、前記音声取得部で取得した入力音声を識別する音声識別処理部と、前記音声区間検出部で検出した発話開始時刻から発話終了時刻までの間、前記音声取得部に達する電気的ノイズ源からのノイズ発生を抑制するノイズ発生抑制手段と、を有することを特徴とする。
また、本発明に係る音声認識方法は、マイクからの入力音声を音声取得部に入力する音声取得工程と、前記音声取得工程で取得した入力音声に基づいて発話開始を検出する発話開始検出工程と、前記発話開始検出の後に、前記音声取得部に達する電気的ノイズ源からのノイズ発生を抑制し、前記音声取得部に入力された音声を識別する音声識別処理工程と、前記音声取得部に入力された音声に基づいて発話終了を検出する発話終了検出工程と、前記発話終了検出の後に、前記入力音声の識別を停止する音声識別停止工程と、を有することを特徴とする。
本発明によれば、音声認識を用いて機器を操作する場合においてノイズによる認識ミスを減らすことができる。
以下、本発明の実施の形態を、図面を参照して説明する。ここで、互いに同一または類似の部分には共通の符号を付して、重複説明は省略する。
[第1の実施形態]
図1は本発明に係る音声認識装置の第1の実施形態を示すブロック図であり、図2は第1の実施形態における処理動作を示す流れ図である。
図1は本発明に係る音声認識装置の第1の実施形態を示すブロック図であり、図2は第1の実施形態における処理動作を示す流れ図である。
第1の実施形態の音声認識装置は、テレビなどのAV機器や、照明や空調機器などの種々の機器(図示せず)をユーザの音声によって操作するものであって、図1に示すように、マイク1と、音声取得部2と、音声区間(発話区間)検出部3と、音声識別処理部4と、認識語彙データベース5とを有する。
ユーザからの入力音声は、マイク1を通して音声取得部2にてあるゲイン・サンプリングレートにて量子化される。
音声区間検出部3は、量子化された音声波形の音声パワーを算出し、ある閾値よりも大きければ、音声区間(発話区間)として検出する。
図3は、音声認識装置における音声区間前後の音声パワーの変化の例を示すグラフである。この図に示すように、音声波形の音声パワーが連続的に閾値を超えているときを音声区間として特定する。
なお、入力音声が音声パワー閾値を長時間超える場合は、相当程度の以上の環境騒音が入っている可能性があるため、音声パワー閾値自体を上げる処理を行なう。
音声識別処理部4は、音声区間として検出された音声波形を処理し、認識語彙データベース5と照合し、認識結果を出力する。テレビなどの操作対象機器を操作する際にはこの認識結果に対応する操作を実行する。
この実施形態では、音声区間検出部3が音声区間検出中には、入力音声への音響的・電気的ノイズ源となりうる周辺機器(冷却ファン・モータなど)6のうち、一時的に停止しても支障がない機器の動作を停止させる。音声区間は、ユーザからの発話音声であり常時検出されることは少ない。
図4は、音声認識装置における音声区間前後の音声パワーの変化の例を示すグラフであって、(a)はファンを含む周辺機器動作中の場合、(b)はファンのみを停止させた場合、(c)はファンを含む周辺機器を停止させた場合を示す。この図に示すように、入力音声への音響的・電気的ノイズ源となりうる周辺機器の動作を一時的に停止させることにより、音声識別処理部4において音声区間内の音声波形を処理する際のノイズを抑制することができ、音声識別の精度を向上させることができる。
図2において、マイク1から入力された音声は音声取得部2により量子化され、音声区間検出部3の音声パワー算出処理を行ない(ステップS1)、閾値以上であれば音声区間の始端を検出する。始端検出時には、対象とする周辺機器の動作を停止させる(ステップS2)。次に音声識別処理を行なう(ステップS3)。また、このときの音声パワーを算出し(ステップS4)、次に音声パワーが閾値以下となった時点で、周辺機器の動作を再開する(ステップS5)。図2に示す例では、音声識別処理(ステップS3)は、音声始端検出後、随時行なうが、他の例として、音声区間終端が検出された際に行なう方法もありうる。
本実施形態によれば、CPU冷却ファンなどの音響的・電気的ノイズの大きい周辺機器を伴う操作対象機器に対して音声認識性能を向上することが可能となる。
[第2の実施形態]
図5は本発明に係る音声認識装置の第2の実施形態の概念を示す斜視図であり、図6は本発明に係る音声認識装置の第2の実施形態を示すブロック図である。
図5は本発明に係る音声認識装置の第2の実施形態の概念を示す斜視図であり、図6は本発明に係る音声認識装置の第2の実施形態を示すブロック図である。
この実施形態では、図に示すようにユーザ10とマイク1の間の距離を測定するために、マイク1の周辺に赤外測距センサ11を設置する。
赤外測距センサ11の検出結果によりユーザ10がマイク1の近くにいないと判断される場合は、マイク1に入力された音声は、周囲騒音であると判断できるため、音声認識処理を停止し周囲騒音による誤動作を防ぐこともできる。ユーザ10が検出された際には音声認識処理を行ない、その際の入力音声はユーザ10の発話音声として、音声が飽和しないよう、また音声識別可能な分解能を持つようにマイクゲインを調整することができる。
さらに、発話適正距離提示として、周囲騒音に応じて、周囲騒音が大きい場合にはマイクゲインが小さいため近い距離に、周囲騒音が小さい場合にはマイクゲインが大きいため遠い距離に、ユーザが来た際に、適正距離として表示することができる。このことにより、ユーザ10はその表示を見ながら、マイク1との距離を適切に調整することができる。また逆に、周辺騒音が小さい場合には、マイクゲインの方をユーザ10との距離に応じて調整することもできる。すなわち、距離が遠ければゲインを上げ、距離が近ければゲインを下げる。
赤外光測距センサ11は、たとえば、赤外線発光ダイオードとPIN型フォトダイオード(PSD(Position Sensitive Detector):位置検出素子)を用いて距離の検出を行なうものである。距離の検出方式は光学測距方式(反射光がセンサへ入射した位置をもとに三角測量の原理で距離計算する方式)である。この方式は検出の対象の色や反射率に影響されにくい特徴を持つ。赤外光測距センサは、安価で距離を算出可能なセンサであるが、赤外光をパルス発光するため電気的ノイズが大きい。
そこで、この実施形態では、第1の実施形態におけるノイズ発生源である周辺機器6として、赤外光測距センサ11を設定し、音声区間検出中には、赤外光測距センサ11の動作を停止させる。これにより、音声識別処理部4において音声区間内の音声波形を処理する際のノイズを抑制することができ、音声識別の精度を向上させることができる。
図7は、音声認識装置における音声区間前後の音声パワーの変化の例を示すグラフであって、(a)は赤外光測距センサ動作中の場合、(b)は赤外光測距センサを動作させない場合を示す。この図からわかるように、赤外光測距センサの動作を停止することによって、電源を分けたり別段の電気ノイズ処理をしたりしなくても、電気ノイズを低減でき、音声認識率を高めることが可能となる。
[第3の実施形態]
図8は本発明に係る音声認識装置の第3の実施形態を示すブロック図である。第3の実施形態は第2の実施形態(図6)の変形例であって、マイク1の周辺に、赤外測距センサ11に加えて焦電センサ12も設置する。焦電センサ12は、人体などの発熱物体から発生した赤外線の変化を検出することによってその発熱物体の移動を検出するものである。
図8は本発明に係る音声認識装置の第3の実施形態を示すブロック図である。第3の実施形態は第2の実施形態(図6)の変形例であって、マイク1の周辺に、赤外測距センサ11に加えて焦電センサ12も設置する。焦電センサ12は、人体などの発熱物体から発生した赤外線の変化を検出することによってその発熱物体の移動を検出するものである。
赤外光測距センサ11での距離情報だけでは、ユーザ10以外の固定物があった場合に検出を失敗する可能性がある。また、赤外光測距センサ11は測定範囲が狭いため、ユーザ10のいる位置が赤外光測距センサ11の法線上にいない場合には、ユーザ10が検出されないという欠点がある。焦電センサ12は、熱変化を捉え、人移動を体温変化で検出するため、人以外の物体は検出されにくい。また検出範囲が広い。一方、焦電センサ12は、人でも動きがなければ検出されないため、検出時の赤外光測距センサ11の検出距離と合わせて、ユーザ検出を行なうことで、高い精度での音声認識ノイズ低減処理につなげることが可能となる。
1 : マイク
2 : 音声取得部
3 : 音声区間(発話区間)検出部
4 : 音声識別処理部
5 : 認識語彙データベース
6 : 周辺機器
10 : ユーザ
11 : 赤外光測距センサ
12 : 焦電センサ
2 : 音声取得部
3 : 音声区間(発話区間)検出部
4 : 音声識別処理部
5 : 認識語彙データベース
6 : 周辺機器
10 : ユーザ
11 : 赤外光測距センサ
12 : 焦電センサ
Claims (7)
- マイクからの入力音声を取得する音声取得部と、
前記音声取得部で取得した入力音声に基づいて発話開始時刻と発話終了時刻とを検出する音声区間検出部と、
前記音声取得部で取得した入力音声を識別する音声識別処理部と、
前記音声区間検出部で検出した発話開始時刻から発話終了時刻までの間、前記音声取得部に達する電気的ノイズ源からのノイズ発生を抑制するノイズ発生抑制手段と、
を有することを特徴とする音声認識装置。 - 前記マイクと前記入力音声の発生元となるユーザとの距離を測定する測距センサをさらに有し、
前記ノイズ発生抑制手段は、前記発話開始時刻から発話終了時刻までの間、前記測距センサの動作を停止すること、を特徴とする請求項1に記載の音声認識装置。 - 前記測距センサは赤外光を発生する測距センサであることを特徴とする請求項2に記載の音声認識装置。
- 前記測距センサによって測定された前記マイクとユーザとの距離に応じて前記マイクのゲインを調整するゲイン調整手段さらに有することを特徴とする請求項2または請求項3に記載の音声認識装置。
- 前記測距センサによって測定された前記マイクとユーザとの距離が所定の距離を超えているときに前記音声識別処理部による入力音声を識別する動作を停止させる遠距離音声識別停止手段をさらに有することを特徴とする請求項2ないし請求項4のいずれか一項に記載の音声認識装置。
- 発熱物体から発生した赤外線の変化を検出することによってその発熱物体の移動を検出する焦電センサをさらに有し、
この焦電センサからの出力に基づいて発熱物体が近傍にないと判定されたときに前記音声識別処理部による入力音声を識別する動作を停止させるユーザ不在音声識別停止手段をさらに有することを特徴とする請求項1ないし請求項5のいずれか一項に記載の音声認識装置。 - マイクからの入力音声を音声取得部に入力する音声取得工程と、
前記音声取得工程で取得した入力音声に基づいて発話開始を検出する発話開始検出工程と、
前記発話開始検出の後に、前記音声取得部に達する電気的ノイズ源からのノイズ発生を抑制し、前記音声取得部に入力された音声を識別する音声識別処理工程と、
前記音声取得部に入力された音声に基づいて発話終了を検出する発話終了検出工程と、
前記発話終了検出の後に、前記入力音声の識別を停止する音声識別停止工程と、
を有することを特徴とする音声認識方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008076275A JP2009229899A (ja) | 2008-03-24 | 2008-03-24 | 音声認識装置および音声認識方法 |
US12/404,505 US20090240496A1 (en) | 2008-03-24 | 2009-03-16 | Speech recognizer and speech recognizing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008076275A JP2009229899A (ja) | 2008-03-24 | 2008-03-24 | 音声認識装置および音声認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009229899A true JP2009229899A (ja) | 2009-10-08 |
Family
ID=41089756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008076275A Withdrawn JP2009229899A (ja) | 2008-03-24 | 2008-03-24 | 音声認識装置および音声認識方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20090240496A1 (ja) |
JP (1) | JP2009229899A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011145610A (ja) * | 2010-01-18 | 2011-07-28 | Fujitsu Toshiba Mobile Communications Ltd | 通信機器 |
WO2014103560A1 (ja) * | 2012-12-25 | 2014-07-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 分析装置、分析プログラム、分析方法、推定装置、推定プログラム、及び、推定方法。 |
KR101430342B1 (ko) * | 2013-01-25 | 2014-08-13 | 성균관대학교산학협력단 | 발화자의 거리 추정을 이용한 음성인식방법 및 음성인식장치 |
JP2015211331A (ja) * | 2014-04-25 | 2015-11-24 | Smk株式会社 | リモートコントロールシステム及びリモートコントローラ |
JP2017046094A (ja) * | 2015-08-25 | 2017-03-02 | 株式会社オーディオテクニカ | 防音送話装置 |
CN107846841A (zh) * | 2015-09-24 | 2018-03-27 | 日立工机株式会社 | 自走式割草机 |
CN110415726A (zh) * | 2019-08-09 | 2019-11-05 | 四川虹美智能科技有限公司 | 一种语音测试系统及其应用方法 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101060183B1 (ko) * | 2009-12-11 | 2011-08-30 | 한국과학기술연구원 | 임베디드 청각 시스템 및 음성 신호 처리 방법 |
JP2012075039A (ja) * | 2010-09-29 | 2012-04-12 | Sony Corp | 制御装置、および制御方法 |
CN102291894A (zh) * | 2011-08-29 | 2011-12-21 | 江苏同辉照明科技有限公司 | 一种声控灯及其控制方法 |
CN102394062B (zh) * | 2011-10-26 | 2013-02-13 | 华南理工大学 | 一种自动录音设备源识别的方法和系统 |
US20130332159A1 (en) * | 2012-06-08 | 2013-12-12 | Apple Inc. | Using fan throttling to enhance dictation accuracy |
US9786281B1 (en) * | 2012-08-02 | 2017-10-10 | Amazon Technologies, Inc. | Household agent learning |
KR101987255B1 (ko) * | 2012-08-20 | 2019-06-11 | 엘지이노텍 주식회사 | 음성 인식 장치 및 이의 음성 인식 방법 |
CN106774882B (zh) * | 2012-09-17 | 2020-01-31 | 联想(北京)有限公司 | 一种信息处理的方法及电子设备 |
CN103050116A (zh) * | 2012-12-25 | 2013-04-17 | 安徽科大讯飞信息科技股份有限公司 | 语音命令识别方法及系统 |
US9477217B2 (en) * | 2014-03-06 | 2016-10-25 | Haier Us Appliance Solutions, Inc. | Using visual cues to improve appliance audio recognition |
CN104697119B (zh) * | 2015-03-24 | 2017-07-04 | 广东美的制冷设备有限公司 | 一种空调自适应送风方法及控制器 |
CN105650018B (zh) * | 2015-12-28 | 2018-08-31 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN106439967B (zh) * | 2016-10-14 | 2019-01-04 | 广州视源电子科技股份有限公司 | 一种提高油烟机语音识别率的方法及系统 |
CN109059199A (zh) * | 2018-06-28 | 2018-12-21 | 珠海格力电器股份有限公司 | 一种语音唤醒装置、方法及语音控制空调系统 |
CN111246344B (zh) * | 2020-04-14 | 2020-07-31 | 深圳市恩科电子有限公司 | 一种用于音频处理的方法及智能音箱 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6542857B1 (en) * | 1996-02-06 | 2003-04-01 | The Regents Of The University Of California | System and method for characterizing synthesizing and/or canceling out acoustic signals from inanimate sound sources |
US6717991B1 (en) * | 1998-05-27 | 2004-04-06 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for dual microphone signal noise reduction using spectral subtraction |
US6397086B1 (en) * | 1999-06-22 | 2002-05-28 | E-Lead Electronic Co., Ltd. | Hand-free operator capable of infrared controlling a vehicle's audio stereo system |
JPWO2007080886A1 (ja) * | 2006-01-11 | 2009-06-11 | 日本電気株式会社 | 音声認識装置、音声認識方法、および音声認識プログラム、ならびに妨害軽減装置、妨害軽減方法、および妨害軽減プログラム |
-
2008
- 2008-03-24 JP JP2008076275A patent/JP2009229899A/ja not_active Withdrawn
-
2009
- 2009-03-16 US US12/404,505 patent/US20090240496A1/en not_active Abandoned
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011145610A (ja) * | 2010-01-18 | 2011-07-28 | Fujitsu Toshiba Mobile Communications Ltd | 通信機器 |
WO2014103560A1 (ja) * | 2012-12-25 | 2014-07-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 分析装置、分析プログラム、分析方法、推定装置、推定プログラム、及び、推定方法。 |
JPWO2014103560A1 (ja) * | 2012-12-25 | 2017-01-12 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 分析装置、分析プログラム、分析方法、推定装置、推定プログラム、及び、推定方法。 |
US10121156B2 (en) | 2012-12-25 | 2018-11-06 | International Business Machines Corporation | Analysis device, analysis program, analysis method, estimation device, estimation program, and estimation method |
KR101430342B1 (ko) * | 2013-01-25 | 2014-08-13 | 성균관대학교산학협력단 | 발화자의 거리 추정을 이용한 음성인식방법 및 음성인식장치 |
JP2015211331A (ja) * | 2014-04-25 | 2015-11-24 | Smk株式会社 | リモートコントロールシステム及びリモートコントローラ |
JP2017046094A (ja) * | 2015-08-25 | 2017-03-02 | 株式会社オーディオテクニカ | 防音送話装置 |
CN107846841A (zh) * | 2015-09-24 | 2018-03-27 | 日立工机株式会社 | 自走式割草机 |
JPWO2017051662A1 (ja) * | 2015-09-24 | 2018-06-07 | 日立工機株式会社 | 自走式草刈機及び自走式作業機 |
CN110415726A (zh) * | 2019-08-09 | 2019-11-05 | 四川虹美智能科技有限公司 | 一种语音测试系统及其应用方法 |
Also Published As
Publication number | Publication date |
---|---|
US20090240496A1 (en) | 2009-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009229899A (ja) | 音声認識装置および音声認識方法 | |
JP5473520B2 (ja) | 入力装置及びその制御方法 | |
US10586534B1 (en) | Voice-controlled device control using acoustic echo cancellation statistics | |
JP5075664B2 (ja) | 音声対話装置及び支援方法 | |
US10132519B2 (en) | Air conditioning system | |
US9154848B2 (en) | Television apparatus and a remote operation apparatus | |
EP2399182B1 (en) | System, method and apparatus for causing a device to enter an active mode | |
US6826533B2 (en) | Speech recognition apparatus and method | |
WO2017134935A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US20130085757A1 (en) | Apparatus and method for speech recognition | |
US20110301950A1 (en) | Speech input device, speech recognition system and speech recognition method | |
JP2008009120A (ja) | リモートコントローラ並びに家電機器 | |
JP4982807B2 (ja) | 操作方法およびそのための操作装置、プログラム | |
JP6233650B2 (ja) | 操作補助装置および操作補助方法 | |
US20180217985A1 (en) | Control method of translation device, translation device, and non-transitory computer-readable recording medium storing a program | |
JP2000347692A (ja) | 人物検出方法、人物検出装置及びそれを用いた制御システム | |
JP2005049876A (ja) | ヘッドマウント型多感覚応用音声入力システム(headmountedmulti−sensoryaudioinputsystem) | |
WO2007138503A1 (en) | Method of driving a speech recognition system | |
US20190130901A1 (en) | Information processing device and information processing method | |
JP2018036902A (ja) | 機器操作システム、機器操作方法および機器操作プログラム | |
WO2020158231A1 (ja) | 制御装置、制御対象装置、制御方法及び記憶媒体 | |
US9310903B2 (en) | Displacement detection device with no hovering function and computer system including the same | |
KR102044526B1 (ko) | 인공지능에 기반하여 음성 인식을 향상시키는 방법 및 이를 구현하는 장치 | |
KR20200043128A (ko) | 전자장치 및 그 제어방법 | |
WO2020021861A1 (ja) | 情報処理装置、情報処理システム、情報処理方法及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20110607 |