JP2008064892A - 音声認識方法およびそれを用いた音声認識装置 - Google Patents
音声認識方法およびそれを用いた音声認識装置 Download PDFInfo
- Publication number
- JP2008064892A JP2008064892A JP2006240721A JP2006240721A JP2008064892A JP 2008064892 A JP2008064892 A JP 2008064892A JP 2006240721 A JP2006240721 A JP 2006240721A JP 2006240721 A JP2006240721 A JP 2006240721A JP 2008064892 A JP2008064892 A JP 2008064892A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- sound
- voice
- arrival direction
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】音声認識方法は、マイクロフォンを複数個配置したマイクロフォンアレイにより入力音声を集音する手順1、前記集音した入力音声信号から遠距離にある音源の音波到来方向を推定した音波到来方向推定信号を作成する手順2、前記集音した入力音声信号から近距離にある音源の位置を推定する位置推定信号を作成する手順3、前記音波到来方向推定信号と前記位置推定信号に基づき前記集音した入力音声からユーザの音声を検出・分離して出力する手順4、前記ユーザの音声信号の特徴を補正処理する手順5、前記補正処理した音声信号を音声認識する手順6とからなる。
【選択図】図1
Description
一方、指向性を持った静止雑音源は、マイクロフォンアレイを用いることで十分に抑圧できるが、実環境下では、例えば、歩行中の話者やクラクションを鳴らしながら走行している車など移動雑音源も少なくない。このような指向性を持った移動雑音源の場合、特に移動速度が速い時に、マイクロフォンアレイを用いたとしても、十分な抑圧効果が得られず、残留雑音の影響が無視できなくなる。更に、マイクロフォンアレイ処理では、指向性雑音はある程度抑圧が得られるが、無指向性雑音に対しては十分な抑圧効果が得られないという問題もある。
マイクロフォンアレイ処理部は、音声入力手段と、周囲雑音を抑圧しユーザの音声だけを強調する音源分離処理手段を有する。
音声認識処理部は、前記分離音声に残留する雑音歪を補正する機能を持った音声認識手段を有する。
マイクロフォンアレイ処理部は、入力音声(ユーザの音声等)をマイクロフォンアレイで受音するマイクロフォンアレイ音声入力装置と、この音声入力装置のマルチチャネル音声データから、ユーザの音声と周囲にいる他人の音声や雑音(以後、周囲雑音)の音源位置や到来方向の推定処理手段と、遠距離にある音源の音波到来方向を推定する遠距離にある音源の音波到来方向推定手段と、近距離にある音源の位置を推定する近距離にある音源の位置推定手段と、音源の位置推定手段の音源位置情報に基づいて認識対象の音声を分離する音源分離処理手段と、音源位置情報に基づいてユーザの発話を検出するユーザの発話検出手段と、ユーザの発話検出手段からの検出信号に応じて音源分離処理手段からの音声信号を切換出力する切換手段から構成される。
音声認識処理部は、切換手段からの音声信号に対して特徴を補正処理する特徴補正処理手段と、特徴補正処理手段からの特徴を補正した音声信号を音声認識して認識結果を出力する音声認識手段から構成される。
(1)音声認識方法は、マイクロフォンを複数個配置したマイクロフォンアレイにより入力音声を集音する手順1、前記集音した入力音声信号から遠距離にある音源の音波到来方向を推定した音波到来方向推定信号を作成する手順2、前記集音した入力音声信号から近距離にある音源の位置を推定する位置推定信号を作成する手順3、前記音波到来方向推定信号と前記位置推定信号に基づき前記集音した入力音声からユーザの音声のみを分離して出力する手順4、前記ユーザの音声信号の特徴を補正処理する手順5、前記補正処理した音声信号を音声認識する手順6とからなることを特徴とする。
(2)上記(1)記載の音声認識方法は、前記集音した入力音声からユーザの音声のみを分離して出力する手順4における出力する手順を、前記音波到来方向推定信号と前記位置推定信号に基づいてユーザの発話状態を検出した信号により行う手順としたことを特徴とする。
(4)上記(1)乃至(3)のいずれか1項記載の音声認識方法は、前記マイクロフォンアレイにより入力音声を集音する手順1で指向性雑音を抑圧し、前記ユーザの音声信号の特徴を補正処理する手順5でマイクロフォンアレイ処理で除去できない無指向性雑音や突発性雑音による歪を除去することを特徴とする。
(5)音声認識装置は、マイクロフォンを複数個配置したマイクロフォンアレイにより入力音声を集音し、前記集音した入力音声信号から遠距離にある音源の音波到来方向を推定した音波到来方向推定信号を作成すると供に、前記集音した入力音声信号から近距離にある音源の位置を推定する位置推定信号を作成し、前記音波到来方向推定信号と前記位置推定信号に基づき前記集音した入力音声からユーザの音声のみを分離して出力するマイクロフォンアレイ処理部と、前記ユーザの音声信号の特徴を補正処理し、その補正処理した音声信号を音声認識する音声認識処理部とからなることを特徴とする。
従来のヘッドセットマイクロフォンはヘッドセットの左右のどちらか一方だけに支柱が固定され、その先端に1つのマイクロフォンが配置される構造を持っている。これに対し、本発明のヘッドセットマイクロフォンアレイ音声入力装置は、ヘッドセットマイクロフォンがヘッドセットの左右両側に支柱が固定され、その先端に1つのマイクロフォンが配置される構造を持っている。
ヘッドバンド3は、長さの調節を可能とするために下記のようにスライド調節可能に構成することができる。
音声入力手段は、ユーザ音声を受音するために相互に離間して配置した複数のマイクロフォンアレイ6からなる受音手段を備える。
図6に示した平行マイクロフォンアレイ音声入力装置の構成について、以下に説明する。図6に示すように、マイクロフォンを取り付ける2本の金具は、一端をヘッドバンドに固定し、例えば20cmの間隔で平行にユーザの口元より先まで達する程度の長さを持ち、左右それぞれの金具上に任意数、例えば2つのマイクロフォン(計4個)を任意の間隔、例えば3cm間隔で配置している。
図7に示すように、音声入力手段は、平行マイクロフォンアレイ30a、30bと、マイクロフォンアンプとADC(アナログ/デジタルコンバータ)32を有する。
受音手段は、少なくとも複数のマイクロフォンを備え、好ましくは多数個のマイクロフォンをアレイ状に配置したマイクロフォンアレイが好ましい。また、マイクロフォンの配置方向は、少なくとも相互に離間して、音源からのベクトルが異なるようにする。さらに好ましくは、マイクロフォンがユーザの口元先の両側に配置されていることが好ましい。このようにユーザの口元先の両側に配置されることにより、ユーザの音声入力が容易に且つ明瞭になる。
本発明の処理回路は、平行マイクロフォンアレイ30a、30bはマイクロフォンアンプとADC32を介してCPU(中央演算処理装置)ボード33に接続され、CPU(中央演算処理装置)ボード33は記憶装置34にバスで接続される。CPU(中央演算処理装置)ボード33は、出力表示するためにディスプレイ31に接続され、また、イヤーパッド内のイヤホーンスピーカ35に接続され、更に、ケース本体2Raおよび2La内の送信装置36に接続される。送受信装置36は、有線、無線に限らず、任意の通信手段を採用できる。
音声認識装置は、平行マイクロフォンアレイ30a、30bで受音したマルチチャネル音声データに基づきユーザの音声信号を推定し認識結果を出力する。
平行マイクロフォンアレイ30a、30bでのサンプリングレートは任意に設定でき、例えば8kHzとし、量子化ビット数は任意に設定でき、例えば16bitとする。処理精度を上げるときには、サンプリングレートおよび量子化ビット数を上げる。
ヘッドセット型マイクロフォンアレイ音声入力装置は、画像表示手段として、小型で薄型のディスプレイ(例えば、液晶、EL(エレクトロルミネッセンス、プラズマディスプレイ等))やヘッドマウンテッドディスプレイ等を備えることができ、前記発声位置推定処理の結果等を視覚的に示す。
図1は本発明の音声認識装置のブロック構成図である。この音声認識装置は図7においてCPUボード33と記憶装置34とから構成される。
音声認識装置40は、マイクロフォンアレイ処理部41と、音声認識処理部42から構成される。
マイクロフォンアレイ処理部41は、入力音声をひろうマイクロフォンアレイ音声入力装置43と、装置43の出力のひろった音から遠距離にある音源の音波到来方向を推定する遠距離にある音源の音波到来方向推定手段45と、装置43の出力のひろった音から近距離にある音源の位置を推定する近距離にある音源の位置推定手段46と、手段45および46の音源位置情報に基づいて装置43の出力のひろった音から抽出対象の音源の音声を分離する音源分離処理手段44と、手段45および46の音源位置情報に基づいてユーザ(ヘッドセット型マイクロフォンアレイ音声入力装置装着者)の発話を検出するユーザの発話検出手段47と、ユーザの発話検出手段47からの検出信号に応じて音源分離処理手段44からの音声信号を切換出力する切換手段48から構成される。
音声認識処理部42は、切換手段48からの音声信号に対して特徴を補正処理する特徴補正処理手段49と、手段49からの特徴を補正した音声信号を音声認識して認識結果を出力する音声認識手段50から構成される。
1.マイクロフォンアレイから近距離にある音源の位置推定
2.マイクロフォンアレイから遠距離にある音源の音波到来方向の推定
3.ユーザの発話検出
4.音源分離処理
5.音声認識処理(特願2003−320183)
これらの要素技術の詳細について以下で説明する。
図8は本発明のマイクロフォンアレイの機能説明図である。
マイクロフォン1、2、3、4と、マイクロフォン5、6、7、8は、図8に示されるように、対向して、配置される。また、各マイクロフォンと音源の位置等は図のような関係になっているものとする。
マイクロフォンアレイから約1m以内の近距離にある音源の位置を、マイクロフォンアレイで推定する方法について以下に説明する。
雑音部分空間の基底ベクトルから行列Rn(ω)を次のように定義し、
音源位置の推定処理は連続するN個のフレームを1つのブロックとして処理する。音源位置の推定をより安定に行うためには、フレーム数Nを増やす、そして/また連続するNb個のブロックの全てで式(30)の条件が満たされたら発声があったと判断する。ブロック数は任意に設定する。連続するNフレームの時間内において、近似的に音源が静止していると見られるほどの速さで音源が移動している場合は、前記手法により音源の移動奇跡を捉えることができる。
(周囲雑音の音波到来方向推定)
複数のマイクロフォンは3次元空間中の任意の位置に配置可能である。遠距離から到来する音波は平面波として観測されると考える。
図2は、例として、任意の位置に配置された3個のマイクロフォンm1、m2、m3で、音源から到来した音波を受音する場合を示している。図2で、点cは基準点を示しており、この基準点のまわりで音波の到来方向を推定する。図2で、平面sは、基準点cを含む平面波の断面を示している。平面sの法線ベクトルnは、そのベクトルの向きを音波の伝播方向と逆向きとし、次式のように定義する。
複数の音源が存在している場合、どの音源が認識すべき音声なのかの特定は一般的に難しい。一方、音声を用いたインタフェースを採用するシステムでは、予めシステムのユーザがシステムに対して相対的にどのような位置で発声するかを表すユーザ発声領域を決めておくことができる。この場合、前述の方法でシステムの周囲に音源が複数存在しているとしても、各音源の位置や音波の到来方向を推定できれば、システムが予め想定しているユーザ発声領域に入る音源を選択することで容易にユーザの音声を特定できるようになる。
図3は本発明による発話検出処理の機能説明図である。
この図では簡単のためにX−Y平面のみで表すが、一般的に3次元空間においても同様に任意のユーザ発声領域を定義することができる。図3では、任意の位置に配置された8個のマイクロフォンm1〜m8を用いた処理を仮定し、近距離音源の探索領域および遠距離音源の探索領域のそれぞれで、ユーザ発声領域を定義している。近距離音源の探索空間は、(PxL,PyL)と(PxH,PyH)の2点を結ぶ直線を対角線とする矩形領域で、その領域内で(PTxL1,PTyL1)と(PTxH1,PTyH1)、(PTxL2,PTyL2)と(PTxH2,PTyH2)のそれぞれの2点を結ぶ直線を対角線とする2つの矩形領域をユーザの発声領域と定義している。従って、式(20)により発声があったと判断された音源位置のなかで、その座標ベクトルが前記ユーザ発声領域内に入っているものを選択することで、近距離に存在する音源の中でユーザ音声を特定できる。
発話検出された音源の位置推定結果または音波の到来方向推定結果を用いて、ユーザの音声を強調し周囲雑音を抑圧する音源分離処理について以下に説明する。
ユーザ音声の発話位置または到来方向は前記発話検出処理により求められている。また、周囲雑音の音源位置または到来方向も既に推定されている。これらの推定結果と式(8)と式(27)の音源位置ベクトル、そして無指向性雑音の分散を表すσを用いて、行列V(ω)を次式のように定義する。
連続するNフレームの時間内において、近似的に音源が静止していると見られるほどの速さで音源が移動している場合は、前記手法により移動しているユーザの強調音声が得られる。
前記音源分離処理は、指向性雑音に対しては有効であるが、無指向性雑音に対してはある程度雑音が残留してしまう。また、突発性雑音のように短時間で発生する雑音に対してもあまり雑音抑圧効果を望めない。そこで、前記音源分離処理により強調されたユーザ音声の認識に、例えば、特願2003−320183号「背景雑音歪みの補正処理方法及びそれを用いた音声認識システム」で述べられている特徴補正法を組み込んだ音声認識エンジンを用いることで、残留雑音の影響を軽減する。なお本発明は、音声認識エンジンとして特願2003−320183号に限定するものではなく、この他にも雑音に頑健な様々な手法を実装した音声認識エンジンを使用することが考えられる。
図5は音源の音波到来方向処理、発話検出処理そして音源分離処理を施して強調されたユーザ音声の波形信号を示している。横軸は時間軸、縦軸は振幅値を表す。
音声特徴量の補正処理を含まない通常の音声認識デコーダで、その強調音声を認識すると19回の発声の内正しく認識されたのは11回のみであった。これは、主に、マイクロフォンアレイ処理では除去しきれない、無指向性雑音が図5の強調音声に残留していることが影響している。一方、発話検出処理により得られる発話検出信号と前述の特徴補正を組み込んだ音声認識デコーダで、再度、強調音声を認識すると19回全ての発話を正しく認識することができた。
2R、2L イヤーパッド付き収納ケース
3 ヘッドバンド
4R、4L 支柱
5 マイクロフォン
6 マイクロフォンアレイ
30a、30b 平行マイクロフォンアレイ
31 ディスプレイ
32 マイクロフォンアンプとADC
33 CPUボード
34 記憶装置
35 イヤホーンスピーカ
36 送受信装置
40 音声認識装置
41 マイクロフォンアレイ処理部
42 音声認識処理部
43 マイクロフォンアレイ音声入力装置
44 音源分離処理手段
45 遠距離にある音源の音波到来方向推定手段
46 近距離にある音源の位置推定手段
47 ユーザの発話検出手段
48 切換器
49 特徴補正処理手段
50 音声認識手段
m1、m2、m3、m4、m5、m6、m7、m8 マイクロフォン
Claims (7)
- マイクロフォンを複数個配置したマイクロフォンアレイにより入力音声を集音する手順1、前記集音した入力音声信号から遠距離にある音源の音波到来方向を推定した音波到来方向推定信号を作成する手順2、前記集音した入力音声信号から近距離にある音源の位置を推定する位置推定信号を作成する手順3、前記音波到来方向推定信号と前記位置推定信号に基づき前記集音した入力音声からユーザの音声のみを分離して出力する手順4、前記ユーザの音声信号の特徴を補正処理する手順5、前記補正処理した音声信号を音声認識する手順6とからなることを特徴とする音声認識方法。
- 前記集音した入力音声からユーザの音声のみを分離して出力する手順4における出力する手順を、前記音波到来方向推定信号と前記位置推定信号に基づいてユーザの発話状態を検出した信号により行う手順としたことを特徴とする請求項1記載の音声認識方法。
- 前記音波到来方向推定信号と前記位置推定信号に基づいてユーザの発話状態を検出する手順を、前記音波到来方向推定信号と前記位置推定信号に基づいて予め想定されているユーザ発声領域に入る音源を選択する手順としたことを特徴とする請求項2記載の音声認識方法。
- 前記マイクロフォンアレイにより入力音声を集音する手順1で指向性雑音を抑圧し、前記ユーザの音声信号の特徴を補正処理する手順5でマイクロフォンアレイ処理で除去できない無指向性雑音や突発性雑音による歪を除去することを特徴とする請求項1乃至3のいずれか1項記載の音声認識方法。
- マイクロフォンを複数個配置したマイクロフォンアレイにより入力音声を集音し、前記集音した入力音声信号から遠距離にある音源の音波到来方向を推定した音波到来方向推定信号を作成すると供に、前記集音した入力音声信号から近距離にある音源の位置を推定する位置推定信号を作成し、前記音波到来方向推定信号と前記位置推定信号に基づき前記集音した入力音声からユーザの音声のみを分離して出力するマイクロフォンアレイ処理部と、前記ユーザの音声信号の特徴を補正処理し、その補正処理した音声信号を音声認識する音声認識処理部とからなることを特徴とする音声認識装置。
- マイクロフォンを複数個配置したマイクロフォンアレイにより入力音声を集音し、前記集音した入力音声信号から遠距離にある音源の音波到来方向を推定した音波到来方向推定信号を作成すると供に、前記集音した入力音声信号から近距離にある音源の位置を推定する位置推定信号を作成し、前記音波到来方向推定信号と前記位置推定信号に基づき前記集音した入力音声から分離音声を分離し、該分離音声を前記音波到来方向推定信号と前記位置推定信号に基づいて求めたユーザの発話検出信号に応じて伝送切換えするマイクロフォンアレイ処理部と、前記切換えされた分離音声信号の特徴を補正処理し、その補正処理した音声信号を音声認識する音声認識処理部とからなることを特徴とする請求項5記載の音声認識装置。
- マイクロフォンを複数個配置したマイクロフォンアレイにより入力音声を集音するマイクロフォンアレイ音声入力装置と、前記マイクロフォンアレイ音声入力装置の出力信号を受け遠距離にある音源の音波到来方向を推定する音波到来方向推定手段と、前記マイクロフォンアレイ音声入力装置の出力信号を受け近距離にある音源の位置を推定する位置推定手段と、前記音波到来方向推定手段の出力信号と前記位置推定手段の出力信号に基づき前記マイクロフォンアレイ音声入力装置の出力信号から音源の音声信号を分離する音源分離処理手段と、前記音波到来方向推定手段と前記位置推定手段の出力信号に基づいてユーザの発話状態を検出する発話検出手段と、前記発話検出手段の出力信号に基づいて前記音源分離処理手段の分離音声を伝送又は非伝送にする開閉器と、前記開閉器からの分離音声信号を取り込み、該分離音声信号の特徴を補正する特徴補正処理手段と、前記特徴補正処理手段からの特徴を補正した音声信号に基づき音声を認識する音声認識手段とからなることを特徴とする請求項5又は6記載の音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006240721A JP2008064892A (ja) | 2006-09-05 | 2006-09-05 | 音声認識方法およびそれを用いた音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006240721A JP2008064892A (ja) | 2006-09-05 | 2006-09-05 | 音声認識方法およびそれを用いた音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008064892A true JP2008064892A (ja) | 2008-03-21 |
Family
ID=39287683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006240721A Pending JP2008064892A (ja) | 2006-09-05 | 2006-09-05 | 音声認識方法およびそれを用いた音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008064892A (ja) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009282644A (ja) * | 2008-05-20 | 2009-12-03 | National Institute Of Advanced Industrial & Technology | インターフェイス装置とインターフェイス方法 |
EP2133707A2 (en) | 2008-06-11 | 2009-12-16 | Sony Corporation | Signal processing apparatus, signal processing method, and program |
WO2010067976A2 (ko) * | 2008-12-12 | 2010-06-17 | Shin Ho Joon | 신호 분리 방법, 상기 신호 분리 방법을 이용한 통신 시스템 및 음성인식시스템 |
KR101396633B1 (ko) * | 2008-06-10 | 2014-05-16 | 삼성전자주식회사 | 소리 신호를 이용한 영상 출력 기능 제어 장치 및 방법 |
JP2014098573A (ja) * | 2012-11-13 | 2014-05-29 | Jvc Kenwood Corp | 音声情報報知装置、音声情報報知方法およびプログラム |
CN106898360A (zh) * | 2017-04-06 | 2017-06-27 | 北京地平线信息技术有限公司 | 音频信号处理方法、装置和电子设备 |
CN107527626A (zh) * | 2017-08-30 | 2017-12-29 | 北京嘉楠捷思信息技术有限公司 | 一种音频识别系统 |
CN107909715A (zh) * | 2017-09-29 | 2018-04-13 | 嘉兴川森智能科技有限公司 | 自动售货机中的语音识别系统及方法 |
US9972338B2 (en) | 2016-05-30 | 2018-05-15 | Fujitsu Limited | Noise suppression device and noise suppression method |
CN108377605A (zh) * | 2018-04-03 | 2018-08-07 | 海盐瑞科光电科技有限公司 | 一种浴室语音控制智能开关 |
US10311874B2 (en) | 2017-09-01 | 2019-06-04 | 4Q Catalyst, LLC | Methods and systems for voice-based programming of a voice-controlled device |
CN110310625A (zh) * | 2019-07-05 | 2019-10-08 | 四川长虹电器股份有限公司 | 语音断句方法及系统 |
US10540972B2 (en) | 2017-03-27 | 2020-01-21 | Casio Computer Co., Ltd. | Speech recognition device, speech recognition method, non-transitory recording medium, and robot |
CN111429916A (zh) * | 2020-02-20 | 2020-07-17 | 西安声联科技有限公司 | 一种声音信号记录系统 |
US11087755B2 (en) | 2016-08-26 | 2021-08-10 | Samsung Electronics Co., Ltd. | Electronic device for voice recognition, and control method therefor |
CN113490979A (zh) * | 2020-01-17 | 2021-10-08 | 海信视像科技股份有限公司 | 环境声输出装置、系统、方法及非易失性存储介质 |
CN113795881A (zh) * | 2019-03-10 | 2021-12-14 | 卡多姆科技有限公司 | 使用线索的聚类的语音增强 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005084653A (ja) * | 2003-09-11 | 2005-03-31 | National Institute Of Advanced Industrial & Technology | 背景雑音歪みの補正処理方法及びそれを用いた音声認識システム |
-
2006
- 2006-09-05 JP JP2006240721A patent/JP2008064892A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005084653A (ja) * | 2003-09-11 | 2005-03-31 | National Institute Of Advanced Industrial & Technology | 背景雑音歪みの補正処理方法及びそれを用いた音声認識システム |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009282644A (ja) * | 2008-05-20 | 2009-12-03 | National Institute Of Advanced Industrial & Technology | インターフェイス装置とインターフェイス方法 |
KR101396633B1 (ko) * | 2008-06-10 | 2014-05-16 | 삼성전자주식회사 | 소리 신호를 이용한 영상 출력 기능 제어 장치 및 방법 |
EP2133707A2 (en) | 2008-06-11 | 2009-12-16 | Sony Corporation | Signal processing apparatus, signal processing method, and program |
WO2010067976A2 (ko) * | 2008-12-12 | 2010-06-17 | Shin Ho Joon | 신호 분리 방법, 상기 신호 분리 방법을 이용한 통신 시스템 및 음성인식시스템 |
WO2010067976A3 (ko) * | 2008-12-12 | 2010-08-12 | Shin Ho Joon | 신호 분리 방법, 상기 신호 분리 방법을 이용한 통신 시스템 및 음성인식시스템 |
JP2014098573A (ja) * | 2012-11-13 | 2014-05-29 | Jvc Kenwood Corp | 音声情報報知装置、音声情報報知方法およびプログラム |
US9972338B2 (en) | 2016-05-30 | 2018-05-15 | Fujitsu Limited | Noise suppression device and noise suppression method |
US11087755B2 (en) | 2016-08-26 | 2021-08-10 | Samsung Electronics Co., Ltd. | Electronic device for voice recognition, and control method therefor |
US10540972B2 (en) | 2017-03-27 | 2020-01-21 | Casio Computer Co., Ltd. | Speech recognition device, speech recognition method, non-transitory recording medium, and robot |
CN106898360A (zh) * | 2017-04-06 | 2017-06-27 | 北京地平线信息技术有限公司 | 音频信号处理方法、装置和电子设备 |
CN106898360B (zh) * | 2017-04-06 | 2023-08-08 | 北京地平线信息技术有限公司 | 音频信号处理方法、装置和电子设备 |
CN107527626A (zh) * | 2017-08-30 | 2017-12-29 | 北京嘉楠捷思信息技术有限公司 | 一种音频识别系统 |
US10311874B2 (en) | 2017-09-01 | 2019-06-04 | 4Q Catalyst, LLC | Methods and systems for voice-based programming of a voice-controlled device |
CN107909715A (zh) * | 2017-09-29 | 2018-04-13 | 嘉兴川森智能科技有限公司 | 自动售货机中的语音识别系统及方法 |
CN108377605A (zh) * | 2018-04-03 | 2018-08-07 | 海盐瑞科光电科技有限公司 | 一种浴室语音控制智能开关 |
CN113795881A (zh) * | 2019-03-10 | 2021-12-14 | 卡多姆科技有限公司 | 使用线索的聚类的语音增强 |
JP2022533300A (ja) * | 2019-03-10 | 2022-07-22 | カードーム テクノロジー リミテッド | キューのクラスター化を使用した音声強化 |
CN110310625A (zh) * | 2019-07-05 | 2019-10-08 | 四川长虹电器股份有限公司 | 语音断句方法及系统 |
CN113490979A (zh) * | 2020-01-17 | 2021-10-08 | 海信视像科技股份有限公司 | 环境声输出装置、系统、方法及非易失性存储介质 |
CN113490979B (zh) * | 2020-01-17 | 2024-02-27 | 海信视像科技股份有限公司 | 环境声输出装置、系统、方法及非易失性存储介质 |
CN111429916A (zh) * | 2020-02-20 | 2020-07-17 | 西安声联科技有限公司 | 一种声音信号记录系统 |
CN111429916B (zh) * | 2020-02-20 | 2023-06-09 | 西安声联科技有限公司 | 一种声音信号记录系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008064892A (ja) | 音声認識方法およびそれを用いた音声認識装置 | |
CN107221336B (zh) | 一种增强目标语音的装置及其方法 | |
JP4982807B2 (ja) | 操作方法およびそのための操作装置、プログラム | |
US7613310B2 (en) | Audio input system | |
JP5572445B2 (ja) | 残響抑圧装置、及び残響抑圧方法 | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
CN110379439B (zh) | 一种音频处理的方法以及相关装置 | |
US20080175408A1 (en) | Proximity filter | |
CN108630222B (zh) | 信号处理系统以及信号处理方法 | |
US10339949B1 (en) | Multi-channel speech enhancement | |
JP5841986B2 (ja) | 音声処理装置、音声処理方法、及び音声処理プログラム | |
US20100098266A1 (en) | Multi-channel audio device | |
JP2016042132A (ja) | 音声処理装置、音声処理方法、並びにプログラム | |
JP4825552B2 (ja) | 音声認識装置、周波数スペクトル取得装置および音声認識方法 | |
JP2008236077A (ja) | 目的音抽出装置,目的音抽出プログラム | |
TW202147862A (zh) | 強烈雜訊干擾存在下穩健的揚聲器定位系統與方法 | |
US10015592B2 (en) | Acoustic signal processing apparatus, method of processing acoustic signal, and storage medium | |
JP4552034B2 (ja) | ヘッドセット型マイクロフォンアレイ音声入力装置 | |
Okuno et al. | Robot audition: Missing feature theory approach and active audition | |
JP4660740B2 (ja) | 電動車椅子搭載用音声入力装置 | |
CN116343808A (zh) | 柔性麦克风阵列语音增强方法及装置、电子设备、介质 | |
JP4822458B2 (ja) | インターフェイス装置とインターフェイス方法 | |
US10880642B2 (en) | Sound pick-up apparatus, medium, and method | |
Ogawa et al. | Speech enhancement using a square microphone array in the presence of directional and diffuse noise | |
JP2005227511A (ja) | 対象音検出方法、音信号処理装置、音声認識装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080421 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101116 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20101128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20101129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110111 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110412 |