JP6603919B2 - 音声認識装置、および音声認識方法 - Google Patents
音声認識装置、および音声認識方法 Download PDFInfo
- Publication number
- JP6603919B2 JP6603919B2 JP2015122843A JP2015122843A JP6603919B2 JP 6603919 B2 JP6603919 B2 JP 6603919B2 JP 2015122843 A JP2015122843 A JP 2015122843A JP 2015122843 A JP2015122843 A JP 2015122843A JP 6603919 B2 JP6603919 B2 JP 6603919B2
- Authority
- JP
- Japan
- Prior art keywords
- state
- sound source
- vehicle
- threshold
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 45
- 230000004807 localization Effects 0.000 claims description 52
- 230000005236 sound signal Effects 0.000 claims description 47
- 238000001228 spectrum Methods 0.000 claims description 45
- 238000000926 separation method Methods 0.000 claims description 29
- 238000012886 linear function Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 23
- 238000012546 transfer Methods 0.000 description 18
- 238000001514 detection method Methods 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 13
- 230000008859 change Effects 0.000 description 12
- 230000007246 mechanism Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000033001 locomotion Effects 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
Description
このような音声認識装置では、座席シートの位置毎に、座席シートに着席している話者の音声の音源位置を予めプリセット情報として記憶させておく。そして、音声認識装置では、センサによって検出した座席シートの位置に基づいてプリセット情報を検索し、検索されたプリセット情報を参照して、運転席と助手席それぞれに着席している話者の音声を分離して音声認識を行うことが提案されている(例えば、特許文献1参照)。
また、(2)の構成によれば、車両の走行状態または動作状態のうちの少なくとも1つの状態に応じた閾値を用いて、音源の発話区間を検出することができる。
また、(1)または(6)の構成によれば、音源分離された運転者または乗員の発話のうち、閾値以上の発話の区間の音声信号を用いて音声認識を行うことで、車両の状態応じて発生するノイズの影響を低減することができる。
また、(5)の構成によれば、運転者の音声を乗員の音声より優先して音声認識することができる。
図1は、本実施形態に係る音声認識装置1の構成を示すブロック図である。図2は、本実施形態に係る車両2が備える構成の例を示す図である。
図1に示すように、音声認識装置1は車両2に設置されている。
図2に示すように、車両2は、収音部10、運転席201、助手席202、ステアリングホイール211、シフトレバー212、パーキングブレーキ・ブレーキペダル213、アクセルペダル214、車輪221、パワーウィンド231、ドア232等を含んで構成される。
操作入力部51は、車両2の走行に関する入力部であり、例えばステアリングホイール211、シフトレバー212、パーキングブレーキ・ブレーキペダル213、アクセルペダル214、クラッチペダル215等である。操作入力部51は、入力された結果を走行装備20に出力する。
走行機構22は、動力伝達装置、走行装置、制御装置等であり、例えばドライブシャフト、車輪221、ブレーキドラム等である。
走行制御部21は、操作入力部51が出力した結果に応じて、走行機構22を制御する。また、走行制御部21は、制御した制御結果を走行状態検出部23に出力する。
動作機構32は、パワーウィンド231の開閉機構、ドア232の開閉機構、ワイパー233の動作機構等である。
動作制御部31は、操作入力部52が出力した結果に応じて、動作機構32を制御する。また、動作制御部31は、制御した制御結果を動作状態検出部33に出力する。
図1に示すように、音声認識装置1は、収音部10、音声信号取得部11、伝達関数記憶部12、音源定位部13、音源分離部14、動作情報取得部15、閾値記憶部16、音声区間判定部17、特徴量算出部18、および音声認識部19を備えている。
また、音源定位部13は、音源定位された運転席201に着席している運転者の発話(第1音源)の空間スペクトルと、助手席202に着席している乗員の発話(第2音源)の空間スペクトルを、例えばフレーム毎に音声区間判定部17に出力する。ここで、フレームとは、解析されるデータの単位であり、例えばフレーム長が25(msec)、フレームの間隔が10(msec)である。
次に、音声認識装置1が行う処理手順を説明する。
図3は、本実施形態に係る音声認識装置1が行う処理のフローチャートである。
ここで、MUSIC法(例えば、参考文献1参照)による空間スペクトルの算出と、音源定位の推定の概略を説明する。
音源定位部13は、周波数ω毎にチャネル間の周波数領域信号xi(ω)の相互相関(cross correlation)を要素とするN行N列の相関行列(correlation matrix)R(ω)を、例えば次式(1)によって算出する。
音源定位部13は、相関行列R(ω)を固有値展開して、N個の固有値λi(ω)及び固有ベクトルei(ω)を算出する。なお、相関行列R(ω)と固有値λi(ω)ならびに固有ベクトルei(ω)は、次式(2)に示される関係を満たす。
音源定位部13は、MUSIC評価値P(ω,φ)と最大固有値λ1(ω)を用いて、検出した音源方向φ毎に、予め定めた音声の周波数帯域における空間スペクトルP(φ)を、例えば次式(4)によって算出する。
次に、運転席201と助手席202における空間スペクトルの時間変化の例を説明する。
図4は、本実施形態に係る運転席201に着席している運転者による音声信号の空間スペクトルの時間変化の例を示す図である。図5は、本実施形態に係る助手席202に着席している乗員による音声信号の空間スペクトルの時間変化の例を示す図である。図4および図5において、横軸は時刻、縦軸はパワーを表している。
図5において、曲線p02は、助手席202に着席している乗員の音声信号の空間スペクトルのパワーの時間変化を表している。図5に示す例では、時刻t0のとき、パワーが極小値p2minであり、時刻t11のとき、パワーが極大値p2maxである。
次に、閾値記憶部16に記憶されている閾値の例を説明する。
図6は、本実施形態に係る閾値記憶部16に記憶されている運転席201に着席している運転者の音声信号に対する閾値の例を示す図である。図7は、本実施形態に係る閾値記憶部16に記憶されている助手席202に着席している乗員の音声信号に対する閾値の例を示す図である。
図6および図7に示すように、車速毎にワイパー233がON(オン)状態の閾値と、OFF(オフ)状態の閾値とが、音源毎に対応つけられている。
このため、運転席と助手席に対するぞれぞれの閾値の大小関係を、認識した音声の用途に応じて、例えば利用者(運転者または乗員)が切り替えるようにしてもよい。
さらに、閾値記憶部16に記憶されている閾値は、表形式に限られず、車速vの閾値Td(v)および閾値Tp(v)それぞれの数式が記憶されていてもよい。
なお、閾値Td(v)とは、運転席201に着席している運転者の音声信号におけるパワーに対する閾値である。閾値Tp(v)とは、助手席202に着席している乗員の音声信号におけるパワーに対する閾値である。
図8は、本実施形態に係る車速vと、閾値Td(v)および閾値Tp(v)との例を示す図である。図8において、グラフg101は、車速vと時刻との関係を表すグラフであり、グラフg102は、閾値Td(v)および閾値Tp(v)と時刻との関係を表すグラフである。グラフg101およびグラフg102において、横軸は時刻である。グラフg101において、縦軸は車速vである。グラフg102において、縦軸は閾値dBである。また、グラフg102に示した閾値Td(v)および閾値Tp(v)は、ワイパー233がON状態である。
次に、音声区間判定部17による音声区間の例を説明する。
図9は、本実施形態に係る運転席201に着席している運転者の音声信号におけるパワーと閾値との時間変化の例を示す図である。図10は、本実施形態に係る助手席202に着席している乗員の音声信号におけるパワーと閾値との時間変化の例を示す図である。図9および図10において、横軸は時刻、縦軸はパワーと閾値である。なお、図9および図10において、時刻t0〜t23における時刻に対する時速vの変化は、図8と同じである。このため、閾値Td(v)と閾値Tp(v)も図8と同様である。
図10に示す例では、時刻t0〜t23の区間、乗員の発話p02が閾値Tp(v)より小さい。このため、音声区間判定部17は、時刻t0〜t23において、乗員の発話区間がないと判定する。
この構成によって、本実施形態では、車両の走行状態または動作状態のうちの少なくとも1つの状態に応じた閾値を用いて、音源の発話区間を検出することができる。本実施形態では、このように検出された発話区間の音声信号の音声認識を行うことで、車両の走行状態または動作状態のうちの少なくとも1つの状態に応じたノイズより大きい音声信号を抽出することができる。この結果、本実施形態の音声認識装置1は、車両の走行状態または動作状態のうちの少なくとも1つの状態応じて発生するノイズの影響を低減することができる。
この構成によって、本実施形態では、車速毎かつ車両の動作状態毎かつ運転者または乗員毎の閾値を用いて、運転者または乗員の発話区間を適切に検出することができる。本実施形態では、このように検出された発話区間の音声信号の音声認識を行うことで、車両の状態に応じたノイズより大きい音声信号を抽出することができる。この結果、本実施形態の音声認識装置1は、車両の状態応じて発生するノイズの影響を低減することができる。
この構成によって、本実施形態では、運転者の音声を乗員の音声より優先して音声認識することができる。
Claims (6)
- 音響信号を収音する収音部と、
前記収音部によって収音された前記音響信号から空間スペクトルを算出し、算出した前記空間スペクトルを用いて音源定位を行う音源定位部と、
音声区間を判定するための閾値と車両の状態との関係は非線形の関数であり、前記閾値を前記車両の状態毎に表形式で記憶する閾値記憶部と、
前記車両の状態に対応する閾値を前記閾値記憶部から読み出し、前記音源定位部によって算出された前記空間スペクトルのパワーが、前記閾値記憶部から読み出した前記閾値を超えた区間を判定する音声区間判定部と、
前記音声区間判定部が判定した区間の音響信号について音声認識を行う音声認識部と、
を備え、
前記閾値記憶部は、運転席に着席する運転者の音声信号に対応する閾値と、助手席に着席する乗員の音声信号に対応する閾値を、それぞれ表形式で記憶し、
前記音源定位部によって音源定位された結果に基づいて、前記運転者の音声信号と前記乗員の音声信号を分離する音源分離部、を備え、
前記音声区間判定部は、
前記音源分離部によって分離された音声信号が前記運転者の音声信号の場合、前記運転者の音声信号に対応する閾値の中から前記車両の状態に対応する閾値を読み出し、前記空間スペクトルのパワーが、前記運転者の音声信号に対応する閾値の中から前記車両の状態に対応する前記閾値を超えた区間を判定し、
前記音源分離部によって分離された音声信号が前記乗員の音声信号の場合、前記乗員の音声信号に対応する閾値の中から前記車両の状態に対応する閾値を読み出し、前記空間スペクトルのパワーが、前記乗員の音声信号に対応する閾値の中から前記車両の状態に対応する前記閾値を超えた区間を判定する、音声認識装置。 - 前記車両の状態は、
前記車両の走行状態および前記車両の動作状態のうち、少なくとも1つの状態である請求項1に記載の音声認識装置。 - 前記車両の走行状態は、車速に基づく状態であり、
前記車両の動作状態は、パワーウィンドの開閉状態、ドアの開閉状態、およびワイパーの動作状態のうち、少なくとも1つの状態である請求項1または請求項2に記載の音声認識装置。 - 前記所定の閾値は、
車速と、前記車両の動作状態と、前記運転者または前記乗員の音源とに対応付けられている請求項1に記載の音声認識装置。 - 前記所定の閾値は、
前記運転者の音源に対する前記所定の閾値の方が、前記乗員の音源に対する前記所定の閾値より大きい請求項1または請求項4に記載の音声認識装置。 - 音声区間を判定するための閾値と車両の状態との関係は非線形の関数であり、音声区間を判定するための閾値を車両の状態毎に表形式で記憶する閾値記憶部を有し、前記閾値記憶部は、運転席に着席する運転者の音声信号に対応する閾値と、助手席に着席する乗員の音声信号に対応する閾値を、それぞれ表形式で記憶する音声認識装置における音声認識方法であって、
収音部が、音響信号を収音する収音手順と、
音源定位部が、前記収音手順によって収音された前記音響信号から空間スペクトルを算出し、算出した前記空間スペクトルを用いて音源定位を行う音源定位手順と、
音声区間判定部が、前記車両の状態に対応する閾値を前記閾値記憶部から読み出す閾値読出手順と、
前記音声区間判定部が、前記音源定位手順によって算出された前記空間スペクトルのパワーが、前記閾値読出手順によって読み出した前記閾値を超えた区間を判定する音声区間判定手順と、
音声認識部が、前記音声区間判定手順が判定した区間の音響信号について音声認識を行う音声認識手順と、
音源分離部が、前記音源定位手順によって音源定位された結果に基づいて、前記運転者の音声信号と前記乗員の音声信号を分離する音源分離手順と、
を含み、
前記音声区間判定手順は、
前記音源分離手順によって分離された音声信号が前記運転者の音声信号の場合、前記運転者の音声信号に対応する閾値の中から前記車両の状態に対応する閾値を読み出し、前記空間スペクトルのパワーが、前記運転者の音声信号に対応する閾値の中から前記車両の状態に対応する前記閾値を超えた区間を判定し、
前記音源分離手順によって分離された音声信号が前記乗員の音声信号の場合、前記乗員の音声信号に対応する閾値の中から前記車両の状態に対応する閾値を読み出し、前記空間スペクトルのパワーが、前記乗員の音声信号に対応する閾値の中から前記車両の状態に対応する前記閾値を超えた区間を判定する、
音声認識方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015122843A JP6603919B2 (ja) | 2015-06-18 | 2015-06-18 | 音声認識装置、および音声認識方法 |
US15/180,218 US9697832B2 (en) | 2015-06-18 | 2016-06-13 | Speech recognition apparatus and speech recognition method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015122843A JP6603919B2 (ja) | 2015-06-18 | 2015-06-18 | 音声認識装置、および音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017009701A JP2017009701A (ja) | 2017-01-12 |
JP6603919B2 true JP6603919B2 (ja) | 2019-11-13 |
Family
ID=57588367
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015122843A Active JP6603919B2 (ja) | 2015-06-18 | 2015-06-18 | 音声認識装置、および音声認識方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9697832B2 (ja) |
JP (1) | JP6603919B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6603919B2 (ja) * | 2015-06-18 | 2019-11-13 | 本田技研工業株式会社 | 音声認識装置、および音声認識方法 |
CN106653060B (zh) * | 2017-01-11 | 2020-05-12 | 瑞声声学科技(深圳)有限公司 | 吹气声识别系统及采用该系统的吹气识别方法 |
CN113986187B (zh) * | 2018-12-28 | 2024-05-17 | 阿波罗智联(北京)科技有限公司 | 音区幅值获取方法、装置、电子设备及存储介质 |
CN112216303B (zh) * | 2019-07-11 | 2024-07-23 | 北京声智科技有限公司 | 一种语音处理方法、装置及电子设备 |
WO2021014649A1 (ja) * | 2019-07-25 | 2021-01-28 | 日本電信電話株式会社 | 音声非音声判定装置、音声非音声判定用モデルパラメータ学習装置、音声非音声判定方法、音声非音声判定用モデルパラメータ学習方法、プログラム |
CN113494796B (zh) * | 2020-04-02 | 2024-01-05 | 青岛海尔电冰箱有限公司 | 冰箱、传声单元的控制方法和存储介质 |
CN113494798B (zh) * | 2020-04-02 | 2023-11-03 | 青岛海尔电冰箱有限公司 | 冰箱、传声单元的控制方法和存储介质 |
CN113494797B (zh) * | 2020-04-02 | 2024-01-05 | 青岛海尔电冰箱有限公司 | 冰箱、传声单元的控制方法和存储介质 |
CN111640428B (zh) * | 2020-05-29 | 2023-10-20 | 阿波罗智联(北京)科技有限公司 | 一种语音识别方法、装置、设备和介质 |
CN113327608B (zh) * | 2021-06-03 | 2022-12-09 | 阿波罗智联(北京)科技有限公司 | 针对车辆的语音处理方法、装置、电子设备和介质 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5730913A (en) * | 1980-08-01 | 1982-02-19 | Nissan Motor Co Ltd | Speech recognition response device for automobile |
KR100493172B1 (ko) * | 2003-03-06 | 2005-06-02 | 삼성전자주식회사 | 마이크로폰 어레이 구조, 이를 이용한 일정한 지향성을갖는 빔 형성방법 및 장치와 음원방향 추정방법 및 장치 |
WO2006025106A1 (ja) | 2004-09-01 | 2006-03-09 | Hitachi, Ltd. | 音声認識システム、音声認識方法およびそのプログラム |
EP1923866B1 (en) * | 2005-08-11 | 2014-01-01 | Asahi Kasei Kabushiki Kaisha | Sound source separating device, speech recognizing device, portable telephone, sound source separating method, and program |
EP2090895B1 (en) * | 2006-11-09 | 2011-01-05 | Panasonic Corporation | Sound source position detector |
JP2009020423A (ja) * | 2007-07-13 | 2009-01-29 | Fujitsu Ten Ltd | 音声認識装置および音声認識方法 |
KR101670313B1 (ko) * | 2010-01-28 | 2016-10-28 | 삼성전자주식회사 | 음원 분리를 위해 자동적으로 문턱치를 선택하는 신호 분리 시스템 및 방법 |
JP5668553B2 (ja) * | 2011-03-18 | 2015-02-12 | 富士通株式会社 | 音声誤検出判別装置、音声誤検出判別方法、およびプログラム |
JP5629249B2 (ja) * | 2011-08-24 | 2014-11-19 | 本田技研工業株式会社 | 音源定位システム及び音源定位方法 |
JP5443454B2 (ja) * | 2011-09-20 | 2014-03-19 | トヨタ自動車株式会社 | 音源検出装置 |
JP5838861B2 (ja) * | 2012-02-29 | 2016-01-06 | 沖電気工業株式会社 | 音声信号処理装置、方法及びプログラム |
US9378752B2 (en) * | 2012-09-05 | 2016-06-28 | Honda Motor Co., Ltd. | Sound processing device, sound processing method, and sound processing program |
JP2014145838A (ja) * | 2013-01-28 | 2014-08-14 | Honda Motor Co Ltd | 音響処理装置及び音響処理方法 |
JP6603919B2 (ja) * | 2015-06-18 | 2019-11-13 | 本田技研工業株式会社 | 音声認識装置、および音声認識方法 |
-
2015
- 2015-06-18 JP JP2015122843A patent/JP6603919B2/ja active Active
-
2016
- 2016-06-13 US US15/180,218 patent/US9697832B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20160372134A1 (en) | 2016-12-22 |
US9697832B2 (en) | 2017-07-04 |
JP2017009701A (ja) | 2017-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6603919B2 (ja) | 音声認識装置、および音声認識方法 | |
US9583119B2 (en) | Sound source separating device and sound source separating method | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
JP6543844B2 (ja) | 音源同定装置および音源同定方法 | |
JP3836815B2 (ja) | 音声認識装置、音声認識方法、該音声認識方法をコンピュータに対して実行させるためのコンピュータ実行可能なプログラムおよび記憶媒体 | |
US10224053B2 (en) | Audio signal quality enhancement based on quantitative SNR analysis and adaptive Wiener filtering | |
EP0911805B1 (en) | Speech recognition method and speech recognition apparatus | |
US8867755B2 (en) | Sound source separation apparatus and sound source separation method | |
CN112447191A (zh) | 信号处理装置以及信号处理方法 | |
US8693287B2 (en) | Sound direction estimation apparatus and sound direction estimation method | |
US20060031067A1 (en) | Sound input device | |
CN110120217B (zh) | 一种音频数据处理方法及装置 | |
US9549274B2 (en) | Sound processing apparatus, sound processing method, and sound processing program | |
CN106992002A (zh) | 用于改进含噪语音识别的动态声学模型切换 | |
JP5255467B2 (ja) | 雑音抑制装置、雑音抑制方法、及び、プログラム | |
KR102550598B1 (ko) | 음성 화자 인식 장치 및 그 방법 | |
US20080120100A1 (en) | Method For Detecting Target Sound, Method For Detecting Delay Time In Signal Input, And Sound Signal Processor | |
CN105810210B (zh) | 声音信号处理装置及其方法与配备有该装置的车辆 | |
Al-Karawi et al. | Model selection toward robustness speaker verification in reverberant conditions | |
Loh et al. | Speech recognition interactive system for vehicle | |
US9875755B2 (en) | Voice enhancement device and voice enhancement method | |
KR101361034B1 (ko) | 하모닉 주파수 의존성을 이용한 독립벡터분석에 기반한 강한 음성 인식 방법 및 이를 이용한 음성 인식 시스템 | |
JP2023146123A (ja) | 音響処理システム、音響処理装置、音響処理方法、および、プログラム | |
CN110675890A (zh) | 声音信号处理装置以及声音信号处理方法 | |
KR20150144636A (ko) | 이상음원 위치 추적 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171129 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20181005 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181024 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181106 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181226 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190521 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190819 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20190827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190917 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190919 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6603919 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |