JP6024180B2 - 音声認識装置、音声認識方法、及びプログラム - Google Patents
音声認識装置、音声認識方法、及びプログラム Download PDFInfo
- Publication number
- JP6024180B2 JP6024180B2 JP2012102942A JP2012102942A JP6024180B2 JP 6024180 B2 JP6024180 B2 JP 6024180B2 JP 2012102942 A JP2012102942 A JP 2012102942A JP 2012102942 A JP2012102942 A JP 2012102942A JP 6024180 B2 JP6024180 B2 JP 6024180B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- utterance
- section
- snr
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 148
- 230000005236 sound signal Effects 0.000 claims description 93
- 238000004364 calculation method Methods 0.000 claims description 81
- 238000001514 detection method Methods 0.000 claims description 30
- 230000001755 vocal effect Effects 0.000 claims description 7
- 238000005284 basis set Methods 0.000 claims 1
- 230000001419 dependent effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000012795 verification Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 2
- 206010011224 Cough Diseases 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 206010041232 sneezing Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Description
図1の音声認識装置10は、入力部11、検出部12、第一算出部13、照合部14、単語辞書15、音響モデル16、第二算出部17、選出部18、及び出力部19を備えている。
[B]第一算出部13は、検出部12が検出した検出された発声区間を含む所定の区間における音声信号に関してのSNRを算出する。すなわち、第一算出部13は、まず、検出部12が検出した検出された発声区間に、当該発声区間の前及び後の所定期間(例えば5分間)の区間を加えた区間を算出対象区間に設定する。なお、検出部12は、この算出対象区間の設定において、検出部12が検出した検出された発声区間に、当該発声区間の前の所定期間(例えば5分間)の区間のみを加えた区間を算出対象区間に設定するようにしてもよい。算出対象区間の設定をこのようにすると、音声認識装置10を、認識結果を直ちに発声者に提示する用途に用いる場合に好適である。次に、第一算出部13は、算出対象区間内の音声信号についての音声パワーの平均値と標準偏差とを求める。ここで、第一算出部13は、算出対象区間内の音声信号の音声パワーのうちで、当該音声パワーの平均値から当該音声パワーの標準偏差を減算した値よりも小さいものの平均値を算出し、算出された平均値を雑音Nの値とする。また、第一算出部13は、算出対象区間内の音声信号の音声パワーのうちで、当該音声パワーの平均値に当該音声パワーの標準偏差を加算した値よりも大きいものの平均値を算出し、算出された平均値を信号Sの値とする。そして、第一算出部13は、前掲した数式(1)の計算を行ってSNRの値を算出し、算出された値を、検出部12が検出した発声区間に関してのSNRの算出結果とする。
図2のコンピュータ20は、MPU21、ROM22、RAM23、ハードディスク装置24、入力装置25、表示装置26、インタフェース装置27、及び記録媒体駆動装置28を備えている。なお、これらの各構成要素はバスライン29を介して接続されており、MPU21の管理の下で各種のデータを相互に授受することができる。
記録媒体駆動装置28は、可搬型記録媒体30に記録されている各種の制御プログラムやデータの読み出しを行う装置である。MPU21は、可搬型記録媒体30に記録されている所定の制御プログラムを、記録媒体駆動装置28を介して読み出して実行することによって、各種の制御処理を行うようにすることもできる。なお、可搬型記録媒体30としては、例えばCD−ROM(Compact Disc Read Only Memory)やDVD−ROM(Digital Versatile Disc Read Only Memory)、USB(Universal Serial Bus)規格のコネクタが備えられているフラッシュメモリなどがある。
図4に図解した音声認識装置10の構成において、図1に表したものと同名の機能ブロックについては同一の符号を付している。以下の説明において特に説明を行わない機能ブロックについては図1に表したものと同様の機能を提供するものとする。
図8の2つのグラフは、ある発声区間における発声音についての音声パワーの時間変化の様子の一例を表しており、認識対象者が『えー、ふくやまのてんき』と発声している傍らで他の人が『こう』と発声した場合の様子を表している。このグラフにおいて、横軸は時間の経過を表しており、縦軸は音声パワーを表している。ここで、この発声区間内におけるノイズレベルは一定であるとすれば、この音声パワーの時間変化は、発声区間のSNRの変化をそのまま表していると見ることができる。
(付記1)
入力された音声信号の特徴量を用いて、該音声信号が表している音声に発声音が含まれている発声区間を該音声信号から検出し、
前記検出した発声区間に関しての信号対雑音比(SNR)を算出し、
前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとを照合することによって、前記検出した発声区間についての発声音が表現している単語を特定し、
前記検出した発声区間内における、前記特定した単語についての発声音を表している単語区間に関してのSNRを算出し、
前記単語区間に関してのSNRについての前記検出した発声区間に関してのSNRとの比較結果に基づいて、該単語区間の発声音が表している単語を選出し、
前記選出した単語を出力する、
処理をコンピュータに実行させることを特徴とするプログラム。
(付記2)
前記単語区間の発声音が表している単語を選出する処理は、前記発声区間に関してのSNRに対して所定の下限閾値以上のSNRである単語区間の発声音が表している単語を選出することを特徴とする付記1に記載のプログラム。
(付記3)
前記単語区間の発声音が表している単語を選出する処理は、前記発声区間に関してのSNRに対して所定の下限閾値以上であって且つ所定の上限閾値以下のSNRである単語区間の発声音が表している単語を選出することを特徴とする付記1に記載のプログラム。
(付記4)
前記検出した発声区間についての発声音が表現している単語を特定する処理は、前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとの類似度の高さを表す照合スコアを取得し、
前記プログラムは、前記単語区間に関してのSNRと前記発声区間に関してのSNRとの比較結果に基づいて該単語区間の発声音が表している単語について前記照合スコアを取得する処理により取得した照合スコアを変更する処理を前記コンピュータに更に実行させ、
前記単語区間の発声音が表している単語を選出する処理は、該単語区間の発声音が表している単語の選出を、該単語についての照合スコアに基づいて行う、
ことを特徴とする付記1に記載のプログラム。
(付記5)
前記照合スコアを変更する処理は、前記発声区間に関してのSNRに対してSNRが所定の下限閾値に満たない単語区間の発声音が表している単語について前記照合スコアを取得する処理により取得した照合スコアを変更して、該照合スコアが表している類似度の高さを低下させることを特徴とする付記4に記載のプログラム。
(付記6)
前記単語区間の発声音が表している単語を選出する処理は、前記単語の選出に用いる下限閾値として、選出の対象である単語毎に対応付けられている下限閾値を用いて行うことを特徴とする付記2に記載のプログラム。
(付記7)
前記単語区間の発声音が表している単語を選出する処理による選出の対象である単語についての下限閾値を、該単語の読みの情報に基づいて算出する処理を前記コンピュータに更に実行させることを特徴とする付記6に記載のプログラム。
(付記8)
前記下限閾値を算出する処理は、前記単語区間の発声音が表している単語を選出する処理による選出の対象である単語についての下限閾値の算出を、該単語の読みの各音節について各々対応付けられている閾値の平均値を算出することによって行うことを特徴とする付記7に記載のプログラム。
(付記9)
前記検出した発声区間に関してのSNRを算出する処理は、前記検出した発声区間に関してのSNRの算出を、前記検出した発声区間を含む所定の区間における音声信号に関してのSNRを算出することによって行うことを特徴とする付記1から8のうちのいずれか一項に記載のプログラム。
(付記10)
入力された音声信号の特徴量を用いて、該音声信号が表している音声に発声音が含まれている発声区間を該音声信号から検出し、
前記検出した発声区間の音声信号の平均パワーを算出し、
前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとを照合することによって、前記検出した発声区間についての発声音が表現している単語を特定し、
前記検出した発声区間内における、前記特定した単語についての発声音を表している単語区間の音声信号の平均パワーを算出し、
前記単語区間に関しての音声信号の平均パワーについての前記検出した発声区間に関しての音声信号の平均パワーとの比較結果に基づいて、該単語区間の発声音が表している単語を選出し、
前記選出した単語を出力する、
処理をコンピュータに実行させることを特徴とするプログラム。
(付記11)
入力された音声信号の特徴量を用いて、該音声信号が表している音声に発声音が含まれている発声区間を該音声信号から検出する検出部と、
前記検出した発声区間に関しての信号対雑音比(SNR)を算出する第一算出部と、
前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとを照合することによって、前記検出した発声区間についての発声音が表現している単語を特定する照合部と、
前記検出した発声区間内における、前記特定した単語についての発声音を表している単語区間に関してのSNRを算出する第二算出部と、
前記単語区間に関してのSNRについての前記検出した発声区間に関してのSNRとの比較結果に基づいて、該単語区間の発声音が表している単語を選出する選出部と、
前記選出した単語を出力する出力部と、
を備えることを特徴とする音声認識装置。
(付記12)
前記選出部は、前記発声区間に関してのSNRに対して所定の下限閾値以上のSNRである単語区間の発声音が表している単語を選出することを特徴とする付記11に記載の音声認識装置。
(付記13)
前記選出部は、前記発声区間に関してのSNRに対して所定の下限閾値以上であって且つ所定の上限閾値以下のSNRである単語区間の発声音が表している単語を選出することを特徴とする付記11に記載の音声認識装置。
(付記14)
前記照合部は、前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとの類似度の高さを表す照合スコアを取得し、
前記音声認識装置は、前記単語区間に関してのSNRと前記発声区間に関してのSNRとの比較結果に基づいて該単語区間の発声音が表している単語について前記照合部が取得した照合スコアを変更する変更部を更に備え、
前記選出部は、該単語区間の発声音が表している単語の選出を、該単語についての照合スコアに基づいて行う、
ことを特徴とする付記11に記載の音声認識装置。
(付記15)
前記変更部は、前記発声区間に関してのSNRに対してSNRが所定の下限閾値に満たない単語区間の発声音が表している単語について前記照合部が取得した照合スコアを変更して、該照合スコアが表している類似度の高さを低下させることを特徴とする付記14に記載の音声認識装置。
(付記16)
前記選出部は、前記単語の選出に用いる下限閾値として、選出の対象である単語毎に対応付けられている下限閾値を用いて行うことを特徴とする付記12に記載の音声認識装置。
(付記17)
前記選出部による選出の対象である単語についての下限閾値を、該単語の読みの情報に基づいて算出する閾値算出部を更に備えることを特徴とする付記16に記載の音声認識装置。
(付記18)
前記閾値算出部は、前記選出部による選出の対象である単語についての下限閾値の算出を、該単語の読みの各音節について各々対応付けられている閾値の平均値を算出することによって行うことを特徴とする付記17に記載の音声認識装置。
(付記19)
前記第一算出部は、前記検出した発声区間に関してのSNRの算出を、前記検出した発声区間を含む所定の区間における音声信号に関してのSNRを算出することによって行うことを特徴とする付記11から18のうちのいずれか一項に記載の音声認識装置。
(付記20)
入力された音声信号の特徴量を用いて、該音声信号が表している音声に発声音が含まれている発声区間を該音声信号から検出する検出部と、
前記検出した発声区間の音声信号の平均パワーを算出する第一算出部と、
前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとを照合することによって、前記検出した発声区間についての発声音が表現している単語を特定する照合部と、
前記検出した発声区間内における、前記特定した単語についての発声音を表している単語区間の音声信号の平均パワーを算出する第二算出部と、
前記単語区間に関しての音声信号の平均パワーについての前記検出した発声区間に関しての音声信号の平均パワーとの比較結果に基づいて、該単語区間の発声音が表している単語を選出する選出部と、
前記選出した単語を出力する出力部と、
を備えることを特徴とする音声認識装置。
(付記21)
入力された音声信号の特徴量を用いて、該音声信号が表している音声に発声音が含まれている発声区間を該音声信号から検出し、
前記検出した発声区間に関しての信号対雑音比(SNR)を算出し、
前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとを照合することによって、前記検出した発声区間についての発声音が表現している単語を特定し、
前記検出した発声区間内における、前記特定した単語についての発声音を表している単語区間に関してのSNRを算出し、
前記単語区間に関してのSNRについての前記検出した発声区間に関してのSNRとの比較結果に基づいて、該単語区間の発声音が表している単語を選出し、
前記選出した単語を出力する、
ことを特徴とする音声認識方法。
(付記22)
入力された音声信号の特徴量を用いて、該音声信号が表している音声に発声音が含まれている発声区間を該音声信号から検出し、
前記検出した発声区間の音声信号の平均パワーを算出し、
前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとを照合することによって、前記検出した発声区間についての発声音が表現している単語を特定し、
前記検出した発声区間内における、前記特定した単語についての発声音を表している単語区間の音声信号の平均パワーを算出し、
前記単語区間に関しての音声信号の平均パワーについての前記検出した発声区間に関しての音声信号の平均パワーとの比較結果に基づいて、該単語区間の発声音が表している単語を選出し、
前記選出した単語を出力する、
ことを特徴とする音声認識方法。
11 入力部
12 検出部
13 第一算出部
14 照合部
15 単語辞書
16 音響モデル
17 第二算出部
18 選出部
19 出力部
20 コンピュータ
21 MPU
22 ROM
23 RAM23
24 ハードディスク装置
25 入力装置
26 表示装置
27 インタフェース装置
28 記録媒体駆動装置
29 バスライン
30 可搬型記録媒体
31 変更部
41 閾値算出部
Claims (14)
- 入力された音声信号の特徴量を用いて、該音声信号が表している音声に発声音が含まれている発声区間を該音声信号から検出し、
前記検出した発声区間に関しての信号対雑音比(SNR)を算出し、
前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとを照合することによって、前記検出した発声区間についての発声音が表現している単語を特定し、
前記検出した発声区間内における、前記特定した単語についての発声音を表している単語区間に関してのSNRを算出し、
前記単語区間に関してのSNRについての前記検出した発声区間に関してのSNRとの比較結果に基づいて、前記特定した単語を音声認識の結果として選出するか否かを判定し、
前記判定により音声認識の結果として選出した単語を出力する、
処理をコンピュータに実行させることを特徴とするプログラム。 - 前記特定した単語を音声認識の結果として選出するか否かを判定する処理は、前記単語区間に関してのSNRが前記発声区間に関してのSNRに基づき定められる下限閾値以上のSNRである場合に、前記特定した単語を音声認識の結果として選出するとの判定を下すことを特徴とする請求項1に記載のプログラム。
- 前記特定した単語を音声認識の結果として選出するか否かを判定する処理は、前記単語区間に関してのSNRが、前記発声区間に関してのSNRに基づき定められる下限閾値以上であって且つ前記発声区間に関してのSNRに基づき定められる上限閾値以下のSNRである場合に、前記特定した単語を音声認識の結果として選出するとの判定を下すことを特徴とする請求項1に記載のプログラム。
- 前記検出した発声区間についての発声音が表現している単語を特定する処理は、前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとの類似度の高さを表す照合スコアを取得し、
前記プログラムは、前記単語区間に関してのSNRと前記発声区間に関してのSNRとの比較結果に基づいて該単語区間の発声音が表している単語について前記照合スコアを取得する処理により取得した照合スコアを変更する処理を前記コンピュータに更に実行させ、
前記特定した単語を音声認識の結果として選出するか否かを判定する処理は、該単語についての照合スコアに基づいて行う、
ことを特徴とする請求項1に記載のプログラム。 - 前記照合スコアを変更する処理は、SNRが前記発声区間に関してのSNRに基づき定められる下限閾値に満たない単語区間の発声音が表している単語について前記照合スコアを取得する処理により取得した照合スコアを変更して、該照合スコアが表している類似度の高さを低下させることを特徴とする請求項4に記載のプログラム。
- 前記下限閾値は、前記特定した単語の読みにも更に基づいて定められることを特徴とする請求項2に記載のプログラム。
- 前記下限閾値を、前記特定した単語の読みの情報に基づいて算出する処理を前記コンピュータに更に実行させることを特徴とする請求項6に記載のプログラム。
- 前記下限閾値を算出する処理は、前記下限閾値の算出を、前記特定した単語の読みの各音節について各々対応付けられている閾値の平均値を算出することによって行うことを特徴とする請求項7に記載のプログラム。
- 前記検出した発声区間に関してのSNRを算出する処理は、前記検出した発声区間に関してのSNRの算出を、前記検出した発声区間を含む所定の区間における音声信号に関してのSNRを算出することによって行うことを特徴とする請求項1から8のうちのいずれか一項に記載のプログラム。
- 入力された音声信号の特徴量を用いて、該音声信号が表している音声に発声音が含まれている発声区間を該音声信号から検出し、
前記検出した発声区間の音声信号の平均パワーを算出し、
前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとを照合することによって、前記検出した発声区間についての発声音が表現している単語を特定し、
前記検出した発声区間内における、前記特定した単語についての発声音を表している単語区間の音声信号の平均パワーを算出し、
前記単語区間に関しての音声信号の平均パワーについての前記検出した発声区間に関しての音声信号の平均パワーとの比較結果に基づいて、前記特定した単語を音声認識の結果として選出するか否かを判定し、
前記判定により音声認識の結果として選出した単語を出力する、
処理をコンピュータに実行させることを特徴とするプログラム。 - 入力された音声信号の特徴量を用いて、該音声信号が表している音声に発声音が含まれている発声区間を該音声信号から検出する検出部と、
前記検出した発声区間に関しての信号対雑音比(SNR)を算出する第一算出部と、
前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとを照合することによって、前記検出した発声区間についての発声音が表現している単語を特定する照合部と、
前記検出した発声区間内における、前記特定した単語についての発声音を表している単語区間に関してのSNRを算出する第二算出部と、
前記単語区間に関してのSNRについての前記検出した発声区間に関してのSNRとの比較結果に基づいて、前記特定した単語を音声認識の結果として選出するか否かを判定する選出部と、
前記判定により音声認識の結果として選出した単語を出力する出力部と、
を備えることを特徴とする音声認識装置。 - 入力された音声信号の特徴量を用いて、該音声信号が表している音声に発声音が含まれている発声区間を該音声信号から検出する検出部と、
前記検出した発声区間の音声信号の平均パワーを算出する第一算出部と、
前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとを照合することによって、前記検出した発声区間についての発声音が表現している単語を特定する照合部と、
前記検出した発声区間内における、前記特定した単語についての発声音を表している単語区間の音声信号の平均パワーを算出する第二算出部と、
前記単語区間に関しての音声信号の平均パワーについての前記検出した発声区間に関しての音声信号の平均パワーとの比較結果に基づいて、前記特定した単語を音声認識の結果として選出するか否かを判定する選出部と、
前記判定により音声認識の結果として選出した単語を出力する出力部と、
を備えることを特徴とする音声認識装置。 - 入力された音声信号の特徴量を用いて、該音声信号が表している音声に発声音が含まれている発声区間を該音声信号から検出し、
前記検出した発声区間に関しての信号対雑音比(SNR)を算出し、
前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとを照合することによって、前記検出した発声区間についての発声音が表現している単語を特定し、
前記検出した発声区間内における、前記特定した単語についての発声音を表している単語区間に関してのSNRを算出し、
前記単語区間に関してのSNRについての前記検出した発声区間に関してのSNRとの比較結果に基づいて、前記特定した単語を音声認識の結果として選出するか否かを判定し、
前記判定により音声認識の結果として選出した単語を出力する、
ことを特徴とする音声認識方法。 - 入力された音声信号の特徴量を用いて、該音声信号が表している音声に発声音が含まれている発声区間を該音声信号から検出し、
前記検出した発声区間の音声信号の平均パワーを算出し、
前記検出した発声区間の音声信号の特徴量と複数の単語の各々についての音響モデルとを照合することによって、前記検出した発声区間についての発声音が表現している単語を特定し、
前記検出した発声区間内における、前記特定した単語についての発声音を表している単語区間の音声信号の平均パワーを算出し、
前記単語区間に関しての音声信号の平均パワーについての前記検出した発声区間に関しての音声信号の平均パワーとの比較結果に基づいて、前記特定した単語を音声認識の結果として選出するか否かを判定し、
前記判定により音声認識の結果として選出した単語を出力する、
ことを特徴とする音声認識方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012102942A JP6024180B2 (ja) | 2012-04-27 | 2012-04-27 | 音声認識装置、音声認識方法、及びプログラム |
US13/846,234 US9196247B2 (en) | 2012-04-27 | 2013-03-18 | Voice recognition method and voice recognition apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012102942A JP6024180B2 (ja) | 2012-04-27 | 2012-04-27 | 音声認識装置、音声認識方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013231797A JP2013231797A (ja) | 2013-11-14 |
JP6024180B2 true JP6024180B2 (ja) | 2016-11-09 |
Family
ID=49478069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012102942A Active JP6024180B2 (ja) | 2012-04-27 | 2012-04-27 | 音声認識装置、音声認識方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9196247B2 (ja) |
JP (1) | JP6024180B2 (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8917876B2 (en) | 2006-06-14 | 2014-12-23 | Personics Holdings, LLC. | Earguard monitoring system |
EP2044804A4 (en) | 2006-07-08 | 2013-12-18 | Personics Holdings Inc | PERSONAL HEARING AID AND METHOD |
US8917894B2 (en) | 2007-01-22 | 2014-12-23 | Personics Holdings, LLC. | Method and device for acute sound detection and reproduction |
US11750965B2 (en) | 2007-03-07 | 2023-09-05 | Staton Techiya, Llc | Acoustic dampening compensation system |
US8111839B2 (en) | 2007-04-09 | 2012-02-07 | Personics Holdings Inc. | Always on headwear recording system |
US10194032B2 (en) | 2007-05-04 | 2019-01-29 | Staton Techiya, Llc | Method and apparatus for in-ear canal sound suppression |
US11856375B2 (en) | 2007-05-04 | 2023-12-26 | Staton Techiya Llc | Method and device for in-ear echo suppression |
US11683643B2 (en) | 2007-05-04 | 2023-06-20 | Staton Techiya Llc | Method and device for in ear canal echo suppression |
US8600067B2 (en) | 2008-09-19 | 2013-12-03 | Personics Holdings Inc. | Acoustic sealing analysis system |
US9129291B2 (en) | 2008-09-22 | 2015-09-08 | Personics Holdings, Llc | Personalized sound management and method |
US10045321B2 (en) | 2010-12-30 | 2018-08-07 | Staton Techiya, Llc | Information processing using a population of data acquisition devices |
US10362381B2 (en) | 2011-06-01 | 2019-07-23 | Staton Techiya, Llc | Methods and devices for radio frequency (RF) mitigation proximate the ear |
US9167082B2 (en) | 2013-09-22 | 2015-10-20 | Steven Wayne Goldstein | Methods and systems for voice augmented caller ID / ring tone alias |
US10043534B2 (en) | 2013-12-23 | 2018-08-07 | Staton Techiya, Llc | Method and device for spectral expansion for an audio signal |
KR102210433B1 (ko) * | 2014-01-21 | 2021-02-01 | 삼성전자주식회사 | 전자 장치 및 이의 음성 인식 방법 |
KR102371697B1 (ko) * | 2015-02-11 | 2022-03-08 | 삼성전자주식회사 | 음성 기능 운용 방법 및 이를 지원하는 전자 장치 |
JP6501259B2 (ja) * | 2015-08-04 | 2019-04-17 | 本田技研工業株式会社 | 音声処理装置及び音声処理方法 |
US10242677B2 (en) * | 2015-08-25 | 2019-03-26 | Malaspina Labs (Barbados), Inc. | Speaker dependent voiced sound pattern detection thresholds |
US10616693B2 (en) | 2016-01-22 | 2020-04-07 | Staton Techiya Llc | System and method for efficiency among devices |
US10489590B2 (en) | 2016-03-07 | 2019-11-26 | Chengdu Haicun Ip Technology Llc | Processor for enhancing computer security |
US10560475B2 (en) | 2016-03-07 | 2020-02-11 | Chengdu Haicun Ip Technology Llc | Processor for enhancing network security |
TWI610294B (zh) * | 2016-12-13 | 2018-01-01 | 財團法人工業技術研究院 | 語音辨識系統及其方法、詞彙建立方法與電腦程式產品 |
US10714172B2 (en) | 2017-09-21 | 2020-07-14 | HangZhou HaiCun Information Technology Co., Ltd. | Bi-sided pattern processor |
US10951994B2 (en) | 2018-04-04 | 2021-03-16 | Staton Techiya, Llc | Method to acquire preferred dynamic range function for speech enhancement |
US10747429B2 (en) * | 2018-08-01 | 2020-08-18 | International Business Machines Corporation | Compensating for user hand tremors when using hand-held electronic devices |
KR20190106946A (ko) * | 2019-08-30 | 2019-09-18 | 엘지전자 주식회사 | 지능형 디바이스 및 그 제어 방법 |
CN112581941A (zh) * | 2020-11-17 | 2021-03-30 | 北京百度网讯科技有限公司 | 音频识别方法、装置、电子设备及存储介质 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4829578A (en) * | 1986-10-02 | 1989-05-09 | Dragon Systems, Inc. | Speech detection and recognition apparatus for use with background noise of varying levels |
US5761639A (en) * | 1989-03-13 | 1998-06-02 | Kabushiki Kaisha Toshiba | Method and apparatus for time series signal recognition with signal variation proof learning |
JP3452443B2 (ja) * | 1996-03-25 | 2003-09-29 | 三菱電機株式会社 | 騒音下音声認識装置及び騒音下音声認識方法 |
US6044343A (en) * | 1997-06-27 | 2000-03-28 | Advanced Micro Devices, Inc. | Adaptive speech recognition with selective input data to a speech classifier |
US6219642B1 (en) * | 1998-10-05 | 2001-04-17 | Legerity, Inc. | Quantization using frequency and mean compensated frequency input data for robust speech recognition |
US6985859B2 (en) * | 2001-03-28 | 2006-01-10 | Matsushita Electric Industrial Co., Ltd. | Robust word-spotting system using an intelligibility criterion for reliable keyword detection under adverse and unknown noisy environments |
US20040181409A1 (en) * | 2003-03-11 | 2004-09-16 | Yifan Gong | Speech recognition using model parameters dependent on acoustic environment |
JP4033299B2 (ja) * | 2003-03-12 | 2008-01-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声モデルの雑音適応化システム、雑音適応化方法、及び、音声認識雑音適応化プログラム |
WO2004102527A2 (en) * | 2003-05-08 | 2004-11-25 | Voice Signal Technologies, Inc. | A signal-to-noise mediated speech recognition method |
JP2005300958A (ja) * | 2004-04-13 | 2005-10-27 | Mitsubishi Electric Corp | 話者照合装置 |
JP5402089B2 (ja) * | 2009-03-02 | 2014-01-29 | 富士通株式会社 | 音響信号変換装置、方法、及びプログラム |
-
2012
- 2012-04-27 JP JP2012102942A patent/JP6024180B2/ja active Active
-
2013
- 2013-03-18 US US13/846,234 patent/US9196247B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20130289992A1 (en) | 2013-10-31 |
US9196247B2 (en) | 2015-11-24 |
JP2013231797A (ja) | 2013-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6024180B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
JP4085130B2 (ja) | 感情認識装置 | |
JP4836290B2 (ja) | 音声認識システム、音声認識プログラムおよび音声認識方法 | |
Zelinka et al. | Impact of vocal effort variability on automatic speech recognition | |
WO2018025025A1 (en) | Speaker recognition | |
EP1701338B1 (en) | Speech recognition method | |
US20140200890A1 (en) | Methods, systems, and circuits for speaker dependent voice recognition with a single lexicon | |
US20090228272A1 (en) | System for distinguishing desired audio signals from noise | |
US11495235B2 (en) | System for creating speaker model based on vocal sounds for a speaker recognition system, computer program product, and controller, using two neural networks | |
KR20100115093A (ko) | 음성 검출 장치 및 방법 | |
JP6284462B2 (ja) | 音声認識方法、及び音声認識装置 | |
JP2008139568A (ja) | 音声処理装置および音声処理方法、並びに、プログラム | |
JP6176055B2 (ja) | 音声検索装置及び音声検索方法 | |
EP1675102A2 (en) | Method for extracting feature vectors for speech recognition | |
JP2015068897A (ja) | 発話の評価方法及び装置、発話を評価するためのコンピュータプログラム | |
US9129596B2 (en) | Apparatus and method for creating dictionary for speech synthesis utilizing a display to aid in assessing synthesis quality | |
CN107610691B (zh) | 英语元音发声纠错方法及装置 | |
JP2007316330A (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
JP6373621B2 (ja) | 話し方評価装置、話し方評価方法、プログラム | |
JP2797861B2 (ja) | 音声検出方法および音声検出装置 | |
US20050246172A1 (en) | Acoustic model training method and system | |
JP2011180308A (ja) | 音声認識装置及び記録媒体 | |
JP2006010739A (ja) | 音声認識装置 | |
Nanjo et al. | A fundamental study of novel speech interface for computer games | |
JP5066668B2 (ja) | 音声認識装置、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150203 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160322 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160405 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160526 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160913 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160926 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6024180 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |