JPS63503487A - 音声処理装置 - Google Patents
音声処理装置Info
- Publication number
- JPS63503487A JPS63503487A JP62503341A JP50334187A JPS63503487A JP S63503487 A JPS63503487 A JP S63503487A JP 62503341 A JP62503341 A JP 62503341A JP 50334187 A JP50334187 A JP 50334187A JP S63503487 A JPS63503487 A JP S63503487A
- Authority
- JP
- Japan
- Prior art keywords
- gain
- processing device
- signal
- speech
- audio processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
【発明の詳細な説明】
音声処理装置
〔技術分野〕
本発明は自動利得制御機能を備えた音声処理装置に関し、特に音声認識に関する
。
自動音声認識装置は、可聴音声信号から抽出した特徴を比較することにより動作
する。FJjw!iシようとする音声から抽出した特徴を既知の発話から抽出し
て蓄えた特徴と比較する。
正確な認識のために、異なる時間に話された同じ語または音から抽出した特徴が
、十分に類似していることが重要である。しかし、音声のダイナミックレンジが
広い場合、特に、マイクロホンにより受信される音声レベルが非常に広い範囲に
わたって変化するハンドフリー電話の場合には、特徴を類似させることが困難に
なる。この音声レベルの変化を補償するため、多くの音声認識装置では何らかの
形態の自動利得制御(AGC)が用いられている。
自動利得制御回路は、特徴抽出回路が使用する平均信号レベルをある所定の時間
にわたって可能なかぎりほぼ一定に保つことができるように、利得を制御する。
したがって、静かな発話のときには、大声の発話に比較して大きな利得が与えら
れる。この形態の自動利得制御回路は、連続音声を入力信号とする場合には良好
に動作する。
これは、ある時間が経過すると自動利得制御回路が信号レベルを最適化し、矛盾
のない特徴抽出ができるようになるからである。しかし、無音の場合には、自動
利得制御回路の利得が背景雑音により決定されるレベルまで増加し、発話の開始
時には、自動利得制御回路の利得が高く設定されてしまう。発話中には回路の利
得が自動的に制限される。利得変化の速度は、自動利得制御回路の「アタック3
時間により決定される。したがって、発話の開始時には利得が非常に大きくなり
、そのときに抽出される特徴は、その後に利得が制限されたときに抽出される同
じ特徴に比較して、非常に大きなエネルギをもつことになる。
この歪の効果は入力信号レベルに依存し、音声レベルが高くなるほど歪が大きく
なる。したがって、抽出された最初の幾つかの特徴は、理論的には同等な蓄えら
れた特徴と対応せず、認識特性が不十分となることがある。
本発明はこの問題を解決することを目的とする。
本発明は音声処理装置を提供するものであり、音声信号を受け取る入力と、音声
信号からスペクトラムのパラメータを抽出する信号処理手段と、この抽出された
パラメータを二値化するアナログ・ディジタル変換器と、このアナログ・ディジ
タル変換器に供給される信号レベルを制御する自動利得制御手段とを備えた音声
処理装置において、スペクトラムのパラメータを少なくとも一時的に蓄え、この
蓄えられたパラメータのそれぞれについて上記利得制御手段により加えられた利
得を示す利得係数を蓄え、標本化周期の終了時に、その周期の間に蓄えた利得係
数が異なる場合にはその係数をその周期に蓄えられた最も小さい利得係数と等し
い値に設定し、これに比例して、対応して蓄えられたスペクトラムのパラメータ
の大きさを調整することを特徴とする。
本発明の音声処理装置を音声認識装置として構成する場合には、自動利得制御手
段としてディジタルに切り替え可能な減衰器を用い、音声認識を実行するマイク
ロプロセッサにより利得を決定する。マイクロプロセッサが利得を制御すること
により、アナログ・ディジタル変換器(これは、アナログで自動利得制御を行う
場合でも、特徴抽出回路と認識装置を制御するマイクロプロセッサとの間に必要
である)のダイナミックレンジを越えないようにする(自動利得制御を適応させ
ている間を除いて)。従来のアナログ自動利得制御と本発明装置との基本的な差
異は、本発明装置ではマイクロプロセッサが利得の設定値を制御し、これにより
、抽出されたそれぞれの特徴に対して使用された利得を蓄えることができること
である。発話が終了した後に、マイクロプロセッサが完了した発話に対して最適
な利得設定値を決定する。蓄えられた特徴は、すべて最適利得設定値で規格化さ
れる。このようにして、矛盾のない特徴の組を入力信号利得に独立に抽出できる
。
本発明の実施例について添付図面を参照して説明する。
第1図は本発明実施例音声認識装置の概略的な構成図。
〔発明を実施するための最良の形態3
本特許出願ではテンプレート・マツチングを用いた音声認識装置を参照して本発
明を説明するが、従来から用いられているどのような音声認識装置、例えば確率
モデル化(stochastic i+odeling)、マルコフ・チェーン
(Marcov chaines) 、ダイナミック・タイムヮーピング(dy
namic−timewarping)、音素認tm (phoneme−re
cognation)でも同様に本発明を実施できる。
音声認識は、複数(一般には8ないし16)のフィルタ・チャネルからのエネル
ギ白線を比較することを基本とする。音声が存在するときには、各フィルタ・チ
ャネルからのエネルギ・スペクトラムをアナログ・ディジタル変換器で二値化し
てテンプレートを作成し、これをメモリに蓄える。
認識の初期段階は「トレーニング」と呼ばれ、認識装置に認識すべき語を話して
参照テンプレートを生成する。認識すべき語に対する参照テンプレートが作成さ
れると、音声認識を実行できる。
認識装置に発話を入力すると、メモリ内の参照テンプレートと比較できる試験テ
ンプレートを作成し、最も似ているものを見つけ出す。
本発明の音声認識装置の基本的な構成要素を第1図に示す。マイクロホン1から
入力され増幅器2により増幅された音声信号は、フィルタ・バンク3aを通過す
る。フィルタ・バンク3aでは、音声信号が複数(この実施例では16)の周波
数帯に濾波され、この信号が整流器4により整流される。濾波され整流された信
号は、低域通過フィルタ3bにより平滑化され、この後に、マルチプレクサ5に
より順番に標本化される。マルチプレクサ5は、得られた単一チャネルの信号を
ディジタル自動利得制御回路8に供給する。ディジタル自動利得制御回路8は出
力信号をアナログ・ディジタル変換器6に供給し、このアナログ・ディジタル変
換器6から、二値化信号ストリームが制御用のマルチプレクサ7に供給される。
マルチプレクサは、それぞれのフィルタ・チャネルを20マイクロ秒間にわたり
読み取り、それが終了すると次のフィルタ・チャネルの読み取りを行う。lOミ
リ秒のタイムスロットのそれぞれの終了時に、それぞれのチャネルでその期間に
標本化されたエネルギを蓄える。トレーニング時および認識動作時に生成される
テンプレートは、それぞれのフィルタ・チャネルに対して約100タイムスロツ
トの標本を含む。
ディジタル自動利得制御回路は以下の方法で動作する。マルチプレクサがフィル
タ・チャネルを読み取る毎に、マイクロプロセッサは、そのチャネルのエネルギ
・レベルを読み取ってアナログ・ディジタル変換器が過負荷となっているか否か
、すなわち利得が大き過ぎないか否かを判断する。利得が大き過ぎるとマイクロ
プロセッサが判断したときには、ディジタル自動利得制御回路の利得を1段階ず
つ減少させ、再びチャネルのエネルギ・レベルを観測する。利得を1段階減少さ
せることは、利得を1.5dB引き下げることに対応する。利得が十分に引き下
げられてアナログ・ディジタル変換器の過負荷を防止できるとマイクロプロセッ
サが判断するまで、マルチプレクサは次のチャネルの読み取りを開始しない。マ
ルチプレクサが次のフィルタの読み取りを開始するときには、新しいチャネルの
エネルギ・レベルによってアナログ・ディジタル変換器の過負荷が生じないかぎ
り、ディジタル利得制御回路の利得を前のチャネルで得られた低レベルに維持す
る。新しいチャネルのエネルギ・レベルにより過負荷が生じたときには、上述し
たと同様に利得を1段階ずつ引き下げる。マルチプレクサが最後のフィルタ・チ
ャネルを読み取ったとき、マイクロプロセッサは、すべてのチャネルのエネルギ
・レベルについて、その利得係数(この係数は、マイクロプロセッサに接続され
たメモリに、エネルギ・レベル情報として一緒に蓄えられている)をマイクロプ
ロセッサにより確立した新しい最小値で割って規格化する。このようにして、初
期入力信号利得およびテンプレートを作成する間の利得変化と独立に、矛盾のな
い特徴の組を抽出できる。
音声認識装置はまた、音声または語の開始および終了を高精度に検出する必要が
ある。本発明の音声認識装置は、以下の技術を使用する。
A、背景雑音のエネルギ・レベルを32タイムスロツトにわたりに測定して蓄え
(lOミリ秒に1標本)、これと同時に、最大雑音エネルギについて、上述と同
様に自動利得制御回路の利得を調節(削減)する。
B、それぞれのタイムスロットにおけるフィルタの値を総て加算し、これを16
(フィルタ・チャネルの数)で除算し、ディジタル自動利得制御回路の利得を示
す利得係数を乗算し、それぞれのタイムスロットを比較して最大値を見つけるこ
とより、最大エネルギの標本を見つける。
C0音声が存在すると判断するために必要なしきい値をステップBでめた最大雑
音エネルギの1.5倍に設定する。
D、それぞれのフィルタ・チャネルに対する平均雑音エネルギを見つけて蓄え(
それぞれのチャネルについて、32タイムスロット全体のエネルギの和をめ、こ
れを32で割る)、雑音テンプレートを確立する。
E、これらの後にフィルタ・バンクを10ミリ秒毎に走査し、平均フィルタ・エ
ネルギがステップCで計算した雑音/音声しきい値を越えるまで、100タイム
スロツトの標本を蓄えることのできる一時循環メモリにデータを蓄える。
F、32個の標本を得た後に雑音/音声しきい値を越えていない場合には、ディ
ジタル自動利得制御回路の利得が低く設定されていないことを確認するための検
査を行う。この検査は、32タイムスロツトの間に蓄えたフィルタ・チャネル値
の最大値を見つけることにより行う。最大レベルがアナログ・ディジタル変換器
の最大許容入力レベルより1.5dB以上低ければ、自動利得制御の利得を1段
階増加させ、利得を1.5dB増加させる。32個の標本を得た後でもしきい値
を越えず、ディジタル自動利得制御回路の設定が正しい場合には、最新の32個
の標本について最大エネルギを見つけ(ステップBと同様)、1.5を乗算する
(ステップCと同様)ことにより、雑音/音声しきい値を再び計算する。
G、雑音/音声しきい値を越えたときには、100個の標本が入力されるか、ま
たは20個の連続する標本に対してエネルギ・レベルが雑音/音声しきい値以下
になるまで、フィルタ・バンクを10ミリ秒毎に走査し、フィルタのデータをメ
モリに蓄え、音声テンプレートを生成する。上述したように、データ入力中にア
ナログ・ディジタル変換器が過負荷となったときには、自動利得制御の設定を1
段階減少させ、そのフィルタ・チャネルに対するデータを再処理する。16個の
フィルタ・チャネルを走査するうちにディジタル自動利得制御回路の利得が低下
した場合には、全16チヤネルからのデータを再入力し、これにより、すべての
フィルタ・データを同一の自動利得制御設定値に対応させる。使用される自動利
得制御の値には、フィルタ・データと一緒にメモリに記憶する。各タイムスロッ
トの開始時に使用される自動利得制御の設定値は前の時間フレームから得られ、
音声処理中には利得を減らすことができるだけである (増加させることはでき
ない)。テンプレートを作成する期間の終了時にすべてのテンプレート・データ
を一定の自動利得制御設定値で規格化するので、利得を増加できなくても問題は
ない。
H0音声/雑音の検出しきい値により音声の開始を確実に検出できるように、音
声検出前の15タイムスロツトの標本を一時循環メモリから「音声」テンプレー
トの前部に送り出す。
1、音声を検出するまでに100個以上の標本を処理した場合には、一時循環メ
モリ内の最も古い32個の時間フレームを解析して(ステップDと同様)、雑音
テンプレートを再度計算する。
音声検出前に100個未満の標本しか処理していない場合には、ステップDで確
立した音声テンプレートを以下のステップで使用する。
30以上のステップにより、音声テンプレートを作成するための自動利得制御の
最小利得設定値がわかり、この設定値に対して音声テンプレートと雑音テンプレ
ートとの双方が規格化され、これにより、双方のテンプレートが入力された値を
含み、その利得が開始時から使用される。
K、規格化された雑音テンプレートを規格化された音声テンプレートの各時間フ
レームから減算する。
L、規格化された音声テンプレートの最大エネルギを見つけ、新しい雑音/音声
しきい値、すなわち最大エネルギから18dBを引いた値を計算する。この新し
いしきい値を使用して、規格化された音声テンプレートを走査し、音声の開始点
および終了点を判定する。
M0次に、音声テンプレートから開始点と終了点とを除去し、メモリに蓄えるか
(トレーニングの場合)、または認識のために使用する。表に、320 ミリ秒
(10ミリ秒のタイムスロット432個)にわたって背景雑音を測定したときの
、メモリに蓄えられた値を例を示す。
(以下本頁余白)
実際の
DAGCI 2 3 4 5 6 7 8 9 1011 121314151
6工ネルギ間421022023224522421616718817623
42501?7134170213209408フ4211218230250
2202221701901732302551701371?2215212
409し421022223424721622517118917g 233
25317114017021420841014 2]3220231251
218223166184174230250168133165220216
408ム42152172282532202201601861802312
54166132164223220409平均雑音テンプレート
デイジタル自動利得制御(DAGC>の値「4」は、アナログ・ディジタル変換
器に出力する信号を6dB減衰させることに等価であり、「実際の」エネルギを
計算するために、すべてのフィルタ・バンクの値を二倍した。
最大実エネルギ(すべてのフィルタの平均)は−410、テンプレートの記録を
開始または終了するしきい値は−615であった。
本発明の基本的な利用形態は音声認識装置であり、そのような応用を例に説明し
た。しかし、当業者であれば、本発明を音声認識装置に利用するだけでなく、音
声信号を処理して特徴を抽出するどのような装置でも利用できる。
本発明の音声処理装置は、従来からの音声処理装置では背景雑音およびそのレベ
ルの変化が問題となるような場合に利用するに適する。このような利用例として
、本発明をハンドフリー電話、特にセルラ無線端末装置(cellular r
adio terminal)を用いたハンドフリー電話に利用できる。セルラ
無線端末装置は、自動車内でしばしば使用され、音声認識を利用して、手を用い
ることなく呼接続およびダイヤリングを行うことができる装置である。しかし、
風、道路およびエンジンの雑音が大きく変動し、音声の正確な認識が困難となる
。このような利用形態のハンドフリー電話で音声認識を行うには、背景雑音があ
っても、命令を繰り返すという機械的必要なしに、音声による命令を正しく聴き
取って動作する必要がある。
本発明により認識精度が改善されるため、本発明の音声処理装置は上述した利用
形態において特に効果がある。
国際調査報告 。2,7゜93□znnt7g−、、、、、、^、−=、、PC
T/GB B1100376 −2−入NNEX To THE INTEλN
ATZONAL 5EARCヨ 艮EPORT ON
Claims (8)
- 1.音声信号が供給される入力手段と、音声信号からスペクラムのパラメータを 抽出する信号処理手段と、この抽出されたパラメータを二値化するアナログ・デ ィジタル変換器と、 このアナログ・ディジタル変換器に供給される信号レベルを制御する自動利得制 御手段と を備えた音声処理装置において、 スペクトラムのパラメータを一時的に蓄えると共に、蓄えられたパラメータのそ れぞれについて、上記利得制御手段が加えた利得を表す利得係数を蓄える手段と 、 標本化周期の終了時に、その周期の間に蓄えた利得係数が異なる場合にはその係 数をその周期に蓄えられた最も小さい利得係数と等しい値に設定し、これと共に 、対応して蓄えられたスペクトラムのパラメータの大きさを調整する手段と を備えたことを特徴とする音声処理装置。
- 2.信号処理手段は、長さtのタイムスロットにおいて特定の周波数帯に含まれ るエネルギに対応してスペクトラムのパラメータを抽出する構成であり、 それぞれの抽出されたパラメータについてアナログ・ディジタル変換器に供給す る信号レベルを時間tを細分した時間内に決定し、この信号レベルがあらかじめ 定められたレベルより大きいときには利得を低減し、この信号レベルを再び評価 し、最終的なレベルが上記あらかじめ定められたレベル以下となるまで信号強度 の評価および利得の低減をタイムスロットの時間t内で繰り返す手段を備えた請 求項1記載の音声処理装置。
- 3.あらかじめ定められたレベルは、アナログ・ディジタル変換器のダイナミッ クレンジの最大レベルに設定される請求項2記載の音声処理装置。
- 4.信号処理手段は、長さtの一つのタイムスロットに含まれるスペクトラムの パラメータを多数の別々の周波数帯に対してそれぞれ確立する構成であり、 異なる周波数帯を順番に読み取り、それぞれの周波数帯の最終的な利得係数を次 に読み取る周波数帯の初期利得係数として使用する手段を備えた 請求項2記載の音声処理装置。
- 5.標本化周期は長さtの複数のタイムスロットを含む請求項2ないし4のいず れかに記載の音声処理装置。
- 6.音声処理装置は音声認識装置として構成された請求項1ないし5のいずれか に記載の音声処理装置。
- 7.利得制御手段は、入力のひとつがアナログ・ディジタル変換器の二値化出力 に接続されたマイクロプロセッサの制御によりディジタルに切り替えられる減衰 器を含み、この減衰器の利得はマイクロプロセッサにより決定される構成である 請求項1ないし6のいずれかに記載の音声処理装置。
- 8.音声命令に応答して機能を選択する音声認識装置を備えたセルラ無線端末装 置において、上記音声認識装置は請求項1ないし5のいずれかに記載の音声処理 装置を含むことを特徴とするセルラ無線端末装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB868613327A GB8613327D0 (en) | 1986-06-02 | 1986-06-02 | Speech processor |
GB8613327 | 1986-06-02 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5019720A Division JP2654503B2 (ja) | 1986-06-02 | 1993-01-11 | 無線端末装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63503487A true JPS63503487A (ja) | 1988-12-15 |
JP2561850B2 JP2561850B2 (ja) | 1996-12-11 |
Family
ID=10598774
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62503341A Expired - Lifetime JP2561850B2 (ja) | 1986-06-02 | 1987-05-29 | 音声処理装置 |
JP5019720A Expired - Fee Related JP2654503B2 (ja) | 1986-06-02 | 1993-01-11 | 無線端末装置 |
JP9032774A Pending JPH09325790A (ja) | 1986-06-02 | 1997-01-30 | 音声処理方法および装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5019720A Expired - Fee Related JP2654503B2 (ja) | 1986-06-02 | 1993-01-11 | 無線端末装置 |
JP9032774A Pending JPH09325790A (ja) | 1986-06-02 | 1997-01-30 | 音声処理方法および装置 |
Country Status (13)
Country | Link |
---|---|
US (1) | US4912766A (ja) |
EP (2) | EP0248609B1 (ja) |
JP (3) | JP2561850B2 (ja) |
KR (1) | KR950011963B1 (ja) |
AT (2) | ATE183009T1 (ja) |
CA (1) | CA1310418C (ja) |
DE (2) | DE3752288T2 (ja) |
DK (1) | DK171426B1 (ja) |
ES (1) | ES2056819T3 (ja) |
FI (1) | FI92113C (ja) |
GB (1) | GB8613327D0 (ja) |
HK (1) | HK137096A (ja) |
WO (1) | WO1987007750A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02189600A (ja) * | 1989-01-19 | 1990-07-25 | Sanyo Electric Co Ltd | 音声認識装置 |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK510275A (da) * | 1975-11-12 | 1977-05-13 | Struers K S | Elektrolytisk polerapparat |
US5333155A (en) * | 1991-04-25 | 1994-07-26 | Rohde & Schwarz Gmbh & Co. Kg | Method and system for transmitting digital audio signals from recording studios to the various master stations of a broadcasting network |
US6134521A (en) * | 1994-02-17 | 2000-10-17 | Motorola, Inc. | Method and apparatus for mitigating audio degradation in a communication system |
AU720511B2 (en) * | 1995-08-24 | 2000-06-01 | British Telecommunications Public Limited Company | Pattern recognition |
US5774841A (en) * | 1995-09-20 | 1998-06-30 | The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration | Real-time reconfigurable adaptive speech recognition command and control apparatus and method |
US7630895B2 (en) * | 2000-01-21 | 2009-12-08 | At&T Intellectual Property I, L.P. | Speaker verification method |
US6012027A (en) * | 1997-05-27 | 2000-01-04 | Ameritech Corporation | Criteria for usable repetitions of an utterance during speech reference enrollment |
US6353809B2 (en) * | 1997-06-06 | 2002-03-05 | Olympus Optical, Ltd. | Speech recognition with text generation from portions of voice data preselected by manual-input commands |
US6188986B1 (en) | 1998-01-02 | 2001-02-13 | Vos Systems, Inc. | Voice activated switch method and apparatus |
GB9822529D0 (en) * | 1998-10-16 | 1998-12-09 | Dragon Syst Uk Ltd | Speech processing |
DE19960161C2 (de) * | 1998-12-15 | 2002-03-28 | Daimler Chrysler Ag | Verfahren zur Detektion von sprachmodulierten Sendungen |
FI118359B (fi) * | 1999-01-18 | 2007-10-15 | Nokia Corp | Menetelmä puheentunnistuksessa ja puheentunnistuslaite ja langaton viestin |
US6519559B1 (en) * | 1999-07-29 | 2003-02-11 | Intel Corporation | Apparatus and method for the enhancement of signals |
US6910011B1 (en) | 1999-08-16 | 2005-06-21 | Haman Becker Automotive Systems - Wavemakers, Inc. | Noisy acoustic signal enhancement |
US7117149B1 (en) | 1999-08-30 | 2006-10-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Sound source classification |
US6594630B1 (en) * | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
US7155385B2 (en) | 2002-05-16 | 2006-12-26 | Comerica Bank, As Administrative Agent | Automatic gain control for adjusting gain during non-speech portions |
KR100841096B1 (ko) * | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7895036B2 (en) | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
US7949522B2 (en) | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US8073689B2 (en) | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
US7885420B2 (en) | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US7725315B2 (en) | 2003-02-21 | 2010-05-25 | Qnx Software Systems (Wavemakers), Inc. | Minimization of transient noises in a voice signal |
US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
AU2003901539A0 (en) * | 2003-03-28 | 2003-05-01 | Cochlear Limited | Noise floor estimator |
US7949520B2 (en) | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US7716046B2 (en) | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US7680652B2 (en) | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8306821B2 (en) | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US8543390B2 (en) | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US8170879B2 (en) | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US8284947B2 (en) | 2004-12-01 | 2012-10-09 | Qnx Software Systems Limited | Reverberation estimation and suppression system |
US20060146652A1 (en) * | 2005-01-03 | 2006-07-06 | Sdi Technologies, Inc. | Sunset timer |
US8027833B2 (en) | 2005-05-09 | 2011-09-27 | Qnx Software Systems Co. | System for suppressing passing tire hiss |
US8170875B2 (en) | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
US8311819B2 (en) | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
US7117075B1 (en) * | 2005-08-15 | 2006-10-03 | Report On Board Llc | Driver activity and vehicle operation logging and reporting |
US7995713B2 (en) * | 2006-04-03 | 2011-08-09 | Agere Systems Inc. | Voice-identification-based signal processing for multiple-talker applications |
US7844453B2 (en) | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
US8326620B2 (en) | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
US8335685B2 (en) | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
US8904400B2 (en) | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
US8209514B2 (en) | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
DE102010041435A1 (de) * | 2010-09-27 | 2012-03-29 | Siemens Medical Instruments Pte. Ltd. | Verfahren zum Rekonstruieren eines Sprachsignals und Hörvorrichtung |
WO2013061252A2 (en) | 2011-10-24 | 2013-05-02 | Cochlear Limited | Post-filter common-gain determination |
JP6127422B2 (ja) | 2012-09-25 | 2017-05-17 | セイコーエプソン株式会社 | 音声認識装置及び方法、並びに、半導体集積回路装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56126896A (en) * | 1980-03-10 | 1981-10-05 | Nippon Electric Co | Voice recognizing system |
JPS57178299A (en) * | 1981-04-27 | 1982-11-02 | Kyosan Electric Mfg | Recognition pattern preparation system |
JPS6195398A (ja) * | 1984-10-17 | 1986-05-14 | 株式会社東芝 | 音声認識装置 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3411153A (en) * | 1964-10-12 | 1968-11-12 | Philco Ford Corp | Plural-signal analog-to-digital conversion system |
US4000369A (en) * | 1974-12-05 | 1976-12-28 | Rockwell International Corporation | Analog signal channel equalization with signal-in-noise embodiment |
US4032710A (en) * | 1975-03-10 | 1977-06-28 | Threshold Technology, Inc. | Word boundary detector for speech recognition equipment |
CA1056504A (en) * | 1975-04-02 | 1979-06-12 | Visvaldis A. Vitols | Keyword detection in continuous speech using continuous asynchronous correlation |
US4052568A (en) * | 1976-04-23 | 1977-10-04 | Communications Satellite Corporation | Digital voice switch |
FR2451680A1 (fr) * | 1979-03-12 | 1980-10-10 | Soumagne Joel | Discriminateur parole/silence pour interpolation de la parole |
US4262355A (en) * | 1979-05-11 | 1981-04-14 | Rca Corporation | System for limiting intermodulation distortion of talkspurt signals |
US4292470A (en) * | 1979-09-10 | 1981-09-29 | Interstate Electronics Corp. | Audio signal recognition computer |
US4352957A (en) * | 1980-03-17 | 1982-10-05 | Storage Technology Corporation | Speech detector circuit with associated gain control for a tasi system |
JPS56159400U (ja) * | 1980-04-24 | 1981-11-27 | ||
JPS57177197A (en) * | 1981-04-24 | 1982-10-30 | Hitachi Ltd | Pick-up system for sound section |
US4410763A (en) * | 1981-06-09 | 1983-10-18 | Northern Telecom Limited | Speech detector |
US4489434A (en) * | 1981-10-05 | 1984-12-18 | Exxon Corporation | Speech recognition method and apparatus |
JPS5984300A (ja) * | 1982-11-08 | 1984-05-15 | 株式会社日立製作所 | 音声区間検出回路 |
JPS59111697A (ja) * | 1982-12-17 | 1984-06-27 | 株式会社日立製作所 | 音声認識方式 |
US4627091A (en) * | 1983-04-01 | 1986-12-02 | Rca Corporation | Low-energy-content voice detection apparatus |
JPS6063600A (ja) * | 1983-08-26 | 1985-04-11 | 日本電気株式会社 | 可変閾値型音声検出器 |
US4696040A (en) * | 1983-10-13 | 1987-09-22 | Texas Instruments Incorporated | Speech analysis/synthesis system with energy normalization and silence suppression |
JPS6085628A (ja) * | 1983-10-15 | 1985-05-15 | Fujitsu Ten Ltd | 通信装置 |
JPS60254100A (ja) * | 1984-05-30 | 1985-12-14 | 沖電気工業株式会社 | 音声認識方式 |
US4821325A (en) * | 1984-11-08 | 1989-04-11 | American Telephone And Telegraph Company, At&T Bell Laboratories | Endpoint detector |
JPS61113100A (ja) * | 1984-11-08 | 1986-05-30 | ヤマハ株式会社 | 音声パラメ−タ検出装置 |
FR2576472B1 (fr) * | 1985-01-22 | 1988-02-12 | Alcatel Thomson Faisceaux | Procede et dispositif de commande automatique de gain d'un recepteur en acces multiple a repartition temporelle |
JPH0673079B2 (ja) * | 1985-03-29 | 1994-09-14 | 沖電気工業株式会社 | 音声区間検出回路 |
JPH06105394B2 (ja) * | 1986-03-19 | 1994-12-21 | 株式会社東芝 | 音声認識方式 |
-
1986
- 1986-06-02 GB GB868613327A patent/GB8613327D0/en active Pending
-
1987
- 1987-05-29 EP EP87304793A patent/EP0248609B1/en not_active Expired - Lifetime
- 1987-05-29 DE DE3752288T patent/DE3752288T2/de not_active Expired - Fee Related
- 1987-05-29 DE DE3750314T patent/DE3750314T2/de not_active Expired - Fee Related
- 1987-05-29 WO PCT/GB1987/000376 patent/WO1987007750A1/en unknown
- 1987-05-29 KR KR1019880700114A patent/KR950011963B1/ko not_active IP Right Cessation
- 1987-05-29 EP EP93203407A patent/EP0750291B1/en not_active Expired - Lifetime
- 1987-05-29 AT AT93203407T patent/ATE183009T1/de not_active IP Right Cessation
- 1987-05-29 ES ES87304793T patent/ES2056819T3/es not_active Expired - Lifetime
- 1987-05-29 AT AT87304793T patent/ATE109582T1/de active
- 1987-05-29 JP JP62503341A patent/JP2561850B2/ja not_active Expired - Lifetime
- 1987-06-01 CA CA000538514A patent/CA1310418C/en not_active Expired - Fee Related
- 1987-06-01 US US07/055,966 patent/US4912766A/en not_active Expired - Lifetime
- 1987-06-02 FI FI872450A patent/FI92113C/fi not_active IP Right Cessation
- 1987-06-02 DK DK282587A patent/DK171426B1/da not_active IP Right Cessation
-
1993
- 1993-01-11 JP JP5019720A patent/JP2654503B2/ja not_active Expired - Fee Related
-
1996
- 1996-07-25 HK HK137096A patent/HK137096A/xx not_active IP Right Cessation
-
1997
- 1997-01-30 JP JP9032774A patent/JPH09325790A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56126896A (en) * | 1980-03-10 | 1981-10-05 | Nippon Electric Co | Voice recognizing system |
JPS57178299A (en) * | 1981-04-27 | 1982-11-02 | Kyosan Electric Mfg | Recognition pattern preparation system |
JPS6195398A (ja) * | 1984-10-17 | 1986-05-14 | 株式会社東芝 | 音声認識装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02189600A (ja) * | 1989-01-19 | 1990-07-25 | Sanyo Electric Co Ltd | 音声認識装置 |
Also Published As
Publication number | Publication date |
---|---|
EP0248609B1 (en) | 1994-08-03 |
ATE183009T1 (de) | 1999-08-15 |
KR880701435A (ko) | 1988-07-27 |
DE3750314D1 (de) | 1994-09-08 |
JPH0677894A (ja) | 1994-03-18 |
DE3750314T2 (de) | 1994-11-17 |
HK137096A (en) | 1996-08-02 |
EP0248609A1 (en) | 1987-12-09 |
US4912766A (en) | 1990-03-27 |
JP2561850B2 (ja) | 1996-12-11 |
FI92113B (fi) | 1994-06-15 |
FI872450A (fi) | 1987-12-03 |
FI92113C (fi) | 1994-09-26 |
CA1310418C (en) | 1992-11-17 |
DK282587A (da) | 1987-12-03 |
WO1987007750A1 (en) | 1987-12-17 |
JP2654503B2 (ja) | 1997-09-17 |
EP0750291A1 (en) | 1996-12-27 |
ATE109582T1 (de) | 1994-08-15 |
FI872450A0 (fi) | 1987-06-02 |
EP0750291B1 (en) | 1999-08-04 |
ES2056819T3 (es) | 1994-10-16 |
JPH09325790A (ja) | 1997-12-16 |
DE3752288T2 (de) | 2000-07-06 |
GB8613327D0 (en) | 1986-07-09 |
KR950011963B1 (ko) | 1995-10-12 |
DK171426B1 (da) | 1996-10-21 |
DE3752288D1 (de) | 1999-09-09 |
DK282587D0 (da) | 1987-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS63503487A (ja) | 音声処理装置 | |
US4633499A (en) | Speech recognition system | |
US4455676A (en) | Speech processing system including an amplitude level control circuit for digital processing | |
US6768801B1 (en) | Hearing aid having improved speech intelligibility due to frequency-selective signal processing, and method for operating same | |
JPS6257040B2 (ja) | ||
US4833711A (en) | Speech recognition system with generation of logarithmic values of feature parameters | |
JPH027099A (ja) | 過大音声検出装置 | |
JPH0646359B2 (ja) | 単語音声認識装置 | |
JPH05224694A (ja) | 音声認識装置 | |
KR100647291B1 (ko) | 음성의 특징을 이용한 음성 다이얼링 장치 및 방법 | |
JPS59105697A (ja) | 音声認識装置 | |
JPH09297596A (ja) | 音声認識装置 | |
JPH10304023A (ja) | 電話機 | |
KR100278640B1 (ko) | 이동 전화기를 위한 음성 다이얼링 장치 및방법 | |
JPH09204194A (ja) | 音声認識装置 | |
JPH04369697A (ja) | 音声認識装置 | |
JPH06130983A (ja) | 音声認識機構の音声区間検出装置 | |
JPH07104675B2 (ja) | 音声認識方法 | |
JPS6172299A (ja) | 音声認識装置 | |
JPH0731506B2 (ja) | 音声認識方法 | |
JPH0422999A (ja) | 信号処理回路及び音声認識装置 | |
JPS60200299A (ja) | 音声認識装置 | |
JPH03122700A (ja) | 音声認識装置 | |
JPS59195291A (ja) | 音声認識装置 | |
JPS59195290A (ja) | 音声認識装置 |