JPH0677894A - 無線端末装置 - Google Patents
無線端末装置Info
- Publication number
- JPH0677894A JPH0677894A JP5019720A JP1972093A JPH0677894A JP H0677894 A JPH0677894 A JP H0677894A JP 5019720 A JP5019720 A JP 5019720A JP 1972093 A JP1972093 A JP 1972093A JP H0677894 A JPH0677894 A JP H0677894A
- Authority
- JP
- Japan
- Prior art keywords
- gain
- terminal device
- signal
- wireless terminal
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Abstract
(57)【要約】
【目的】 呼接続やダイアリングを音声命令により入力
するセルラ無線端末装置の制御入力の誤りを少なくす
る。 【構成】 制御入力を音声により入力する場合に、マイ
クロホンから発声者までの距離が変化する、あるいは発
声者の声に強弱があるときに、音声増幅器の自動利得制
御回路が作動する。その利得制御のパラメタを少なくと
も1サンプリング周期にわたり記憶しておき、音声認識
のための処理を実行するときにその記憶された制御パラ
メタを利用する。 【効果】 自動車用のフリーハンド無線端末にきわめて
有用である。
するセルラ無線端末装置の制御入力の誤りを少なくす
る。 【構成】 制御入力を音声により入力する場合に、マイ
クロホンから発声者までの距離が変化する、あるいは発
声者の声に強弱があるときに、音声増幅器の自動利得制
御回路が作動する。その利得制御のパラメタを少なくと
も1サンプリング周期にわたり記憶しておき、音声認識
のための処理を実行するときにその記憶された制御パラ
メタを利用する。 【効果】 自動車用のフリーハンド無線端末にきわめて
有用である。
Description
【0001】
【産業上の利用分野】本発明は、手を用いることなく音
声により制御命令を入力して、呼接続およびダイヤリン
グを行う無線端末装置に利用する。本発明は、特に自動
車に搭載されるセルラ方式のハンドフリー無線端末装置
として利用するに適する。セルラ方式とは一つの無線基
地局が受け持つゾーンを小さく設定し、無線基地局を小
さい間隔で多数配置するとともに、基地局および移動局
ともその送信電力を小さく設定して電波の有効利用をは
かり、加入できる無線端末の数を大きくすることができ
る方式である。セルラ方式については、電子情報通信学
会編「電子情報通信ハンドブック」1988年オーム社
発行2187頁2057頁に詳しい記載がある。
声により制御命令を入力して、呼接続およびダイヤリン
グを行う無線端末装置に利用する。本発明は、特に自動
車に搭載されるセルラ方式のハンドフリー無線端末装置
として利用するに適する。セルラ方式とは一つの無線基
地局が受け持つゾーンを小さく設定し、無線基地局を小
さい間隔で多数配置するとともに、基地局および移動局
ともその送信電力を小さく設定して電波の有効利用をは
かり、加入できる無線端末の数を大きくすることができ
る方式である。セルラ方式については、電子情報通信学
会編「電子情報通信ハンドブック」1988年オーム社
発行2187頁2057頁に詳しい記載がある。
【0002】
【従来の技術】音声により制御命令を入力するための自
動音声認識装置は、さまざまな分野で利用されはじめ
た。従来の自動音声認識装置は、可聴音声信号から抽出
した特徴を比較することにより動作する。認識しようと
する音声から抽出した特徴を既知の発話から抽出して蓄
えた特徴と比較する。
動音声認識装置は、さまざまな分野で利用されはじめ
た。従来の自動音声認識装置は、可聴音声信号から抽出
した特徴を比較することにより動作する。認識しようと
する音声から抽出した特徴を既知の発話から抽出して蓄
えた特徴と比較する。
【0003】正確な認識のために、異なる時間に話され
た同じ語または音から抽出した特徴が、十分に類似して
いることが重要である。しかし、音声のダイナミックレ
ンジが広い場合、特に、マイクロホンにより受信される
音声レベルが非常に広い範囲にわたって変化するハンド
フリー電話の場合には、特徴を類似させることが困難に
なる。この音声レベルの変化を補償するため、多くの音
声認識装置では何らかの形態の自動利得制御(AGC)
が用いられている。
た同じ語または音から抽出した特徴が、十分に類似して
いることが重要である。しかし、音声のダイナミックレ
ンジが広い場合、特に、マイクロホンにより受信される
音声レベルが非常に広い範囲にわたって変化するハンド
フリー電話の場合には、特徴を類似させることが困難に
なる。この音声レベルの変化を補償するため、多くの音
声認識装置では何らかの形態の自動利得制御(AGC)
が用いられている。
【0004】自動利得制御回路は、特徴抽出回路が使用
する平均信号レベルをある所定の時間にわたって可能な
かぎりほぼ一定に保つことができるように、利得を制御
する。したがって、静かな発話のときには、大声の発話
に比較して大きな利得が与えられる。この形態の自動利
得制御回路は、連続音声を入力信号とする場合には良好
に動作する。これは、ある時間が経過すると自動利得制
御回路が信号レベルを最適化し、矛盾のない特徴抽出が
できるようになるからである。しかし、無音の場合に
は、自動利得制御回路の利得が背景雑音により決定され
るレベルまで増加し、発話の開始時には、自動利得制御
回路の利得が高く設定されてしまう。発話中には回路の
利得が自動的に制限される。利得変化の速度は、自動利
得制御回路の「アタック」時間により決定される。した
がって、発話の開始時には利得が非常に大きくなり、そ
のときに抽出される特徴は、その後に利得が制限された
ときに抽出される同じ特徴に比較して、非常に大きなエ
ネルギをもつことになる。
する平均信号レベルをある所定の時間にわたって可能な
かぎりほぼ一定に保つことができるように、利得を制御
する。したがって、静かな発話のときには、大声の発話
に比較して大きな利得が与えられる。この形態の自動利
得制御回路は、連続音声を入力信号とする場合には良好
に動作する。これは、ある時間が経過すると自動利得制
御回路が信号レベルを最適化し、矛盾のない特徴抽出が
できるようになるからである。しかし、無音の場合に
は、自動利得制御回路の利得が背景雑音により決定され
るレベルまで増加し、発話の開始時には、自動利得制御
回路の利得が高く設定されてしまう。発話中には回路の
利得が自動的に制限される。利得変化の速度は、自動利
得制御回路の「アタック」時間により決定される。した
がって、発話の開始時には利得が非常に大きくなり、そ
のときに抽出される特徴は、その後に利得が制限された
ときに抽出される同じ特徴に比較して、非常に大きなエ
ネルギをもつことになる。
【0005】
【発明が解決しようとする課題】この歪の効果は入力信
号レベルに依存し、音声レベルが高くなるほど歪が大き
くなる。したがって、抽出された最初の幾つかの特徴
は、理論的には同等な蓄えられた特徴と対応せず、認識
特性が不十分となることがある。
号レベルに依存し、音声レベルが高くなるほど歪が大き
くなる。したがって、抽出された最初の幾つかの特徴
は、理論的には同等な蓄えられた特徴と対応せず、認識
特性が不十分となることがある。
【0006】一方、セルラ方式による移動無線通信方式
が移動無線電話に広く採用されることが考えられ、また
無線端末装置が安価に入手できるようになって自動車に
搭載され広く普及する場合には、交通安全のうえからハ
ンドフリーの制御装置が強く要望されている。すなわ
ち、セルラ方式は小さいゾーンが設定されて、基地局の
数がきわめて大きくなるためにその接続制御が複雑であ
る。したがって、呼接続およびダイヤリングのための制
御命令に誤りが発生すると、制御チャネルおよび接続制
御装置を占有する時間が長くなってその影響するところ
が大きいから、制御命令の中に発生する命令の誤り率を
小さくすることが必要である。自動車内で自動車を運転
しながらハンドフリーの音声入力を行うと、運転者は運
転動作にしたがって首を左右に振るから、マイクロホン
は必ずしも発話者の口元にあるとは限らず、また周囲の
騒音の質や量が風、道路およびエンジンの雑音などによ
り激しく変動するから、音声入力による制御命令の誤り
率を小さくするにはさらに高度な音声認識装置が必要で
ある。
が移動無線電話に広く採用されることが考えられ、また
無線端末装置が安価に入手できるようになって自動車に
搭載され広く普及する場合には、交通安全のうえからハ
ンドフリーの制御装置が強く要望されている。すなわ
ち、セルラ方式は小さいゾーンが設定されて、基地局の
数がきわめて大きくなるためにその接続制御が複雑であ
る。したがって、呼接続およびダイヤリングのための制
御命令に誤りが発生すると、制御チャネルおよび接続制
御装置を占有する時間が長くなってその影響するところ
が大きいから、制御命令の中に発生する命令の誤り率を
小さくすることが必要である。自動車内で自動車を運転
しながらハンドフリーの音声入力を行うと、運転者は運
転動作にしたがって首を左右に振るから、マイクロホン
は必ずしも発話者の口元にあるとは限らず、また周囲の
騒音の質や量が風、道路およびエンジンの雑音などによ
り激しく変動するから、音声入力による制御命令の誤り
率を小さくするにはさらに高度な音声認識装置が必要で
ある。
【0007】本発明は、この要望に応えることができる
装置を提供することを目的とする。すなわち本発明は、
発話者とマイクロホンの相対位置関係が変動し、周囲騒
音の質および量が変動する環境でも、音声入力による制
御命令の誤り率を小さく抑えることができる無線端末装
置を提供することを目的とする。
装置を提供することを目的とする。すなわち本発明は、
発話者とマイクロホンの相対位置関係が変動し、周囲騒
音の質および量が変動する環境でも、音声入力による制
御命令の誤り率を小さく抑えることができる無線端末装
置を提供することを目的とする。
【0008】
【課題を解決するための手段】本発明の無線端末装置
は、音声信号を受け取る入力と、音声信号からスペクト
ラムのパラメータを抽出する信号処理手段と、この抽出
されたパラメータを二値化するアナログ・ディジタル変
換器と、このアナログ・ディジタル変換器に供給される
信号レベルを制御する自動利得制御手段とを備え、スペ
クトラムのパラメータを少なくとも一時的に蓄え、この
蓄えられたパラメータのそれぞれについて上記利得制御
手段により加えられた利得を示す利得係数を蓄え、標本
化周期の終了時に、その周期の間に蓄えた利得係数が異
なる場合にはその係数をその周期に蓄えられた最も小さ
い利得係数と等しい値に設定し、これに比例して、対応
して蓄えられたスペクトラムのパラメータの大きさを調
整する音声認識装置を搭載したことを特徴とする。
は、音声信号を受け取る入力と、音声信号からスペクト
ラムのパラメータを抽出する信号処理手段と、この抽出
されたパラメータを二値化するアナログ・ディジタル変
換器と、このアナログ・ディジタル変換器に供給される
信号レベルを制御する自動利得制御手段とを備え、スペ
クトラムのパラメータを少なくとも一時的に蓄え、この
蓄えられたパラメータのそれぞれについて上記利得制御
手段により加えられた利得を示す利得係数を蓄え、標本
化周期の終了時に、その周期の間に蓄えた利得係数が異
なる場合にはその係数をその周期に蓄えられた最も小さ
い利得係数と等しい値に設定し、これに比例して、対応
して蓄えられたスペクトラムのパラメータの大きさを調
整する音声認識装置を搭載したことを特徴とする。
【0009】本発明は自動利得制御手段としてディジタ
ルに切り替え可能な減衰器を用い、音声認識を実行する
マイクロプロセッサにより利得を決定する。マイクロプ
ロセッサが利得を制御することにより、アナログ・ディ
ジタル変換器の自動利得制御を適応させている間を除い
てダイナミックレンジを越えないようにする。アナログ
・ディジタル変換器は、アナログで自動利得制御を行う
場合でも、特徴抽出回路と認識装置を制御するマイクロ
プロセッサとの間に必要である。
ルに切り替え可能な減衰器を用い、音声認識を実行する
マイクロプロセッサにより利得を決定する。マイクロプ
ロセッサが利得を制御することにより、アナログ・ディ
ジタル変換器の自動利得制御を適応させている間を除い
てダイナミックレンジを越えないようにする。アナログ
・ディジタル変換器は、アナログで自動利得制御を行う
場合でも、特徴抽出回路と認識装置を制御するマイクロ
プロセッサとの間に必要である。
【0010】従来のアナログ自動利得制御と本発明装置
との基本的な差異は、本発明装置ではマイクロプロセッ
サが利得の設定値を制御し、これにより、抽出されたそ
れぞれの特徴に対して使用された利得を蓄えることがで
きることである。発話が終了した後に、マイクロプロセ
ッサが完了した発話に対して最適な利得設定値を決定す
る。蓄えられた特徴は、すべて最適利得設定値で規格化
される。このようにして、矛盾のない特徴の組を入力信
号利得に独立に抽出することができる。
との基本的な差異は、本発明装置ではマイクロプロセッ
サが利得の設定値を制御し、これにより、抽出されたそ
れぞれの特徴に対して使用された利得を蓄えることがで
きることである。発話が終了した後に、マイクロプロセ
ッサが完了した発話に対して最適な利得設定値を決定す
る。蓄えられた特徴は、すべて最適利得設定値で規格化
される。このようにして、矛盾のない特徴の組を入力信
号利得に独立に抽出することができる。
【0011】
【実施例】本発明の実施例について添付図面を参照して
説明する。
説明する。
【0012】ここでは実施例として、テンプレート・マ
ッチングを用いた音声認識装置を参照して本発明を説明
するが、テンプレート・マッチングに限らず、従来から
用いられているどのような音声認識装置、例えば確率モ
デル化(stochastic modeling)、マルコフ・チェーン
(Marcov chaines) 、ダイナミック・タイムワーピング
(dynamic-timewarping)、音素認識 (phoneme-recognati
on)でも同様に本発明を実施できる。
ッチングを用いた音声認識装置を参照して本発明を説明
するが、テンプレート・マッチングに限らず、従来から
用いられているどのような音声認識装置、例えば確率モ
デル化(stochastic modeling)、マルコフ・チェーン
(Marcov chaines) 、ダイナミック・タイムワーピング
(dynamic-timewarping)、音素認識 (phoneme-recognati
on)でも同様に本発明を実施できる。
【0013】音声認識は、複数 (一般には8ないし16)
のフィルタ・チャネルからのエネルギ曲線を比較するこ
とを基本とする。音声が存在するときには、各フィルタ
・チャネルからのエネルギ・スペクトラムをアナログ・
ディジタル変換器で二値化してテンプレートを作成し、
これをメモリに蓄える。
のフィルタ・チャネルからのエネルギ曲線を比較するこ
とを基本とする。音声が存在するときには、各フィルタ
・チャネルからのエネルギ・スペクトラムをアナログ・
ディジタル変換器で二値化してテンプレートを作成し、
これをメモリに蓄える。
【0014】認識の初期段階は「トレーニング」と呼ば
れ、認識装置に認識すべき語を話して参照テンプレート
を生成する。認識すべき語に対する参照テンプレートが
作成されると、音声認識を実行できる。
れ、認識装置に認識すべき語を話して参照テンプレート
を生成する。認識すべき語に対する参照テンプレートが
作成されると、音声認識を実行できる。
【0015】認識装置に発話を入力すると、メモリ内の
参照テンプレートと比較できる試験テンプレートを作成
し、最も似ているものを見つけ出す。
参照テンプレートと比較できる試験テンプレートを作成
し、最も似ているものを見つけ出す。
【0016】本発明の音声認識装置の基本的な構成要素
を第1図に示す。マイクロホン1から入力され増幅器2
により増幅された音声信号は、フィルタ・バンク3aを通
過する。フィルタ・バンク3aでは、音声信号が複数 (こ
の実施例では16) の周波数帯に濾波され、この信号が整
流器4により整流される。濾波され整流された信号は、
低域通過フィルタ3bにより平滑化され、この後に、マル
チプレクサ5により順番に標本化される。マルチプレク
サ5は、得られた単一チャネルの信号をディジタル自動
利得制御回路8に供給する。ディジタル自動利得制御回
路8は出力信号をアナログ・ディジタル変換器6に供給
し、このアナログ・ディジタル変換器6から、二値化信
号ストリームが制御用のマルチプレクサ7に供給され
る。
を第1図に示す。マイクロホン1から入力され増幅器2
により増幅された音声信号は、フィルタ・バンク3aを通
過する。フィルタ・バンク3aでは、音声信号が複数 (こ
の実施例では16) の周波数帯に濾波され、この信号が整
流器4により整流される。濾波され整流された信号は、
低域通過フィルタ3bにより平滑化され、この後に、マル
チプレクサ5により順番に標本化される。マルチプレク
サ5は、得られた単一チャネルの信号をディジタル自動
利得制御回路8に供給する。ディジタル自動利得制御回
路8は出力信号をアナログ・ディジタル変換器6に供給
し、このアナログ・ディジタル変換器6から、二値化信
号ストリームが制御用のマルチプレクサ7に供給され
る。
【0017】マルチプレクサは、それぞれのフィルタ・
チャネルを20マイクロ秒間にわたり読み取り、それが終
了すると次のフィルタ・チャネルの読み取りを行う。10
ミリ秒のタイムスロットのそれぞれの終了時に、それぞ
れのチャネルでその期間に標本化されたエネルギを蓄え
る。トレーニング時および認識動作時に生成されるテン
プレートは、それぞれのフィルタ・チャネルに対して約
100 タイムスロットの標本を含む。
チャネルを20マイクロ秒間にわたり読み取り、それが終
了すると次のフィルタ・チャネルの読み取りを行う。10
ミリ秒のタイムスロットのそれぞれの終了時に、それぞ
れのチャネルでその期間に標本化されたエネルギを蓄え
る。トレーニング時および認識動作時に生成されるテン
プレートは、それぞれのフィルタ・チャネルに対して約
100 タイムスロットの標本を含む。
【0018】ディジタル自動利得制御回路は以下の方法
で動作する。マルチプレクサがフィルタ・チャネルを読
み取る毎に、マイクロプロセッサは、そのチャネルのエ
ネルギ・レベルを読み取ってアナログ・ディジタル変換
器が過負荷となっているか否か、すなわち利得が大き過
ぎないか否かを判断する。利得が大き過ぎるとマイクロ
プロセッサが判断したときには、ディジタル自動利得制
御回路の利得を1段階ずつ減少させ、再びチャネルのエ
ネルギ・レベルを観測する。利得を1段階減少させるこ
とは、利得を1.5dB 引き下げることに対応する。利得が
十分に引き下げられてアナログ・ディジタル変換器の過
負荷を防止できるとマイクロプロセッサが判断するま
で、マルチプレクサは次のチャネルの読み取りを開始し
ない。マルチプレクサが次のフィルタの読み取りを開始
するときには、新しいチャネルのエネルギ・レベルによ
ってアナログ・ディジタル変換器の過負荷が生じないか
ぎり、ディジタル利得制御回路の利得を前のチャネルで
得られた低レベルに維持する。新しいチャネルのエネル
ギ・レベルにより過負荷が生じたときには、上述したと
同様に利得を1段階ずつ引き下げる。マルチプレクサが
最後のフィルタ・チャネルを読み取ったとき、マイクロ
プロセッサは、すべてのチャネルのエネルギ・レベルに
ついて、その利得係数(この係数は、マイクロプロセッ
サに接続されたメモリに、エネルギ・レベル情報として
一緒に蓄えられている)をマイクロプロセッサにより確
立した新しい最小値で割って規格化する。このようにし
て、初期入力信号利得およびテンプレートを作成する間
の利得変化と独立に、矛盾のない特徴の組を抽出でき
る。
で動作する。マルチプレクサがフィルタ・チャネルを読
み取る毎に、マイクロプロセッサは、そのチャネルのエ
ネルギ・レベルを読み取ってアナログ・ディジタル変換
器が過負荷となっているか否か、すなわち利得が大き過
ぎないか否かを判断する。利得が大き過ぎるとマイクロ
プロセッサが判断したときには、ディジタル自動利得制
御回路の利得を1段階ずつ減少させ、再びチャネルのエ
ネルギ・レベルを観測する。利得を1段階減少させるこ
とは、利得を1.5dB 引き下げることに対応する。利得が
十分に引き下げられてアナログ・ディジタル変換器の過
負荷を防止できるとマイクロプロセッサが判断するま
で、マルチプレクサは次のチャネルの読み取りを開始し
ない。マルチプレクサが次のフィルタの読み取りを開始
するときには、新しいチャネルのエネルギ・レベルによ
ってアナログ・ディジタル変換器の過負荷が生じないか
ぎり、ディジタル利得制御回路の利得を前のチャネルで
得られた低レベルに維持する。新しいチャネルのエネル
ギ・レベルにより過負荷が生じたときには、上述したと
同様に利得を1段階ずつ引き下げる。マルチプレクサが
最後のフィルタ・チャネルを読み取ったとき、マイクロ
プロセッサは、すべてのチャネルのエネルギ・レベルに
ついて、その利得係数(この係数は、マイクロプロセッ
サに接続されたメモリに、エネルギ・レベル情報として
一緒に蓄えられている)をマイクロプロセッサにより確
立した新しい最小値で割って規格化する。このようにし
て、初期入力信号利得およびテンプレートを作成する間
の利得変化と独立に、矛盾のない特徴の組を抽出でき
る。
【0019】音声認識装置はまた、音声または語の開始
および終了を高精度に検出する必要がある。本発明の音
声認識装置は、以下の技術を使用する。 A.背景雑音のエネルギ・レベルを32タイムスロットに
わたりに測定して蓄え (10ミリ秒に1標本)、これと同
時に、最大雑音エネルギについて、上述と同様に自動利
得制御回路の利得を調節(削減)する。 B.それぞれのタイムスロットにおけるフィルタの値を
総て加算し、これを16 (フィルタ・チャネルの数) で除
算し、ディジタル自動利得制御回路の利得を示す利得係
数を乗算し、それぞれのタイムスロットを比較して最大
値を見つけることより、最大エネルギの標本を見つけ
る。 C.音声が存在すると判断するために必要なしきい値を
ステップBで求めた最大雑音エネルギの1.5 倍に設定す
る。 D.それぞれのフィルタ・チャネルに対する平均雑音エ
ネルギを見つけて蓄え(それぞれのチャネルについて、
32タイムスロット全体のエネルギの和を求め、これを32
で割る) 、雑音テンプレートを確立する。 E.これらの後にフィルタ・バンクを10ミリ秒毎に走査
し、平均フィルタ・エネルギがステップCで計算した雑
音/音声しきい値を越えるまで、100 タイムスロットの
標本を蓄えることのできる一時循環メモリにデータを蓄
える。 F.32個の標本を得た後に雑音/音声しきい値を越えて
いない場合には、ディジタル自動利得制御回路の利得が
低く設定されていないことを確認するための検査を行
う。この検査は、32タイムスロットの間に蓄えたフィル
タ・チャネル値の最大値を見つけることにより行う。最
大レベルがアナログ・ディジタル変換器の最大許容入力
レベルより1.5dB 以上低ければ、自動利得制御の利得を
1段階増加させ、利得を1.5dB 増加させる。32個の標本
を得た後でもしきい値を越えず、ディジタル自動利得制
御回路の設定が正しい場合には、最新の32個の標本につ
いて最大エネルギを見つけ (ステップBと同様)、1.5
を乗算する (ステップCと同様)ことにより、雑音/音
声しきい値を再び計算する。 G.雑音/音声しきい値を越えたときには、100 個の標
本が入力されるか、または20個の連続する標本に対して
エネルギ・レベルが雑音/音声しきい値以下になるま
で、フィルタ・バンクを10ミリ秒毎に走査し、フィルタ
のデータをメモリに蓄え、音声テンプレートを生成す
る。上述したように、データ入力中にアナログ・ディジ
タル変換器が過負荷となったときには、自動利得制御の
設定を1段階減少させ、そのフィルタ・チャネルに対す
るデータを再処理する。16個のフィルタ・チャネルを走
査するうちにディジタル自動利得制御回路の利得が低下
した場合には、全16チャネルからのデータを再入力し、
これにより、すべてのフィルタ・データを同一の自動利
得制御設定値に対応させる。使用される自動利得制御の
値には、フィルタ・データと一緒にメモリに記憶する。
各タイムスロットの開始時に使用される自動利得制御の
設定値は前の時間フレームから得られ、音声処理中には
利得を減らすことができるだけである (増加させること
はできない) 。テンプレートを作成する期間の終了時に
すべてのテンプレート・データを一定の自動利得制御設
定値で規格化するので、利得を増加できなくても問題は
ない。 H.音声/雑音の検出しきい値により音声の開始を確実
に検出できるように、音声検出前の15タイムスロットの
標本を一時循環メモリから「音声」テンプレートの前部
に送り出す。 I.音声を検出するまでに100 個以上の標本を処理した
場合には、一時循環メモリ内の最も古い32個の時間フレ
ームを解析して(ステップDと同様)、雑音テンプレー
トを再度計算する。音声検出前に100 個未満の標本しか
処理していない場合には、ステップDで確立した音声テ
ンプレートを以下のステップで使用する。 J.以上のステップにより、音声テンプレートを作成す
るための自動利得制御の最小利得設定値がわかり、この
設定値に対して音声テンプレートと雑音テンプレートと
の双方が規格化され、これにより、双方のテンプレート
が入力された値を含み、その利得が開始時から使用され
る。 K.規格化された雑音テンプレートを規格化された音声
テンプレートの各時間フレームから減算する。 L.規格化された音声テンプレートの最大エネルギを見
つけ、新しい雑音/音声しきい値、すなわち最大エネル
ギから18dBを引いた値を計算する。この新しいしきい値
を使用して、規格化された音声テンプレートを走査し、
音声の開始点および終了点を判定する。 M.次に、音声テンプレートから開始点と終了点とを除
去し、メモリに蓄えるか(トレーニングの場合)、また
は認識のために使用する。表に、320 ミリ秒 (10ミリ秒
のタイムスロットを32個) にわたって背景雑音を測定し
たときの、メモリに蓄えられた値を例を表1に示す。
および終了を高精度に検出する必要がある。本発明の音
声認識装置は、以下の技術を使用する。 A.背景雑音のエネルギ・レベルを32タイムスロットに
わたりに測定して蓄え (10ミリ秒に1標本)、これと同
時に、最大雑音エネルギについて、上述と同様に自動利
得制御回路の利得を調節(削減)する。 B.それぞれのタイムスロットにおけるフィルタの値を
総て加算し、これを16 (フィルタ・チャネルの数) で除
算し、ディジタル自動利得制御回路の利得を示す利得係
数を乗算し、それぞれのタイムスロットを比較して最大
値を見つけることより、最大エネルギの標本を見つけ
る。 C.音声が存在すると判断するために必要なしきい値を
ステップBで求めた最大雑音エネルギの1.5 倍に設定す
る。 D.それぞれのフィルタ・チャネルに対する平均雑音エ
ネルギを見つけて蓄え(それぞれのチャネルについて、
32タイムスロット全体のエネルギの和を求め、これを32
で割る) 、雑音テンプレートを確立する。 E.これらの後にフィルタ・バンクを10ミリ秒毎に走査
し、平均フィルタ・エネルギがステップCで計算した雑
音/音声しきい値を越えるまで、100 タイムスロットの
標本を蓄えることのできる一時循環メモリにデータを蓄
える。 F.32個の標本を得た後に雑音/音声しきい値を越えて
いない場合には、ディジタル自動利得制御回路の利得が
低く設定されていないことを確認するための検査を行
う。この検査は、32タイムスロットの間に蓄えたフィル
タ・チャネル値の最大値を見つけることにより行う。最
大レベルがアナログ・ディジタル変換器の最大許容入力
レベルより1.5dB 以上低ければ、自動利得制御の利得を
1段階増加させ、利得を1.5dB 増加させる。32個の標本
を得た後でもしきい値を越えず、ディジタル自動利得制
御回路の設定が正しい場合には、最新の32個の標本につ
いて最大エネルギを見つけ (ステップBと同様)、1.5
を乗算する (ステップCと同様)ことにより、雑音/音
声しきい値を再び計算する。 G.雑音/音声しきい値を越えたときには、100 個の標
本が入力されるか、または20個の連続する標本に対して
エネルギ・レベルが雑音/音声しきい値以下になるま
で、フィルタ・バンクを10ミリ秒毎に走査し、フィルタ
のデータをメモリに蓄え、音声テンプレートを生成す
る。上述したように、データ入力中にアナログ・ディジ
タル変換器が過負荷となったときには、自動利得制御の
設定を1段階減少させ、そのフィルタ・チャネルに対す
るデータを再処理する。16個のフィルタ・チャネルを走
査するうちにディジタル自動利得制御回路の利得が低下
した場合には、全16チャネルからのデータを再入力し、
これにより、すべてのフィルタ・データを同一の自動利
得制御設定値に対応させる。使用される自動利得制御の
値には、フィルタ・データと一緒にメモリに記憶する。
各タイムスロットの開始時に使用される自動利得制御の
設定値は前の時間フレームから得られ、音声処理中には
利得を減らすことができるだけである (増加させること
はできない) 。テンプレートを作成する期間の終了時に
すべてのテンプレート・データを一定の自動利得制御設
定値で規格化するので、利得を増加できなくても問題は
ない。 H.音声/雑音の検出しきい値により音声の開始を確実
に検出できるように、音声検出前の15タイムスロットの
標本を一時循環メモリから「音声」テンプレートの前部
に送り出す。 I.音声を検出するまでに100 個以上の標本を処理した
場合には、一時循環メモリ内の最も古い32個の時間フレ
ームを解析して(ステップDと同様)、雑音テンプレー
トを再度計算する。音声検出前に100 個未満の標本しか
処理していない場合には、ステップDで確立した音声テ
ンプレートを以下のステップで使用する。 J.以上のステップにより、音声テンプレートを作成す
るための自動利得制御の最小利得設定値がわかり、この
設定値に対して音声テンプレートと雑音テンプレートと
の双方が規格化され、これにより、双方のテンプレート
が入力された値を含み、その利得が開始時から使用され
る。 K.規格化された雑音テンプレートを規格化された音声
テンプレートの各時間フレームから減算する。 L.規格化された音声テンプレートの最大エネルギを見
つけ、新しい雑音/音声しきい値、すなわち最大エネル
ギから18dBを引いた値を計算する。この新しいしきい値
を使用して、規格化された音声テンプレートを走査し、
音声の開始点および終了点を判定する。 M.次に、音声テンプレートから開始点と終了点とを除
去し、メモリに蓄えるか(トレーニングの場合)、また
は認識のために使用する。表に、320 ミリ秒 (10ミリ秒
のタイムスロットを32個) にわたって背景雑音を測定し
たときの、メモリに蓄えられた値を例を表1に示す。
【0020】
【表1】 ディジタル自動利得制御(DAGC)の値「4」は、アナロ
グ・ディジタル変換器に出力する信号を6dB減衰させる
ことに等価であり、「実際の」エネルギを計算するため
に、すべてのフィルタ・バンクの値を二倍した。
グ・ディジタル変換器に出力する信号を6dB減衰させる
ことに等価であり、「実際の」エネルギを計算するため
に、すべてのフィルタ・バンクの値を二倍した。
【0021】最大実エネルギ (すべてのフィルタの平
均) は−410 、テンプレートの記録を開始または終了す
るしきい値は−615 であった。
均) は−410 、テンプレートの記録を開始または終了す
るしきい値は−615 であった。
【0022】
【発明の効果】以上説明したように、本発明によれば、
発話者とマイクロホンの相対位置関係が変動し、周囲騒
音の質および量が変動する環境でも、音声入力による制
御命令の誤り率を小さく抑えることができる無線端末装
置が得られる。本発明は、ハンドフリーであって、しか
も音声による制御入力に誤認識の発生率が小さいことが
必要なセルラ方式による自動車用無線電話装置に実施し
てきわめて効果的である。
発話者とマイクロホンの相対位置関係が変動し、周囲騒
音の質および量が変動する環境でも、音声入力による制
御命令の誤り率を小さく抑えることができる無線端末装
置が得られる。本発明は、ハンドフリーであって、しか
も音声による制御入力に誤認識の発生率が小さいことが
必要なセルラ方式による自動車用無線電話装置に実施し
てきわめて効果的である。
【図1】本発明実施例音声認識装置の概略的な構成図。
Claims (6)
- 【請求項1】 音声命令に応答して呼接続およびダイヤ
リングを行う接続制御装置を備えた無線端末装置におい
て、 前記接続制御装置に、 音声信号が供給される入力手段と、 音声信号からスペクラムのパラメータを抽出する信号処
理手段と、 この抽出されたパラメータを二値化するアナログ・ディ
ジタル変換器と、 このアナログ・ディジタル変換器に供給される信号レベ
ルを制御する自動利得制御手段とスペクトラムのパラメ
ータを一時的に蓄えると共に、蓄えられたパラメータの
それぞれについて、上記利得制御手段が加えた利得を表
す利得係数を蓄える手段と、 標本化周期の終了時に、その周期の間に蓄えた利得係数
が異なる場合にはその係数をその周期に蓄えられた最も
小さい利得係数と等しい値に設定し、これと共に、対応
して蓄えられたスペクトラムのパラメータの大きさを調
整する手段とを備えたことを特徴とする無線端末装置。 - 【請求項2】 前記信号処理手段は、長さtのタイムス
ロットにおいて特定の周波数帯に含まれるエネルギに対
応してスペクトラムのパラメータを抽出する構成であ
り、 それぞれの抽出されたパラメータについてアナログ・デ
ィジタル変換器に供給する信号レベルを時間tを細分し
た時間内に決定し、この信号レベルがあらかじめ定めら
れたレベルより大きいときには利得を低減し、この信号
レベルを再び評価し、最終的なレベルが上記あらかじめ
定められたレベル以下となるまで信号強度の評価および
利得の低減をタイムスロットの時間t内で繰り返す手段
を備えた請求項1記載の無線端末装置。 - 【請求項3】 あらかじめ定められたレベルは、アナロ
グ・ディジタル変換器のダイナミックレンジの最大レベ
ルに設定される請求項1記載の無線端末装置。 - 【請求項4】 前記信号処理手段は、長さtの一つのタ
イムスロットに含まれるスペクトラムのパラメータを多
数の別々の周波数帯に対してそれぞれ確立する構成であ
り、 異なる周波数帯を順番に読み取り、それぞれの周波数帯
の最終的な利得係数を次に読み取る周波数帯の初期利得
係数として使用する手段を備えた請求項2記載の無線端
末装置。 - 【請求項5】 標本化周期は長さtの複数のタイムスロ
ットを含む請求項2ないし4のいずれかに記載の無線端
末装置。 - 【請求項6】 前記利得制御手段は、入力のひとつがア
ナログ・ディジタル変換器の二値化出力に接続されたマ
イクロプロセッサの制御によりディジタルに切り替えら
れる減衰器を含み、この減衰器の利得はマイクロプロセ
ッサにより決定される構成である請求項1ないし4のい
ずれかに記載の無線端末装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB868613327A GB8613327D0 (en) | 1986-06-02 | 1986-06-02 | Speech processor |
GB8613327 | 1986-06-02 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62503341A Division JP2561850B2 (ja) | 1986-06-02 | 1987-05-29 | 音声処理装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9032774A Division JPH09325790A (ja) | 1986-06-02 | 1997-01-30 | 音声処理方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0677894A true JPH0677894A (ja) | 1994-03-18 |
JP2654503B2 JP2654503B2 (ja) | 1997-09-17 |
Family
ID=10598774
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62503341A Expired - Lifetime JP2561850B2 (ja) | 1986-06-02 | 1987-05-29 | 音声処理装置 |
JP5019720A Expired - Fee Related JP2654503B2 (ja) | 1986-06-02 | 1993-01-11 | 無線端末装置 |
JP9032774A Pending JPH09325790A (ja) | 1986-06-02 | 1997-01-30 | 音声処理方法および装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62503341A Expired - Lifetime JP2561850B2 (ja) | 1986-06-02 | 1987-05-29 | 音声処理装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9032774A Pending JPH09325790A (ja) | 1986-06-02 | 1997-01-30 | 音声処理方法および装置 |
Country Status (13)
Country | Link |
---|---|
US (1) | US4912766A (ja) |
EP (2) | EP0248609B1 (ja) |
JP (3) | JP2561850B2 (ja) |
KR (1) | KR950011963B1 (ja) |
AT (2) | ATE183009T1 (ja) |
CA (1) | CA1310418C (ja) |
DE (2) | DE3752288T2 (ja) |
DK (1) | DK171426B1 (ja) |
ES (1) | ES2056819T3 (ja) |
FI (1) | FI92113C (ja) |
GB (1) | GB8613327D0 (ja) |
HK (1) | HK137096A (ja) |
WO (1) | WO1987007750A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002528753A (ja) * | 1998-10-16 | 2002-09-03 | ドラゴン システムズ ユーケー リサーチ アンド デヴェロプメント リミテッド | スピーチプロセシング |
US9390709B2 (en) | 2012-09-25 | 2016-07-12 | Seiko Epson Corporation | Voice recognition device and method, and semiconductor integrated circuit device |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK510275A (da) * | 1975-11-12 | 1977-05-13 | Struers K S | Elektrolytisk polerapparat |
JPH02189600A (ja) * | 1989-01-19 | 1990-07-25 | Sanyo Electric Co Ltd | 音声認識装置 |
US5333155A (en) * | 1991-04-25 | 1994-07-26 | Rohde & Schwarz Gmbh & Co. Kg | Method and system for transmitting digital audio signals from recording studios to the various master stations of a broadcasting network |
US6134521A (en) * | 1994-02-17 | 2000-10-17 | Motorola, Inc. | Method and apparatus for mitigating audio degradation in a communication system |
AU720511B2 (en) * | 1995-08-24 | 2000-06-01 | British Telecommunications Public Limited Company | Pattern recognition |
US5774841A (en) * | 1995-09-20 | 1998-06-30 | The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration | Real-time reconfigurable adaptive speech recognition command and control apparatus and method |
US7630895B2 (en) * | 2000-01-21 | 2009-12-08 | At&T Intellectual Property I, L.P. | Speaker verification method |
US6012027A (en) * | 1997-05-27 | 2000-01-04 | Ameritech Corporation | Criteria for usable repetitions of an utterance during speech reference enrollment |
US6353809B2 (en) * | 1997-06-06 | 2002-03-05 | Olympus Optical, Ltd. | Speech recognition with text generation from portions of voice data preselected by manual-input commands |
US6188986B1 (en) | 1998-01-02 | 2001-02-13 | Vos Systems, Inc. | Voice activated switch method and apparatus |
DE19960161C2 (de) * | 1998-12-15 | 2002-03-28 | Daimler Chrysler Ag | Verfahren zur Detektion von sprachmodulierten Sendungen |
FI118359B (fi) * | 1999-01-18 | 2007-10-15 | Nokia Corp | Menetelmä puheentunnistuksessa ja puheentunnistuslaite ja langaton viestin |
US6519559B1 (en) * | 1999-07-29 | 2003-02-11 | Intel Corporation | Apparatus and method for the enhancement of signals |
US6910011B1 (en) | 1999-08-16 | 2005-06-21 | Haman Becker Automotive Systems - Wavemakers, Inc. | Noisy acoustic signal enhancement |
US7117149B1 (en) | 1999-08-30 | 2006-10-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Sound source classification |
US6594630B1 (en) * | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
US7155385B2 (en) | 2002-05-16 | 2006-12-26 | Comerica Bank, As Administrative Agent | Automatic gain control for adjusting gain during non-speech portions |
KR100841096B1 (ko) * | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7895036B2 (en) | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
US7949522B2 (en) | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US8073689B2 (en) | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
US7885420B2 (en) | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US7725315B2 (en) | 2003-02-21 | 2010-05-25 | Qnx Software Systems (Wavemakers), Inc. | Minimization of transient noises in a voice signal |
US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
AU2003901539A0 (en) * | 2003-03-28 | 2003-05-01 | Cochlear Limited | Noise floor estimator |
US7949520B2 (en) | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US7716046B2 (en) | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US7680652B2 (en) | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8306821B2 (en) | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US8543390B2 (en) | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US8170879B2 (en) | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US8284947B2 (en) | 2004-12-01 | 2012-10-09 | Qnx Software Systems Limited | Reverberation estimation and suppression system |
US20060146652A1 (en) * | 2005-01-03 | 2006-07-06 | Sdi Technologies, Inc. | Sunset timer |
US8027833B2 (en) | 2005-05-09 | 2011-09-27 | Qnx Software Systems Co. | System for suppressing passing tire hiss |
US8170875B2 (en) | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
US8311819B2 (en) | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
US7117075B1 (en) * | 2005-08-15 | 2006-10-03 | Report On Board Llc | Driver activity and vehicle operation logging and reporting |
US7995713B2 (en) * | 2006-04-03 | 2011-08-09 | Agere Systems Inc. | Voice-identification-based signal processing for multiple-talker applications |
US7844453B2 (en) | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
US8326620B2 (en) | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
US8335685B2 (en) | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
US8904400B2 (en) | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
US8209514B2 (en) | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
DE102010041435A1 (de) * | 2010-09-27 | 2012-03-29 | Siemens Medical Instruments Pte. Ltd. | Verfahren zum Rekonstruieren eines Sprachsignals und Hörvorrichtung |
WO2013061252A2 (en) | 2011-10-24 | 2013-05-02 | Cochlear Limited | Post-filter common-gain determination |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56159400U (ja) * | 1980-04-24 | 1981-11-27 | ||
JPS5984300A (ja) * | 1982-11-08 | 1984-05-15 | 株式会社日立製作所 | 音声区間検出回路 |
JPS6063600A (ja) * | 1983-08-26 | 1985-04-11 | 日本電気株式会社 | 可変閾値型音声検出器 |
JPS6085628A (ja) * | 1983-10-15 | 1985-05-15 | Fujitsu Ten Ltd | 通信装置 |
JPS60254100A (ja) * | 1984-05-30 | 1985-12-14 | 沖電気工業株式会社 | 音声認識方式 |
JPS6195398A (ja) * | 1984-10-17 | 1986-05-14 | 株式会社東芝 | 音声認識装置 |
JPS61113100A (ja) * | 1984-11-08 | 1986-05-30 | ヤマハ株式会社 | 音声パラメ−タ検出装置 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3411153A (en) * | 1964-10-12 | 1968-11-12 | Philco Ford Corp | Plural-signal analog-to-digital conversion system |
US4000369A (en) * | 1974-12-05 | 1976-12-28 | Rockwell International Corporation | Analog signal channel equalization with signal-in-noise embodiment |
US4032710A (en) * | 1975-03-10 | 1977-06-28 | Threshold Technology, Inc. | Word boundary detector for speech recognition equipment |
CA1056504A (en) * | 1975-04-02 | 1979-06-12 | Visvaldis A. Vitols | Keyword detection in continuous speech using continuous asynchronous correlation |
US4052568A (en) * | 1976-04-23 | 1977-10-04 | Communications Satellite Corporation | Digital voice switch |
FR2451680A1 (fr) * | 1979-03-12 | 1980-10-10 | Soumagne Joel | Discriminateur parole/silence pour interpolation de la parole |
US4262355A (en) * | 1979-05-11 | 1981-04-14 | Rca Corporation | System for limiting intermodulation distortion of talkspurt signals |
US4292470A (en) * | 1979-09-10 | 1981-09-29 | Interstate Electronics Corp. | Audio signal recognition computer |
JPS56126896A (en) * | 1980-03-10 | 1981-10-05 | Nippon Electric Co | Voice recognizing system |
US4352957A (en) * | 1980-03-17 | 1982-10-05 | Storage Technology Corporation | Speech detector circuit with associated gain control for a tasi system |
JPS57177197A (en) * | 1981-04-24 | 1982-10-30 | Hitachi Ltd | Pick-up system for sound section |
JPS57178299A (en) * | 1981-04-27 | 1982-11-02 | Kyosan Electric Mfg | Recognition pattern preparation system |
US4410763A (en) * | 1981-06-09 | 1983-10-18 | Northern Telecom Limited | Speech detector |
US4489434A (en) * | 1981-10-05 | 1984-12-18 | Exxon Corporation | Speech recognition method and apparatus |
JPS59111697A (ja) * | 1982-12-17 | 1984-06-27 | 株式会社日立製作所 | 音声認識方式 |
US4627091A (en) * | 1983-04-01 | 1986-12-02 | Rca Corporation | Low-energy-content voice detection apparatus |
US4696040A (en) * | 1983-10-13 | 1987-09-22 | Texas Instruments Incorporated | Speech analysis/synthesis system with energy normalization and silence suppression |
US4821325A (en) * | 1984-11-08 | 1989-04-11 | American Telephone And Telegraph Company, At&T Bell Laboratories | Endpoint detector |
FR2576472B1 (fr) * | 1985-01-22 | 1988-02-12 | Alcatel Thomson Faisceaux | Procede et dispositif de commande automatique de gain d'un recepteur en acces multiple a repartition temporelle |
JPH0673079B2 (ja) * | 1985-03-29 | 1994-09-14 | 沖電気工業株式会社 | 音声区間検出回路 |
JPH06105394B2 (ja) * | 1986-03-19 | 1994-12-21 | 株式会社東芝 | 音声認識方式 |
-
1986
- 1986-06-02 GB GB868613327A patent/GB8613327D0/en active Pending
-
1987
- 1987-05-29 EP EP87304793A patent/EP0248609B1/en not_active Expired - Lifetime
- 1987-05-29 DE DE3752288T patent/DE3752288T2/de not_active Expired - Fee Related
- 1987-05-29 DE DE3750314T patent/DE3750314T2/de not_active Expired - Fee Related
- 1987-05-29 WO PCT/GB1987/000376 patent/WO1987007750A1/en unknown
- 1987-05-29 KR KR1019880700114A patent/KR950011963B1/ko not_active IP Right Cessation
- 1987-05-29 EP EP93203407A patent/EP0750291B1/en not_active Expired - Lifetime
- 1987-05-29 AT AT93203407T patent/ATE183009T1/de not_active IP Right Cessation
- 1987-05-29 ES ES87304793T patent/ES2056819T3/es not_active Expired - Lifetime
- 1987-05-29 AT AT87304793T patent/ATE109582T1/de active
- 1987-05-29 JP JP62503341A patent/JP2561850B2/ja not_active Expired - Lifetime
- 1987-06-01 CA CA000538514A patent/CA1310418C/en not_active Expired - Fee Related
- 1987-06-01 US US07/055,966 patent/US4912766A/en not_active Expired - Lifetime
- 1987-06-02 FI FI872450A patent/FI92113C/fi not_active IP Right Cessation
- 1987-06-02 DK DK282587A patent/DK171426B1/da not_active IP Right Cessation
-
1993
- 1993-01-11 JP JP5019720A patent/JP2654503B2/ja not_active Expired - Fee Related
-
1996
- 1996-07-25 HK HK137096A patent/HK137096A/xx not_active IP Right Cessation
-
1997
- 1997-01-30 JP JP9032774A patent/JPH09325790A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56159400U (ja) * | 1980-04-24 | 1981-11-27 | ||
JPS5984300A (ja) * | 1982-11-08 | 1984-05-15 | 株式会社日立製作所 | 音声区間検出回路 |
JPS6063600A (ja) * | 1983-08-26 | 1985-04-11 | 日本電気株式会社 | 可変閾値型音声検出器 |
JPS6085628A (ja) * | 1983-10-15 | 1985-05-15 | Fujitsu Ten Ltd | 通信装置 |
JPS60254100A (ja) * | 1984-05-30 | 1985-12-14 | 沖電気工業株式会社 | 音声認識方式 |
JPS6195398A (ja) * | 1984-10-17 | 1986-05-14 | 株式会社東芝 | 音声認識装置 |
JPS61113100A (ja) * | 1984-11-08 | 1986-05-30 | ヤマハ株式会社 | 音声パラメ−タ検出装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002528753A (ja) * | 1998-10-16 | 2002-09-03 | ドラゴン システムズ ユーケー リサーチ アンド デヴェロプメント リミテッド | スピーチプロセシング |
JP4778613B2 (ja) * | 1998-10-16 | 2011-09-21 | ドラゴン システムズ ユーケー リサーチ アンド デヴェロプメント リミテッド | スピーチプロセシング |
US9390709B2 (en) | 2012-09-25 | 2016-07-12 | Seiko Epson Corporation | Voice recognition device and method, and semiconductor integrated circuit device |
Also Published As
Publication number | Publication date |
---|---|
EP0248609B1 (en) | 1994-08-03 |
ATE183009T1 (de) | 1999-08-15 |
KR880701435A (ko) | 1988-07-27 |
DE3750314D1 (de) | 1994-09-08 |
DE3750314T2 (de) | 1994-11-17 |
HK137096A (en) | 1996-08-02 |
EP0248609A1 (en) | 1987-12-09 |
US4912766A (en) | 1990-03-27 |
JP2561850B2 (ja) | 1996-12-11 |
FI92113B (fi) | 1994-06-15 |
FI872450A (fi) | 1987-12-03 |
FI92113C (fi) | 1994-09-26 |
CA1310418C (en) | 1992-11-17 |
DK282587A (da) | 1987-12-03 |
WO1987007750A1 (en) | 1987-12-17 |
JP2654503B2 (ja) | 1997-09-17 |
EP0750291A1 (en) | 1996-12-27 |
ATE109582T1 (de) | 1994-08-15 |
FI872450A0 (fi) | 1987-06-02 |
EP0750291B1 (en) | 1999-08-04 |
ES2056819T3 (es) | 1994-10-16 |
JPS63503487A (ja) | 1988-12-15 |
JPH09325790A (ja) | 1997-12-16 |
DE3752288T2 (de) | 2000-07-06 |
GB8613327D0 (en) | 1986-07-09 |
KR950011963B1 (ko) | 1995-10-12 |
DK171426B1 (da) | 1996-10-21 |
DE3752288D1 (de) | 1999-09-09 |
DK282587D0 (da) | 1987-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2654503B2 (ja) | 無線端末装置 | |
US5146504A (en) | Speech selective automatic gain control | |
US4633499A (en) | Speech recognition system | |
US6411928B2 (en) | Apparatus and method for recognizing voice with reduced sensitivity to ambient noise | |
US4455676A (en) | Speech processing system including an amplitude level control circuit for digital processing | |
US20040236571A1 (en) | Subband method and apparatus for determining speech pauses adapting to background noise variation | |
US20080228477A1 (en) | Method and Device For Processing a Voice Signal For Robust Speech Recognition | |
KR101516589B1 (ko) | 이동통신단말기 및 그의 음성신호 처리 방법 | |
US5630014A (en) | Gain controller with automatic adjustment using integration energy values | |
JPH027099A (ja) | 過大音声検出装置 | |
JPH0635498A (ja) | 音声認識装置及び方法 | |
KR100294920B1 (ko) | 심한 잡음 환경에서 이동 전화기의 음성인식을 위한 음성검출방법 및 장치 | |
KR100647291B1 (ko) | 음성의 특징을 이용한 음성 다이얼링 장치 및 방법 | |
JPH08298698A (ja) | 環境音分析装置 | |
KR100278640B1 (ko) | 이동 전화기를 위한 음성 다이얼링 장치 및방법 | |
JPS59105697A (ja) | 音声認識装置 | |
JPH10304023A (ja) | 電話機 | |
JPH0946400A (ja) | 音声出力レベルの自動調整機能を備えた音声入出 力装置 | |
JPS60200299A (ja) | 音声認識装置 | |
JPS6172299A (ja) | 音声認識装置 | |
JPH04369697A (ja) | 音声認識装置 | |
JPH04340598A (ja) | 音声認識装置 | |
JPH09297596A (ja) | 音声認識装置 | |
JPS60166998A (ja) | 単語音声認識装置 | |
JPH09204194A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |