JPS63226698A - 不特定話者電話音声認識装置 - Google Patents
不特定話者電話音声認識装置Info
- Publication number
- JPS63226698A JPS63226698A JP62060792A JP6079287A JPS63226698A JP S63226698 A JPS63226698 A JP S63226698A JP 62060792 A JP62060792 A JP 62060792A JP 6079287 A JP6079287 A JP 6079287A JP S63226698 A JPS63226698 A JP S63226698A
- Authority
- JP
- Japan
- Prior art keywords
- telephone
- input
- section
- voice
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001629 suppression Effects 0.000 claims description 31
- 230000005540 biological transmission Effects 0.000 claims description 20
- 238000000605 extraction Methods 0.000 description 20
- 238000001514 detection method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 230000033228 biological regulation Effects 0.000 description 2
- 230000008602 contraction Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000002747 voluntary effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は電話機より電話回線を介して入力される不特定
な話者の音声を認識する装置の改良に関するものである
。
な話者の音声を認識する装置の改良に関するものである
。
(従来の技術)
従来のこのような分野の技術としては、村田隆憲 他著
「不特定話者電話音声認識技術の開発」(沖電気研究開
発 第129号VOL、53 No、1.昭和61年1
月1日発行、P79〜8B)に開示されたものがある。
「不特定話者電話音声認識技術の開発」(沖電気研究開
発 第129号VOL、53 No、1.昭和61年1
月1日発行、P79〜8B)に開示されたものがある。
以下、これに沿って説明する。
第2図は従来の不特定話者電話音声認識装置の一例を示
すもので、図中、1は特徴抽出部、2は音声区間検出部
、3はマツチング部、4は標準パターン格納部、5は認
識判定部である。
すもので、図中、1は特徴抽出部、2は音声区間検出部
、3はマツチング部、4は標準パターン格納部、5は認
識判定部である。
前記装置において、図示しない電話機より電話回線を介
して送出された音声信号は、まず、特徴抽出部1に入力
される。特徴抽出部1は電話回線の標準的な伝送周波数
帯域を通過帯域とした帯域フィルタと、該伝送周波数帯
域を多数の帯域に分割した多数の帯域フィルタとから構
成されており、入力音声中の前記伝送周波数帯域外の不
要な信号を除去した後、各周波数成分毎に分析し、時系
列化する。なお、前記各帯域フィルタはアナログフィル
タ又はディジタル信号処理によるフィルタのいずれかに
より構成される。
して送出された音声信号は、まず、特徴抽出部1に入力
される。特徴抽出部1は電話回線の標準的な伝送周波数
帯域を通過帯域とした帯域フィルタと、該伝送周波数帯
域を多数の帯域に分割した多数の帯域フィルタとから構
成されており、入力音声中の前記伝送周波数帯域外の不
要な信号を除去した後、各周波数成分毎に分析し、時系
列化する。なお、前記各帯域フィルタはアナログフィル
タ又はディジタル信号処理によるフィルタのいずれかに
より構成される。
前記特徴抽出部1の分析出力は音声区間検出部2に送出
され、入力音声区間が切出される。入力音声区間の切出
し方法としては種々あるが、ここでは第3図に示すよう
に入力音声のレベル6が予め設定した始端閾値LSを所
定時間T1以上越えたならば、該始端閾値LSを最初に
越えた時点t1を音声始端とし、音圧レベルが予め設定
した終端閾値LEを所定時間T2以上下回ったならば、
その所定時間T2の最後の時点t2を音声終端とする。
され、入力音声区間が切出される。入力音声区間の切出
し方法としては種々あるが、ここでは第3図に示すよう
に入力音声のレベル6が予め設定した始端閾値LSを所
定時間T1以上越えたならば、該始端閾値LSを最初に
越えた時点t1を音声始端とし、音圧レベルが予め設定
した終端閾値LEを所定時間T2以上下回ったならば、
その所定時間T2の最後の時点t2を音声終端とする。
入力音声は音声区間が切出された後、線形又は非線形伸
縮により固定長の音声データに変換され、マツチング部
3に送出される。標準パターン格納部4には認識対象語
毎に標準パターンと呼ばれる入力音声との比較用パター
ンデータが数種類ずつ格納されており、これらのパター
ンは多数の話者が発声した音声データから平均及び修正
作業により作成されている。
縮により固定長の音声データに変換され、マツチング部
3に送出される。標準パターン格納部4には認識対象語
毎に標準パターンと呼ばれる入力音声との比較用パター
ンデータが数種類ずつ格納されており、これらのパター
ンは多数の話者が発声した音声データから平均及び修正
作業により作成されている。
入力音声データは標準パターン格納部4の各認識対象語
の標準パターンとマツチング部3でマツチングが行なわ
れ、その類似度が各々の標準パターンについて順次計算
される。認識判定部5はこれら各標準パターンに対する
類似度のうち、最も大きな値を有する認識対象語を認識
結果として出力する。
の標準パターンとマツチング部3でマツチングが行なわ
れ、その類似度が各々の標準パターンについて順次計算
される。認識判定部5はこれら各標準パターンに対する
類似度のうち、最も大きな値を有する認識対象語を認識
結果として出力する。
(発明が解決しようとする問題点)
現在、市場に出回っている電話機は多種多様であるが、
これらの電話機に対する通話品質の規制は通信機械工業
会の通話品質に関する自主規制があるのみである。従っ
て、前述した不特定話者電話音声認識装置に接続される
電話機の送話周波数特性には大きなバラツキが存在する
。
これらの電話機に対する通話品質の規制は通信機械工業
会の通話品質に関する自主規制があるのみである。従っ
て、前述した不特定話者電話音声認識装置に接続される
電話機の送話周波数特性には大きなバラツキが存在する
。
第4図は種々の電話機の送話周波数特性を示すものであ
るJ同図において、破線で示す特性7は現在最も普及、
している601型電話機の送話周波数特性であり、通常
、標準パターン作成に使用する音声データもこの電話機
から入力される。また、実線で示す特性8は高域の特性
が極端に良い他の電話機Aの送話周波数特性であり、ま
た、一点鎖線で示す特性9は低域及び中域の特性がフラ
ットな他の電話機Bの送話周波数特性である。
るJ同図において、破線で示す特性7は現在最も普及、
している601型電話機の送話周波数特性であり、通常
、標準パターン作成に使用する音声データもこの電話機
から入力される。また、実線で示す特性8は高域の特性
が極端に良い他の電話機Aの送話周波数特性であり、ま
た、一点鎖線で示す特性9は低域及び中域の特性がフラ
ットな他の電話機Bの送話周波数特性である。
これらの電話機AやBの送話周波数特性はマイクロフォ
ンの構造に起因するものと、スピーチネットワークIC
による特性変化に起因するものとがある。また、電話回
線は公衆電気通信設備の技術規準により、800HZ〜
3400Hzの範囲で使用することが義務づけられてい
るが、実際には、300Hz以下又は3400Hz以上
の音声も伝送され、特に高域の特性の良い電話機の場合
には無視することのできないレベルの音声が伝送される
。
ンの構造に起因するものと、スピーチネットワークIC
による特性変化に起因するものとがある。また、電話回
線は公衆電気通信設備の技術規準により、800HZ〜
3400Hzの範囲で使用することが義務づけられてい
るが、実際には、300Hz以下又は3400Hz以上
の音声も伝送され、特に高域の特性の良い電話機の場合
には無視することのできないレベルの音声が伝送される
。
前述した従来の不特定話者電話音声認識装置では、これ
らの周波数特性の大きく異なる電話機より入力された全
ての音声に対する標準パターンを予め用意しておかなけ
ればならず、その作成に時間を要し、また、該標準パタ
ーンを記憶させるメモリの容量が増加し、さらに認識に
要する時間が増大し、さ°らにまた、誤認識や類似度過
小によるリジェクトが多く発生するという問題点があっ
た。
らの周波数特性の大きく異なる電話機より入力された全
ての音声に対する標準パターンを予め用意しておかなけ
ればならず、その作成に時間を要し、また、該標準パタ
ーンを記憶させるメモリの容量が増加し、さらに認識に
要する時間が増大し、さ°らにまた、誤認識や類似度過
小によるリジェクトが多く発生するという問題点があっ
た。
本発明は前記問題点を除去し、少ない標準パターンを用
いて、あらゆる電話機から入力された音声を短い処理時
間で且つ高い認識率をもって認識し得る不特定話者電話
音声認識装置を提供することを目的とする。
いて、あらゆる電話機から入力された音声を短い処理時
間で且つ高い認識率をもって認識し得る不特定話者電話
音声認識装置を提供することを目的とする。
(問題点を解決するための手段)
本発明では前記問題点を解決するため、電話機より電話
回線を介して入力される不特定な話者の音声を認識する
不特定話者電話音声認識装置において、電話回線の標準
的な伝送周波数帯域より低い帯域における入力音声のレ
ベルを検出し予め設定した所定の値より大きい時に第1
の判定信号を出力する第1の判定手段と、電話回線の標
準的な伝送周波数帯域より高い帯域における入力音声の
レベルを検出し予め設定した所定の値より大きい時に第
2の判定信号を出力する第2の判定手段と、第1の判定
信号を受信した時のみ入力音声の前記低い帯域のレベル
を抑圧する第1の抑圧手段と、第2の判定信号を受信し
た時のみ入力音声の前記高い帯域のレベルを抑圧する第
2の抑圧手段とを設けた。
回線を介して入力される不特定な話者の音声を認識する
不特定話者電話音声認識装置において、電話回線の標準
的な伝送周波数帯域より低い帯域における入力音声のレ
ベルを検出し予め設定した所定の値より大きい時に第1
の判定信号を出力する第1の判定手段と、電話回線の標
準的な伝送周波数帯域より高い帯域における入力音声の
レベルを検出し予め設定した所定の値より大きい時に第
2の判定信号を出力する第2の判定手段と、第1の判定
信号を受信した時のみ入力音声の前記低い帯域のレベル
を抑圧する第1の抑圧手段と、第2の判定信号を受信し
た時のみ入力音声の前記高い帯域のレベルを抑圧する第
2の抑圧手段とを設けた。
(作 用)
本発明によれば、低域特性の良い電話機より入力された
音声はその低域における信号レベルが第1の判定手段に
よって検出され、その際、出力される第1の判定信号に
より第1の抑圧手段が動作し、音声中の低域のレベルが
下げられ、また、高域特性の良い電話機より入力された
音声はその高域における信号レベルが第2の判定手段に
よって検出され、その際、出力される第2の判定信号に
より第2の抑圧手段が動作し、音声中の高域のレベルが
下げられる。
音声はその低域における信号レベルが第1の判定手段に
よって検出され、その際、出力される第1の判定信号に
より第1の抑圧手段が動作し、音声中の低域のレベルが
下げられ、また、高域特性の良い電話機より入力された
音声はその高域における信号レベルが第2の判定手段に
よって検出され、その際、出力される第2の判定信号に
より第2の抑圧手段が動作し、音声中の高域のレベルが
下げられる。
(実施例)
第1図は本発明の不特定話者電話音声認識装置の一実施
例を示すもので、図中、従来例と同一構成部分は同一符
号をもって表わす。即ち、2は音声区間検出部、3はマ
ツチング部、4は標準パターン格納部、5は認識判定部
、10は入力音声特徴抽出部、20は電話機判定部であ
る。
例を示すもので、図中、従来例と同一構成部分は同一符
号をもって表わす。即ち、2は音声区間検出部、3はマ
ツチング部、4は標準パターン格納部、5は認識判定部
、10は入力音声特徴抽出部、20は電話機判定部であ
る。
図示しない電話機より電話回線を介して送出された入力
音声は、まず、入力音声特徴抽出部10及び電話機判定
部20に入力される。電話機判定部20は後述する如く
して音声入力に使用された電話機の周波数特性を検出・
判定し、その判定結果を入力音声特徴抽出部lOに送出
する。該入力音声特徴抽出部1Gは前記判定結果に基づ
いて、入力音声の周波数特性を後述するようにして変更
し又は変更せず、その特徴を分析し、結果を音声区間検
出部2に送出する。以下、音声区間検出部2.マツチン
グ部3.標準パターン格納部4及び認識判定部5におい
て、従来例と同様な音声認識処理が実行され、その2識
結果は上位装置(図示せず)に送出される。
音声は、まず、入力音声特徴抽出部10及び電話機判定
部20に入力される。電話機判定部20は後述する如く
して音声入力に使用された電話機の周波数特性を検出・
判定し、その判定結果を入力音声特徴抽出部lOに送出
する。該入力音声特徴抽出部1Gは前記判定結果に基づ
いて、入力音声の周波数特性を後述するようにして変更
し又は変更せず、その特徴を分析し、結果を音声区間検
出部2に送出する。以下、音声区間検出部2.マツチン
グ部3.標準パターン格納部4及び認識判定部5におい
て、従来例と同様な音声認識処理が実行され、その2識
結果は上位装置(図示せず)に送出される。
第5図は入力音声特徴抽出部10の詳細な構成を示すも
ので、帯域フィルタ11.帯域フィルタ群12.低域抑
圧部13及び高域抑圧部14からなっている。
ので、帯域フィルタ11.帯域フィルタ群12.低域抑
圧部13及び高域抑圧部14からなっている。
帯域フィルタ11は電話回線の標準的な伝送周波数帯域
を通過帯域とした周知のもので、第6図にその周波数特
性を示す。帯域フィルタ群12は前記電話回線の標準的
な伝送周波数帯域を多数の帯域に分割した多数の周知の
帯域フィルタ12−1.12−2.・・・・・・12−
nからなるもので、第7図に各帯域フィルタ12−1〜
12−nの周波数特性を示す。なお、従来の装置の特徴
抽出部1は該帯域フィルタ11及び帯域フィルタ群12
のみからなっている。
を通過帯域とした周知のもので、第6図にその周波数特
性を示す。帯域フィルタ群12は前記電話回線の標準的
な伝送周波数帯域を多数の帯域に分割した多数の周知の
帯域フィルタ12−1.12−2.・・・・・・12−
nからなるもので、第7図に各帯域フィルタ12−1〜
12−nの周波数特性を示す。なお、従来の装置の特徴
抽出部1は該帯域フィルタ11及び帯域フィルタ群12
のみからなっている。
低域抑圧部13は低域抑圧フィルタ13aとスイッチS
WIとを備え、常時は帯域フィルタ11の出力をそのま
ま高域抑圧部14に送出するが、電話機判定部20より
後述する第1の判定信号S1を受信した時のみ、スイッ
チSWIを切替え、帯域フィルタ11の出力を低域抑圧
フィルタ13Hに通した後、高域抑圧部14に送出する
。
WIとを備え、常時は帯域フィルタ11の出力をそのま
ま高域抑圧部14に送出するが、電話機判定部20より
後述する第1の判定信号S1を受信した時のみ、スイッ
チSWIを切替え、帯域フィルタ11の出力を低域抑圧
フィルタ13Hに通した後、高域抑圧部14に送出する
。
また、高域抑圧部14は高域抑圧フィルタ14aとスイ
ッチSW2とを備え、常時は低域抑圧部13の出力をそ
のまま帯域フィルタ群12に送出するが、電話機判定部
20より後述する第2の判定信号S2を受信した時のみ
、スイッチSW2を切替え、低域抑圧部13の出力を高
域抑圧フィルタ14aに通した後、帯域フィルタ群12
に送出する。
ッチSW2とを備え、常時は低域抑圧部13の出力をそ
のまま帯域フィルタ群12に送出するが、電話機判定部
20より後述する第2の判定信号S2を受信した時のみ
、スイッチSW2を切替え、低域抑圧部13の出力を高
域抑圧フィルタ14aに通した後、帯域フィルタ群12
に送出する。
第8図は低域抑圧フィルタ13a及び高域抑圧フィルタ
14aの周波数特性の一例を示すもので、図中、31は
低域抑圧フィルタ13aの特性、32は高域抑圧フィル
タ14aの特性を示す。
14aの周波数特性の一例を示すもので、図中、31は
低域抑圧フィルタ13aの特性、32は高域抑圧フィル
タ14aの特性を示す。
前記構成において、入力音声は帯域フィルタ11を介し
て低域抑圧部13に入力され、判定信号S1に従って低
域が抑圧され又は抑圧されずに高域抑圧部14に入力さ
れ、判定信号S2に従って高域が抑圧され又は抑圧され
ずに帯域フィルタ群12に入力され、ここで、各帯域フ
ィルタ12−1〜12−nにより各周波数成分毎に分析
され、信号CHI、CH2,・・・・・・CHnに時系
列化される。
て低域抑圧部13に入力され、判定信号S1に従って低
域が抑圧され又は抑圧されずに高域抑圧部14に入力さ
れ、判定信号S2に従って高域が抑圧され又は抑圧され
ずに帯域フィルタ群12に入力され、ここで、各帯域フ
ィルタ12−1〜12−nにより各周波数成分毎に分析
され、信号CHI、CH2,・・・・・・CHnに時系
列化される。
第9図は電話機判定部20の詳細な構成を示すもので、
低域判定部21及び高域判定部22からなっている。
低域判定部21及び高域判定部22からなっている。
低域判定部21は低域バンドパスフィルタ21aとレベ
ル検出回路21bとを備え、該レベル検出回路21bは
低域バンドパスフィルタ21aの出力信号を監視し、そ
のレベルが所定の閾値以上となった時のみ、第1の判定
信号S1を出力する。また、高域判定部22は高域バン
ドパスフィルタ22aとレベル検出回路22bとを備え
、該レベル検出回路22bは高域バンドパスフィルタ2
2aの出力信号を監視し、そのレベルが所定の閾値以上
となった時のみ、第2の判定信号S2を出力する。
ル検出回路21bとを備え、該レベル検出回路21bは
低域バンドパスフィルタ21aの出力信号を監視し、そ
のレベルが所定の閾値以上となった時のみ、第1の判定
信号S1を出力する。また、高域判定部22は高域バン
ドパスフィルタ22aとレベル検出回路22bとを備え
、該レベル検出回路22bは高域バンドパスフィルタ2
2aの出力信号を監視し、そのレベルが所定の閾値以上
となった時のみ、第2の判定信号S2を出力する。
第10図は低域バンドパスフィルタ21a及び高域バン
ドパスフィルタ22aの周波数特性の一例を示すもので
、図中、33は低域バンドパスフィルタ21aの特性、
34は高域バンドパスフィルタ22aの特性を示す。こ
こで、低域バンドパスフィルタ21aの中心周波数は入
力音声特徴抽出部10の帯域フィルタ群12の最も低い
中心周波数よりもさらに低い値に設定され、また、高域
バンドパスフィルタ22aの中心周波数は入力音声特徴
抽出部10の帯域フィルタ群12の最も高い中心周波数
よりもさらに高い値に設定される。
ドパスフィルタ22aの周波数特性の一例を示すもので
、図中、33は低域バンドパスフィルタ21aの特性、
34は高域バンドパスフィルタ22aの特性を示す。こ
こで、低域バンドパスフィルタ21aの中心周波数は入
力音声特徴抽出部10の帯域フィルタ群12の最も低い
中心周波数よりもさらに低い値に設定され、また、高域
バンドパスフィルタ22aの中心周波数は入力音声特徴
抽出部10の帯域フィルタ群12の最も高い中心周波数
よりもさらに高い値に設定される。
前記構成において、入力音声は低域バンドパスフィルタ
21a及び高域バンドパスフィルタ22aにそれぞれ入
力され、各々の通過帯域に対応する信号のみがレベル検
出回路21b及び22bにそれぞれ送出され判定され、
該判定結果に従って、判定信号S1及びS2が出力され
又は出力されないよう制御される。
21a及び高域バンドパスフィルタ22aにそれぞれ入
力され、各々の通過帯域に対応する信号のみがレベル検
出回路21b及び22bにそれぞれ送出され判定され、
該判定結果に従って、判定信号S1及びS2が出力され
又は出力されないよう制御される。
次に、入力音声特徴抽出部10及び電話機判定部20の
具体的な動作について説明する。
具体的な動作について説明する。
電話回線の着信前は入力音声特徴抽出部10の低域抑圧
部13及び高域抑圧部14内のスイッチSWI及びSW
2は直通側に接続されている。
部13及び高域抑圧部14内のスイッチSWI及びSW
2は直通側に接続されている。
電話回線が接続され、例えば高域特性の良い電話機より
音声が入力されると、電話機判定部20の高域判定部2
2内の高域バンドパスフィルタ22aから出力が現われ
、該出力が予め設定した閾値を超えると、レベル検出回
路22bは判定信号S2を出力する。
音声が入力されると、電話機判定部20の高域判定部2
2内の高域バンドパスフィルタ22aから出力が現われ
、該出力が予め設定した閾値を超えると、レベル検出回
路22bは判定信号S2を出力する。
判定信号S2が出力されると、高域抑圧部14のスイッ
チSW2が動作し、高域抑圧フィルタ14a側に接続さ
れる。以後、高域部分が抑圧された入力音声が帯域フィ
ルタ群12に入力され、以後、認識動作が行なわれる。
チSW2が動作し、高域抑圧フィルタ14a側に接続さ
れる。以後、高域部分が抑圧された入力音声が帯域フィ
ルタ群12に入力され、以後、認識動作が行なわれる。
第11図(a)〜(e)は高域特性の良い電話機及び標
準的な電話機を使用した場合の出力信号のようすを示す
もので、第11図(a)は高域特性の良い電話機の送話
周波数特性を示し、また、第11図(b)は前記特性を
有する電話機を使用した場合の従来の特徴抽出部1の出
力を示し、さらにまた、第11図(C)は前記特性を有
する電話機を使用した場合の入力音声特徴抽出部10の
出力を示す。また、第11図(d)は標準的な電話機の
送話周波数特性を示し、第11図(e)は該標準的な電
話機を使用した場合の入力音声特徴抽出部10の出力を
示す。
準的な電話機を使用した場合の出力信号のようすを示す
もので、第11図(a)は高域特性の良い電話機の送話
周波数特性を示し、また、第11図(b)は前記特性を
有する電話機を使用した場合の従来の特徴抽出部1の出
力を示し、さらにまた、第11図(C)は前記特性を有
する電話機を使用した場合の入力音声特徴抽出部10の
出力を示す。また、第11図(d)は標準的な電話機の
送話周波数特性を示し、第11図(e)は該標準的な電
話機を使用した場合の入力音声特徴抽出部10の出力を
示す。
第11図(b)に示すように従来の特徴抽出部1の出力
では大きな値を示しているチャンネルn付近、即ち高域
部分の出力値が、第11図(C)に示すように本発明の
入力音声特徴抽出部10の出力ではその値が抑圧され、
標準的な電話機の出力値を示す第11図(e)の値とほ
ぼ同様になっていることが理解される。
では大きな値を示しているチャンネルn付近、即ち高域
部分の出力値が、第11図(C)に示すように本発明の
入力音声特徴抽出部10の出力ではその値が抑圧され、
標準的な電話機の出力値を示す第11図(e)の値とほ
ぼ同様になっていることが理解される。
なお、低域特性の良い電話機から音声が入力された場合
も、同様に低域判定部21及び低域抑圧部13が動作し
、低域部分が抑圧された入力音声が帯域フィルタ群12
に入力され、以後、認識動作が行なわれる。
も、同様に低域判定部21及び低域抑圧部13が動作し
、低域部分が抑圧された入力音声が帯域フィルタ群12
に入力され、以後、認識動作が行なわれる。
(発明の効果)
以上説明したように本発明によれば、入力信号の低域及
び高域のレベルの判定手段と、入力信号の低域及び高域
のレベルの抑圧手段とを設けたため、標準的な通常の電
話機と送話周波数特性の大幅に異なる電話機より音声が
入力された場合であっても、これを検出し通常の電話機
より入力された音声と同等の特性に補正することができ
、従って、通常の電話機と送話周波数特性の異なった電
話機から入力された音声のための標準パターンを別途用
意する必要がなく、該標準パターンの作成に要する時間
や標準パターンの記憶容量を削減することができ、また
、認識処理時間を低減でき、さらにまた、誤認識及び類
似度過小によるリジェクトの低減等が期待できる。
び高域のレベルの判定手段と、入力信号の低域及び高域
のレベルの抑圧手段とを設けたため、標準的な通常の電
話機と送話周波数特性の大幅に異なる電話機より音声が
入力された場合であっても、これを検出し通常の電話機
より入力された音声と同等の特性に補正することができ
、従って、通常の電話機と送話周波数特性の異なった電
話機から入力された音声のための標準パターンを別途用
意する必要がなく、該標準パターンの作成に要する時間
や標準パターンの記憶容量を削減することができ、また
、認識処理時間を低減でき、さらにまた、誤認識及び類
似度過小によるリジェクトの低減等が期待できる。
第1図は本発明の不特定話者電話音声認識装置の一実施
例を示す構成図、第2図は従来の不特定話者電話音声認
識装置の一例を示す構成図、第3図は音声区間の切出し
のようすを示す説明図、第4図は種々の電話機の送話周
波数特性を示すグラフ、第5図は入力音声特徴抽出部の
詳細な構成を示すブロック図、第6図は帯域フィルタの
周波数特性を示すグラフ、第7図は帯域フィルタ群の各
フィルタの周波数特性を示すグラフ、第8図は低域抑圧
フィルタ及び高域抑圧フィルタの周波数特性の一例を示
すグラフ、第9図は電話機判定部の詳細な構成を示すブ
ロック図、第10図は低域バンドパスフィルタ及び高域
バンドパスフィルタの周波数特性の一例を示すグラフ、
第11図(a)〜(e)は高域特性の良い電話機及び標
準的な電話機を使用した場合の出力信号のようすを示す
説明図である。 2・・・音声区間検出部、3・・・マツチング部、4・
・・標準パターン格納部、5・・・認識判定部、10・
・・入力音声特徴抽出部、13・・・低域抑圧部、14
・・・高域抑圧部、20・・・電話機判定部、21・・
・低域判定部、22・・・高域判定部。
例を示す構成図、第2図は従来の不特定話者電話音声認
識装置の一例を示す構成図、第3図は音声区間の切出し
のようすを示す説明図、第4図は種々の電話機の送話周
波数特性を示すグラフ、第5図は入力音声特徴抽出部の
詳細な構成を示すブロック図、第6図は帯域フィルタの
周波数特性を示すグラフ、第7図は帯域フィルタ群の各
フィルタの周波数特性を示すグラフ、第8図は低域抑圧
フィルタ及び高域抑圧フィルタの周波数特性の一例を示
すグラフ、第9図は電話機判定部の詳細な構成を示すブ
ロック図、第10図は低域バンドパスフィルタ及び高域
バンドパスフィルタの周波数特性の一例を示すグラフ、
第11図(a)〜(e)は高域特性の良い電話機及び標
準的な電話機を使用した場合の出力信号のようすを示す
説明図である。 2・・・音声区間検出部、3・・・マツチング部、4・
・・標準パターン格納部、5・・・認識判定部、10・
・・入力音声特徴抽出部、13・・・低域抑圧部、14
・・・高域抑圧部、20・・・電話機判定部、21・・
・低域判定部、22・・・高域判定部。
Claims (1)
- 【特許請求の範囲】 電話機より電話回線を介して入力される不特定な話者の
音声を認識する不特定話者電話音声認識装置において、 電話回線の標準的な伝送周波数帯域より低い帯域におけ
る入力音声のレベルを検出し予め設定した所定の値より
大きい時に第1の判定信号を出力する第1の判定手段と
、 電話回線の標準的な伝送周波数帯域より高い帯域におけ
る入力音声のレベルを検出し予め設定した所定の値より
大きい時に第2の判定信号を出力する第2の判定手段と
、 第1の判定信号を受信した時のみ入力音声の前記低い帯
域のレベルを抑圧する第1の抑圧手段と、 第2の判定信号を受信した時のみ入力音声の前記高い帯
域のレベルを抑圧する第2の抑圧手段とを設けた ことを特徴とする不特定話者電話音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62060792A JPS63226698A (ja) | 1987-03-16 | 1987-03-16 | 不特定話者電話音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62060792A JPS63226698A (ja) | 1987-03-16 | 1987-03-16 | 不特定話者電話音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63226698A true JPS63226698A (ja) | 1988-09-21 |
Family
ID=13152510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62060792A Pending JPS63226698A (ja) | 1987-03-16 | 1987-03-16 | 不特定話者電話音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63226698A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02193441A (ja) * | 1989-01-20 | 1990-07-31 | Tokyo Electric Power Co Inc:The | 電話装置 |
JP4810044B2 (ja) * | 2000-01-27 | 2011-11-09 | ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー | 2つのスイッチオフ規準を持つ音声検出装置 |
-
1987
- 1987-03-16 JP JP62060792A patent/JPS63226698A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02193441A (ja) * | 1989-01-20 | 1990-07-31 | Tokyo Electric Power Co Inc:The | 電話装置 |
JP4810044B2 (ja) * | 2000-01-27 | 2011-11-09 | ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー | 2つのスイッチオフ規準を持つ音声検出装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6826525B2 (en) | Method and device for detecting a transient in a discrete-time audio signal | |
US5717772A (en) | Method and apparatus for suppressing acoustic feedback in an audio system | |
US20050259834A1 (en) | Voice controlled system and method | |
CA2485644A1 (en) | Voice activity detection | |
CN115348507A (zh) | 脉冲噪声抑制方法、系统、可读存储介质及计算机设备 | |
JPS63226698A (ja) | 不特定話者電話音声認識装置 | |
JP2570603B2 (ja) | 音声信号伝送装置およびノイズ抑圧装置 | |
US11490198B1 (en) | Single-microphone wind detection for audio device | |
EP0545596B1 (en) | A deviation limiting transmission circuit | |
JPH06289898A (ja) | 音声信号処理装置 | |
US5319801A (en) | Seamless frequency hopping system | |
JP2859634B2 (ja) | 雑音除去装置 | |
US5930308A (en) | Method and apparatus for detecting signaling tones in wide-band digitized cellular-telephone signals | |
US20020141568A1 (en) | Dual threshold correlator | |
KR20040082756A (ko) | 비음성 제거에 의한 음성 추출 방법 | |
WO1993009531A1 (en) | Processing of electrical and audio signals | |
CN108156307B (zh) | 语音处理的方法以及语音通讯装置 | |
JP2833879B2 (ja) | 帯域内一周波信号検出方法および装置 | |
SU1246407A1 (ru) | Громкоговор щее устройство,управл емое голосом | |
JPH0110039Y2 (ja) | ||
JPS649785B2 (ja) | ||
JP2606167B2 (ja) | 電話機 | |
JPH09292894A (ja) | 音声認識方法及び装置 | |
JPH04134399A (ja) | 音声認識装置 | |
EP1217607A1 (en) | Voice/voiceless frame judging device and judging method therefor |