JPS63226698A - 不特定話者電話音声認識装置 - Google Patents

不特定話者電話音声認識装置

Info

Publication number
JPS63226698A
JPS63226698A JP62060792A JP6079287A JPS63226698A JP S63226698 A JPS63226698 A JP S63226698A JP 62060792 A JP62060792 A JP 62060792A JP 6079287 A JP6079287 A JP 6079287A JP S63226698 A JPS63226698 A JP S63226698A
Authority
JP
Japan
Prior art keywords
telephone
input
section
voice
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62060792A
Other languages
English (en)
Inventor
松下 満次
勝美 高橋
矢端 基之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP62060792A priority Critical patent/JPS63226698A/ja
Publication of JPS63226698A publication Critical patent/JPS63226698A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は電話機より電話回線を介して入力される不特定
な話者の音声を認識する装置の改良に関するものである
(従来の技術) 従来のこのような分野の技術としては、村田隆憲 他著
「不特定話者電話音声認識技術の開発」(沖電気研究開
発 第129号VOL、53 No、1.昭和61年1
月1日発行、P79〜8B)に開示されたものがある。
以下、これに沿って説明する。
第2図は従来の不特定話者電話音声認識装置の一例を示
すもので、図中、1は特徴抽出部、2は音声区間検出部
、3はマツチング部、4は標準パターン格納部、5は認
識判定部である。
前記装置において、図示しない電話機より電話回線を介
して送出された音声信号は、まず、特徴抽出部1に入力
される。特徴抽出部1は電話回線の標準的な伝送周波数
帯域を通過帯域とした帯域フィルタと、該伝送周波数帯
域を多数の帯域に分割した多数の帯域フィルタとから構
成されており、入力音声中の前記伝送周波数帯域外の不
要な信号を除去した後、各周波数成分毎に分析し、時系
列化する。なお、前記各帯域フィルタはアナログフィル
タ又はディジタル信号処理によるフィルタのいずれかに
より構成される。
前記特徴抽出部1の分析出力は音声区間検出部2に送出
され、入力音声区間が切出される。入力音声区間の切出
し方法としては種々あるが、ここでは第3図に示すよう
に入力音声のレベル6が予め設定した始端閾値LSを所
定時間T1以上越えたならば、該始端閾値LSを最初に
越えた時点t1を音声始端とし、音圧レベルが予め設定
した終端閾値LEを所定時間T2以上下回ったならば、
その所定時間T2の最後の時点t2を音声終端とする。
入力音声は音声区間が切出された後、線形又は非線形伸
縮により固定長の音声データに変換され、マツチング部
3に送出される。標準パターン格納部4には認識対象語
毎に標準パターンと呼ばれる入力音声との比較用パター
ンデータが数種類ずつ格納されており、これらのパター
ンは多数の話者が発声した音声データから平均及び修正
作業により作成されている。
入力音声データは標準パターン格納部4の各認識対象語
の標準パターンとマツチング部3でマツチングが行なわ
れ、その類似度が各々の標準パターンについて順次計算
される。認識判定部5はこれら各標準パターンに対する
類似度のうち、最も大きな値を有する認識対象語を認識
結果として出力する。
(発明が解決しようとする問題点) 現在、市場に出回っている電話機は多種多様であるが、
これらの電話機に対する通話品質の規制は通信機械工業
会の通話品質に関する自主規制があるのみである。従っ
て、前述した不特定話者電話音声認識装置に接続される
電話機の送話周波数特性には大きなバラツキが存在する
第4図は種々の電話機の送話周波数特性を示すものであ
るJ同図において、破線で示す特性7は現在最も普及、
している601型電話機の送話周波数特性であり、通常
、標準パターン作成に使用する音声データもこの電話機
から入力される。また、実線で示す特性8は高域の特性
が極端に良い他の電話機Aの送話周波数特性であり、ま
た、一点鎖線で示す特性9は低域及び中域の特性がフラ
ットな他の電話機Bの送話周波数特性である。
これらの電話機AやBの送話周波数特性はマイクロフォ
ンの構造に起因するものと、スピーチネットワークIC
による特性変化に起因するものとがある。また、電話回
線は公衆電気通信設備の技術規準により、800HZ〜
3400Hzの範囲で使用することが義務づけられてい
るが、実際には、300Hz以下又は3400Hz以上
の音声も伝送され、特に高域の特性の良い電話機の場合
には無視することのできないレベルの音声が伝送される
前述した従来の不特定話者電話音声認識装置では、これ
らの周波数特性の大きく異なる電話機より入力された全
ての音声に対する標準パターンを予め用意しておかなけ
ればならず、その作成に時間を要し、また、該標準パタ
ーンを記憶させるメモリの容量が増加し、さらに認識に
要する時間が増大し、さ°らにまた、誤認識や類似度過
小によるリジェクトが多く発生するという問題点があっ
た。
本発明は前記問題点を除去し、少ない標準パターンを用
いて、あらゆる電話機から入力された音声を短い処理時
間で且つ高い認識率をもって認識し得る不特定話者電話
音声認識装置を提供することを目的とする。
(問題点を解決するための手段) 本発明では前記問題点を解決するため、電話機より電話
回線を介して入力される不特定な話者の音声を認識する
不特定話者電話音声認識装置において、電話回線の標準
的な伝送周波数帯域より低い帯域における入力音声のレ
ベルを検出し予め設定した所定の値より大きい時に第1
の判定信号を出力する第1の判定手段と、電話回線の標
準的な伝送周波数帯域より高い帯域における入力音声の
レベルを検出し予め設定した所定の値より大きい時に第
2の判定信号を出力する第2の判定手段と、第1の判定
信号を受信した時のみ入力音声の前記低い帯域のレベル
を抑圧する第1の抑圧手段と、第2の判定信号を受信し
た時のみ入力音声の前記高い帯域のレベルを抑圧する第
2の抑圧手段とを設けた。
(作 用) 本発明によれば、低域特性の良い電話機より入力された
音声はその低域における信号レベルが第1の判定手段に
よって検出され、その際、出力される第1の判定信号に
より第1の抑圧手段が動作し、音声中の低域のレベルが
下げられ、また、高域特性の良い電話機より入力された
音声はその高域における信号レベルが第2の判定手段に
よって検出され、その際、出力される第2の判定信号に
より第2の抑圧手段が動作し、音声中の高域のレベルが
下げられる。
(実施例) 第1図は本発明の不特定話者電話音声認識装置の一実施
例を示すもので、図中、従来例と同一構成部分は同一符
号をもって表わす。即ち、2は音声区間検出部、3はマ
ツチング部、4は標準パターン格納部、5は認識判定部
、10は入力音声特徴抽出部、20は電話機判定部であ
る。
図示しない電話機より電話回線を介して送出された入力
音声は、まず、入力音声特徴抽出部10及び電話機判定
部20に入力される。電話機判定部20は後述する如く
して音声入力に使用された電話機の周波数特性を検出・
判定し、その判定結果を入力音声特徴抽出部lOに送出
する。該入力音声特徴抽出部1Gは前記判定結果に基づ
いて、入力音声の周波数特性を後述するようにして変更
し又は変更せず、その特徴を分析し、結果を音声区間検
出部2に送出する。以下、音声区間検出部2.マツチン
グ部3.標準パターン格納部4及び認識判定部5におい
て、従来例と同様な音声認識処理が実行され、その2識
結果は上位装置(図示せず)に送出される。
第5図は入力音声特徴抽出部10の詳細な構成を示すも
ので、帯域フィルタ11.帯域フィルタ群12.低域抑
圧部13及び高域抑圧部14からなっている。
帯域フィルタ11は電話回線の標準的な伝送周波数帯域
を通過帯域とした周知のもので、第6図にその周波数特
性を示す。帯域フィルタ群12は前記電話回線の標準的
な伝送周波数帯域を多数の帯域に分割した多数の周知の
帯域フィルタ12−1.12−2.・・・・・・12−
nからなるもので、第7図に各帯域フィルタ12−1〜
12−nの周波数特性を示す。なお、従来の装置の特徴
抽出部1は該帯域フィルタ11及び帯域フィルタ群12
のみからなっている。
低域抑圧部13は低域抑圧フィルタ13aとスイッチS
WIとを備え、常時は帯域フィルタ11の出力をそのま
ま高域抑圧部14に送出するが、電話機判定部20より
後述する第1の判定信号S1を受信した時のみ、スイッ
チSWIを切替え、帯域フィルタ11の出力を低域抑圧
フィルタ13Hに通した後、高域抑圧部14に送出する
また、高域抑圧部14は高域抑圧フィルタ14aとスイ
ッチSW2とを備え、常時は低域抑圧部13の出力をそ
のまま帯域フィルタ群12に送出するが、電話機判定部
20より後述する第2の判定信号S2を受信した時のみ
、スイッチSW2を切替え、低域抑圧部13の出力を高
域抑圧フィルタ14aに通した後、帯域フィルタ群12
に送出する。
第8図は低域抑圧フィルタ13a及び高域抑圧フィルタ
14aの周波数特性の一例を示すもので、図中、31は
低域抑圧フィルタ13aの特性、32は高域抑圧フィル
タ14aの特性を示す。
前記構成において、入力音声は帯域フィルタ11を介し
て低域抑圧部13に入力され、判定信号S1に従って低
域が抑圧され又は抑圧されずに高域抑圧部14に入力さ
れ、判定信号S2に従って高域が抑圧され又は抑圧され
ずに帯域フィルタ群12に入力され、ここで、各帯域フ
ィルタ12−1〜12−nにより各周波数成分毎に分析
され、信号CHI、CH2,・・・・・・CHnに時系
列化される。
第9図は電話機判定部20の詳細な構成を示すもので、
低域判定部21及び高域判定部22からなっている。
低域判定部21は低域バンドパスフィルタ21aとレベ
ル検出回路21bとを備え、該レベル検出回路21bは
低域バンドパスフィルタ21aの出力信号を監視し、そ
のレベルが所定の閾値以上となった時のみ、第1の判定
信号S1を出力する。また、高域判定部22は高域バン
ドパスフィルタ22aとレベル検出回路22bとを備え
、該レベル検出回路22bは高域バンドパスフィルタ2
2aの出力信号を監視し、そのレベルが所定の閾値以上
となった時のみ、第2の判定信号S2を出力する。
第10図は低域バンドパスフィルタ21a及び高域バン
ドパスフィルタ22aの周波数特性の一例を示すもので
、図中、33は低域バンドパスフィルタ21aの特性、
34は高域バンドパスフィルタ22aの特性を示す。こ
こで、低域バンドパスフィルタ21aの中心周波数は入
力音声特徴抽出部10の帯域フィルタ群12の最も低い
中心周波数よりもさらに低い値に設定され、また、高域
バンドパスフィルタ22aの中心周波数は入力音声特徴
抽出部10の帯域フィルタ群12の最も高い中心周波数
よりもさらに高い値に設定される。
前記構成において、入力音声は低域バンドパスフィルタ
21a及び高域バンドパスフィルタ22aにそれぞれ入
力され、各々の通過帯域に対応する信号のみがレベル検
出回路21b及び22bにそれぞれ送出され判定され、
該判定結果に従って、判定信号S1及びS2が出力され
又は出力されないよう制御される。
次に、入力音声特徴抽出部10及び電話機判定部20の
具体的な動作について説明する。
電話回線の着信前は入力音声特徴抽出部10の低域抑圧
部13及び高域抑圧部14内のスイッチSWI及びSW
2は直通側に接続されている。
電話回線が接続され、例えば高域特性の良い電話機より
音声が入力されると、電話機判定部20の高域判定部2
2内の高域バンドパスフィルタ22aから出力が現われ
、該出力が予め設定した閾値を超えると、レベル検出回
路22bは判定信号S2を出力する。
判定信号S2が出力されると、高域抑圧部14のスイッ
チSW2が動作し、高域抑圧フィルタ14a側に接続さ
れる。以後、高域部分が抑圧された入力音声が帯域フィ
ルタ群12に入力され、以後、認識動作が行なわれる。
第11図(a)〜(e)は高域特性の良い電話機及び標
準的な電話機を使用した場合の出力信号のようすを示す
もので、第11図(a)は高域特性の良い電話機の送話
周波数特性を示し、また、第11図(b)は前記特性を
有する電話機を使用した場合の従来の特徴抽出部1の出
力を示し、さらにまた、第11図(C)は前記特性を有
する電話機を使用した場合の入力音声特徴抽出部10の
出力を示す。また、第11図(d)は標準的な電話機の
送話周波数特性を示し、第11図(e)は該標準的な電
話機を使用した場合の入力音声特徴抽出部10の出力を
示す。
第11図(b)に示すように従来の特徴抽出部1の出力
では大きな値を示しているチャンネルn付近、即ち高域
部分の出力値が、第11図(C)に示すように本発明の
入力音声特徴抽出部10の出力ではその値が抑圧され、
標準的な電話機の出力値を示す第11図(e)の値とほ
ぼ同様になっていることが理解される。
なお、低域特性の良い電話機から音声が入力された場合
も、同様に低域判定部21及び低域抑圧部13が動作し
、低域部分が抑圧された入力音声が帯域フィルタ群12
に入力され、以後、認識動作が行なわれる。
(発明の効果) 以上説明したように本発明によれば、入力信号の低域及
び高域のレベルの判定手段と、入力信号の低域及び高域
のレベルの抑圧手段とを設けたため、標準的な通常の電
話機と送話周波数特性の大幅に異なる電話機より音声が
入力された場合であっても、これを検出し通常の電話機
より入力された音声と同等の特性に補正することができ
、従って、通常の電話機と送話周波数特性の異なった電
話機から入力された音声のための標準パターンを別途用
意する必要がなく、該標準パターンの作成に要する時間
や標準パターンの記憶容量を削減することができ、また
、認識処理時間を低減でき、さらにまた、誤認識及び類
似度過小によるリジェクトの低減等が期待できる。
【図面の簡単な説明】
第1図は本発明の不特定話者電話音声認識装置の一実施
例を示す構成図、第2図は従来の不特定話者電話音声認
識装置の一例を示す構成図、第3図は音声区間の切出し
のようすを示す説明図、第4図は種々の電話機の送話周
波数特性を示すグラフ、第5図は入力音声特徴抽出部の
詳細な構成を示すブロック図、第6図は帯域フィルタの
周波数特性を示すグラフ、第7図は帯域フィルタ群の各
フィルタの周波数特性を示すグラフ、第8図は低域抑圧
フィルタ及び高域抑圧フィルタの周波数特性の一例を示
すグラフ、第9図は電話機判定部の詳細な構成を示すブ
ロック図、第10図は低域バンドパスフィルタ及び高域
バンドパスフィルタの周波数特性の一例を示すグラフ、
第11図(a)〜(e)は高域特性の良い電話機及び標
準的な電話機を使用した場合の出力信号のようすを示す
説明図である。 2・・・音声区間検出部、3・・・マツチング部、4・
・・標準パターン格納部、5・・・認識判定部、10・
・・入力音声特徴抽出部、13・・・低域抑圧部、14
・・・高域抑圧部、20・・・電話機判定部、21・・
・低域判定部、22・・・高域判定部。

Claims (1)

  1. 【特許請求の範囲】 電話機より電話回線を介して入力される不特定な話者の
    音声を認識する不特定話者電話音声認識装置において、 電話回線の標準的な伝送周波数帯域より低い帯域におけ
    る入力音声のレベルを検出し予め設定した所定の値より
    大きい時に第1の判定信号を出力する第1の判定手段と
    、 電話回線の標準的な伝送周波数帯域より高い帯域におけ
    る入力音声のレベルを検出し予め設定した所定の値より
    大きい時に第2の判定信号を出力する第2の判定手段と
    、 第1の判定信号を受信した時のみ入力音声の前記低い帯
    域のレベルを抑圧する第1の抑圧手段と、 第2の判定信号を受信した時のみ入力音声の前記高い帯
    域のレベルを抑圧する第2の抑圧手段とを設けた ことを特徴とする不特定話者電話音声認識装置。
JP62060792A 1987-03-16 1987-03-16 不特定話者電話音声認識装置 Pending JPS63226698A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62060792A JPS63226698A (ja) 1987-03-16 1987-03-16 不特定話者電話音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62060792A JPS63226698A (ja) 1987-03-16 1987-03-16 不特定話者電話音声認識装置

Publications (1)

Publication Number Publication Date
JPS63226698A true JPS63226698A (ja) 1988-09-21

Family

ID=13152510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62060792A Pending JPS63226698A (ja) 1987-03-16 1987-03-16 不特定話者電話音声認識装置

Country Status (1)

Country Link
JP (1) JPS63226698A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02193441A (ja) * 1989-01-20 1990-07-31 Tokyo Electric Power Co Inc:The 電話装置
JP4810044B2 (ja) * 2000-01-27 2011-11-09 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 2つのスイッチオフ規準を持つ音声検出装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02193441A (ja) * 1989-01-20 1990-07-31 Tokyo Electric Power Co Inc:The 電話装置
JP4810044B2 (ja) * 2000-01-27 2011-11-09 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 2つのスイッチオフ規準を持つ音声検出装置

Similar Documents

Publication Publication Date Title
US6826525B2 (en) Method and device for detecting a transient in a discrete-time audio signal
US5717772A (en) Method and apparatus for suppressing acoustic feedback in an audio system
US20050259834A1 (en) Voice controlled system and method
CA2485644A1 (en) Voice activity detection
CN115348507A (zh) 脉冲噪声抑制方法、系统、可读存储介质及计算机设备
JPS63226698A (ja) 不特定話者電話音声認識装置
JP2570603B2 (ja) 音声信号伝送装置およびノイズ抑圧装置
US11490198B1 (en) Single-microphone wind detection for audio device
EP0545596B1 (en) A deviation limiting transmission circuit
JPH06289898A (ja) 音声信号処理装置
US5319801A (en) Seamless frequency hopping system
JP2859634B2 (ja) 雑音除去装置
US5930308A (en) Method and apparatus for detecting signaling tones in wide-band digitized cellular-telephone signals
US20020141568A1 (en) Dual threshold correlator
KR20040082756A (ko) 비음성 제거에 의한 음성 추출 방법
WO1993009531A1 (en) Processing of electrical and audio signals
CN108156307B (zh) 语音处理的方法以及语音通讯装置
JP2833879B2 (ja) 帯域内一周波信号検出方法および装置
SU1246407A1 (ru) Громкоговор щее устройство,управл емое голосом
JPH0110039Y2 (ja)
JPS649785B2 (ja)
JP2606167B2 (ja) 電話機
JPH09292894A (ja) 音声認識方法及び装置
JPH04134399A (ja) 音声認識装置
EP1217607A1 (en) Voice/voiceless frame judging device and judging method therefor