JPH04230796A - 音声信号処理装置 - Google Patents

音声信号処理装置

Info

Publication number
JPH04230796A
JPH04230796A JP3118260A JP11826091A JPH04230796A JP H04230796 A JPH04230796 A JP H04230796A JP 3118260 A JP3118260 A JP 3118260A JP 11826091 A JP11826091 A JP 11826091A JP H04230796 A JPH04230796 A JP H04230796A
Authority
JP
Japan
Prior art keywords
voice
signal
noise
peak
discrimination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3118260A
Other languages
English (en)
Inventor
Joji Kane
丈二 加根
Akira Nohara
明 野原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3118260A priority Critical patent/JPH04230796A/ja
Publication of JPH04230796A publication Critical patent/JPH04230796A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号処理装置に関
し、特に、雑音混じりの音声信号などの信号に付いてそ
の信号部分の検出と共にその信号の種類の判別をも行う
信号判別装置、音声認識の前段などに用いられ複数の人
の音声を弁別するための信号処理装置、並びに、人の発
声した言葉を認識する音声認識装置に関する。
【0002】
【従来の技術】従来、雑音混じりの音声信号に付いて、
その雑音部分と、音声部分とを区別する技術は、例えば
、特開昭59−124397号公報,特開昭59−13
1997号公報に記載のものがある。この雑音部分と音
声部分とが区別された結果は、例えば音声認識装置で音
声部分を認識するというシステムで用いられている。
【0003】
【発明が解決しようとする課題】しかしながら、そのよ
うに音声部分を雑音部分と区別する従来技術は、その音
声部分の種類、すなわち誰の声なのかが分からない技術
である。音声認識装置では、その音声部分の種類が予め
分かっていることが望ましいことである。
【0004】また、従来、音声認識装置においては、特
定の話者の音声を入力して認識する場合がある。すなわ
ち、音声特徴のパターンマッチングの認識率を高くする
ため、今話しているのは誰それであるという情報も追加
して、音声認識をやり易くすることが必要不可欠である
【0005】また、秘密を要する機械に組み込まれた音
声認識装置の場合などでは、特定の人の音声しか受け付
けてはいけない場合がある。そこで、発せられている音
声が誰のものかを弁別し、そのような音声認識の前段階
に用いようという要望がある。
【0006】さらに、最近、研究所など、秘密を要する
場所で、特別な言葉を発しないと、使用できないシステ
ムが開発されている。そのシステムは、音声認識技術を
利用して、たとえば{「イチ」、「サン」、「ゴー」、
「ナナ」}という言葉をキーとして、その言葉をシステ
ムに向かって発することによって、そのシステムが稼働
するようになっている。しかしながら、このような秘密
を要するシステムにおいては、言葉をキーとするだけで
なく、その言葉を発する人も特定の人に限るのが望まし
い。すなわち、予め決められた特定の人が、そのキーと
なる言葉を発して初めて、システムが使用できるように
なる方が、より秘密が守られ易いといえる。
【0007】かかる点に鑑み、本発明の第1の目的は、
上記の従来技術の課題を考慮し、信号部分の判別と共に
その信号部分の信号の種類も判別する信号判別装置を提
供することにある。
【0008】また、本発明の第2の目的は、上記の要望
に対応した、複数人の音声を弁別して、区別してそれぞ
れを出力できる信号処理装置を提供することにある。
【0009】また、本発明の第3の目的は、上記の従来
の音声認識装置の課題を考慮し、予め決められた人の発
した音声のみを認識して出力する音声認識装置を提供す
ることにある。
【0010】
【課題を解決するための手段】上記目的を達成するため
本発明は、入力された雑音混じりの音声信号の周波数帯
域を分割する帯域分割手段と、その帯域分割手段の帯域
分割出力が入力され、ケプストラム分析を行うケプスト
ラム手段と、前記ケプストラム分析手段のケプストラム
分析結果に基づきピークを検出するピーク検出手段と、
そのピーク検出手段によって検出されたピーク情報に基
づき、音声部分を判別する音声判別手段と、この音声判
別手段によって判別された音声部分情報に基づき、前記
雑音混じりの音声信号に付いて、音声部分の雑音を予測
する雑音予測手段と、前記帯域分割された雑音混じりの
音声信号について、雑音予測手段によって予測された雑
音を除去するキャンセル手段と、そのキャンセル手段か
らの出力に付いて帯域合成を行なう帯域合成手段とを備
えたことを特徴とする信号判別装置である。
【0011】また、入力された音声信号の周波数帯域を
分割する帯域分割手段と、その帯域分割手段の帯域分割
出力が入力され、ケプストラム分析を行うケプストラム
手段と、そのケプストラム分析手段によって分析された
分析結果に基づいて、ピーク周波数を検出するピーク周
波数検出手段と、複数の人の音声のピーク周波数を順次
出力するピーク周波数判別制御手段と、前記ピーク周波
数検出手段によって、検出されたピーク周波数と前記ピ
ーク周波数判別制御手段からの各種ピーク周波数とを比
較して、検出されたピーク周波数がどの人のものかを判
別するピーク周波数判別手段と、このピーク周波数判別
手段によって判別された判別情報に従い、スイッチ制御
信号を出力するスイッチ制御手段と、前記入力された音
声信号を入力し、前記スイッチ制御信号に従い、人別に
区別して音声信号を出力するスイッチ手段とを備えたこ
とを特徴とする信号処理装置である。
【0012】また、入力された音声信号の周波数帯域を
分割する帯域分割手段と、その帯域分割手段の帯域分割
出力が入力され、ケプストラム分析を行うケプストラム
手段と、そのケプストラム分析手段によって分析された
分析結果に基づいて、ピーク周波数を検出するピーク周
波数検出手段と、複数の人の音声のピーク周波数を順次
出力するピーク周波数判別制御手段と、前記ピーク周波
数検出手段によって、検出されたピーク周波数と前記ピ
ーク周波数判別制御手段からの各種ピーク周波数とを比
較して、検出されたピーク周波数がどの人のものかを判
別するピーク周波数判別手段と、このピーク周波数判別
手段によって判別された判別情報に従い、くし形フィル
タ周波数制御信号を出力するくし形フィルタ周波数制御
手段と、前記帯域分割手段によって帯域された信号を入
力し、前記くし形フィルタ周波数制御信号に従い、判別
された音声信号のみ通過させるように、適切にそのフィ
ルタリング機能を調整してフィルタリングするくし形フ
ィルタと、そのくし形フィルタの出力に付いて、帯域合
成を行う帯域合成手段とを備えたことを特徴とする信号
処理装置である。
【0013】また、入力された雑音混じりの音声信号の
周波数帯域を分割する帯域分割手段と、その帯域分割手
段の帯域分割出力が入力され、ケプストラム分析を行う
ケプストラム手段と、そのケプストラム分析手段によっ
て分析された分析結果に基づいて、ピーク周波数を検出
するピーク周波数検出手段と、複数の人の音声のピーク
周波数を順次出力するピーク周波数判別制御手段と、前
記ピーク周波数検出手段によって、検出されたピーク周
波数と前記ピーク周波数判別制御手段からの各種ピーク
周波数とを比較して、検出されたピーク周波数がどの人
のものかを判別するピーク周波数判別手段と、このピー
ク周波数判別手段によって判別された判別情報に従い、
スイッチ制御信号を出力するスイッチ制御手段と、前記
ケプストラム分析手段のケプストラム分析結果に基づき
ピークを検出するピーク検出手段と、そのピーク検出手
段によって検出されたピーク情報に基づき、音声部分を
判別する音声判別手段と、この音声判別手段によって判
別された音声部分情報に基づき、前記雑音混じりの音声
信号に付いて、音声部分の雑音を予測する雑音予測手段
と、前記帯域分割された雑音混じりの音声信号について
、雑音予測手段によって予測された雑音を除去するキャ
ンセル手段と、そのキャンセル手段からの出力に付いて
帯域合成を行う帯域合成手段と、その帯域合成された信
号を入力し、前記スイッチ制御信号に従い、人別に区別
して音声信号を出力するスイッチ手段とを備えたことを
特徴とする信号処理装置である。
【0014】また、予め既知の人の音声信号の帯域分割
され、ケプストラム分析されて得られたピーク周波数を
記憶した第1の記憶手段と、未知の雑音混じりの音声入
力信号を帯域分割する帯域分割手段と、その帯域分割手
段の出力をケプストラム分析するケプストラム分析手段
と、そのケプストラム分析手段のケプストラム分析出力
におけるピーク周波数を検出するピーク周波数検出手段
と、前記ピーク周波数検出手段のピーク検出情報と前記
第1記憶手段に記憶された各ピーク周波数とを比較し、
その未知の音声信号が誰のものであるかを判断する第1
比較手段と、予め各種音声の音声特徴を記憶した第2の
記憶手段と、前記雑音混じりの音声信号から音声部分を
切り出す音声切り出し手段と、切り出された音声の特徴
を抽出する特徴抽出手段と、その特徴抽出手段によって
抽出された音声特徴と前記第2記憶手段に記憶された音
声特徴とを比較し、音声を認識する第2比較手段と、前
記第1比較手段の比較結果と、第2比較手段の比較結果
に基づき、所定の処理を行って出力する比較合成手段と
を備えたことを特徴とする音声認識装置である。
【0015】
【作用】上記のような構成により、雑音まじりの入力信
号から雑音予測を行い、入力信号から雑音をキャンセル
する。また、雑音予測に際してはケプストラム分析の結
果を基に、ピーク検出、最ゆう判定等を行い話者弁別等
を行う。
【0016】
【実施例】以下に本発明に係る各実施例について図面を
参照して説明する。
【0017】<第1の実施例>図1は、本発明にかかる
第1の実施例の信号判別装置を示すブロック図である。 本実施例では、信号として音声信号を用いた場合を例に
とっている。
【0018】ケプストラム分析手段1は、帯域分割手段
によって、フーリエ変換された音声信号に付いて、ケプ
ストラム分析を行う手段である。ケプストラムとは、波
形の短時間振幅スペクトルの対数の逆フーリエ変換であ
って、図4に示すようなものである。図4(a)は、短
時間スペクトルであって、同図(b)は、そのケプスト
ラムである。
【0019】記憶手段2は、既知の種類の信号に付いて
、その所定の特徴情報を予め記憶しているRAM,RO
M等の手段である。すなわち、Aという人の音声信号の
ケプストラム分析結果という特徴をAという人と結びつ
けた記憶している。そのケプストラム分析結果とは、少
なくともそのピーク(ピッチ)の存在位置、さらにホル
マント情報(図4(b)参照)である。同様にして、他
のB,C・・・の音声のケプストラム分析結果を記憶さ
せてある。ピークやホルマント情報は、各人でそれぞれ
異なるものである。なお、特徴情報としては、このよう
なケプストラム分析結果以外に振幅、位相等任意の音声
特徴でよい。
【0020】信号判別手段3は、ケプストラム分析手段
1によって得られたそのケプストラムを利用して音声信
号部分と雑音部分を判別するための手段である。そのケ
プストラムを利用して音声信号部分を判別する方法とし
ては、例えば、ケプストラムのピークを検出して音声信
号と雑音を判別する方法が知られている。すなわち、分
析されたケプストラムに付いてそのピークを検出するピ
ーク検出手段31と、その検出されたピーク情報に基づ
いて、音声信号を判別する信号雑音判別手段32とを利
用する方法である(図2参照)。図4(b)のピッチが
そのピークを示し、そのピークが存在するところが音声
信号部分である。そのピークの検出は、例えば所定の閾
値を予め設定しておき、それとの比較を行うことによっ
て検出する。
【0021】最ゆう検出手段4へは、信号判別手段3に
よって音声信号部分が捉えられると、そのタイミングで
、信号判別手段3から制御信号が記憶手段2にアクセス
され、記憶されていた特徴情報が入力されるようになっ
ている。他方、その判別された音声信号部分に付いての
ケプストラム分析結果の特徴情報がケプストラム分析手
段1から入力されている。そこで、最ゆう検出手段4は
、その入力されてくるケプストラム分析結果と、前記記
憶手段2の特徴情報をA→B→C→D→・・・と切り替
えながら順次比較し、最も似ている特徴を捜して、その
音声信号部分の信号が誰のものかを検出するようになっ
ている。なお、その似ている程度の判断は、パターンマ
ッチング法、振幅レベルの類似度、位相の類似度を調べ
る方法などがある。
【0022】出力手段5は、前記信号判別手段3による
結果と前記最ゆう検出手段4による結果を入力し、それ
らを対にして出力する手段である。すなわち、この出力
手段5からは、音声信号部分の存在情報と共に、その音
声信号が誰のものかに付いての情報が出力されることに
なる。
【0023】次に、上記実施例の動作を簡単に説明する
。まず、記憶手段2に予め、各人の音声のケプストラム
分析結果を記憶させておく。しかる後、雑音混じりの音
声信号を入力し、ケプストラム分析手段1によって、分
析を行う(なお、上記各人のケプストラム分析をこのケ
プストラム分析手段1を利用して行ってもよい(図1の
6参照)。このケプストラム分析結果のピーク等を利用
しながら、信号判別手段3は音声信号部分を判別する。 そして、音声信号部分が発生すると、そのタイミングで
、制御信号が記憶手段2にアクセスされ(図1の7参照
)、記憶手段2から、そこに記憶されていたケプストラ
ム分析結果が最ゆう検出手段4へ出力される。他方、そ
のケプストラム分析手段1から、その結果が最ゆう検出
手段4へ入力される。最ゆう検出手段4は、この双方の
ケプストラム分析結果を比較し、最も似ているものを決
定する。ある程度以上似ているものがなければ、該当す
るものなしとする。出力手段5は、この最ゆう検出手段
4の結果を信号判別手段3の結果に組み合わせて出力す
る。
【0024】本発明は、音声情報に限らず、車の音、飛
行機の音などを信号とし、それ以外を雑音とするように
してもよい。その場合は、特徴情報としては、ケプスト
ラム分析結果を用いず、他の特徴情報を用いるようにす
る。
【0025】<第2の実施例>図2は、本発明に係る第
2の実施例を示すブロック図である。
【0026】図1の第1の実施例と同様に、信号判別手
段3は、ピーク検出手段31と音声判別手段32とを備
える。そして、図1に示す実施例と異なる点は次の通り
である。最ゆう検出手段4は、前記記憶手段2のケプス
トラム分析結果と、ケプストラム分析手段1から入力さ
れて来るケプストラム分析結果だけでなく、その音声信
号部分における予測雑音をも考慮して、最も似ている信
号種類を見つけるものである点である。すなわち、音声
判別手段32で音声部分の発生タイミングが見つかると
、その出力は、雑音予測手段8に入力される。他方、こ
の雑音予測手段8は、雑音混じりの音声信号を入力して
いる。そして、音声部分でない部分は雑音のみの部分で
あるので、その雑音のみのデータに基づき、音声信号部
分の雑音を予測するようになっている。すなわち、この
雑音予測手段8は、例えば、mチャンネルに分割された
音声/雑音入力に基づき、雑音成分を各チャンネル毎に
予測する手段である。例えば、図5に示すように、x軸
に周波数、y軸に音声レベル、z軸に時間をとるととも
に、周波数f1のところのデータp1,p2,・・・,
piをとり、その先のpjを予測する。例えば、雑音部
分p1〜piの平均をとりpjとする。あるいは更に、
音声信号部分が続くときは、pjに減衰係数を掛けるな
どである。雑音パワー算出手段9は、この雑音予測手段
8によって、予測された雑音の大きさを算出する手段で
ある。例えば、振幅の平均値等である。最ゆう検出手段
4は、この雑音パワーが大きいときは、記憶手段2に記
憶されたケプストラム結果と入力されたケプストラム結
果が多少異なっていても、かなり近いとみて、類似判断
基準を緩める。逆に雑音パワーが小さいときは、雑音が
ほとんど無いのであるから、類似判断基準を厳しく運用
する。
【0027】<第3の実施例>図3は、図2の実施例に
おける雑音予測手段8によって、予測された雑音予測値
を利用して、雑音の抑圧された信号が得られる雑音抑圧
装置を示すブロック図である。
【0028】同図において、帯域分割手段10は、雑音
混じりの音声信号を入力し、A/D変換してフーリエ変
換する手段である。この帯域分割手段10の出力が前記
ケプストラム分析手段1と雑音予測手段8へ入力される
。他方、キャンセル手段11は、帯域分割手段10から
出力された各周波数チャンネル毎の雑音混じりの音声信
号を入力し、雑音予測手段8によって予測された雑音予
測値をチャンネル毎に除去する手段である。一般に、キ
ャンセルの方法の一例として、時間軸でのキャンセレー
ションは、図6に示すように、雑音混入音声信号(a)
から予測された雑音波形(b)を引算するものである。 それによって信号のみが取り出される(c)。また、本
実施例では、図7に示すように、周波数を基準にしたキ
ャンセレーションで、雑音混入音声信号(a)をフーリ
エ変換し(b)、それから予測雑音のスペクトル(c)
を引き(d)、それを逆フーリエ変換して、雑音の無い
音声信号を得る(e)ものである。帯域合成手段12は
、キャンセル手段11より供給されるmチャンネルの信
号を逆フーリエ変換して品質のよい音声出力を得る手段
である。このように、キャンセル手段11によって、雑
音をキャンセルし、帯域合成手段12によって、音声を
合成するので、雑音の抑圧された音声信号が、人を特定
した情報と共に得られる。なお、記憶手段2に記憶され
る特徴として、本実施例では、ケプストラム分析結果の
中のピーク情報を選択している(図3のピーク検出手段
31と記憶手段2参照)。
【0029】<第4の実施例>図8は本発明にかかる第
4の実施例の信号処理装置のブロック図である。
【0030】図8において、帯域分割手段101は、複
数の人の音声信号を帯域分割する帯域分割手段であり、
例えば、信号をA/D変換するA/D変換手段と、フー
リエ変換するFFT手段とを備える。
【0031】ケプストラム分析手段102は、その帯域
分割された信号を入力し、ケプストラム分析を行う手段
である。
【0032】ピーク周波数検出手段103は、そのケプ
ストラム分析結果に付いてピーク(ピッチ)周波数を検
出する手段である。図4(b)のピッチがそのピークを
示し、そのピークが存在するところが音声信号部分であ
る。そのピーク周波数の検出は、例えば所定の閾値を予
め設定しておき、それとの比較を行うことによって検出
する。
【0033】ピーク周波数判別制御手段104は、複数
の人の音声のピーク周波数を順次出力する手段である。 すなわち、音声のピーク周波数は、各人によって、それ
ぞれ異なるものである。従って、予め各人の音声のピー
ク周波数を調べておき、それを順次出力するようにして
いる。
【0034】ピーク周波数判別手段105は、ピーク周
波数検出手段103によって検出されたピーク周波数と
前記ピーク周波数判別制御手段104からの各種ピーク
周波数とを比較して、検出されたピーク周波数がどの人
のものかを判別する手段である。例えば、最も近いピー
ク周波数の人の音声信号と判別する。
【0035】スイッチ制御手段106は、このピーク周
波数判別手段105によって判別された判別情報に従い
、スイッチ制御信号を出力する手段である。
【0036】スイッチ手段107は、前記入力された音
声信号を入力し、スイッチ制御信号に従い、人別に区別
して音声信号を出力する手段である。例えば、図に示す
ように、D→A→B→Cの順に音声がそれぞれ入力され
てくる。それを、それぞれの出力端子A,B,C,D・
・・、Nへ区別して出力する。
【0037】次に、本発明の上記実施例に付いて動作を
説明する。帯域分割手段101は、複数の音声信号に付
いて、帯域分割を行う。ケプストラム分析手段102は
、この帯域分割された信号についてケプストラム分析を
行う。ピーク周波数検出手段103は、そのケプストラ
ム分析結果に基づき、そのピーク周波数を検出する。他
方、ピーク周波数判別制御手段104は、記憶している
各人の音声のピーク周波数を出力していく。ピーク周波
数判別手段105は、検出されたピーク周波数と、順次
送られてくる既知のピーク周波数とを突合せ、誰のピー
ク周波数かを判別する。スイッチ制御手段106は、こ
のピーク周波数判別手段105で判別された結果に基づ
き、スイッチ制御信号を出力する。スイッチ手段107
は、その制御信号に基づき、Aの人の音声信号なら、出
力端子Aへスイッチを切り替え、Bの人の音声信号なら
、出力端子Bへスイッチを切り替える。このようにして
、各人の音声が弁別されて出力される。
【0038】<第5の実施例>図9は、本発明にかかる
第5の実施例を示すものである。
【0039】FFT108は、複数人の音声信号をフー
リエ変換する手段である。ケプストラム分析手段102
、ピーク周波数検出手段103、ピーク周波数判別制御
手段104、ピーク周波数判別手段105、スイッチ制
御手段106は、図8のものと同じなので説明を省略す
る。
【0040】ディジタルスイッチ手段109は、FFT
108の出力信号を入力し、スイッチ制御手段106か
らの制御信号に応じて、nチャンネルに音声信号を区別
して出力する手段である。IFFT手段110は、この
ディジタルスイッチ手段109の出力に付いて、逆フー
リエ変換を行い、出力端子A,B,C,・・・,Nへそ
れぞれ出力する手段である。  <第6の実施例>図1
0は本発明にかかる第6の実施例の信号処理装置のブロ
ック図である。
【0041】帯域分割手段101、ケプストラム分析手
段102、スイッチ制御手段106、スイッチ手段10
7、図8の実施例のものと同じであるのでその説明は省
略する。
【0042】ホルマント分析手段108は、ケプストラ
ム分析手段102によって分析されたケプストラムのホ
ルマント(図4(b)参照)を分析する手段である。ホ
ルマントは、スペクトラムの包絡線に対応する。
【0043】音声検出手段111は、ケプストラム分析
結果のピッチ情報など及びホルマント分析結果を入力し
、音声特徴を検出する手段である。図4(b)のピッチ
がそのピークを示し、そのピークが存在するところが音
声信号部分である。ホルマントも人によって差異がある
【0044】音声判別制御手段112は、複数の人の音
声の音声特徴を順次出力する手段である。すなわち、音
声のピーク周波数等の特徴は、各人によって、それぞれ
異なるものである。従って、予め各人の音声のそれら特
徴を調べておき、それを順次出力するようにしている。
【0045】音声判別手段113は、音声検出手段11
1によって検出された音声特徴と音声判別制御手段11
2からの音声特徴とを比較して、検出された音声特徴が
どの人のものかを判別する手段である。例えば、パター
ンマッチング法などを用いる。
【0046】<第7の実施例>図11は、本発明にかか
る第7の実施例であって、図8の実施例におけるスイッ
チ手段107が雑音も音声と区別して出力できる場合で
ある。
【0047】すなわち、雑音区間算出手段114は、ピ
ーク周波数検出手段103によって検出されピーク周波
数情報に基づき、音声区間を判断し、それを反転するこ
とによって雑音のみの区間を算出する手段である。その
雑音区間情報は、スイッチ手段107へ入力される。ス
イッチ手段107は、この雑音区間情報に基づき、雑音
区間においては、雑音出力端子へその雑音を出力するよ
うにスイッチを切り替える。これによって、各人の音声
が区別されて出力されるばかりでなく、雑音も区別され
て、特定の出力端子から得られる。例えば、自動車のエ
ンジン音や、飛行機の音など、雑音それ自体が必要な場
合もあるからである。
【0048】<第8の実施例>図12は、本発明にかか
る第8の実施例の信号処理装置のブロック図である。
【0049】帯域分割手段201は、複数の人の音声信
号を帯域分割する帯域分割手段であり、例えば、信号を
A/D変換するA/D変換手段と、フーリエ変換するF
FT手段とを備える。
【0050】ケプストラム分析手段202、その帯域分
割された信号を入力し、ケプストラム分析を行う手段で
ある。ピーク周波数検出手段203は、そのケプストラ
ム分析結果に付いてピーク(ピッチ)周波数を検出する
手段である。図4(b)のピッチがそのピークを示し、
そのピークが存在するところが音声信号部分である。そ
のピーク周波数の検出は、例えば所定の閾値を予め設定
しておき、それとの比較を行うことによって検出する。 なお、このピークが現われる位置は、人によってそれぞ
れ異なるものである。従って、複数の人が同時に話した
場合は、同図破線で示すように、少しずつ位置のずれた
状態で各人のピークが発生する。
【0051】ピーク周波数判別制御手段204は、複数
の人の音声のピーク周波数を順次出力する手段である。 すなわち、音声のピーク周波数は、前述のように、各人
によって、それぞれ異なるものである。従って、予め各
人の音声のピーク周波数を調べておき、それを順次出力
するようにしている。
【0052】ピーク周波数判別手段205は、ピーク周
波数検出手段203によって検出されたピーク周波数と
前記ピーク周波数判別制御手段204からの各種ピーク
周波数とを比較して、検出されたピーク周波数がどの人
のものかを判別する手段である。例えば、最も近いピー
ク周波数の人の音声信号と判別する。前述のように、複
数の人が同時に話している場合も、誰と誰が話している
場合も、誰と誰が話をしているのか判別する。例えば、
A,Dという二人の人の音声が同時に発せられた場合は
、A,Dという人が発生したと判別する。
【0053】くし形フィルタ周波数制御手段206は、
ピーク周波数判別手段205からの判別信号を受けて、
その判別した人の音声のみを通過させるため最も最適に
くし形フィルタリング機能を調整してフィルタリングさ
せる制御信号を出力する手段である。すなわち、Aにつ
いては、検出されたAのピーク周波数情報から導かれる
最適のくし形フィルタリング機能情報(Aの音声信号の
みを確実にフィルタリングする機能情報)、Dについて
は、検出されたDのピーク周波数情報から導かれる最適
のくし形フィルタリング機能情報(Dの音声信号のみを
確実にフィルタリングする機能情報)とを制御信号とし
て出力する。
【0054】くし形フィルタ周波数手段207−1,2
07−2,207−3,207−4,・・,207−N
は、前記帯域分割手段201によって帯域分割された信
号を入力し、前記くし形フィルタ周波数制御信号に従い
、判別された音声信号のみ通過させるように、適切にそ
のフィルタリング機能を調整してフィルタリングする手
段であって、各人に応じた数だけ設けられている。すな
わち、207−1,207−2,207−3,207−
4,・・・,207−Nのくし形フィルタは、それぞれ
例えば、A,B,C,D,E・・・という人に対応する
。従って、Aという人の音声信号については、くし形フ
ィルタ207−1のフィルタリング機能が、Aという人
の音声のみを確実に通過させるように調整され、またD
という人の音声信号に付いては、くし形フィルタ207
−4のフィルタリング機能が、Dという人の音声のみを
確実に通過させるように調整される。なお、予め、それ
ぞれのくし形フィルタをA,Dの音声に最適に調整して
固定しておく方法も考えられるが、現実の人の音声は、
体調、時、環境などの違いで、微妙に異なるので、検出
したピーク周波数毎に、最適のくし形フィルタをそのつ
ど調整するようにしている。なお、その意味で、最適に
フィルタリング機能を調整した後も、微妙にその通過可
能周波数を変動させ、通過許容範囲を広げるようにして
もよい。
【0055】帯域合成手段208−1,208−2,2
08−3,208−4,・・・,208−Nは、くし形
フィルタ207−1,207−2,207−3,207
−4,・・・,207−Nのそれぞれの出力を帯域合成
する手段である。 例えば、逆フーリエ変換を行うIFFTである。
【0056】次に、上記実施例の動作に付いて説明する
。あらかじめ、ピーク周波数判別制御手段204は、複
数人の音声信号のケプストラム分析結果による、ピーク
周波数をそれぞれ記憶しておく。
【0057】帯域分割手段201は、複数人の音声信号
を入力し、帯域分割する。ケプストラム分析手段202
は、その帯域分割された信号に付いてケプストラム分析
を行う。ピーク周波数検出手段203は、そのケプスト
ラム分析結果から、ピーク周波数を検出する。雑音のみ
で、人の音声が存在しない場合は、ピークは見つからず
、人の音声に付いては、その人の数だけ検出することが
出来る。ピーク周波数判別制御手段204は、予め記憶
されている色々な人のピーク周波数を順次出力する。ピ
ーク周波数判別手段205は、検出されたピーク周波数
と順次提供されるピーク周波数とを比較して突合せ、最
も似ているピーク周波数を選択する。その最も似ている
ピーク周波数の人がその音声の発生主である。くし形フ
ィルタ周波数制御手段206は、その人が判別された情
報に基づき、その人のくし形フィルタ207について、
そのピーク周波数から導かれる最適のフィルリング機能
に調整する。くし形フィルタ207は、その調整によっ
て、最適の状態で、その音声を各人に区別した状態で出
力する。すなわち、Aならくし形フィルタ207−1の
み、最適のフィルタリング機能に調整されて、Aの音声
を通過させるので、くし形フィルタリング207−1か
らAの音声信号が出力される。また、Dも発声している
と、くし形フィルタ207−4のみ、最適のフィルタリ
ング機能に調整されて、Dの音声を通過させるので、く
し形フィルタ207−4からDの音声信号が出力される
。このようにして、同時に色々な人が話しをしていても
、各人別に区別されて出力される。帯域合成手段208
は、それぞれ入力されてくる音声信号を帯域合成する。
【0058】<第9の実施例>図13は、本発明にかか
る第9の実施例であって、図12の実施例と異なるとこ
ろは、ピーク周波数検出手段203の出力を入力し、音
声信号区間を反転して、音声以外の自動車のエンジン音
等の雑音区間を算出する雑音区間算出手段250、前記
帯域合成手段208−1,208−2,208−3,2
08−4,・・・,208−Nから出力された信号、及
び雑音区間算出手段250からの信号を入力し、スイッ
チングを行う、スイッチ手段290である。すなわち、
スイッチング手段290は、雑音区間において、本装置
に入力されてくる雑音信号を雑音出力端子270へ出力
し、音声区間においては、各帯域合成手段208の出力
に付いて、それぞれの出力端子260へ出力する。これ
によって、音声信号はもちろん雑音区間の雑音も区別し
て出力できる。
【0059】<第10の実施例>図14は、図12の実
施例において、くし形フィルタ207への入力信号が雑
音がキャンセルされた信号であるようになっている他の
実施例である。
【0060】すなわち、帯域分割手段201、ケプスト
ラム手段202、ピーク周波数検出手段203、ピーク
周波数判別制御手段204、ピーク周波数判別手段20
5、くし形フィルタ周波数制御手段206、くし形フィ
ルタ207、帯域合成手段208は、第12の実施例と
同じなので説明を省略する。
【0061】ピーク検出手段209は、前記ケプストラ
ム分析手段202において求められたケプストラムのピ
ーク(ピッチ)を検出する手段である。そのピークの検
出は、例えば、所定の大きさの閾値を予め決めておき、
それとの比較を行うことによって、検出できる。音声判
別手段210は、そのピークが存在するところが音声信
号部分として判別する手段である。
【0062】雑音予測手段211は、前記帯域分割手段
201の出力に付いて、音声判別手段210によって、
判別された音声部分から、雑音部分をとらえ、その雑音
のみの部分の雑音データに基づいて、音声部分の雑音を
予測刷る手段である。この雑音予測手段211は、mチ
ャンネルに分割された音声/雑音入力に基づき、雑音成
分を各チャンネル毎に予測する手段である。例えば、図
5に示すように、x軸に周波数、y軸に音声レベル、z
軸に時間をとるとともに、周波数f1のところのデータ
p1,p2,・・・piをとり、その先のpjを予測す
る。例えば、雑音部分p1〜piの平均をとりpjとす
る。あるいは更に、音声信号部分が続くときはpjに減
衰係数を掛けるなどである。  キャンセル手段212
は、帯域分割手段201及び雑音予測手段211よりm
チャンネルの信号が供給され、チャンネル毎に雑音を引
算するなどしてキャンセルする手段である。そのキャン
セレーションの方法は、図7に示すように、周波数を基
準にしたキャンセレーションで、雑音混入音声信号(a
)をフーリエ変換し(b)、それから予測雑音のスペク
トル(c)を引き(d)、それを逆にフーリエ変換して
、雑音の無い音声信号を得る(e)ものである。
【0063】くし形フィルタ207は、キャンセル手段
212からの出力についてフィルタリングを行う。
【0064】<第11の実施例>図15は、本発明にか
かる第11の実施例であって、ホルマント分析を利用し
た実施例である。図14に示す実施例とは、帯域分割手
段201、ケプストラム手段202、ピーク周波数検出
手段203、くし形フィルタ周波数制御手段206、く
し形フィルタ207、帯域合成手段208、ピーク検出
手段209、音声判別手段210、雑音予測手段211
、キャンセル手段212は同じであるので説明を省略す
る。
【0065】ホルマント分析手段213は、ケプストラ
ム分析手段202によって分析されたケプストラムのホ
ルマント(図4(b)参照)を分析する。ホルマントは
、スペクトラムの包絡線に対応する。音声検出手段21
4は、ケプストラム分析結果のピッチ情報など及びホル
マント分析結果を入力し、音声特徴を検出する。図4(
b)のピッチがそのピークを示し、そのピークが存在す
るところが音声信号部分である。ホルマントも人によっ
て差異がある。音声判別制御手段215は、複数の人の
音声の音声特徴を順次出力する。すなわち、音声のピー
ク周波数等の特徴は、各人によって、それぞれ異なるも
のである。従って、予め各人の音声のそれら特徴を調べ
ておき、それを順次出力するようにしている。音声判別
手段216は、音声検出手段214によって検出された
音声特徴と音声判別制御手段215からの音声特徴とを
比較して、検出された音声特徴がどの人のものかを判別
する。例えば、パターンマッチング法などを用いる。こ
の実施例ではホルマント分析を利用して音声特徴を判断
するので、よりいっそう正確な音声信号の弁別が可能と
なる。
【0066】<第12の実施例>図16は、本発明にか
かる第12の実施例の信号処理装置のブロック図である
【0067】帯域分割手段301は、複数の人の音声信
号を帯域分割する帯域分割手段であり、例えば、信号を
A/D変換するA/D変換手段と、フーリエ変換するF
FT手段とを備える。
【0068】ケプストラム分析手段302は、その帯域
分割された信号を入力し、ケプストラム分析を行う手段
である。
【0069】ピーク周波数検出手段303は、そのケプ
ストラム分析結果に付いてピーク(ピッチ)周波数を検
出する手段である。図4(b)のピッチがそのピークを
示し、そのピークが存在するところが音声信号部分であ
る。そのピーク周波数の検出は、例えば所定の閾値を予
め設定しておき、それとの比較を行うことによって検出
する。
【0070】ピーク周波数判別制御手段304は、複数
の人の音声のピーク周波数を順次出力する手段である。 すなわち、音声のピーク周波数は、各人によって、それ
ぞれ異なるものである。従って、予め各人の音声のピー
ク周波数を調べておき、それを順次出力するようにして
いる。
【0071】ピーク周波数判別手段305は、ピーク周
波数検出手段303によって検出されたピーク周波数と
前記ピーク周波数判別制御手段304からの各種ピーク
周波数とを比較して、検出されたピーク周波数がどの人
のものかを判別する手段である。例えば、最も近いピー
ク周波数の人の音声信号と判別する。
【0072】スイッチ制御手段306は、このピーク周
波数判別手段305によって判別された判別情報に従い
、スイッチ制御信号を出力する手段である。
【0073】ピーク検出手段308は、前記ケプストラ
ム分析手段302において求められたケプストラムのピ
ーク(ピッチ)を検出する手段である。そのピークの検
出は、例えば、所定の大きさの閾値を予め決めておき、
それとの比較を行うことによって、検出できる。音声判
別手段309は、そのピークが存在するところが音声信
号部分として判別する手段である。
【0074】雑音予測手段310は、前記帯域分割手段
301の出力に付いて、音声判別手段309によって、
判別された音声部分から、雑音部分をとらえ、その雑音
のみの部分の雑音データに基づいて、音声部分の雑音を
予測する手段である。この雑音予測手段310は、mチ
ャンネルに分割された音声/雑音入力に基づき、雑音成
分を各チャンネル毎に予測する手段である。例えば、図
5に示すように、x軸周波数、y軸に音声レベル、z軸
に時間をとるとともに、周波数f1のところのデータp
1,p2・・・,piをとり、その先のpjを予測する
。例えば雑音部分p1〜piの平均をとりpjとする。 あるいは更に、音声信号部分が続くときはpjに減衰係
数をとり掛けるなどである。
【0075】キャンセル手段311は、帯域分割手段3
01及び雑音予測手段310よりmチャンネルの信号が
供給され、チャンネル毎に雑音を引算するなどしてキャ
ンセルする手段である。そのキャンセレーションの方法
は、図6に示すように、周波数を基準にしたキャンセレ
ーションで、雑音混入音声信号(a)をフーリエ変換し
(b)、それから予測雑音のスペクトル(c)を引き(
d)、それを逆フーリエ変換して、雑音の無い音声信号
を得る(e)ものである。
【0076】帯域合成手段312は、このキャンセル手
段311の出力に付いて帯域合成する、IFFT等の手
段である。
【0077】スイッチ手段307は、帯域合成手段31
2から入力された音声信号を入力し、スイッチ制御手段
に従い、人別に区別して音声信号を出力する手段である
。例えば、図に示すように、D→A→B→Cの順に音声
がそれぞれ入力されてくる。それを、それぞれの出力端
子A,B,C,D,・・・、Nへ区別して出力する。
【0078】次に、本発明の上記実施例に付いて動作を
説明する。帯域分割手段301は、複数の音声信号に付
いて、帯域分割を行う。ケプストラム分析手段302は
、この帯域分割された信号についてケプストラム分析を
行う。ピーク周波数検出手段303は、そのケプストラ
ム分析結果に基づき、そのピーク周波数を検出する。他
方、ピーク周波数判別制御手段304は、記憶している
各人の音声のピーク周波数を出力していく。ピーク周波
数判別手段305は、検出されたピーク周波数と、順次
送られてくる既知のピーク周波数とを突合せ、誰のピー
ク周波数かを判別する。スイッチ制御手段306は、こ
のピーク周波数判別手段305で判別された結果に基づ
き、スイッチ制御信号を出力する。ピーク検出手段30
8は、ケプストラム分析手段308の出力についてピー
クを検出する。音声判別手段309はそのピークによっ
て音声部分を判別する。雑音予測手段310は、その音
声判別結果により、雑音のみの部分のデータから音声部
分の雑音を予測する。 キャンセル手段311は、帯域分割手段301からの出
力から、予測された雑音をキャンセルする。帯域合成手
段312は、この雑音のキャンセルされた信号に付いて
帯域合成する。スイッチ手段307は、帯域合成された
信号に付いて、スイッチ制御手段306の制御信号に基
づき、Aの人の音声信号なら、出力端子Aへスイッチを
切り替え、Bの人の音声信号なら、出力端子Bへスイッ
チを切り替える。このようにして、各人の音声が弁別さ
れて出力される。
【0079】<第13の実施例>図17は、本発明の第
13の実施例を示すものである。
【0080】帯域分割手段301、ケプストラム分析手
段302、ピーク周波数検出手段303、ピーク検出手
段308、音声判別手段309、雑音予測手段310、
キャンセル手段311は図16の実施例のものと同じで
あるのでその説明は省略する。
【0081】ホルマント分析手段319は、ケプストラ
ム分析手段302によって分析されたケプストラムのホ
ルマント(図4(b)参照)を分析する手段である。ホ
ルマントは、スペクトラムの包絡線に対応する。
【0082】音声検出手段313は、ケプストラム分析
結果のピッチ情報など及びホルマント分析結果を入力し
、音声特徴を検出する手段である。図4(b)のピッチ
がそのピークを示し、そのピークが存在するところが音
声信号部分である。ホルマントも人によって差異がある
【0083】音声判別制御手段314は、複数の人の音
声の音声特徴を順次出力する手段である。すなわち、音
声のピーク周波数等の特徴は、各人によって、それぞれ
異なるものである。従って、予め各人の音声のそれら特
徴を調べておき、それを順次出力するようにしている。
【0084】音声判別手段315は、音声検出手段31
3によって検出された音声特徴と音声判別制御手段31
4からの音声特徴とを比較して、検出された音声特徴が
どの人のものかを判別する手段である。例えば、パター
ンマッチング法などを用いる。
【0085】スイッチ制御手段316は、この音声判別
手段315からの音声判別結果により、制御信号を出力
する手段である。スイッチ手段317は、キャンセル手
段311の出力を入力し、スイッチ制御信号に基づきス
イッチングを行う手段である。帯域合成手段318は、
そのスイッチ手段317の出力を入力し、帯域合成する
手段である。本実施例では、ホルマント分析が利用され
ているので、よりいっそう音声特徴が正確に把握される
【0086】<第14の実施例>図18は、本発明にか
かる第14の実施例の信号処理装置のブロック図である
。図18において、帯域分割手段401は、信号に付い
て帯域分割を行う手段であって、例えば、A/D変換器
と、信号をフーリエ変換するFFT手段とを備えたもの
である。
【0087】ケプストラム分析手段402は、ケプスト
ラム分析を行う手段である。ピーク周波数検出手段40
3は、ケプストラム分析手段402で得られたケプスト
ラム分布のピーク周波数を検出する手段である。
【0088】第1記憶手段404は、予め既知の人の音
声信号を帯域分割し、更に、その帯域分割された信号に
付いてケプストラム分析を行い、そのケプストラム分析
結果について、得られたピーク周波数を記憶したROM
等の第1記憶手段である。
【0089】第1比較手段405は、ピーク周波数検出
手段403のピーク検出情報と、第1記憶手段404に
記憶された各ピーク周波数とを比較、その未知の音声信
号が誰のものであるかを判断する手段である。ある許容
範囲内で、最も近いピーク周波数の持ち主をその人であ
ると判断する。
【0090】他方、第2記憶手段409は、予め各種音
声の音声特徴を記憶したROM等の手段である。例えば
、単語毎、又は「ア」、「イ」、「ウ」等の音節毎、さ
らには音素毎の音声の特徴を記憶している。
【0091】音声きりだし手段406は、雑音混じりの
音声信号から音声部分を切り出す手段である。例えば、
フィルタ等を用いる。
【0092】特徴抽出手段407は、その切り出された
音声の特徴を抽出する手段である。第2比較手段408
は、特徴抽出手段407によって抽出された音声特徴と
第2記憶手段409に記憶された音声特徴とを比較し、
音声を認識する手段である。例えば、パターンマッチン
グ法などの手法を用いる。
【0093】比較合成手段410は、前記第1比較手段
405の比較結果と、第2比較手段408の比較結果に
基づき、所定の処理を行って、その結果を出力する手段
であって、例えば、予め指定された人の以外の人の場合
は、その認識結果を出力しないようにする。あるいは、
誰の音声かに付いての情報を付けて、認識結果を出力し
てもよい。
【0094】次に上記実施例の動作を説明する。まず、
第1記憶手段404に、予め既知の人の音声信号の帯域
分割され、ケプストラム分析されて得られたピーク周波
数を記憶しておく。そして、第2記憶手段409に、予
め各種音声の音声特徴を記憶しておく。
【0095】そして、帯域分割手段401で、未知の雑
音混じりの音声入力信号を帯域分割し、ケプストラム分
析手段402で、その帯域分割手段401の出力をケプ
ストラム分析し、ピーク周波数検出手段403で、その
ケプストラム分析手段402のケプストラム分析出力に
おけるピーク周波数を検出し、第1比較手段405で、
前記ピーク周波数検出手段403のピーク周波数検出情
報と前記第1記憶手段404に記憶された各ピーク周波
数とを比較し、その未知の音声信号が誰のものであるか
を判断する。
【0096】音声切り出し手段406で、前記雑音混じ
りの音声信号から音声部分を切り出し、特徴抽出手段4
07で、切り出された音声の特徴を抽出し、第2比較手
段408で、その特徴抽出手段407によって抽出され
た音声特徴と前記第2記憶手段409に記憶された音声
特徴とを比較し、音声に認識する。
【0097】そして、比較合成手段410で、前記第1
比較手段405の比較結果と、第2比較手段408の比
較結果に基づき、所定の人の音声信号の場合のみ、音声
認識結果を出力する。
【0098】<第15の実施例>図19は本発明にかか
る第15の実施例であって、図18に示す実施例とは、
帯域分割手段401、ケプストラム分析手段402、第
1記憶手段404、第1比較手段405、音声切り出し
手段406、特徴抽出手段407、第2比較手段408
、第2記憶手段409、比較出力合成手段410は同じ
ものであるので、説明は省略する。
【0099】ピーク周波数検出手段411は、ケプスト
ラム分析手段402によるケプストラム分析結果を利用
してピークを検出する手段であって、ピーク周波数検出
手段403は、そのピーク情報に基づきピーク周波数を
検出する手段である。他方、音声判別手段412は、ピ
ーク情報に基づき、音声部分を判別する手段である。雑
音予測手段413は、その音声判別手段412による音
声部分情報を利用して、前記帯域分割された信号につい
て、音声部分の雑音を予測する手段である。この雑音予
測手段413は、mチャンネルに分割された音声/雑音
入力に基づき、雑音成分を各チャンネル毎に予測する手
段である。例えば、図5に示すように、x軸に周波数、
y軸に音声レベル、z軸に時間をとるとともに、周波数
f1のところのデータp1,p2,・・・piをとり、
その先のpjを予測する。例えば、雑音部分p1〜pi
の平均をとりpjとする。あるいは更に、音声信号部分
が続くときはpjに減衰係数を掛けるなどである。キャ
ンセル手段414は、前記帯域分割された信号について
、その予測された雑音を除去する手段である。一般に、
キャンセルの方法の一例として、時間軸でのキャンセレ
ーションは、図6に示すように、雑音混入音声信号(a
)から予測された雑音波形(b)を引算するものである
。それによって信号のみが取り出される(c)。また、
本実施例では、図7に示すように、周波数を基準にした
キャンセレーションで、雑音混入音声信号(a)をフー
リエ変換し(b)、それから予測雑音のスペクトル(c
)を引き(d)、それを逆フーリエ変換して、雑音の無
い音声信号を得る(e)ものである。帯域合成手段41
5は、キャンセル手段414より供給されるmチャンネ
ルの信号を逆フーリエ変換して音声出力を得る手段であ
る。前記音声切り出し手段406は、この帯域合成手段
415によって合成された信号に付いて音声切り出しを
行う。  本実施例では、このように、音声認識する対
象となる音声信号から、雑音がキャンセルされているの
で、より認識率の高い音声認識が行われる。
【0100】なお、以上の実施例において、ケプストラ
ム分析手段、最ゆう検出手段、雑音検出手段、雑音区間
算出手段、ピーク周波数検出手段、雑音予測手段、音声
検出手段、ホルマント分割手段、比較手段などは、コン
ピュータを利用してソフトウエア的に実現できるが、専
用のハード回路を用いても実現可能である。
【0101】また、本発明において、雑音とは、着目す
る信号以外の信号を意味するので、音声でも雑音として
扱われることが有り得る。
【0102】さらに、複数のくし形フィルタ手段の個数
を一個とし、時分割方法によって、制御するようにして
もよい。
【0103】
【発明の効果】以上のように本発明によれば、雑音混じ
りの音声信号から雑音成分を除去することができ、これ
によって、音声部分のみの信号を取り出すことができる
【0104】また、複数の人の音声信号に付いてそれぞ
れ区別して出力することが出来、音声認識の前段階に便
利なものである。
【0105】また、複数の人の音声信号に付いて、同時
に発せられても、それぞれ正確に区別して出力すること
が出来、雑音が除かれた音声信号に付いて、それぞれ区
別して出力することが出来る。
【0106】さらに、音声信号に付いて、その音声を発
した人をケプストラム分析を利用して特定し、その人情
報も利用するので、秘密を要するシステムなどに有効で
ある。  また、雑音を除去して、音声認識を行う場合
は、雑音が除去された信号に付いて音声認識を行えるの
で、より一層音声認識率が高くなる。
【図面の簡単な説明】
【図1】  本発明にかかる第1の実施例の信号判別装
置を示すブロック図
【図2】  本発明にかかる第2の実施例の信号判別装
置を示すブロック図
【図3】  本発明にかかる第3の実施例の雑音抑圧装
置を示すブロック図
【図4】  一般のケプストラム分析を説明するための
グラフ
【図5】  本発明における雑音予測方法を説明するた
めのグラフ
【図6】  本発明のキャンセレーション法を説明する
ための波形図
【図7】  本発明のキャンセレーション法を説明する
ための波形図
【図8】  本発明にかかる第4の実施例の信号処理装
置を示すブロック図
【図9】  本発明にかかる第5の実施例の信号処理装
置を示すブロック図
【図10】  本発明にかかる第6の実施例の信号処理
装置を示すブロック図
【図11】  本発明にかかる第7の実施例の信号処理
装置を示すブロック図
【図12】  本発明にかかる第8の実施例の信号処理
装置を示すブロック図
【図13】  本発明にかかる第9の実施例の信号処理
装置を示すブロック図
【図14】  本発明にかかる第10の実施例の信号処
理装置を示すブロック図
【図15】  本発明にかかる第11の実施例の信号処
理装置を示すブロック図
【図16】  本発明にかかる第12の実施例の信号処
理装置を示すブロック図
【図17】  本発明にかかる第13の実施例の信号処
理装置を示すブロック図
【図18】  本発明にかかる第14の実施例の音声認
識装置を示すブロック図
【図19】  本発明にかかる第15の実施例の音声認
識装置を示すブロック図
【符号の説明】
1  ケプストラム分析手段 2  記憶手段 3  信号判別手段 4  最ゆう検出手段 5  出力手段 8  雑音予測手段 9  雑音パワー算出手段 10  帯域分割手段 11  キャンセル手段 12  帯域合成手段 31  ピーク検出手段 32  音声判別手段 101  帯域分割手段 102  ケプストラム分析手段 103  ピーク周波数検出手段 104  ピーク周波数判別制御手段 105  ピーク周波数判別手段 106  スイッチ制御手段 107  スイッチ手段 108  FFT 109  ディジタルスイッチ手段 110  IFFT 111  音声検出手段 112  音声判別制御手段 113  音声判別手段 114  雑音区間算出手段 201  帯域分割手段 202  ケプストラム分析手段 203  ピーク周波数検出手段 204  ピーク周波数判別制御手段 205  ピーク周波数判別手段 206  くし形フィルタ周波数制御手段207  く
し形フィルタ 208  帯域合成手段 250  雑音区間算出手段 290  スイッチ手段 304  第1記憶手段 305  第1比較手段 306  音声切り出し手段 307  特徴検出手段 308  第2比較手段 309  第2記憶手段 310  比較出力合成手段 401  帯域分割手段 402  ケプストラム分析手段 403  ピーク周波数検出手段 404  ピーク周波数判別制御手段 405  ピーク周波数判別手段 406  スイッチ制御手段 407  スイッチ手段 408  ピーク検出手段 409  音声判別手段 410  雑音予測手段 411  キャンセル手段

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】  入力された雑音混じりの音声信号の周
    波数帯域を分割する帯域分割手段と、その帯域分割手段
    の帯域分割出力が入力され、ケプストラム分析を行うケ
    プストラム手段と、前記ケプストラム分析手段のケプス
    トラム分析結果に基づきピークを検出するピーク検出手
    段と、そのピーク検出手段によって検出されたピーク情
    報に基づき、音声部分を判別する音声判別手段と、この
    音声判別手段によって判別された音声部分情報に基づき
    、前記雑音混じりの音声信号に付いて、音声部分の雑音
    を予測する雑音予測手段と、前記帯域分割された雑音混
    じりの音声信号について、雑音予測手段によって予測さ
    れた雑音を除去するキャンセル手段と、そのキャンセル
    手段からの出力に付いて帯域合成を行なう帯域合成手段
    とを備えたことを特徴とする信号判別装置。
  2. 【請求項2】  既知の種類の信号に付いて、その所定
    の特徴情報を予め記憶している記憶手段、雑音混じりの
    信号を入力し、信号部分を判別する信号判別手段と、そ
    の信号判別手段によって判別された信号部分に付いての
    特徴情報と前記記憶手段の特徴情報とを比較し、その信
    号部分の信号種類を検出する最ゆう検出手段と、前記信
    号判別手段による結果と前記最ゆう検出手段による結果
    を対にして出力する出力手段とを備えたことを特徴とす
    る信号判別装置。
  3. 【請求項3】  上記特徴情報は、音声信号に付いての
    ケプストラム分析結果情報であり、前記最ゆう検出手段
    は、前記雑音混じりの信号に付いてケプストラム分析を
    行うケプストラム分析手段による分析結果を利用して音
    声信号部分の信号種類を検出するものであることを特徴
    とする請求項2記載の信号判別装置。
  4. 【請求項4】雑音混じりの信号に基づいて、信号部分の
    雑音を予測する雑音予測手段を備え、前記最ゆう検出手
    段は、その雑音予測手段によって予測された雑音予測値
    も考慮して信号部分の信号種類を検出するものであるこ
    とを特徴とする請求項2記載の信号判別装置。
  5. 【請求項5】  雑音混じりの信号に基づいて、信号部
    分の雑音を予測する雑音予測手段を備え、前記最ゆう検
    出手段は、その雑音予測手段によって予測された雑音予
    測値も考慮して信号部分の信号種類を検出するものであ
    ることを特徴とする請求項3記載の信号判別装置。
  6. 【請求項6】  入力された音声信号の周波数帯域を分
    割する帯域分割手段と、その帯域分割手段の帯域分割出
    力が入力され、ケプストラム分析を行うケプストラム手
    段と、そのケプストラム分析手段によって分析された分
    析結果に基づいて、ピーク周波数を検出するピーク周波
    数検出手段と、複数の人の音声のピーク周波数を順次出
    力するピーク周波数判別制御手段と、前記ピーク周波数
    検出手段によって検出されたピーク周波数と前記ピーク
    周波数判別制御手段からの各種ピーク周波数とを比較し
    て、検出されたピーク周波数がどの人のものかを判別す
    るピーク周波数判別手段と、このピーク周波数判別手段
    によって判別された判別情報に従い、スイッチ制御信号
    を出力するスイッチ制御手段と、前記入力された音声信
    号を入力し、前記スイッチ制御信号に従い、人別に区別
    して音声信号を出力するスイッチ手段とを備えたことを
    特徴とする信号処理装置。
  7. 【請求項7】  ピーク周波数検出手段で検出されたピ
    ーク周波数に基づいて、雑音区間を算出する雑音区間算
    出手段とを更に備え、前記スイッチ手段は、この雑音区
    間算出手段からの雑音区間情報を利用して、前記人別の
    音声信号の他に、雑音を区別して出力することを特徴と
    する請求項6記載の信号処理装置。
  8. 【請求項8】  入力された音声信号をフーリエ変換す
    るFFTと、そのフーリエ変換された信号に付いて、ケ
    プストラム分析を行うケプストラム手段と、そのケプス
    トラム分析手段によって分析された分析結果に基づいて
    、ピーク周波数を検出するピーク周波数検出手段と、複
    数の人の音声のピーク周波数を順次出力するピーク周波
    数判別制御手段と、前記ピーク周波数検出手段によって
    検出されたピーク周波数と前記ピーク周波数判別制御手
    段からの各種ピーク周波数とを比較して、検出されたピ
    ーク周波数がどの人のものかを判別するピーク周波数判
    別手段と、このピーク周波数判別手段によって判別され
    た判別情報に従って、スイッチ制御信号を出力するスイ
    ッチ制御手段と、前記フーリエ変換された信号に付いて
    、前記スイッチ制御信号に従い、人別に区別して音声信
    号を出力するディジタルスイッチ手段と、そのディジタ
    ルスイッチ手段からのそれぞれの出力信号を逆フーリエ
    変換するIFFTとを備えたことを特徴とする信号処理
    装置。
  9. 【請求項9】  入力された音声信号の周波数帯域を分
    割する帯域分割手段と、その帯域分割手段の帯域分割出
    力が入力され、ケプストラム分析を行うケプストラム手
    段と、その帯域分割出力が入力されホルマント分析を行
    うホルマント分析手段と、そのホルマント分析手段によ
    って分析されたホルマント分析結果と、前記ケプストラ
    ム分析手段によって分析されたケプストラム分析結果に
    基づいて、音声の特徴を検出する音声検出手段と、複数
    の人の音声の音声特徴を順次出力する音声判別制御手段
    と、前記音声検出手段によって、検出された音声特徴と
    前記音声判別制御手段からの各種特徴とを比較して、検
    出された音声特徴がどの人のものかを判別する音声判別
    手段と、この音声判別手段によって判別された判別情報
    に従い、スイッチ制御信号を出力するスイッチ制御手段
    と、前記入力された音声信号を入力し、前記スイッチ制
    御信号に従い、人別に区別して音声信号を出力するスイ
    ッチ手段とを備えたことを特徴とする信号処理装置。
  10. 【請求項10】  入力された音声信号の周波数帯域を
    分割する帯域分割手段と、その帯域分割手段の帯域分割
    出力が入力され、ケプストラム分析を行うケプストラム
    手段と、そのケプストラム分析手段によって分析された
    分析結果に基づいて、ピーク周波数を検出するピーク周
    波数検出手段と、複数の人の音声のピーク周波数を順次
    出力するピーク周波数判別制御手段と、前記ピーク周波
    数検出手段によって検出されたピーク周波数と前記ピー
    ク周波数判別制御手段からの各種ピーク周波数とを比較
    して、検出されたピーク周波数がどの人のものかを判別
    するピーク周波数判別手段と、このピーク周波数判別手
    段によって判別された判別情報に従い、くし形フィルタ
    周波数制御信号を出力するくし形フィルタ周波数制御手
    段と、前記帯域分割手段によって帯域分割された信号を
    入力し、前記くし形フィルタ周波数制御信号に従い、判
    別された音声信号のみ通過させるように、適切にそのフ
    ィルタリング機能を調整してフィルタリングするくし形
    フィルタと、そのくし形フィルタの出力に付いて、帯域
    合成を行う帯域合成手段とを備えたことを特徴とする信
    号処理装置。
  11. 【請求項11】  入力された音声信号の周波数帯域を
    分割する帯域分割手段と、その帯域分割手段の帯域分割
    出力が入力され、ケプストラム分析を行うケプストラム
    手段と、そのケプストラム分析手段によって分析された
    分析結果に基づいて、ピーク周波数を検出するピーク周
    波数検出手段と、複数の人の音声のピーク周波数を順次
    出力するピーク周波数判別制御手段と、前記ピーク周波
    数検出手段によって、検出されたピーク周波数と前記ピ
    ーク周波数判別制御手段からの各種ピーク周波数とを比
    較して、検出されたピーク周波数がどの人のものかを判
    別するピーク周波数判別手段と、このピーク周波数判別
    手段によって判別された判別情報に従い、くし形フィル
    タ周波数制御信号を出力するくし形フィルタ周波数制御
    手段と、前記ケプストラム分析手段のケプストラム分析
    結果に基づきピークを検出するピーク検出手段と、その
    ピーク検出手段によって検出されたピーク情報に基づき
    、音声部分を判別する音声判別手段と、この音声判別手
    段によって判別された音声部分情報に基づき、前記雑音
    混じりの音声信号に付いて、音声部分の雑音を予測する
    雑音予測手段と、前記帯域分割された雑音混じりの音声
    信号について、雑音予測手段によって予測された雑音を
    除去するキャンセル手段と、その雑音キャンセルされた
    信号を入力し、前記くし形フィルタ周波数制御信号に従
    い、判別された音声信号のみ通過させるように、適切に
    そのフィルタリング機能を調整してフィルタリングする
    くし形フィルタと、そのくし形フィルタの出力に付いて
    、帯域合成を行う帯域合成手段とを備えたことを特徴と
    する信号処理装置。
  12. 【請求項12】  入力された雑音混じりの音声信号の
    周波数帯域を分割する帯域分割手段と、その帯域分割手
    段の帯域分割出力が入力され、ケプストラム分析を行う
    ケプストラム手段と、そのケプストラム分析手段によっ
    て分析された分析結果に基づいて、ピーク周波数を検出
    するピーク周波数検出手段と、前記ケプストラム分析結
    果に基づいて、ホルマント分析を行うホルマント分析手
    段と、前記検出されたピーク周波数と前記ホルマント情
    報に基づき音声特徴を検出する音声検出手段と、複数の
    人の音声の特徴を順次出力する音声判別制御手段と、前
    記音声検出手段によって検出された特徴と前記音声判別
    制御手段からの各種特徴とを比較して、検出された音声
    特徴がどの人のものかを判別する音声判別手段と、この
    音声判別手段によって判別された判別情報に従い、くし
    形フィルタ周波数制御信号を出力するくし形フィルタ周
    波数制御手段と、前記ケプストラム分析手段のケプスト
    ラム分析結果に基づきピークを検出するピーク検出手段
    と、そのピーク検出手段によって検出されたピーク情報
    に基づき、音声部分を判別する音声判別手段と、この音
    声判別手段によって判別された音声部分情報に基づき、
    前記雑音混じりの音声信号に付いて、音声部分の雑音を
    予測する雑音予測手段と、前記帯域分割された雑音混じ
    りの音声信号について、雑音予測手段によって予測され
    た雑音を除去するキャンセル手段と、その雑音キャンセ
    ルされた信号を入力し、前記くし形フィルタ周波数制御
    信号に従い、判別された音声信号のみ通過させるように
    、適切にそのフィルタリング機能を調整してフィルタリ
    ングするくし形フィルタと、そのくし形フィルタの出力
    に付いて、帯域合成を行う帯域合成手段とを備えたこと
    を特徴とする信号処理装置。
  13. 【請求項13】  入力された雑音混じりの音声信号の
    周波数帯域を分割する帯域分割手段と、その帯域分割手
    段の帯域分割出力が入力され、ケプストラム分析を行う
    ケプストラム手段と、そのケプストラム分析手段によっ
    て分析された分析結果に基づいて、ピーク周波数を検出
    するピーク周波数検出手段と、複数の人の音声のピーク
    周波数を順次出力するピーク周波数判別制御手段と、前
    記ピーク周波数検出手段によって検出されたピーク周波
    数と前記ピーク周波数判別制御手段からの各種ピーク周
    波数とを比較して、検出されたピーク周波数がどの人の
    ものかを判別するピーク周波数判別手段と、このピーク
    周波数判別手段によって判別された判別情報に従い、ス
    イッチ制御信号を出力するスイッチ制御手段と、前記ケ
    プストラム分析手段のケプストラム分析結果に基づきピ
    ークを検出するピーク検出手段と、そのピーク検出手段
    によって検出されたピーク情報に基づき、音声部分を判
    別する音声判別手段と、この音声判別手段によって判別
    された音声部分情報に基づき、前記雑音混じりの音声信
    号に付いて、音声部分の雑音を予測する雑音予測手段と
    、前記帯域分割された雑音混じりの音声信号について、
    雑音予測手段によって予測された雑音を除去するキャン
    セル手段と、そのキャンセル手段からの出力に付いて帯
    域合成を行う帯域合成手段と、その帯域合成された信号
    を入力し、前記スイッチ制御信号に従い、人別に区別し
    て音声信号を出力するスイッチ手段とを備えたことを特
    徴とする信号処理装置。
  14. 【請求項14】  入力された雑音混じりの音声信号の
    周波数帯域を分割する帯域分割手段と、その帯域分割手
    段の帯域分割出力が入力され、ケプストラム分析を行う
    ケプストラム手段と、そのケプストラム分析手段によっ
    て分析された分析結果に基づいて、ピーク周波数を検出
    するピーク周波数検出手段と、前記ケプストラム分析結
    果に基づいて、ホルマント分析を行うホルマント分析手
    段と、前記検出されたピーク周波数と前記ホルマント情
    報に基づき音声特徴を検出する音声検出手段と、複数の
    人の音声の特徴を順次出力する音声判別制御手段と、前
    記音声検出手段によって、検出された特徴と前記音声判
    別制御手段からの各種特徴とを比較して、検出された音
    声特徴がどの人のものかを判別する音声判別手段と、こ
    の音声判別手段によって判別された判別情報に従い、ス
    イッチ制御信号を出力するスイッチ制御手段と、前記ケ
    プストラム分析手段のケプストラム分析結果に基づきピ
    ークを検出するピーク検出手段と、そのピーク検出手段
    によって検出されたピーク情報に基づき、音声部分を判
    別する音声判別手段と、この音声判別手段によって判別
    された音声部分情報に基づき、前記雑音混じりの音声信
    号に付いて、音声部分の雑音を予測する雑音予測手段と
    、前記帯域分割された雑音混じりの音声信号について、
    雑音予測手段によって予測された雑音を除去するキャン
    セル手段と、そのキャンセル手段からの出力に付いて前
    記スイッチ制御信号に従い、人別に区別して音声信号を
    出力するスイッチ手段と、そのスイッチ手段からの信号
    について帯域合成を行う帯域合成手段とを備えたことを
    特徴とする信号処理装置。
  15. 【請求項15】  予め既知の人の音声信号の帯域分割
    され、ケプストラム分析されて得られたピーク周波数を
    記憶した第1の記憶手段と、未知の雑音混じりの音声入
    力信号を帯域分割する帯域分割手段と、その帯域分割手
    段の出力をケプストラム分析するケプストラム分析手段
    と、そのケプストラム分析手段のケプストラム分析出力
    におけるピーク周波数を検出するピーク周波数検出手段
    と、前記ピーク周波数検出手段のピーク検出情報と前記
    第1記憶手段に記憶された各ピーク周波数とを比較し、
    その未知の音声信号が誰のものであるかを判断する第1
    比較手段と、予め各種音声の音声特徴を記憶した第2の
    記憶手段と、前記雑音混じりの音声信号から音声部分を
    切り出す音声切り出し手段と、切り出された音声の特徴
    を抽出する特徴抽出手段と、その特徴抽出手段によって
    抽出された音声特徴と前記第2記憶手段に記憶された音
    声特徴とを比較し、音声を認識する第2比較手段と、前
    記第1比較手段の比較結果と、第2比較手段の比較結果
    に基づき、所定の処理を行って出力する比較合成手段と
    を備えたことを特徴とする音声認識装置。
  16. 【請求項16】  ケプストラム分析手段によるケプス
    トラム分析結果を利用して音声部分を判別する音声判別
    手段と、その音声判別手段による音声部分情報を利用し
    て、前記帯域分割された信号について、音声部分の雑音
    を予測する雑音予測手段と、前記帯域分割された信号に
    ついて、その予測された雑音を除去するキャンセル手段
    と、そのキャンセル手段の出力を帯域合成する帯域合成
    手段とを備え、前記音声切り出し手段は、この帯域合成
    手段によって合成された信号に付いて切り出しを行うこ
    とを特徴とする請求項15記載の音声認識装置。
JP3118260A 1990-05-28 1991-05-23 音声信号処理装置 Pending JPH04230796A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3118260A JPH04230796A (ja) 1990-05-28 1991-05-23 音声信号処理装置

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
JP2-138067 1990-05-28
JP13806390 1990-05-28
JP2-138061 1990-05-28
JP2-138053 1990-05-28
JP13805390 1990-05-28
JP13806790 1990-05-28
JP2-138062 1990-05-28
JP2-138063 1990-05-28
JP13806190 1990-05-28
JP13806290 1990-05-28
JP3118260A JPH04230796A (ja) 1990-05-28 1991-05-23 音声信号処理装置

Publications (1)

Publication Number Publication Date
JPH04230796A true JPH04230796A (ja) 1992-08-19

Family

ID=27552518

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3118260A Pending JPH04230796A (ja) 1990-05-28 1991-05-23 音声信号処理装置

Country Status (1)

Country Link
JP (1) JPH04230796A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001249676A (ja) * 2000-03-06 2001-09-14 Japan Science & Technology Corp 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法
JP2002306492A (ja) * 2001-04-16 2002-10-22 Electronic Navigation Research Institute カオス論的ヒューマンファクタ評価装置
JP2003065836A (ja) * 2001-08-28 2003-03-05 Nippon Telegr & Teleph Corp <Ntt> 雑音源判別装置及び方法
JP2003280696A (ja) * 2002-03-19 2003-10-02 Matsushita Electric Ind Co Ltd 音声強調装置及び音声強調方法
JP2005148301A (ja) * 2003-11-13 2005-06-09 Sony Corp 音声処理装置と音声処理方法
KR100717396B1 (ko) * 2006-02-09 2007-05-11 삼성전자주식회사 로컬 스펙트럴 정보를 이용하여 음성 인식을 위한 유성음을판단하는 방법 및 장치
JP2018136233A (ja) * 2017-02-23 2018-08-30 セコム株式会社 物体検出装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001249676A (ja) * 2000-03-06 2001-09-14 Japan Science & Technology Corp 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法
JP2002306492A (ja) * 2001-04-16 2002-10-22 Electronic Navigation Research Institute カオス論的ヒューマンファクタ評価装置
JP2003065836A (ja) * 2001-08-28 2003-03-05 Nippon Telegr & Teleph Corp <Ntt> 雑音源判別装置及び方法
JP2003280696A (ja) * 2002-03-19 2003-10-02 Matsushita Electric Ind Co Ltd 音声強調装置及び音声強調方法
JP2005148301A (ja) * 2003-11-13 2005-06-09 Sony Corp 音声処理装置と音声処理方法
KR100717396B1 (ko) * 2006-02-09 2007-05-11 삼성전자주식회사 로컬 스펙트럴 정보를 이용하여 음성 인식을 위한 유성음을판단하는 방법 및 장치
JP2018136233A (ja) * 2017-02-23 2018-08-30 セコム株式会社 物体検出装置

Similar Documents

Publication Publication Date Title
US5617505A (en) Speech signal processing apparatus for cutting out a speech signal from a noisy speech signal
KR950013551B1 (ko) 잡음신호예측장치
US5583961A (en) Speaker recognition using spectral coefficients normalized with respect to unequal frequency bands
Delcroix et al. Compact network for speakerbeam target speaker extraction
US20180137880A1 (en) Phonation Style Detection
WO2011046474A2 (ru) Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания
US5220610A (en) Speech signal processing apparatus for extracting a speech signal from a noisy speech signal
JPH0431898A (ja) 音声雑音分離装置
Hsu et al. Voice activity detection based on frequency modulation of harmonics
JPH04230796A (ja) 音声信号処理装置
Maazouzi et al. MFCC and similarity measurements for speaker identification systems
Lee et al. Cochannel speech separation
JP3106543B2 (ja) 音声信号処理装置
EP1102240A1 (en) Interval normalization device for voice recognition input voice
CN113707156B (zh) 一种用于车载的语音识别方法及系统
US20030046069A1 (en) Noise reduction system and method
Bhukya et al. End point detection using speech-specific knowledge for text-dependent speaker verification
JP4328423B2 (ja) 音声識別装置
JPH04227338A (ja) 音声信号処理装置
Every et al. Enhancement of harmonic content of speech based on a dynamic programming pitch tracking algorithm.
JPH04230798A (ja) 雑音予測装置
JPH05165492A (ja) 音声認識装置
Kyriakides et al. Isolated word endpoint detection using time-frequency variance kernels
KR950001071B1 (ko) 음성신호처리장치
JPH09127982A (ja) 音声認識装置