JP2002182689A - 音声信号分離方法及び装置 - Google Patents

音声信号分離方法及び装置

Info

Publication number
JP2002182689A
JP2002182689A JP2000384745A JP2000384745A JP2002182689A JP 2002182689 A JP2002182689 A JP 2002182689A JP 2000384745 A JP2000384745 A JP 2000384745A JP 2000384745 A JP2000384745 A JP 2000384745A JP 2002182689 A JP2002182689 A JP 2002182689A
Authority
JP
Japan
Prior art keywords
consonant
signal
audio signal
vowel
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000384745A
Other languages
English (en)
Other versions
JP4710130B2 (ja
Inventor
Kazunobu Kondou
多伸 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2000384745A priority Critical patent/JP4710130B2/ja
Publication of JP2002182689A publication Critical patent/JP2002182689A/ja
Application granted granted Critical
Publication of JP4710130B2 publication Critical patent/JP4710130B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 非音声信号側の経時的な変化に追従可能で、
且つ子音部分も精度良く分離可能にする。 【解決手段】 母音処理部1は、混合信号Iに含まれる
基本周波数fに基づいて混合信号Iから音声信号の母音
部分を検出し、母音信号Vvと、その他の信号O1とに
分離する。子音処理部2では、混合信号Iのスペクトル
包絡の特徴や特定帯域のパワー等に基づいて混合信号I
から音声信号に含まれる子音部分を検出し、混合信号I
を子音信号Vcとその他の信号O2とに分離する。母音
・子音判定部3は、母音処理部1からの母音/非母音判
定結果v/oと子音処理部2からの子音/非子音判定結
果c/oとに基づいて、母音区間、子音区間及び非音声
区間を判定し、切替部4の切替制御を行う。切替部4
は、母音・子音判定部3により切替制御され、母音区間
では母音処理部1で分離された母音信号Vvとその他の
信号O1とを、また非母音区間では子音処理部2で分離
された子音信号Vcとその他の信号O2とを選択し、そ
れぞれ音声信号V及びその他の信号Oとして出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、音声信号を含む
混合信号から音声信号のみを分離して音声信号及びその
他の信号の少なくとも一方を抽出する音声信号分離方法
及び装置に関する。
【0002】
【従来の技術】複数の音響信号が混在した信号から、特
定の信号を強調・抑圧したり分離抽出する技術が知られ
ている。音声信号に対しては、雑音と音声信号が混在し
た音響信号から雑音のみを抑圧する雑音抑圧方式(例え
ば特開平9−153769号、特開平9−212196
号等)が、音楽に対しては演奏に含まれる旋律の分離や
除去に関する方式(特開平11−143460号等)が
様々に提案されている。
【0003】雑音抑圧方式は、例えば信号増幅器などの
音響処理装置において、聴取したい音声信号が雑音に埋
もれてしまい、目的の音声信号が聴き難いといった問題
に対処する。また、音楽に対する分離や除去の方式は、
例えばある旋律だけを除いてカラオケのようなものを作
成したりする。
【0004】特開平9−212196号では、スペクト
ラルサブトラクションと呼ばれる手法によって雑音抑圧
を実現している。これは、入力信号中の音声/非音声を
検出し、非音声区間で代表的な雑音振幅スペクトルを求
め、音声区間でこれを入力信号の振幅スペクトルから差
し引くことで雑音を抑圧する。合成時の位相成分につい
ては、混合された状態のときのものを用いる。ここで
は、音声の母音が整数次倍音構造を持っていることを利
用して、基本周波数とその倍音成分のパワーを加算した
ものを指標として、非音声の検出をしている。特開平9
−212196号では、この指標に対する閾値を小さく
することで、確実に雑音であると思われる区間から代表
的な雑音スペクトルを求め、音声の子音の影響を小さく
している。
【0005】特開平11−143460号では、楽器音
が整数次倍音構造を持っているものが多いことから、基
本周波数とその倍音成分を同一楽器からの音であると判
断している。そして、これらの周波数成分の時刻、振
幅、位相の情報に基づいて波形を加算合成することで抽
出や除去後の音を合成している。
【0006】
【発明が解決しようとする課題】雑音抑圧方式では、非
音声信号とは雑音のことであり、これは不要なものであ
る。従って、基本的には音声の抑圧された非音声側の信
号を得ることはない。特開平9−212196号に開示
されたスペクトラルサブトラクション法では、子音部分
でも母音部分でも同じ抑圧処理をしている。ここでは、
経時的に平均した代表的雑音スペクトルを用いているた
め、音声とその他の信号の混在区間で雑音抑圧方式に変
更を加えずに非音声側の信号を出力しようと思った場
合、常に代表的雑音スペクトルが出力されることになっ
てしまい、非音声信号側の経時的な変化に追従できな
い。
【0007】また、音楽に対する分離や除去の方式で
は、整数次倍音構造を持たない信号は、全てその他の信
号として処理されてしまうため、基本周波数の存在しな
い音声の子音部分に関しては、非音声信号に残留してし
まう。非音声信号に対して適切な効果を与える場合に、
残留した子音部分によってその効果が損なわれてしま
う。例えばテレビのスポーツ実況に残響を付加し、臨場
感を高める場合、実況音声と環境音信号とを分離し、環
境音のみに残響付加することが望ましい。しかし、環境
音側に子音部分だけが残ると、この子音にも残響付加さ
れ、高めたいはずの臨場感を損なってしまう。
【0008】この発明は、このような問題点に鑑みなさ
れたもので、非音声信号側の経時的な変化に追従可能
で、且つ子音部分も精度良く分離可能な音声分離方法及
び装置を提供することを目的とする。
【0009】
【課題を解決するための手段】この発明に係る音声信号
分離方法は、音声信号とその他の信号とが混合された混
合信号から音声信号を分離して前記音声信号及びその他
の信号の少なくとも一方を抽出する音声信号分離方法に
おいて、前記混合信号から整数次倍音構造に基づいて前
記音声信号のうちの母音部分を検出して分離する母音処
理ステップと、前記混合信号又は前記混合信号から前記
母音部分を分離した残りの信号を子音判定対象信号と
し、この子音判定対象信号から子音の特性に基づいて前
記音声信号のうちの子音部分を検出して分離する子音処
理ステップと、前記母音処理ステップで検出された音声
信号の母音部分と前記子音処理ステップで検出された音
声信号の子音部分とによって音声信号を分離して前記音
声信号及びその他の信号の少なくとも一方を抽出する出
力ステップとを備えたことを特徴とする。
【0010】また、この発明に係る音声信号分離装置
は、音声信号とその他の信号とが混合された混合信号か
ら音声信号を分離して前記音声信号及びその他の信号の
少なくとも一方を抽出する音声信号分離装置において、
前記混合信号から整数次倍音構造に基づいて前記音声信
号のうちの母音部分を検出して分離する母音処理手段
と、前記混合信号又は前記混合信号から前記母音部分を
分離した残りの信号を子音判定対象信号とし、この子音
判定対象信号から子音の特性に基づいて前記音声信号の
うちの子音部分を検出して分離する子音処理手段と、前
記母音処理手段で検出された音声信号の母音部分と前記
子音処理手段で検出された音声信号の子音部分とによっ
て音声信号を分離して前記音声信号及びその他の信号の
少なくとも一方を抽出する出力手段とを備えたことを特
徴とする。
【0011】この発明によれば、音声信号とその他の信
号とが混合された混合信号から整数次倍音構造に基づい
て音声信号のうちの母音部分を抽出すると共に、混合信
号又は混合信号から母音部分を分離した残りの信号を子
音対象信号として、この子音対象信号から子音の特性に
基づいて子音部分を検出してこれを分離するようにして
いるので、母音部分と子音部分とが分離された残りの非
音声信号は、経時的変化が反映されたものとなる。ま
た、子音部分を含んで音声信号が混合信号から分離され
るので、非音声信号に子音部分が含まれることがなく、
非音声信号を処理する場合にも、精度の良い処理が可能
になる。
【0012】なお、ここで“母音”とは、この明細書で
は、母音のみならず、整数次倍音構造を持つ有声子音も
含む。また、“子音”とは、整数次倍音構造を持たない
無声子音を意味する。子音処理時において子音区間を検
出するために使用される子音の特性としては、例えば子
音判定対象信号のスペクトル包絡、特定帯域のパワー
(例えば4〜10kHz程度)等を使用することができ
る。スペクトル包絡を使用する場合、子音処理では、例
えば混合信号から母音部分を分離した残りの信号のうち
非子音区間のスペクトル包絡を経時的に蓄積し、この経
時的に蓄積した非子音区間のスペクトル包絡と子音判定
対象信号のスペクトル包絡との距離を定量的に評価して
子音区間を検出する様にすればよい。また、予め学習さ
れた代表的な子音のスペクトル包絡と子音判定対象信号
のスペクトル包絡との距離を定量的に評価するようにし
ても良い。スペクトル包絡間の距離尺度としては、例え
ば線形予測係数に対する最尤スペクトル距離、LPC
(線形予測)ケプストラム距離等を使用することができ
る。更に、特定帯域のパワーを使用する場合には、特定
帯域のパワーと所定の閾値との比較を行えば良い。
【0013】また、子音処理では、混合信号から母音部
分を分離した残りの信号のうち非子音区間のスペクトル
包絡を経時的に蓄積し、この経時的に蓄積した非子音区
間のスペクトル包絡と子音判定対象信号のスペクトル包
絡との間で顕著に異なる帯域を分離する帯域として特定
するようにすればよい。この他、混合信号から母音部分
を分離した残りの信号のうち非子音区間のスペクトル包
絡を経時的に蓄積し、この経時的に蓄積した非子音区間
のスペクトル包絡を現在対象としている子音判定対象信
号のパワーで正規化したスペクトル包絡と子音判定対象
信号のスペクトル包絡との間で所定の閾値以上の関係を
有する帯域を分離する帯域として特定するようにしても
良い。
【0014】なお、子音部分の分離は、時間領域の信号
に対しては、例えばバンドパスフィルタやノッチフィル
タによる特定帯域のゲイン処理によって行うことがで
き、周波数領域の信号に対しては、例えばスペクトラル
サブトラクションにより行うことができる。
【0015】
【発明の実施の形態】以下、図面を参照して、この発明
の好ましい実施の形態について説明する。図1は、この
発明の一実施例に係る音声信号分離システムの構成を示
すブロック図である。音声信号とその他の信号(環境
音、背景音、雑音等)とを含む混合信号Iは、母音処理
部1と子音処理部2とに入力されている。母音処理部1
では、混合信号Iに含まれる基本周波数fに基づいて混
合信号Iから音声信号の母音部分を検出し、母音信号V
vと、その他の信号O1とに分離する。子音処理部2で
は、混合信号Iのスペクトル包絡の特徴や特定帯域のパ
ワー等に基づいて混合信号Iから音声信号に含まれる子
音部分を検出し、混合信号Iを子音信号Vcとその他の
信号O2とに分離する。母音・子音判定部3は、母音処
理部1からの母音/非母音判定結果v/oと子音処理部
2からの子音/非子音判定結果c/oとに基づいて、母
音区間、子音区間及び非音声区間を判定し、切替部4の
切替制御を行う。切替部4は、母音・子音判定部3によ
り切替制御され、母音区間では母音処理部1で分離され
た母音信号Vvとその他の信号O1とを、また非母音区
間では子音処理部2で分離された子音信号Vcとその他
の信号O2とを選択し、それぞれ音声信号V及びその他
の信号Oとして出力する。また、非子音区間では母音処
理部1で分離された母音信号Vvとその他の信号O1と
を、子音区間では子音処理部2で分離された子音信号V
cとその他の信号O2とを選択し、それぞれ音声信号V
及びその他の信号Oとして出力するようにしても良い。
【0016】図2は、この発明の他の実施例に係る音声
分離システムの構成を示すブロック図である。母音処理
部1、子音処理部2及び母音・子音判定部3は、上述し
た実施例と同様のものであるが、この実施例では、子音
処理部2が母音処理部1で母音信号Vvを抑圧したその
他の信号O1を子音判定対象信号として入力し、母音信
号成分が除去された状態で子音部分と非子音部分とを検
出し、子音信号Vcとその他の信号O2とに分離する点
が異なっている。この場合には、母音信号成分が除去さ
れた信号に対して子音検出を行うため、先の実施例より
も検出精度は上がる。子音処理部2で分離された子音信
号Vcは、母音処理部1で分離された母音信号Vvに加
算器5で加算されて音声信号Vとして出力される。ま
た、母音処理部1で分離されたその他の信号O1と子音
処理部2で分離されたその他の信号O2とは、母音・子
音判定部3での切替制御に従って切替器6よって切り替
え他の信号Oとして出力される。
【0017】これらの実施例において、母音処理部1
は、例えば図3に示すように構成されている。混合信号
Iは、先ず周波数分析部11に入力される。周波数分析
部11は、ハニング窓部111とFFT(高速フーリエ
変換)部112とからなる。混合信号Iは、ハニング窓
部111でフレーム分割されたのち、FFT部112に
より周波数分析される。FFT部112での周波数分析
結果は、基本周波数検出部12と母音分離部13とに入
力されている。基本周波数検出部12では、FFT部1
12による周波数分析結果から整数次倍音構造を評価し
て基本周波数f′を推定する。母音分離部13では、基
本周波数検出部12で検出された基本周波数f′から整
数次倍音構造の各周波数成分の振幅を振幅推定部131
1,1312,…,131nで推定する。各周波数成分の
振幅は、例えば複素スペクトル内挿法によって推定する
ことができる。複素スペクトル内挿法は、複素平面上で
ピークに隣接する複素ベクトルから内積によって真のピ
ークを求める手法であり、これによりハニング窓対応補
正された基本周波数f及びその倍音周波数2f,3f,
…,nfと、その振幅とが求められる。各補正周波数
f,2f,3f,…,nfは、位相推定部1321,1
322,…,132nに入力されここで、ハニング窓の特
性と該当周波数成分の前後の周波数サンプル値とから位
相を推定することができる。これにより線スペクトルが
推定され、そこからハニング窓による影響(メインロー
ブ、サイドローブ)を排除することができる。このよう
にして求められた整数次倍音構造は、FFT部112の
周波数分析結果から減算器133によって減算されると
共に、IFFT(逆FFT)部134によって時間領域
の信号に戻される。また、減算器133の減算結果もI
FFT部135によって時間領域の信号に戻される。こ
れらは、フレーム間のつなぎ部分を滑らかにするため、
加算器136,137においてオーバーラップ/アド用
データ138,139とそれぞれ加算されて、加算器1
36からは混合信号Iから母音信号成分のみ強調された
母音信号Vvが、また加算器137混合信号Iから母音
信号成分が抑圧されたその他の信号O1が生成出力され
る。
【0018】図4は、図1及び図2の実施例における子
音処理部2の構成例を示すブロック図、図5は、この子
音処理部2における子音区間検出処理を示すフローチャ
ートとである。混合信号I(図2の実施例では他の信号
O1)は、子音特徴量計算手段であるLPC(線形予
測)分析部21に与えられ、ここで特徴量計算が実行さ
れる。ここでは、子音のうち特に目立つ無声子音の特徴
量として、スペクトル包絡特性を計算する。スペクトル
包絡特性にて特徴量評価を行うためには、まず、LPC
係数を計算する(S1,S2,S3)。LPC分析部2
1では、過去の標本値から現時点での標本値を予測す
る。このときの予測係数をLPC係数という。LPC分
析では、共分散法や自己相関法にて直接LPC係数を求
める方法もあるが、PARCOR分析によるPARCO
R係数、LSP(線スペクトル対)分析によるLSP係
数と、LPC係数とは相互に変換可能である。ここで、
PARCOR分析、LSP分析は、いずれもLPC分析
法の一種であるが、より性能の改善された手法である。
【0019】特徴量評価部22では、次にLPCケプス
トラム距離計算部221において、非無声子音区間に経
時的に平均したLPC係数222との間のLPCケプス
トラム距離Dcepを計算する(S6,S7,S8)。L
PC係数を経時的に平均化する場合には、求めたLPC
係数(S4)をLSP係数(S14)に変換して、平均
を計算すると良い(S15,S16,S17)。LSP
係数はLPC係数やPARCOR係数よりも補間性能が
良いため、平均操作に適している。そして平均化後のL
SP係数をLPC係数に戻す。これにより、平均化後の
LPC係数を得る。また、ここで言う経時的な平均化と
は、信号の入力の開始から現在までのLPC係数の全て
を重み付け加算することを言う。具体的には、以下のよ
うな計算を行えば良い。
【0020】
【数1】avg(i)=w*cur(i)+(1−w)
*avg(i−1)
【0021】なお、ここで、cur(i)は現在のLP
C係数、avg(i)は経時平均LPC係数、wは重み
関数である。また、経時的に平均化したLPC係数22
2の算出精度を高めるため、母音処理部1からの他の信
号O1をLPC分析部21に供給してピッチが存在する
母音検出区間においても、平均化処理を続行することが
望ましい(S5,S14,S15,S16)。
【0022】なお、このとき、経時的に平均したLPC
係数222ではなく、予め求めておいた代表的な無声子
音のLPC係数との距離を計算するようにしても良い。
予め求めておく代表的な無声子音のLPC係数は、音声
認識データベース等から流用可能である。また、LPC
ケプストラム距離やここでは用いていないが最尤スペク
トル距離等は、音声認識においてLPC係数間(スペク
トル包絡間)の距離尺度として用いられているものであ
る。
【0023】また、無声子音には、有声音と比較して比
較的高い4kHz以上の周波数成分が多く含まれている
ことが一般に知られている。このため、子音判定部22
3は、LPC分析部21で求めた入力信号のスペクトル
包絡特性224から4kHz以上の帯域の振幅を閾値と
比較し、高いレベルにある帯域を検出する。これは、あ
まり高い周波数帯域まで調べる必要はなく、10kHz
程度までで十分である。比較結果をパラメータDspecと
して数値化する(S9,S10,S11)。
【0024】子音判定部223は、計算されたDcep及
びDspecと、それぞれ事前に調査して求めた閾値ThDc
ep及びThDspecとを比較する(S12)。これらの総
合判定結果から、当該区間が無声子音であるかどうかの
判定を行う(S13)。なお、閾値ThDcepやThDspe
cは入力信号に適応して動的に制御することも可能であ
る。無声子音と判定された場合には、入力信号I又はO
1と経時的平均LPC係数222とからそれぞれのスペ
クトル包絡特性224,225を求め、これを各周波数
成分に対して比較する(S9,S18,S19)。この
とき、信号パワーへの依存性を減らすため、スペクトル
包絡は正規化したものを用いると良い。比較によって経
時的平均スペクトル包絡特性225に対して、入力の方
が高い周波数を特定する(S20)。これは、音声信号
Vのミックスレベルがその他の信号Oよりも高いレベル
にある場合に相当する。一般の実況放送等では、この条
件は十分満たされている。
【0025】子音分離部24では、特定された帯域に、
FFT部23でのFFT結果の振幅スペクトルのゲイン
操作を行ったり、時間軸上でフィルタリングすること
で、無声子音の強調・抑圧が可能となる。振幅スペクト
ルのゲイン操作を行った場合、得られた無声子音信号と
その他の信号とをIFFT部25,26でそれぞれ時間
軸上の信号に戻すことで子音信号Vvとその他の信号O
2とが得られる。
【0026】図1において説明したように、出力時に
は、ピッチ周波数の有無による母音区間判定、上述した
子音区間判定の結果を用いて、母音処理部1からの出力
Vv,O1を用いるか、子音処理部2からの出力Vc,
O2を用いるかを切替部4で切り替えるが、このとき、
図6に示すように、母音区間、子音区間及び非音声区間
の信号を滑らかに接続するため、ハニング窓等のオーバ
ーラップ/アドデータ41,42を用いて加算器43,
44にて信号Vv/Vc,O1/O2をオーバーラップ
/アド処理して出力信号V,Oを得ることが望ましい。
【0027】図7は、上述したシステムの適用例を示す
ものである。同図(a)は混合信号Iを音声信号Vと他
の信号Oとに分離する強調・抑圧部501にこの発明を
適用している。分離された音声信号Vと他の信号Oに
は、信号処理部502,503によってそれぞれ別々の
信号処理が施され、音声信号V′及び他の信号O′とし
て出力される。同図(b)は、非音声信号である他の信
号Oに対する処理の例として、テレビの実況中継におけ
る音場制御の例を示している。テレビ601から出力さ
れる実況中継の音響信号(混合信号I)は、この発明に
係る強調・抑圧部602で実況音声(V)と、環境音
(O)とに分離される。実況音声については視聴者60
3の前方のフロントスピーカ604から出力される。環
境音については、残響付加部605で残響成分が付加さ
れて、視聴者603の前後左右に配置された4つのスピ
ーカ606,607,608,609から出力される。
これにより臨場感が向上する。同図(c)は、音声認識
の例である。即ち、音声強調部701は、入力音響信号
Iから音声信号V以外の他の信号(雑音)Oを抑圧し
て、これにより音声信号Vを分離抽出する。音声認識部
702は、分離抽出された音声信号Vに対して音声認識
処理を実行する。このように音声認識において不要な周
囲雑音を取り除くことで音声認識精度が向上する。この
場合、他の信号Oは、不要な雑音成分なので、音声強調
部701は音声信号Vのみを抽出する。
【0028】
【発明の効果】以上述べたように、この発明によれば、
音声信号とその他の信号とが混合された混合信号から整
数次倍音構造に基づいて音声信号のうちの母音部分を抽
出すると共に、混合信号又は混合信号から母音部分を分
離した残りの信号を子音対象信号として、この子音対象
信号から子音の特性に基づいて子音部分を検出してこれ
を分離するようにしているので、母音部分と子音部分と
が分離された残りの非音声信号は、経時的変化が反映さ
れたものとなり、且つ子音部分を含んで音声信号が混合
信号から分離されるので、非音声信号に子音部分が含ま
れることがなく、非音声信号を処理する場合にも、精度
の良い処理が可能になるという効果を奏する。
【図面の簡単な説明】
【図1】 この発明の一実施例に係る音声信号分離シス
テムのブロック図である。
【図2】 この発明の他の実施例に係る音声信号分離シ
ステムのブロック図である。
【図3】 図2及び図3の実施例における音声処理部の
構成を示すブロック図である。
【図4】 図2及び図3の実施例における子音処理部の
構成を示すブロック図である。
【図5】 子音処理部における子音区間検出処理を示す
フローチャートである。
【図6】 図1のシステムの出力部分の変形例を示す図
である。
【図7】 同システムの応用例を示すブロック図であ
る。
【符号の説明】
1…母音処理部、2…子音処理部、3…母音・子音判定
部、4,6…切替部、5…加算器、11…周波数分析
部、12…基本周波数検出部、13…母音分離部、21
…LPC分析部、22…特徴量評価部、24…子音分離
部。

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 音声信号とその他の信号とが混合された
    混合信号から音声信号を分離して前記音声信号及びその
    他の信号の少なくとも一方を抽出する音声信号分離方法
    において、 前記混合信号から整数次倍音構造に基づいて前記音声信
    号のうちの母音部分を検出して分離する母音処理ステッ
    プと、 前記混合信号又は前記混合信号から前記母音部分を分離
    した残りの信号を子音判定対象信号とし、この子音判定
    対象信号から子音の特性に基づいて前記音声信号のうち
    の子音部分を検出して分離する子音処理ステップと、 前記母音処理ステップで検出された音声信号の母音部分
    と前記子音処理ステップで検出された音声信号の子音部
    分とによって音声信号を分離して前記音声信号及びその
    他の信号の少なくとも一方を抽出する出力ステップとを
    備えたことを特徴とする音声信号分離方法。
  2. 【請求項2】 前記子音処理ステップは、前記子音の特
    性として前記子音判定対象信号のスペクトル包絡に基づ
    いて前記音声信号のうちの子音区間を検出するステップ
    であることを特徴とする請求項1記載の音声信号分離方
    法。
  3. 【請求項3】 前記子音処理ステップは、前記混合信号
    から前記母音部分を分離した残りの信号のうち非子音区
    間のスペクトル包絡を経時的に蓄積し、この経時的に蓄
    積した非子音区間のスペクトル包絡と前記子音判定対象
    信号のスペクトル包絡との距離を定量的に評価して前記
    音声信号のうちの子音区間を検出するステップであるこ
    とを特徴とする請求項2記載の音声信号分離方法。
  4. 【請求項4】 前記子音処理ステップは、予め学習され
    た代表的な子音のスペクトル包絡と前記子音判定対象信
    号のスペクトル包絡との距離を定量的に評価して前記音
    声信号のうちの子音区間を検出するステップであること
    を特徴とする請求項2記載の音声信号分離方法。
  5. 【請求項5】 前記子音処理ステップは、前記子音判定
    対象信号の特定帯域のパワーに基づいて前記音声信号の
    うちの子音区間を検出するステップであることを特徴と
    する請求項1〜4のいずれか1項記載の音声信号分離方
    法。
  6. 【請求項6】 前記子音処理ステップは、前記混合信号
    から前記母音部分を分離した残りの信号のうち非子音区
    間のスペクトル包絡を経時的に蓄積し、この経時的に蓄
    積した非子音区間のスペクトル包絡と前記子音判定対象
    信号のスペクトル包絡との間で顕著に異なる帯域を分離
    する帯域として特定することを特徴とする請求項1〜5
    のいずれか1項記載の音声信号分離方法。
  7. 【請求項7】 前記子音処理ステップは、前記混合信号
    から前記母音部分を分離した残りの信号のうち非子音区
    間のスペクトル包絡を経時的に蓄積し、この経時的に蓄
    積した非子音区間のスペクトル包絡を現在対象としてい
    る前記子音判定対象信号のパワーで正規化したスペクト
    ル包絡と前記子音判定対象信号のスペクトル包絡との間
    で所定の閾値以上の関係を有する帯域を分離する帯域と
    して特定することを特徴とする請求項1〜5のいずれか
    1項記載の音声信号分離方法。
  8. 【請求項8】 音声信号とその他の信号とが混合された
    混合信号から音声信号を分離して前記音声信号及びその
    他の信号の少なくとも一方を抽出する音声信号分離装置
    において、 前記混合信号から整数次倍音構造に基づいて前記音声信
    号のうちの母音部分を検出して分離する母音処理手段
    と、 前記混合信号又は前記混合信号から前記母音部分を分離
    した残りの信号を子音判定対象信号とし、この子音判定
    対象信号から子音の特性に基づいて前記音声信号のうち
    の子音部分を検出して分離する子音処理手段と、 前記母音処理手段で検出された音声信号の母音部分と前
    記子音処理手段で検出された音声信号の子音部分とによ
    って音声信号を分離して前記音声信号及びその他の信号
    の少なくとも一方を抽出する出力手段とを備えたことを
    特徴とする音声信号分離装置。
  9. 【請求項9】 前記子音処理手段は、前記子音の特性と
    して前記子音判定対象信号のスペクトル包絡に基づいて
    前記音声信号のうちの子音区間を検出する手段であるこ
    とを特徴とする請求項8記載の音声信号分離装置。
  10. 【請求項10】 前記子音処理手段は、前記混合信号か
    ら前記母音部分を分離した残りの信号のうち非子音区間
    のスペクトル包絡を経時的に蓄積し、この経時的に蓄積
    した非子音区間のスペクトル包絡と前記子音判定対象信
    号のスペクトル包絡との距離を定量的に評価して前記音
    声信号のうちの子音区間を検出する手段であることを特
    徴とする請求項9記載の音声信号分離装置。
  11. 【請求項11】 前記子音処理手段は、予め学習された
    代表的な子音のスペクトル包絡と前記子音判定対象信号
    のスペクトル包絡との距離を定量的に評価して前記音声
    信号のうちの子音区間を検出する手段であることを特徴
    とする請求項9記載の音声信号分離装置。
  12. 【請求項12】 前記子音処理手段は、前記子音判定対
    象信号の特定帯域のパワーに基づいて前記音声信号のう
    ちの子音区間を検出する手段であることを特徴とする請
    求項8〜11のいずれか1項記載の音声信号分離装置。
  13. 【請求項13】 前記子音処理手段は、前記混合信号か
    ら前記母音部分を分離した残りの信号のうち非子音区間
    のスペクトル包絡を経時的に蓄積し、この経時的に蓄積
    した非子音区間のスペクトル包絡と前記子音判定対象信
    号のスペクトル包絡との間で顕著に異なる帯域を分離す
    る帯域として特定することを特徴とする請求項8〜12
    のいずれか1項記載の音声信号分離装置。
  14. 【請求項14】 前記子音処理手段は、前記混合信号か
    ら前記母音部分を分離した残りの信号のうち非子音区間
    のスペクトル包絡を経時的に蓄積し、この経時的に蓄積
    した非子音区間のスペクトル包絡を現在対象としている
    前記子音判定対象信号のパワーで正規化したスペクトル
    包絡と前記子音判定対象信号のスペクトル包絡との間で
    所定の閾値以上の関係を有する帯域を分離する帯域とし
    て特定することを特徴とする請求項8〜12のいずれか
    1項記載の音声信号分離装置。
JP2000384745A 2000-12-19 2000-12-19 音声信号分離方法及び装置 Expired - Fee Related JP4710130B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000384745A JP4710130B2 (ja) 2000-12-19 2000-12-19 音声信号分離方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000384745A JP4710130B2 (ja) 2000-12-19 2000-12-19 音声信号分離方法及び装置

Publications (2)

Publication Number Publication Date
JP2002182689A true JP2002182689A (ja) 2002-06-26
JP4710130B2 JP4710130B2 (ja) 2011-06-29

Family

ID=18852136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000384745A Expired - Fee Related JP4710130B2 (ja) 2000-12-19 2000-12-19 音声信号分離方法及び装置

Country Status (1)

Country Link
JP (1) JP4710130B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04230800A (ja) * 1990-05-28 1992-08-19 Matsushita Electric Ind Co Ltd 音声信号処理装置
JPH10124090A (ja) * 1996-10-24 1998-05-15 Nippon Telegr & Teleph Corp <Ntt> 音声認識方法およびこの方法を実施する装置
JP2000152394A (ja) * 1998-11-13 2000-05-30 Matsushita Electric Ind Co Ltd 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04230800A (ja) * 1990-05-28 1992-08-19 Matsushita Electric Ind Co Ltd 音声信号処理装置
JPH10124090A (ja) * 1996-10-24 1998-05-15 Nippon Telegr & Teleph Corp <Ntt> 音声認識方法およびこの方法を実施する装置
JP2000152394A (ja) * 1998-11-13 2000-05-30 Matsushita Electric Ind Co Ltd 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CSNG199700199014, 奥乃 博 HIROSHI G. OKUNO, "音声ストリーム分離法の提案と複数音声の同時認識の予備実験 Speech Stream Segregation and Preliminary", 情報処理学会論文誌 Transactions of Information Processing Society of Japan, 19970315, 第38巻, P.510−P.523, JP, 社団法人情報処理学会 Information Processing Socie *

Also Published As

Publication number Publication date
JP4710130B2 (ja) 2011-06-29

Similar Documents

Publication Publication Date Title
US9264003B2 (en) Apparatus and method for modifying an audio signal using envelope shaping
US8271279B2 (en) Signature noise removal
EP2546831B1 (en) Noise suppression device
US6044341A (en) Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice
JP3033061B2 (ja) 音声雑音分離装置
JP2000330597A (ja) 雑音抑圧装置
JP2001051687A (ja) 合成音生成装置
JPH08160994A (ja) 雑音抑圧装置
JP4123835B2 (ja) 雑音抑圧装置および雑音抑圧方法
JP2007093635A (ja) 既知雑音除去装置
Zhao et al. A processing method for pitch smoothing based on autocorrelation and cepstral F0 detection approaches
JP4710130B2 (ja) 音声信号分離方法及び装置
JP2001222289A (ja) 音響信号分析方法及び装置並びに音声信号処理方法及び装置
JP4125322B2 (ja) 基本周波数抽出装置、その方法、そのプログラム並びにそのプログラムを記録した記録媒体
JP3106543B2 (ja) 音声信号処理装置
JP2002258899A (ja) 雑音抑圧方法および雑音抑圧装置
JP4612468B2 (ja) 信号抽出装置
JPH1138997A (ja) 雑音抑圧装置および音声の雑音除去の処理をするための処理プログラムを記録した記録媒体
CN111226278B (zh) 低复杂度的浊音语音检测和基音估计
JPH1138998A (ja) 雑音抑圧装置および雑音抑圧処理プログラムを記録した記録媒体
JPH1138999A (ja) 雑音抑圧装置および雑音抑圧処理プログラムを記録した記録媒体
JPH1097288A (ja) 背景雑音除去装置及び音声認識装置
JP2002372982A (ja) 音響信号分析方法及び装置
JP2003316380A (ja) 会話を含む音の信号処理を行う前の段階の処理におけるノイズリダクションシステム
JP2003173195A (ja) 占有度抽出装置および基本周波数抽出装置、それらの方法、それらのプログラム並びにそれらのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071023

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100716

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110307

LAPS Cancellation because of no payment of annual fees