JP2001144656A - 多チャンネル反響消去方法及び装置並びにそのプログラムを記録した記録媒体 - Google Patents

多チャンネル反響消去方法及び装置並びにそのプログラムを記録した記録媒体

Info

Publication number
JP2001144656A
JP2001144656A JP32569299A JP32569299A JP2001144656A JP 2001144656 A JP2001144656 A JP 2001144656A JP 32569299 A JP32569299 A JP 32569299A JP 32569299 A JP32569299 A JP 32569299A JP 2001144656 A JP2001144656 A JP 2001144656A
Authority
JP
Japan
Prior art keywords
signal
channel
echo
sequence
reception
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP32569299A
Other languages
English (en)
Inventor
Akira Emura
暁 江村
Suehiro Shimauchi
末廣 島内
Shigeaki Aoki
茂明 青木
Yutaka Kaneda
豊 金田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP32569299A priority Critical patent/JP2001144656A/ja
Publication of JP2001144656A publication Critical patent/JP2001144656A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

(57)【要約】 【課題】多チャンネル反響消去方法において、多チャン
ネル入力信号のチャンネル間の相互相関を変動させると
同時に、その影響がほとんど分からないように付加信号
を生成し反響消去性能を向上させる。 【解決手段】音響信号からチャンネル毎に音響信号と同
期した励振信号を抽出する第1の段階と、抽出した励振
信号からパルス信号を生成する第2の段階と、パルス信
号に基づきチャンネル間相関が無相関の数列を生成する
第3の段階と、励振信号の振幅をチャンネル毎に数列で
制御して付加信号を生成する第4の段階と、付加信号と
音響信号とを加算して加算信号を得る第5の段階と、加
算信号をチャンネル毎に再生手段で再生し、加算信号に
インパルス応答を畳み込み演算して擬似反響信号を生成
し、収音手段で収音された信号から擬似反響信号を差し
引いて差信号を求め、差信号と加算信号とからインパル
ス応答を推定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、多チャンネル信号
のチャンネル間相互を変動させることにより適応フィル
タによる推定結果が真値に近づくことを保証する多チャ
ンネル反響消去方法および装置並びにプログラムを記録
した記録媒体に関する。
【0002】
【従来の技術】ステレオTV会議システムにおいて、対
地にて2本のマイクにより収音された1人の話者音声は
チャンネル間の相互相関が高くて一定である。そのた
め、このステレオ信号を受話信号とする反響消去装置内
の2入力1出力適応フィルタにより推定された室内伝達
特性は、実際と一致せず、対地での話者交代によりステ
レオ信号間の相関が変化したとき反響を消去できなくな
る。
【0003】ステレオ信号のチャンネル間相互相関を変
動させることにより、2入力1出力適応フィルタによる
推定結果が実際の室内伝達特性へと収束していくことは
数学的に示されており、ステレオ信号相関変動の手法と
して以下の3法が提案されている。 1.振幅変調によるステレオ信号相関変動の手法 (S.Shimauchi and S.Makino,“Stereo Projection Echo
Canceller withTrue Echo Path Estimation,”Proc.of
ICASSP'95,pp.3059-3062,May1995) 2.1サンプルタイムの遅延をオン/オフして得られる
信号をもちいるステレオ信号相関変動の手法 (Y.Joncour and A.Sugiyama,“A Unique and Strict Id
entification of theEcho Path Impulse Response in S
tereo Echo Cancellation,”Technical Report of IEIC
E,DSP96-100,pp17-24,Dec.1996) 3.元信号を半波整流して得られる信号を付加するステ
レオ信号相関変動の手法 (J.Benesty,D.R.Morgan and M.M.Sondhi,“A Better Un
derstanding and anImproved Solution to the Problem
of Stereophonic Acoustic EchoCanncellation,”Proc
eedings of 1997 IEEE International Conference OnAC
OUSTICS,SPEECH,AND SIGNAL PROCESSING,pp.303-306.Ap
ril 1997) しかし1.の手法では、適応フィルタの推定を向上させ
るために、音像定位に影響するほど音量を変化させなけ
ればならない。2.の手法では、1サンプルの遅延がオ
ン、オフする瞬間に不快なクリック音が生じ、1サンプ
ルの遅延が挿入されることによる音像の移動がさけられ
ない。3.の手法でも適応フィルタの推定を向上させる
には、音質変化が十分知覚できるレベルまで大きくした
半波整流信号を元信号に足しこむ必要がある。またいず
れの手法もステレオ反響消去に特化しており、入力が3
チャンネル以上のとき反響消去装置内の多入力1出力適
応フィルタによる室内伝達関数の推定結果が実際と一致
するとは限らない。
【0004】
【発明が解決しようとする課題】そこで本発明では、多
チャンネル反響消去方法において、聴感上その影響がほ
とんど知覚できないように多チャンネル入力信号のチャ
ンネル間相互相関を変動させて、反響消去性能を向上さ
せる。
【0005】
【課題を解決するための手段】多チャンネルの入力音声
信号から、音声と同期し音声と性質の似た多チャンネル
信号を生成し、その各チャンネルの振幅をチャンネル間
相互相関がなくなるような乱数列により二値もしくは多
値制御して得られた信号を元の多チャンネル入力信号に
付加することで、音質変化を知覚させることなくチャン
ネル間相互相関を変動し、多チャンネル適応フィルタを
真値に確実に収束させることで、上記の問題を解決す
る。
【0006】
【発明の実施の形態】実施例1 図1は、本発明の実施例1を示すブロック図である。入
力されたMチャンネル音声信号X(n,m)(ただし、nは時
刻、mは1〜Mチャンネル番号とする)はD/A変換器
を介し受信部屋においてスピーカで拡声され、室内音場
で反響しマイクロホンに受音される。このスピーカ・マ
イクロホン間のインパルス応答の推定値をエコーキャン
セラ内のインパルス応答推定部、疑似反響路より求め、
マイクロホン出力信号をA/D変換器を介した信号から
差し引きスピーカ出力を消去する。
【0007】励振信号抽出部11と無相関マルチチャンネ
ル付加信号生成部10より無相関マルチチャンネル付加信
号が生成される。無相関マルチチャンネル付加信号生成
部10は、パルス生成部12、パルス無相関化ゲイン生成部
13、ゲイン部14および急激な変化を緩和する緩和手段、
例えば、LPF19から構成される。入力されたMチャン
ネル音声信号X(n,m)から、励振信号抽出部11にてMチャ
ンネル励振信号X1(n,m)が抽出される。
【0008】励振信号X1(n,m)からは、例えば、チャン
ネル毎に図9の状態遷移動作を行うパルス生成部12によ
りパルス信号V(n,m)が生成される。この状態遷移を図1
0のフローチャートを用いて説明する。 (第1段階)チャンネルmは3つの状態のいずれかをと
ることができ、初期化後は状態1にいる。 (第2段階)状態1において、入力された励振信号が予
め設定した閾値xthより小さいときV(n,m)=0を出力
し、次時刻も状態1に遷移する(S103)。励振信号がxth
以上のときV(n,m)=1を出力して状態2に遷移する(S1
04)。状態2にいるとき、計数器cnt(m)に設定値h#over
(音声のピッチよりも短いピッチに対応する計数値)を
設定し(S106),V(n,m)=0を出力して状態3に遷移する
(S107)。状態3では、cnt(m)を1つ減らしV(n,m)=0
を出力して次時刻も状態3にとどまる(S107)。cnt(m)が
0であれば、V(n,m)=0を出力して状態1に遷移する
(S110)。このように状態1のときのみX1(n,m)に応じて
状態を遷移し、状態2,3からの遷移はX1(n,m)に依存
しない。このようにして、励振信号X1(n,m)からパルス
信号V(n,m)を得ることができる。 ・上記の処理は、設定値h#over以内のパルス信号V(n,
m)は出力しないようにするためであり、励振信号X1(n,
m)からパルス信号V(n,m)を正確に生成できる。 (第3段階)パルス無相関化ゲイン生成器13でパルス信
号V(n,m)から相互相関成分を持たない乱数列を生成
し、パルス無相関化ゲインを生成する。また、LPF19
はパルス無相関化ゲインの急激な変化を緩和する。 (第4段階)第3段階で乱数を用いて生成されたパルス
無相関化ゲインによりゲイン部14のゲインを決めること
により各チャンネルの励振信号X1(n,m)の振幅を制御す
る。 (第5段階)第4段階で得られたマルチチャンネル付加
信号を、加算器15で元のマルチチャンネル音声信号X(n,
m)に加算して、反響路および疑似反響路に入力する。
【0009】図2は、本発明の実施例2を示すブロック
図である。図2の音声符号化器、音声復号器は、線形予
測を用いて高能率で音声を符号化・復号化するもので、
例えば、CELP(Code Exicited Linear Prediction)
符号化方式が用いられる。 この符号化信号を復号化す
る復号化器は、励振源復号器、スペクトル包絡復号器、
線形予測合成フィルタから構成され、スペクトル包絡復
号器によりスペクトル包絡パラメータが取り出され、線
形予測合成フィルタにフィルタ係数として設定され、ま
た励振源復号器により励振信号が選択復号されて線形予
測合成フィルタに励振信号として入力され、合成フィル
タから音声信号が復元出力される。
【0010】上記励振信号を励振信号X1(n,m)として用
い、これからパルス信号V(n,m)を生成する。マルチチ
ャンネル励振信号がチャンネル間相関成分を持たないよ
うに、第3の段階で相互相関成分を持たない数列を生成
し、第4の段階で励振信号の各チャンネルの振幅を制御
して生成された付加信号を、第5の段階でマルチチャン
ネル音声信号に加算して反響路への入力信号としてい
る。
【0011】図3は、本発明の実施例3を示すブロック
図である。振幅比ゲイン制御部16は信号パワー比較部16
Aとゲイン部16Bから構成され、信号パワー比較部16A
は、元のマルチチャンネル入力信号とマルチチャンネル
付加信号の信号パワーを推定比較し、付加するマルチチ
ャンネル付加信号の振幅と元の入力信号の振幅比が一定
値以下になるように、16Bでそのゲインを制御する。図
4は、本発明の実施例4を示すブロック図である。
【0012】第4の段階により振幅制御されて得られる
マルチチャンネル付加信号はマルチチャンネル入力信号
より広帯域の信号となり、聴覚上知覚されやすい帯域成
分が含まれる可能性がある。このような各帯域成分を周
波数特性補正部17にて減衰させてマルチチャンネル付加
信号を元のマルチチャンネル音声信号に付加し、反響路
および疑似反響路に入力する。各帯域成分を減衰させる
方法として、付加信号の各周波数帯域成分が人間の聴覚
特性上等ラウドネスになるよう付加信号の周波数特性を
補正する方法がある。
【0013】図5は、本発明の実施例5を示すブロック
図である。実施例1の第1から第4の段階を経て生成さ
れた信号と元のマルチチャンネル音声信号の振幅比が一
定値以下になるよう制御する第6の段階とその周波数特
性を人間の聴覚特性に基づいて制御する第7の段階を経
て生成されたマルチチャンネル付加信号を、第5の段階
でマルチチャンネル音声信号に加算して、反響路と疑似
反響路への入力信号としている。
【0014】図6は、本発明の実施例6のブロック図を
示す。実施例2の第2から第4の段階を経て生成された
信号と元のマルチチャンネル音声信号の振幅比が一定値
以下になるよう制御する第6の段階を経て生成されたマ
ルチチャンネル付加信号を第5の段階でマルチチャンネ
ル音声信号に加算して、反響路と疑似反響路への入力信
号としている。図7は、本発明の実施例7を示すブロッ
ク図である。
【0015】実施例2の第2から第4の段階を経て生成
された信号の周波数特性を人間の聴覚特性に基づいて制
御する第7の段階を経て生成されたマルチチャンネル付
加信号を、第5の段階でマルチチャンネル音声信号に加
算して、反響路と疑似反響路への入力信号としている。
図8は、本発明の実施例8を示すブロック図である。実
施例2の第2から第4の段階を経て生成された信号と元
のマルチチャンネル音声信号の振幅比が一定値以下とな
るよう制御する第6の段階とその周波数特性を人間の聴
覚特性に基づいて制御する第7の段階を経て生成される
マルチチャンネル付加信号を第5の段階でマルチチャン
ネル音声信号に加算して、反響路と疑似反響路への入力
信号としている。
【0016】また、実施例1、3〜5の励振信号を抽出
する段階を、音声を線形予測分析し、その予測残差信号
を出力する方法により実現することができる。励振信号
の抽出を線形予測分析を偏自己相関係数の格子型分析法
により行うことにより、ブロック単位ではなくサンプル
毎に、遅延なく安定に予測残差信号を得ることができ
る。なお、音声の線形予測分析と偏自己相関係数の格子
型計算法については、例えば、中田和男、『音声の高能
率符号化』、森北出版、pp.71-85に記載されている。
【0017】図11はMチャンネル励振信号X1(n,m)のパ
ルス振幅をゲイン制御部14において二値制御するフロー
チャートを示す。図11のフローチャートは、パルス信号
V(n,m)から相互相関成分を持たないマルチチャンネル
付加信号を生成する上記第3と第4の段階のブロックS2
11、および音声区間検出によるM系列乱数の同期を行う
ブロックS212からなる。フローチャート内で、mseq(j,
m)はM系列乱数列からMj+m番目の乱数を取り出すこと
を意味する。
【0018】はじめに、チャンネル数分のパルス計数器
(gc(m)(m=1・・・M))と音声区間内パルス計数器(dgc
(m)(m=1・・・M))とMチャンネル分のM系列(g(m)=ms
eq(qc(m)+dqc(m),m))を初期化し、最初の乱数を取り出
す(S201)。時刻nにおいてチャンネルmにパルス信号が
入力されると(S206)、第3の段階でチャンネルmの音声
区間内パルス計数器dgc(m)にMを足し(dgc(m)+M)、チ
ャンネルmのM系列からMビットの乱数を取り出し(チ
ャンネルmのM系列乱数からMビットの乱数を取り出
す)、そのmビット目のα倍(α:係数)を振幅倍率g
(m)(=0もしくはα)として更新する(S207)。第4の
段階では、毎時刻各チャンネルに設定された振幅倍率に
よりMチャンネルの励振信号振幅を制御する(X2(n,m)
=g(m)X1(n,m))(S204)。・すなわち、S206でパルス信号
V(n,m)=1が出力されると、S207でmseq(qc(m)+dqc
(m),m)、(mチャンネルの乱数)に係数αを乗算して振
幅倍率g(m)とし、g(m)とチャンネルmの励振信号X1(n,
m)を乗算する。これによりマルチチャンネル付加信号X2
(n,m)を出力する処理を行う。
【0019】また、音声区間から無音区間に入るとき、
M個の音声区間内パルス計数器の最大値dcを求めて、チ
ャンネルmのM系列からdc-dgc(m)個の乱数を読み飛ば
すことでMチャンネルのM系列乱数列の同期をとる。さ
らに、この値でパルス計数器を更新して、音声区間内パ
ルス計数器を初期化する(S203)。S202,S203の処理は各
チャンネルの音声区間内の最大パルスdcを同期化するも
のであり、この処理により、M系列乱数がMチャンネル
間の対応するピッチを確実に無相関化することができ
る。
【0020】図12はMチャンネル励振信号X1(n,m)のパ
ルス振幅をゲイン制御部14において多値制御するフロー
チャートを示す。図12のフローチャートは、パルス信号
V(n,m)から相互相関成分を持たないマルチチャンネル
付加信号を生成する第3と第4の段階のブロックS311、
および無音区間検出によるM系列乱数の同期を行うブロ
ックS312からなる。付加信号を聴感上より目立たないよ
うにするために、図12に記載の第3の段階では、付加
信号振幅をKビットの乱数を用いて細かく制御する。こ
れは次のように実現される。
【0021】まずチャンネル毎に、各ビットがM系列中
のできるだけ離れた部分を走るように初期設定したK本
のM系列ビットを用意する。時刻nにおいてチャンネル
mにパルス信号が入力されたとき、チャンネルmの音声
区間内パルス計数器dgc(m)にMを足し、チャンネルmの
K本の各M系列乱数からMビットの乱数を取り出し、そ
の第mビット目の値を取り出す(S307)。以後、この動作
をmseq2(j,m,k)と記す。
【0022】g2(m,k)=mseq2(n,m,k)(k=1,・・・,K) これから、例えば次式のようにkビットの乱数を生成
し、そのα倍(α:係数)を振幅倍率g(m)として更新す
る。 g(m)=α・(−1)g2(m,K)×(g2(m,1)2(-1)+・・・+
g2(m,k-1)2(1-k )) 第4の段階では、毎時刻各チャンネルに設定された振幅
倍率によりMチャンネルの励振信号振幅を制御する(S30
4)。 ・上記式において、(−1)g2(m,K) は符号(+もし
くは−)を、(g2(m,1)2(- 1)+・・・+g2(m,k-1)2
(1-K))は振幅を表し、K本のM系列乱数に基づいて、M
チャンネル励振信号X1(n,m)をゲイン制御部14において
正または負とゲインを乱数を用いて制御し、X2(n,m)を
出力する。
【0023】図12のフローチャートにおいて、無音区間
検出によるM系列乱数の同期を行うブロックS312に動作
は、図11フローチャート内のブロックS212と同一であ
る。一般に音声から抽出された励振信号は広帯域の成分
を持つ。例えば、励振信号としてパルス列が抽出された
場合、周波数で見ると信号の各帯域パワーは同じにな
る。一方、同じエネルギーの音響信号であっても、人間
が感じる音の大きさは周波数によって変化する。例え
ば、三浦種敏監修、『聴覚と音声』電子情報通信学会
編、pp.128に記載のRobinsonの等ラウドネス曲線によれ
ば、人は4kHz前後の帯域成分に敏感であり、4kH
z以下では周波数が低くなるにしたがい緩やかに感度が
下がる。
【0024】付加信号の各帯域成分が人間の聴覚特性上
等ラウドネスになるように4kHz前後の帯域成分で減
衰させて付加信号を聴覚上検知されにくくすることで、
実施例4,5,7,8の聴覚特性に基づく付加信号の周
波数特性を実現する。さらに、本発明を適用したシステ
ムをCPUやメモリ等を有するコンピュータと、利用者
端末と、CD−ROM、磁気ディスク装置、半導体メモ
リ等の機械読み取り可能な記録媒体で構成し、記録媒体
に記憶された多チャンネル反響消去法のプログラムをコ
ンピュータに読み取り、コンピュータの動作を制御し、
前述の実施の形態における各構成要素を実現する。
【0025】
【発明の効果】2スピーカ1マイクロホン間の反響路伝
達特性を推定する場合の性能について、半波整流フィル
タにより付加信号を生成する従来の非線形処理法と、請
求項1に記載の多チャンネル反響消去法の実施例を数値
シュミレーションにて調べた。シュミレーションでは、
励振信号抽出に請求項4に記載の偏自己相関係数の格子
型計算法を用い、励振信号振幅の制御に図12により生成
される乱数列を用い、請求項1記載の発明の第1から第
4の段階を経て生成された付加信号を請求項9記載の発
明により処理した。
【0026】残響時間250msecの部屋で16kHzサンプリン
グで測定した室内伝達関数を、1200タップで打ち切った
ものを使用した。室内伝達関数の推定には2入力1出力
で、各入力について1000タップを畳み込む適応フィルタ
を、その学習には二次の射影アルゴリズムを用いた。ま
た補正フィルタとして7kHzを遮断周波数とする低域濾
波フィルタを用いた。従来法として、左チャンネル信号
を半波整流し、その振幅を0.3倍した信号を元の左チャ
ンネル信号に付加したステレオ信号を用いた。また本発
明法においては、振幅8ビットの乱数で制御された各チ
ャンネルの励振信号を6kHzのLPFを通過させ、元信
号とのパワー比を0.011とした付加信号を用いた。
【0027】格子型分析法による線形予測分析により、
図13上のグラフの音声信号X(n,1)から、図13下グラフの
励振信号X1(n,1)が得られた。この信号から図14上グラ
フのパルス信号V(n,1)とゲイン振幅g(1)のグラフが得
られた。図14にゲイン振幅g(1)とg(2)のグラフを示す。
図14からチャンネル1と2のゲインg(1)とg(2)は無相関
化されていることが分かる。
【0028】反響路伝達特性のインパルス応答ベクトル
をそれぞれh1,h2,疑似反響路のインパルス応答をw1,w2
とし、次式で定義される誤差ベクトルの相対的な大きさ {(h1-w1)2+(h2-w2)2}/{h12+h22} を推定性能の評価量に用いた。時間を横軸に、縦軸に推
定性能評価量をとったグラフを図15に示す。推定開始10
秒後の時点で、従来法では、誤差ベクトルが−4dB程度
であるのに対し、本発明法によれば誤差ベクトルは約−
15dBまで減衰し、その推定速度は約4倍である。
【0029】誤差ベクトルが−5dB程度減少するのに、
従来法では推定開始から10秒かかっているが、本発明法
では、0.8秒程度である。また本発明法によれば推定開
始から10秒で、誤差ベクトルが約−15dBまで減衰する。
以上述べたように、マルチチャンネル音声信号から音声
と同期している励振信号を抽出し、この励振信号から生
成されるパルス信号により相互相関成分を持たないマル
チチャンネル乱数数列を駆動して、各チャンネルの励振
信号振幅を制御することにより、チャンネル間の相互相
関成分をほとんど持たない付加信号が得られる。M系列
等から生成される乱数列を用いることにより、任意のチ
ャンネル数Mについて相互相関成分を持たないマルチチ
ャンネル乱数数列を生成することができる。このような
マルチチャンネルの付加信号を元のマルチチャンネル音
声信号に加算して反響路と疑似反響路の入力とすること
により、複数の疑似反響路特性が模擬する反響の音響経
路伝達特性に収束することが保証される。
【0030】励振信号抽出に偏自己相関係数の格子型計
算法による音声の線形予測分析を用いることで、音声か
ら安定かつ確実にピッチを抽出することができる。また
線形予測に基づく音声符号化・復号化と併用する場合に
は、励振信号抽出処理に音声符号化・復号化で用いられ
ているピッチ周期パラメータから復号される励振信号を
そのまま使用することができるため、演算量の増加が少
なくて済む。また付加信号の周波数特性を人間の聴覚特
性に基づいて整形し、付加信号と元の信号の振幅比を制
御することにより、インパルス推定の性能をほとんど劣
化させることなく、付加信号の影響を分からないように
することが可能である。
【図面の簡単な説明】
【図1】本発明の実施例1を示すブロック図。
【図2】本発明の実施例2を示すブロック図。
【図3】本発明の実施例3を示すブロック図。
【図4】本発明の実施例4を示すブロック図。
【図5】本発明の実施例5を示すブロック図。
【図6】本発明の実施例6を示すブロック図。
【図7】本発明の実施例7を示すブロック図。
【図8】本発明の実施例8を示すブロック図。
【図9】励振信号X1(n,m)からパルス信号V(n,m)を生成
するための状態遷移図。
【図10】励振信号X1(n,m)からパルス信号V(n,m)を生成
するための状態遷移を説明するフローチャート。
【図11】1ビット乱数によるゲート制御用信号生成とM
系列乱数の同期を説明するフローチャート。
【図12】Kビット乱数によるゲート制御用信号生成とM
系列乱数の同期を説明するフローチャート。
【図13】音声信号について図1中の各信号の波形例を示
す図(上 X(n,1),下 X1(n,1))。
【図14】音声信号について図1中の各信号〔上 X(n,
1),下 X1(n,1)〕の波形例を示す図(上 V(n,1),下 g
(1)とg(2)の時間履歴)。
【図15】図4の実施例と従来例の性能を比較した図。
【符号の説明】
10 無相関マルチチャンネル付加信号生成部 11 励振信号抽出部 12 パルス生成部 13 パルス無相関化ゲイン生成部 14 ゲイン部 15 加算器 16 振幅比ゲイン制御部 17 周波数特性補正部 19 LPF
───────────────────────────────────────────────────── フロントページの続き (72)発明者 青木 茂明 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 金田 豊 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5K046 AA01 BB01 HH11 HH24 HH37 HH42 HH56 HH79 9A001 HH15 HZ32 JJ23 KK56

Claims (30)

    【特許請求の範囲】
  1. 【請求項1】各チャンネルの受話に対応する信号をチャ
    ンネル毎に再生器で音響信号に再生し、 これら各音響信号が上記各再生器から収音器に到る各音
    響経路を経由して収音され、 その収音器からの反響信号から疑似反響信号を差し引
    き、 その残りである残留反響信号と前記各チャンネルの受話
    信号とから修正ベクトルを求め、 この修正ベクトルを用いて前記反響路のインパルス応答
    の推定を逐次修正し、 その修正されたインパルス応答を持つ各疑似反響路を生
    成し、 各疑似反響路に前記受話信号に対応するものをそれぞれ
    入力して前記疑似反響信号を生成する多チャンネル反響
    消去方法において、 各チャンネルの受話信号からチャンネル毎に前記受話信
    号と同期した励振信号を抽出する第1の段階と、 前記励振信号からチャンネル毎にパルス信号を生成する
    第2の段階と、 前記パルス信号に基づきチャンネル間相関が無相関の数
    列を生成する第3の段階と、 前記励振信号の振幅をチャンネル毎に前記数列で制御し
    て付加信号を生成する第4の段階と、 チャンネル毎に前記付加信号を前記受話信号に加算して
    受話に対応する信号とする第5の段階と、を有すること
    を特徴とする多チャンネル反響消去方法。
  2. 【請求項2】音声が線形予測をもちいて高能率で符号化
    されている伝送路に接続される請求項1記載の多チャン
    ネル反響消去方法において、 前記受話信号として復号された音声をもちい、前記符号
    化で使用されているピッチ周期パラメータを復号するこ
    とで受話信号と同期した励振信号を抽出する第1の段階
    を有することを特徴とする多チャンネル反響消去方法。
  3. 【請求項3】請求項1記載の多チャンネル反響消去方法
    において、 前記第1の段階の受話信号からチャンネル毎に前記受話
    信号と同期した励振信号の抽出を、前記受話信号を線形
    予測分析し、その予測残差信号を出力することで前記励
    振信号を抽出することを特徴とする多チャンネル反響消
    去方法。
  4. 【請求項4】請求項3記載の多チャンネル反響消去方法
    において、 前記線形予測分析を、偏自己相関係数の格子型計算法に
    より線形予測分析することを特徴とする多チャンネル反
    響消去方法。
  5. 【請求項5】請求項1〜4のいずれか1項に記載の多チ
    ャンネル反響消去方法において、 前記入力のチャンネル数がMのとき前記第3の段階のパ
    ルス信号に基づきチャンネル間相関が無相関の数列の生
    成を、M系列乱数数列から連続するMビットを取り出す
    ことにより行い、 前記第4の段階の励振信号の振幅をチャンネル毎に前記
    数列で制御する前記付加信号の生成を、第mビット(1
    ≦m≦M)が1のとき第mチャンネルの信号をα倍し
    (αは係数を表す)、第mビットが0のとき第mチャン
    ネルの信号を0倍することにより行うことを特徴とする
    多チャンネル反響消去方法。
  6. 【請求項6】請求項1〜4のいずれか1項に記載の多チ
    ャンネル反響消去方法において、 前記入力のチャンネル数がMの時、前記第3段階のパル
    ス信号に基づきチャンネル間相関が無相関の数列の生成
    を、K本のM系列乱数列から連続するMビットを取り出
    し、前記第4段階の励振信号の振幅をチャンネル毎に前
    記数列で制御する前記付加信号の生成を、K個の第mビ
    ット情報からKビットの乱数β(m)を得て、第mチャ
    ンネルの信号をαβ(m)倍する(αは係数を表す)こ
    とにより行うことを特徴とする多チャンネル反響消去方
    法。
  7. 【請求項7】請求項5又は6に記載の多チャンネル反響
    消去方法において、 前記第3段階の各チャンネルに対応する励振信号をM系
    列乱数列により確実に無相関にするために無音状態を検
    出したとき各チャンネルのM系列乱数列を同期させるこ
    とを特徴とする多チャンネル反響消去方法。
  8. 【請求項8】請求項1〜7のいずれか1項に記載の多チ
    ャンネル反響消去方法において、 前記第4の段階に前記受話信号に対する振幅比が一定値
    以下になるように制御する第6の段階を設け、生成され
    た信号を前記付加信号とすることを特徴とする多チャン
    ネル反響消去方法。
  9. 【請求項9】請求項1〜7のいずれか1項に記載の多チ
    ャンネル反響消去方法において、 前記第4の段階に信号の周波数特性を人間の聴覚特性に
    基づいて制御する第7の段階を設け、生成された信号を
    前記付加信号とすることを特徴とする多チャンネル反響
    消去方法。
  10. 【請求項10】請求項1〜7のいずれか1項に記載の多チ
    ャンネル反響消去方法において、 前記第4の段階に前記受話信号に対する振幅比が一定値
    比以下になるように制御する第6の段階と、その周波数
    特性を人間の聴覚特性に基づいて制御する第7の段階を
    設け、生成された信号を前記付加信号とすることを特徴
    とする多チャンネル反響消去方法。
  11. 【請求項11】各チャンネルの受話に対応する信号をチャ
    ンネル毎に再生器で音響信号に再生し、 これら各音響信号が上記各再生器から収音器に到る各音
    響経路を経由して収音され、 その収音器からの反響信号から疑似反響信号を差し引
    き、 その残りである残留反響信号と前記各チャンネルの受話
    信号とから修正ベクトルを求め、 この修正ベクトルを用いて前記反響路のインパルス応答
    の推定を逐次修正し、 その修正されたインパルス応答を持つ各疑似反響路を生
    成し、 各疑似反響路に前記受話信号に対応するものをそれぞれ
    入力して前記疑似反響信号を生成する多チャンネル反響
    消去装置において、 各チャンネルの受話信号からチャンネル毎に前記受話信
    号と同期した励振信号を抽出する励振信号抽出部と、 前記励振信号からチャンネル毎にパルス信号を生成する
    パルス生成部と、 前記パルス信号に基づきチャンネル間相関が無相関の数
    列を生成し、前記励振信号の振幅をチャンネル毎に前記
    数列で制御して付加信号を生成する付加信号生成部と、 チャンネル毎に前記付加信号を前記受話信号に加算して
    受話に対応する信号とする加算部と、を有することを特
    徴とする多チャンネル反響消去装置。
  12. 【請求項12】音声が線形予測をもちいて高能率で符号化
    されている伝送路に接続される請求項11記載の多チャン
    ネル反響消去装置において、 前記受話信号として復号された音声をもちい、前記符号
    化で使用されているピッチ周期パラメータを復号するこ
    とで受話信号と同期した励振信号を抽出する励振信号抽
    出部を有することを特徴とする多チャンネル反響消去装
    置。
  13. 【請求項13】請求項11記載の多チャンネル反響消去装置
    において、 前記励振信号抽出部は、前記受話信号を線形予測分析
    し、その予測残差信号を出力することで前記励振信号を
    抽出する励振信号抽出手段を備えたことを特徴とする多
    チャンネル反響消去方法。
  14. 【請求項14】請求項13記載の多チャンネル反響消去装置
    において、 前記励振信号抽出手段の線形予測分析を偏自己相関係数
    の格子型計算法により線形予測分析することを特徴とす
    る多チャンネル反響消去装置。
  15. 【請求項15】請求項11〜14のいずれか1項に記載の多チ
    ャンネル反響消去装置において、 前記付加信号生成部は、M系列乱数数列から連続するM
    ビットを取り出し、第mビットが1のとき第mチャンネ
    ルの信号をα倍し(αは係数を表す)、第mビットが0
    のとき第mチャンネルの信号を0倍する手段を備え、前
    記付加信号を生成することを特徴とする多チャンネル反
    響消去装置。
  16. 【請求項16】請求項11〜14のいずれか1項に記載の多チ
    ャンネル反響消去装置において、 前記付加信号生成部は、K本のM系列乱数列から連続す
    るMビットを取り出し、K個の第mビット情報からKビ
    ットの乱数β(m)を得て、第mチャンネルの信号をα
    β(m)倍する(αは係数を表す)手段を備え、前記付
    加信号を生成することを特徴とする多チャンネル反響消
    去装置。
  17. 【請求項17】請求項15又は16に記載の多チャンネル反響
    消去装置において、 前記付加信号生成部は、各チャンネルに対応するピッチ
    をM系列乱数列により確実に無相関にするために無音状
    態を検出したとき各チャンネルのM系列乱数列を同期さ
    せる同期手段を備えたことを特徴とする多チャンネル反
    響消去装置。
  18. 【請求項18】請求項11〜17のいずれか1項に記載の多チ
    ャンネル反響消去装置において、 前記付加信号生成部は、前記付加信号の前記受話信号に
    対する振幅比が一定値以下になるように制御する振幅比
    ゲイン制御部を備え、生成された信号を前記付加信号と
    することを特徴とする多チャンネル反響消去装置。
  19. 【請求項19】請求項11〜17のいずれか1項に記載の多チ
    ャンネル反響消去装置において、 前記付加信号生成部は、周波数特性を人間の聴覚特性に
    基づいて制御する周波数特性補正部を備え、生成された
    信号を前記付加信号とすることを特徴とする多チャンネ
    ル反響消去装置。
  20. 【請求項20】請求項11〜17のいずれか1項に記載の多チ
    ャンネル反響消去装置において、 前記付加信号生成部は、前記付加信号の前記受話信号に
    対する振幅比が一定値以下になるように制御する振幅比
    ゲイン制御部と周波数特性を人間の聴覚特性に基づいて
    制御する周波数特性補正部を備え、生成された信号を前
    記付加信号とすることを特徴とする多チャンネル反響消
    去装置。
  21. 【請求項21】各チャンネルの受話に対応する信号をチャ
    ンネル毎に再生器で音響信号に再生し、 これら各音響信号が上記各再生器から収音器に到る各音
    響経路を経由して収音され、 その収音器からの反響信号から疑似反響信号を差し引
    き、 その残りである残留反響信号と前記各チャンネルの受話
    信号とから修正ベクトルを求め、 この修正ベクトルを用いて前記反響路のインパルス応答
    の推定を逐次修正し、 その修正されたインパルス応答を持つ各疑似反響路を生
    成し、 各疑似反響路に前記受話信号に対応するものをそれぞれ
    入力して前記疑似反響信号を生成する手順を実行させる
    プログラムを記録した機械読み取り可能な記録媒体にお
    いて、 各チャンネルの受話信号からチャンネル毎に前記受話信
    号と同期した励振信号を抽出する第1の手順と、 前記励振信号からチャンネル毎にパルス信号を生成する
    第2の手順と、 前記パルス信号に基づきチャンネル間相関が無相関の数
    列を生成する第3の手順と、 前記励振信号の振幅をチャンネル毎に前記数列で制御し
    て付加信号を生成する第4の手順と、 チャンネル毎に前記付加信号を前記受話信号に加算して
    受話に対応する信号とする第5の手順を実行させるプロ
    グラムを記録した機械読み取り可能な記録媒体。
  22. 【請求項22】音声が線形予測をもちいて高能率で符号化
    されている伝送路に接続される請求項21記載のプログラ
    ムを記録した機械読み取り可能な記録媒体において、 前記受話信号として復号された音声信号をもちい、前記
    符号化で使用されているピッチ周期パラメータを復号す
    ることで受話信号と同期した励振信号を抽出する第1の
    手順を有するプログラムを記録した機械読み取り可能な
    記録媒体。
  23. 【請求項23】請求項21記載のプログラムを記録した機械
    読み取り可能な記録媒体において、 前記第1の手順の受話信号からチャンネル毎に前記受話
    信号と同期した励振信号の抽出を、前記受話信号を線形
    予測分析し、その予測残差信号を出力することで前記励
    振信号として抽出する手順とするプログラムを記録した
    機械読み取り可能な記録媒体。
  24. 【請求項24】請求項23記載のプログラムを記録した機械
    読み取り可能な記録媒体において、 前記第1の手順の線形予測分析を、偏自己相関係数の格
    子型計算法により線形予測分析する手順としたプログラ
    ムを記録した機械読み取り可能な記録媒体。
  25. 【請求項25】請求項21〜24のいずれか1項に記載のプロ
    グラムを記録した機械読み取り可能な記録媒体におい
    て、 前記第3の手順のパルス信号に基づきチャンネル間相関
    が無相関の数列の生成を、M系列乱数数列から連続する
    Mビットを取り出して生成し、 前記第4の手順の励振信号の振幅をチャンネル毎に前記
    数列で制御する前記付加信号の生成を、第mビットが1
    のとき第mチャンネルの信号をα倍し(αは係数を表
    す)、第mビットが0のとき第mチャンネルの信号を0
    倍することにより生成する手順としたプログラムを記録
    した機械読み取り可能な記録媒体。
  26. 【請求項26】請求項21〜24のいずれか1項に記載のプロ
    グラムを記録した機械読み取り可能な記録媒体におい
    て、 前記第3の手順のパルス信号に基づきチャンネル間相関
    が無相関の数列の生成を、K本のM系列乱数列から連続
    するMビットを取り出して生成し、前記第4の手順の前
    記励振信号の振幅をチャンネル毎に前記数列で制御する
    付加信号の生成を、K個の第mビット情報からKビット
    の乱数β(m)を得て、第mチャンネルの信号をαβ
    (m)倍する(αは係数を表す)ことにより生成する手
    順としたプログラムを記録した機械読み取り可能な記録
    媒体。
  27. 【請求項27】請求項25又は26に記載のプログラムを記録
    した機械読み取り可能な記録媒体において、 前記第3の手順に各チャンネルに対応する励振信号をM
    系列乱数列により確実に無相関にするために無音状態を
    検出したとき各チャンネルのM系列乱数列を同期させる
    手順を備えたプログラムを記録した機械読み取り可能な
    記録媒体。
  28. 【請求項28】請求項21〜27のいずれか1項に記載のプロ
    グラムを記録した機械読み取り可能な記録媒体におい
    て、 前記第4の手順に前記受話信号に対する振幅比が一定値
    以下になるように制御する第6の手順を設け、生成され
    た信号を前記付加信号とするプログラムを記録した機械
    読み取り可能な記録媒体。
  29. 【請求項29】請求項21〜27のいずれか1項に記載のプロ
    グラムを記録した機械読み取り可能な記録媒体におい
    て、 前記第4の手順に信号の周波数特性を人間の聴覚特性に
    基づいて制御する第7の手順を設け、生成された信号を
    前記付加信号とするプログラムを記録した機械読み取り
    可能な記録媒体。
  30. 【請求項30】請求項21〜27のいずれか1項に記載のプロ
    グラムを記録した機械読み取り可能な記録媒体におい
    て、 前記第4の手順に前記付加信号の前記受話信号に対する
    振幅比が一定値以下になるように制御する第6の手順
    と、その周波数特性を人間の聴覚特性に基づいて制御す
    る第7の手順を設け、生成された信号を前記付加信号と
    するプログラムを記録した機械読み取り可能な記録媒
    体。
JP32569299A 1999-11-16 1999-11-16 多チャンネル反響消去方法及び装置並びにそのプログラムを記録した記録媒体 Pending JP2001144656A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32569299A JP2001144656A (ja) 1999-11-16 1999-11-16 多チャンネル反響消去方法及び装置並びにそのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32569299A JP2001144656A (ja) 1999-11-16 1999-11-16 多チャンネル反響消去方法及び装置並びにそのプログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2001144656A true JP2001144656A (ja) 2001-05-25

Family

ID=18179656

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32569299A Pending JP2001144656A (ja) 1999-11-16 1999-11-16 多チャンネル反響消去方法及び装置並びにそのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2001144656A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005136448A (ja) * 2003-10-28 2005-05-26 Nippon Telegr & Teleph Corp <Ntt> 多チャネル音響エコー消去方法及び装置
WO2007029412A1 (ja) * 2005-09-01 2007-03-15 Matsushita Electric Industrial Co., Ltd. マルチチャンネル音響信号処理装置
JP2010135936A (ja) * 2008-12-02 2010-06-17 Hitachi Ltd エコーキャンセラおよびエコー消去方法
JP2011049862A (ja) * 2009-08-27 2011-03-10 Sony Corp 音声信号処理装置および音声信号処理方法
JP2019191558A (ja) * 2018-04-23 2019-10-31 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 音声を増幅する方法及び装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005136448A (ja) * 2003-10-28 2005-05-26 Nippon Telegr & Teleph Corp <Ntt> 多チャネル音響エコー消去方法及び装置
WO2007029412A1 (ja) * 2005-09-01 2007-03-15 Matsushita Electric Industrial Co., Ltd. マルチチャンネル音響信号処理装置
US8184817B2 (en) 2005-09-01 2012-05-22 Panasonic Corporation Multi-channel acoustic signal processing device
JP5053849B2 (ja) * 2005-09-01 2012-10-24 パナソニック株式会社 マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法
JP2010135936A (ja) * 2008-12-02 2010-06-17 Hitachi Ltd エコーキャンセラおよびエコー消去方法
JP2011049862A (ja) * 2009-08-27 2011-03-10 Sony Corp 音声信号処理装置および音声信号処理方法
US8929556B2 (en) 2009-08-27 2015-01-06 Sony Corporation Audio-signal processing device and method for processing audio signal
JP2019191558A (ja) * 2018-04-23 2019-10-31 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 音声を増幅する方法及び装置
US10891967B2 (en) 2018-04-23 2021-01-12 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for enhancing speech

Similar Documents

Publication Publication Date Title
US9558755B1 (en) Noise suppression assisted automatic speech recognition
US8355511B2 (en) System and method for envelope-based acoustic echo cancellation
JP5332733B2 (ja) エコーキャンセラ
JP5000647B2 (ja) 音声状態モデルを使用したマルチセンサ音声高品質化
JP4976503B2 (ja) マルチチャネル配列のためのドロップアウトの補償
JP2018036666A (ja) 音声信号処理のためのマルチチャネル直接・環境分解のための装置及び方法
US8682006B1 (en) Noise suppression based on null coherence
US20120010881A1 (en) Monaural Noise Suppression Based on Computational Auditory Scene Analysis
US20130163781A1 (en) Breathing noise suppression for audio signals
Mosayyebpour et al. Single-microphone LP residual skewness-based inverse filtering of the room impulse response
CN110447069A (zh) 自适应噪声环境的语音信号处理的方法和装置
JP5027127B2 (ja) 背景雑音に応じてバイブレータの動作を制御することによる移動通信装置の音声了解度の向上
JP2014523174A (ja) スペクトル重みジェネレータを使用する周波数領域処理を用いてステレオ録音を分解するための方法および装置
CN105491495A (zh) 基于确定性序列的反馈估计
JP2004349806A (ja) 多チャネル音響エコー消去方法、その装置、そのプログラム及びその記録媒体
US20120271630A1 (en) Speech signal processing system, speech signal processing method and speech signal processing method program
CN1332374C (zh) 控制用来传送语音的信号中可能有害的信号的方法与系统
JP2001144656A (ja) 多チャンネル反響消去方法及び装置並びにそのプログラムを記録した記録媒体
EP3830823A1 (en) Forced gap insertion for pervasive listening
JP3673727B2 (ja) 反響消去方法、その装置、そのプログラム及びその記録媒体
JP4542538B2 (ja) ダブルトーク状態判定方法、その方法を用いた反響消去装置、そのプログラム及びその記録媒体
JP2005107448A (ja) 雑音低減処理方法、この方法を実施する装置、プログラム、記録媒体
Nguyen et al. Time-reversal approach to the stereophonic acoustic echo cancellation problem
JP3724705B2 (ja) 反響抑圧方法・反響抑圧装置
JP4652116B2 (ja) エコー消去装置