KR20010065125A - 전 처리단을 이용한 스테레오 음향 반향 제거장치 - Google Patents

전 처리단을 이용한 스테레오 음향 반향 제거장치 Download PDF

Info

Publication number
KR20010065125A
KR20010065125A KR1019990064939A KR19990064939A KR20010065125A KR 20010065125 A KR20010065125 A KR 20010065125A KR 1019990064939 A KR1019990064939 A KR 1019990064939A KR 19990064939 A KR19990064939 A KR 19990064939A KR 20010065125 A KR20010065125 A KR 20010065125A
Authority
KR
South Korea
Prior art keywords
noise
gain
energy
signal
block
Prior art date
Application number
KR1019990064939A
Other languages
English (en)
Inventor
윤대희
정양원
이지하
Original Assignee
박종섭
주식회사 하이닉스반도체
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 박종섭, 주식회사 하이닉스반도체 filed Critical 박종섭
Priority to KR1019990064939A priority Critical patent/KR20010065125A/ko
Publication of KR20010065125A publication Critical patent/KR20010065125A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

본 발명에 따른 전처리단을 이용한 스테레오 음향 반향 제거장치는 상기 원 음성신호를 분석하여 AR계수를 추출하는 AR계수 추출부와; 백색잡음을 발생시키는 노이즈 발생부와; 상기 AR계수 추출부에서 추출된 AR계수에 상기 노이즈 발생부에서 발생한 백색잡음을 합성하여 음성신호와 같은 AR특성을 갖는 AR잡음을 생성하는 AR잡음 생성부와; 상기 전송되는 원 음성신호에 대한 에너지값과, AR잡음 생성부에서 생성된 AR잡음에 대한 에너지값을 각각 계산하는 에너지 계산부와; 상기 에너지 계산부에서 계산된 원 음성신호의 에너지값과 AR잡음에 대한 에너지값을 비교하여 AR잡음의 이득을 계산하는 이득 계산부와; 상기 이득계산부에서 계산된 AR잡음의 이득에 따라 AR잡음 생성부에서 생성된 AR잡음의 이득을 조절하는 이득조절부와; 상기 이득 조절부에서 이득 조절된 AR잡음을 상기 원 음성신호와 가산하여 상기 음향 반향 제거기로 출력하는 가산부로 이루어진 전처리단을 구성함으로써, 멀티미디어 원거리 회의에서 입력 음성신호간의 강한 상관 관계를 음질의 왜곡없이 적은 계산량으로 효과적으로 제거할 수 있도록 하고, 복호화된 음성신호를 사용하는 무선 통신에도 별도의 음성 분석단을 구성하지 않고도 적용할 수 있도록 한 것이다.

Description

전 처리단을 이용한 스테레오 음향 반향 제거장치{Apparatus for excluding stereo sound echo using pre-processor}
본 발명은 스테레오 음향 반향 제거기에 관한 것으로서, 특히 인간의 청각 특성과 음성신호 특성을 고려하여 전송되는 신호의 음질을 저하시키지 않으면서 두 채널 입력신호의 상호 상관관계를 저하시킴으로써, 적응필터의 수렴 성능을 향상시킬 수 있도록 한 전처리단을 이용한 음향 방향 제거장치에 관한 것이다.
일반적으로, 정보화 사회의 발전과 더불어 빠르게 진행되고 있는 통신 수단의 발전은 기존의 유선 통신 방식으로부터 무선 통신 방식으로, 또한 보다 편리한 통화환경을 제공하기 위하여 송수화기를 사용하지 않는 핸드프리(Hands-Free) 방식으로 발전해 가고 있다. 이러한 핸드프리방식이 응용될 수 있는 분야로는 원거리 회의 시스템(Tele_Conference System), 차세대 이동통신 단말기인 IMT-2000 단말기, 자동차용 핸드 프리 전화기, 스피커폰 시스템, 회상회의 터미날 등을 들 수 있으며, 통신 기술의 발전에 힘입어 점차 그 상용 범위가 확대되고 잇다.
원거리 회의와 같은 핸드프리 통화환경에서는 통화자(이하, 근단화자라 칭함)가 위치한 환경내에 스피커와 마이크로 폰이 함께 위치하고 있기 때문에 스피커로 수신된 상대방(이하 원단화자)의 신호가 근단화자가 위치한 실내공간을 거쳐 마이크로 폰으로 입력되어 다시 원단화자에게 되돌아가는 현상 즉, 음향 반향현상이 필연적으로 발생하게 된다. 이로 인하여 원단화자는 근단화자의 신호와 함께 자신이 한말을 일정 시간후에 다시 듣게 되므로 통화의 품질이 떨어지게 되어 통화에 불편함을 느끼게 된다. 따라서, 고품질의 핸드프리 통신 시스템을 구현하기 위해서는 음향 방향 제거기(Acoustic Echo Canceller)가 반드시 필요하다.
이러한 음향 반향을 제거하기 위해서는 적응필터를 사용하는 반향 경로를 연속적으로 추정하여 새로 생성된 반향성분만을 제거하여 통화의 부잔영성을 줄여주는 적응 음향 반향 제거기법이 주로 사용된다.
현재 대부분의 원거리 회의 시스템은 하나의 양방향(Full-Duplex)오디오 채날만을 이용하여 통신을 하기 때문에 회의 참석자들에게 같은 공간에서 회의를 하는 듯한 공간감을 느끼게 해 줄수가 없다. 특히 화상 회의 시스템의 경우 화면상으로 화자의 움직임 등의 간간상의 변화를 전달할 수 있으나, 하나의 오디오 채널에 의해 전송되는 음성신호로는 공간상의 변화를 제대로 절달할 수 없기 때문에 오히려 통화의 부자연성이 발생하게 된다. 따라서, 회의 참석자들이 마치 한 공간에서 회으를 하는 듯한 느낌을 주기 위해서는 적어도 2개의 오디오 채널을 사용하는 스테레오 원거리 회의 시스템이 필요하며, 이때, 발생하는 음향반향을 제거하기 위한 음향 방향 제거기의 연구도 필연적인 것이다.
음향 반향은 핸드프리 전화기, 원거리 회의 시스템, PA(Public Address) 시스템과 같이핸드프리 방식으로 이루어지는 통화환경에서 발생한다.
도 1은 원거리 회의 시스템과 같은 통신 환경에서 발생하는 음향 반향과 음향 반향 제거기의 위치를 나타내고 있다. 여기서, x(k)는 스피커로 출력되는 원단화자의 음성신호이고, v(k)와 δ(k)는 각각 근단화자의 음성신호와 근단의 주변 자음을 나타내며, H(z)는 수신실의 음향 반향의 전달함수를 나타낸다.
근단화자의 신호의 주변잡음이 없을 경우의 y(k)는 마이크로 폰으로의 유입되는 반향신호를 의미한다.
음성 통신에서는 통화자의 음성을 왜곡없이 상대방에게 전달하여야 한다. 그러나, 도 1과 같이 핸드프리방식으로 통화가 이루어지는 환경에서는 원단신호 x(k)가 스피커, 사무실 공간 그리고 마이크로폰으로 구성되는 반향경로를 경유하여 다시 원단화자에게 되돌아가게 된다. 이로 인해 원단화자는 근단화자의 신호 v(k)뿐 만 아니라 자기가 발성한 음성을 통화 왕복 지연시간 뒤에 듣게 되어 통화에 불편함을 느끼게 된다, 즉, 통신 채널에 의한 왜곡이 없더라도 반향신호에 의해 통화의 품질은 크게 저하된다, 이러한 음향 반향의 영향은 그 크기와 시간지연에 비례하여 증가하게 된다.
반향 경로의 특성이 시간에 따라 변화하지 않는다면, 반향경로의 충격응답(Impulse Response)을 미리 측정하여 반향신호를 생성시킬 수 있고, 이를 마이크로 폰에 입력된 신호로부터 빼줌으로써, 반향신호를 완벽하게 제거할 수 있다. 그러나, 실제의 원거리 회의등과 같은 환경에서는 회의 참석자가 머리, 팔, 어깨 등을 움직이고, 반향경로가 시간에 따라 변화하기 때문에 적응필터를 사용하여 변화하는 반향경로 특성을 연속적으로 추적하여야 만 효과적으로 반향을 제거할수 있다. 적응 반향 제거 시스템은 스피커로 전송되는 신호 x(k)를 참조신호로 수신실의 마이크로 폰 입력신호 y(k)를 목적신호로 하여 시변하는 반향 경로 H(z)를 추정한 뒤 이를 이용하여 예측된 반향신호 y^(k)를 합성하여 반향신호를 제거한다.
적응필터의 계수를 갱신하는 적응 알고리즘은 일반적으로 통계적 미분(Stochastic Gradient) 계열의 알고리즘과 LS(Least Square)계열의 알고리즘으로 구분된다. 통계적 미분 알고리즘의 대표적인 형태인 LMS(Least Mean Square)알고리즘과 NLMS(Normalized Least Mean Square)알고리즘은 비교적 적은 연산량으로 안정성 확보가 용이하다는 장점을 가지고 있지만, 음성신호와 같이 샘플간의 자기 상관도가 높은 신호에 대해서는 그 수렴 성능이 저하되는 단점이 있다.
반면에 LS계열의 알고리즘인 RLS(Recursive Least Square)알고리즘, Kalman 알고리즘은 수렴성능이 입력신호와 상관관계에 덜 민감하며 음성신호와 같은 비정적인 신호에 대해서는 빠른 수혐 속도를 갖지만 역행렬 연산을 포함하는 과중한 계산량을 요구하는 단점이 있다.
스테레오 음향 반향 제거기는 기본적으로 단일 채널 반향 제거기의 원리를 확장 적용하여 반향 제거를 수행하지만, 단일 채널 반향 제거기에서 발생하지 않는 다른 문제점을 가지고 있다. 다음에서 도 2를 참조하여 스테레오 음향 반향 제거기의 구조와 문제점에 대하여 살펴보도록 하자. 도 2는 도 1에 도시된 스테레오 음향 반향 제거기의 상세 구성 즉, 스테레오 반향 제거장치의 기본 구조에 대한 블록 구성도이다.
기본적으로 스테레오 음향 반향 제거기는 도 2에 도시된 바와 같이, 단일 채널 음향 반향 제거의 원리를 두 채널로 확장하여 구성할 수 있다. 스테레오 원거리 회의 시스템에서는 전송실(100) 및 수신실(200) 각각 2개의 마이크로 폰(101, 102, 201, 202)과 2개의 스피커(103, 104, 203, 204)를 사용하기 때문에 이들의 조합에 의해 총 4개의 반향 경로가 발생하게 된다. 도 2에서 전송실(100)의 스피커 1개와 수신실(200)에서의 마이크로 폰 1개는 생략되어 있다. 따라서, 각각의 반향 경로에서 발생하는 반향 성분을 제거하기 위해서는 4개의 적응필터가 필요하게 된다. 각 채널은 대칭성을 유지하므로 여기서는 편의상 수신실(200)의 하나의 마이크로 폰(202)으로 입력되는 반향 성분들에 대해서만 살펴보기로 한다.
전송실(100)에 위치한 원단화자의 음성신호는 도 2와 같이 원단화자와 두 마이크로 폰(101, 102)사이의 반향 경로 G1(z), G2(z)를 거쳐 각각의 마이크로 폰(101, 102)으로 입력된다.
그리고, 수신실(200)의 두 스피커(203, 204)로 전해진 스테레오 신호 x1(k), x2(k)는 각각 두 스피커(203, 204)와 한 개의 마이크로 폰(201)사이의 반향 경로 H1(z), H2(z)를 통과하여 수신실(200)의 마이크로 폰(201)으로 입력되어 반향신호 y(k)를 만들어 낸다. 이때, 반향 경로 H1(z), H1(z)를 추정하는 적응필터(10, 20)를 사용함으로써, 추정된 반향신호 y^(k)를 합성하여 반향신호 y(k)를 제거할 수 있다. 즉, 전송실(100)의 두 마이크로 폰(101, 102)를 통해 출력되는 각각의 신호는 각각의 적응필터(10, 20)를 통해 각각의 필터링된 신호가 가산기(30)로 출력되고,가산기(30)는 각 적응필터(10, 20)에서 출력되는 신호를 가산하여 추정된 반향신호 y^(k)를 가산기(40)로 출력된다. 따라서, 가산기(40)는 가산기(30)에서 출력되는 반향 추정신호 y^(k)와 수신실(200)의 마이크로 폰(201)을 통해 반향된 신호 y(k)를 합성하여 반향된 신호를 제거하는 것이다.
그러나, 적응 필터(10, 20)의 입력으로 사용되는 두 채널신호는 동일한 음원 S(원단화자)로부터 발생된 신호이기 때문에 서로간에 매우 강한 상관관계를 가진다. 이로 인하여 스테레오 음향 반향 제거기에서는 최적해가 유일하게 존재하지 않거나 적응필터의 수렴이 전송실의 환경변화에 영향을 받게 되는 것과 같은 단일채널 음향 반향 제거지에서 발생하지 않는 문제점들을 갖게 된다.
따라서, 이러한 문제에 의해 스테레오 음향 반향 제거기의 성능이 저하되는데, 이러한 문제점을 해결하기 위하여 일반적으로 전처리단을 구성하여 입력신호간의 상호 상관 관계를 낮추는 방법을 사로 사용하였다.
이와 같은 전처리단을 사용한 종래 기술에 따른 스테레오 음향 반향 제거장치에 대하여 첨부한 도면을 참조하여 설명해 보도록 한다.
도 3은 전 처리단을 이용한 일반적인 스테레오 음향 반향 제거장치에 대한 블록 구성을 나타낸 도면이다.
먼저, 도 3에 도시된 전처리부(50)(Pre-Processing Block)은 수신실(200)로 전송되는 두 채널 입력신호의 상관관계를 제거하는 역할을 수행하는 것으로서, 각 채널 신호를 독립적으로 랜덤잡음(Radom Noise)신호로 변조시키는 방법, 비선형 함수를 이용하는 방법, 시변 대역통과 필터를 사용하는 방법등으로 구성할 수 있다.
이중 가장 간단하면서도 효과적으로 두 신호간의 상관관계를 제거하는 전치리부(50)는 두 채널 입력신호간의 상관관계를 낮추기 위해 두 신호에 서로 독립적인 부가 백색잡음을 섞어주는 방법이다.
이 경우, 전처리부에서 처리된 신호 x^ 1(k), x^ 2(k) 각각 즉, x^ I(k)는 아래의 수학식 1과 같이 구성된다.
여기서, xi(k)는 전송되는 전처리부(50) 입력신호이고, n1(k), n2(k)는 서로 독립 백색 부가잡음이다.
이 경우, 부가 백색잡음의 크기가 커질 수록 두 채널 신호간의 상호 상관도가 낮아지지만, 반대로 전송되는 신호의 신호 대 잡음비(SNR)가 나빠지게 되어 소리의 왜곡이 발생한다.
이와 같은 전처리부(50)의 이용은 신호간의 상호 상관관계를 효과적으로 저하시킬 수 있으나, 전송되는 신호에 임의의 신호를 더하거나 변조하기 때문에 음장감과 음질의 손상이 필연적으로 발생한다. 이러한 신호의 음질 저하없이 입력신호의 상관관계를 제거하기 위해 청각특성을 이용한 전처리부(50)의 구성이 제안되었다.
이 방법은 오디오 부호화에서 널리 이용되는 동시 마스킹 효과(SimultaneousMasking Effect)를 이용한 것으로, 동시 마스킹 효과는 주파수 영역에서 음압 레벨이 큰 신호에 의하여 인접한 주파수의 음압레벨이 작은 신호가 가려져서 잘 들리지않는 현상을 말한다.
이를 이용하여 주파수 영역에서 큰 레벨을 가진 신호의 대역을 중심으로 부가잡음을 첨가하면 동시 마스킹 효과에 의해 더해진 잡음은 청각적으로 인가되지 않으면서 입력신호의 상호 상관관계를 낮출 수 있다. 그러나, 마스킹 될 수 있는 신호 한계 레벨을 의미하는 마스킹 임계값과 마스킹 곡선을 구하는 과정이 필수적으로 포함되는데, 이 과정에서 요구하는 계산량으로 인하여 실제 구현상의 어려움이 있다. 따라서, 보다 효과적으로 창각적으로 인가되지 않는 부가잡음을 발생하는 방법이 요구된다.
따라서, 본 발명은 상기한 종래기술에 따른 제반 문제점을 해결하기 위하여 안출한 것으로 본 발명의 목적은 스테레오 음향 반향 제거기의 성능 향상을 위한 세로운 전처리단에 관한 것으로, 인간의 청각특성과 음성신호 특성을 고려하여 적은 계산량으로 전송되는 신호의 음질을 저하시키지 않으면서 두 채널 입력 신호의 상호 상관관계를 저하시켜 적응필터의 수렴특성을 크게 향상시킬 수 있도록 전처리단을 이용한 스테레오 음향 반향 제거장치를 제공함에 있다.
상기한 목적을 달성하기 위한 본 발명에 따른 전처리단을 이용한 스테레오 음향 반향 제거장치의 특징은, 전송되는 원 음성신호의 반향을 제거하는 스테레오음향 반향 제거기에 있어서, 상기 원 음성신호를 분석하여 AR계수를 추출하는 AR계수 추출부와; 백색잡음을 발생시키는 노이즈 발생부와; 상기 AR계수 추출부에서 추출된 AR계수에 상기 노이즈 발생부에서 발생한 백색잡음을 합성하여 음성신호와 같은 AR특성을 갖는 AR잡음을 생성하는 AR잡음 생성부와; 상기 전송되는 원 음성신호에 대한 에너지값과, AR잡음 생성부에서 생성된 AR잡음에 대한 에너지값을 각각 계산하는 에너지 계산부와; 상기 에너지 계산부에서 계산된 원 음성신호의 에너지값과 AR잡음에 대한 에너지값을 비교하여 AR잡음의 이득을 계산하는 이득 게산부와; 상기 이득계산부에서 계산된 AR잡음의 이득에 따라 AR잡음 생성부에서 생성된 AR잡음의 이득을 조절하는 이득조절부와; 상기 이득 조절부에서 이득 조절된 AR잡음을 상기 원 음성신호와 가산하여 상기 음향 반향 제거기로 출력하는 가산부를 포함하여 구성됨에 있다.
도 1은 일반적인 음향 반향 제거장치의 기본 구조를 나타낸 도면,
도 2는 스테레오 음향 반향 제거기의 기본 구조를 나타낸 도면,
도 3은 전 처리단을 이용한 일반적인 스테레오 음향 반향 제거장치에 대한 블록 구성을 나타낸 도면,
도 4는 일반적인 음성신호의 발생 모델을 나타낸 도면,
도 5는 유성음의 음성 스펙트럼과 AR계수 스펙트럼의 상관 관계에 대한 그래프를 나타낸 도면,
도 6은 본 발명에 따른 전 처리단을 이용한 스테레오 음향 방향 제거장치에서 전 처리단의 상세 블록 회로 구성을 나타낸 도면.
〈도면의 주요부분에 대한 부호의 설명〉
100 : 전송 룸 200 : 수신 룸
10, 20 : 적응필터 30, 40 : 가산기
50 : 전 처리부 51, 55 : 파워 계산부
52 : AR계수 추출부 53 : 노이즈 발생부
54 : AR잡음 생성부 56 : 이득 계산부
57 : 이득 조절부 58 : 가산기
먼저, 본 발명은 스테레오 음향 반향 제거에서 가장 큰 문제로 작용하는 두 채널 입력간의 강한 상호 상관관계를 제거하기 위해 새로운 구조의 전처리장치를 제안한 것이다. 제안된 전처리단은 심리 음향과 음성신호의 특성을 이용하여 청각으로 인지되지 않는 크기의 부가 잡음을 더해 줌으로써, 기존의 방법과는 달이 음질의 저하를 가져오지 않으면서 반향 제거성능을 향상시킨 것이다.
즉, 본 발명에서 제안된 전처리단은 심리음향의 청각특성 뿐만 아니라 음성신호의 특성을 함깨 고려하여 비교적 간단한 방법으로 창각적으로 인지되지 않는부가잡음을 생성할 수 있다. 제안된 전처리단을 설명하기 위해 먼저 음성신호의 특성에 대하여 간략하게 살펴보도록 하자.
도 4는 일반적인 음성신호의 발생 모델을 나타낸 도면으로서, 유,무성음 구간에 따라 다르게 구성되는 여기(Excitation)신호를 성도(Vocal Tract) 전달함수를 통과시켜 얻어지는 것으로 모델링할 수 있다.
여기신호는 각 구간의 특성에 따라 다른 발생 모델이 사용되는데, 보통 주기적 특성이 나타나는 유성음 구간에서는 일정 간격으로 구성되는 펄스 열로, 무성음 구간에서는 백색 잡음으로 모델링된다.
도 4에서 G는 여기신호의 이득을 나타내고, e(k)는 성도에 입력되는 여기신호이며, H(z)는 성도 전달함수로서, 시변 극-영점(Pole-Zero)으로 구성된 디지탈 필터이지만 음성신호에서는 점극(all-pole)모델로 충준히 근사화할 수 있다.
전극모델은 AR(Auto-Regressive)모델이라고도 하며, 이때, AR계수가 흔히 말하는 LPC(Linear Predictive Coding)계수이다.
성도의 전달특성을 결정하는 AR계수는 아애의 수학식 2와 같은 방법으로 모델링된다.
여기서, G는 이득, ak는 AR 계수, P 는 AR 차수, A(z)는 역필터이다.
상기 수학식 2에서 P개의 모델 파라메터 ak(1 ≤k ≤P)는 예측 오차의 에너지를 최소로 선형 예측기의 계수로 주어진다.
성도 전달함수 H(z)는 시간에 따라 천천히 변화하는 특성(Guasi-Stationary)을 가지고 있으므로 10 - 30ms의 구간마다 필터계수를 갱신한다.
음성신호의 스펙트럼은 성도 전달함수를 모델링하는 AR계수의 스펙트럼과 여기신호의 스펙트럼이 곱해진 형태로 나타난다. 여기신호는 음성신호의 스펙트럼에서 피치(Pitch)정보를 나타내고, AR계수의 스펙트럼은 음선신호 스펙트럼의 포락선, 즉 각 주파수 영역에서 소리의 레벨을 표현한다. 도 5는 음성음 신호의 스펙트럼과 10차 AR 포락선을 보여준다.
도 5에서 AR포락선은 스펙트럼의 편균전력으로 정규화한 1/A(z)의 주파수 응답이다. 도 5에서 AR계수의 스펙트럼이 음성의 주파수 축 상에서 대체적인 소리의 레벨을 나타내는 것을 확인할 수 있다.
이러한 특성으로 인하여 음성신호의 경우 마스킹 곡선과 AR계수의 스펙트럼은 매우 유사한 형태로 나타난다. 따라서, 정확한 마스킹 곡선을 계산하는 대신 음성신호의 AR계수의 스펙트럼을 이용하여 근사적인 마스킹 곡선으로 사용함으로 계산량에서 큰 이득을 얻을 수 있다.
AR계수의 스펙트럼을 이용하여 부가잡음을 생성할 경우 음성신호에 더해지는 잡음의 크기는 AR계수 스펙트럼에 비레하여 설정되는데, 청각으로 인지되지 않는 크기의 부가잡음이 생성되는 이득을 실험적으로 찾을 수 있다.
AR계수는 Levinson-Durbin 알고리즘이나 격자 예측기(Lattice Predictor) 등을 이용하여 간단하게 얻을 수 있다. 또한, 대부분의 음성 부호화기는 신호의 전송에서 AR계수를 포함하기 때문에 제안된 전처리단이 음성 부호화기의 결합된 통신에 이용될 경우 AR계수를 구하기 위한 별도의 음성 분석이 필요없게 된다.
이하, 첨부한 도 6을 참조하여 본 발명에 따른 전처리단을 이용한 스테레오 음향 반향 제거장치에 대하여 설명해 보기로 하자.
도 6은 본 발명에 따른 전처리단을 이용한 스테레오 음향 반향 제거장치에 대한 블록 구성을 나타낸 도면이다.
도 5를 참조하여 그 구성을 살펴보면, 전송실(100)에서 마이크로 폰(101, 102)을 통해 출력되는 음성신호의 파워를 계산하는 제 1 파워 계산부(51)와, 전송실(100)에서 마이크로 폰(101, 102)을 통해 출력되는 음성신호를 분석하여 AR계수를 추출하는 AR계수 추출부(52)와, 백색잡음을 발생시키는 노이즈 발생부(53)와, 상기 AR계수 추출부(52)에서 추출된 AR계수에 상기 노이즈 발생부(53)에서 발생한 백색잡음을 합성하여 음성신호와 같은 AR특성을 갖는 부가잡음(이하, AR잡음이라 칭함)을 생성하는 AR잡음 생성부(54)와, AR잡음 생성부(54)에서 생성된 AR잡음에 대한 파워를 계산하는 제 2 파워 계산부(55)로 구성된다.
또한, 상기 제 1 파워계산부(51)에서 계산된 원 음성신호의 파워와 상기 제 2파워 계산부(55)에서 계산된 AR잡음에 대한 파워를 비교하여 AR잡음의 이득을 계산하는 이득 게산부(56)와, 이득계산부(56)에서 계산된 AR잡음의 이득에 따라 AR잡음 생성부(54)에서 생성된 AR잡음의 이득을 조절하는 이득조절하는 이득조절부(57)와, 이득 조절부(570에서 이득 조절된 AR잡음을 상기 전송실(100)에서 출력되는 원음성신호와 가산하여 수신실(200)의 스피커(203, 204)로 출력하는 가산기로 구성된 것이다.
이와 같은 구성을 갖는 본 발명에 따른 스테레오 음향 반향 제거장치의 전처리부(50)의 동작에 대하여 설명해 보도록 하자.
본 발명에 따른 전처리부(50)는 청각특성과 음성신호의 특성을 이용한 것으로, 먼저 송신실(100)의 2개의 마이크로 폰(103, 104)각각을 통해 수신실(200)로 출력되는 음성신호 x(n)을 음성신호 분석과정을 이용하여 AR계수 추출부(52)에서 AR계수 A(z)를 추출한다.
AR 계수 추출부(52)에서 추출된 AR 계수 A(z)는 AR잡음 생성부(54)로 출력한다.
AR 잡음 생성부(54)는 AR 계수로 구성된 합성필터에서는 노이즈 발생부(53)에서 발생된 백색잡음 n(k)를 상기 추출된 AR계수 A(z)에 통과시켜 음성신호같은 AR잡음n~(k)를 생성하는 것이다.
그리고, 제 1 파워 게산부(51)에서는 상기 송신실(100)에서 출력되는 음성신호 x(n)의 파워 즉, 에너지를 계산하여 계산된 음성신호의 에너지 σ2 x(k)를 이득 계산부(56)으로 제공한다.
한편, 제 2 파워 계산부(55)는 AR 잡음 생성부(54)에서 생성한 AR잡음n~(k)에 대한 파워 즉, 에너지를 게산한 후, 계산된 AR잡음의 에너지 σ2 x~(k)를 이득 계산부(56)으로 출력한다.
이득 게산부(56)는 상기 제 1, 2, 파워 계산부(51, 55)에서 출력되는 음성신호의 에너지값 σ2 x(k)과 AR잡음에 대한 에너지값 σ2 x~(k)를 비교하여 AR잡음의 이득을 결정한다. 즉, 생성된 AR잡음이 원 음성신호에 더해졌을 때, 청각적으로 인지지되지 않는 정해진 SNR을 유지하기 위해 음성신호의 에너지와 AR잡음의 에너지를 비교하여 AR잡음의 이득 α을 결정하는 것이다.
이렇게 이득 계산부(56)에서 계산된 AR잡음의 이득 α에 따라 AR잡음 생성부(54)에서 생성된 AR잡음n~(k)의 이득을 조절한 후, 조절된 AR잡음을 가산기(58)로 출력하여 송신실(100)에서 출력되는 원 음성신호가 가산되어 수신실(200)의 스피커(203, 204)로 각각 전송되는 것이다.
여기서, 상기 AR계수 추출부(52)에서 음성신호의 분석을 위해 10차의 차수를 갖는 격자예측기를 이용한다.
그리고, 음성신호와 AR잡음의 에너지는 아래의 수학식 3과 4와 같이 1-Pole IIR필터를 이용하여 시각 재귀적(Time-Recursive)로 구한다.
여기서, λ는 시간재귀적인 에너지 계산을 위한 망각 상수(Forgetting Factor)이고, σ(k)는 송신실(100)에서 출력되는 음성신호의 에너지, σn~(k)는 AR잡음의 에너지이다.
또한, 실험적으로 결정되는 가변 SNR에 따른 AR잡음의 이득 즉, 이득계산부(56)에서 계산되는 AR잡음의 이득은 ANR의 정의로 부터 아래의 수학식 5와 같이 계산되어진다.
결국, 본 발명에 따른 스테레오 음향 반향 제거장치에 적용되는 전처리단은 인간의 청각특성을 이용함으로 전송신호의 음질 저하없이 신호간의 상호 상관관계를 제거할 수 있으며, 음성신호 분석을 이용하여 적은 계산량으로 구성이 가능하다.
또한, 복호화된 신호를 입력으로 사용할 경우 복호화된 신호열이 AR계수를 포함하고 있으므로 별도의 음성 분석과정 없이도 구현이 가능한 것이다.
상술한 바와 같은 본 발명에 따른 전처리단을 이용한 스테레오 음향 반향 제거장치는 인간 청각특성과 음성신호의 특성을 이용한 전 처리단을 구성함으로써, 멀티미디어 원거리 회의에서 입력 음성신호간의 강한 상관 관계를 음질의 왜곡없이 적은 계산량으로 효과적으로 제거할 수 있는 이점이 있다.
이를 통하여 간단하게 스테레오 음향 반향 제거기의 성능을 크게 향상시킬 수 있으며, 복호화된 음성신호를 사용하는 무선 통신에 적용될 경우 별도의 음성 분석단을 구성하지 않아도 되는 장점을 가진 것이다.

Claims (5)

  1. 전송되는 원 음성신호의 반향을 제거하는 스테레오 음향 반향 제거기에 있어서,
    상기 원 음성신호를 분석하여 AR계수를 추출하는 AR계수 추출부와;
    백색잡음을 발생시키는 노이즈 발생부와;
    상기 AR계수 추출부에서 추출된 AR계수에 상기 노이즈 발생부에서 발생한 백색잡음을 합성하여 음성신호와 같은 AR특성을 갖는 AR잡음을 생성하는 AR잡음 생성부와;
    상기 전송되는 원 음성신호에 대한 에너지값과, AR잡음 생성부에서 생성된 AR잡음에 대한 에너지값을 각각 계산하는 에너지 계산부와;
    상기 에너지 계산부에서 계산된 원 음성신호의 에너지값과 AR잡음에 대한 에너지값을 비교하여 AR잡음의 이득을 계산하는 이득 게산부와;
    상기 이득계산부에서 계산된 AR잡음의 이득에 따라 AR잡음 생성부에서 생성된 AR잡음의 이득을 조절하는 이득조절부와;
    상기 이득 조절부에서 이득 조절된 AR잡음을 상기 원 음성신호와 가산하여 상기 음향 반향 제거기로 출력하는 가산부를 포함하여 구성됨을 특징으로 하는 전처리단을 이용한 스테레오 음향 반향 제거장치.
  2. 제 1 항에 있어서,
    상기 이득 계산부는 상기 AR잡음 생성부에서 생성된 AR잡음이 원 음성신호에 더해 졌을 때청각적으로 인지되지 않는 정해진 SNR을 유지하기 위해 음성신호의 에너지와 AR잡음의 에너지를 비교하여 AR잡음의 이득을 결정하는 것을 특징으로 하는 전처리단을 이용한 스테레오 음향 반향 제거장치.
  3. 제 1 항에 있어서,
    상기 에너지 게산부에서의 원 음성신호의 에너지값은 아래의 수학식을 이용하여 계산되어짐을 특징으로 하는 전처리단을 이용한 스테레오 음향 반행 제거장치.
    여기서, λ는 시간재귀적인 에너지 계산을 위한 망각 상수(Forgetting Factor)이고, σ(k)는 송신실(100)에서 출력되는 음성신호의 에너지이다.
  4. 제 1 항에 있어서,
    상기 상기 에너지 계산부에서의 AR 잡음의 에너지값은 아래의 수학식을 이용하여 계산되어짐을 특징으로 하는 전처리단을 이용한 스테레오 음향 반행 제거장치.
    여기서, λ는 시간재귀적인 에너지 계산을 위한 망각 상수(Forgetting Factor)이고, σn~(k)는 AR잡음의 에너지이다.
  5. 제 1 항에 있어서,
    상기 이득 게산부에서의 이득 계산은 아래의 수학식 을 이용하여 게산되어짐을 특징으로 하는 전처리단을 이용한 스테레오 음향 반향 제거장치.
    여기서, 상기 σ 2(k)는 원 음성신호의 에너지값이고, σn~ 2(k)는 AR잡음의 에너지값이다.
KR1019990064939A 1999-12-29 1999-12-29 전 처리단을 이용한 스테레오 음향 반향 제거장치 KR20010065125A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990064939A KR20010065125A (ko) 1999-12-29 1999-12-29 전 처리단을 이용한 스테레오 음향 반향 제거장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990064939A KR20010065125A (ko) 1999-12-29 1999-12-29 전 처리단을 이용한 스테레오 음향 반향 제거장치

Publications (1)

Publication Number Publication Date
KR20010065125A true KR20010065125A (ko) 2001-07-11

Family

ID=19632195

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990064939A KR20010065125A (ko) 1999-12-29 1999-12-29 전 처리단을 이용한 스테레오 음향 반향 제거장치

Country Status (1)

Country Link
KR (1) KR20010065125A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100377797B1 (ko) * 2000-12-30 2003-03-26 주식회사 하이닉스반도체 이동통신용 핸즈프리 단말기의 잔여 반향 제거장치
KR100672492B1 (ko) * 2006-04-25 2007-01-24 엘지전자 주식회사 이동 단말기의 이어마이크로폰 노이즈 제거 방법 및 이를위한 이동 단말기

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100377797B1 (ko) * 2000-12-30 2003-03-26 주식회사 하이닉스반도체 이동통신용 핸즈프리 단말기의 잔여 반향 제거장치
KR100672492B1 (ko) * 2006-04-25 2007-01-24 엘지전자 주식회사 이동 단말기의 이어마이크로폰 노이즈 제거 방법 및 이를위한 이동 단말기

Similar Documents

Publication Publication Date Title
Zhang et al. Deep learning for acoustic echo cancellation in noisy and double-talk scenarios
Gustafsson et al. A psychoacoustic approach to combined acoustic echo cancellation and noise reduction
US9768829B2 (en) Methods for processing audio signals and circuit arrangements therefor
CN108376548B (zh) 一种基于麦克风阵列的回声消除方法与系统
US7869587B2 (en) Method and apparatus for canceling acoustic echo in a mobile terminal
US11297178B2 (en) Method, apparatus, and computer-readable media utilizing residual echo estimate information to derive secondary echo reduction parameters
EP0841799A2 (en) Stereophonic acoustic echo cancellation using non-linear transformations
Park et al. Integrated echo and noise canceler for hands-free applications
JP2009503568A (ja) 雑音環境における音声信号の着実な分離
CN104052526A (zh) 用于声学回声抵消器的基于倒谱距离的消波
Habets et al. Joint dereverberation and residual echo suppression of speech signals in noisy environments
JPH11331046A (ja) エコー抑圧方法及び装置並びにエコー抑圧プログラムが記憶されたコンピュータに読取り可能な記憶媒体
JP3507020B2 (ja) 反響抑圧方法、反響抑圧装置及び反響抑圧プログラム記憶媒体
US6718036B1 (en) Linear predictive coding based acoustic echo cancellation
US7062039B1 (en) Methods and apparatus for improving adaptive filter performance by inclusion of inaudible information
Park et al. State-space microphone array nonlinear acoustic echo cancellation using multi-microphone near-end speech covariance
KR100827146B1 (ko) 이동 단말에서 반향 제거 방법 및 장치
KR101035736B1 (ko) 이동통신 시스템의 단말 장치에서 반향 제거 장치 및 방법
Mohammed A new robust adaptive beamformer for enhancing speech corrupted with colored noise
KR20010065125A (ko) 전 처리단을 이용한 스테레오 음향 반향 제거장치
EP1521241A1 (en) Transmission of speech coding parameters with echo cancellation
US7023986B2 (en) Echo canceller in a communication system at a terminal
Fukui et al. Acoustic echo canceller software for VoIP hands-free application on smartphone and tablet devices
Ihle et al. Integration of noise reduction and echo attenuation for handset-free communication
Kallinger et al. Multi-microphone residual echo estimation

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application