KR102340999B1

KR102340999B1 - 시간 지연 추정을 기반으로 하는 에코 제거 방법 및 장치

Info

Publication number: KR102340999B1
Application number: KR1020207014264A
Authority: KR
Inventors: 밍지 리; 펭 마; 하이쿤 왕; 지구오 왕; 구오핑 후
Original assignee: 아이플라이텍 캄파니 리미티드
Priority date: 2017-10-23
Filing date: 2018-07-16
Publication date: 2021-12-20
Also published as: KR20200070346A; EP3703052C0; CN107610713B; US20210051404A1; US11323807B2; EP3703052B1; ES2965954T3; CN107610713A; JP7018130B2; WO2019080552A1; EP3703052A4; EP3703052A1; JP2021500778A

Abstract

시간 지연 추정(time delay estimation)을 기반으로 하는 에코 제거(echo cancellation) 방법 및 장치. 방법은, 마이크로폰 신호와 기준 신호를 획득하고, 그들을 전처리하는 단계(101); 전처리된 마이크로폰 신호와 기준 신호에서, 현재 에코 제거 시나리오의 비선형성을 갖는 주파수 포인트 신호들을 결정하는 단계(102); 마이크로폰 신호와 기준 신호에서 비선형성이 없는 주파수 포인트 신호들에 따라, 계산에 의해, 현재 시간 지연 추정 값을 획득하는 단계(103); 현재 시간 지연 추정 값에 기반하여, 기준 신호를 이동시키는 단계(104); 및 에코 제거를 실현하기 위해, 전처리된 마이크로폰 신호와 이동된 기준 신호에 따라, 자기-적응 필터를 업데이트하는 단계(105)를 포함한다. 본 발명은 시간 지연 추정의 정확도를 향상시키고, 에코 제거 효과를 향상시킬 수 있다.

Description

시간 지연 추정을 기반으로 하는 에코 제거 방법 및 장치

본원은, 2017년 10월 23일에 출원된 “시간 지연 추정을 기반으로 하는 에코 제거 방법 및 장치”라는 명칭의 중국 특허 출원 제201710994195.X호에 대한 우선권을 주장하며, 그 전체가 참조로서 본 문서에 포함된다.

본 개시는 신호 처리 분야에 관한 것이며, 특히 지연 추정(delay estimation)을 기반으로 하는 에코 제거(echo cancellation) 방법 및 지연 추정을 기반으로 하는 에코 제거 장치에 관한 것이다.

정보 기술의 지속적인 개발에 따라, 다양한 종류의 분산 스마트 하드웨어(distributed smart hardware)가 다양한 분야들에서 점점 더 많이 사용되고 있다. 에코 제거는 스마트 디바이스들 간 상호 작용에 필요하며, 이는 해당 분야의 연구 핫스팟(research hotspot)이다.

에코 제거는 파-엔드(fae-end) 사운드(sound)의 복귀(return)를 방지하기 위해, 로컬(local) 마이크로폰(microphone)에 의해 픽업된 파-엔드 사운드 신호를 취소 또는 제거하는 처리이다. 기존의 전형적인 에코 제거 방식은 지연 추정을 기반으로 한다. 기준(reference) 신호와 마이크로폰 신호 사이의 선형 상관도(linear correlation)가 계산된다. 최대(maximum) 상호-상관(cross-corrleation)에 대응하는 지연이 디바이스 지연(device delay)으로 선택된다. 기준 신호는 디바이스 지연에 기반하여 시프트된다(shifted). 실제 에코에 가까운(approximating) 신호를 생성하기 위해, 적응 필터(adaptive filter)는 시프트된 기준 신호와 마이크로폰 신호를 기반으로, 업데이트된다. 에코 제거를 달성하기 위해, 실제 에코에 가까운 신호는 마이크로폰 신호로부터 감산된다(subtracted). 예를 들면, 자체-동작 승인(self-operation authorization)을 갖는 분산 스마트 하드웨어 장치는 기준 신호와 마이크로폰 신호를 동기적으로 리샘플링할 수 없다. 예를 들면, 일반 가정에서, 텔레비전 박스(television box)가 텔레비전을 제어하는 데 사용된다. 텔레비전 박스와 텔레비전은 일반적으로 상이한 제조업체들에 의해 제공된다. 예를 들면, 텔레비전 박스의 제조자는, 텔레비전에 의해 재생되는 사운도의 에코 제거를 수행하도록, 텔레비전 박스의 사운드 제어 기능을 설계하지만, 텔레비전의 동작 승인만을 갖는다. 즉, 텔레비전 박스는 텔레비전 박스에 의해 텔레비전으로 전송된 소스(source) 신호 및 텔레비전 박스의 마이크로폰에 의해 수집된 신호만을 획득할 수 있다. 이러한 경우, 텔레비전 박스에 의해 텔레비전으로 전송된 소스 신호는 기준 신호로서 기능한다. 텔레비전 박스의 마이크로폰에 의해 수집된 신호는 마이크로폰 신호로서 기능한다. 텔레비전 박스는 스피커 신호와 마이크로폰 신호를 동기적으로 리샘플링할 수 없다. 따라서, 지연을 기반으로 하는 에코 제거를 달성하기 위해, 기준 신호와 마이크로폰 신호 사이의 지연이 추정될 필요가 있다.

지연 추정의 정확도는 에코 제거의 효과에 직접적으로 영향을 미친다는 것을 알 수 있다. 실제 적용들의 복잡하고 변경 가능한 환경으로 인해, 지연 추정을 기반으로 하는 기존의 에코 제거 기술로 획득된 지연 추정 값에서 큰 에러(error)가 발생한다. 따라서, 에코 제거의 효과가 향상되는 것이 바람직하다.

본 개시의 실시예들에 따라, 지연 추정의 에러를 감소시키고 에코 제거의 효과를 향상시키기 위해, 지연 추정을 기반으로 하는 에코 제거 방법 및 지연 추정을 기반으로 하는 에코 제거 장치가 제공된다.

따라서, 본 개시에 따라, 다음의 기술적 해결 수단들이 제공된다.

지연 추정을 기반으로 하는 에코 제거 방법은, 마이크로폰 신호와 기준 신호를 수신하고, 상기 마이크로폰 신호와 상기 기준 신호를 전처리하는 단계; 상기 전처리된 마이크로폰 신호와 상기 전처리된 기준 신호에서, 현재 에코 제거 시나리오의 비선형성(non-linearity)을 갖는 주파수 포인트(frequency point) 신호들을 결정하는 단계; 상기 마이크로폰 신호와 상기 기준 신호에서 비선형성이 없는 주파수 포인트 신호들을 기반으로, 현재 지연 추정 값을 계산하는 단계; 상기 현재 지연 추정 값에 기반하여, 상기 기준 신호를 시프트하는 단계; 및 에코 제거를 수행하기 위해, 상기 전처리된 마이크로폰 신호와 상기 시프트된 기준 신호를 기반으로, 적응 필터를 업데이트하는 단계를 포함한다.

일 실시예에서, 상기 전처리된 마이크로폰 신호와 상기 전처리된 기준 신호에서, 현재 에코 제거 시나리오의 비선형성을 갖는 주파수 포인트 신호들을 결정하는 단계는, 파-엔드 신호 검출, 듀얼-엔드(dual-end) 신호 검출, 및 디바이스 하드웨어에 의해 발생되는 비선형성의 검출 중 하나 이상을 포함한다. 상기 파-엔드 신호 검출에서, 상기 비선형성을 갖는 주파수 포인트 신호들은 상기 전처리된 기준 신호의 에너지, 제로-크로싱 율(zero-crossing rate), 및 단기 진폭(short-term amplitude) 중 하나 이상에 기반하여, 결정된다. 상기 듀얼-엔드 신호 검출에서, 상기 비선형성을 갖는 주파수 포인트 신호들은 상기 전처리된 마이크로폰 신호의 에너지 대 상기 전처리된 기준 신호의 에너지의 비율에 기반하여, 결정된다. 상기 디바이스 하드웨어에 의해 발생되는 미선형성의 검출에서, 저주파수 범위에서의 상기 기준 신호와 상기 마이크로폰 신호 사이의 상관도(correlation)에 대한 평균 값이 계산된다. 이 후, 미리 결정된 주파수 간격(interval)의 다른 주파수 범위들에서의 상기 기준 신호와 상기 마이크로폰 신호 사이의 상관도에 대한 평균 값들이 계산된다. 마지막으로, 상기 비선형성을 갖는 주파수 포인트 신호들이 상기 다른 주파수 범위들에서의 상관도에 대한 평균 값들과 상기 저주파수 범위에서의 상관도의 평균 값에 기반하여, 결정된다.

일 실시예에서, 상기 마이크로폰 신호와 상기 기준 신호에서 비선형성이 없는 주파수 포인트 신호들을 기반으로, 현재 지연 추정 값을 계산하는 단계는, 지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들의 각각에 대해, 상기 기준 신호와 상기 마이크로폰 신호의 프레임에서 비선형성이 없는 주파수 포인트 신호들을 선택하고, 상기 기준 신호와 상기 마이크로폰 신호의 프레임 사이의 상호-상관(cross-correlation) 값을 계산하는 단계; 및 상기 기준 신호와 상기 마이크로폰 신호의 프레임들 사이의 계산된 상호-상관 값들에 기반하여, 상기 지연 추정 값을 결정하는 단계를 포함한다.

일 실시예에서, 상기 기준 신호와 상기 마이크로폰 신호의 프레임들 사이의 계산된 상호-상관 값들에 기반하여, 상기 지연 추정 값을 결정하는 단계는, 상기 기준 신호와 상기 마이크로폰 신호의 프레임들 사이의 상기 계산된 상호-상관 값들 중에서 최대 상호-상관 값을 갖는 마이크로폰 신호의 프레임에 대응하는 위치를 현재 지연 위치로 선택하는 단계; 및 상기 현재 지연 위치와 상기 기준 신호의 위치에 기반하여, 상기 현재 지연 추정 값을 결정하는 단계를 포함한다.

일 실시예에서, 상기 기준 신호와 상기 마이크로폰 신호의 프레임들 사이의 계산된 상호-상관 값들에 기반하여, 상기 현재 지연 추정 값을 결정하는 단계는, 각 지연 추정에서, 상기 기준 신호와 상기 지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들 사이의 상기 계산된 상호-상관 값들 중에서 최대 상호-상관 값을 갖는 마이크로폰 신호의 프레임에 대응하는 위치를 후보 지연 위치로 선택하는 단계; 및 후보 지연 위치들을 L-차원 어레이(Sa)에 매핑하고 - L은 상기 지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들의 총 개수와 동일함 -, 후보 지연 위치가 연속적으로 반복되는 횟수를 카운트하는 단계; 현재 후보 지연 위치가 변경되면, 상기 현재 후보 지연 위치에 대한 값을 제1 사전 설정 값(t1)만큼 증가시키고, 이전 후보 지연 위치에 대한 값을 제2 사전 설정 값(t2)만큼 감소시키고, 다른 위치들에 대한 값들을 제3 사전 설정 값(t3)만큼 감소시키는 단계; 상기 현재 후보 지연 위치가 변경되지 않으면, 상기 현재 후보 지연 위치에 대한 값을 상기 제1 사전 설정 값(t1)만큼 증가시키고, 다른 위치들에 대한 값들을 상기 제3 사전 설정 값(t3)만큼 감소시키는 단계 - 사기 제2 사전 설정 값(t2)은 상기 제3 사전 설정 값(t3) 이하임 -; 및 상기 현재 후보 지연 위치에 대한 값이 제1 임계 값 보다 크고, 상기 현재 후보 지연 위치가 연속적으로 반복되는 횟수가 제2 임계 값 보다 크면, 상기 현재 후보 지연 위치와 상기 기준 신호의 위치에 기반하여, 상기 현재 지연 추정 값을 결정하는 단계를 포함한다.

일 실시예에서, 상기 현재 지연 추정 값에 기반하여, 상기 기준 신호를 시프트하는 단계는, 상기 현재 지연 추정 값(D₁(t))이 제3 임계 값(T3) 이하인 경우, 상기 기준 신호의 데이터를 시프트하지 않고; 상기 현재 지연 추정 값(D₁(t))이 상기 제3 임계 값(T3) 보다 크고 제4 임계 값(T4) 보다 작은 경우, 상기 기준 신호의 데이터를 D₁(t)/2만큼 시프트하는 단계; 및 상기 현재 지연 추정 값(D₁(t))이 상기 제4 임계 값(T4) 이상인 경우, 상기 기준 신호의 데이터를 D₁(t)만큼 시프트하는 단계를 포함한다.

일 실시예에서, 상기 기준 신호와 상기 마이크로폰 신호의 프레임들 사이의 계산된 상호-상관 값들에 기반하여, 상기 지연 추정 값을 결정하는 단계는, 다음의 조건들: (1) 현재 지연 위치에 대응하는 상호-상관 값(C(t))이 이전 지연 위치에 대응하는 상호-상관 값(C(t-1)) 보다 큼; (2) 현재 지연 분석 범위에서의 각 프레임에 대해, 최대 상호-상관 값(C_max(t))에 대응하는 위치와 최소 상호-상관 값(C_min(t))에 대응하는 위치 사이의 차이 값이 제1 사전 설정 차이 값 보다 큼; (3) 상기 기준 신호와 상기 지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들 사이의 상호-상관 값들의 평균 값(C_mean(t))과 상기 현재 지연 위치에 대응하는 상호-상관 값(C(t)) 사이의 차이 값이 제2 사전 설정 차이 값 보다 큼; 및 (4) 상기 현재 지연 위치(p(t))가 이전 지연 위치(p(t-1)) 보다 작음 중 하나 이상이 충족되는 것을 결정하는 단계를 포함한다.

일 실시예에서, 상기 방법은, 히스토리컬(historical) 기준 신호의 데이터를 캐싱하는 단계; 및 상기 기준 신호를 시프트할 때, 상기 히스토리컬 기준 신호의 상기 캐싱된 데이터를 시프트하는 단계를 더 포함한다.

일 실시예에서, 상기 적응 필터를 업데이트하는 단계는, 상기 현재 지연 추정 값이 상기 적응 필터의 길이(length) 보다 작으면, 상기 지연 추정 값에 기반하여, 적응 필터 계수를 시프트하고, 상기 시프트된 적응 필터 계수에 기반하여, 상기 적응 필터를 업데이트하는 단계를 포함하고, 시프트 후에 값이 없는 위치에서의 계수가 리셋되고, 상기 적응 필터가 상기 리셋된 적응 필터 계수에 기반하여, 업데이트된다.

지연 추정을 기반으로 하는 에코 제거 장치는, 신호 처리 모듈, 주파수 포인트 검출 모듈, 지연 추정 모듈, 신호 시프트 모듈, 및 적응 필터를 포함한다. 상기 신호 처리 모듈은, 마이크로폰 신호와 기준 신호를 수신하고, 상기 마이크로폰 신호와 상기 기준 신호를 전처리하고, 상기 전처리된 마이크로폰 신호와 상기 전처리된 기준 신호를 출력하도록 구성된다. 상기 주파수 포인트 검출 모듈은, 상기 신호 처리 모듈에 의해 출력되는 상기 전처리된 마이크로폰 신호와 상기 전처리된 기준 신호에서, 현재 에코 제거 시나리오의 비선형성을 갖는 주파수 포인트 신호들을 결정하도록 구성된다. 상기 지연 추정 모듈은, 상기 전처리된 마이크로폰 신호와 상기 전처리된 기준 신호에서 상기 주파수 포인트 검출 모듈에 의해 결정되는 비선형성이 없는 주파수 포인트 신호들을 기반으로, 현재 지연 추정 값을 계산하고, 상기 현재 지연 추정 값을 출력하도록 구성된다. 상기 신호 시프트 모듈은, 상기 지연 추정 모듈에 의해 출력되는 상기 현재 지연 추정 값에 기반하여, 상기 기준 신호를 시프트하고, 상기 시프트된 기준 신호를 출력하도록 구성된다. 상기 적응 필터는, 에코 제거를 수행하기 위해, 상기 신호 처리 모듈에 의해 출력되는 상기 전처리된 마이크로폰 신호와 상기 신호 시프트 모듈에 의해 출력되는 상기 시프트된 기준 신호를 기반으로, 상기 적응 필터를 업데이트하도록 구성된다.

일 실시예에서, 상기 주파수 포인트 검출 모듈은, 파-엔드 신호 검출 유닛, 듀얼-엔드 신호 검출 유닛, 및 디바이스 하드웨어 검출 유닛 중 하나 이상을 포함한다. 상기 파-엔드 신호 검출 유닛은, 상기 전처리된 기준 신호의 에너지, 제로-크로싱 율, 및 단기 진폭 중 하나 이상에 기반하여, 상기 비선형성을 갖는 주파수 포인트 신호들을 결정하도록 구성된다. 상기 듀얼-엔드 신호 검출 유닛은, 상기 전처리된 마이크로폰 신호의 에너지 대 상기 전처리된 기준 신호의 에너지의 비율에 기반하여, 상기 비선형성을 갖는 주파수 포인트 신호들을 결정하도록 구성된다. 상기 디바이스 하드웨어 검출 유닛은, 저주파수 범위에서의 상기 기준 신호와 상기 마이크로폰 신호 사이의 상관도에 대한 평균 값을 결정하고, 특정 주파수 간격의 다른 주파수 범위들에서의 상기 기준 신호와 상기 마이크로폰 신호 사이의 상관도에 대한 평균 값들을 계산하고, 상기 다른 주파수 범위들에서의 상관도에 대한 평균 값들과 상기 저주파수 범위에서의 상관도의 평균 값에 기반하여, 상기 비선형성을 갖는 주파수 포인트 신호들을 결정하도록 구성된다.

일 실시예에서, 상기 지연 추정 모듈은, 상호-상관 계산 유닛 및 지연 추정 값 결정 유닛을 포함한다. 상기 상호-상관 계산 유닛은, 지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들의 각각에 대해, 상기 기준 신호와 상기 마이크로폰 신호의 프레임에서 비선형성이 없는 주파수 포인트 신호들을 선택하고, 상기 기준 신호와 상기 마이크로폰 신호의 프레임 사이의 상호-상관 값을 계산하도록 구성된다. 상기 지연 추정 값 결정 유닛은, 상기 기준 신호와 상기 마이크로폰 신호의 프레임들 사이의 계산된 상호-상관 값들에 기반하여, 상기 지연 추정 값을 결정하도록 구성된다.

일 실시예에서, 상기 지연 추정 값 결정 유닛은, 상기 기준 신호와 상기 마이크로폰 신호의 프레임들 사이의 상기 상호-상관 값들 중에서 최대 상호-상관 값을 갖는 마이크로폰 신호의 프레임에 대응하는 위치를 현재 지연 위치로 선택하고, 상기 현재 지연 위치와 상기 기준 신호의 위치에 기반하여, 상기 현재 지연 추정 값을 결정하도록 구성된다.

일 실시예에서, 상기 지연 추정 값 결정 유닛은, 각 지연 추정에서, 상기 기준 신호와 상기 지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들 사이의 상기 계산된 상호-상관 값들 중에서 최대 상호-상관 값을 갖는 마이크로폰 신호의 프레임에 대응하는 위치를 후보 지연 위치로 선택하고, 후보 지연 위치들을 L-차원 어레이(Sa)에 매핑하고 - L은 상기 지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들의 총 개수와 동일함 -, 후보 지연 위치가 연속적으로 반복되는 횟수를 카운트하고; 현재 후보 지연 위치가 변경되면, 상기 현재 후보 지연 위치에 대한 값을 제1 사전 설정 값(t1)만큼 증가시키고, 이전 후보 지연 위치에 대한 값을 제2 사전 설정 값(t2)만큼 감소시키고, 다른 위치들에 대한 값들을 제3 사전 설정 값(t3)만큼 감소시키고; 상기 현재 후보 지연 위치가 변경되지 않으면, 상기 현재 후보 지연 위치에 대한 값을 상기 제1 사전 설정 값(t1)만큼 증가시키고, 다른 위치들에 대한 값들을 상기 제3 사전 설정 값(t3)만큼 감소시키며 - 사기 제2 사전 설정 값(t2)은 상기 제3 사전 설정 값(t3) 이하임 -; 상기 현재 후보 지연 위치에 대한 값이 제1 임계 값 보다 크고, 상기 현재 후보 지연 위치가 연속적으로 반복되는 횟수가 제2 임계 값 보다 크면, 상기 현재 후보 지연 위치와 상기 기준 신호의 위치에 기반하여, 상기 현재 지연 추정 값을 결정하도록 구성된다.

일 실시예에서, 상기 신호 시프트 모듈은, 상기 현재 지연 추정 값(D₁(t))이 제3 임계 값(T3) 이하인 경우, 상기 기준 신호의 데이터를 시프트하지 않고, 상기 현재 지연 추정 값(D₁(t))이 상기 제3 임계 값(T3) 보다 크고 제4 임계 값(T4) 보다 작은 경우, 상기 기준 신호의 데이터를 D₁(t)/2만큼 시프트하며, 상기 현재 지연 추정 값(D₁(t))이 상기 제4 임계 값(T4) 이상인 경우, 상기 기준 신호의 데이터를 D₁(t)만큼 시프트하도록 더 구성된다.

일 실시예에서, 상기 지연 추정 값 결정 유닛은, 상기 지연 추정 값을 결정할 때, 다음의 조건들: (1) 현재 지연 위치에 대응하는 상호-상관 값(C(t))이 이전 지연 위치에 대응하는 상호-상관 값(C(t-1)) 보다 큼; (2) 현재 지연 분석 범위에서의 각 프레임에 대해, 최대 상호-상관 값(C_max(t))에 대응하는 위치와 최소 상호-상관 값(C_min(t))에 대응하는 위치 사이의 차이 값이 제1 사전 설정 차이 값 보다 큼; (3) 상기 기준 신호와 상기 지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들 사이의 상호-상관 값들의 평균 값(C_mean(t))과 상기 현재 지연 위치에 대응하는 상호-상관 값(C(t)) 사이의 차이 값이 제2 사전 설정 차이 값 보다 큼; 및 (4) 상기 현재 지연 위치(p(t))가 이전 지연 위치(p(t-1)) 보다 작음 중 하나 이상이 충족되는 것을 결정하도록 구성된다.

일 실시예에서, 상기 장치는, 캐싱(caching) 모듈을 더 포함한다. 상기 캐싱 모듈은, 히스토리컬 기준 신호의 데이터를 캐싱하도록 구성된다. 상기 신호 시프트 모듈은, 상기 기준 신호를 시프트할 때, 상기 히스토리컬 기준 신호의 상기 캐싱된 데이터를 함께 시프트하도록 더 구성된다.

일 실시예에서, 상기 적응 필터는, 상기 적응 필터를 업데이트할 때, 상기 현재 지연 추정 값이 상기 적응 필터의 길이 보다 작으면, 상기 지연 추정 값에 기반하여, 적응 필터 계수를 시프트하고, 상기 시프트된 적응 필터 계수에 기반하여, 상기 적응 필터를 업데이트하도록 구성되고, 시프트 후에 값이 없는 위치에서의 계수가 리셋되고, 상기 적응 필터가 상기 리셋된 적응 필터 계수에 기반하여, 업데이트된다.

지연 추정을 기반으로 하는 에코 제거 디바이스는, 프로세서, 메모리, 및 시스템 버스를 포함한다. 상기 프로세서는, 상기 시스템 버스를 통해 상기 메모리에 연결된다. 상기 메모리는, 상기 프로세서에 의해 실행될 때, 상기 프로세서가 상기의 지연 추정을 기반으로 하는 에코 제거 방법들 중 어느 하나를 수행하도록 제어하는 명령어들을 포함하는 하나 이상의 프로그램들을 저장한다.

컴퓨터-판독 가능 저장 매체는, 단말 장치에 의해 실행될 때, 상기 단말 장치가 상기의 지연 추정을 기반으로 하는 에코 제거 방법들 중 어느 하나를 수행하도록 제어하는 명령어들을 저장한다.

컴퓨터 프로그램 제품은, 단말 장치에 의해 실행될 때, 상기 단말 장치가 상기의 지연 추정을 기반으로 하는 에코 제거 방법들 중 어느 하나를 수행하도록 제어한다.

본 개시의 실시예들에 따른 에코 제거 방법 및 에코 제거 장치에 의해, 마이크로폰 신호와 기준 신호에서 비선형성을 갖는 주파수 포인트들이 검출된다. 현재 지연 추정 값은 마이크로폰 신호와 기준 신호에서 비선형성이 없는 주파수 포인트 신호들을 기반으로, 계산된다. 즉, 기준 신호와 마이크로폰 신호 사이의 지연은 비선형성 없이 추정되며, 이에 따라 지연 추정 값이 더 정확하다. 그리고, 기준 신호는 현재 지연 추정 값에 기반하여, 시프트된다. 에코 제거를 수행하기 위해, 적응 필터는 마이크로폰 신호 및 시프트된 기준 신호를 기반으로, 업데이트되며, 이로써, 에코 제거의 효과가 효과적으로 향상된다.

또한, 지연 추정에서, 지연 추정 값은 다양한 로버스트(robust) 조건들에 기반하여 보정되며, 이에 따라 추정된 지연은 더 로버스트하다.

또한, 적응 필터를 업데이트하는 프로세스에서, 히스토리컬 기준 신호의 데이터를 캐싱 및 시프트하고, 기준 배율(magnificence)이 없는 필터 계수(filter coefficient)를 리셋함으로써, 지연의 변화에 의해 발생된 필터의 재수렴(re-convergence)을 위한 시간 주기가 감소될 수 있으며, 이로써 에코 제거의 성능에 대한 재수렴의 영향이 감소된다.

본 개시의 실시예들 또는 기존의 기술에서의 기술적 해결 수단들을 보다 명확하게 설명하기 위해, 실시예들에 사용될 도면들이 간략하게 후술된다. 명확하게는, 이하의 설명에서의 도면들은 본 개시의 몇몇 실시예들만을 나타내고, 다른 도면들이 해당 기술 분야에서 통상의 지식을 가진 자로부터 도면들로부터 획득될 수 있다.
도 1은 본 개시의 일 실시예에 따른 지연 추정을 기반으로 하는 에코 제거 방법의 흐름도이다;
도 2는 히스토리컬 기준 신호가 공동으로 시프트되는 본 개시의 일 실시예와 현재 기준 신호만이 시프트되는 기존의 기술 사이의 비교를 도시하는 개략도이다;
도 3은 기존의 기술과 필터를 업데이트할 때 에러 필터 계수가 리셋되는 본 개시의 일 실시예 사이의 비교를 도시하는 개략도이다;
도 4는 본 개시의 일 실시예에 따른 지연 추정을 기반으로 하는 에코 제거 장치의 개략적인 블록도이다; 그리고
도 5는 본 개시의 다른 실시예에 따른 지연 추정을 기반으로 하는 에코 제거 장치의 개략적인 블록도이다.

본 개시의 실시예들은 첨부되는 도면들과 구현들을 참조하여 보다 상세하게 후술되며, 이에 따라 해당 기술 분야에서 통상의 지식을 가진 자는 본 개시의 실시예들에 따른 해결 과제들을 잘 이해할 수 있다.

실제 적용들에서, 비선형성이 종종 에코 제거 프로세스에서 발생한다. 높은 음량, 불충분한 배터리 전력, 파-엔드 신호의 부재, 즉 기준 신호의 부재, 및 듀얼 스피치, 즉 인간 사운드와 스피커 사운드를 둘 다 포함하는 것과 같은 많은 경우들이 사운드 신호의 비선형성을 초래하고, 이는 지연 추정을 위해 계산되는 상호-상관의 에러를 야기할 수 있으며, 결국 에코 제거의 부족한 효과를 초래할 수 있다. 이를 고려하여, 본 개시의 실시예들에 따른 지연 추정을 기반으로 하는 에코 제거 방법 및 지연 추정을 기반으로 하는 에코 제거 장치가 제공된다. 지연이 결정될 때, 비선형성을 갖는 주파수 포인트들이 제거된다. 정확한 지연 추정 값을 획득하기 위해, 지연 추정 값이 마이크로폰 신호와 기준 신호에서 비선형성이 없는 주파수 포인트 신호들을 기반으로, 결정된다. 이에 따라, 이 지연 추정 값에 기반하여 수행된 에코 제거가 더 효과적일 수 있다.

본 개시의 일 실시예에 따른 지연 추정을 기반으로 하는 에코 제거 방법의 흐름도인 도 1을 참조한다. 방법은 다음의 단계 101 내지 단계 105를 포함한다.

단계 101에서, 마이크로폰 신호와 기준 신호가 수신되고, 전처리된다.

마이크로폰 신호는 음성 신호를 수집하기 위한 마이크로폰에 의해 획득되고, A/D 변환의 대상이 되는 디지털 신호이다. 기준 신호는 에코 제거에 의해 제거될 소스 신호이며, 디지털 신호이기도 하다. 일 예로, 텔레비전 박스의 제조자를 위해, 텔레비전 박스 상에서 에코 제거가 수행되는 경우, 기준 신호는 텔레비전 박스에 의해 텔레비전으로 전송되는 소스 신호, 또는 기존의 기술에서 일반적으로 사용되는 텔레비전 스피커 신호이며, 이에 제한되지 않는다.

전처리는 주로 프레이밍(framing), 윈도잉(windowing), 및 고속 푸리에 변환(fast Fourier transforming) 등을 포함하고, 시간 도메인(time domain)의 기준 신호와 마이크로폰 신호를 주파수 도메인(frequency domain)의 각각의 신호들로 변환하기 위해 수행된다.

단계 102에서, 전처리된 마이크로폰 신호와 전처리된 기준 신호에서, 현재 에코 제거 시나리오의 비선형성을 갖는 주파수 포인트 신호들이 결정된다.

실제 적용 환경들 및 디바이스 하드웨어의 다양성을 고려하여, 다음의 상이한 검출 방법들이 비선형성을 갖는 주파수 포인트 신호들을 결정하기 위해 사용될 수 있다.

(1) 파-엔드 신호 검출

비선형성을 갖는 주파수 포인트 신호들은 전처리된 기준 신호의 에너지, 제로-크로싱 율, 및 단기 진폭 중 하나 이상에 기반하여, 결정된다. 예를 들면, 주파수 포인트에서의 기준 신호(x)의 에너지(P_x)가 미리 설정된 에너지 임계 값 보다 크면, 이 주파수 포인트에서의 주파수 포인트 신호에서 비선형성이 발생하는 것으로 결정된다.

(2) 듀얼-엔드 신호 검출

비선형성을 갖는 주파수 포인트 신호들은 전처리된 마이크로폰 신호의 에너지 대 전처리된 기준 신호의 에너지의 비율에 기반하여, 결정된다.

구체적으로, 주파수 포인트에서의 기준 신호(x)의 스무딩(smoothing) 에너지(

)와 이 주파수 포인트에서의 마이크로폰 신호의 스무딩 에너지(

)가 계산된다. 결정은 에너지 비율(

)에 기반하여, 이루어진다. 에너지 비율이 미리 설정된 에너지 비율 임계 값 보다 크면, 이 주파수 포인트에서의 주파수 포인트 신호에서 비선형성이 발생한다. 스무딩 에너지(

및

)는 하기 [수학식 1] 및 [수학식 2]로부터 계산된다.

여기서, x(n) 및 y(n)은 주파수(n)에서의 기준 신호와 마이크로폰 신호를 각각 나타내고,

는 스무딩 계수이며, 수 많은 실험 결과들 및/또는 경험에 기반하여, 결정될 수 있다.

대안적으로, 주파수 포인트에서의 기준 신호(x)의 에너지 및 주파수 포인트에서의 마이크로폰 신호의 에너지는 직접 계산될 수 있다. 결정은 기준 신호(x)의 에너지 대 마이크로폰 신호의 에너지의 에너지 비율에 기반하여, 이루어진다. 에너지 비율이 미리 설정된 에너지 비율 임계 값 보다 크면, 이 주파수 포인트에서의 주파수 포인트 신호에서 비선형성이 발생하는 것으로 결정된다.

(3) 디바이스 하드웨어에 의해 발생되는 비선형성의 검출

실제 적용들에서, 가능한 많은 하드웨어 디바이스의 비용을 줄이기 위해, 저렴한 하드웨어가 종종 사용되며, 이는 과도한 스피커 음량 및 불충분한 배터리 전력과 같은 몇몇 동작 상태들에서의 비선형성을 초래할 수 있다. 비선형성은 다음과 같이 검출될 수 있다.

먼저, 저주파수 범위(N)(예를 들어, 300 Hz에서 800 Hz의 범위이며, 경험들 및/또는 수 많은 실험 결과들에 기반하여, 결정됨)에서 기준 신호와 마이크로폰 신호 사이의 상호-상관에 대한 평균 값이 계산된다.

주파수(n)에서, 기준 신호와 마이크로폰 신호 사이의 상호-상관 값이 하기 [수학식 3]으로부터 계산된다.

여기서,

,

이에 따라, 저주파수 범위(N)에서, 기준 신호와 마이크로폰 신호 사이의 상호-상관에 대한 평균 값이 하기 [수학식 4]와 같이 계산될 수 있다.

이 후, 특정 주파수 간격(d(1≤d<20))의 다른 주파수 범위들에서, 기준 신호와 마이크로폰 신호 사이의 상호-상관에 대한 평균 값들이 상기의 저주파수 범위에서의 상호-상관에 대한 평균 값과 동일한 계산 방법에 의해, 계산된다.

마지막으로, 비선형성을 갖는 주파수 포인트 신호들이 다른 주파수 범위들에서의 상호-상관에 대한 평균 값들과 저주파수 범위에서의 상호-상관에 대한 평균 값에 기반하여, 결정된다. 예를 들면, 다른 주파수 범위들에서의 상관도의 평균 값들 중 하나가 저주파수 범위에서의 상관도의 평균 값 보다 현저하게 작은 지(예를 들어, 다른 주파수 범위에서의 상관도의 평균 값 대 저주파수 범위에서의 상관도의 평균값의 비율이 0.1 보다 작은 지)의 여부가 판단된다. 다른 주파수 범위에서의 상관도의 평균 값이 저주파수 범위에서의 상관도의 평균 값 보다 현저하게 작으면, 다른 주파수 범위에서의 신호들이 비선형성을 갖는다.

실제 적용들에서, 결정은 상기의 검출 방법들 중 어느 하나 또는 상기의 검출 방법들 중 어느 두 개나 셋 모두를 조합하여, 이루어질 수 있음에 유의해야 한다. 또한, 다수의 검출 방법들이 포괄적인 결정을 위해 사용되는 경우에, 다수의 검출 방법들에 의해 획득된 값들은 가중될 수 있다. 대안적으로, 다수의 검출 방법들의 각각의 결과가 주파수 포인트 신호들이 비선형성을 갖는 것으로 나타낼 때에만, 주파수 포인트 신호들이 비선형성을 갖는 것으로 결정되며, 이에 제한되지 않는다.

단계 103에서, 마이크로폰 신호와 기준 신호에서 비선형성이 없는 주파수 포인트 신호들에 기반하여, 현재 지연 추정 값이 계산된다.

먼저, 지연 분석 범위에 포함된 마이크로폰 신호의 프레임들이 결정된다. 예를 들면, 16kHz의 샘플링 레이트(sampling rate)와 1s의 최대 지연의 경우, 지연 분석 범위는 30 개의 프레임들이다. 즉, 기준 신호와 마이크로폰 신호의 30 프레임들의 각각 사이의 상호-상관 값은 각 지연 분석에서 계산된다.

이 후, 마이크로폰 신호의 프레임들의 각각에 대해, 기준 신호와 마이크로폰 신호의 프레임 사이의 상호-상관 값을 계산하기 위해, 기준 신호와 마이크로폰 신호의 프레임에서 비선형성이 없는 주파수 포인트 신호들이 선택된다.

구체적으로, 현재 프레임에 대해, 비선형성이 없는 주파수 포인트 신호들이 선택된다. 512 개의 주파수 포인트들의 경우(여기서, FFT 간격의 길이가 1024임), 상기 [수학식 3]을 참조하여, 512 개의 주파수 포인트들의 각각에서 기준 신호와 마이크로폰 신호 사이의 상호-상관 값이 계산된다.

512 개의 주파수 포인트들의 각각에서의 상호-상관 값이 획득된 후에, 현재 프레임의 512 개의 주파수 포인트들에서의 상호-상관에 대한 평균 값이 계산된다. 상호-상관에 대한 평균 값은 기준 신호의 현재 프레임과 마이크로폰 신호의 현재 프레임 사이의 상호-상관 값으로서 기능한다.

상호-상관을 기반으로 하는 지연 추정을 더 정확하게 하기 위해, 일반적인 오디오 주파수 범위에서의 주파수 포인트들(16KHZ의 샘플링 레이트의 경우, 일반적인 오디오 주파수 범위들은 1500Hz에서 4625Hz임)이 기준 신호와 마이크로폰 신호 사이의 상호-상관 값을 계산하기 위해 선택될 수 있다. 또한, 계산량을 줄이고 효율성을 향상시키기 위해, 일반적인 주파수 범위에서의 M(예를 들어, M=100임) 개의 주파수 포인트들이 기준 신호와 마이크로폰 신호 사이의 상호-상관 값을 계산하기 위해 선택될 수 있다.

마지막으로, 기준 신호와 마이크로폰 신호의 프레임들 사이의 계산된 상호-상관 값들에 기반하여, 지연 추정 값이 결정된다.

실제 적용들에서, 지연 추정 값이 다양한 방식들로 결정될 수 있으며, 이들은 이하에서 개별적으로 설명된다.

제1 예로, 기준 신호와 마이크로폰 신호의 프레임들 사이의 계산된 상호-상관 값들 중에서 최대 상호-상관 값을 갖는 마이크로폰 신호의 프레임에 대응하는 위치가 현재 지연 위치로서 선택된다. 현재 지연 추정 값은 현재 지연 위치 및 기준 신호의 위치에 기반하여, 결정된다.

예를 들면, 기준 신호의 현재 프레임이 기준으로 취해지고, 이는 50 번째 프레임으로 가정되며, 지연 분석 범위, 즉 마이크로폰 신호의 20 번째 프레임 내지50 번째 프레임에, 마이크로폰 신호의 30 개의 프레임들이 있다. 마이크로폰 신호의 30 프레임들의 각각이 기준 신호의 50 번째 프레임과 비교된다. 기준 신호의 현재 50 번째 프레임과 마이크로폰 신호의 25 번째 프레임 사이의 상호-상관 값이 최대이면, 현재 지연 추정 값은 50-25=25로서 계산된다. 명확하게는, 기준 신호의 프레임 번호가 30 보다 작으면(예를 들어, 18임), 비교될 마이크로폰 신호의 프레임들은 현재 프레임 이전의 모든 프레임들이다. 즉, 기준 신호의 18 번째 프레임은 마이크로폰 신호의 1 번째 프레임 내지 18 번째 프레임의 각각과 비교된다.

제2 예에서, 현재 지연 추정 값을 더 로버스트하게 하기 위해, 다음의 로버스트 조건들 중 하나 이상이 충족될 수 있다. 즉, 가장 큰 상호-상관 값을 갖는 프레임이 획득된 후에, 다음의 로버스트 조건들 중 하나 이상이 충족되는 지의 여부를 판단하는 것이 추가로 요구된다. 다음의 로버스트 조건들 중 하나 이상이 충족되면, 현재 지연 추정 값이 현재 지연 위치 및 기준 신호의 위치에 기반하여, 결정되고, 그렇지 않으면 다음 지연 추정이 수행된다.

로버스트 조건들은, (1) 현재 지연 위치에 대응하는 상호-상관 값(C(t))이 이전 지연 위치에 대응하는 상호-상관 값(C(t-1)) 보다 큼; (2) 현재 지연 분석 범위에서의 각 프레임에 대해, 최대 상호-상관 값(C_max(t))에 대응하는 위치와 최소 상호-상관 값(C_min(t))에 대응하는 위치 사이의 차이 값이 제1 사전 설정 차이 값 보다 큼; (3) 기준 신호와 지연 분석 범위에서의 마이크로폰 신호의 프레임들 사이의 상호-상관 값들의 평균 값(C_mean(t))과 현재 지연 위치에 대응하는 상호-상관 값(C(t)) 사이의 차이 값이 제2 사전 설정 차이 값 보다 큼; 및 (4) 상기 현재 지연 위치(p(t))가 이전 지연 위치(p(t-1)) 보다 작음을 포함한다.

제3 예에서, 기준 신호를 시프트하고 필터를 지연에 기반하여 업데이트할 때, 지연 추정 값은 필터의 수렴(convergence)으로 인해 매우 정확하도록 요구된다. 지연을 더 정확하게 획득하기 위해, 최대 상호-상관 값을 갖는 프레임에 대응하는 위치가 일 실시예에서 후보 지연 위치로서 기능할 수 있다. 후보 지연 위치의 변화에 따라, 최종적으로 정확한 지연 추정 값을 획득하기 위해, 히스토리컬 데이터에 기반하여, 후보 지연 위치가 처벌 및/또는 보상된다. .

지연 추정 값은 다음과 같이 결정된다.

먼저, 각 지연 추정에서 계산된, 기준 신호와 지연 분석 범위에서의 마이크로폰 신호의 프레임들 사이의 상호-상관 값들 중에서 최대 상호-상관 값을 갖는 마이크로폰 신호의 프레임에 대응하는 위치가 후보 지연 위치로서 기능한다. 후보 지연 위치들은 L-차원 어레이(Sa)로 매핑되고, 여기서 L은 지연 분석 범위에서의 마이크로폰 신호의 프레임들의 총 개수와 동일하다. 후보 지연 위치가 연속적으로 반복되는 횟수 "카운트"가 카운트된다. 연속적인 반복이 중단되면, "카운트"가 0으로 설정된다.

현재 후보 지연 위치가 변경되면, 현재 후보 지연 위치에 대한 값이 제1 사전 설정 값(t1)만큼 증가되고, 이전 후보 지연 위치에 대한 값이 제2 사전 설정 값(t2)만큼 감소되며, 다른 위치들에 대한 값들이 제3 사전 설정 값(t3)만큼 감소된다.

현재 후보 지연 위치가 변경되지 않으면, 현재 후보 지연 위치들의 신뢰성이 증가하고, 이전에 추정된 후보 지연 위치와 다른 위치들의 신뢰성이 낮다. 현재 후보 지연 위치에 대한 값이 제1 사전 설정 값(t1)만큼 증가되고, 다른 위치들에 대한 값들이 제3 사전 설정 값(t3)만큼 감소된다. 이전 후보 지연 위치가 다른 위치들 보다 신뢰할 수 있으므로, 이전 후보 지연 위치가 상대적으로 작은 값만큼 감소된다. t1, t2, 및t3의 값들은 경험들 또는 수 많은 실험들에 기반하여 결정될 수 있으며, 일반적으로 t3은 t2 이상이다. 예를 들면, t1, t2, 및 t3은 2, 1, 및 2로 각각 설정될 수 있다.

현재 후보 지연 위치의 값이 제1 임계 값(T1) 보다 크고(예를 들어, T1=10임), 현재 후보 지연 위치가 연속적으로 반복되는 횟수가 제2 임계 값(T2) 보다 크면(예를 들어, T2=4임), 이는 추정된 현재 후보 지연 위치가 더 정확하고, 정확한 지연(D₁(t))으로서 사용될 수 있음을 나타낸다.

제4 예에서, 현재 지연 추정 값을 더 로버스트하게 하기 위해, 제3 예의 방법에 의해 지연 추정 값을 결정할 때, 상기의 로버스트 조건들 중 하나 이상이 충족되는 지의 여부가 더 판단된다. 상기의 로버스트 조건들 중 하나 이상이 충족되면, 현재 지연 추정 값이 현재 지연 위치 및 기준 신호의 위치에 기반하여 결정되고, 그렇지 않으면 다음 지연 추정이 수행된다.

단계 104에서, 현재 지연 추정 값에 기반하여, 기준 신호가 시프트된다.

실제 적용들에서, 기준 신호의 데이터가 상기의 제1 예 내지 제4 예의 상이한 방법들 중 어느 하나에 의해 결정되는 지연 추정 값만큼 시프트될 수 있다.

게다가, 현재 지원 추정 값(D₁(t))이 제3 예 또는 제4 예의 방법에 의해 결정되는 경우, 추정된 후보 지연 위치가 간격들에 따라 변하는 것을 고려하면, 기준 신호는 다음과 같이 시프트될 수 있다.

현재 지연 추정 값(D₁(t))이 제3 임계 값(T3)(예를 들어, T3=10임) 이하인 경우, 기준 신호의 데이터는 시프트되지 않는다.

현재 지연 추정 값(D₁(t))이 제3 임계 값(T3) 보다 크고 제4 임계 값(T4)(예를 들어, T4=20임) 보다 작은 경우, 기준 신호의 데이터는 D₁(t)/2만큼 시프트된다.

현재 지연 추정 값(D₁(t))이 제4 임계 값(T4) 이상인 경우, 기준신호의 데이터는 D₁(t)만큼 시프트된다.

게다가, 지연에 기반하여 기준 신호를 시프트할 때 히스토리컬 기준 신호의 내용의 손실에 대한 기존의 문제점을 고려하여, 본 개시의 다른 실시예에서의 현재 지연 추정 값에 기반하여 기준 신호를 시프트하는 것과 함께, 히스토리컬 기준 신호의 데이터가 시프트된다. 구체적으로, 히스토리컬 기준 신호의 데이터가 캐싱된다. 기준 신호를 시프트할 때, 히스토리컬 기준 신호의 캐싱된 데이터가 함께 시프트된다.

기존의 기술과 히스토리컬 기준 신호의 데이터가 함께 시프트되는 본 개시의 실시예 사이의 비교를 도시하는 개략도인 도 2를 참조한다.

기존의 기술의 도 2로부터 알 수 있는 바와 같이, 지연 추정 값이 3과 같다고 가정하면, 시간 포인트(n)에서의 기준 신호의 데이터는 기준 신호를 시프트할 때, 시간 포인트(n-3)에서의 기준 신호 데이터의 데이터로 직접 대체된다. 그러나, 히스토리컬 기준 신호의 데이터, 예를 들어 도 2의 시간 포인트들((n-1) 내지 (n-4))에서의 기준 신호의 데이터는 변경되지 않고 유지되며, 이는 신호의 불연속을 초래할 수 있다. 본 개시의 실시예에서, 기준 신호를 시프트할 때, 시간 포인트(n)에서의 기준 신호의 데이터가 시간 포인트(n-3)에서의 기준 신호 데이터의 데이터로 대체될 뿐 아니라, 도 2에 도시된 바와 같이 히스토리컬 기준 신호의 데이터도 함께 시프트되며, 이로써 불연속 신호에 의해 야기되는 에코 제거의 효과에 대한 영향, 즉 히스토리컬 기준 신호의 내용의 손실을 피한다.

단계 105에서, 에코 제거를 수행하기 위해, 전처리된 마이크로폰 신호와 시프트된 기준 신호에 기반하여, 적응 필터가 업데이트된다.

구체적으로, 에코 제거가 마이크로폰 신호(y(t, n))와 시프트된 기준 신호(x'(t, n))에 기반하여, 수행된 후에, 출력 신호는 하기 [수학식 5]와 같다.

여기서, h(t, n)는 필터 계수를 나타낸다.

필터 계수(h(t, n))는 하기 [수학식 6]과 같이 업데이트된다.

여기서, γ는 필터를 업데이트하기 위한 단계 사이즈(step size)이고, 이는 수 많은 실험들 및/또는 경험들에 기반하여 결정되고, θ는 정규화 인자(regularization factor)이고, 이 또한 일반적으로 수 많은 실험들 및/또는 경험들에 기반하여 결정된다.

지연이 변화할 때 필터 계수가 업데이트될 필요가 있기 때문에, 필터 계수의 업데이트를 가속화하고, 필터 계수를 업데이트함으로써 야기되는 에코 제거의 성능 저하를 감소시키기 위해, 본 개시의 다른 실시예에서, 현재 지연 추정 값이 필터의 길이 보다 작으면, 적응 필터 계수를 업데이트할 때, 필터 계수는 지연 추정 값에 기반하여 시프트되고, 필터는 시프트된 필터 계수에 기반하여 업데이트되며, 여기서 시프트 후에 값이 없는 위치에서의 계수는, 예를 들어 0으로 리셋된다. 필터 계수를 업데이트하기 위한 시간 주기를 단축시키기 위해, 필터의 업데이트는 리셋된 적응 필터 계수를 기반으로 한다.

기존의 기술과 필터를 업데이트할 때 에러 필터 계수가 0으로 리셋되는 본 개시의 실시예 사이의 비교를 도시하는 계략도인 도 3을 참조한다.

지연 추정 값은 3과 같다고 가정한다. 기존의 기술에서 필터 계수를 업데이트하는 개략도가 좌측에 도시되어 있다. 기존의 기술에서, 필터 계수를 업데이트할 때, 모든 계수들이 현재 값에 기반하여 업데이트된다. 본 개시의 실시예에서 필터 계수를 업데이트하는 개략도는 우측에 도시되어 있다. n 번째 및 (n-1) 번째 필터 계수들이 업데이트되고, 다른 필터 계수들은 0으로 리셋됨으로써 업데이트됨을 알 수 있다.

본 개시의 실시예에 따른 에코 제거 방법에 따르면, 마이크로폰 신호와 기준 신호의 비선형성을 갖는 주파수 포인트들이 검출된다. 현재 지연 추정 값은, 마이크로폰 신호와 기준 신호에서 비선형성이 없는 주파수 포인트 신호들을 기반으로 계산된다. 즉, 기준 신호와 마이크로폰 신호 사이의 지연은 비선형 없이 추정되며, 이에 따라 지연 추정 값이 더 정확하다. 그리고, 기준 신호는 현재 지연 추정 값에 기반하여 시프트된다. 에코 제거를 수행하기 위해, 적응 필터가 마이크로폰 신호와 시프트된 기준 신호를 기반으로 업데이트되며, 이로써 에코 제거의 효과가 효과적으로 향상된다.

또한, 지연 추정에서, 지연 추정 값은 다양한 로버스트 조건들에 기반하여 보정되며, 이에 따라 추정된 지연이 더 로버스트하다.

또한, 적응 필터를 업데이트하는 프로세스에서, 히스토리컬 기준 신호의 데이터를 캐싱하고 함께 시프트하며, 기준 유의성(significance)이 없는 필터 계수를 리셋함으로써, 지연의 변화에 의해 야기되는 필터의 재수렴에 대한 시간 주기가 감소될 수 있으며, 이로써, 에코 제거의 성능에 대한 재수렴의 영향이 감소된다.

이에 따라, 본 개시의 일 실시예에 따른 지연 추정을 기반으로 하는 에코 제거 장치가 더 제공된다. 장치의 개략적인 블록도인 도 4를 참조한다.

도 4는, 에코 제거가 텔레비전 박스에서 수행되는 일 예를 도시한다. 기준 신호는 텔레비전 박스에 의해 텔레비전으로 전송되는 소스 신호 또는 기존의 기술에서 일반적으로 사용되는 텔레비전 스피커 신호이다. 텔레비전 박스의 마이크로폰에 의해 수집되는 신호는 마이크로폰 신호로서 기능한다. 사용자(A)는 음성으로 텔레비전 박스를 제어한다.

도 4의 입력 신호는 스피커로부터의 에코 신호를 포함한다. 입력 신호는 A/D 변환의 대상이 되고, 변환된 디지털 신호가 본 개시의 실시예에 따른 지연 추정을 기반으로 하는 에코 제거 장치(400)로 전송된다. 에코 제거 장치(400)는 출력 신호, 즉 사용자(A)의 음성 신호를 획득하기 위해, 입력 신호에서 에코 신호를 제거한다. 텔레비전 박스는 사용자(A)의 제어 명령어를 획득하기 위해, 출력 신호를 분석한다.

본 실시예에 따른 지연 추정을 기반으로 하는 에코 제거 장치(400)는 신호 처리 모듈들(401, 401'), 주파수 포인트 검출 모듈들(402, 402'), 지연 추정 모듈(403), 신호 시프트 모듈(404), 및 적응 필터(405)를 포함한다.

신호 처리 모듈들(401, 401')은 마이크로폰 신호와 기준 신호를 수신하고, 마이크로폰 신호와 기준 신호를 전처리하고, 전처리된 마이크로폰 신호와 전처리된 기준 신호를 출력하도록 각각 구성된다. 전처리는 주로 프레이밍, 윈도잉, 및 고속 푸리에 변환 등을 포함하고, 시간 도메인의 기준 신호와 마이크로폰 신호를 주파수 도메인의 각각의 신호들로 변환하기 위해 수행된다.

주파수 포인트 검출 모듈들(402, 402')은 신호 처리 모듈들에 의해 출력되는 전처리된 마이크로폰 신호와 전처리된 기준 신호에서, 현재 에코 제거 시나리오의 비선형성을 갖는 주파수 포인트 신호들을 결정하도록 구성된다.

지연 추정 모듈(403)은 전처리된 마이크로폰 신호와 전처리된 기준 신호에서 주파수 포인트 검출 모듈들에 의해 결정되는 비선형성이 없는 주파수 포인트 신호들을 기반으로 현재 지연 추정 값을 계산하고, 현재 지연 추정 값을 출력하도록 구성된다.

신호 시프트 모듈(404)은 지연 추정 모듈에 의해 출력되는 현재 지연 추정 값에 기반하여 기준 신호를 시프트하고, 시프트된 기준 신호를 출력하도록 구성된다.

적응 필터(405)는, 에코 제거를 수행하기 위해, 신호 처리 모듈에 의해 출력되는 전처리된 마이크로폰 시호와 신호 시프트 모듈(404)에 의해 출력되는 시프트된 기준 신호를 기반으로 적응 필터를 업데이트하도록 구성된다.

도 4에서, 신호 처리 모듈(401)과 신호 처리 모듈(401')뿐 아니라 주파수 포인트 검출 모듈(402)과 주파수 포인트 검출 모듈(402')은 단지 본 개시에 따른 장치의 원리 이해의 편의를 위해 설명됨에 유의해야 한다. 실제 적용들에서, 신호 처리 모듈(401)과 신호 처리 모듈(401')은 동일한 물리적 개체(physical entity)로 통합될 수 있다. 이와 유사하게, 주파수 포인트 검출 모듈(402)과 주파수 포인트 검출 모듈(402')은 동일한 물리적 개체로 통합될 수 있다. 또한, 신호 처리 모듈들과 주파수 포인트 검출 모듈들은 동일한 물리적 개체로 통합될 수 있으며, 이에 제한되지 않는다.

도 4는 본 개시에 따른 장치의 적용 예를 도시할 뿐이다. 본 개시의 실시예에 따른 장치는 다양한 시나리오들에 적용될 수 있음에 유의해야 한다. 예를 들면, 텔레비전 박스가 텔레비전을 제어하는 시나리오에서, 텔레비전에 대한 제어 사운드로부터 텔레비전에 의해 재생되는 사운드를 효과적으로 제거하기 위해, 본 개시에 따른 장치는 텔레비전 박스에 통합된다. 다른 시나리오들은 본 문서에 열거되지 않는다.

실제 적용 환경들 및 디바이스 하드웨어의 다양성의 관점에서, 비선형성을 갖는 주파수 포인트 신호들을 결정할 때, 상이한 검출 방법들이 사용될 수 있다. 이에 따라, 상이한 조건들의 비선형성을 갖는 주파수 포인트 신호들을 검출하기 위해, 상기 주파수 포인트 검출 모듈은 다음의 검출 유닛들, 즉 파-엔드 신호 검출 유닛, 듀얼-엔드 신호 검출 유닛, 및 디바이스 하드웨어 검출 유닛 중 하나 이상을 포함할 수 있다.

파-엔드 신호 검출 유닛은 전처리된 기준 신호의 에너지, 제로-크로싱 율, 및 단기 진폭 중 하나 이상에 기반하여, 비선형성을 갖는 주파수 포인트 신호들을 결정하도록 구성된다. 예를 들면, 주파수 포인트에서의 기준 신호(x)의 에너지(P_x)가 미리 설정된 에너지 임계 값 보다 크면, 이 주파수 포인트에서의 주파수 포인트 신호에서 비선형성이 발생하는 것으로 결정된다.

듀얼-엔드 신호 검출 유닛은 전처리된 마이크로폰 신호의 에너지 대 전처리된 기준 신호의 에너지의 비율에 기반하여, 비선형성을 갖는 주파수 포인트 신호들을 결정하도록 구성된다. 상기 방법 실시예들의 상세한 설명을 참조할 수 있으며, 여기에서는 반복되지 않는다.

디바이스 하드웨어 검출 유닛은, 먼저 저주파수 범위에서 기준 신호와 마이크로폰 신호 사이의 상관도의 평균 값을 결정하고, 이 후 미리 결정된 주파수 간격의 다른 주파수 범위들에서 기준 신호와 마이크로폰 시호 사이의 상관도의 평균 값들을 계산하고, 마지막으로 다른 주파수 범위들에서의 상관도의 평균 값들과 저주파수 범위에서의 상관도의 평균 값에 기반하여, 비선형성을 갖는 주파수 포인트 신호들을 결정하도록 구성된다. 예를 들면, 다른 주파수 범위에서의 상관도의 평균 값이 저주파수 범위에서의 상관도의 평균 값 보다 현저하게 작으면, 다른 주파수 범위에서의 신호들이 비선형성을 갖는다.

지연 추정 모듈(403)은 상호-상관 계산 유닛 및 지연 추정 값 결정 유닛을 포함한다. 상호-상관 계산 유닛은, 지연 분석 범위에서의 마이크로폰 신호의 프레임들의 각각에 대해, 기준 신호와 마이크로폰 신호의 프레임에서 비선형성이 없는 주파수 포인트 신호들을 선택하고, 기준 신호와 마이크로폰 신호의 프레임 사이의 상호-상관 값을 계산하도록 구성된다. 지연 추정 값 결정 유닛은, 상호-상관 계산 유닛에 의해 계산된 기준 신호와 마이크로폰 신호의 프레임들 사이의 상호-상관 값들에 기반하여, 지연 추정 값을 계산하도록 구성된다.

예를 들면, 지연 추정 값 결정 유닛은, 상호-상관 계산 유닛에 의해 계산된 기준 신호와 마이크로폰 신호의 프레임들 사이의 상호-상관 값들 중에서 최대 상호-상관 값을 갖는 마이크로폰 신호의 프레임에 대응하는 위치를 현재 지연 위치로서 선택하고, 현재 지연 위치와 기준 신호의 위치에 기반하여, 현재 지연 추정 값을 결정하도록 구성된다.

또한, 현재 지연 추정 값을 더 로버스트하게 하기 위해, 현재 지연 추정 값을 결정할 때, 지연 추정 값 결정 유닛은, 다음의 로버스트 조건들 중 하나 이상이 만족되는 지의 여부를 더 판단할 수 있다. 다음의 로버스트 조건들 중 하나 이상이 만족되면, 현재 지연 추정 값이 현재 지연 위치와 기준 신호의 위치에 기반하여 결정되고, 그렇지 않으면 다음 지연 추정이 수행된다.

또한, 기준 신호가 시프트되고 필터가 지연에 기반하여 업데이트되는 경우, 지연 추정 값은 필터의 수렴에 따라 점점 더 정확해지도록 요구된다. 지연을 더 정확하게 획득하기 위해, 지연 추정 값 결정 유닛은 최대 상호-상관 값을 갖는 프레임에 대응하는 위치를 후보 지연 위치로서 선택할 수 있다. 히스토리컬 데이터에 기반하여, 최종적으로 정확한 지연 추정 값을 획득하기 위해, 후보 지연 위치가 후보 지원 위치의 변경에 따라 처벌 및/또는 보상된다. 구체적으로, 각 지연 추정에서 계산되는 지연 분석 범위에서의 기준 신호와 마이크로폰 신호의 프레임들 사이의 상호-상관 값들 중에서 가장 큰 상호-상관 값을 갖는 마이크로폰 신호의 프레임에 대응하는 위치는 후보 지연 위치로서 기능한다. 후보 지연 위치들은 L-차원 어레이(Sa)에 매핑되고, 여기서 L은 지연 분석 범위에서의 마이크로폰 신호의 프레임들의 총 개수와 동일하다. 후보 지연 위치가 연속적으로 반복되는 횟수가 카운트된다. 현재 후보 지연 위치가 변경되면, 현재 후보 지연 위치에 대한 값은 제1 사전 설정 값(t1)만큼 증가되고, 이전 후보 지연 위치에 대한 값은 제2 사전 설정 값(t2)만큼 감소되고, 다른 위치들에 대한 값들은 제3 사전 설정 값(t3)만큼 감소된다. 현재 후보 지연 위치가 변경되지 않으면, 현재 후보 지연 위치에 대한 값은 제1 사전 설정 값(t1)만큼 증가되고, 다른 위치들에 대한 값들은 제3 사전 설정 값(t3)만큼 감소된다. 제2 사전 설정 값(t2)은 제3 사전 설정 값(t3) 이하이다. 현재 후보 지연 위치에 대한 값이 제1 임계 값 보다 크고, 현재 후보 지연 위치가 연속적으로 반복되는 횟수가 제2 임계 값 보다 크면, 현재 지연 추정 값은 현재 후보 지연 위치와 기준 신호의 위치에 기반하여 결정된다. t1, t2, 및 t3에 대한 값은 경험 또는 수 많은 실험들에 기반하여 결정될 수 있으며, t3은 일반적으로 t2 이상이다. 예를 들면, t1, t2, 및 t3은 2, 1, 및 2로 설정될 수 있다.

상술된 방식으로 지연 추정 값을 결정할 때, 지연 추정 값 결정 유닛은 상기의 로버스트 조건들 중 하나 이상이 만족되는 지의 여부를 더 판단할 수 있으며, 이에 따라 현재 추정된 지연 값이 더 로버스트하다.

실제 적용들에서, 신호 시프트 모듈(404)은 상이한 방식들 중 어느 하나로 지연 추정 값 결정 유닛에 의해 결정된 현재 지연 추정 값만큼 기준 신호의 데이터를 시프트할 수 있다.

또한, 히스토리컬 데이터를 기반으로 하는 경우, 최종적으로 지연 추정 값을 획득을 획득하기 위해, 후보 지연 위치가 후보 지연 위치의 변화에 따라 처벌 및/또는 보상되고, 추정된 후보 지연 위치의 정확도가 간격들에 따라 다르다. 따라서, 신호 시프트 모듈(404)은 다음과 같이 기준 신호를 시프트할 수 있다. 현재 지연 추정 값(D₁(t))이 제3 임계 값(T3) 이하인 경우, 기준 신호의 데이터는 시프트되지 않는다. 현재 지연 추정 값(D₁(t))이 제3 임계 값(T3) 보다 크고 제4 임계 값(T4) 보다 작으면, 기준 신호의 데이터는 D₁(t)/2만큼 시프트된다. 현재 지연 추정 값(D₁(t))이 제4 임계 값(T4) 이상이면, 기준 신호의 데이터는 D₁(t)만큼 시프트된다.

게다가, 도 5에 도시된 바와 같이 기준 신호를 시프트할 때, 히스토리컬 기준 신호의 내용의 손실을 피하기 위해, 본 개시의 다른 실시예에 따른 장치는 캐싱 모듈(501)을 더 포함한다. 캐싱 모듈은 히스토리컬 기준 신호의 데이터를 캐싱하도록 구성된다.

따라서, 본 실시예에서, 신호 시프트 모듈(404)은 기준 신호를 시프트할 때, 캐싱된 히스토리컬 기준 신호의 데이터를 함께 시프트하도록 더 구성된다.

본 개시의 다른 실시예에 따른 장치에서, 적응 필터(405)가 계수를 업데이트할 때, 현재 지연 추정 값이 필터의 길이 보다 작으면, 필터 계수는 지연 추정 값에 기반하여 시프트되고, 필터는 시프트된 적응 필터 계수에 기반하여 업데이트되며, 여기서 시프트 후에 값이 없는 위치에서의 계수는 리셋된다. 예를 들면, 기준 배율이 없는 이러한 필터 계수는 0으로 리셋된다. 그리고, 필터는 리셋된 적응 필터 계수에 기반하여 업데이트된다.

본 개시의 실시예들에 따른 에코 제거 장치에 따르면, 마이크로폰 신호와 기준 신호에서 비선형성을 갖는 주파수 포인트들이 검출된다. 현재 지연 추정 값은, 마이크로폰 신호와 기준 신호에서 비선형성이 없는 주파수 포인트 신호들에 기반하여 계산된다. 즉, 기준 신호와 마이크로폰 신호 사이의 지연은 비선형성 없이 추정되며, 이에 따라 지연 추정 값이 더 정확하다. 그리고, 기준 신호는 현재 지연 추정 값에 기반하여 시프트된다. 에코 제거를 수행하기 위해, 적응 필터가 마이크로폰 신호와 시프트된 기준 신호를 기반으로 업데이트되며, 이로써 에코 제거의 효과가 효과적으로 향상된다.

또한, 적응 필터를 업데이트하는 프로세스에서, 히스토리컬 기준 신호의 데이터를 캐싱하고 함께 시프트하며, 기준 유의성이 없는 필터 계수를 리셋함으로써, 지연의 변화에 의해 야기되는 필터의 재수렴에 대한 시간 주기가 감소될 수 있으며, 이로써, 에코 제거의 성능에 대한 재수렴의 영향이 감소된다.

본 개시의 일 실시예에 따른 지연 추정을 기반으로 하는 에코 제거 디바이스가 더 제공된다. 디바이스는 프로세서, 메모리, 및 시스템 버스를 포함한다.

프로세서는 시스템 버스를 통해 메모리에 연결된다.

메모리는, 프로세서에 의해 실행될 때, 프로세서가 상술된 지연 추정을 기반으로 하는 에코 제거 방법들 중 어느 하나를 수행하도록 제어하는 명령어들을 포함하는 하나 이상의 프로그램들을 저장한다.

본 개시의 일 실시예에 따른 컴퓨터-판독 가능 저장 매체가 더 제공된다. 컴퓨터-판독 가능 저장 매체는, 단말 장치에 의해 실행될 때, 단말 장치가 상술된 지연 추정을 기반으로 하는 에코 제거 방법들 중 어느 하나를 수행하도록 제어하는 명령어들을 저장한다.

본 개시의 일 실시예에 따른 컴퓨터 프로그램 제품이 더 제공된다. 컴퓨터 프로그램 제품은, 단말 장치에 의해 실행될 때, 단말 장치가 상술된 지연 추정을 기반으로 하는 에코 제거 방법들 중 어느 하나를 수행하도록 제어한다.

본 명세서의 실시예들은 진행 순서로 설명되고, 이들 각각은 다른 것들과의 차이점을 강조하며, 실시예들 중 동일하거나 유사한 부분들은 서로 참조될 수 있다. 또한, 상술된 장치 실시예들은 단지 예시적인 것이다. 개별 구성 요소들로서의 상술된 유닛들은 물리적으로 분리되거나 분리되지 않을 수 있다. 하나의 유닛으로서 표시된 구성 요소는 물리적인 유닛이거나 물리적인 유닛이 아닐 수 있으며, 즉 한 곳에 위치하거나 다수의 네트워크 유닛들 상에 분산될 수 있다. 실시예의 해결 수단들의 목적은, 실제 요구 사항들에 기초하여 유닛들의 일부 또는 전부를 선택함으로써 달성될 수 있다. 해당 기술 분야에서 통상의 지식을 가진 자는 창조적 노력 없이 본 개시의 기술적 해결 수단을 이해하고 구현할 수 있다.

본 개시의 실시예들이 상술되었다. 본 개시는 특정 실시예들에 의해 예시된다. 상술된 실시예들은 본 개시에 따른 방법 및 장치의 이해를 돕기 위한 것일 뿐이다. 또한, 해당 기술 분야에서 통상의 지식을 가진 자는 본 개시의 아이디어에 기초하여 특정 구현 및 적용 범위를 변경할 수 있다. 요약하면, 본 명세서는 본 개시에 대한 제한으로서 이해되어서는 안된다.

Claims

지연 추정(delay estimation)을 기반으로 하는 에코 제거(echo cancellation) 방법에 있어서,
마이크로폰(microphone) 신호와 기준(reference) 신호를 수신하고, 상기 마이크로폰 신호와 상기 기준 신호를 전처리하는 단계;
상기 전처리된 마이크로폰 신호와 상기 전처리된 기준 신호에서, 현재 에코 제거 시나리오의 비선형성(non-linearity)을 갖는 주파수 포인트(frequency point) 신호들을 결정하는 단계;
상기 마이크로폰 신호와 상기 기준 신호에서 비선형성이 없는 주파수 포인트 신호들을 기반으로, 현재 지연 추정 값을 계산하는 단계;
상기 현재 지연 추정 값에 기반하여, 상기 기준 신호를 시프트하는 단계; 및
에코 제거를 수행하기 위해, 상기 전처리된 마이크로폰 신호와 상기 시프트된 기준 신호를 기반으로, 적응 필터(adaptive filter)를 업데이트하는 단계
를 포함하는, 방법.
제1 항에 있어서,
상기 전처리된 마이크로폰 신호와 상기 전처리된 기준 신호에서, 현재 에코 제거 시나리오의 비선형성을 갖는 주파수 포인트 신호들을 결정하는 단계는,
상기 전처리된 기준 신호의 에너지, 제로-크로싱 율(zero-crossing rate), 및 단기 진폭(short-term amplitude) 중 하나 이상에 기반하여, 상기 비선형성을 갖는 주파수 포인트 신호들을 결정하는 단계를 포함하는, 파-엔드(far-end) 신호 검출;
상기 전처리된 마이크로폰 신호의 에너지 대 상기 전처리된 기준 신호의 에너지의 비율에 기반하여, 상기 비선형성을 갖는 주파수 포인트 신호들을 결정하는 단계를 포함하는, 듀얼-엔드(dual-end) 신호 검출; 및
저주파수 범위에서의 상기 기준 신호와 상기 마이크로폰 신호 사이의 상관도(correlation)에 대한 평균 값을 계산하는 단계, 미리 결정된 주파수 간격(interval)의 다른 주파수 범위들에서의 상기 기준 신호와 상기 마이크로폰 신호 사이의 상관도에 대한 평균 값들을 계산하는 단계, 및 상기 다른 주파수 범위들에서의 상관도에 대한 평균 값들과 상기 저주파수 범위에서의 상관도의 평균 값에 기반하여, 상기 비선형성을 갖는 주파수 포인트 신호들을 결정하는 단계를 포함하는, 디바이스 하드웨어에 의해 발생되는 비선형성의 검출
중 하나 이상을 포함하는, 방법.
제1 항에 있어서,
상기 마이크로폰 신호와 상기 기준 신호에서 비선형성이 없는 주파수 포인트 신호들을 기반으로, 현재 지연 추정 값을 계산하는 단계는,
지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들의 각각에 대해, 상기 기준 신호와 상기 마이크로폰 신호의 프레임에서 비선형성이 없는 주파수 포인트 신호들을 선택하고, 상기 기준 신호와 상기 마이크로폰 신호의 프레임 사이의 상호-상관(cross-correlation) 값을 계산하는 단계; 및
상기 기준 신호와 상기 마이크로폰 신호의 프레임들 사이의 계산된 상호-상관 값들에 기반하여, 상기 지연 추정 값을 결정하는 단계
를 포함하는, 방법.
제3 항에 있어서,
상기 기준 신호와 상기 마이크로폰 신호의 프레임들 사이의 계산된 상호-상관 값들에 기반하여, 상기 지연 추정 값을 결정하는 단계는,
상기 기준 신호와 상기 마이크로폰 신호의 프레임들 사이의 상기 계산된 상호-상관 값들 중에서 최대 상호-상관 값을 갖는 마이크로폰 신호의 프레임에 대응하는 위치를 현재 지연 위치로 선택하는 단계; 및
상기 현재 지연 위치와 상기 기준 신호의 위치에 기반하여, 상기 현재 지연 추정 값을 결정하는 단계
를 포함하는, 방법.
제3 항에 있어서,
상기 기준 신호와 상기 마이크로폰 신호의 프레임들 사이의 계산된 상호-상관 값들에 기반하여, 상기 현재 지연 추정 값을 결정하는 단계는,
각 지연 추정에서, 상기 기준 신호와 상기 지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들 사이의 상기 계산된 상호-상관 값들 중에서 최대 상호-상관 값을 갖는 마이크로폰 신호의 프레임에 대응하는 위치를 후보 지연 위치로 선택하는 단계; 및 후보 지연 위치들을 L-차원 어레이(Sa)에 매핑하고 - L은 상기 지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들의 총 개수와 동일함 -, 후보 지연 위치가 연속적으로 반복되는 횟수를 카운트하는 단계;
현재 후보 지연 위치가 변경되면, 상기 현재 후보 지연 위치에 대한 값을 제1 사전 설정 값(t1)만큼 증가시키고, 이전 후보 지연 위치에 대한 값을 제2 사전 설정 값(t2)만큼 감소시키고, 다른 위치들에 대한 값들을 제3 사전 설정 값(t3)만큼 감소시키는 단계;
상기 현재 후보 지연 위치가 변경되지 않으면, 상기 현재 후보 지연 위치에 대한 값을 상기 제1 사전 설정 값(t1)만큼 증가시키고, 다른 위치들에 대한 값들을 상기 제3 사전 설정 값(t3)만큼 감소시키는 단계 - 사기 제2 사전 설정 값(t2)은 상기 제3 사전 설정 값(t3) 이하임 -; 및
상기 현재 후보 지연 위치에 대한 값이 제1 임계 값 보다 크고, 상기 현재 후보 지연 위치가 연속적으로 반복되는 횟수가 제2 임계 값 보다 크면, 상기 현재 후보 지연 위치와 상기 기준 신호의 위치에 기반하여, 상기 현재 지연 추정 값을 결정하는 단계
를 포함하는, 방법.
제5 항에 있어서,
상기 현재 지연 추정 값에 기반하여, 상기 기준 신호를 시프트하는 단계는,
상기 현재 지연 추정 값(D₁(t))이 제3 임계 값(T3) 이하인 경우, 상기 기준 신호의 데이터를 시프트하지 않고;
상기 현재 지연 추정 값(D₁(t))이 상기 제3 임계 값(T3) 보다 크고 제4 임계 값(T4) 보다 작은 경우, 상기 기준 신호의 데이터를 D₁(t)/2만큼 시프트하는 단계; 및
상기 현재 지연 추정 값(D₁(t))이 상기 제4 임계 값(T4) 이상인 경우, 상기 기준 신호의 데이터를 D₁(t)만큼 시프트하는 단계
를 포함하는, 방법.
제4 항 내지 제6 항 중 어느 한 항에 있어서,
상기 기준 신호와 상기 마이크로폰 신호의 프레임들 사이의 계산된 상호-상관 값들에 기반하여, 상기 지연 추정 값을 결정하는 단계는,
다음의 조건들:
(1) 상기 현재 지연 위치에 대응하는 상기 상호-상관 값(C(t))이 이전 지연 위치에 대응하는 상호-상관 값(C(t-1)) 보다 큼;
(2) 현재 지연 분석 범위에서의 각 프레임에 대해, 최대 상호-상관 값(C_max(t))에 대응하는 위치와 최소 상호-상관 값(C_min(t))에 대응하는 위치 사이의 차이 값이 제1 사전 설정 차이 값 보다 큼;
(3) 상기 기준 신호와 상기 지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들 사이의 상호-상관 값들의 평균 값(C_mean(t))과 상기 현재 지연 위치에 대응하는 상기 상호-상관 값(C(t)) 사이의 차이 값이 제2 사전 설정 차이 값 보다 큼; 및
(4) 상기 현재 지연 위치(p(t))가 이전 지연 위치(p(t-1)) 보다 작음
중 하나 이상이 충족되는 것을 결정하는 단계
를 포함하는, 방법.
제1 항 내지 제6 항 중 어느 한 항에 있어서,
히스토리컬(historical) 기준 신호의 데이터를 캐싱하는 단계; 및
상기 기준 신호를 시프트할 때, 상기 히스토리컬 기준 신호의 상기 캐싱된 데이터를 시프트하는 단계
를 더 포함하는, 방법.
제1 항 내지 제6 항 중 어느 한 항에 있어서,
상기 적응 필터를 업데이트하는 단계는,
상기 현재 지연 추정 값이 상기 적응 필터의 길이(length) 보다 작으면, 상기 지연 추정 값에 기반하여, 적응 필터 계수를 시프트하고, 상기 시프트된 적응 필터 계수에 기반하여, 상기 적응 필터를 업데이트하는 단계
를 포함하고,
시프트 후에 값이 없는 위치에서의 계수가 리셋되고,
상기 적응 필터가 상기 리셋된 적응 필터 계수에 기반하여, 업데이트되는, 방법.
지연 추정을 기반으로 하는 에코 제거 장치에 있어서,
마이크로폰 신호와 기준 신호를 수신하고, 상기 마이크로폰 신호와 상기 기준 신호를 전처리하고, 상기 전처리된 마이크로폰 신호와 상기 전처리된 기준 신호를 출력하도록 구성되는 신호 처리 모듈;
상기 신호 처리 모듈에 의해 출력되는 상기 전처리된 마이크로폰 신호와 상기 전처리된 기준 신호에서, 현재 에코 제거 시나리오의 비선형성을 갖는 주파수 포인트 신호들을 결정하도록 구성되는 주파수 포인트 검출 모듈;
상기 전처리된 마이크로폰 신호와 상기 전처리된 기준 신호에서 상기 주파수 포인트 검출 모듈에 의해 결정되는 비선형성이 없는 주파수 포인트 신호들을 기반으로, 현재 지연 추정 값을 계산하고, 상기 현재 지연 추정 값을 출력하도록 구성되는 지연 추정 모듈;
상기 지연 추정 모듈에 의해 출력되는 상기 현재 지연 추정 값에 기반하여, 상기 기준 신호를 시프트하고, 상기 시프트된 기준 신호를 출력하도록 구성되는 신호 시프트 모듈; 및
에코 제거를 수행하기 위해, 상기 신호 처리 모듈에 의해 출력되는 상기 전처리된 마이크로폰 신호와 상기 신호 시프트 모듈에 의해 출력되는 상기 시프트된 기준 신호를 기반으로, 적응 필터를 업데이트하도록 구성되는 상기 적응 필터
를 포함하는, 장치.
제10 항에 있어서,
상기 주파수 포인트 검출 모듈은,
상기 전처리된 기준 신호의 에너지, 제로-크로싱 율, 및 단기 진폭 중 하나 이상에 기반하여, 상기 비선형성을 갖는 주파수 포인트 신호들을 결정하도록 구성되는 파-엔드 신호 검출 유닛;
상기 전처리된 마이크로폰 신호의 에너지 대 상기 전처리된 기준 신호의 에너지의 비율에 기반하여, 상기 비선형성을 갖는 주파수 포인트 신호들을 결정하도록 구성되는 듀얼-엔드 신호 검출 유닛; 및
저주파수 범위에서의 상기 기준 신호와 상기 마이크로폰 신호 사이의 상관도에 대한 평균 값을 결정하고, 특정 주파수 간격의 다른 주파수 범위들에서의 상기 기준 신호와 상기 마이크로폰 신호 사이의 상관도에 대한 평균 값들을 계산하고, 상기 다른 주파수 범위들에서의 상관도에 대한 평균 값들과 상기 저주파수 범위에서의 상관도의 평균 값에 기반하여, 상기 비선형성을 갖는 주파수 포인트 신호들을 결정하도록 구성되는 디바이스 하드웨어 검출 유닛
중 하나 이상을 포함하는, 장치.
제10 항에 있어서,
상기 지연 추정 모듈은,
지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들의 각각에 대해, 상기 기준 신호와 상기 마이크로폰 신호의 프레임에서 비선형성이 없는 주파수 포인트 신호들을 선택하고, 상기 기준 신호와 상기 마이크로폰 신호의 프레임 사이의 상호-상관 값을 계산하도록 구성되는 상호-상관 계산 유닛; 및
상기 기준 신호와 상기 마이크로폰 신호의 프레임들 사이의 계산된 상호-상관 값들에 기반하여, 상기 지연 추정 값을 결정하도록 구성되는 지연 추정 값 결정 유닛
을 포함하는, 장치.
제12 항에 있어서,
상기 지연 추정 값 결정 유닛은,
상기 기준 신호와 상기 마이크로폰 신호의 프레임들 사이의 상기 상호-상관 값들 중에서 최대 상호-상관 값을 갖는 마이크로폰 신호의 프레임에 대응하는 위치를 현재 지연 위치로 선택하고,
상기 현재 지연 위치와 상기 기준 신호의 위치에 기반하여, 상기 현재 지연 추정 값을 결정하도록 구성되는,
장치.
제12 항에 있어서,
상기 지연 추정 값 결정 유닛은,
각 지연 추정에서, 상기 기준 신호와 상기 지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들 사이의 상기 계산된 상호-상관 값들 중에서 최대 상호-상관 값을 갖는 마이크로폰 신호의 프레임에 대응하는 위치를 후보 지연 위치로 선택하고, 후보 지연 위치들을 L-차원 어레이(Sa)에 매핑하고 - L은 상기 지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들의 총 개수와 동일함 -, 후보 지연 위치가 연속적으로 반복되는 횟수를 카운트하고,
현재 후보 지연 위치가 변경되면, 상기 현재 후보 지연 위치에 대한 값을 제1 사전 설정 값(t1)만큼 증가시키고, 이전 후보 지연 위치에 대한 값을 제2 사전 설정 값(t2)만큼 감소시키고, 다른 위치들에 대한 값들을 제3 사전 설정 값(t3)만큼 감소시키고,
상기 현재 후보 지연 위치가 변경되지 않으면, 상기 현재 후보 지연 위치에 대한 값을 상기 제1 사전 설정 값(t1)만큼 증가시키고, 다른 위치들에 대한 값들을 상기 제3 사전 설정 값(t3)만큼 감소시키며 - 사기 제2 사전 설정 값(t2)은 상기 제3 사전 설정 값(t3) 이하임 -,
상기 현재 후보 지연 위치에 대한 값이 제1 임계 값 보다 크고, 상기 현재 후보 지연 위치가 연속적으로 반복되는 횟수가 제2 임계 값 보다 크면, 상기 현재 후보 지연 위치와 상기 기준 신호의 위치에 기반하여, 상기 현재 지연 추정 값을 결정하도록 구성되는,
장치.
제14 항에 있어서,
상기 신호 시프트 모듈은,
상기 현재 지연 추정 값(D₁(t))이 제3 임계 값(T3) 이하인 경우, 상기 기준 신호의 데이터를 시프트하지 않고,
상기 현재 지연 추정 값(D₁(t))이 상기 제3 임계 값(T3) 보다 크고 제4 임계 값(T4) 보다 작은 경우, 상기 기준 신호의 데이터를 D₁(t)/2만큼 시프트하며,
상기 현재 지연 추정 값(D₁(t))이 상기 제4 임계 값(T4) 이상인 경우, 상기 기준 신호의 데이터를 D₁(t)만큼 시프트하도록 구성되는,
장치.
제13 항 내지 제15 항 중 어느 한 항에 있어서,
상기 지연 추정 값 결정 유닛은,
상기 지연 추정 값을 결정할 때, 다음의 조건들:
(1) 상기 현재 지연 위치에 대응하는 상기 상호-상관 값(C(t))이 이전 지연 위치에 대응하는 상호-상관 값(C(t-1)) 보다 큼;
(2) 현재 지연 분석 범위에서의 각 프레임에 대해, 최대 상호-상관 값(C_max(t))에 대응하는 위치와 최소 상호-상관 값(C_min(t))에 대응하는 위치 사이의 차이 값이 제1 사전 설정 차이 값 보다 큼;
(3) 상기 기준 신호와 상기 지연 분석 범위에서의 상기 마이크로폰 신호의 프레임들 사이의 상호-상관 값들의 평균 값(C_mean(t))과 상기 현재 지연 위치에 대응하는 상기 상호-상관 값(C(t)) 사이의 차이 값이 제2 사전 설정 차이 값 보다 큼; 및
(4) 상기 현재 지연 위치(p(t))가 이전 지연 위치(p(t-1)) 보다 작음
중 하나 이상이 충족되는 것을 결정하도록 구성되는,
장치.
제10 항 내지 제15 항 중 어느 한 항에 있어서,
히스토리컬 기준 신호의 데이터를 캐싱하도록 구성되는 캐싱 모듈을 더 포함하고,
상기 신호 시프트 모듈은,
상기 기준 신호를 시프트할 때, 상기 히스토리컬 기준 신호의 상기 캐싱된 데이터를 함께 시프트하도록 더 구성되는,
장치.
제10 항 내지 제15 항 중 어느 한 항에 있어서,
상기 적응 필터는,
상기 적응 필터를 업데이트할 때,
상기 현재 지연 추정 값이 상기 적응 필터의 길이 보다 작으면, 상기 지연 추정 값에 기반하여, 적응 필터 계수를 시프트하고, 상기 시프트된 적응 필터 계수에 기반하여, 상기 적응 필터를 업데이트하도록 구성되고,
시프트 후에 값이 없는 위치에서의 계수가 리셋되고,
상기 적응 필터가 상기 리셋된 적응 필터 계수에 기반하여, 업데이트되는,
장치.
지연 추정을 기반으로 하는 에코 제거 디바이스에 있어서,
프로세서, 메모리, 및 시스템 버스를 포함하고,
상기 프로세서는, 상기 시스템 버스를 통해 상기 메모리에 연결되며,
상기 메모리는, 상기 프로세서에 의해 실행될 때, 상기 프로세서가 제1 항 내지 제6 항 중 어느 한 항에 기재된 방법을 수행하도록 제어하는 명령어들을 포함하는 하나 이상의 프로그램들을 저장하는,
에코 제거 디바이스.
단말 장치에 의해 실행될 때, 상기 단말 장치가 제1 항 내지 제6 항 중 어느 한 항에 기재된 방법을 수행하도록 제어하는 명령어들을 저장하는,
컴퓨터-판독 가능 저장 매체.
삭제