KR20160004462A - G.722 코덱 패킷손실은닉 및 최급강하법을 이용한 적응형 뮤팅 시스템 및 방법 - Google Patents

G.722 코덱 패킷손실은닉 및 최급강하법을 이용한 적응형 뮤팅 시스템 및 방법 Download PDF

Info

Publication number
KR20160004462A
KR20160004462A KR1020140082514A KR20140082514A KR20160004462A KR 20160004462 A KR20160004462 A KR 20160004462A KR 1020140082514 A KR1020140082514 A KR 1020140082514A KR 20140082514 A KR20140082514 A KR 20140082514A KR 20160004462 A KR20160004462 A KR 20160004462A
Authority
KR
South Korea
Prior art keywords
frame
signal
parameter
sigmoid function
muting
Prior art date
Application number
KR1020140082514A
Other languages
English (en)
Other versions
KR101591597B1 (ko
Inventor
이봉기
장준혁
Original Assignee
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한양대학교 산학협력단 filed Critical 한양대학교 산학협력단
Priority to KR1020140082514A priority Critical patent/KR101591597B1/ko
Publication of KR20160004462A publication Critical patent/KR20160004462A/ko
Application granted granted Critical
Publication of KR101591597B1 publication Critical patent/KR101591597B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

G.722 코덱 패킷손실은닉 및 최급강하법을 이용한 적응형 뮤팅 시스템 및 방법이 개시된다. 적응형 뮤팅 시스템은, G.722 인코더에서 인코딩된 프레임을 노멀 디코딩(normal decoding)하여 디코딩 신호를 생성하는 디코딩 신호 생성부, 인코딩된 프레임 이전에 수신되어 패킷 손실이 발생하지 않은 이전 프레임에 대해 선형 예측 기반 피치 반복(Linear Prediction based Pitch Repetition)을 수행하여 손실 가정 디코딩 신호를 생성하는 손실 가정 디코딩 신호 생성부, 및 디코딩 신호와 손실 가정 디코딩 신호를 이용하여 시그모이드 함수의 파라미터를 결정하는 파라미터 결정부를 포함할 수 있다.

Description

G.722 코덱 패킷손실은닉 및 최급강하법을 이용한 적응형 뮤팅 시스템 및 방법{ADAPTIVE MUTING SYSTEM AND MEHTOD USING G.722 CODEC PACKET LOSS CONCEALMENT AND STEEPEST DESCENT CRITERION}
본 발명의 실시예들은 G.722 코덱의 패킷손실은닉 알고리즘에서 최급강하법을 이용하여 시그모이드 함수의 파라미터를 결정하는 기술에 관한 것이다.
일반적으로, VoIP(Voice over Internet Protocol)를 이용한 음성 통신 시스템은 패킷이 중간에 손실되는 패킷 손실이 발생한다. 이러한 패킷 손실은 음성통화품질을 감소시킨다. 이에 따라, 종래의 VoIP 음성 통신 시스템은 패킷손실은닉(Packet Loss Concealment) 알고리즘을 이용하여 패킷 손실을 보상한다.
G.722 코덱은 ITU-T에 의해 표준화된 광대역 기반의 코덱(CODEC)으로, VoIP 음성 통신에 널리 쓰이는 코덱이다. G.722 코덱의 경우, 그리드 탐색 방식의 훈련 기법을 이용하여 시그모이드 함수의 파라미터를 결정한다.
이처럼, 그리드 탐색 방식의 훈련 기법을 이용하는 경우, 한 번 결정된 시그모이드 함수의 파라미터는 이후에 변하지 않는 고정된 값으로서, 훈련 데이터베이스에 의존적이다.
이에 따라, 패킷손실은닉 알고리즘을 정의하고 있는 ITU-T에 의해 표준화된 G.722 Appendix IV에서, 그리드 탐색 방식의 훈련 기법을 이용하여 시그모이드 함수의 파라미터를 결정한 경우, 미리 정해진 값의 불연속전인 커브를 사용하여 적응형 뮤팅 기법을 통해 뮤팅 게인(muting gain)을 계산함에 따라 최적화된 뮤팅을 이루어내기 어렵다.
다시 말해, 시그모이드 함수의 파라미터가 훈련 데이터에 의존적이고, 한번 결정된 파라미터가 변하지 않고 고정적으로 이용되기 때문에 음성의 짧은 시간 변화에 대응하기 어렵다.
따라서, 시그모이드 함수의 파라미터가 고정되지 않고, 매 음성의 특성에 따라 시그모이드 함수의 파라미터를 샘플 단위로 업데이트할 수 있는 기술이 요구된다.
본 발명은 고정된 시그모이드 함수의 파라미터를 사용함에 따른 문제점을 해소하고자 안출된 것으로, 음성 품질이 개선될 수 있도록 최급강하법을 이용하여 시그모이드 함수의 파라미터를 샘플 단위로 결정하여 업데이트하기 위한 것이다.
본 발명의 일실시예에 따른 적응형 뮤팅 시스템은, G.722 인코더에서 인코딩된 프레임을 노멀 디코딩(normal decoding)/G.722 디코딩하여 디코딩 신호를 생성하는 디코딩 신호 생성부, 상기 인코딩된 프레임 이전에 수신되어 패킷 손실이 발생하지 않은 이전 프레임에 대해 선형 예측 기반 피치 반복(Linear Prediction based Pitch Repetition)을 수행하여 손실 가정 디코딩 신호를 생성하는 손실 가정 디코딩 신호 생성부, 및 상기 디코딩 신호와 상기 손실 가정 디코딩 신호를 이용하여 시그모이드 함수의 파라미터를 결정하는 파라미터 결정부를 포함할 수 있다.
일측면에 따르면, 상기 시그모이드 함수의 파라미터는, 최급강하법(Steepest Descent Criterion))을 이용하여 매 프레임마다 결정되어 업데이트될 수 있다.
다른 측면에 따르면, 상기 인코딩된 프레임이 손실 프레임인지 여부를 판단하는 판단부, 및 상기 손실 프레임이 아닌 것으로 판단됨에 따라, 현재 프레임에 해당하는 시그모이드 함수의 파라미터를 상기 손실 가정 디코딩 신호를 이용하여 결정된 시그모이드 함수의 파라이터로 업데이트하고, 상기 손실 프레임으로 판단됨에 따라, 현재 프레임에 해당하는 시그모이드 함수의 파라미터를 이전 프레임에 해당하는 시그모이드 함수의 파라미터로 업데이트하는 파라미터 업데이트부를 더 포함할 수 있다.
또 다른 측면에 따르면, 상기 인코딩된 프레임은, 패킷 손실이 발생하지 않은 프레임이고, 상기 손실 가정 디코딩 신호 생성부는, 상기 인코딩된 프레임에 패킷 손실이 발생한 것을 가정하고 상기 선형 예측 기반 피치 반복을 수행할 수 있다.
또 다른 측면에 따르면, 상기 파라미터 결정부는, 상기 인코딩된 프레임을 복원한 복원 신호와 상기 디코딩 신호 간의 차이를 나타내는 에러 신호가 감소 또는 최소화되도록 상기 시그모이드 함수의 파라미터를 결정할 수 있다.
또 다른 측면에 따르면, 상기 시그모이드 함수의 파라미터를 이용하여 뮤팅 게인(muting gain)을 계산하는 뮤팅 게인 계산부, 및 상기 뮤팅 게인과 상기 손실 가정 디코딩 신호를 이용하여 현재 프레임을 복원하는 복원 신호 생성부를 더 포함할 수 있다.
또 다른 측면에 따르면, 상기 디코딩 신호 생성부는, 상기 인코딩 프레임에 포함된 로우 대역(lower band) 및 하이 대역(higher band) 신호 중 로우 대역에 해당하는 신호를 디코딩할 수 있다. 그리고, 상기 손실 가정 디코딩 신호 생성부는, 상기 로우 대역에 해당하는 신호에 대해 상기 선형 예측 기반 피치 반복을 수행할 수 있다.
또 다른 측면에 따르면, 상기 손실 가정 디코딩 신호 생성부는, 상기 인코딩 프레임에 포함된 로우 대역(lower band) 및 하이 대역(higher band) 신호 중 상기 로우 대역에 해당하는 신호에 대해 상기 선형 예측 기반 피치 반복을 수행할 수 있다.
본 발명의 일 실시예에 따른 적응형 뮤팅 방법은, G.722 인코더에서 인코딩된 프레임을 노멀 디코딩(normal decoding)/G.722 디코딩하여 디코딩 신호를 생성하는 단계, 상기 인코딩된 프레임 이전에 수신되어 패킷 손실이 발생하지 않은 이전 프레임에 대해 선형 예측 기반 피치 반복(Linear Prediction based Pitch Repetition)을 수행하여 손실 가정 디코딩 신호를 생성하는 단계, 및 상기 디코딩 신호와 상기 손실 가정 디코딩 신호를 이용하여 시그모이드 함수의 파라미터를 결정하는 단계를 포함할 수 있다.
일 측면에 따르면, 상기 시그모이드 함수의 파라미터는, 최급강하법(Steepest Descent Criterion))을 이용하여 매 프레임마다 결정되어 업데이트될 수 있다.
다른 측면에 따르면, 상기 인코딩된 프레임이 손실 프레임인지 여부를 판단하는 단계, 상기 손실 프레임이 아닌 것으로 판단됨에 따라, 현재 프레임에 해당하는 시그모이드 함수의 파라미터를 상기 손실 가정 디코딩 신호를 이용하여 결정된 시그모이드 함수의 파라이터로 업데이트하는 단계, 및 상기 손실 프레임으로 판단됨에 따라, 현재 프레임에 해당하는 시그모이드 함수의 파라미터를 이전 프레임에 해당하는 시그모이드 함수의 파라미터로 업데이트하는 단계를 더 포함할 수 있다.
또 다른 측면에 따르면, 상기 인코딩된 프레임은, 패킷 손실이 발생하지 않은 프레임이고, 상기 손실 가정 디코딩 신호를 생성하는 단계는, 상기 인코딩된 프레임에 패킷 손실이 발생한 것을 가정하고 상기 선형 예측 기반 피치 반복을 수행할 수 있다.
또 다른 측면에 따르면, 상기 시그모이드 함수의 파라미터를 결정하는 단계는, 상기 인코딩된 프레임을 복원한 복원 신호와 상기 디코딩 신호 간의 차이를 나타내는 에러 신호가 감소 또는 최소화되도록 상기 시그모이드 함수의 파라미터를 결정할 수 있다.
또 다른 측면에 따르면, 상기 시그모이드 함수의 파라미터를 이용하여 뮤팅 게인(muting gain)을 계산하는 단계, 및 상기 뮤팅 게인과 상기 손실 가정 디코딩 신호를 이용하여 현재 프레임을 복원하는 단계를 더 포함할 수 있다.
또 다른 측면에 따르면, 상기 손실 가정 디코딩 신호를 생성하는 단계는, 상기 인코딩 프레임에 포함된 로우 대역(lower band) 및 하이 대역(higher band) 신호 중 상기 로우 대역에 해당하는 신호에 대해 상기 선형 예측 기반 피치 반복을 수행할 수 있다.
또 다른 측면에 따르면, 상기 디코딩 신호를 생성하는 단계는, 상기 인코딩 프레임에 포함된 로우 대역(lower band) 및 하이 대역(higher band) 신호 중 로우 대역에 해당하는 신호를 디코딩하고, 상기 손실 가정 디코딩 신호를 생성하는 단계는, 상기 로우 대역에 해당하는 신호에 대해 상기 선형 예측 기반 피치 반복을 수행할 수 있다.
본 발명에 의하면, 최급강하법을 이용하여 시그모이드 함수의 파라미터를 샘플 단위로 결정하여 업데이트함에 따라, 음성 품질을 개선할 수 있다.
도 1은 본 발명의 일실시예에 따른 G.722 디코더의 전반적인 구성을 도시한 블록도이다.
도 2는 본 발명의 일실시예에 따른 적응형 뮤팅 시스템의 구성을 도시한 블록도이다.
도 3은 도 1의 LP 기반 피치 반복 수행부에서 복원 신호를 생성하는 과정을 나타내는 블록도이다.
도 4는 본 발명의 일실시예에 따라 패킷손실은닉 및 최급강하법을 이용하여 복원 신호를 생성하는 동작을 설명하기 위해 제공되는 흐름도이다.
도 5는 본 발명의 일실시예에 따른 뮤팅 게인을 이용하여 생성된 복원 신호의 파형을 도시한 도면이다.
이하, 본 발명에 따른 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일실시예에 따른 G.722 디코더의 전반적인 구성을 도시한 블록도이다.
도 1에 따르면, G.722 디코더(100)는 로우 대역 ADPCM 디코더(Lower Band Adaptive Differential Pulse Code Modulation Decoder, 101) 로우 대역 ADPCM 스테이트 업데이트부(Lower band Adaptive Differential Pulse Code Modulation State Update, 102), LP 기반 피치 반복 수행부(Linear Prediction Pitch Repetition, 103), 크로스 페이딩(Crossfading, 104), 하이 대역 ADPCM 디코더(Higher Band Adaptive Differential Pulse Code Modulation Decoder, 105), 하이 대역 ADPCM 스테이트 업데이트부(Higher Band Adaptive Differential Pulse Code Modulation State Update, 106), 피치 반복 수행부(Pitch Repetition, 107), A(107), Hpost(109), B(110), 및 QMF 합성 필터 뱅크(Quadrature Mirror Filter Synthesis Filter Bank, 111)를 포함할 수 있다.
도 1에서, G.722 디코더(100)는, 패킷손실은닉을 위해 G.722 Appendix IV에 정의된 G.722 디코더보다 로우 대역 ADPCM 스테이트 업데이트부(Lower Band ADPCM State Update, 102), LP 기반 피치 반복 수행부(LP based pitch repetition, 103), 크로스 페이딩(Corssfading, 104), 하이 대역 ADPCM 스테이트 업데이트부(Higher Band ADPCM State Update, 106), 피치 반복 수행부(pitch repetition, 107), Hpost(109) 및 B(110)을 더 포함할 수 있다.
도 1에서, Zl(n)은 패킷 손실이 발생하지 않은 이전 프레임일 수 있다. 여기서, 이전 프레임은, G.722 인코더에서 인코딩되어 연속하여 수신되는 인코딩 프레임들 중 현재 프레임 바로 이전에 수신된 프레임일 수 있다. 예를 들어, G.722 인코더에서 인코딩된 프레임 1, 프레임 2, 프레임 3, ...,프레임 n이 연속하여 수신되고, 현재 프레임이 프레임 2인 경우, 이전 프레임은 프레임 1일 수 있다.
일례로, 도 1에서, 이전 프레임에는 패킷 손실이 발생하지 않다가, 현재 프레임에 패킷 손실이 발생한 경우, G.722 디코더(100)는 이전 프레임 Zl(n)을 이용하여 현재 프레임을 복원하여 복원 신호 yl(n)를 생성할 수 있다. 다시 말해, 패킷 손실이 발생한 배드 프레임(bad frame)이 현재 프레임으로 수신된 경우, G.722 디코더(100)는 이전 프레임 Zl(n)을 이용하여 현재 프레임을 복원할 수 있다.
이처럼, 현재 프레임을 복원한 이후, 다음 프레임 xl(n)이 패킷 손실이 발생하지 않은 프레임인 경우, 크로스 페이딩(104)은 복원 신호 yl(n)과 다음 프레임 xl(n) 간의 불연속점을 감소 또는 제거하기 위해 복원 신호 yl(n)과 다음 프레임 xl(n) 을 크로스 페이딩할 수 있다.
여기서, 다음 프레임은, G.722 인코더에서 인코딩되어 연속하여 수신되는 프레임들 중 현재 프레임 이후에 수신된 프레임으로, 패킷 손실이 발생하지 않은 굿 프레임(good frame)에 해당할 수 있다. 예를 들어, G.722 인코더에서 인코딩된 프레임 1, 프레임 2, 프레임 3, ...,프레임 n이 연속하여 수신되고, 현재 프레임이 프레임 2인 경우, 다음 프레임은 프레임 2일 수 있다.
G.722 코덱은 하이 대역과 로우 대역으로 구성된 서브 밴드(sub-band) 방식의 코덱일 수 있다. 이때, 음성 신호는 로우 대역에 존재할 수 있다. 그러면, LP 기반 피치 반복 수행부(103)는 선형 예측 기반 피치 반복(Linear Prediction based Pitch Repetition) 알고리즘을 이용하여 로우 대역에 존재하는 음성 신호를 복원할 수 있다. 이때, G.722 디코더(100)는 이전 프레임 Zl(n)의 피치 주기만을 이용하여 하이 대역에 존재하는 신호를 복원함에 따라 계산 복잡도를 감소시킬 수 있다.
도 2는 본 발명의 일실시예에 따른 적응형 뮤팅 시스템의 구성을 도시한 블록도이다.
도 2에 따르면, 적응형 뮤팅 시스템(200)은 판단부(201), 디코딩 신호 생성부(202), 손실 가정 디코딩 신호 생성부(203), 뮤팅 처리부(204), 버퍼(208), 파라미터 업데이트부(207), 및 복원 신호 생성부(209)를 포함할 수 있다.
먼저, 판단부(201)는, G.722 인코더에서 인코딩된 프레임을 수신하고, 인코딩된 프레임이 패킷 손실이 발생한 프레임인지 여부를 판단할 수 있다. 여기서, G.722 인코더는 ITU-T에 의해 표준화된 인코더로서 표준과 변화가 없으므로 자세한 설명은 생략하기로 한다. 그리고, G.722는 서브 밴드(sub-band) 방식의 코덱으로, 대부분의 음성 신호가 로우 대역(lower band) 쪽에 존재할 수 있다.
이때, 인코딩된 프레임이 패킷 손실이 발생하지 않은 프레임인 경우, 디코딩 신호 생성부(202)는 인코딩된 프레임을 노멀 디코딩(normal decoding)함에 따라 디코딩 신호 dl(n)를 생성할 수 있다. 예를 들어, 디코딩 신호 생성부(202)는 패킷 손실이 발생하지 않은 인코딩 프레임에 대해 G.722 디코딩을 수행할 수 있다. 이에 따라, 디코딩 신호 dl(n)은 깨끗한 신호로서, desired signal일 수 있다.
손실 가정 디코딩 신호 생성부(203)는 인코딩된 프레임 이전에 수신되어 패킷 손실이 발생하지 않은 이전 프레임에 대해 선형 예측 기반의 피치 반복(LP based Pitch Repetition)을 수행하여 손실 가정 디코딩 신호를 생성할 수 있다.
예를 들어, 손실 가정 디코딩 신호 생성부(203)는 인코딩된 프레임에 손실이 발생한 것으로 가정할 수 있다. 그리고, 손실 가정 디코딩 신호 생성부(203)는, 인코딩된 프레임의 이전 프레임 zl(n)에 대해 선형 예측 기반의 피치 반복(LP based Pitch Repetition)을 수행함에 따라 손실 가정 디코딩 신호 ylpre(n)를 생성할 수 있다.
뮤팅 처리부(204)는 최급강하법을 이용하여 시그모이드 함수의 파라미터를 결정하기 위해 파라미터 결정부(205), 및 뮤팅 게인 계산부(206)를 포함할 수 있다.
파라미터 결정부(205)는, 디코딩 신호 dl(n)와 손실 가정 디코딩 신호 ylpre(n)에 최급강하법을 적용함에 따라 시그모이드 함수의 파라미터를 결정할 수 있다. 이때, 파라미터 결정부(205)는 매 프레임마다 시그모이드 함수의 파라미터를 결정할 수 있다.
일례로, 파라미터 결정부(205)는 아래의 수학식 1 내지 수학식 4에 기초하여 인코딩된 프레임을 복원한 복원 신호 yl(n)와 디코딩 신호 dl(n) 간의 차이를 나타내는 에러 신호 e(n)가 감소 또는 최소화되도록 시그모이드 함수의 파라미터를 결정할 수 있다.
Figure pat00001
수학식 1에서, yl(n)은 인코딩된 프레임을 복원한 복원 신호, G(n)은 뮤팅 게인(muting gain), ylpre(n)은 손실 가정 디코딩 신호일 수 있다.
수학식 1에 따르면, 복원 신호 yl(n)은 뮤팅 게인 G(n)과 손실 가정 디코딩 신호 ylpre(n)의 곱에 의해 계산될 수 있다. 이때, 손실 가정 디코딩 신호 ylpre(n)는 손실 가정 디코딩 신호 생성부(203)로부터 얻을 수 있으나, 복원 신호 yl(n) 및 뮤팅 게인 G(n)은 아직 알 수 없다. 이에 따라, 파라미터 결정부(205)는 뮤팅 게인과 시그모이드 함수의 파라미터 간의 관계를 나타내는 아래의 수학식 2에 기초하여 시그모이드 함수의 파라미터를 결정할 수 있다.
Figure pat00002
수학식 2에서, α와 β는 시그모이드 함수의 모양을 결정하는 파라미터이고, n0는 오프셋으로, α, β, 및 n0는 시그모이드 함수의 기울기를 결정하는 파라미터일 수 있다.
일례로, 4프레임 이상 연속하여 패킷 손실이 발생한 경우, 뮤팅 게인 G(n)은 0으로 기설정될 수 있다. 수학식 2를 이용함에 따라, 뮤팅 커브는 프레임에 대해 연속적이며, 유연한 뮤팅 게인을 획득할 수 있다.
이때, 최급강하법은 원하는 신호(desired signal)에서 복원 신호 yl(n) 간의 차이를 최소화하는 알고리즘이다. 이에 따라, 적응형 뮤팅 시스템(200)은 최급강하법을 이용하기 위해 패킷 손실이 발생하지 않은 굿 프레임을 대상으로 LP 기반 피치 반복(LP based pitch repetition)을 수행하여 복원 신호를 생성할 수 있다. 다시 말해, 파라미터 결정부(205)는 아래의 수학식 3에 기초하여 노멀 디코딩한 결과인 디코딩 신호 dl(n)와 손실 가정 디코딩 신호 ylpre(n)를 최급강하법에 적용할 수 있다.
Figure pat00003
수학식 3에서, e(n)은 에러 신호, dl(n)은 디코딩 신호, yl(n)은 복원 신호일 수 있다. 이때, 수학식 1에 따르면, 복원 신호 yl(n)은 뮤팅 게인 G(n)과 손실 가정 디코딩 신호 ylpre(n)로 표현될 수 있다. 그러면, 파라미터 결정부(205)는 수학식 3에 수학식 1을 대입할 수 있다. 이어, 수학식 2에 따르면, 뮤팅 게인 G(n)은 시그모이드 함수의 기울기를 결정하는 파라미터 α, β, 및 n0로 표현될 수 있다. 이에 따라, 파라미터 결정부(205)는 수학식 3에 수학식 2를 대입할 수 있다. 그러면, 에러 신호 e(n)은 디코딩 신호 dl(n)에서 시그모이드 함수의 파라미터와 손실 가정 신호의 곱을 감산한 것으로 표현될 수 있다.
수학식 3에 기초하여, 파라미터 결정부(205)는 디코딩 신호 dl(n)과 손실 가정 디코딩 신호 ylpre(n) 간의 차이를 나타내는 에러 신호가 최소화되도록 시그모이드 함수의 파라미터 α, β, 및 n0를 결정할 수 있다. 이때, 에러 신호는 비용 함수로써 아래의 수학식 4와 같이 표현될 수 있다.
Figure pat00004
수학식 4에서, 비용함수 J(α, β)는 α, β에 의해 결정되는 함수일 수 있다. 그러면, 파라미터 결정부(205)는 최급강하법을 이용하여 비용함수 J(α, β)를 최소화시키는 방향으로 α, β를 결정할 수 있다.
그러면, 버퍼(208)는 파라미터 결정부(205)에서 매 프레임마다 결정된 시그모이드 함수의 파라미터를 임시 저장할 수 있다. 예를 들어, 버퍼(208)는 프레임 1에 해당하는 시그모이드 함수의 파라미터, 프레임 2에 해당하는 시그모이드 함수의 파라미터, 프레임 3에 해당하는 시그모이드 함수의 파라미터, ...,프레임 n에 해당하는 시그모이드 함수의 파라미터를 임시 저장할 수 있다.
이어, 파라미터 업데이트부(207)는 매 프레임마다 결정된 시그모이드 함수의 파라미터를 업데이트할 수 있다.
일례로, 판단부(201)에서 인코딩된 프레임이 손실 프레임이 아닌 것으로 판단한 경우, 파라미터 업데이트부(207)는 현재 프레임에 해당하는 시그모이드 함수의 파라미터를 손실 가정 디코딩 신호를 이용하여 결정된 시그모이드 함수의 파라미터로 업데이트할 수 있다. 다시 말해, 파라미터 업데이트부(207)는 위의 수학식 4에 기초하여 결정된 파라미터를 현재 프레임에 해당하는 시그모이드 함수의 파라미터로 업데이트할 수 있다.
그리고, 손실 프레임인 것으로 판단한 경우, 파라미터 업데이트부(207)는 버퍼(208)를 참조하여 현재 프레임에 해당하는 시그모이드 함수의 파라미터를 이전 프레임에 해당하는 시그모이드 함수의 파라미터로 업데이트할 수 있다.
예를 들어, 파라미터 업데이트부(207)는 아래의 수학식 5 내지 8에 기초하여 시그모이드 함수의 파라미터를 업데이트할 수 있다.
Figure pat00005
수학식 5에서,
Figure pat00006
는 아래의 수학식 6과 같이 표현될 수 있다.
Figure pat00007
수학식 6은 G를 α에 대해 미분한 값을 나타낼 수 있다.
이처럼, 파라미터 업데이트부(207)는 수학식 5 및 6에 기초하여 시그모이드 함수의 파라미터 α를 매 프레임마다 업데이트할 수 있다.
그리고, 파라미터 업데이트부(207)는 아래의 수학식 7 및 8에 기초하여 시그모이드 함수의 파라미터 β를 매 프레임마다 업데이트할 수 있다.
Figure pat00008
수학식 7에서,
Figure pat00009
는 아래의 수학식 8과 같이 표현될 수 있다.
Figure pat00010
수학식 8은 G를 β에 대해 미분한 값을 나타낼 수 있다.
이상의 수학식 1 내지 8에서 설명한 바와 같이, 시그모이드 함수의 파라미터는 최급강하법을 이용하여 비용함수를 최소화하도록 매 프레임마다 결정될 수 있다. 그러면, 파라미터 업데이트부(207)는 비용함수를 최소화시키도록 매 프레임마다 결정된 파라미터로 시그모이드 함수의 파라미터를 계속하여 업데이트할 수 있다. 그리고, 패킷 손실이 발생하지 않은 프레임에서 구해진 시그모이드 함수의 파라미터는, 패킷 손실이 발생한 프레임에서, 적응형 뮤팅을 위해 사용될 수 있다.
이때, 시그모이드 함수의 모양을 고려하여 n0는 150으로 기설정될 수 있으며, α 및 β는
Figure pat00011
Figure pat00012
범위 내에서 결정될 수 있다.
이처럼, 시그모이드 함수의 파라미터가 결정 및 업데이트되면, 뮤팅 게인 계산부(206)는 위의 수학식 2에 기초하여 뮤팅 게인을 계산할 수 있다. 그러면, 복원 신호 생성부(209)는 위의 수학식 1에 기초하여 복원 신호를 생성할 수 있다. 예를 들어, 복원 신호 생성부(209)는 뮤팅 게인 G(n)과 손실 가정 디코딩 신호 ylpre(n)의 곱으로써 복원 신호 yl(n)을 생성할 수 있다.
이때, 시그모이드 함수의 파라미터가 계속하여 업데이트됨에 따라, 뮤팅 게인 계산부(206)는 업데이트된 시그모이드 함수의 파라미터를 이용하여 뮤팅 게인 G(n)을 계산할 수 있다. 다시 말해, 뮤팅 게인 G(n)은 적응적인 값을 가질 수 있다. 이에 따라, 복원 신호 생성부(209)는 적응형 뮤팅 게인 G(n)을 손실 가정 디코딩 신호 ylpre(n)에 곱함에 따라 점차적으로 신호를 감쇄시켜 복원 신호를 생성할 수 있다. 이에 따라, 패킷 손실이 발생 시 손실 가정 디코딩 신호 ylpre(n)를 그대로 사용할 때 보다 적응형 뮤팅 게인을 이용하여 복원 신호를 생성하는 경우 기계음과 같은 불필요한 잡음이 감소 또는 제거될 수 있다.
도 3은 도 1의 LP 기반 피치 반복 수행부에서 복원 신호를 생성하는 과정을 나타내는 블록도이다.
도 3은 도 1의 과정 중 본 발명의 일실시예에 따른 패킷손실은닉 및 최급강하법을 적용하여 복원 신호를 생성하는 과정을 나타내는 블록도이다.
도 3에 따르면, 패킷 손실이 발생하지 않은 이전 프레임 Zl(n)을 이용하여 현재 프레임에 해당하는 복원 신호 yl(n)가 생성될 수 있다. 이때, LP 분석(LP analysis, 301)는 이전 프레임 Zl(n)을 대상으로 선형 예측 분석을 수행하여 LPC 계수를 추출하여 사용할 수 있다. 그리고, LTP 분석(LTP analysis, 302)는 이전 프레임 Zl(n)의 피치 구간 T0를 추출하고, 신호 분류부(signal classification, 303)은 이전 프레임 Zl(n)의 클래스(class)를 추출할 수 있다.
그러면, 수정 및 피치 반복부(Modification/pitch repetition, 304)는 LPC 계수, 클래스(class) 및 피치 구간 T0를 이용하여 수정 가정 디코딩 신호 ylpre(n)를 생성할 수 있다. 여기서, LP 분석(LP analysis, 301), LTP 분석(LTP analysis, 302), 신호 분류부(signal classification, 303), 수정 및 피치 반복부(Modification/pitch repetition, 304)는 도 2의 손실 가정 디코딩 신호 생성부에 포함될 수 있다.
그리고, 뮤팅 팩터 계산부(muting factor computation, 305)는 시그모이드 함수의 파라미터를 프레임마다 결정하여 업데이트하고, 업데이트된 파라미터를 이용하여 뮤팅 게인을 적응적으로 계산할 수 있다. 여기서, 뮤팅 팩터 계산부(305)는 도 2의 뮤팅 처리부(204)에 해당할 수 있다.
이어, 복원 신호 생성부(306)는 적응형 뮤팅 게인을 손실 가정 디코딩 신호 ylpre(n)에 곱함에 따라 복원 신호 yl(n)을 생성할 수 있다. 복원 신호 생성부(306)는 적응형 뮤팅 게인을 이용함에 따라 피치의 주기적인 반복으로 인해 생성되는 불필요한 잡음을 감소 또는 제거시켜 복원 신호를 생성할 수 있다.
도 4는 본 발명의 일실시예에 따라 패킷손실은닉 및 최급강하법을 이용하여 복원 신호를 생성하는 동작을 설명하기 위해 제공되는 흐름도이다.
도 4에서, 복원 신호를 생성하는 동작은 도 2의 적응형 뮤팅 시스템에 의해 수행될 수 있다.
먼저, 401 단계에서, 적응형 뮤팅 시스템(200)은 G.722 인코더에서 인코딩된 프레임을 수신할 수 있다.
이어, 402 단계에서, 적응형 뮤팅 시스템(200)은 인코딩된 프레임이 패킷 손실이 발생한 손실 프레임인지 여부를 판단할 수 있다.
이때, 손실 프레임이 아닌것으로 판단된 경우(402: No), 403 단계에서, 적응형 뮤팅 시스템(200)은 인코딩된 프레임에 대해 노멀 디코딩(normal decoding)을 수행하여 디코딩 신호 dl(n)을 생성할 수 있다. 예를 들어, 적응형 뮤팅 시스템(200)은 G.722 디코딩을 수행할 수 있다. 그러면, 디코딩 신호 dl(n)은 깨끗한 신호로 desired signal일 수 있다.
이어, 404 단계에서, 적응형 뮤팅 시스템(200)은 최급강하법을 적용하기 위해 패킷 손실이 발생하지 않은 프레임에 패킷 손실이 발생한 것을 가정하고, LP 기반 피치 반복(LP based pitch repetition)을 수행할 수 있다. 예를 들어, 적응형 뮤팅 시스템(200)은 패킷 손실을 가정함에 따라 이전 프레임 Zl(n)에 대해 LP 기반 피치 반복(LP based pitch repetition)을 수행하여 손실 가정 디코딩 신호 ylpre(n)을 생성할 수 있다.
그러면, 405 단계에서, 적응형 뮤팅 시스템(200)은 손실 가정 디코딩 신호 ylpre(n)와 디코딩 신호 dl(n)을 이용하여 시그모이드 함수의 파라미터를 결정할 수 있다.
예를 들어, 적응형 뮤팅 시스템(200)은 위의 수학식 1 내지 5에 기초하여 디코딩 신호와 복원 신호 간의 차이를 나타내는 에러 신호가 최소 또는 감소되도록 시그모이드 함수의 파라미터를 결정할 수 있다. 이때, 적응형 뮤팅 시스템(200)은 프레임 마다 시그모이드 함수의 파라미터를 결정할 수 있다.
그러면, 406 단계에서, 적응형 뮤팅 시스템(200)은 결정된 시그모이드 함수의 파라미터를 프레임마다 업데이트할 수 있다.
그리고, 407 단계에서, 적응형 뮤팅 시스템(200)은 업데이트된 시그모이드 함수의 파라미터를 이용하여 뮤팅 게인을 계산할 수 있다. 이때, 시그모이드 함수의 파라미터가 매 프레임마다 업데이트됨에 따라, 적응형 뮤팅 시스템(200)은 적응적으로 뮤팅 게인 G(n)을 계산할 수 있다.
그러면, 408 단계에서, 적응형 뮤팅 시스템(200)은 적응형 뮤팅 게인 G(n)과 손실 가정 디코딩 신호 ylpre(n)을 이용하여 복원 신호를 생성할 수 있다.
예를 들어, 적응형 뮤팅 시스템(200)은 적응형 뮤팅 게인 G(n)과 손실 가정 디코딩 신호 ylpre(n)을 곱함에 따라 복원 신호 yl(n)을 생성할 수 있다.
이처럼, 적응형 뮤팅 시스템(200)은 패킷 손실이 발생하지 않은 경우에도 패킷 손실이 발생한 것으로 가정하고 시그모이드 함수의 파라미터를 계속하여 업데이트하여 뮤팅 게인을 적응적으로 계산할 수 있다.
이때, 패킷 손실이 발생한 경우, 다시 말해, 인코딩된 프레임이 손실 프레임으로 판단된 경우(402: YES), 적응형 뮤팅 시스템(200)은 이전 프레임에 해당하는 시그모이드 함수의 파라미터를 이용하여 뮤팅 게인을 계산할 수 있다. 여기서, 이전 프레임은, 손실 프레임 이전에 수신되어 패킷 손실이 발생하지 않은 프레임에 해당할 수 있다.
예를 들어, 적응형 뮤팅 시스템(200)은 버퍼를 참조하여 패킷 손실이 발생하지 않은 이전 프레임에 해당하는 시그모이드 함수의 파라미터를 패킷 손실이 발생한 현재 프레임에 해당하는 시그모이드 함수의 파라미터로 결정하여 파라미터를 업데이트할 수 있다. 그리고, 409 단계에서, 적응형 뮤팅 시스템(200)은 업데이트된 현재 프레임에 해당하는 시그모이드 함수의 파라미터를 이용하여 뮤팅 게인을 계산할 수 있다.
이처럼, 패킷 손실이 발생한 경우, 적응형 뮤팅 시스템(200)은 패킷 손실이 발생하지 않은 이전 프레임에 해당하는 시그모이드 함수의 파라미터를 이용함에 따라, 뮤팅 게인을 적응적으로 계산할 수 있다. 그리고, 적응형 뮤팅 시스템(200)은 계산된 적응형 뮤팅 게인과 손실 가정 디코딩 신호를 이용하여 복원 신호를 생성함에 따라, 기계음과 같은 불필요한 잡음을 제거하여 복원 신호를 생성할 수 있다.
도 5는 본 발명의 일실시예에 따른 뮤팅 게인을 이용하여 생성된 복원 신호의 파형을 도시한 도면이다.
도 5에서, 성능을 검증하기 위해 NTT 데이터 베이스의 음성 파일을 사용하였으며, 501은 뮤팅을 동작하지 않고 복원 신호를 생성한 경우의 파형, 502는 표준에서 정의한 뮤팅 방법에 따라 복원 신호를 생성한 경우의 파형, 503은 본 발명에서 제안하는 적응형 뮤팅 게인을 이용하여 복원 신호를 생성한 경우의 파형이다.
도 5에서는, 뮤팅의 중요성을 확인하기 위해 뮤팅이 동작하지 않을 때의 파형 역시 포함하고 있다(501). 도 5에서, 0 내지 0.01초 구간은 패킷 손실이 발생하지 않은 구간이고, 0.01 내지 0.05초 구간은 패킷 손실이 발생한 구간에 해당한다. 이때, 501 내지 503 에서 복원 신호 yl(n)와 원하는 신호 dl(n)를 비교해 보면, 본 발명에 따른 뮤팅 게인을 이용하여 복원 신호를 생성한 503이 복원 신호가 원하는 신호와 가장 비슷하게 복원된 것을 확인할 수 있다. 여기서, 원하는 신호는 디코딩된 신호일 수 있다.
또한, 도 5의 501을 참고하면, 뮤팅이 동작하지 않을 때는 동일 파형이 같은 피치 주기로 반복되면서 불필요한 잡음 및 기계음이 발생하는 것을 확인할 수 있다. 그리고, 502를 참고하면, 표준에 따른 뮤팅 방법은 본 발명의 일실시예에 따른 적응형 뮤팅 방법보다 뮤팅이 더 많이 된 것을 확인할 수 있다.
아래의 표 1은 여러 가지 패킷 손실률에 대해 객관적인 음성품질평가 지표인 segmental SNR, PESQ, Cov1에 대한 결과와 주관적 음성 품질평가 지표인 MOS에 대한 결과를 나타내고 있다. MOS 실험을 위해 총 10명의 참가자가 각자 주관적으로 1점부터 5점까지 음성 품질에 대한 점수를 매기었다.
패킷손실률 음질평가지표 비교 알고리즘
기존 표준에 따른 뮤팅 방법 알고리즘 본 발명에 따른 적응형 뮤팅 방법
3% Seg. SNR 24.37 24.42
PESQ 3.40 3.42
Covl 3.69 3.80
MOS 3.39 3.45
6% Seg. SNR 21.08 21.14
PESQ 3.01 3.13
Covl 3.34 3.57
MOS 3.13 3.19
10% Seg. SNR 17.73 17.83
PESQ 2.76 2.92
Covl 2.86 3.21
MOS 2.64 2.80
15% Seg. SNR 13.21 13.36
PESQ 2.32 2.55
Covl 2.41 2.76
MOS 2.16 2.36
표 1에 따르면, 본 발명의 일실시예에 따른 적응형 뮤팅 방법이 표준에서 정의하고 있는 뮤팅 방법보다 효과적으로 뮤팅을 수행하고 있음을 확인할 수 있다. 이는, 최급강하법을 이용하여 결정된 시그모이드 함수의 파라미터가 뮤팅에 최적화되어 있음을 나타낼 수 있다. 이처럼, 뮤팅에 최적화된 시그모이드 함수의 파라미터를 이용하여 뮤팅을 수행하여 복원 신호를 생성함에 따라, 기계음 등의 잡음이 제거 또는 감소되어 음성 품질이 향상될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다.  예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (8)

  1. G.722 인코더에서 인코딩된 프레임을 노멀 디코딩(normal decoding) 디코딩하여 디코딩 신호를 생성하는 디코딩 신호 생성부;
    상기 인코딩된 프레임 이전에 수신되어 패킷 손실이 발생하지 않은 이전 프레임에 대해 선형 예측 기반 피치 반복(Linear Prediction based Pitch Repetition)을 수행하여 손실 가정 디코딩 신호를 생성하는 손실 가정 디코딩 신호 생성부; 및
    상기 디코딩 신호와 상기 손실 가정 디코딩 신호를 이용하여 시그모이드 함수의 파라미터를 결정하는 파라미터 결정부
    를 포함하는 것을 특징으로 하는 적응형 뮤팅 시스템.
  2. 제1항에 있어서,
    상기 시그모이드 함수의 파라미터는,
    최급강하법(Steepest Descent Criterion))을 이용하여 매 프레임마다 결정되어 업데이트되는 것을 특징으로 하는 적응형 뮤팅 시스템.
  3. 제1항에 있어서,
    상기 인코딩된 프레임이 손실 프레임인지 여부를 판단하는 판단부; 및
    상기 손실 프레임이 아닌 것으로 판단됨에 따라, 현재 프레임에 해당하는 시그모이드 함수의 파라미터를 상기 손실 가정 디코딩 신호를 이용하여 결정된 시그모이드 함수의 파라이터로 업데이트하고, 상기 손실 프레임으로 판단됨에 따라, 현재 프레임에 해당하는 시그모이드 함수의 파라미터를 이전 프레임에 해당하는 시그모이드 함수의 파라미터로 업데이트하는 파라미터 업데이트부
    를 더 포함하는 것을 특징으로 하는 적응형 뮤팅 시스템.
  4. 제1항에 있어서,
    상기 인코딩된 프레임은, 패킷 손실이 발생하지 않은 프레임이고,
    상기 손실 가정 디코딩 신호 생성부는,
    상기 인코딩된 프레임에 패킷 손실이 발생한 것을 가정하고 상기 선형 예측 기반 피치 반복을 수행하는 것을 특징으로 하는 적응형 뮤팅 시스템.
  5. 제1항에 있어서,
    상기 파라미터 결정부는,
    상기 인코딩된 프레임을 복원한 복원 신호와 상기 디코딩 신호 간의 차이를 나타내는 에러 신호가 감소 또는 최소화되도록 상기 시그모이드 함수의 파라미터를 결정하는 것을 특징으로 하는 적응형 뮤팅 시스템.
  6. 제1항에 있어서,
    상기 시그모이드 함수의 파라미터를 이용하여 뮤팅 게인(muting gain)을 계산하는 뮤팅 게인 계산부; 및
    상기 뮤팅 게인과 상기 손실 가정 디코딩 신호를 이용하여 현재 프레임을 복원하는 복원 신호 생성부
    를 더 포함하는 것을 특징으로 하는 적응형 뮤팅 시스템.
  7. 제1항에 있어서,
    상기 손실 가정 디코딩 신호 생성부는,
    상기 인코딩 프레임에 포함된 로우 대역(lower band) 및 하이 대역(higher band) 신호 중 상기 로우 대역에 해당하는 신호에 대해 상기 선형 예측 기반 피치 반복을 수행하는 것을 특징으로 하는 적응형 뮤팅 시스템.
  8. G.722 인코더에서 인코딩된 프레임을 노멀 디코딩(normal decoding) 디코딩하여 디코딩 신호를 생성하는 단계;
    상기 인코딩된 프레임 이전에 수신되어 패킷 손실이 발생하지 않은 이전 프레임에 대해 선형 예측 기반 피치 반복(Linear Prediction based Pitch Repetition)을 수행하여 손실 가정 디코딩 신호를 생성하는 단계; 및
    상기 디코딩 신호와 상기 손실 가정 디코딩 신호를 이용하여 시그모이드 함수의 파라미터를 결정하는 단계
    를 포함하는 것을 특징으로 하는 적응형 뮤팅 방법.
KR1020140082514A 2014-07-02 2014-07-02 G.722 코덱 패킷손실은닉 및 최급강하법을 이용한 적응형 뮤팅 시스템 및 방법 KR101591597B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140082514A KR101591597B1 (ko) 2014-07-02 2014-07-02 G.722 코덱 패킷손실은닉 및 최급강하법을 이용한 적응형 뮤팅 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140082514A KR101591597B1 (ko) 2014-07-02 2014-07-02 G.722 코덱 패킷손실은닉 및 최급강하법을 이용한 적응형 뮤팅 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20160004462A true KR20160004462A (ko) 2016-01-13
KR101591597B1 KR101591597B1 (ko) 2016-02-19

Family

ID=55172418

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140082514A KR101591597B1 (ko) 2014-07-02 2014-07-02 G.722 코덱 패킷손실은닉 및 최급강하법을 이용한 적응형 뮤팅 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR101591597B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112634912A (zh) * 2020-12-18 2021-04-09 北京猿力未来科技有限公司 丢包补偿方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080002996A (ko) * 2005-04-22 2008-01-04 콸콤 인코포레이티드 이득 계수 평활화를 위한 시스템, 방법, 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080002996A (ko) * 2005-04-22 2008-01-04 콸콤 인코포레이티드 이득 계수 평활화를 위한 시스템, 방법, 및 장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112634912A (zh) * 2020-12-18 2021-04-09 北京猿力未来科技有限公司 丢包补偿方法及装置
CN112634912B (zh) * 2020-12-18 2024-04-09 北京猿力未来科技有限公司 丢包补偿方法及装置

Also Published As

Publication number Publication date
KR101591597B1 (ko) 2016-02-19

Similar Documents

Publication Publication Date Title
KR101290425B1 (ko) 소거된 스피치 프레임을 복원하는 시스템 및 방법
JP5186054B2 (ja) マルチステージコードブックおよび冗長コーディング技術フィールドを有するサブバンド音声コーデック
US8180632B2 (en) Method for limiting adaptive excitation gain in an audio decoder
JP4824734B2 (ja) 減衰率を取得する方法および装置
JP5289320B2 (ja) ピッチ周期訂正を用いたデジタルオーディオ信号の損失ブロックの合成
JP7297803B2 (ja) 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加
JP2004512561A (ja) 符号化音響信号の復号に関するエラー隠匿
JP7472154B2 (ja) 完全フレーム損失隠蔽および部分的フレーム損失隠蔽を含む、lc3隠蔽のためのデコーダおよび復号方法
KR101591626B1 (ko) 딥신경망에 기초한 패킷 손실 은닉 방법 및 장치
JP6694047B2 (ja) 個別の符号帳情報についての個別の置き換えlpc表現を用いたエラー隠し信号を生成する装置及び方法
RU2437170C2 (ru) Ослабление чрезмерной тональности, в частности, для генерирования возбуждения в декодере при отсутствии информации
JPH1055199A (ja) 音声符号化並びに復号化方法及びその装置
RU2660630C2 (ru) Устройство и способ для генерации сигнала маскирования ошибок с использованием индивидуальных замещающих представлений lpc для информации индивидуальных кодовых книг
US10672411B2 (en) Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy
KR20160096191A (ko) 음성/오디오 비트스트림 디코딩 방법 및 장치
RU2682927C2 (ru) Устройство обработки аудиосигнала, способ обработки аудиосигнала и программа обработки аудиосигнала
KR101591597B1 (ko) G.722 코덱 패킷손실은닉 및 최급강하법을 이용한 적응형 뮤팅 시스템 및 방법
ES2659182T3 (es) Aparato y método para procesar una señal codificada y codificador y método para generar una señal codificada
JP6718670B2 (ja) Adpcmコーデックでのパケット損失隠蔽方法及びplc回路を備えるadpcm復号器
JP2016105168A5 (ko)
KR101551236B1 (ko) 패킷 손실 은닉에서의 적응형 뮤팅 방법
KR20220006510A (ko) 사운드 신호에 있어서의 어택을 검출하고 검출된 어택을 코딩하는 방법들 및 디바이스들
CN115428069A (zh) 低音后置滤波器的低成本适配
Carmona et al. Dealing with acoustic noise and packet loss in VoIP recognition systems

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee