KR100612889B1 - 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치 - Google Patents

선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치 Download PDF

Info

Publication number
KR100612889B1
KR100612889B1 KR1020050010992A KR20050010992A KR100612889B1 KR 100612889 B1 KR100612889 B1 KR 100612889B1 KR 1020050010992 A KR1020050010992 A KR 1020050010992A KR 20050010992 A KR20050010992 A KR 20050010992A KR 100612889 B1 KR100612889 B1 KR 100612889B1
Authority
KR
South Korea
Prior art keywords
frame
converting
spectral envelope
line spectrum
spectrum pair
Prior art date
Application number
KR1020050010992A
Other languages
English (en)
Other versions
KR20060090457A (ko
Inventor
성호상
최승호
주기현
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020050010992A priority Critical patent/KR100612889B1/ko
Priority to EP06250603A priority patent/EP1688916A3/en
Priority to JP2006028177A priority patent/JP2006215569A/ja
Priority to US11/347,429 priority patent/US7765100B2/en
Publication of KR20060090457A publication Critical patent/KR20060090457A/ko
Application granted granted Critical
Publication of KR100612889B1 publication Critical patent/KR100612889B1/ko
Priority to US12/659,943 priority patent/US8214203B2/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders

Abstract

본 발명은 음성 복호화에서 프레임 손실 시, 스펙트럼 영역에서 선스펙트럼 쌍(Line Spectrum Pair) 파라미터를 복원하는 방법 및 장치와 그 음성 복호화 장치에 관한 것으로, 본 발명에 따른 방법은, 음성 복호화 시, 소거된 프레임이 존재하는 것으로 판단되면, 소거된 프레임의 이전 또는 이전과 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 1 변환 단계; 제 1 변환 단계에 의해 얻어진 스펙트럼 포락선들을 이용하여 소거된 프레임의 스펙트럼 포락선을 복원하는 단계; 및 복원된 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터 영역으로 변환하는 제 2 변환 단계를 포함함으로써, 음성 복호화 시, 복원된 음성신호의 질을 향상시키면서 다양한 기술에 적용이 가능하고, 알고리즘 개발이 용이한 선스펙트럼 쌍 파라미터 복원 기술을 제공할 수 있다.

Description

선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성 복호화 장치{Method and apparatus for recovering line spectrum pair parameter and speech decoding apparatus thereof}
도 1은 기존의 선스펙트럼 쌍 파라미터 복원 방법의 일 예이다.
도 2는 기존의 선스펙트럼 쌍 파라미터 복원 방법의 다른 예이다.
도 3은 본 발명의 바람직한 일 실시 예에 따른 선스펙트럼 쌍 파라미터 복원 장치를 포함하는 음성 복호화 장치의 기능 블록 도이다.
도 4는 도 3에 도시된 프레임 소거 은닉 유니트의 일 실시 예이다.
도 5는 도 3에 도시된 프레임 소거 은닉 유니트의 다른 실시 예이다.
도 6은 도 5에서의 본 발명에 따른 선스펙트럼 쌍 파라미터 복원 장치의 동작 개념도이다.
도 7은 도 3에 도시된 프레임 소거 은닉 유니트의 또 다른 실시 예이다.
도 8은 도 7의 복원 유니트에서 수행되는 DFW에 의한 워핑경로와 워핑 범위에 대한 예시도이다.
도 9는 본 발명의 바람직한 또 다른 실시 예에 따른 선스펙트럼 쌍 파라미터 복원 방법의 동작 흐름도이다.
도 10은 본 발명의 바람직한 또 다른 실시 예에 따른 선스펙트럼 쌍 파라미 터 복원 방법의 동작 흐름도이다.
본 발명은 음성 복호화(speech decoding) 시 선스펙트럼 쌍(Line Spectrum Pair, 이하 LSP라고 약함) 파라미터 복원 방법 및 장치에 관한 것으로, 더욱 상세하게는 프레임 손실 시 LSP 파라미터를 복원하는 방법 및 장치과 그 음성 복호화 장치에 관한 것이다.
대역폭이 제한된 전송 환경에서도 데이터 전송을 가능하게 하기 위하여, 최근의 음성 부호화 장치는 음성 신호를 직접 전송하는 대신 음성신호를 대표하는 파라미터들을 추출하고, 추출된 파라미터를 부호화하고, 부호화된 파라미터를 포함하는 음성 패킷을 생성한다. 이에 따라 음성 복호화 장치는 수신된 음성 패킷에 포함되어 있는 파라미터를 복호화하고, 복호화 된 파라미터를 이용하여 복원된 음성 신호를 생성한다.
LSP 파라미터는 상기 음성신호를 대표하는 파라미터들중 하나이다. LSP 파라미터는 음성의 주파수 특성과 밀접하게 연관되기 때문에, 부호화 특성이 좋은 파라미터이다. 따라서 최근에 개발된 음성 부호화 및 복호화 장치들은 대부분 LSP 파라미터를 생성하고, 생성된 LSP 파라미터를 부호화하고, 이를 복호화 하는 방법을 사용하고 있다.
그러나, 수신되는 과정에서 발생되는 음성 패킷 오류를 제거하기 위하여, 대 부분의 음성 부호화 및 복호화 장치들은 수신되는 음성 패킷을 검사하고, 패킷 오류가 발생된 것으로 판단되면, 해당 패킷을 소거하는 기능을 갖고 있다. 이 패킷 소거 기능으로 인하여 LSP와 같은 파라미터가 손실되어 복원되는 음성 신호가 단절(breaking)되는 현상이 발생된다.
이러한 문제를 해결하기 위하여, 음성 복호화 시 손실된 LSP 파라미터를 복원하기 위한 기술이 제안되었다.
도 1은 ITU(International Telecommunication Union) G.729 표준에 제안된 LSP 파라미터 복원 방법이다. 도 1은 이전의 정상 프레임(Previous Good Frame, 이하 PGF라고 약함)에서의 LSP 파라미터(LSP(m))(또는 LSP 벡터)를 수정하지 않고 L개의 소거 프레임의 LSP 파라미터로 사용하는 외삽(extrapolation) 방법이다.
그러나, 이 방법은 L개의 프레임기간동안 동일한 음성 신호가 복원되므로, L개의 소거 프레임을 토대로 복원된 음성신호와 다음 정상 프레임(Next Good Frame, 이하 NGF라고 약함)을 토대로 복원된 음성신호간의 연속성이 떨어진다.
도 2는 기존의 LSP 파라미터 복원 방법의 다른 예이다. 도 2는 PGF와 L개의 프레임 소거 후 처음으로 수신되는 다음 정상 프레임(Next Good Frame, 이하 NGF라고 약함)의 LSP 파라미터를 모두 사용하는 내삽(interpolation) 방식으로 LSP 파라미터를 복원한다.
도 2에서 w는 가중치이다. 가중치 w는 소거된 프레임 개수 및 소거된 프레임의 전송 위치가 PGF에 근접한지 NGF에 근접한 지에 따라 0부터 1사이의 값 중 하나로 정의된다. 따라서, PGF와 NGF의 LSP 파라미터를 이용하여 생성된 L개의 소거 프 레임의 LSP 파라미터는 서로 다른 값(LSP(m+1),..., LSP(m+x), ..., LSP(m+L))을 갖는다.
그러나, 도 2와 같은 복원 방식은 LSP 파라미터 영역에서 처리됨으로 스펙트럼을 정의하기 어렵다. 따라서 다양한 기술 개발에 적용할 수 없고, 알고리즘 개발이 어렵다.
본 발명이 이루고자 하는 기술적 과제는 음성 복호화에서 프레임 손실 시, 스펙트럼 영역에서 선스펙트럼 쌍(Line Spectrum Pair) 파라미터를 복원하는 방법 및 장치와 그 음성 복호화 장치를 제공하는데 있다.
상술한 기술적 과제들을 달성하기 위하여 본 발명은, 음성 복호화 시 선스펙트럼 쌍 파라미터 복원 방법에 있어서, 소거된 프레임이 존재하는 것으로 판단되면, 상기 소거된 프레임의 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 1 변환 단계; 상기 제 1 변환 단계에 의해 얻어진 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 단계; 및 상기 복원된 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터 영역으로 변환하는 제 2 변환 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법을 제공한다.
상술한 기술적 과제들을 달성하기 위하여 본 발명은, 음성 복호화 시 선스펙트럼 쌍 파라미터 복원 방법에 있어서, 소거된 프레임이 존재하는 것으로 판단되 면, 상기 소거된 프레임의 이전 정상 프레임의 선스펙트럼 쌍 파라미터와 상기 소거된 프레임의 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 각각 스펙트럼 영역으로 변환하는 제 1 변환 단계; 상기 제 1 변환단계에서 얻어진 상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터에 대한 스펙트럼 포락선과 상기 다음 정상 프레임의 선스펙트럼 쌍 파라미터에 대한 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 단계; 상기 복원된 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터 영역으로 변환하는 제 2 변환 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법을 제공한다.
상술한 기술적 과제들을 달성하기 위하여 본 발명은, 음성 복호화 시 선스펙트럼 쌍 파라미터 복원 장치에 있어서, 소거된 프레임이 존재하는 것으로 판단되어 이전 정상 프레임의 선스펙트럼 쌍 파라미터가 입력되면, 상기 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 1 변환부; 상기 제 1 변환부에서 출력되는 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 스펙트럼 복원부; 및 상기 스펙트럼 복원부에서 복원된 상기 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터로 변환하는 제 2 변환부를 포함하는 선스펙트럼 쌍 파라미터 복원 장치를 제공한다.
상술한 기술적 과제들을 달성하기 위하여 본 발명은, 음성 복호화 시 선스펙트럼 쌍 파라미터 복원 장치에 있어서, 소거된 프레임이 존재하는 것으로 판단되면, 상기 소거된 프레임의 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 1 변환부; 상기 소거된 프레임이 소거된 것으로 판단되면, 상기 소거된 프레임의 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 2 변환부; 상기 제 1 변환부에서 얻어진 상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터의 스펙트럼 포락선과 상기 제 2 변환부에서 얻어진 상기 다음 정상 프레임의 선스펙트럼 쌍 파라미터의 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 복원 유니트; 상기 복원 유니트에서 복원된 상기 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터 영역으로 변환하는 제 3 변환부를 포함하는 선스펙트럼 쌍 파라미터 복원 장치를 제공한다.
상술한 기술적 과제들을 달성하기 위하여 본 발명은, 음성 복호화 장치에 있어서, 현재 프레임의 파라미터들을 디코딩하여 여기 신호를 출력하는 여기신호 디코딩부; 상기 현재 프레임의 선스펙트럼 쌍 파라미터를 디코딩하는 선스펙트럼 쌍 파라미터 디코딩부; 수신되는 부호화된 음성 패킷에 소거된 프레임이 존재하면, 상기 소거된 프레임의 소거를 은닉할 수 있도록, 상기 소거된 프레임의 이전 정상 프레임의 파라미터들 또는 이전 정상 프레임과 다음 정상 프레임의 파라미터들을 이용하여 상기 소거된 프레임의 선스펙트럼 쌍 파라미터와 여기 신호를 복원하는 프레임 소거 은닉 유니트; 상기 수신된 부호화된 음성 패킷에 소거 프레임이 존재하지 않으면, 현재 프레임의 파라미터들을 상기 여기 신호 디코딩부와 상기 선스펙트럼 쌍 파라미터 디코딩부로 각각 전송하고, 상기 수신된 부호화된 음성 패킷에 소거 프레임이 존재하면, 상기 이전 정상 프레임 또는 이전 정상 프레임과 다음 정상 프레임의 파라미터들을 상기 프레임 소거 은닉 유니트로 전송하는 파라미터 전송 부; 상기 선스펙트럼 쌍 파라미터 디코딩부로부터 전송되는 디코딩된 선스펙트럼 쌍 파라미터와 상기 프레임 소거 은닉 유니트로부터 출력되는 선스펙트럼 쌍 파라미터중 하나를 선형 예측 계수(LPC)로 변환하는 변환부; 및 상기 여기신호 디코딩부로부터 출력되는 여기신호와 상기 프레임 소거 은닉 유니트로부터 출력되는 여기신호중 한 신호가 입력되면, 상기 변환부로부터 출력되는 선형 예측 계수를 이용하여 합성된 음성신호를 출력하는 합성 필터를 포함하는 음성 복호화 장치.
이하, 첨부된 도면을 참조하여 본 발명에 따른 실시 예를 상세히 설명하기로 한다.
도 3은 본 발명의 바람직한 일 실시 예에 따른 선스펙트럼 쌍 파라미터 복원 장치를 포함하는 음성 복호화 장치의 기능 블록 도이다. 도 3을 참조하면, 상기 음성 복호화 장치는, 파라미터 전송부(310), 여기 신호(excitation signal) 디코딩부(320), 선스펙트럼 쌍(Line Spectrum Pair, 이하 LSP라고 약함) 디코딩부(330), LSP/LPC(Linear Prediction Coefficient, 이하 LPC라고 약함) 변환부(340), 합성 필터(350), 및 프레임 소거 은닉(frame erasure concealment) 유니트(360)를 포함한다.
파라미터 전송부(310)로 입력되는 부호화된 음성 패킷은 오류 검사가 수행된 패킷이다. 따라서, 상기 입력되는 부호화된 음성 패킷은 오류가 발생된 프레임이 소거된 상태이다.
파라미터 전송부(310)는 입력되는 부호화된 음성 패킷을 프레임단위로 체크하여 프레임 소거(또는 손실) 여부를 판단한 결과에 따라 음성 패킷에 포함되어 있 는 파라미터들을 전송한다. 비트열 오류로 인해 패킷이 소거된 것으로 판단되거나 일정 시간동안 패킷이 수신되지 않으면, 파라미터 전송부(310)는 수신되지 않는 구간의 프레임이 소거된 것으로 판단할 수 있다.
입력되는 부호화된 음성 패킷이 정상 프레임이면, 파라미터 전송부(310)는 수신된 음성 패킷에 포함되어 있는 파라미터들중 여기신호를 디코딩하기 위해 필요한 파라미터들을 여기 신호 디코딩부(320)로 전송하고, 10개의 근(roots)을 갖는 LSP 파라미터(또는 LSP 계수)를 LSP 디코딩부(330)로 전송한다.
상기 음성 복호화 장치가 CELP(Code-Excited Linear Predicton) 형이면, 상기 여기 신호를 디코딩하기 위해 필요한 파라미터들은 적응 코드북(adative codebook)에서 이용되는 피치(pitch), 고정 코드북(fixed codebook)에서 이용되는 코드북 인덱스, 적응 코드북의 이득값(gp), 고정 코드북의 이득값(gc)을 포함할 수 있다.
여기 신호 디코딩부(320)는 입력되는 파라미터들을 디코딩하여 여기 신호를 출력한다. 출력되는 여기신호는 합성 필터(350)로 전송된다. LSP 디코딩부(330)는 입력되는 LSP 파라미터를 디코딩한다. 디코딩된 LSP 파라미터는 LSP/LPC변환부(340)로 전송된다. LSP/LPC 변환부(340)는 디코딩된 LSP 파라미터를 LPC 파라미터로 변환한다. 변환된 LPC 파라미터는 합성 필터(350)로 전송된다.
합성 필터(350)는 LPC 파라미터를 이용하여 여기 신호를 합성 필터링하고, 합성된 음성신호(synthesis speech)를 출력한다. 상기 합성된 음성신호는 복원된 음성신호이다.
그러나, 프레임이 소거된 것으로 판단되면, 소거된 프레임(또는 손실된 프레임)의 LSP 파라미터를 복원하기 위하여 파라미터 전송부(310)는 이전 정상 프레임(Previous Good Frame, 이하 PGF라고 약함)의 LSP 파라미터 또는 PGF의 LSP 파라미터와 다음 정상 프레임(Next Good Frame, 이하 NGF라고 약함)의 LSP 파라미터, 및 여기 신호를 복원할 수 있는 파라미터들을 프레임 소거 은닉 유니트(360)로 전송한다.
프레임 소거 은닉 유니트(360)는 여기 신호를 복원하면서 외삽 방식과 내삽 방식중 어느 한 방식에 의해 소거된 프레임의 LSP 파라미터를 복원할 수 있다.
외삽방식에 의해 소거된 프레임의 LSP 파라미터를 복원할 경우에, 프레임 소거 은닉 유니트(360)는 도 4에 도시된 바와 같이 구성될 수 있다. 도 4를 참조하면, 프레임 소거 은닉 유니트(360)는 여기 신호 복원부(401), LSP/스펙트럼 변환부(402), 스펙트럼 복원부(403), 및 스펙트럼/LSP 변환부(404)를 포함한다.
여기신호 복원부(401)는 파라미터 전송부(310)로부터 전송되는 PGF의 여기신호 생성을 위한 파라미터들을 수신하고, 수신된 파라미터들을 이용하여 소거된 프레임의 여기 신호를 복원한다. 여기신호 복원부(401)는 예를 들어, ITU G.729 표준에 의거하여 여기 신호를 복원할 수 있다. 복원된 여기 신호는 합성 필터(350)로 전송된다.
LSP/스펙트럼 변환부(402)는 파라미터 전송부(310)로부터 PGF의 10개의 근을 갖는 LSP 파라미터가 수신되면, 수신된 LSP 파라미터를 스펙트럼 영역으로 변환하 여 PGF의 스펙트럼 포락선(spectrum envelope)을 얻는다. PGF의 스펙트럼 포락선은 스펙트럼 복원부(403)로 전송된다.
스펙트럼 복원부(403)는 상기 PGF들의 스펙트럼 포락선을 사전에 설정된 방식에 의해 변형하여 소거된 프레임의 스펙트럼 포락선을 복원한다. 상기 소거된 프레임은 현재 프레임으로 정의될 수 있다. 상기 사전에 설정된 방식은, 예를 들어, 사전에 설정된 영역으로 스펙트럼 포락선을 스펙트럴 시프팅(spectral shifting)하도록 정의될 수 있다. 상기 사전에 설정된 영역은 저주파 또는 고주파 영역으로 점차적으로 시프트할 수 있는 영역이다.
스펙트럼 복원부(403)는 상기 PGF의 스펙트럼 포락선을 부드럽게 변화시키는(spectrum smoothing) 방식으로 소거된 프레임의 스펙트럼 포락선을 복원할 수 있다.
또는 스펙트럼 복원부(403)는 소거된 프레임과 PGF간의 상관관계를 토대로 결정된 가중치를 이용하여 상기 PGF의 스펙트럼 포락선을 변형시키고, 변형된 스펙트럼 포락선을 상기 소거된 프레임의 복원된 스펙트럼 포락선으로 출력할 수 있다.
상기 소거된 프레임의 스펙트럼 포락선이 입력되면, 스펙트럼/LSP 변환부(404)는 상기 소거된 프레임의 스펙트럼 포락선을 LSP 파라미터로 변환한다. 스펙트럼/LSP 변환부(404)로부터 출력되는 LSP 파라미터는 LSP/LPC변환부(340)로 전송한다.
LSP/스펙트럼 변환부(402)는 입력되는 PGF의 LSP 파라미터를 LPC 파라미터로 변환하고, LPC 파라미터를 켑스트럼(Cepstrum)으로 변환하고, 변환된 켑스트럼을 스펙트럼 영역으로 변환하도록 구성될 수 있다. 만약 LSP/스펙트럼 변환부(402)가 이와 같이 구성되면, 스펙트럼/LSP 변환부(404)는 소거된 프레임의 복원된 스펙트럼 포락선을 켑스트럼으로 변환하고, 켑스트럼을 LPC 파라미터로 변환하고, LPC 파라미터를 LSP 파라미터로 변환하도록 구성된다.
또한, LSP/스펙트럼 변환부(402)는 입력된 PGF의 LSP 파라미터를 LPC 파라미터로 변환하고, LPC 파라미터를 스펙트럼 영역으로 변환하도록 구성될 수 있다. 이에 대해 스펙트럼/LSP 변환부(404)는 소거된 프레임의 복원된 스펙트럼 포락선을 ACC(Auto-Correlation Coefficients, 이하 ACC라고 약함) 파라미터로 변환하고, ACC 파라미터를 LPC 파라미터로 변환하고, LPC 파라미터를 LSP 파라미터로 변환하도록 구성된다.
LSP/스펙트럼 변환부(402)는 입력된 PGF의 LSP 파라미터를 LPC 파라미터로 변환하고, LPC 파라미터를 켑스트럼으로 변환하고, 켑스트럼을 스펙트럼 영역으로 변환하도록 구성할 수 있다. 이에 대해 스펙트럼/LPC 변환부(404)는 소거된 프레임의 복원된 스펙트럼 포락선을 ACC 파라미터로 변환하고, ACC 파라미터를 LPC 파라미터로 변환하고, LPC 파라미터를 LSP 파라미터로 변환하도록 구성된다.
LSP/스펙트럼 변환부(402)는 입력되는 PGF의 LSP 파라미터를 의사 켑스트럼(Pseudo_cepstrum, PCEP)으로 변환하고, 이를 스펙트럼 영역으로 변환하도록 구성할 수 있다. 이에 대해 스펙트럼/LSP 변환부(404)는 소거된 프레임의 복원된 스펙트럼 포락선을 PCEP로 변환하고, PCEP를 LSP 파라미터로 변환하도록 구성된다.
도 4에서 본원 발명에 따른 소거된 프레임의 LSP 파라미터 복원 장치는 LSP/ 스펙트럼 변환부(402), 스펙트럼 복원부(403), 및 스펙트럼/LSP 변환부(404)를 포함하는 것으로 정의할 수 있다.
한편, 여기 신호를 복원하면서 내삽방식으로 손실된 프레임의 LSP 파라미터를 복원할 경우에, 프레임 소거 은닉 유니트(360)는 도 5에 도시된 바와 같이 구성될 수 있다.
도 5를 참조하면, 프레임 소거 은닉 유니트(360)는 여기신호 복원부(501), 제 1 LSP/스펙트럼 변환부(502), 제 2 LSP/스펙트럼 변환부(503), 복원 유니트(504), 및 스펙트럼/LSP 변환부(505)를 포함한다.
도 5에서 본원 발명에 따른 소거된 프레임의 LSP 파라미터 복원 장치는 제 1 LSP/스펙트럼 변환부(502), 제 2 LSP/스펙트럼 변환부(503), 복원 유니트(504), 및 스펙트럼/LSP 변환부(505)를 포함할 수 있다.
여기신호 복원부(501)는 파라미터 전송부(310)로부터 전송되는 PGF와 NGF의 여기신호 생성을 위한 파라미터들을 각각 수신하고, 수신된 파라미터들을 이용하여 소거된 프레임의 여기 신호를 복원한다. 여기신호 복원부(501)는 예를 들어, ITU G.729 표준에 의거하여 여기 신호를 복원할 수 있다. 복원된 여기 신호는 합성 필터(350)로 전송된다.
제 1 LSP/스펙트럼 변환부(502)는 파라미터 전송부(310)로부터 PGF의 10개의 근을 갖는 LSP 파라미터가 수신되면, 수신된 PGF의 LSP 파라미터를 스펙트럼 영역으로 변환하여 PGF의 스펙트럼 포락선(spectrum envelope)을 얻는다. 이 때, 제 1 LSP/스펙트럼 변환부(502)는 도 4의 LSP/스펙트럼 변환부(402)에서 설명한 바와 같 은 4가지 변환 방식중 하나의 방식으로 LSP 파라미터를 스펙트럼 영역으로 변환시킬 수 있다. 얻어진 PGF의 스펙트럼 포락선은 복원 유니트(504)로 전송된다.
제 2 LSP/스펙트럼 변환부(503)는 파라미터 전송부(310)로부터 NGF의 10개의 근을 갖는 LSP 파라미터가 수신되면, 수신된 NGF의 LSP 파라미터를 스펙트럼 영역으로 변환하여 NGF의 스펙트럼 포락선(spectrum envelope)을 얻는다. 이 때, 제 2 LSP/스펙트럼 변환부(503)는 도 4의 LSP/스펙트럼 변환부(402)에서 설명한 바와 같은 4가지 변환 방식중 하나의 방식으로 LSP 파라미터를 스펙트럼 영역으로 변환시킬 수 있다. 그러나 제 1 LSP/스펙트럼 변환부(502)와 제 2 LSP/스펙트럼 변환부(503)의 변환 방식은 동일하게 정의된다. 제 2 LSP/스펙트럼 변환부(503)에 의해 얻어진 NGF의 스펙트럼 포락선은 복원 유니트(504)로 전송된다.
복원 유니트(504)는 제 1 스펙트럼 포락선 변형부(506), 제 2 스펙트럼 포락선 변형부(507), 및 혼합부(508)를 포함한다.
제 1 스펙트럼 포락선 변형부(506)는 PGF와 소거된 프레임간의 상관 관계와 소거된 프레임과 NGF 간의 상관관계 및 소거된 프레임의 수를 토대로 결정된 가중치를 이용하여 PGF의 스펙트럼 포락선을 변형시킨다.
상기 상관관계는 상기 소거된 프레임의 전송 위치가 PGF에 근접한지 NGT에 근접한지를 토대로 한 것이고, 상기 가중치는 0부터 1사이의 값을 갖는다. 소거된 프레임이 PGF에 근접하면, 제 1 스펙트럼 포락선 변형부(506)로 입력되는 가중치가 제 2 스펙트럼 포락선 변형부(507)로 입력되는 가중치보다 큰 값을 갖는다. 제 1 스펙트럼 포락선 변형부(506)로 입력되는 가중치가 w이면, 제 2 스펙트럼 포락선 변형부(507)로 입력되는 가중치는 1-w로 정의된다.
제 2 스펙트럼 포락선 변형부(507)는 상기 가중치를 이용하여 NGF의 스펙트럼을 변형시킨다.
혼합부(508)는 제 1 스펙트럼 변형부(506)로부터 출력되는 변형된 PGF의 스펙트럼 포락선과 제 2 스펙트럼 변형부(507)로부터 출력되는 변형된 NGF의 스펙트럼 포락선을 혼합한다. 상기 혼합은 두 스펙트럼 포락선의 가중된 합을 얻는 방식으로 수행될 수 있다. 혼합부(508)에서 출력되는 스펙트럼 포락선은 해당되는 소거된 프레임의 복원된 스펙트럼 포락선이다.
상기 소거된 프레임의 스펙트럼 포락선이 입력되면, 스펙트럼/LSP 변환부(505)는 상기 소거된 프레임의 스펙트럼 포락선을 LSP 파라미터로 변환한다. 스펙트럼/LSP 변환부(505)로부터 출력되는 LSP 파라미터는 LSP/LPC 변환부(340)로 전송한다. 스펙트럼/LSP 변환부(505)는 도 4의 스펙트럼/LSP 변환부(404)와 같이 제 1 LSP/스펙트럼 변환부(502) 및 제 2 LSP/스펙트럼 변환부(503)의 변환 구성에 대응되는 역 변환 구성을 갖는다.
도 6은 도 5에 도시된 제 1 LSP/스펙트럼 변환부(502), 제 2 LSP/스펙트럼 변환부(503), 복원 유니트(504), 및 스펙트럼/LSP 변환부(505)를 포함하는 본 발명에 따른 LSP 파라미터 복원 장치의 동작 개념 도이다.
도 6을 참조하면, PGF와 NGF간에 L개의 소거된 프레임이 존재할 때, PGF의 LSP 파라미터를 스펙트럼 영역으로 변환시키고(601), NGF의 LSP 파라미터를 스펙트럼 영역으로 변환시키고(602), PGF의 스펙트럼 포락선과 NGF의 스펙트럼 포락선을 각각 변형시켜 혼합함으로써, 소거된 프레임의 스펙트럼 포락선을 복원하고(603), 복원된 스펙트럼 포락선을 LSP 파라미터로 변환하여 이를 소거된 프레임의 LSP 파라미터로 제공한다. 이 때, PGF의 스펙트럼 포락선과 NGF의 스펙트럼 포락선은 소거된 프레임이 PGF에 근접한지 NGF에 근접한지에 대한 상관관계와 소거된 프레임의 수를 토대로 결정된 각각의 가중치로 상기 PGF의 스펙트럼 포락선과 NGF의 스펙트럼 포락선을 변형시킨다.
도 7은 여기 신호를 복원하면서 내삽방식으로 손실된 프레임의 LSP 파라미터를 복원할 경우에, 프레임 소거 은닉 유니트(360)는 다른 실시 예이다. 도 7의 여기신호 복원부(701), 제 1 LSP/스펙트럼 변환부(702), 제 2 LSP/스펙트럼 변환부(703), 및 스펙트럼/LPS 변환부(705)는 도 5의 여기신호 복원부(501), 제 1 LSP/스펙트럼 변환부(502), 제 2 LSP/스펙트럼 변환부(503) 및 스펙트럼/LSP 변환부(505)와 동일하게 구성되므로 이에 대한 설명은 생략한다.
복원 유니트(704)는 동적 프로그램(Dynamic Programming) 기법을 사용하여 제 1 LSP/스펙트럼 변환부(702)로부터 출력되는 PGF의 스펙트럼 포락선의 밴드와 제 2 LSP/스펙트럼 변환부(703)로부터 출력되는 NGF의 스펙트럼 포락선의 밴드를 비선형적으로 정합하여 소거된 프레임의 스펙트럼 포락선을 복원한다.
즉, 복원 유니트(704)는 DFW(Dynamic Frequency Warping)기법을 이용하여 PGF와 NGF의 스펙트럼 밴드를 도 8에 도시된 바와 같이 비선형적으로 정합하여 워핑경로(warping path)를 얻고, 이 워핑 경로를 기반으로 소거된 프레임의 스펙트럼을 복원한다. 도 8에서 알 수 있는 바와 같이 상기 워핑 경로를 얻을 때, 워핑 범 위가 설정되어 운영된다.
도 9는 본 발명의 바람직한 또 다른 실시 예에 따른 LSP 파라미터 복원 방법의 동작 흐름도이다.
음성 복호화 시, 수신된 음성 패킷에 소거된 프레임이 존재하는 것으로 판단되면, PGF의 LSP 파라미터를 스펙트럼 영역으로 변환하여 PGF의 스펙트럼 포락선을 얻는다(901, 902).
PGF의 스펙트럼 포락선을 도 4의 스펙트럼 복원부(403)에서 설명한 바와 같은 방식들중 하나의 방식으로 변형시켜 소거된 프레임의 스펙트럼 포락선을 복원시킨다(903).
복원된 소거된 프레임의 스펙트럼 포락선을 LSP 파라미터 영역으로 변환시키고, 이에 따라 얻어진 LSP 파라미터를 소거된 프레임의 복원된 LSP 파라미터로 제공한다(904, 905).
상기 제 902 단계는 도 4의 LSP/스펙트럼 변환부(402)에서 정의된 4가지 변환 방식중 하나의 방식으로 수행될 수 있고, 제 904 단계는 도 4의 스펙트럼/LSP 변환부(404)에서 정의된 4가지 변환 방식중 하나의 방식으로 수행될 수 있다. 그러나, 제 902 단계에서 수행되는 방식에 의해 제 904 단계에서 수행되는 방식은 결정된다.
한편, 수신된 음성 패킷에 소거된 프레임이 존재하지 않으면, 현재 프레임의 LSP 파라미터를 디코딩하고, 디코딩된 LSP 파라미터를 현재 프레임의 LSP 파라미터로 제공한다(901, 906, 907).
도 10은 본 발명의 바람직한 또 다른 실시 예에 따른 LSP 파라미터 복원 방법의 동작 흐름도이다.
음성 복호화 시, 수신된 음성 패킷에 소거된 프레임이 존재하는 것으로 판단되면, PGF의 LSP 파라미터와 NGF의 LSP 파라미터를 각각 스펙트럼 영역으로 변환하여 PGF의 스펙트럼 포락선과 NGF의 스펙트럼 포락선을 각각 얻는다(1001, 1002).
PGF의 스펙트럼 포락선과 NGF의 스펙트럼 포락선을 이용하여 소거된 프레임의 스펙트럼 포락선을 복원시킨다(1003). 즉, 도 5의 복원 유니트(504) 또는 도 7의 복원 유니트(704)에서 정의된 방식중 하나의 방식으로 소거된 프레임의 스펙트럼 포락선을 복원시킬 수 있다.
복원된 소거된 프레임의 스펙트럼 포락선을 LSP 파라미터 영역으로 변환시키고, 이에 따라 얻어진 LSP 파라미터를 소거된 프레임의 복원된 LSP 파라미터로 제공한다(1004, 1005).
상기 제 1002 단계는 도 4의 LSP/스펙트럼 변환부(402)에서 정의된 4가지 변환 방식중 하나의 방식으로 수행될 수 있고, 제 1004 단계는 도 4의 스펙트럼/LSP 변환부(404)에서 정의된 4가지 변환 방식중 하나의 방식으로 수행될 수 있다. 그러나, 제 1002 단계에서 수행되는 방식에 의해 제 1004 단계에서 수행되는 방식은 결정된다.
한편, 수신된 음성 패킷에 소거된 프레임이 존재하지 않으면, 현재 프레임의 LSP 파라미터를 디코딩하고, 디코딩된 LSP 파라미터를 현재 프레임의 LSP 파라미터로 제공한다(1001, 1006, 1007).
이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
상술한 바에 의해 본 발명은 음성 복호화 시, 복원된 음성신호의 질을 향상시키면서 다양한 기술에 적용이 가능하고, 알고리즘 개발이 용이한 선스펙트럼 쌍 파라미터 복원 기술을 제공할 수 있다.

Claims (21)

  1. 음성 복호화 시 선스펙트럼 쌍 파라미터 복원 방법에 있어서,
    소거된 프레임이 존재하는 것으로 판단되면, 상기 소거된 프레임의 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 1 변환 단계;
    상기 제 1 변환 단계에 의해 얻어진 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 단계; 및
    상기 복원된 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터 영 역으로 변환하는 제 2 변환 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
  2. 제 1 항에 있어서, 상기 복원 단계는, 상기 제 1 변환 단계에서 얻어진 상기 이전 정상 프레임의 스펙트럼 포락선을 사전에 설정된 영역으로 스펙트럴 시프팅하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 것을 특징으로 하는 선스펙트럼 쌍 파라미터 복원 방법.
  3. 제 1 항에 있어서, 상기 복원 단계는 상기 소거된 프레임과 상기 이전 정상 프레임간의 상관관계를 토대로 결정된 가중치를 이용하여 상기 제 1 변환 단계에서 얻어진 상기 이전 정상 프레임의 스펙트럼 포락선을 변형시키고, 상기 변형된 스펙트럼 포락선을 상기 소거된 프레임의 복원된 스펙트럼 포락선으로서 얻는 것을 특징으로 하는 선스펙트럼 쌍 파라미터 복원 방법.
  4. 제 1 항 내지 제 3 항중 어느 한 항에 있어서,
    상기 제 1 변환 단계는,
    상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 선형 예측 계수로 변환하는 단계;
    상기 선형 예측 계수를 켑스트럼으로 변환하는 단계;
    상기 켑스트럼을 스펙트럼 영역으로 변환하여 상기 스펙트럼 포락선을 생성하는 단계를 포함하고,
    상기 제 2 변환 단계는,
    상기 소거된 프레임의 스펙트럼 포락선을 켑스트럼으로 변환하는 단계;
    상기 켑스트럼을 선형 예측 계수로 변환하는 단계;
    상기 선형 예측 계수를 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
  5. 제 1 항 내지 제 3 항중 어느 한 항에 있어서,
    상기 제 1 변환 단계는,
    상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 선형 예측 계수로 변환하는 단계;
    상기 선형 예측 계수를 스펙트럼 영역으로 변환하여 상기 스펙트럼 포락선을 생성하는 단계를 포함하고,
    상기 제 2 변환 단계는,
    상기 소거된 프레임의 스펙트럼 포락선을 자동 상관 계수로 변환하는 단계;
    상기 자동 상관 계수를 선형 예측 계수로 변환하는 단계;
    상기 선형 예측 계수를 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
  6. 제 1 항 내지 제 3 항중 어느 한 항에 있어서,
    상기 제 1 변환 단계는,
    상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 선형 예측 계수로 변환하는 단계;
    상기 선형 예측 계수를 켑스트럼으로 변환하는 단계;
    상기 켑스트럼을 스펙트럼 영역으로 변환하여 상기 스펙트럼 포락선을 생성하는 단계를 포함하고,
    상기 제 2 변환 단계는,
    상기 소거된 프레임이 스펙트럼 포락선을 자동 상관 계수로 변환하는 단계;
    상기 자동 상관 계수를 선형 예측 계수로 변환하는 단계;
    상기 선형 예측 계수를 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
  7. 제 1 항 내지 제 3 항중 어느 한 항에 있어서,
    상기 제 1 변환 단계는,
    상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 의사 켑스트럼으로 변환하는 단계;
    상기 의사 켑스트럼을 스펙트럼 영역으로 변환하여 상기 스펙트럼 포락선을 생성하는 단계를 포함하고,
    상기 제 2 변환 단계는,
    상기 소거된 프레임의 스펙트럼 포락선을 의사 켑스트럼으로 변환하는 단계;
    상기 의사 켑스트럼을 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
  8. 음성 복호화 시 선스펙트럼 쌍 파라미터 복원 방법에 있어서,
    소거된 프레임이 존재하는 것으로 판단되면, 상기 소거된 프레임의 이전 정상 프레임의 선스펙트럼 쌍 파라미터와 상기 소거된 프레임의 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 각각 스펙트럼 영역으로 변환하는 제 1 변환 단계;
    상기 제 1 변환단계에서 얻어진 상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터에 대한 스펙트럼 포락선과 상기 다음 정상 프레임의 선스펙트럼 쌍 파라미터에 대한 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 단계;
    상기 복원된 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터 영역으로 변환하는 제 2 변환 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
  9. 제 8 항에 있어서, 상기 스펙트럼 포락선 복원 단계는,
    상기 소거된 프레임과 상기 이전 정상 프레임간의 상관관계 및 상기 소거된 프레임과 다음 정상 프레임간의 상관관계를 토대로 결정된 제 1 가중치를 이용하여 상기 이전 정상 프레임의 스펙트럼 포락선을 변형하는 단계;
    상기 상관관계를 토대로 결정된 제 2 가중치를 이용하여 상기 다음 정상 프레임의 스펙트럼 포락선을 변형하는 단계;
    상기 변형된 이전 정상 프레임의 스펙트럼 포락선과 상기 변형된 다음 정상 프레임의 스펙트럼 포락선을 혼합하고, 혼합된 결과를 상기 소거된 프레임의 복원된 스펙트럼 포락선으로 생성하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
  10. 제 8 항에 있어서, 상기 스펙트럼 포락선 복원 단계는,
    동적 프로그램 기법을 사용하여 상기 이전 정상 프레임의 스펙트럼 밴드와 상기 다음 정상 프레임의 스펙트럼 밴드를 비선형적으로 정합하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 것을 특징으로 하는 선스펙트럼 쌍 파라미터 복원 방법.
  11. 제 8 항 내지 제 10 항중 어느 한 항에 있어서,
    상기 제 1 변환 단계는,
    상기 이전 정상 프레임과 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 각각 선형 예측 계수로 변환하는 단계;
    상기 이전 정상 프레임과 다음 정상 프레임의 선형 예측 계수를 각각 켑스트럼으로 변환하는 단계;
    상기 이전 영상 프레임과 다음 정상 프레임의 선형 예측 계수의 켑스트럼을 각각 스펙트럼 영역으로 변환하여 스펙트럼 포락선을 생성하는 단계를 포함하고,
    상기 제 2 변환 단계는,
    상기 소거된 프레임의 스펙트럼 포락선을 켑스트럼으로 변환하는 단계;
    상기 켑스트럼을 선형 예측 계수로 변환하는 단계;
    상기 선형 예측 계수를 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
  12. 제 8 항 내지 제 10 항중 어느 한 항에 있어서,
    상기 제 1 변환 단계는,
    상기 이전 정상 프레임과 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 각각 선형 예측 계수로 변환하는 단계;
    상기 이전 정상 프레임과 다음 정상 프레임의 선형 예측 계수를 각각 스펙트럼 영역으로 변환하여 스펙트럼 포락선을 생성하는 단계를 포함하고,
    상기 제 2 변환 단계는,
    상기 소거된 프레임의 스펙트럼 포락선을 자동 상관 계수로 변환하는 단계;
    상기 자동 상관 계수를 선형 예측 계수로 변환하는 단계;
    상기 선형 예측 계수를 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
  13. 제 8 항 내지 제 10 항중 어느 한 항에 있어서,
    상기 제 1 변환 단계는,
    상기 이전 정상 프레임과 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 각각 선형 예측 계수로 변환하는 단계;
    상기 이전 정상 프레임과 다음 정상 프레임의 선형 예측 계수를 각각 켑스트럼으로 변환하는 단계;
    상기 이전 정상 프레임과 다음 정상 프레임의 켑스트럼을 스펙트럼 영역으로 변환하여 스펙트럼 포락선을 생성하는 단계를 포함하고,
    상기 제 2 변환 단계는,
    상기 소거된 프레임의 스펙트럼 포락선을 자동 상관 계수로 변환하는 단계;
    상기 자동 상관 계수를 선형 예측 계수로 변환하는 단계;
    상기 선형 예측 계수를 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
  14. 제 8 항 내지 제 10 항중 어느 한 항에 있어서,
    상기 제 1 변환 단계는,
    상기 이전 정상 프레임과 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 각각 의사 켑스트럼으로 변환하는 단계;
    상기 이전 정상 프레임과 다음 정상 프레임의 의사 켑스트럼을 스펙트럼 영역으로 변환하여 스펙트럼 포락선을 생성하는 단계를 포함하고,
    상기 제 2 변환 단계는,
    상기 소거된 프레임의 스펙트럼 포락선을 의사 켑스트럼으로 변환하는 단계;
    상기 의사 켑스트럼을 선스펙트럼 쌍 파라미터로 변환하는 단계를 포함하는 선스펙트럼 쌍 파라미터 복원 방법.
  15. 음성 복호화 시 선스펙트럼 쌍 파라미터 복원 장치에 있어서,
    소거된 프레임이 존재하는 것으로 판단되어 이전 정상 프레임의 선스펙트럼 쌍 파라미터가 입력되면, 상기 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 1 변환부;
    상기 제 1 변환부에서 출력되는 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 스펙트럼 복원부; 및
    상기 스펙트럼 복원부에서 복원된 상기 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터로 변환하는 제 2 변환부를 포함하는 선스펙트럼 쌍 파라미터 복원 장치.
  16. 제 15 항에 있어서, 상기 스펙트럼 복원부는,
    상기 제 1 변환부에 의해 얻어진 상기 이전 정상 프레임의 스펙트럼 포락선을 사전에 설정된 영역으로 스펙트럴 시프팅하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 것을 특징으로 하는 선스펙트럼 쌍 파라미터 복원 장치.
  17. 제 15 항에 있어서, 상기 스펙트럼 복원부는,
    상기 소거된 프레임과 상기 이전 정상 프레임간의 상관관계를 토대로 결정된 가중치를 이용하여 상기 제 1 변환부에 의해 얻어진 상기 이전 정상 프레임의 스펙트럼 포락선을 변형시키고, 상기 변형된 스펙트럼 포락선을 상기 소거된 프레임의 복원된 스펙트럼 포락선으로 출력하는 것을 특징으로 하는 선스펙트럼 쌍 파라미터 복원 장치.
  18. 음성 복호화 시 선스펙트럼 쌍 파라미터 복원 장치에 있어서,
    소거된 프레임이 존재하는 것으로 판단되면, 상기 소거된 프레임의 이전 정상 프레임의 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 1 변환부;
    상기 소거된 프레임이 소거된 것으로 판단되면, 상기 소거된 프레임의 다음 정상 프레임의 선스펙트럼 쌍 파라미터를 스펙트럼 영역으로 변환하는 제 2 변환부;
    상기 제 1 변환부에서 얻어진 상기 이전 정상 프레임의 선스펙트럼 쌍 파라미터의 스펙트럼 포락선과 상기 제 2 변환부에서 얻어진 상기 다음 정상 프레임의 선스펙트럼 쌍 파라미터의 스펙트럼 포락선을 이용하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 복원 유니트;
    상기 복원 유니트에서 복원된 상기 소거된 프레임의 스펙트럼 포락선을 선스펙트럼 쌍 파라미터 영역으로 변환하는 제 3 변환부를 포함하는 선스펙트럼 쌍 파라미터 복원 장치.
  19. 제 18 항에 있어서, 상기 복원 유니트는,
    상기 소거된 프레임과 상기 이전 정상 프레임간의 상관관계 및 상기 소거된 프레임과 상기 다음 정상 프레임간의 상관관계를 토대로 결정된 제 1 가중치를 이 용하여 상기 이전 정상 프레임의 스펙트럼 포락선을 변형하는 제 1 변형부;
    상기 상관관계를 토대로 결정된 제 2 가중치를 이용하여 상기 다음 정상 프레임의 스펙트럼 포락선을 변형하는 제 2 변형부; 및
    상기 변형된 이전 정상 프레임의 스펙트럼 포락선과 상기 변형된 다음 정상 프레임의 스펙트럼 포락선을 혼합하고, 상기 혼합 결과를 상기 소거된 프레임의 복원된 스펙트럼 포락선으로 생성하는 혼합부를 포함하는 선스펙트럼 쌍 파라미터 복원 장치.
  20. 제 18 항에 있어서, 상기 복원 유니트는,
    동적 프로그램 기법을 사용하여 상기 이전 정상 프레임의 스펙트럼 밴드와 상기 다음 정상 프레임의 스펙트럼 밴드를 비선형적으로 정합하여 상기 소거된 프레임의 스펙트럼 포락선을 복원하는 것을 특징으로 하는 선스펙트럼 쌍 파라미터 복원 장치.
  21. 음성 복호화 장치에 있어서,
    현재 프레임의 파라미터들을 디코딩하여 여기 신호를 출력하는 여기신호 디코딩부;
    상기 현재 프레임의 선스펙트럼 쌍 파라미터를 디코딩하는 선스펙트럼 쌍 파라미터 디코딩부;
    수신되는 부호화된 음성 패킷에 소거된 프레임이 존재하면, 상기 소거된 프 레임의 소거를 은닉할 수 있도록, 상기 소거된 프레임의 이전 정상 프레임의 파라미터들 또는 이전 정상 프레임과 다음 정상 프레임의 파라미터들을 이용하여 상기 소거된 프레임의 선스펙트럼 쌍 파라미터와 여기 신호를 복원하는 프레임 소거 은닉 유니트;
    상기 수신된 부호화된 음성 패킷에 소거 프레임이 존재하지 않으면, 현재 프레임의 파라미터들을 상기 여기 신호 디코딩부와 상기 선스펙트럼 쌍 파라미터 디코딩부로 각각 전송하고, 상기 수신된 부호화된 음성 패킷에 소거 프레임이 존재하면, 상기 이전 정상 프레임 또는 이전 정상 프레임과 다음 정상 프레임의 파라미터들을 상기 프레임 소거 은닉 유니트로 전송하는 파라미터 전송부;
    상기 선스펙트럼 쌍 파라미터 디코딩부로부터 전송되는 디코딩된 선스펙트럼 쌍 파라미터와 상기 프레임 소거 은닉 유니트로부터 출력되는 선스펙트럼 쌍 파라미터중 하나를 선형 예측 계수(LPC)로 변환하는 변환부; 및
    상기 여기신호 디코딩부로부터 출력되는 여기신호와 상기 프레임 소거 은닉 유니트로부터 출력되는 여기신호중 한 신호가 입력되면, 상기 변환부로부터 출력되는 선형 예측 계수를 이용하여 합성된 음성신호를 출력하는 합성 필터를 포함하는 음성 복호화 장치.
KR1020050010992A 2005-02-05 2005-02-05 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치 KR100612889B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020050010992A KR100612889B1 (ko) 2005-02-05 2005-02-05 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치
EP06250603A EP1688916A3 (en) 2005-02-05 2006-02-03 Method and apparatus for recovering line spectrum pair parameter and speech decoding apparatus using same
JP2006028177A JP2006215569A (ja) 2005-02-05 2006-02-06 線スペクトル対パラメータ復元方法、線スペクトル対パラメータ復元装置、音声復号化装置及び線スペクトル対パラメータ復元プログラム
US11/347,429 US7765100B2 (en) 2005-02-05 2006-02-06 Method and apparatus for recovering line spectrum pair parameter and speech decoding apparatus using same
US12/659,943 US8214203B2 (en) 2005-02-05 2010-03-25 Method and apparatus for recovering line spectrum pair parameter and speech decoding apparatus using same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050010992A KR100612889B1 (ko) 2005-02-05 2005-02-05 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치

Publications (2)

Publication Number Publication Date
KR20060090457A KR20060090457A (ko) 2006-08-11
KR100612889B1 true KR100612889B1 (ko) 2006-08-14

Family

ID=36061496

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050010992A KR100612889B1 (ko) 2005-02-05 2005-02-05 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치

Country Status (4)

Country Link
US (2) US7765100B2 (ko)
EP (1) EP1688916A3 (ko)
JP (1) JP2006215569A (ko)
KR (1) KR100612889B1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4445328B2 (ja) * 2004-05-24 2010-04-07 パナソニック株式会社 音声・楽音復号化装置および音声・楽音復号化方法
US9020812B2 (en) * 2009-11-24 2015-04-28 Lg Electronics Inc. Audio signal processing method and device
US8428959B2 (en) 2010-01-29 2013-04-23 Polycom, Inc. Audio packet loss concealment by transform interpolation
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
US9812144B2 (en) * 2013-04-25 2017-11-07 Nokia Solutions And Networks Oy Speech transcoding in packet networks
BR112015031180B1 (pt) 2013-06-21 2022-04-05 Fraunhofer- Gesellschaft Zur Förderung Der Angewandten Forschung E.V Aparelho e método para gerar um formato espectral adaptativo de ruído de conforto
CN103447548B (zh) * 2013-08-30 2016-03-30 昆明理工大学 一种离子液体置换-热处理制备Mg2Cu合金的方法
US10614816B2 (en) * 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
EP3367380B1 (en) * 2014-06-13 2020-01-22 Telefonaktiebolaget LM Ericsson (publ) Burst frame error handling
CN108011686B (zh) * 2016-10-31 2020-07-14 腾讯科技(深圳)有限公司 信息编码帧丢失恢复方法和装置
JP6691169B2 (ja) * 2018-06-06 2020-04-28 株式会社Nttドコモ 音声信号処理方法及び音声信号処理装置
JP6914390B2 (ja) * 2018-06-06 2021-08-04 株式会社Nttドコモ 音声信号処理方法
CN109887515B (zh) * 2019-01-29 2021-07-09 北京市商汤科技开发有限公司 音频处理方法及装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123496A (ja) * 1994-10-18 1996-05-17 Matsushita Electric Ind Co Ltd Lspパラメータ符号化復号化装置
JPH09166999A (ja) * 1996-10-21 1997-06-24 Mitsubishi Electric Corp 音声符号化装置及び音声符号化方法
JPH11184498A (ja) 1997-12-24 1999-07-09 Toshiba Corp 音声符号化/復号化方法
KR20040028750A (ko) * 2001-05-16 2004-04-03 노키아 코포레이션 음성 코덱의 선스펙트럼 주파수 벡터 양자화 방법 및 시스템

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss
KR970011728B1 (ko) * 1994-12-21 1997-07-14 김광호 음향신호의 에러은닉방법 및 그 장치
US5699478A (en) * 1995-03-10 1997-12-16 Lucent Technologies Inc. Frame erasure compensation technique
WO1998006090A1 (en) * 1996-08-02 1998-02-12 Universite De Sherbrooke Speech/audio coding with non-linear spectral-amplitude transformation
US5806027A (en) * 1996-09-19 1998-09-08 Texas Instruments Incorporated Variable framerate parameter encoding
US6205130B1 (en) * 1996-09-25 2001-03-20 Qualcomm Incorporated Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters
US5907822A (en) * 1997-04-04 1999-05-25 Lincom Corporation Loss tolerant speech decoder for telecommunications
US6311153B1 (en) * 1997-10-03 2001-10-30 Matsushita Electric Industrial Co., Ltd. Speech recognition method and apparatus using frequency warping of linear prediction coefficients
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
US6377914B1 (en) * 1999-03-12 2002-04-23 Comsat Corporation Efficient quantization of speech spectral amplitudes based on optimal interpolation technique
US7117156B1 (en) * 1999-04-19 2006-10-03 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US6952668B1 (en) * 1999-04-19 2005-10-04 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US6597961B1 (en) * 1999-04-27 2003-07-22 Realnetworks, Inc. System and method for concealing errors in an audio transmission
US6691082B1 (en) * 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
US6775649B1 (en) * 1999-09-01 2004-08-10 Texas Instruments Incorporated Concealment of frame erasures for speech transmission and storage system and method
US7027989B1 (en) * 1999-12-17 2006-04-11 Nortel Networks Limited Method and apparatus for transmitting real-time data in multi-access systems
US6665638B1 (en) * 2000-04-17 2003-12-16 At&T Corp. Adaptive short-term post-filters for speech coders
EP1199709A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Error Concealment in relation to decoding of encoded acoustic signals
US7031926B2 (en) * 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
US7711563B2 (en) * 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US7324937B2 (en) * 2003-10-24 2008-01-29 Broadcom Corporation Method for packet loss and/or frame erasure concealment in a voice communication system
CN1950883A (zh) * 2004-04-30 2007-04-18 松下电器产业株式会社 可伸缩性解码装置及增强层丢失的隐藏方法
US7519535B2 (en) * 2005-01-31 2009-04-14 Qualcomm Incorporated Frame erasure concealment in voice communications
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
KR100723409B1 (ko) * 2005-07-27 2007-05-30 삼성전자주식회사 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123496A (ja) * 1994-10-18 1996-05-17 Matsushita Electric Ind Co Ltd Lspパラメータ符号化復号化装置
JPH09166999A (ja) * 1996-10-21 1997-06-24 Mitsubishi Electric Corp 音声符号化装置及び音声符号化方法
JPH11184498A (ja) 1997-12-24 1999-07-09 Toshiba Corp 音声符号化/復号化方法
KR20040028750A (ko) * 2001-05-16 2004-04-03 노키아 코포레이션 음성 코덱의 선스펙트럼 주파수 벡터 양자화 방법 및 시스템

Also Published As

Publication number Publication date
KR20060090457A (ko) 2006-08-11
US8214203B2 (en) 2012-07-03
US7765100B2 (en) 2010-07-27
US20060178872A1 (en) 2006-08-10
JP2006215569A (ja) 2006-08-17
EP1688916A3 (en) 2007-05-09
US20100191523A1 (en) 2010-07-29
EP1688916A2 (en) 2006-08-09

Similar Documents

Publication Publication Date Title
KR100612889B1 (ko) 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치
JP6423460B2 (ja) フレームエラー隠匿装置
KR100723409B1 (ko) 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치
US8209190B2 (en) Method and apparatus for generating an enhancement layer within an audio coding system
JP5247878B2 (ja) 階層型復号化構造におけるデジタル音声信号の伝送エラーの隠蔽
US20100169087A1 (en) Selective scaling mask computation based on peak detection
US20100169100A1 (en) Selective scaling mask computation based on peak detection
JP5289319B2 (ja) 隠蔽フレーム(パケット)を生成するための方法、プログラムおよび装置
JPH09120297A (ja) フレーム消失の間のコードブック利得減衰
JP4414705B2 (ja) 音源信号符号化装置、及び音源信号符号化方法
JP2001100797A (ja) 音声符号化復号装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120730

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20130730

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20140730

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20150730

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20160728

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20170728

Year of fee payment: 12