KR20050007854A - 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법 - Google Patents

서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법 Download PDF

Info

Publication number
KR20050007854A
KR20050007854A KR1020030047455A KR20030047455A KR20050007854A KR 20050007854 A KR20050007854 A KR 20050007854A KR 1020030047455 A KR1020030047455 A KR 1020030047455A KR 20030047455 A KR20030047455 A KR 20030047455A KR 20050007854 A KR20050007854 A KR 20050007854A
Authority
KR
South Korea
Prior art keywords
filter
celp codec
weight
mutual
encoding
Prior art date
Application number
KR1020030047455A
Other languages
English (en)
Other versions
KR100554164B1 (ko
Inventor
성종모
김현우
김도영
최진규
윤성완
강홍구
이기성
윤대희
Original Assignee
학교법인연세대학교
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 학교법인연세대학교, 한국전자통신연구원 filed Critical 학교법인연세대학교
Priority to KR1020030047455A priority Critical patent/KR100554164B1/ko
Priority to US10/749,748 priority patent/US7472056B2/en
Publication of KR20050007854A publication Critical patent/KR20050007854A/ko
Application granted granted Critical
Publication of KR100554164B1 publication Critical patent/KR100554164B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치 및 그 방법이 개시된다. 본 발명에 따른 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치는 서로 다른 포맷을 갖는 입력 CELP 코덱과 출력 CELP 코덱 사이에서, 입력 CELP 코덱의 포맷을 출력 CELP 코덱의 포맷으로 변환하는 본 발명에 따른 상호부호화 장치는 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 변환하는 입력 CELP 코덱의 복호화 처리부, 기준필터를 기준으로, 스펙트럼 왜곡이 최소가 되는 최적의 가중치를 적용하여 계산되는 필터 특성으로 입력 CELP 코덱의 복호화 처리부에서 복호화된 음성신호를 필터 처리하는 상호부호화 필터, 다수의 가중치로 이루어진 가중치 세트로부터 상호부호화 필터의 스펙트럼 왜곡을 최소화하는 최적의 가중치를 추출하여 상호부호화 필터로 제공하는 상호부호화 필터 설계부 및 상호부호화 필터에서 필터 처리된 음성신호를 부호화하여 출력 CELP 코덱 포맷의 비트스트림를 생성하는 출력 CELP 코덱의 부호화 처리부를 포함하는 것을 특징으로 하고, 하나의 상호부호화 필터를 이용하여 종래의 후-필터 및 지각가중필터를 대신함으로써, 상호부호화기의 연산량을 감소시키면서도 수신단에서 복호화된 음성의 음질을 향상시킬 수 있다.

Description

서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치 및 그 방법{Transcoder between two speech codecs having difference CELP type and method thereof}
본 발명은 켈프 (CELP: Code-Excited Linear Prediction) 방식의 음성 코딩기술에 관한 것으로, 특히 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치 및 그 방법에 관한 것이다.
음성을 디지털로 전송하는 기술은 기존 전화망을 비롯한 유선 통신뿐만 아니라 무선 통신 및 최근 많은 관심을 끌고 있는 VoIP(Voice over Internet Protocol) 망에서도 널리 사용되고 있다. 음성을 단순히 8 kHz로 샘플링 후 샘플당 8 bit로 부호화하여 전송한다면, 64 kbps(kilo bits per second) 정도의 데이터 전송율을 필요로 한다. 그러나, 음성 분석과 적절한 코딩 방식을 채용한다면 훨씬 더 낮은 전송율로 음성을 고품질로 전송할 수 있다.
음성 생성 모델로부터 파라미터를 추출하여 음성을 압축하는 장치를 보통 보코더(vocoder)라고 부른다. 이러한 장치는 입력 음성으로부터 파라미터들의 추출을 위해 음성을 분석하는 부호화기와 전송 채널을 통해 전송된 파라미터로부터 수신 측에서 재합성하는 복호화기로 구성된다. 선형 예측 기반의 타임-도메인 보코더는 최근까지 가장 널리 사용되고 있다. 이러한 선형예측 기반의 타임-도메인 보코더는 과거 음성 샘플들로부터 현재 음성 샘플을 예측하여 원 샘플과의 오류가 최소가 되도록 하는 예측 필터의 계수를 계산하고, 예측 필터를 통과한 오류 신호를 적응 코드북과 고정 코드북으로 모델링하는 방식을 이용한다.
보코더의 기능은 음성 자체에 존재하는 중복성(Redundancy)을 제거함으로써, 낮은 전송 비트율로 음성 신호를 압축하는 것이다. 일반적으로, 음성은 입술과 혀의 필터링 동작으로 인한 단기간 중복성과 성대의 떨림으로 인한 장기간 중복성을 갖는 것으로 알려져 있다. CELP 기반의 보코더는 이러한 두 가지 특성을 각각의 필터로 모델링하는데, 이들을 각각 단기간 포만트 필터와 장기간 피치 필터라고 부른다. 이 두 개의 필터를 통해서 중복성이 제거되고 남는 잔여 신호는 CELP의 종류에 따라 백색 가우시안 잡음(White Gaussian Noise) 혹은 다중 펄스(multi-pulse) 등으로 모델링되어 부호화될 수 있다. 이러한 기술의 근간은 두 필터의 계수를 계산하는 것이다. 포만트 필터 혹은 LPC (Linear Predictive Coding) 필터는 음성의 단기간 예측 과정을 수행하고, 피치 필터는 음성의 장기간 예측 과정을 수행한다. 마지막으로 잔여 신호는 합성에 의한 분석(analysis-by-synthesis) 기법을 이용해서 최적의 신호로 모델링 된다. 이러한 분석을 통해서 채널로 전송되는 파라미터는 포만트 정보와 피치 정보 및 잔여 신호 정보 등을 포함한다.
최근 음성 전송을 위한 여러 가지 망이 공존하고 있다. 그러나, 이들 망에서 각각의 망 특성을 고려한 특정한 코덱을 채용하고 있기 때문에 망간 연동을 위해서는 서로 다른 코덱간 포맷 변환 작업을 필요로 하게 된다. 이 작업을 상호부호화(transcoding) 과정이라고 부르며 이 작업을 수행하는 장치를 상호부호화기(transcoder)라 한다. 상호부호화 과정을 위해 종래에는 단순히 한 코덱의 복호화기와 다른 코덱의 부호화기를 이어 붙이는 탠덤(tandem) 방식이 사용되었다. 그러나, 이 탠덤 방식의 상호부호화 과정은 음성 부호화와 복호화 과정을 두 번 거침으로 인해서 음질 저하, 알고리즘 지연 증가 및 계산량 증가 등의 단점을 가진다. 이러한 단점을 보완하기 위해, 탠덤 방식에서와 같이 복호화 과정을 거치지 않고 부호화된 비트스트림에서 직접 변환을 수행하는 비트스트림 매핑 방식의 상호부호화가 사용된다.
도 1은 탠덤 방식과 비트스트림 매핑 방식의 상호부호화 과정을 비교한 도면이다. 도 1(a)을 참조하여, 탠덤 방식은 송신단에서 입력 음성 신호를 부호화기(102)를 통해서 비트스트림(A)로 부호화한 다음 제1채널(104)로 전송한다. 제1채널(104)을 통해서 수신된 비트스트림(A)은 상호부호화기(114)의 복호화기(106)를 통해서 복호화되어 PCM(Pulse-Coded Modulation) 신호로 바뀐다. 복호화된 PCM 신호는 상호부호화기(114)의 부호화기(108)를 통해서 비트스트림(B)으로 부호화되어 제2채널(110)을 통해 최종 수신단의 복호화기(112)로 전송된다. 수신단의 복호화기(112)를 통해 출력 음성 신호가 얻어진다. 여기서 탠덤 방식의 상호부호화기(114)는 복호화기(106)와 부호화기(108)로 구성된다. 반면, 도 1(b)의 비트스트림 매핑 상호부호화 방식에서는, 송신단에서 탠덤 방식과 마찬가지로 입력 음성 신호가 부호화기(152)를 통해서 비트스트림(A)로 부호화되어 제1채널(154)을 통해 상호부호화기(156)로 전송된다. 상호부호화기(156)는 수신된 비트스트림(A)를 비트스트림 매핑 방식을 이용하여 직접 비트스트림(B)로 변환하여 제2채널(158)로 전송한다. 수신단의 복호화기(160)는 제2채널(158)를 통해 수신된 비트스트림(B)을 복호화하여 출력 음성 신호를 생성한다.
도 2는 도 1의 상호부호화 과정을 각 코덱에 포함된 필터링 과정으로 나타낸 것이다. 여기서, 지각가중필터(210), 부호화처리부(211), 복호화 처리부(212) 및 후처리 필터(213)는 코덱 A이며, 지각가중필터(223), 부호화처리부(222), 복호화처리부(221) 및 후처리 필터(220)는 코덱 B이며, 상호부호화기(114)는 복호화처리부(212), 후처리 필터(213), 지각가중필터(223) 및 부호화처리부(222)를이용하여 코덱 A 포맷의 비트스트림A를 코덱 B 포맷의 비트스트림B으로 변환한다. 그리고, 도 2에 도시된 바와 같이, 일반적인 CELP 방식 코덱의 부호화기에는 음성 신호의 스펙트럼 형태에 따라 청각 인지도가 다르다는 점을 이용한 지각가중필터를 포함하고, 복호화기에서는 부호화기에서 적용한 지각가중필터에 의한 스펙트럼 왜곡을 보상하여 음질을 향상시키기 위한 후-필터를 포함한다.
도 2를 참조하여, 입력 음성(A)은 사람의 청각기관 특성을 고려한 지각가중필터(210)를 거친 후, 부호화처리부(211)를 통해 코덱 A의 비트스트림A로 변환되어 상호부호화기(114)로 전송된다. 전송된 비트스트림A는 상호부호화기(114)에서 복호화처리(212)를 거친 다음, 부호화기(102)에서 적용된 지각가중필터의 영향을 다시 상쇄하기 위해 후-필터(213)를 거친다. 후-필터(213)를 거친 음성은 코덱 B의 비트스트림B로 부호화되기에 앞서 지각가중필터(223)를 통해 필터링 된다. 지각가중 필터링된 음성은 부호화 처리부(22)에서 코덱 B의 비트스트림으로 부호화되어 복호화기(112)로 전송된다. 복호화처리부(221)는 수신된 비트스트림B을 복호화 처리한 다음, 지각가중필터(223)의 영향을 제거하기 위해 후-필터(220)를 통해 필터링 되어 최종적으로 출력 음성 신호를 얻게 된다. 상기 설명한 CELP 방식의 코덱에서 사용되는 두 필터인 지각가중필터와 후-필터는 보통 다음 수학식 1 및 2와 같은 수식의 형태를 갖는다.
여기서,, p는 LPC 차수, μ는 틸트 팩터(tilt factor), γn과 γd는 후-필터의 가중치이고, γ1과 γ2는 지각가중필터의 가중치이다. 상호부호화기(114)에서는 후-필터(213)와 지각가중필터(223)가 직렬로 연결되며, 두 필터를 통해 신호를 필터링하기 위해서는 각 음성 샘플에 대해서 (2p+1)+2p 번의 MAC (Multiply-and-Accumulate) 작업과 (2p+1)+2p 개의 메모리를 필요로 하게 된다. 상호부호화기(114)에서는 코덱 A의 후-필터와 코덱 B의 지각가중필터를 포함한다.
출력 음성(B)을 수신하는 수신단에서 보면 음성신호는 두 번의 지각가중필터링과 두 번의 후-필터링을 거치게 되므로 계산량이 증가되며, 여러번의 필터 처리를 통해 음성 스펙트럼의 왜곡이 초래된다.
본 발명이 이루고자 하는 제1기술적 과제는 상호부호화시 계산량을 줄이면서 고품질의 음성을 제공할 수 있는 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치 및 그 방법을 제공하는 데 있다.
본 발명이 이루고자 하는 제2기술적 과제는 상기 상호부호화 장치에서 코덱간 상호부호화를 위해 이용되는 상호부호화 필터 설계 방법을 제공하는 데 있다.
본 발명이 이루고자 하는 제3기술적 과제는 상기 음성 코덱 간의 상호부호화 방법을 컴퓨터에서 실행 가능한 프로그램 코드로 기록한 기록 매체를 제공하는 데 있다.
본 발명이 이루고자 하는 제4기술적 과제는 상호부호화 필터 설계 방법을 컴퓨터에서 실행 가능한 프로그램 코드로 기록된 기록 매체를 제공하는 데 있다.
도 1은 탠덤 방식과 비트스트림 매핑 방식의 상호부호화 과정을 비교한 도면이다.
도 2는 도 1의 상호부호화 과정을 각 코덱에 포함된 필터링 과정으로 나타낸 것이다.
도 3은 본 발명에 따른 CELP 방식 코덱들 간의 상호부호화 장치의 일 실시예를 개략적으로 나타내는 블록도이다.
도 4는 도 3의 상호부호화 필터 설계부(322)에서 수행되는 상호부호화 필터의 가중치를 결정 방법의 일실시예를 나타내는 흐름도이다.
도 5는 도 4의 제400단계에서 수행되는 기준필터 생성 과정을 상세히 나타내는 흐름도이다.
상기 제1과제를 이루기 위해, 서로 다른 포맷을 갖는 입력 CELP 코덱과 출력 CELP 코덱 사이에서, 입력 CELP 코덱의 포맷을 출력 CELP 코덱의 포맷으로 변환하는 본 발명에 따른 상호부호화 장치는 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 변환하는 입력 CELP 코덱의 복호화 처리부, 기준필터를 기준으로, 스펙트럼 왜곡이 최소가 되는 최적의 가중치를 적용하여 계산되는 필터 특성으로 입력 CELP 코덱의 복호화 처리부에서 복호화된 음성신호를 필터 처리하는 상호부호화 필터, 다수의 가중치로 이루어진 가중치 세트로부터 상호부호화 필터의 스펙트럼 왜곡을 최소화하는 최적의 가중치를 추출하여 상호부호화 필터로 제공하는 상호부호화 필터 설계부 및 상호부호화 필터에서 필터 처리된 음성신호를 부호화하여 출력 CELP 코덱 포맷의 비트스트림를 생성하는 출력 CELP 코덱의 부호화 처리부를 포함하는 것이 바람직하다.
상기 제1과제를 이루기 위해, 서로 다른 포맷을 갖는 입력 CELP 코덱과 출력 CELP 코덱 사이에서, 입력 CELP 코덱의 포맷을 출력 CELP 코덱의 포맷으로 변환하는 상호부호화 장치에서 수행되는 본 발명에 따른 상호부호화 방법은 스펙트럼 왜곡을 최소화하는 가중치가 적용된, 지각가중필터 특성을 갖는 상호부호화 필터를 생성하는 (A)단계, 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 변환하는 (B)단계, (A)단계에서 생성된 상호부호화 필터로 (B)단계에서 변환된 음성신호를 필터링하는 (C)단계 및 (C)단계에서 필터링된 음성신호를 부호화하여 출력 CELP 코덱 포맷의 비트스트림를 생성하는 (D)단계를 포함하는 것이 바람직하다.
상기 제2과제를 이루기 위해, 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 변환하는 입력 CELP 코덱의 복호화 처리부, 변환된 음성신호를 지각가중필터 특성으로 필터 처리하는 상호부호화 필터 및 필터 처리된 음성신호를 부호화하여 출력 CELP 코덱 포맷의 비트스트림를 생성하는 출력 CELP 코덱의 부호화기를 포함하는 상호부호화 장치에서 본 발명에 따른 상호부호화 필터의 설계 방법은 입력 CELP 코덱에 적용되는 지각가중필터 및 후-필터와 출력 CELP 코덱에 적용되는 지각가중필터의 특성을 이용하여 기준필터를 생성하는 (A)단계, 기준필터를 기준으로 하여, 미리 선택된 가중치 세트에서 상호부호화 필터의 스펙트럼 왜곡을 최소화하는 최적의 가중치를 선택하는 (B)단계 및 (B)단계에서 선택된 가중치를 적용하여 상호부호화 필터를 생성하는 (C)단계를 포함하는 것이 바람직하다.
도 3은 본 발명에 따른 CELP 방식 코덱들 간의 상호부호화 장치의 일 실시예를 개략적으로 나타내는 블록도이다. 본 발명에 따른 상호부호화 장치는 입력 CELP 코덱의 복호화기(311), 상호부호화 필터(323), 상호부호화 필터 설계부(322) 및 출력 CELP 코덱의 부호화기(314)를 포함하여 구성된다. 여기서, 입력 CELP 코덱 및 출력 CELP 코덱은 CELP 방식이다.
도 3을 참조하여, 입력 CELP 코덱의 복호화기(311)는 입력 CELP 코덱 포맷으로 부호화된 비트스트림A를 음성 신호로 변환한다. 여기서, 비트스트림A는 입력 음성신호를 입력 CELP 코덱의 포맷으로 부호화한 비트스트림이다(도 2참조).
상호부호화 필터 설계부(322)는 다수의 가중치 쌍(γ1,γ2)으로 이루어진 가중치 세트로부터 상호부호화 필터(323)의 스펙트럼 왜곡을 최소화하는 최적의 가중치 쌍을 선택한다. 구체적인 상호부호화 필터 설계부(322)의 동작은 도 4 및 도 5를 참조하여 설명될 것이다.
상호부호화 필터(323)는 상기 상호부호화 필터 설계부(322)에서 선택된 가중치 쌍을 적용하여 계산된 필터로 복호화부(321)에서 복호화된 음성신호를 필터 처리한다. 구체적으로, 상호부호화 필터(323)는 입력 CELP 코덱의 후-필터와 출력 CELP 코덱의 지각가중필터가 하나의 지각가중필터 형태로 재구성된 것이다. 즉, 상호부호화 필터(323)는 일반적인 지각가중필터 형태를 가지며, 따라서 수학식 2와 같은 수식으로 표현될 수 있다. 이 때, 상호부호화 필터(323)의 필터 계수는 가중치인 γ1과 γ2에 의해서 결정되며, 상호부호화 필터 설계부(322)에 의해 입력 CELP 코덱의 지각가중필터 및 후-필터와 출력 CELP 코덱의 지각가중필터의 특성이 고려되어 상호부호화 필터(323)의 스펙트럼 왜곡이 최소화되는 가중치 쌍 (γ1과 γ2)이 선택된다.
출력 CELP 코덱의 부호화기(324)는 상호부호화 필터(323)에서 필터 처리된 음성신호를 부호화하여 출력 CELP 코덱 포맷의 비트스트림B를 생성한다. 이 후, 이비트스트림B는 출력 CELP 코덱의 복호화 처리 및 후-필터링을 통해 원래의 음성신호로 복원된다.
도 4는 도 3의 상호부호화 필터 설계부(322)에서 수행되는 상호부호화 필터의 가중치를 결정 방법의 일실시예를 나타내는 흐름도이다.
도 3 및 도 4를 참조하여, 입력 CELP 코덱의 지각가중필터 및 후-필터와 출력 CELP 코덱의 지각가중필터의 특성을 이용하여 상호부호화 필터를 계산하기 위한 기준필터를 생성하고, 생성된 기준필터의 주파수 응답을 계산한다(제400단계).
한편, 상호부호화 필터는(323)는 수학식 2와 같은 지각가중필터의 형태를 가지는 것으로 가정하였기 때문에, 상호부호화 필터를 구하기 위해서는 가중치인 γ1과 γ2를 계산하면 된다. 이를 위해, 먼저 미리 선택된 가중치 세트에서 임의로 하나의 가중치 쌍(γ1, γ2)을 선택하여 상호부호화필터를 초기화한다(제410단계).
제410단계에서 선택된 가중치 쌍을 이용하여 상호부호화 필터(323)를 계산하고, 계산된 상호부호화 필터(323)의 주파수 응답을 계산한다(제420단계).
제420단계 후에, 제400단계에서 계산된 주파수 응답과 제420단계에서 계산된 주파수 응답을 이용하여 스펙트럼 왜곡(distortion, d)을 계산한다(제430단계).
제430단계에서 계산된 스펙트럼 왜곡 값(d)을 그 때의 가중치 쌍과 함께 별도의 저장 공간에 저장한다(제440단계).
제440단계 후에, 상호부호화 필터의 가중치 쌍을 가중치 세트에 있는 다른 가중치 쌍으로 변경하여(제450단계) 제410~440단계를 반복 진행한다.
전체 가중치 세트에 대해서 반복 수행이 완료되면(제460단계), 제440단계에서 저장된 가중치 쌍과 스펙트럼 왜곡 값을 참조하여 최소의 스펙트럼 왜곡을 갖는 가중치 쌍을 최적의 가중치 쌍으로서 검색한다(제470단계). 검색된 최적의 가중치 쌍을 상호부호화 필터(323)에 적용한다(제480단계).
이와 같은 최적의 상호부호화 필터(323) 설계를 위한 가중치 쌍의 검색은 훈련을 통해서 오프-라인으로 수행되며, 실제 상호부호화 과정은 검색된 최적의 가중치 쌍을 상호부호화 필터(323)에 적용함으로써 이루어진다.
도 5는 도 4의 제400단계에서 수행되는 기준필터 생성 과정을 상세히 나타내는 흐름도이다.
도 3 및 도 5를 참조하여, 먼저 입력 CELP 포맷으로 부호화된 비트스트림A에서 복호화를 통해서 LPC 계수를 추출한다(제500단계).
제401단계에서 구해진 LPC(Linear Predictive Coding) 계수를 이용해서 출력 CELP 코덱에서 사용될 지각가중필터를 계산한다(제510단계). 그리고, 입력 CELP 코덱에서 비트스트림A의 생성에 사용된 지각가중필터의 영향을 보상하기 위해, 입력 CELP 코덱의 복호화기에서 사용되는 후-필터를 지각가중필터의 보상필터로서 계산한다(제520단계).
제520단계를 통해서 구해진 지각가중필터의 보상필터와 제510단계를 통해서 계산된 출력 CELP 코덱의 지각가중필터를 직렬로 연결하고, 이를 상호부호화 필터(323)를 계산하기 위한 기준필터로서 구한다(제530단계).
제530단계에서 구해진 기준필터의 주파수 응답을 계산한다(제540단계).
한편, 제520단계에서 입력 CELP 코덱의 지각가중필터의 보상필터서 입력 CELP 코덱의 복호화기에서 사용되는 후-필터를 이용함을 설명하였으나, 후-필터대신 입력 CELP 코덱의 부호화기에서 사용된 지각가중필터의 역-필터를 지각가중필터의 보상필터로서 계산할 수도 있다.
이상에서와 같은 방법에 의해 설계된 지각가중필터 형태를 갖는 상호부호화 필터를 상호부호화기에 적용함으로써 종래에 후-필터와 지각가중필터의 직렬연결 형태의 필터에 비해서 필터 탭(tap) 수를 감소시킬 수 있으며, 따라서 상호부호화기의 연산량을 감소시킬 수 있다. 또한, 종래에 후-필터와 지각가중필터에 의한 두 번의 필터링 과정을 하나의 상호부호화 필터에 의해 한 번의 필터링 과정으로 줄임으로서 필터링에 의한 음성 왜곡을 감소시킬 수 있다. 이로 인해, 수신단에서 상호부호화기를 통해 수신된 비트스트림의 복호화된 음성의 음질을 향상을 시킬 수 있다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플라피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이상 도면과 명세서에서 최적 실시예들이 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.
상술한 바와 같이, 본 발명에 따른 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치 및 그 방법에 따르면 하나의 상호부호화 필터를 이용하여 종래의 후-필터 및 지각가중필터를 대신함으로써, 상호부호화기의 연산량을 감소시키면서도 수신단에서 복호화된 음성의 음질을 향상시킬 수 있다.

Claims (11)

  1. 서로 다른 포맷을 갖는 입력 CELP 코덱과 출력 CELP 코덱 사이에서, 입력 CELP 코덱의 포맷을 출력 CELP 코덱의 포맷으로 변환하는 상호부호화 장치에 있어서,
    입력 음성신호가 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 변환하는 입력 CELP 코덱의 복호화 처리부;
    기준필터를 기준으로, 스펙트럼 왜곡이 최소가 되는 최적의 가중치를 적용하여 계산되는 필터 특성으로 상기 입력 CELP 코덱의 복호화 처리부에서 복호화된 음성신호를 필터 처리하는 상호부호화 필터;
    다수의 가중치 쌍으로 이루어진 가중치 세트로부터 상기 기준 필터와 상호부호화 필터간의 스펙트럼 왜곡을 최소화하는 상기 최적의 가중치를 추출하여 상기 상호부호화 필터로 제공하는 상호부호화 필터 설계부; 및
    상기 상호부호화 필터에서 필터 처리된 음성신호를 부호화하여 출력 CELP 코덱 포맷의 비트스트림를 생성하는 출력 CELP 코덱의 부호화 처리부를 포함하는 것을 특징으로 하는 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치.
  2. 제1항에 있어서,
    상기 상호부호화 필터는 다음 수학식
    (여기서,, p는 LPC 차수, γ1과 γ2는 지각가중필터의 가중치)
    과 같이 표현되는 지각가중필터 형태인 것을 특징으로 하는 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치.
  3. 제1항에 있어서, 상기 상호부호화 필터 설계부는
    상기 입력 CELP 코덱에 적용되는 지각가중필터 및 후-필터와 상기 출력 CELP 코덱에 적용되는 지각가중필터의 특성을 이용하여 상호부호화 필터를 계산하기 위한 상기 기준필터를 생성하는 과정; 및
    상기 기준필터를 기준으로 하여 스펙트럼 왜곡이 최소가 될 때의 상호부호화 필터 가중치를 상기 최적의 가중치로서 구하는 과정을 포함하는 것을 특징으로 하는 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 장치.
  4. 서로 다른 포맷을 갖는 입력 CELP 코덱과 출력 CELP 코덱 사이에서, 입력 CELP 코덱의 포맷을 출력 CELP 코덱의 포맷으로 변환하는 상호부호화 장치에서 수행되는 상호부호화 방법에 있어서,
    (A)스펙트럼 왜곡을 최소화하는 가중치가 적용된, 지각가중필터 특성을 갖는 상호부호화 필터를 생성하는 단계;
    (B)입력 음성신호가 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 변환하는 단계;
    (C)상기 (A)단계에서 생성된 상호부호화 필터로 상기 (B)단계에서 변환된 음성신호를 필터링하는 단계; 및
    (D)상기 (C)단계에서 필터링된 음성신호를 부호화하여 출력 CELP 코덱 포맷의 비트스트림를 생성하는 단계를 포함하는 것을 특징으로 하는 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 방법.
  5. 제4항에 있어서, 상기 (A)단계는
    (A1)상기 입력 CELP 코덱에 적용되는 지각가중필터 및 후-필터와 상기 출력 CELP 코덱에 적용되는 지각가중필터의 특성을 이용하여 상호부호화 필터를 계산하기 위한 기준필터를 생성하는 단계; 및
    (A2)상기 기준필터를 기준으로 하여, 스펙트럼 왜곡을 최소화하는 가중치가 적용된, 지각가중필터 특성을 갖는 상호부호화 필터를 생성하는 단계를 포함하는 것을 특징으로 하는 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 방법.
  6. 제5항에 있어서, 상기 (A1)단계는
    (A1_1a)상기 입력 CELP 코덱 포맷으로 부호화된 비트스트림을 복호화하여 LPC(Linear Predictive Coding) 계수를 추출하는 단계;
    (A1_2a)상기 (A1_1a)단계에서 구해진 LPC 계수를 이용하여 상기 출력 CELP 코덱에서 사용될 지각가중필터를 계산하는 단계;
    (A1_3a)상기 입력 CELP 코덱 포맷으로 부호화된 비트스트림의 생성에 사용된 지각가중필터의 영향을 보상하기 위한 후-필터를 보상필터로서 계산하는 단계; 및
    (A1_4a)상기 (A1_3a)단계에서 계산된 보상필터와 상기 (A1_2a)단계에서 계산된 지각가중필터를 직렬로 연결하여 상기 기준필터를 생성하는 단계를 포함하는 것을 특징으로 하는 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 방법.
  7. 제5항에 있어서,
    (A1_1b)상기 입력 CELP 코덱 포맷으로 부호화된 비트스트림을 복호화하여 LPC(Linear Predictive Coding) 계수를 추출하는 단계;
    (A1_2b)상기 (A1_1b)단계에서 구해진 LPC 계수를 이용하여 상기 출력 CELP 코덱에서 사용될 지각가중필터를 계산하는 단계;
    (A1_3b)상기 입력 CELP 코덱 포맷으로 부호화된 비트스트림의 생성에 사용된 지각가중필터의 영향을 보상하도록, 상기 지각가중필터의 역 필터를 보상필터로서 계산하는 단계; 및
    (A1_4b)상기 (A1_3b)단계에서 계산된 보상필터와 상기 (A1_2b)단계에서 계산된 지각가중필터를 직렬로 연결하여 상기 기준필터를 생성하는 단계를 포함하는 것을 특징으로 하는 서로 다른 CELP 방식의 음성 코덱 간의 상호부호화 방법.
  8. 입력 음성신호가 입력 CELP 코덱 포맷으로 부호화된 비트스트림를 음성 신호로 변환하는 입력 CELP 코덱의 복호화 처리부, 상기 변환된 음성신호를 지각가중필터 특성으로 필터 처리하는 상호부호화 필터 및 상기 필터 처리된 음성신호를 부호화하여 출력 CELP 코덱 포맷의 비트스트림를 생성하는 출력 CELP 코덱의 부호화기를 포함하는 상호부호화 장치에서 상기 상호부호화 필터의 설계 방법에 있어서,
    (A)상기 입력 CELP 코덱에 적용되는 지각가중필터 및 후-필터와 상기 출력 CELP 코덱에 적용되는 지각가중필터의 특성을 이용하여 기준필터를 생성하는 단계;
    (B)상기 기준필터를 기준으로 하여, 미리 선택된 가중치 세트에서 상기 상호부호화 필터의 스펙트럼 왜곡을 최소화하는 최적의 가중치를 선택하는 단계; 및
    (C)상기 (B)단계에서 선택된 가중치를 적용하여 상기 상호부호화 필터를 생성하는 단계를 포함하는 것을 특징으로 하는 상호부호화 필터의 설계 방법.
  9. 제8항에 있어서, 상기 (A)단계는
    (A1_a)상기 입력 CELP 코덱 포맷으로 부호화된 비트스트림을 복호화하여 LPC(Linear Predictive Coding) 계수를 추출하는 단계;
    (A1_a)상기 (A1_a)단계에서 구해진 LPC 계수를 이용하여 상기 출력 CELP 코덱에서 사용될 지각가중필터를 계산하는 단계;
    (A1_a)상기 입력 CELP 코덱 포맷으로 부호화된 비트스트림의 생성에 사용된 지각가중필터의 영향을 보상하기 위한 후-필터를 보상필터로서 계산하는 단계; 및
    (A1_a)상기 (A1_a)단계에서 계산된 보상필터와 상기 (A1_a)단계에서 계산된 지각가중필터를 직렬로 연결하여 상기 기준필터를 생성하는 단계를 포함하는 것을 특징으로 하는 상호부호화 필터의 설계 방법.
  10. 제8항에 있어서,
    (A1_b)상기 입력 CELP 코덱 포맷으로 부호화된 비트스트림을 복호화하여 LPC 계수를 추출하는 단계;
    (A1_b)상기 (A1_b)단계에서 구해진 LPC 계수를 이용하여 상기 출력 CELP 코덱에서 사용될 지각가중필터를 계산하는 단계;
    (A1_b)상기 입력 CELP 코덱 포맷으로 부호화된 비트스트림의 생성에 사용된 지각가중필터의 영향을 보상하도록, 상기 지각가중필터의 역-필터를 보상필터로서 계산하는 단계; 및
    (A1_b)상기 (A1_b)단계에서 계산된 보상필터와 상기 (A1_b)단계에서 계산된 지각가중필터를 직렬로 연결하여 상기 기준필터를 생성하는 단계를 포함하는 것을 특징으로 하는 상호부호화 필터의 설계 방법.
  11. 제8항 내지 제10항 중 어느 한 항에 있어서, 상기 (B)단계는
    (B1)가중치 세트에서 임의로 하나의 가중치 쌍을 선택하는 단계;
    (B2)선택된 가중치 쌍을 지각가중필터의 형태를 갖는 상기 상호부호화 필터에 적용하여 상기 상호부호화 필터를 계산하는 단계;
    (B3)상기 (B2)단계에서 계산된 상호부호화 필터의 주파수 응답을 계산하는 단계;
    (B4)상기 기준필터의 주파수 응답과 상기 (B2)단계에서 계산된 주파수 응답을 비교하여, 상기 상호부호화 필터의 스펙트럼 왜곡을 구하는 단계;
    (B5)가중치 세트 내의 모든 가중치 쌍에 대해 상기 (B2)~(B4)단계를 진행하여 가중치 쌍 각각에 대응하는 스펙트럼 왜곡 값을 구하는 단계; 및
    (B6)최소의 스펙트럼 왜곡 값을 갖는 가중치 쌍을 상기 최적의 가중치로서 선택하는 단계를 포함하는 것을 특징으로 하는 상호부호화 필터의 설계 방법.
KR1020030047455A 2003-07-11 2003-07-11 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법 KR100554164B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020030047455A KR100554164B1 (ko) 2003-07-11 2003-07-11 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법
US10/749,748 US7472056B2 (en) 2003-07-11 2003-12-30 Transcoder for speech codecs of different CELP type and method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030047455A KR100554164B1 (ko) 2003-07-11 2003-07-11 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20050007854A true KR20050007854A (ko) 2005-01-21
KR100554164B1 KR100554164B1 (ko) 2006-02-22

Family

ID=33563004

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030047455A KR100554164B1 (ko) 2003-07-11 2003-07-11 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법

Country Status (2)

Country Link
US (1) US7472056B2 (ko)
KR (1) KR100554164B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
US7075460B2 (en) * 2004-02-13 2006-07-11 Hewlett-Packard Development Company, L.P. Methods for scaling encoded data without requiring knowledge of the encoding scheme
US7504968B2 (en) * 2004-02-13 2009-03-17 Hewlett-Packard Development Company, L.P. Media data decoding device
KR101170798B1 (ko) * 2005-06-01 2012-08-02 삼성전자주식회사 다층 유기발광소자를 이용한 체적형 3차원 디스플레이시스템

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5694519A (en) * 1992-02-18 1997-12-02 Lucent Technologies, Inc. Tunable post-filter for tandem coders
FR2734389B1 (fr) * 1995-05-17 1997-07-18 Proust Stephane Procede d'adaptation du niveau de masquage du bruit dans un codeur de parole a analyse par synthese utilisant un filtre de ponderation perceptuelle a court terme
US5995923A (en) * 1997-06-26 1999-11-30 Nortel Networks Corporation Method and apparatus for improving the voice quality of tandemed vocoders
FI980132A (fi) * 1998-01-21 1999-07-22 Nokia Mobile Phones Ltd Adaptoituva jälkisuodatin
US6260009B1 (en) * 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
JP2002202799A (ja) 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
US7363218B2 (en) * 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
US7263481B2 (en) * 2003-01-09 2007-08-28 Dilithium Networks Pty Limited Method and apparatus for improved quality voice transcoding

Also Published As

Publication number Publication date
US20050010403A1 (en) 2005-01-13
US7472056B2 (en) 2008-12-30
KR100554164B1 (ko) 2006-02-22

Similar Documents

Publication Publication Date Title
US6260009B1 (en) CELP-based to CELP-based vocoder packet translation
CN101180676B (zh) 用于谱包络表示的向量量化的方法和设备
JP2002202799A (ja) 音声符号変換装置
US11798570B2 (en) Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information
JPH0353300A (ja) 音声符号化装置
JPH10187197A (ja) 音声符号化方法及び該方法を実施する装置
KR101849613B1 (ko) 스피치 관련 스펙트럼 정형 정보를 사용하는 오디오 신호의 인코딩 및 오디오 신호의 디코딩을 위한 개념
KR100503415B1 (ko) 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법
EP2945158B1 (en) Method and arrangement for smoothing of stationary background noise
US8265929B2 (en) Embedded code-excited linear prediction speech coding and decoding apparatus and method
JPH1055199A (ja) 音声符号化並びに復号化方法及びその装置
JP2002544551A (ja) 遷移音声フレームのマルチパルス補間的符号化
KR100499047B1 (ko) 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의 상호부호화 장치 및 그 방법
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
KR100554164B1 (ko) 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법
JP2018511086A (ja) オーディオ信号を符号化するためのオーディオエンコーダー及び方法
KR100550003B1 (ko) 상호부호화기에서 개회로 피치 추정 방법 및 그 장치
EP1397655A1 (en) Method and device for coding speech in analysis-by-synthesis speech coders
JP3232701B2 (ja) 音声符号化方法
JPH08160996A (ja) 音声符号化装置
JP3144244B2 (ja) 音声符号化装置
JP2005062410A (ja) 音声信号の符号化方法
JPH06195098A (ja) 音声符号化方法
JPH034300A (ja) 音声符号化復号化方式
JPH09269798A (ja) 音声符号化方法および音声復号化方法

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130205

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20140123

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee