KR100859881B1 - 음성 신호 코딩 - Google Patents

음성 신호 코딩 Download PDF

Info

Publication number
KR100859881B1
KR100859881B1 KR1020067022237A KR20067022237A KR100859881B1 KR 100859881 B1 KR100859881 B1 KR 100859881B1 KR 1020067022237 A KR1020067022237 A KR 1020067022237A KR 20067022237 A KR20067022237 A KR 20067022237A KR 100859881 B1 KR100859881 B1 KR 100859881B1
Authority
KR
South Korea
Prior art keywords
frequency band
mode
signal
change
encoded
Prior art date
Application number
KR1020067022237A
Other languages
English (en)
Other versions
KR20070002068A (ko
Inventor
파시 오잘라
자리 매키넨
아리 라카니에미
Original Assignee
노키아 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노키아 코포레이션 filed Critical 노키아 코포레이션
Publication of KR20070002068A publication Critical patent/KR20070002068A/ko
Application granted granted Critical
Publication of KR100859881B1 publication Critical patent/KR100859881B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

본 발명은 주파수 대역에서 음성 신호의 프레임을 입력하기 위한 입력(1.2), 상기 주파수 대역을 적어도 저주파 대역과 고주파 대역으로 나누기 위한 분석 필터(1.3), 상기 저주파 대역의 음성 신호를 부호화하기 위한 제1 인코딩 블록(1.4.1), 상기 고주파 대역의 음성 신호를 부호화하기 위한 제2 인코딩 블록(1.4.2), 및 적어도 제1 모드와 제2 모드 사이에서 상기 인코더를 위하여 동작 모드를 선택하기 위한 모드 선택기를 포함하는 인코더(1)에 관한 것이다. 제1 모드에서 단지 저주파의 신호가 부호화되고, 제2 모드에서 저주파 대역 및 고주파 대역의 신호가 부호화된다. 상기 인코더(1)는 상기 인코더의 동작 모드에서의 변화와 함께 제2 인코딩 블록(1.4.2)의 인코딩 속성을 점진적으로 변화하기 위하여 제2 인코딩 블록(1.4.2)을 제어하기 위한 스케일러를 더 포함한다. 또한, 본 발명은 장치, 디코더, 방법, 모듈, 컴퓨터 프로그램 생성물, 및 신호에 관한 것이다.

Description

음성 신호 코딩{Coding of audio signals}
본 발명은 분할된 주파수 대역에서 음성 신호의 프레임들로부터 부호화된 비트 스트림을 해독하기 위한 파라미터들을 포함하는 비트 스트림을 처리하기 위한 모듈에 관한 것으로서, 단지 저주파 대역의 제1 모드 신호가 부호화되고, 저주파 대역 및 고주파 대역의 제2 모드 신호가 부호화되는 적어도 제1 모드와 제2 모드가 상기 음성 신호를 위하여 규정되는 모듈에 관한 것이다.
또한, 본 발명은 상기 모듈을 포함하는 장치에 관한 것이다.
추가로 본 발명은 주파수 대역에서 음성 신호를 처리하기 위한 방법에 관한 것으로서, 상기 주파수 대역이 적어도 저주파 대역과 고주파 대역으로 나누어지고, 상기 저주파 대역의 음성 신호가 상기 저주파 대역에 관한 신호의 파라미터들을 형성하기 위하여 부호화되고, 상기 고주파 대역의 음성 신호가 상기 고주파 대역에 관한 신호의 파라미터들을 형성하기 위하여 부호화되고, 및 단지 저주파 대역의 제1 모드 신호가 부호화되고, 저주파 대역 및 고주파 대역 모두의 제2 모드 신호가 부호화되는 적어도 제1 모드 및 제2 모드 사이에서 음성 신호를 부호화하기 위하여 모드가 선택된다.
추가로 본 발명은 적어도 저주파 대역과 고주파 대역으로 나누어지는 주파수 대역에서 음성 신호를 압축하고, 상기 저주파 대역의 음성 신호를 인코딩하고, 상기 고주파 대역의 음성 신호를 인코딩하고, 및 단지 저주파 대역의 제1 모드 신호가 부호화되고 및 저주파 대역 및 고주파 대역 모두의 제2 모드 신호가 부호화되는 적어도 제1 모드와 제2 모드 사이에서 인코딩을 위하여 모드를 선택하기 위한 기계 실행 단계들을 포함하는 컴퓨터 프로그램 생성물에 관한 것이다.
추가로 본 발명은 비트 스트림을 포함하는 신호에 관한 것으로서, 상기 비트 스트림은 비트 스트림을 해독하기 위한 디코더를 위한 파라미터를 포함하고, 상기 비트 스트림은 적어도 저주파 대역과 고주파 대역으로 나누어지는 주파수 대역에서 음성 신호의 프레임들로부터 부호화되고, 및 단지 저주파 대역의 제1 모드 신호가 부호화되고 저주파 대역 및 고주파 대역 모두의 제2 모드 신호가 부호화되는 적어도 제1 모드 와 제2 모드가 상기 신호를 위하여 규정된다.
삭제
삭제
많은 음성 신호 처리 애플리케이션에서, 음성 신호들은 음성 신호 처리시 처리 전력 요구를 줄이기 위해 압축된다. 예를 들면, 디지털 통신 시스템에서 음성 신호는 전형적으로 아날로그 신호로 캡처되고, 아날로그 대 디지털(A/D) 변환기에서 디지털화되고 그 다음에 이동국 같은 사용자 장치와 기지국과 사이에서 무선 인터페이스를 통하여 전송되기 전에 부호화된다. 상기 인코딩의 목적은 용인될 만한 신호 질의 레벨을 유지하는 반면 디지털화된 신호를 압축하고 그것을 최소한 양의 데이터로 무선 인터페이스를 통하여 전송하는데에 있다. 이것은 무선 인터페이스를 통한 무선 채널 용량이 셀룰러 통신 네트워크에서 제한되는 경우 특히 중요하다. 또한, 디지털화된 음성 신호가 상기 음성 신호의 나중 재생을 위한 저장 매체에 저장되는 애플리케이션들이 있다.
상기 압축은 손실이 많거나 손실이 없을 수 있다. 손실이 많은 압축에서 어떤 정보는 압축하는 동안에 손실되고 이때 압축된 신호로부터 원래의 신호를 완전히 복원하는 것은 불가능하다. 손실이 없는 압축에서 어떠한 정보도 보통 손실되지 않는다. 따라서, 보통 원래의 신호는 압축된 신호로부터 완전히 복원될 수 있다.
통신 서비스에서 언어(speech)는 흔히 약 200Hz 와 3400Hz 사이에서 대역이 제한된다. 아날로그 언어 신호를 디지털 신호로 변환하기 위하여 A/D 변환기에 의하여 사용되는 전형적인 표본 추출 비율은 8kHz 또는 16kHz이다. 음악이나 비-언어 신호는 보통의 언어 대역폭 위의 주파수 성분을 포함할 것이다. 어떤 애플리케이션에서 음성 시스템은 약 20Hz에서 20,000kHz 사이의 주파수 대역을 다룰 수 있어야 한다. 그러한 종류의 신호를 위한 상기 표본 비율은 에일리어싱(aliasing)을 피하기 위하여 적어도 40,000kHz이어야 한다. 여기서 상기 언급한 값들은 단지 비(非)-제한적인 예라는 것을 주의해야 한다. 예를 들면, 어떤 시스템에서 음악 신호를 위한 더 높은 제한은 상기 20,000kHz 미만이어야 할 것이다.
그 다음에 상기 표본 추출된 디지털 신호는 보통 인코딩을 위하여 사용되는 코덱에 의하여 결정되는 비트율로 디지털 데이터 스트림을 야기하는 프레임 기초에 의한 프레임에서 부호화된다. 비트율이 높을수록, 더 많은 데이터가 부호화되고, 입력 프레임의 더 정확한 표시를 가져온다. 그 다음에 상기 부호화된 음성 신호는 해독되고 가능한 한 본래의 신호에 가까운 신호를 복원하기 위하여 디지털 대 아날로그(D/A) 변환기를 통과하게 된다.
이상적인 코덱은 가능한 한 본래의 음성 신호와 가깝게 들리는 해독된 음성 신호를 생성하지만, 채널 용량을 최적화시킬 수 있도록 가능한 적은 비트율로 음성 신호를 부호화할 것이다. 실제상 보통 코덱의 비트율과 해독된 음성의 질 사이에는 트레이드-오프(trade-off)가 있다.
현재 음성 신호의 압축과 인코딩을 위하여 개발된 적응성 다중-비율(AMR: adaptive multi-rate) 코덱, 적응성 다중-비율 광대역(AMR-WB: adaptive multi-rate wideband) 코덱 및 확장된 적응성 다중-비율 광대역(AMR-WB+: extended adaptive multi-rate wideband) 코덱 등의 많은 다른 코덱들이 있다. AMR은 GSM/EDGE 및 WCDMA 통신 네트워크를 위한 3세대 협력 프로젝트(3GPP)에 의하여 개발되었다. 게다가, AMR은 패킷 교환 네트워크(packet switched network)에서 사용될 것으로 파악된다. AMR은 대수 부호 여진 선형 예측(ACELP: algebraic code excited linear prediction) 코딩에 기반한다. 상기 AMR, AMR WB 및 AMR WB+ 코덱은 각각 8, 9 및 12 능동 비트율로 구성되고 또한 음성 활동 탐지(VAD: voice activity detection)와 불연속적인 전송(DTX) 기능을 포함한다. 바로 그때에, AMR 코덱에서의 상기 표본 추출 비율은 8kHz이고, AMR WB 코덱에서의 표본 추출 비율은 16kHz이다. 상기 언급한 상기 코덱들과, 코덱 모드들 및 표본 추출 비율은 단지 비(非)-제한적인 예라는 점은 명백하다.
음성 코덱 대역폭 확장 알고리즘은 전형적으로 중심 코덱으로부터 코딩 파라미터뿐만 아니라 코딩 기능을 적용한다. 즉, 상기 부호화된 음성 대역폭은 두 개로 나누어지고, 그 중 낮은 대역은 중심 코덱에 의하여 처리되고, 그런 다음 높은 대역은 코딩 파라미터와 중심 대역(즉, 낮은 대역)으로부터의 신호에 관한 정보를 이용하여 부호화된다. 대부분의 경우에 낮은 그리고 높은 음성 대역은 서로 상호 관련성이 있기 때문에, 낮은 대역 파라미터는 어느 정도 높은 대역에서 또한 이용될 수 있다. 높은 대역 코딩을 이용하기 위하여 낮은 대역 코더(coder)로부터의 파라미터를 이용하는 것은 높은 대역 인코딩의 비트율을 현저하게 감소시킨다.
분리 대역 코딩 알고리즘의 예는 확장된 적응성 다중-비율 광대역(AMR-WB+) 코덱이다. 높은 대역 인코더의 LPC 여기 신호가 중심 인코더로부터 복사되거나 국부적으로 생성된 랜덤 신호이지만, 상기 중심 인코더는 완전한 소스 신호 인코딩 알고리즘을 포함하다.
상기 낮은 대역 코딩은 대수 부호 여진 선형 예측(ACELP: algebraic code excited linear prediction) 유형이나 변환 기반 알고리즘을 이용한다. 상기 알고리즘 사이의 선택은 입력 신호 특징들에 기반하여 된다. 주파수 결정을 더 잘 다루기 위하여 신호들과 같은 음악이나 음성톤이 변환 코딩을 이용하여 보통 부호화되는데 반하여, ACELP 알고리즘은 보통 언어 신호를 위하여 및 과도적인 것을 위하여 사용된다.
상기 높은 대역 인코딩은 상기 높은 대역 신호의 스펙트럼 엔벨로프(envelope)를 만들기 위하여 선형 예측 코딩을 이용한다. 비트율을 줄이기 위하여, 여기 신호는 낮은 대역 여기를 높은 대역으로 업 샘플링하는 것에 의하여 생성된다. 즉, 상기 낮은 대역 여기는 높은 대역으로 전환하는 것에 의하여 높은 대역에서 다시 사용된다. 다른 방법은 상기 높은 대역을 위하여 랜덤 여기 신호를 생 성하는 것이다. 상기 합성된 높은 대역 신호는 스케일링된 여기 신호를 높은 대역 LPC 모델을 통하여 여과시키는 것에 의하여 복원된다.
상기 확장된 AMR-WB(AMR-WB+) 코덱은 음성 대역폭이 인코딩 처리 전에 두 개의 부분으로 나누어진 분리 대역 구조를 적용한다. 양 대역은 독립적으로 부호화된다. 그러나 비트율을 최소화하기 위하여, 높은 대역 인코딩의 부분이 낮은 대역 인코딩에 의존적인, 높은 대역이 상기 언급한 대역폭 확장 기법을 이용하여 부호화된다. 이러한 경우에, 선형 예측 코딩(LPC) 합성을 위한 높은 대역 여기 신호는 낮은 대역 인코더로부터 복사된다. 상기 AMR-WB+ 코덱에서, 높은 대역은 16kHz 표본추출 주파수를 위한 경우 6.4에서 8kHz이고, 24kHz 표본추출 주파수를 위한 경우 6.4에서 12kHz인데 반하여, 낮은 대역 영역은 0에서 6.4kHZ이다.
상기 표본추출 주파수가 변화하지 않는다면, 상기 AMR-WB+ 코덱은 음성 스트림 동안에도 모드 사이에서 바뀔 수 있다. 따라서, AMR-WB 모드와 16kHz 표본추출 주파수를 사용하는 상기 확장 모드 사이에서 바뀌는 것은 가능하다. 이러한 기능은 가령 네트워크에서의 혼잡을 줄이기 위하여 전송 환경이 높은 비트율 모드(확장 모드)에서 낮은 비트율 모드(AMR-WB 모드)로 변화하는 것을 요구하는 경우에 사용될 수 있다. 유사하게, 만약 네트워크 환경에서의 변화가 더 좋은 음성 질을 위하여 낮은 비트율 모드에서 높은 비트율 모드로의 변화를 허용한다면, AMR-WB+은 AMR-WB 모드에서 확장 모드의 하나로 변화할 수 있다. 높은 대역 확장 코딩을 이용하는 코딩 모드에서 단지 중심 대역 코딩을 이용하는 모드로의 변화는 그러한 모드 변화가 발생한 즉시 단순히 높은 대역 확장을 끄는 것에 의하여 실현될 수 있 다. 유사하게, 중심 대역 유일 모드에서 높은 대역 확장을 이용하는 모드로 변화할 때, 높은 대역 확장을 켜는 것에 의하여 높은 대역은 전체 규모로 즉시 도입된다. 대역 확장 코딩 때문에 AMR-WB+ 확장 모드에 의하여 제공된 음성 대역폭은, 변화가 매우 빨리 발생한다면 성가신 가청(可聽) 효과를 야기할 수 있는 AMR-WB 모드들의 대역폭보다 넓어진다. 사용자는 특히 넓은 음성 대역에서 좁은 음성 대역으로, 즉 확장 모드에서 AMR-WB 모드로의 변화가 있는 경우 특히 방해하는 가청 음성 대역폭에서의 이러한 변화를 고려할 것이다.
본 발명의 하나의 목적은 다른 대역을 갖는 모드 사이에서 변화하는 경우, 성가신 가청 효과를 줄이기 위하여 인코더에서 음성 신호를 인코딩하기 위한 개선된 방법을 제공하는 것이다.
본 발명은 좁은 대역(AMR-WB 모드)에서 넓은 대역 모드(AMR-WB+)로 변화하는 경우 매우 빠른 변화를 피하기 위하여 높은 대역 확장은 즉시 켜지는 것이 아니라 진폭이 단지 점진적으로 최종 규모로 증가한다는 사상에 기반한다. 유사하게, 넓은 대역 모드에서 좁은 모드로 변화하는 경우, 높은 대역 확장 분배는 방해 효과를 피하기 위하여 즉시 꺼지지 않고 점진적으로 규모가 줄어든다.
본 발명에 따르면, 상기 높은 대역 확장 신호의 그러한 점진적인 도입은 높은 대역 합성에 사용되는 여기 이득을 선택 시간 윈도우 내에서 영에서 일로 작은 단차를 가지고 증가하는 스케일링 계수로 증가시키는 것에 의하여 파라미터 레벨에서 실현된다. 즉 AMR-WB+ 코덱에서 320ms의 원도우 길이(80ms AMR-WB+ 프레임 4개)는 높은 대역 음성 분배의 충분히 느린 상승을 제공하는 것으로 기대될 수 있다. 높은 대역 음성 분배의 상승에서와 같은 방법으로, 또한 높은 대역 신호의 점진적인 종료는 높은 대역 합성에 사용되는 여기 이득을 작은 단계에서 선택 주기의 시간 동안 일에서 영으로 감소하는 스케일링 계수로 증가시키는 것에 의하여 파라미터 레벨에서 실현될 수 있다. 그러나 이러한 경우에 일단 중심 대역 유일 모드로 실질적인 변환이 발생하면, 이용 가능한 높은 대역 확장을 위한 파라미터를 업데이트하지 않는다. 그러나 높은 대역 합성은 중심 모드로 변화하기 전에 마지막 프레임을 위하여 수신되는 높은 대역 확장 파라미터와 상기 중심 대역 유일 모드에 수신된 프레임들로부터 얻은 여기 신호를 이용하는 것에 의하여 수행될 수 있다. 이러한 방법의 근소하게 변형된 버전은 LPC 필터의 주파수 응답이 점진적으로 더욱 평면 스펙트럼 쪽으로 강제되는 방법으로 변경한 후에 높은 대역 합성에 사용된 상기 LPC 파라미터를 변형할 것이다. 이것은 가령 실질적으로 수신된 LPC 필터와 IPS 영역에서 평면 스펙트럼을 제공하는 LPC 필터의 가중 평균을 계산하는 것에 의하여 실현될 수 있다. 이러한 접근은 높은 대역 확장 파라미터를 갖는 마지막 프레임이 클리어 스펙트럼 피크(들)을 우연히 포함하는 경우 개선된 음성 질을 제공할 것이다.
본 발명에 따르면 상기 방법은 시간 영역에서의 직접적인 스케일링과 같은 유사한 효과를 제공하지만, 상기 파라미터 레벨에서 스케일링을 수행하는 것이 계산적으로 보다 효과적인 해결이다.
본 발명에 따르면, 상기 모듈은 인코더가 인코더의 동작 모드에서의 변화와 함께 상기 고주파 대역에 관한 신호의 적어도 하나의 파라미터를 점진적으로 변화시키기 위하여 스케일러를 더 포함하는 것을 주로 특징으로 한다.
삭제
삭제
본 발명에 따르면, 상기 방법은 상기 고주파 대역에 관한 신호의 적어도 하나의 파라미터가 상기 동작 모드의 변화와 함께 점진적으로 변화되는 것을 특징으로 한다.
삭제
본 발명에 따르면, 상기 컴퓨터 프로그램 생성물은 컴퓨터 프로그램 생성물이 동작 모드에서의 변화와 함께 인코딩 속성을 점진적으로 변화시키기 위하여 기계 실행 단계를 더 포함하는 것을 주로 특징으로 한다.
본 발명에 따르면, 상기 신호는 상기 제1 모드와 상기 제2 모드 사이에서의 모드 변화에서 상기 고주파에 관한 신호의 적어도 하나의 파라미터가 점진적으로 변화되는 것을 주로 특징으로 한다.
상기 제시된 종래 기술의 접근과 비교하여, 본 발명은 다른 대역 모드 사이에서의 변화 때문에 가능한 가청 효과를 줄이기 위한 해법을 제공한다. 따라서, 상기 음성 신호의 질은 개선될 수 있다. 본 발명은 시간 영역에서의 직접적인 스케일링과 같은 유사한 기능을 수행하지만, 파라미터 레벨에서 스케일링을 수행하는 것이 계산적으로 보다 효율적인 해법이다.
도 1은 본 발명에 따른 두 개의 대역 필터 뱅크와 각 음성 대역을 위한 분리된 인코딩 및 디코딩 블록을 이용하는 분리된 대역 인코딩 디코딩 개념에 대한 단순화된 다이어그램을 나타내고;
도 2는 본 발명에 따른 인코딩 장치의 실시예를 나타내고;
도 3은 본 발명에 따른 디코딩 장치의 실시예를 나타내고;
도 4a는 종래 기술의 인코더에서 좁은 대역에서 넓은 대역으로의 대역 변화의 스펙트럼 사진을 나타내고;
도 4b는 본 발명의 실시예의 인코더에서 좁은 대역에서 넓은 대역으로의 대역 변화의 스펙트럼 사진을 나타내고;
도 4c는 종래 기술 인코더 및 본 발명의 실시예의 인코더에서 좁은 대역에서 넓은 대역으로 대역이 변화하는 경우, 시간 축에 따라 부호화된 높은 대역 신호의 에너지를 나타내고;
도 5a는 종래 기술 인코더에서 넓은 대역에서 좁은 대역으로 변화하는 대역의 스펙트럼 사진을 나타내고;
도 5b는 본 발명의 실시예의 인코더에서 넓은 대역에서 좁은 대역으로 변화하는 대역의 스펙트럼 사진을 나타내고;
도 5c는 종래 기술 인코더 및 본 발명의 실시예의 인코더에서 넓은 대역에서 좁은 대역으로 대역이 변화되는 경우, 시간 축에 따라 부호화된 대역 신호의 에너지를 나타내고; 및
도 6은 본 발명에 따른 시스템의 예를 나타낸다.
도 1은 두 개의 대역 필터 뱅크 및 각 음성 대역을 위한 분리 인코딩과 디코딩 블록을 이용하는 본 발명의 실시예에 따른 분리 대역 인코딩과 디코딩 개념을 나타낸다. 신호 소스(1.2)로부터의 입력 신호는 상기 음성 대역이 적어도 두 개의 음성 대역 즉, 저주파 음성 대역과 고주파 음성 대역으로 나누어지는 분석 필터(1.3)를 통하여 처리되고 임계적으로 다운 샘플링된다. 그 다음에 각각 상기 저주파 음성 대역은 제1 인코딩 블록(1.4.1)에서 부호화되고 상기 고주파 음성 대역은 제2 인코딩 블록(1.4.2)에서 부호화된다. 상기 음성 대역은 실질적으로 서로 독립적으로 부호화된다. 상기 다중화된 비트 스트림은 통신 채널(2)을 통하여 전송 장치(1)로부터 낮은 대역 및 높은 대역이 제1 디코딩 블록(3.3.1) 및 제2 디코딩 블록(3.3.2)에서 각각 독립적으로 해독되는 수신 장치(3)로 전송된다. 상기 해독된 신호는 합성 필터 뱅크(3.4)가 합성된 음성 신호(3.5)를 형성하기 위하여 해독된 음성 신호를 결합한 후에 원래의 표본 추출 주파수로 업 샘플링된다.
16kHz 표본 추출된 음성 신호에서 동작하는 AMR-WB+의 경우에 8kHz 음성 대역은 0-6.4 및 6.4-8kHz 대역으로 분리된다. 상기 분석 필터(1.3) 후에 임계적인 다운 샘플링이 사용된다. 즉, 낮은 대역은 12.8kHz(=2*(0-6.4))로 다운 샘플링되 고 높은 대역은 3.2kHz(=2*(8-6.4))로 다시 샘플링된다.
상기 제2 인코딩 블록(1.4.2)(높은 대역 인코더) 및 제2 디코딩 블록(3.3.2)(높은 대역 디코더)이 독립 코딩 알고리즘이나 대역폭 확장 알고리즘 또는 그것들의 결합 중 어느 하나로써 실행될 수 있는데 반하여, 상기 제1 인코딩 블록(1.4.1)(낮은 대역 인코더) 및 제1 디코딩 블록(3.3.1)(낮은 대역 디코더)은 가령 AMR-WB 표준 인코더 및 디코더일 수 있다.
다음에 본 발명의 실시예에 따른, 인코딩 장치(1)는 도 2를 참조하여 더욱 자세히 설명될 것이다. 상기 인코딩 장치(1)는 필요 시 입력 신호의 디지털화, 필터링 및 프레이밍(framing)을 위해 입력 블록(1.2)을 포함한다. 상기 입력 신호의 디지털화는 입력 표본 추출 주파수에서 입력 표본 추출기(1.2.1)에 의하여 수행된다. 상기 입력 표본 추출기 주파수는 16kHz 또는 24kHz 중 하나의 실시예에 있지만 다른 표본 추출 주파수가 또한 사용될 수 있다는 점은 명백하다. 상기 입력 신호는 이미 인코딩 과정에 적합한 형태일 것이라는 점을 여기서 주의해야 한다. 예를 들면, 상기 입력 신호는 초기 단계에서 디지털화되고 메모리 매체(미도시)에 저장될 수 있다. 상기 입력 신호의 프레임들은 분석 필터(1.3)에 대한 입력이다. 상기 분석 필터(1.3)는 음성 대역이 두 개 이상의 음성 대역으로 나누어지는 필터 뱅크를 포함한다. 이러한 실시예에서 필터 뱅크는 제1 필터(1.3.1) 및 제2 필터(1.3.2)를 포함한다. 상기 제1 필터(1.3.1)는 가령 낮은 음성 대역의 상한에서 차단 주파수를 갖는 저역 통과 필터이다. 상기 차단 주파수는 가령 약 6.4kHz이다. 상기 제2 필터(1.3.2)는 가령 제1 필터(1.3.1)의 차단 주파수에서 음성 대역 의 상한까지의 대역폭을 갖는 대역 통과 필터이다. 상기 대역폭은 예를 들면, 16kHz 표본 추출 주파수에 대하여 6.4kHz-8kHz이고, 24kHz 표본 추출 주파수에 대하여 6.4kHz-12kHz이다. 또한, 인코더(1.4)의 입력에서 상기 음성 신호의 주파수 대역이 상기 표본 추출 주파수의 절반보다 낮거나 같다면, 즉 상기 상한 아래의 주파수만이 분석 필터(1.3)를 통과하는 경우, 제2 필터(1.3.2)가 고역 통과 필터라는 것이 가능하다. 또한, 음성 대역이 둘 이상의 음성 대역으로 나누어지고 상기 분석 필터가 각 음성 대역을 위한 필터를 포함할 것이라는 것은 가능하다. 그러나 다음에서 단지 두 개의 음성 대역이 사용된다는 점이 가정된다.
상기 필터 뱅크의 출력은 상기 음성 신호의 전송을 위해 필요한 비트율을 줄이기 위하여 결정적으로 다운 샘플링된다. 상기 제1 필터(1.3.1)의 출력은 제1 표본 추출기(1.3.3)에서 다운 샘플링되고 상기 제2 필터(1.3.2)의 출력은 제2 표본 추출기(1.3.4)에서 다운 샘플링된다. 상기 제1 표본 추출기(1.3.3)의 표본 추출 주파수는 가령 제1 필터(1.3.1)의 대역의 절반이다. 상기 제2 표본 추출기(1.3.4)의 표본 추출 주파수는 가령 제2 필터(1.3.2)의 대역의 절반이다. 이러한 실시예에서 상기 제1 표본 추출기(1.3.3)의 표본 추출 주파수는 12.8kHz이고, 상기 제2 표본 추출기(1.3.4)의 표본 추출 주파수는 입력 음성 신호의 16kHz 표본 추출 주파수의 경우에는 6,4kHz이고 입력 음성 신호의 24kHz 표본 추출 주파수의 경우에는 11.2kHz이다.
상기 제1 표본 추출기(1.3.3)로부터의 표본들은 인코딩을 위한 상기 제1 인코딩 블록(1.4.1)에 대한 입력이다. 상기 제2 표본 추출기(1.3.4)로부터의 표본들 은 인코딩을 위한 상기 제2 인코딩 블록(1.4.2)에 대한 입력이다. 제1 인코딩 블록(1.4.1)은 어느 여기 방법이 입력 신호를 인코딩하는데 가장 적합한 방법인지를 결정하기 위하여 상기 표본들을 분석한다. 두 개 이상의 여기 방법이 선택될 수 있다. 예를 들면, 제1 여기 방법은 비-언어(또는 비-언어 같은) 신호(가령, 음악)를 위하여 선택되고 제2 여기 방법은 언어(또는 언어 같은) 신호를 위하여 선택된다. 상기 제1 여기 방법은 가령 TCX 여기 신호를 생성하고, 제2 여기 방법은 가령 ACLEP 여기 신호를 생성한다.
상기 여기 방법을 선택한 후에 상기 입력 신호와 가장 잘 조화되는 그러한 파라미터 설정을 찾기 위하여 LPC 분석은 프레임 단위에 의한 표본들의 제1 인코딩 블록(1.4.1)에서 수행된다. 이것을 하기 위하여 어떤 대안적인 방법이 있고 그것들은 당업자에게 알려지는 것으로서 이 출원에서 LPC 분석의 상세한 내용을 설명하는 것은 불필요하다.
선택된 여기 방법에 대한 정보와 LPC 파라미터들은 제2 인코딩 블록(1.4.2)에 전달된다. 제2 인코딩 블록(1.4.2)에서 제1 인코딩 블록(1.4.1)에서 생성된 같은 여기를 사용한다. 이러한 실시예에서, 상기 제2 인코딩 블록(1.4.2)을 위한 상기 여기 신호는 저주파 음성 대역 여기를 고주파 음성 대역으로 업-샘플링하는 것에 의하여 생성된다. 즉, 낮은 대역 여기는 그것을 고주파 음성 대역에 보내는 것에 의하여 높은 대역에서 다시 사용된다. AMR-WB+ 코덱에서 고주파 음성 신호를 설명하는데 사용되는 상기 파라미터들은 합성된 신호의 스펙트럼 특성을 규정하는 LPC 합성 필터들이고, 합성된 음성의 진폭을 제어하는 여기 신호를 위한 일련의 이 득 파라미터들이다.
제1 인코딩 블록(1.4.1) 및 제2 인코딩 블록(1.4.2)에 의하여 생성된 LPC 파라미터들과 여기 파라미터들은 예를 들면 양자화 및 채널 인코딩 블록(1.5)에서 양자화 및 채널 부호화되고 전송 전에, 즉 통신 네트워크(604)(도 6)와 같은 전송 채널에 전송되기 전에 스트림 생성 블록(1.6)에 의하여 같은 전송 스트림에서 결합(다중화)된다. 그러나 파라미터를 전송하는 것은 필요하지 않지만, 가령 그것들은 저장 매체에 저장될 수 있고 나중 단계에 전송 및/또는 디코딩을 위하여 검색될 수 있다.
다음으로, 본 발명의 실시예에 따른 방법은 제1 인코딩 모드와 제2 인코딩 모드 사이의 변화가 수행되는 경우 더욱 자세히 설명될 것이다. 제1 인코딩 모드는 예를 들면, 좁은 대역 인코딩 모드이고 제2 인코딩 모드는 가령 넓은 대역 인코딩 모드이다.
모드 변화가 지속하는 시간의 길이를 나타내는 시간 파라미터(T)가 규정된다. 상기 시간 파라미터(T)는 인코딩을 보다 점진적으로 변화시키는데 사용된다. 상기 시간 파라미터의 값은 예를 들면, 프레임 길이 F(AMR-WB+ 인코더에서 80ms)의 네 배와 같은 320ms이다. 또한, 시간 파라미터(T)를 위한 다른 값이 사용될 수 있다는 점은 명백하다. 또한, 승수 M 및 단계 값 S는 모드가 변화하는 동안 제2 인코딩 블록에 의하여 사용되도록 규정된다. 상기 단계 값은 얼마나 큰 단계가 모드 변화에 사용되는지를 나타내기 위하여 정의된다. 예를 들면, 시간 파라미터(T)가 4 개의 프례임들(4*FL)과 같다면, 상기 단계 값은 0.25(=1/4)이다. 즉, 상기 단계 값은 프레임 길이를 시간 파라미터로 나누는 것(=F/T)에 의하여 계산될 수 있다.
먼저, 상기 인코더(1)는 제1 인코딩 모드를 사용하고 제2 인코딩 모드로 변화가 수행된다는 것이 가정된다. 상기 저주파 음성 신호의 인코딩은 상기와 같이 제1 인코딩 블록(1.4.1)에서 계속된다. 모드 표시기(미도시)는 제2 인코딩 모드가 선택된 것을 나타내는 상태로 설정된다. 게다가, 상기 인코딩 모드 및 LPC 파라미터 및 필요하다면, 제1 인코딩 블록(1.4.1)으로부터의 다른 파라미터의 정보는 제2 인코딩 블록(1.4.2)으로 전달된다. 제2 인코딩 블록(1.4.2)에서 수신 LPC 파라미터들은 그와 같이 사용되지 않지만, 적어도 어떤 파라미터들로의 변형은 수행된다. 상기 승수 M은 0으로 설정된다. 그 다음에 일련의 LPC 이득 파라미터는 상기 일련의 LPC 이득 파라미터들을 승수 M으로 곱하는 것에 의하여 변형된다. 상기 변형된 LPC 파라미터는 현재 프레임(일련의 표본들)의 인코딩 과정에서 제2 인코딩 블록(1.4.2)에 의하여 사용된다. 그 다음에, 다음 프레임을 위하여, 승수M은 단계 값 S에 의하여 더해지고 일련의 LPC 이득 파라미터들은 상기와 같이 변형된다. 값 1은 사용되고 인코더(1)의 동작의 제2 인코딩 모드(넓은 대역 모드)가 계속되는 상기 과정은 상기 승수 M이 값 1에 도달할 때까지 각 연속적인 프레임을 반복한다.
다음으로, 상기 인코더(1)는 제2 인코딩 모드를 사용하고 제1 인코딩 모드로의 변화가 수행된다는 것이 가정된다. 상기 저주파 음성 신호의 인코딩은 상기와 같이 제1 인코딩 블록(1.4.1)에서 계속된다. 모드 표시기는 제1 인코딩 모드가 선택된 것을 나타내는 상태로 설정된다. 이러한 단계에서, 상기 인코딩 모드 및 LPC 파라미터에 대한 정보는 보통 제1 인코딩 블록(1.4.1)에서 제2 인코딩 블록(1.4.2) 으로 전달되지 않는다. 따라서, 동작하기 위한 인코딩 모드에서의 점진적인 변화를 위하여, 어떤 준비가 필요하다. 제1 대안에서 제2 인코딩 블록(1.4.2)은 모드 변화 전에 마지막 프레임을 인코딩하는데 사용되는 LPC 파라미터를 저장한다. 그 다음에, 승수 M은 1로 설정되고, 일련의 LPC 이득 파라미터는 승수 M을 승산하고 상기 변형된 일련의 LPC 이득 파라미터들은 모드 변화 후에 첫 번째 프레임을 인코딩하는데 사용된다. 다음 프레임을 위하여 승수 M의 값은 단계 값 S에 의하여 감소하고, 일련의 LPC 파라미터들은 승수 M에 의하여 승산되고 및 상기 인코딩은 그러한 프레임을 위하여 수행된다. 상기 단계(승수 값을 변화시키고, 일련의 LPC 파라미터들을 변형시키고 및 프레임을 위한 인코딩을 수행하는 것)는 상기 승수가 값 0에 도달할 때까지 반복된다. 그 다음에 제1 인코딩 블록(1.4.1)은 인코딩 과정을 계속한다.
예로서, 업 스케일링과 다운 스케일링에 사용되는 벡터는 다음과 같을 수 있다. 상기 벡터는 하나의 요소가 5ms 하위프레임에 사용되는 것을 의미하는 64개의 요소를 포함한다. 이것은 업/다운 스케일링 이 320ms 동안 수행된다는 것을 의미한다.
gain_hf_ramp[64]=
{0.01538461538462, 0.03076923076923,
0.04615384615385, 0.06153846153846,
0.07692307692308, 0.09230769230769,
0.10769230769231, 0.12307692307692,
0.13846153846154, 0.15384615384615,
0.16923076923077, 0.18461538461538,
0.20000000000000, 0.21538461538462,
0.23076923076923, 0.24615384615385,
0.26153846153846, 0.27692307692308,
0.29230769230769, 0.30769230769231,
0.32307692307692, 0.33846153846154,
0.35384615384615, 0.36923076923077,
0.38461538461538, 0.40000000000000,
0.41538461538462, 0.43076923076923,
0.44615384615385, 0.46153846153846,
0.47692307692308, 0.49230769230769,
0.50769230769231, 0.52307692307692,
0.53846153846154, 0.55384615384615,
0.56923076923077, 0.58461538461538,
0.60000000000000, 0.61538461538462,
0.63076923076923, 0.64615384615385,
0.66153846153846, 0.67692307692308,
0.69230769230769, 0.70769230769231,
0.72307692307692, 0.73846153846154,
0.75384615384615, 0.76923076923077,
0.78461538461538, 0.80000000000000,
0.81538461538462, 0.83076923076923,
0.84615384615385, 0.86153846153846,
0.87692307692308, 0.89230769230769,
0.90769230769231, 0.92307692307692,
0.93846153846154, 0.95384615384615,
0.96923076923077, 0.98461538461538}
제2 인코딩 블록(1.4.2)에 있는 고주파 대역을 업 스케일링하는 경우, 제2 인코딩 블록(1.4.2)의 여기 이득은 인덱스가 스케일링 벡터에서 가리키는 경우의 값들 중 하나에 의하여 승산된다. 상기 인덱스 값은 5ms 부호화된 하위프레임의 수이다. 따라서 모드가 변화한 후에, 제1 하위프레임(5ms)에서 제2 인코딩 블록(1.4.2)의 여기 이득은 스케일링 벡터의 제1 요소에 의하여 승산된다. 제2 하위프레임(5ms)에서, 상기 제2 인코딩 블록(1.4.2)의 여기 이득은 상기 스케일링 벡터의 제2 요소 등에 의하여 승산된다.
제2 인코딩 블록(1.4.2)에서 고주파 대역을 다운 스케일링하는 경우, 제2 인코딩 블록(1.4.2)의 여기 이득은 인덱스가 스케일링 벡터에서 가리키는 경우의 값들 중 하나에 의하여 역시 승산된다. 상기 인덱스 값은 5ms 부호화된 하위프레임의 수이지만, 상기 인덱스 포인터는 역전된다. 따라서, 모드가 변화한 후에, 제1 하위프레임(5ms)에서, 제2 인코딩 블록(1.4.2)의 여기 이득은 상기 스케일링 벡터 의 마지막 요소에 의하여 승산된다. 제2 하위프레임(5ms)에서, 제2 인코딩 블록(1.4.2)의 여기 이득은 상기 스케일링 벡터의 제2 마지막 요소에 의하여 승산된다.
상기 고주파 대역을 다운 스케일링하는 경우(가령 모드를 AMR-WB+에서 AMR-WB로 변화시키는 경우), 제2 인코딩 블록(1.4.2)의 마지막 부호화된 언어 파라미터(LPC 파라미터, 여기 및 여기 이득)는 동작 모드가 제2 인코딩 블록(1.4.2) 없이 사용되는 경우 제1 320ms 동안에 고주파 대역을 생성하는데 사용된다.
예시적인 의사(pseudo) 부호는 다음과 같다.
ExcGain2 = ExcGain2*gain_hf_ramp(ind)
Exc_hf(1:n) = ExcGain2*Exc_lf(1:n)
Output_hf = synth(LPC_hf, exc_hf, mem),
이때,
ExcGain2 = 제 2 인코딩 블록에서의 여기 이득
gain_hf_ramp = 스케일링 벡터
Exc_lf = 제1 인코딩 블록으로부터의 여기 벡터(대역 0-6,4kHz)
Exc_hf = 제2 인코딩 블록으로부터의 여기 벡터(대역 6,4-8,OkHz)
Output_hf = 고주파 대역의 합성된 신호
Synth = 합성된 신호를 만드는 함수
LPC = LP 필터 계수
Mem = LP 필터의 메모리
이러한 방법의 근소하게 변형된 버전은 LPC 필터의 주파수 응답이 점진적으로 더욱 평면 스펙트럼 쪽으로 강제되는 방법으로 변경 후에 고주파 음성 대역 합성에 사용되는 상기 LPC 파라미터를 변형할 것이다. 이것은 가령, 실질적으로 수신된 LPC 필터와 ISP 영역에서 평면 스펙트럼을 제공하는 LPC 필터의 가중 평균을 계산하는 것에 의하여 실현될 수 있다. 이러한 접근은 넓은 대역폭 확장 파라미터를 갖는 마지막 프레임이 클리어 스펙트럼 피크(들)을 우연히 포함하는 경우 개선된 음성 질을 제공할 것이다.
상기 업/다운 스케일링은 가령, LPC나 다른 파라미터에 기반하는 음성 신호 특징에 기반하여 적응할 수 있게 된다. 또한, 선형 스케일링 벡터 대신에, 상기 스케일링 벡터는 비선형일 수 있다. 상기 스케일링 벡터는 업 및 다운 스케일링별로 다르다.
다음으로, 본 발명에 따른 상기 디코딩 장치(3)는 도 3을 참조하여 설명될 것이다. 상기 부호화된 음성 신호는 전송 채널(2)로부터 수신된다. 상기 역 다중화기(3.1)는 저주파 음성 대역에 속하는 파라미터 정보를 제1 비트 스트림으로 역 다중화하고 고주파 음성 대역에 속하는 파라미터 정보를 제2 비트 스트림으로 역 다중화한다. 그 다음에 상기 비트 스트림은 필요 시, 채널 디코딩 및 역 양자화 블록(3.2)에서 채널 해독되고 역 다중화된다.
상기 제1 채널 해독 비트 스트림은 제1 인코딩 블록(1.4.1)에 의하여 생성된 LPC 파라미터들 및 여기 파라미터들을 포함하고, 넓은 대역 모드가 사용되는 경우, 제2 채널 해독 비트 스트림은 제2 인코딩 블록(1.4.2)에 의하여 생성된 일련의 LPC 이득 및 다른 LPC 파라미터들(LPC 필터의 속성을 설명하는 파라미터들)을 포함한다.
제1 비트 스트림은 합성된 저주파 음성 대역 신호를 형성하기 위하여 수신 LPC 이득 및 다른 파라미터들에 따라서 LPC 필터링(낮은 대역 LPC 합성 필터링)을 수행하는 제1 디코딩 블록(3.3)에 대한 입력이다. 필터(3.3.1) 후에, 해독되고 여과된 신호를 본래의 표본 추출 주파수로 표본 추출하기 위한 제1 업-표본 추출기(3.3.2)가 있다.
비트 스트림에 제시되는 경우, 제2 비트 스트림은 합성 고주파 음성 대역 신호를 형성하기 위하여 수신 LPC 이득 및 다른 파라미터들에 따라서 LPC 필터링(높은 대역 LPC 합성 필터링)을 수행하는 제2 디코딩 블록(3.4)에 대한 입력이다. 제1 비트 스트림의 여기 파라미터들은 배율기(3.4.1)에서 일련의 LPC 이득 파라미터로 승산된다. 상기 승산된 여기 파라미터는 제2 비트 스트림의 다른 LPC 파라미터들 또한 입력되는 필터(3.4.2)에 대한 입력이다. 상기 필터(3.4.2)는 필터(3.4.2)에 대한 파라미터 입력의 기초하에 고주파 음성 대역 신호를 재구성한다. 필터(3.4.2) 후에 해독되고 여과된 신호를 본래의 표본 추출 주파수로 표본 추출하기 위한 제2 업-표본 추출기(3.4.3)가 있다.
제1 업-표본 추출기(3.3.2)의 출력은 합성 필터 뱅크(3.5)의 제1 필터(3.5.1)와 연결된다. 제2 업-표본 추출기(3.4.3)의 출력은 합성 필터 뱅크(3.5)의 제2 필터(3.5.2)와 연결된다. 상기 제1 필터(3.5.1) 및 제2 필터(3.5.2)의 출 력은 합성 필터 뱅크(3.5)의 출력으로서 연결되는 것으로서 상기 출력 신호는 음성 신호를 부호화하는데 사용되는 모드에 의존하는 넓거나 좁은 대역인, 재구성된 음성 신호이다.
부호화된 음성 신호가 도 1에서와 같이 통신 채널(2)로부터 수신될 필요가 없다는 것은 명백하지만, 그것은 미리 저장 매체에 저장된 부호화된 비트 스트림일 수 있다.
상기 설명한 바와 같이, 본 발명은 높은 대역 확장 코딩을 사용하는 코딩 모드를 단지 중심 대역 코딩을 사용하는 모드로 변화시키는 때에 높은 대역 확장 분배를 점진적으로 끄는 방법을 제공한다. 상대적으로 짧은 주기의 시간 가령, 몇백 밀리 초 동안에 높은 대역 분배의 진폭을 하나씩 완전한 용량에서 0으로 변화시키는 것은 음성 대역폭에서의 변화를 더 부드럽게 하고, 사용자에게 덜 두드러질 것이고, 개선된 음성 질을 제공할 것이다. 같은 방법으로 단지 중심 대역 모드로부터 높은 대역 확장 코딩을 사용하는 모드로 상기 변화가 발생할 때, 상기 높은 대역 분배가 완전한 용량으로 즉시 도입되지 않지만 개선된 음성 질을 갖는 부드러운 변화를 도입하기 위하여 상대적으로 짧은 시간 윈도우 동안 그것의 진폭은 작은 단계에서 0에서 완전한 용량으로 스케일링 된다.
설사 상기 발명이 주로 16kHz 표본 추출된 음성에 사용될지라도, 24kHz 표본 추출된 음성 신호는 도 4a 내지 도 5c의 변화 예에서 사용된다. 따라서, AMR-WB+는 24kHz 표본 추출된 음성 신호에서 동작한다. 상기 12kHz 음성 대역은 0-6.4 와 6.4-12kHz 대역으로 분리된다. 상기 임계적인 다운 표본 추출은 상기 필터 뱅크 후에 사용된다. 즉, 상기 낮은 대역은 12.8kHz로 다운 샘플링되고 상기 높은 대역은 11.2kHz(=2*(12-6.4))로 다시 표본 추출된다.
도 4a는 좁은 대역에서 넓은 대역으로 변화하는 종래 기술이 수행되는 것을 나타내고 도 4b는 본 발명에 따른 변화가 수행되는 것을 나타낸다. 도 4c는 종래-기술의 경우와 본 발명에 따른 변화에서 부호화된 높은 대역 신호의 총 에너지를 나타낸다.
도 5a는 넓은 대역에서 좁은 대역으로 변화하는 종래 기술이 수행되는 경우를 나타내고 도 5b는 본 발명에 따른 변화가 수행되는 경우를 나타낸다. 도 5c는 종래 기술 및 본 발명에 따른 변화에 있어서 부호화된 높은 대역 신호의 총 에너지를 나타낸다.
도 6은 본 발명에 따른 분리 대역 인코딩 및 디코딩 처리가 적용될 수 있는 시스템의 예를 나타낸다. 상기 시스템은 언어 및/또는 비-언어 음성 신호를 생성하는 하나 이상의 음성 소스(601)를 포함한다. 상기 음성 신호는 필요시에 A/D 변환기(602)에 의하여 디지털 신호로 변환된다. 상기 디지털화된 신호는 인코딩이 본 발명에 따라 수행되는 전송 장치(600)의 인코더(603)에 대한 입력이다. 또한, 상기 부호화된 신호는 필요 시 인코더(603)에서의 전송을 위하여 양자화되고 부호화된다. 전송기(604), 예를 들면 이동 통신 장치(600)의 전송기는 압축되고 부호화된 신호를 통신 네트워크(605)에 전송한다. 상기 신호는 통신 네트워크(605)로부터 수신 장치(606)의 수신기(607)에 의하여 수신된다. 상기 수신된 신호는 수신기(607)로부터 디코딩, 역 양자화 및 역 압축을 위한 디코더(608)로 전달된다. 상 기 디코더(608)는 합성 음성 신호를 형성하기 위하여 수신된 비트 스트림의 역 압축을 수행한다. 그 다음에 상기 합성된 음성 신호는 음성으로 가령, 확성기(609)에서 음성으로 변형된다.
본 발명은 다른 종류의 시스템에서 특히, 종래 기술 시스템에서보다 효율적인 압축을 실현하기 위하여 낮은 비율의 전송에서 실행될 수 있다. 본 발명에 따른 상기 인코더(1)는 통신 시스템의 다른 부분에서 실행될 수 있다. 예를 들면, 인코더(1)는 신호 처리 가능성을 제한하는 이동 통신 장치에서 실행될 수 있다.
본 발명은 적어도 본 발명의 방법의 어떤 부분을 수행하기 위한 기계 실행 단계를 포함하는 컴퓨터 프로그램 생성물로서 적어도 부분적으로 실행될 수 있다. 상기 인코딩 장치(1) 및 디코딩 장치(3)는 제어 블록, 예를 들면 컴퓨터 프로그램이 이용될 수 있는 디지털 신호 처리 및/또는 마이크로프로세서를 포함한다.
본 발명이 상기 서술한 실시예에 단지 한정되지 않는다는 것은 명백하고 첨부된 청구 범위의 영역 내에서 변형될 수 있다.

Claims (30)

  1. 비트 스트림을 처리하기 위한 장치로서,
    상기 비트 스트림은 적어도 저주파 대역과 고주파 대역으로 나누어지는 주파수 대역에서 음성 신호의 프레임들로부터 부호화된 비트 스트림을 해독하기 위한 파라미터들을 포함하고, 그리고 제1 모드에서는 저주파 대역 상의 신호만이 부호화되고 제2 모드에서는 저주파 대역 상의 신호 및 고주파 대역 상의 신호 모두가 부호화되어, 적어도 제1 모드와 제2 모드가 상기 음성 신호를 위하여 규정되며,
    상기 장치는 장치의 동작 모드에서의 변화와 함께 상기 고주파 대역에 관한 신호의 수신된 파라미터들의 적어도 하나를 점진적으로 변화시키기 위하여 스케일러를 포함하는 것을 특징으로 하는 장치.
  2. 제1항에 있어서,
    상기 고주파 대역에 관한 신호의 파라미터들이 이득 파라미터를 포함하며, 상기 스케일러가 상기 장치의 동작 모드에서의 변화와 함께 상기 이득 파라미터를 점진적으로 변화시키기 위하여 계산 요소를 포함하는 것을 특징으로 하는 장치.
  3. 제1항 또는 제2항에 있어서, 상기 장치가 디코더의 부분인 것을 특징으로 하는 장치.
  4. 제1항 또는 제2항에 있어서, 상기 장치가 인코더의 부분인 것을 특징으로 하는 장치.
  5. 제1항 또는 제2항에 있어서, 시간 파라미터(T)가 상기 모드 변화가 지속하는 시간의 길이를 나타내는 것으로 규정되는 것을 특징으로 하는 장치.
  6. 제5항에 있어서, 상기 시간 파라미터(T)를 위하여 규정된 값이 320ms인 것을 특징으로 하는 장치.
  7. 제5항에 있어서, 상기 단차 값(S)이 상기 파라미터들의 점진적인 변화에서 얼마나 큰 단차가 사용되는 지를 나타내는 것으로 규정되는 것을 특징으로 하는 장치.
  8. 제7항에 있어서, 상기 단차 값(S)이 64 단차들에서 상기 인코딩 속성의 변화가 점진적으로 실행되는 것을 나타내는 것으로 규정되는 것을 특징으로 하는 장치.
  9. 제1항 또는 제2항에 있어서, 상기 음성 신호를 추출하고 상기 추출된 음성신호의 프레임을 형성하기 위한 표본 추출기(1.2)를 포함하는 것을 특징으로 하는 장치.
  10. 제5항에 있어서, 상기 시간 파라미터(T)가 상기 모드 변화가 지속하는 프레임들의 수를 나타내는 것으로 규정되는 것을 특징으로 하는 장치.
  11. 제1항 또는 제2항에 있어서, 상기 점진적으로 변화된 파라미터들이 여기, LPC 및 이득 파라미터들을 포함하는 것을 특징으로 하는 장치.
  12. 비트 스트림을 처리하기 위한 장치를 포함하는 기기(600)로서,
    상기 비트 스트림은 적어도 저주파 대역과 고주파 대역으로 나누어지는 주파수 대역에서 음성 신호의 프레임들로부터 부호화된 비트 스트림을 해독하기 위한 파라미터들을 포함하고, 그리고 제1 모드에서는 저주파 대역 상의 신호만이 부호화되고 제2 모드에서는 저주파 대역 상의 신호 및 고주파 대역 상의 신호 모두가 부호화되어, 적어도 제1 모드와 제2 모드가 상기 음성 신호를 위하여 규정되며,
    상기 기기는 상기 장치의 동작 모드에서의 변화와 함께 상기 고주파 대역에 관한 신호의 수신된 파라미터들의 적어도 하나를 점진적으로 변화시키기 위하여 스케일러를 포함하는 것을 특징으로 하는 기기.
  13. 제12항에 있어서, 상기 기기는 무선 통신 장치인 것을 특징으로 하는 기기.
  14. 비트 스트림을 처리하기 위한 코덱으로서,
    상기 비트 스트림은 적어도 저주파 대역과 고주파 대역으로 나누어지는 주파수 대역에서 음성 신호의 프레임들로부터 부호화된 비트 스트림을 해독하기 위한 파라미터들을 포함하고, 그리고 제1 모드에서는 저주파 대역 상의 신호만이 부호화되고 제2 모드에서는 저주파 대역 상의 신호 및 고주파 대역 상의 신호 모두가 부호화되어, 적어도 제1 모드와 제2 모드가 상기 음성 신호를 위하여 규정되며,
    상기 코덱은 코덱의 동작 모드에서의 변화와 함께 상기 고주파 대역에 관한 신호의 수신된 파라미터들의 적어도 하나를 점진적으로 변화시키기 위하여 스케일러를 포함하는 것을 특징으로 하는 코덱.
  15. 제14항에 있어서, 상기 파라미터들이 이득 파라미터를 포함하며, 상기 스케일러는 상기 인코더의 동작 모드에서의 변화와 함께 상기 이득 파라미터를 점진적으로 변화시키기 위하여 계산 요소를 포함하는 것을 특징으로 하는 코덱.
  16. 주파수 대역에서 음성 신호를 처리하는 방법에 있어서,
    상기 주파수 대역이 적어도 저주파 대역과 고주파 대역으로 나누어지고, 상기 저주파 대역의 음성 신호가 상기 저주파 대역에 관한 신호의 파라미터들을 형성하기 위하여 부호화되고, 상기 고주파 대역의 음성 신호가 상기 고주파 대역에 관한 신호의 파라미터들을 형성하기 위하여 부호화되며, 그리고 제1 모드에서는 저주파 대역 상의 신호만이 부호화되고 제2 모드에서는 저주파 대역 상의 신호 및 고주파 대역 상의 신호 모두가 부호화되며, 음성 신호를 부호화하기 위해 적어도 제1 모드와 제2 모드 중에서 하나의 모드가 선택될 때에,
    상기 고주파 대역에 관한 신호의 수신된 파라미터들의 적어도 하나가 동작 모드에서의 변화와 함께 점진적으로 변화하는 것을 특징으로 하는 방법.
  17. 제16항에 있어서, 상기 고주파 대역에 관한 신호의 파라미터들이 이득 파라미터를 포함하며, 상기 이득 파라미터가 상기 동작 모드에서의 변화와 함께 점진적으로 변화하는 것을 특징으로 하는 방법.
  18. 제17항에 있어서, 상기 이득 파라미터는 상기 저주파 대역에서 신호의 인코딩을 제어하기 위하여 규정되며, 상기 이득 파라미터가 점진적으로 변화하는 것을 특징으로 하는 방법.
  19. 제16항 내지 18항 중 어느 한 항에 있어서, 시간 파라미터(T)가 상기 모드 변화가 지속하는 시간의 길이를 나타내는 것으로 정의되는 것을 특징으로 하는 방법.
  20. 제19항에 있어서, 상기 단차 값(S)이 상기 파라미터의 점진적인 변화에서 얼마나 큰 단차가 사용되는 지를 나타내는 것으로 규정되는 것을 특징으로 하는 방법.
  21. 제16항에 있어서, 상기 음성 신호가 표본 추출되고 프레임들이 상기 추출된 음성 신호로부터 형성되는 것을 특징으로 하는 방법.
  22. 제21항에 있어서, 상기 시간 파라미터(T)가 상기 모드 변화가 지속하는 프레임들의 수를 나타내는 것으로 규정되는 것을 특징으로 하는 방법.
  23. 제16항에 있어서, 상기 LPC 여기가 일련의 LPC 파라미터를 생성하는 인코딩에서 사용되는 것으로서, 상기 LPC 파라미터의 적어도 하나가 점진적으로 변화하는 것을 특징으로 하는 방법.
  24. 컴퓨터 프로그램을 포함하는 컴퓨터로 읽을 수 있는 저장 매체로서,
    적어도 저주파 대역과 고주파 대역으로 나누어지는 주파수 대역에서 음성 신호를 압축하고, 상기 저주파 대역의 음성 신호를 인코딩하고, 상기 고주파 대역의 음성 신호를 부호화하고, 그리고 제1 모드에서는 저주파 대역 상의 신호만이 부호화되고 제2 모드에서는 저주파 대역 상의 신호 및 고주파 대역 상의 신호 모두가 부호화되어, 부호화를 위해 적어도 제1 모드 및 제2 모드 중에서 하나의 모드를 선택하기 위한 기계 실행 단계를 포함하며,
    상기 컴퓨터 프로그램이 동작 모드에서의 변화와 함께 상기 고주파 대역에 관한 신호의 수신된 파라미터들의 적어도 하나를 점진적으로 변화시키기 위한 기계 실행 단계들을 더 포함하는 것을 특징으로 하는, 컴퓨터로 읽을 수 있는 저장 매체.
  25. 제24항에 있어서, 파라미터가 이득 파라미터를 포함하며,
    상기 컴퓨터 프로그램이 동작 모드에서의 변화와 함께 이득 파라미터를 점진적으로 변화시키기 위한 기계 실행 단계들을 포함하는 것을 특징으로 하는, 컴퓨터로 읽을 수 있는 저장 매체.
  26. 제24항 또는 제25항에 있어서, 상기 컴퓨터 프로그램이,
    상기 음성 신호의 프레임들로부터 부호화된 비트 스트림을 디코더가 해독하기 위해 인코딩 속성을 포함하는 비트 스트림을 처리하는 것; 그리고
    상기 인코딩 속성에 기초하여 합성 음성 신호를 형성하는 것을 위한 기계 실행 단계들을 포함하는 것을 특징으로 하는, 컴퓨터로 읽을 수 있는 저장 매체.
  27. 비트 스트림을 포함하는 구조화된 데이터를 지니는 컴퓨터 판독가능 저장매체에 있어서,
    상기 비트 스트림은 상기 비트 스트림을 해독하기 위한 디코더를 위한 파라미터를 포함하고, 상기 비트 스트림은 적어도 저주파 대역과 고주파 대역으로 나누어지는 주파수 대역에서 음성 신호의 프레임들로부터 부호화되고, 그리고 제1 모드에서는 저주파 대역 상의 신호만이 부호화되고 제2 모드에서는 저주파 대역 상의 신호 및 고주파 대역 상의 신호 모두가 부호화되어, 적어도 제1 모드와 제2 모드가 상기 음성 신호를 위하여 규정되며,
    상기 제1 모드 및 상기 제2 모드 사이의 모드 변화에서 상기 고주파 대역에 관한 신호의 적어도 하나의 파라미터가 점진적으로 변화하는 것을 특징으로 하는 컴퓨터 판독가능 저장매체.
  28. 제27항에 있어서, 파라미터들이 이득 파라미터를 포함하며,
    상기 구조화된 데이터는 모드 변화와 함께 점진적으로 변화하는 상기 이득 파라미터를 포함하는 것을 특징으로 하는 컴퓨터 판독가능 저장매체.
  29. 삭제
  30. 삭제
KR1020067022237A 2004-04-15 2005-04-14 음성 신호 코딩 KR100859881B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20045135A FI119533B (fi) 2004-04-15 2004-04-15 Audiosignaalien koodaus
FI20045135 2004-04-15

Publications (2)

Publication Number Publication Date
KR20070002068A KR20070002068A (ko) 2007-01-04
KR100859881B1 true KR100859881B1 (ko) 2008-09-24

Family

ID=32104263

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067022237A KR100859881B1 (ko) 2004-04-15 2005-04-14 음성 신호 코딩

Country Status (14)

Country Link
US (1) US20050246164A1 (ko)
EP (1) EP1735776A4 (ko)
JP (1) JP4838235B2 (ko)
KR (1) KR100859881B1 (ko)
CN (1) CN1942928B (ko)
AU (1) AU2005234181B2 (ko)
BR (1) BRPI0509963A (ko)
CA (1) CA2562916C (ko)
FI (1) FI119533B (ko)
HK (1) HK1102036A1 (ko)
MX (1) MXPA06010825A (ko)
RU (1) RU2383943C2 (ko)
WO (1) WO2005101372A1 (ko)
ZA (1) ZA200607661B (ko)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
EP1872364B1 (en) * 2005-03-30 2010-11-24 Nokia Corporation Source coding and/or decoding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
EP2009623A1 (en) * 2007-06-27 2008-12-31 Nokia Siemens Networks Oy Speech coding
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
JP4935329B2 (ja) * 2006-12-01 2012-05-23 カシオ計算機株式会社 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
KR101149449B1 (ko) * 2007-03-20 2012-05-25 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
US8982744B2 (en) * 2007-06-06 2015-03-17 Broadcom Corporation Method and system for a subband acoustic echo canceller with integrated voice activity detection
CN101325537B (zh) * 2007-06-15 2012-04-04 华为技术有限公司 一种丢帧隐藏的方法和设备
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
JP5547081B2 (ja) 2007-11-02 2014-07-09 華為技術有限公司 音声復号化方法及び装置
CA2705968C (en) 2007-11-21 2016-01-26 Lg Electronics Inc. A method and an apparatus for processing a signal
AU2008339211B2 (en) * 2007-12-18 2011-06-23 Lg Electronics Inc. A method and an apparatus for processing an audio signal
CN101499278B (zh) * 2008-02-01 2011-12-28 华为技术有限公司 音频信号切换处理方法和装置
CN101609679B (zh) * 2008-06-20 2012-10-17 华为技术有限公司 嵌入式编解码方法和装置
PL2346030T3 (pl) * 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
RU2491658C2 (ru) * 2008-07-11 2013-08-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Синтезатор аудиосигнала и кодирующее устройство аудиосигнала
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
GB2473267A (en) * 2009-09-07 2011-03-09 Nokia Corp Processing audio signals to reduce noise
GB2476041B (en) 2009-12-08 2017-03-01 Skype Encoding and decoding speech signals
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
US8886523B2 (en) * 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
CN101964189B (zh) * 2010-04-28 2012-08-08 华为技术有限公司 语音频信号切换方法及装置
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
CN102985968B (zh) * 2010-07-01 2015-12-02 Lg电子株式会社 处理音频信号的方法和装置
EP3422346B1 (en) 2010-07-02 2020-04-22 Dolby International AB Audio encoding with decision about the application of postfiltering when decoding
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
ES2564504T3 (es) 2010-12-29 2016-03-23 Samsung Electronics Co., Ltd Aparato de codificación y aparato de descodificación con una ampliación de ancho de banda
EP3684104A1 (en) 2011-06-09 2020-07-22 Panasonic Intellectual Property Corporation of America Communication terminal and communication method
CN103035248B (zh) * 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
EP2830062B1 (en) * 2012-03-21 2019-11-20 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
CN103516440B (zh) * 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
CN105229735B (zh) 2013-01-29 2019-11-01 弗劳恩霍夫应用研究促进协会 用于编码模式切换补偿的技术
BR112015018021B1 (pt) * 2013-01-29 2022-10-11 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V Aparelho e método para selecionar um dentre um primeiro algoritmo de codificação e um segundo algoritmo de codificação
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
DK3058567T3 (en) * 2013-10-18 2017-08-21 ERICSSON TELEFON AB L M (publ) CODING POSITIONS OF SPECTRAL PEAKS
WO2016024853A1 (ko) * 2014-08-15 2016-02-18 삼성전자 주식회사 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기
KR20210003507A (ko) * 2019-07-02 2021-01-12 한국전자통신연구원 오디오 코딩을 위한 잔차 신호 처리 방법 및 오디오 처리 장치

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001048931A2 (en) * 1999-12-23 2001-07-05 Motorola Limited Audio circuit and method for wideband to narrowband transition in a communication device
US20010044712A1 (en) * 2000-05-08 2001-11-22 Janne Vainio Method and arrangement for changing source signal bandwidth in a telecommunication connection with multiple bandwidth capability
US6349197B1 (en) 1998-02-05 2002-02-19 Siemens Aktiengesellschaft Method and radio communication system for transmitting speech information using a broadband or a narrowband speech coding method depending on transmission possibilities
KR20020081388A (ko) * 2000-03-07 2002-10-26 노키아 코포레이션 음성 복호기 및 음성 복호 방법
KR20030014752A (ko) * 2001-05-08 2003-02-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
KR20040029318A (ko) * 2001-11-14 2004-04-06 마쯔시다덴기산교 가부시키가이샤 오디오 부호화 및 복호화

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08166800A (ja) * 1994-12-13 1996-06-25 Hitachi Ltd 複数種類の符号化方法を備える音声符号器および復号器
FI113571B (fi) * 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
JP3344962B2 (ja) * 1998-03-11 2002-11-18 松下電器産業株式会社 オーディオ信号符号化装置、及びオーディオ信号復号化装置
JP3307875B2 (ja) * 1998-03-16 2002-07-24 松下電送システム株式会社 符号化音声再生装置および符号化音声再生方法
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
JP2000322096A (ja) * 1999-05-13 2000-11-24 Mitsubishi Electric Corp 音声伝送装置
US6826527B1 (en) * 1999-11-23 2004-11-30 Texas Instruments Incorporated Concealment of frame erasures and method
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US7031926B2 (en) * 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
US7113522B2 (en) * 2001-01-24 2006-09-26 Qualcomm, Incorporated Enhanced conversion of wideband signals to narrowband signals
SE521693C3 (sv) * 2001-03-30 2004-02-04 Ericsson Telefon Ab L M En metod och anordning för brusundertryckning
US20020163908A1 (en) * 2001-05-07 2002-11-07 Ari Lakaniemi Apparatus, and associated method, for synchronizing operation of codecs operable pursuant to a communicaton session
US7319703B2 (en) * 2001-09-04 2008-01-15 Nokia Corporation Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts
FI20021936A (fi) * 2002-10-31 2004-05-01 Nokia Corp Vaihtuvanopeuksinen puhekoodekki
US20040243404A1 (en) * 2003-05-30 2004-12-02 Juergen Cezanne Method and apparatus for improving voice quality of encoded speech signals in a network
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7542899B2 (en) * 2003-09-30 2009-06-02 Alcatel-Lucent Usa Inc. Method and apparatus for adjusting the level of a speech signal in its encoded format

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6349197B1 (en) 1998-02-05 2002-02-19 Siemens Aktiengesellschaft Method and radio communication system for transmitting speech information using a broadband or a narrowband speech coding method depending on transmission possibilities
WO2001048931A2 (en) * 1999-12-23 2001-07-05 Motorola Limited Audio circuit and method for wideband to narrowband transition in a communication device
KR20020081388A (ko) * 2000-03-07 2002-10-26 노키아 코포레이션 음성 복호기 및 음성 복호 방법
US20010044712A1 (en) * 2000-05-08 2001-11-22 Janne Vainio Method and arrangement for changing source signal bandwidth in a telecommunication connection with multiple bandwidth capability
KR20030014752A (ko) * 2001-05-08 2003-02-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
KR20040029318A (ko) * 2001-11-14 2004-04-06 마쯔시다덴기산교 가부시키가이샤 오디오 부호화 및 복호화

Also Published As

Publication number Publication date
RU2383943C2 (ru) 2010-03-10
AU2005234181B2 (en) 2011-06-23
EP1735776A4 (en) 2007-11-07
US20050246164A1 (en) 2005-11-03
RU2006139790A (ru) 2008-05-20
HK1102036A1 (en) 2007-11-02
MXPA06010825A (es) 2006-12-15
JP4838235B2 (ja) 2011-12-14
CN1942928A (zh) 2007-04-04
CN1942928B (zh) 2011-05-18
KR20070002068A (ko) 2007-01-04
CA2562916C (en) 2012-10-02
FI20045135A0 (fi) 2004-04-15
JP2007532963A (ja) 2007-11-15
CA2562916A1 (en) 2005-10-27
EP1735776A1 (en) 2006-12-27
WO2005101372A1 (en) 2005-10-27
FI119533B (fi) 2008-12-15
FI20045135A (fi) 2005-10-16
AU2005234181A1 (en) 2005-10-27
BRPI0509963A (pt) 2007-09-25
ZA200607661B (en) 2010-11-24

Similar Documents

Publication Publication Date Title
KR100859881B1 (ko) 음성 신호 코딩
JP2007532963A5 (ko)
KR101393298B1 (ko) 적응적 부호화/복호화 방법 및 장치
JP5165559B2 (ja) オーディオコーデックポストフィルタ
CN105957532B (zh) 对音频/语音信号进行编码和解码的方法和设备
KR100574031B1 (ko) 음성합성방법및장치그리고음성대역확장방법및장치
CN110827842B (zh) 高频带激励信号生成
KR101868926B1 (ko) 노이즈 신호 처리 및 생성 방법, 인코더/디코더 및 인코딩/디코딩 시스템
US20080140393A1 (en) Speech coding apparatus and method
KR20070121254A (ko) 광대역 부호화 및 복호화 방법 및 장치
KR101988710B1 (ko) 미스매치된 주파수 범위들을 이용한 고-대역 신호 코딩
KR102512359B1 (ko) 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치
JPWO2009057329A1 (ja) 符号化装置、復号装置およびこれらの方法
TWI597721B (zh) 使用多個子頻帶之高頻帶信號寫碼
KR102622804B1 (ko) 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합
WO2006103488A1 (en) Source coding and/or decoding
KR20070008211A (ko) 스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치
KR20080034817A (ko) 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120821

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20130820

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140825

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee