KR101317530B1 - 입력 신호를 선택적으로 코딩하는 방법 및 선택적 신호 인코더 - Google Patents

입력 신호를 선택적으로 코딩하는 방법 및 선택적 신호 인코더 Download PDF

Info

Publication number
KR101317530B1
KR101317530B1 KR1020107025140A KR20107025140A KR101317530B1 KR 101317530 B1 KR101317530 B1 KR 101317530B1 KR 1020107025140 A KR1020107025140 A KR 1020107025140A KR 20107025140 A KR20107025140 A KR 20107025140A KR 101317530 B1 KR101317530 B1 KR 101317530B1
Authority
KR
South Korea
Prior art keywords
signal
input signal
reconstructed
energy
enhancement layer
Prior art date
Application number
KR1020107025140A
Other languages
English (en)
Other versions
KR20110002088A (ko
Inventor
제임스 피. 아실리
조나단 에이. 깁스
우다 미탈
Original Assignee
모토로라 모빌리티 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 모토로라 모빌리티 엘엘씨 filed Critical 모토로라 모빌리티 엘엘씨
Publication of KR20110002088A publication Critical patent/KR20110002088A/ko
Application granted granted Critical
Publication of KR101317530B1 publication Critical patent/KR101317530B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Separation Using Semi-Permeable Membranes (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

선택적 신호 인코더에서, 입력 신호는 먼저 코어 계층 인코더를 이용하여 인코드되어(1004) 코어 계층 인코드된 신호를 생성한다. 상기 코어 계층 인코드된 신호는 디코드되어 재구성된 신호를 생성하고(1006) 상기 재구성된 신호와 상기 입력 신호 간의 차 신호로서 에러 신호가 생성된다(1008). 상기 재구성된 신호는 상기 입력 신호와 비교된다(1010). 상기 비교에 따라 둘 이상의 강화 계층 인코더들 중 하나가 선택되고 사용되어 상기 에러 신호를 인코드한다(1014, 1016). 상기 코어 계층 인코드된 신호, 상기 강화 계층 인코드된 신호 및 상기 선택 표시자는 (예를 들어, 전송 또는 저장을 위해) 채널로 출력된다(1018).

Description

입력 신호를 선택적으로 코딩하는 방법 및 선택적 신호 인코더{METHOD OF SELECTIVELY CODING AN INPUT SIGNAL AND SELECTIVE SIGNAL ENCODER}
인터넷을 포함하는 통신 채널을 통한 텍스트, 이미지, 보이스 및 음성 신호의 전송은 그러한 텍스트, 이미지 및 음악과 같은 각종 형태의 정보를 전달할 수 있는 멀티미디어 서비스를 제공하는 것처럼 급속히 증가하고 있다. 음성 및 음악 신호를 포함하는 멀티미디어 신호는 전송 시에 넓은 대역폭을 필요로 한다. 그러므로, 텍스트, 이미지 및 오디오를 포함하는 멀티미디어 데이터를 전송하려면, 데이터를 압축하는 것이 매우 바람직하다.
디지털 음성 및 오디오 신호를 압축하는 것은 잘 알려져 있다. 일반적으로, 압축은 신호를 통신 채널을 통해 효율적으로 전송하거나, 또는 압축된 신호를 디지털 미디어 장치, 이를 테면, 고상 메모리 장치 또는 컴퓨터 하드 디스크에 저장하는데 필요하다.
데이터 압축의 기본 원리는 중복 데이터(redundant data)를 제거하는 것이다. 데이터는 사운드가 반복되거나, 예측가능하거나 또는 지각할 수 있는 만큼 중복하는 것과 같이 시간적 중복 정보를 제거함으로써 압축될 수 있다. 이것은 인간이 고주파에 둔감하다는 것을 고려한 것이다.
일반적으로, 압축으로 인해 신호의 저하를 가져오며, 압축률이 높을수록 저하가 더욱 커진다. 비트 스트림의 일부가 제거되어 그 결과 발생하는 서브 스트림이 특정 타겟 디코더를 위한 또 다른 유효 비트 스트림을 형성할 수 있는 경우에, 상기 비트 스트림은 스케일러블(scalable)하다라고 지칭한다. 그리고, 상기 서브 스트림은 완전한 원래 비트 스트림을 재구성하는 경우의 품질 보다는 낮지만 나머지 다른 데이터의 낮은 품질을 고려하면 조금 더 높은 재구성 품질의 소스 콘텐트를 나타낸다. 이러한 특성을 제공하지 않는 비트 스트림은 단일 층 비트 스트림(single-layer bit streams)으로 지칭된다. 스케일러빌리티의 기본 모드는 시간, 공간, 그리고 품질에 대한 스케일러빌리티이다. 스케일러빌리티는 압축된 신호가 대역 제한된 채널을 통해 최적의 성능에 맞추어 조절되게 해준다.
스케일러빌리티는 베이스 계층 및 적어도 하나의 강화 계층을 포함하는 다중 인코딩 계층들이 제공되는 방식으로 구현될 수 있으며, 각 계층은 상이한 해상도를 갖도록 구축된다.
많은 인코딩 방식들이 일반화되어있지만, 일부 인코딩 방식들은 신호의 모델을 추가한다. 일반적으로, 모델이 인코딩되는 신호에 상응하면 더 양호한 신호 압축이 성취된다. 따라서, 신호 형태의 분류에 따라 인코딩 방식을 선택하는 것이 공지되어 있다. 예를 들어, 보이스 신호의 모델이 만들어질 수 있으며 보이스 신호는 음악 신호와 다른 방식으로 인코드될 수 있다. 그러나, 신호 분류는 일반적으로 어려운 문제이다.
디지털 음성 코딩용도로 매우 대중적으로 유지되어온 압축(또는 "코딩") 기술의 예는 "합성 분석(analysis-by-synthesis)" 코딩 알고리즘들의 집합중 하나인 코드 여기 선형 예측(Code Excited Linear Prediction: CELP)으로서 알려져 있다. 합성 분석은 일반적으로 디지털 모델의 다수의 파라미터들이 입력 신호와 비교되고 왜곡을 찾기 위해 분석되는 한 세트의 후보 신호들을 합성하는데 사용되는 코딩 프로세스를 지칭한다. 최저 왜곡을 산출하는 한 세트의 파라미터들은 전송되거나 저장되며, 결국에는 원래 입력 신호의 예측을 재구성하는데 사용된다. CELP는 하나 이상의 코드북을 이용하는 특별한 합성 분석 방법으로, 각각의 코드북은 기본적으로 여러 세트의 코드 벡터들을 포함하며, 이들 코드-벡터들은 코드북 인덱스에 응답하여 코드북으로부터 검색된다.
현대의 CELP 코더에서, 고품질의 음성 및 오디오 재생을 상당히 낮은 데이터 레이트로 유지하는데 문제가 있다. 이것은 CELP 음성 모델이 잘 맞지 않은 음악 또는 다른 일반 오디오 신호의 경우에 특히 그러하다. 이 경우, 모델 미스매치는 그러한 방법을 이용하는 장비의 최종 사용자에게 허용될 수 없는 심각하게 저하된 오디오 품질을 야기할 수 있다.
첨부 도면은 같은 참조부호가 개개의 도면에서 동일 또는 기능적으로 유사한 구성요소를 지칭하며, 아래의 상세한 설명과 함께 본 명세서에 포함되고 본 명세서의 일부를 구성하며, 다양한 실시예들을 상세히 예시하고 본 발명에 따른 각종 원리 및 장점을 모두 설명해주는 역할을 한다.
도 1은 종래 기술의 코딩 시스템 및 디코딩 시스템의 블록도이다.
도 2는 본 발명의 일부 실시예들에 따른 코딩 시스템 및 디코딩 시스템의 블록도이다.
도 3은 본 발명의 일부 실시예들에 따른 코딩 시스템을 선택하는 방법의 흐름도이다.
도 4 내지 도 6은 음성 신호가 입력될 때 본 발명의 일부 실시예들에 따른 비교기/선택기에서 예시적인 신호들을 보여주는 일련의 플롯들이다.
도 7 내지 도 9는 음악 신호가 입력될 때 본 발명의 일부 실시예들에 따른 비교기/선택기에서 예시적인 신호들을 보여주는 일련의 플롯들이다.
도 10은 본 발명의 일부 실시예들에 따른 선택적 신호 인코딩의 방법의 흐름도이다.
숙련자들이라면 도면들 내 구성요소들은 간략성과 명료성을 기하기 위해 예시된 것이며 반드시 축척대로 도시되지 않았다는 것을 인식할 것이다. 예를 들어, 도면들 내 일부 구성요소들의 치수는 본 발명의 실시예들의 이해 증진을 위해 다른 구성요소들에 비해 과장될 수 있다.
본 발명에 따른 실시예들을 상세히 설명하기에 앞서, 실시예들은 모델 피트에 기초한 선택적인 신호 코딩과 관련한 방법 단계들 및 장치 컴포넌트들을 조합하는 것에 주로 관련한다는 것을 알아야 한다. 따라서, 본 명세서의 설명의 이익을 받는 당업자에게 쉽게 자명해질 세부사항으로 개시내용을 불명료해지지 않도록 하기 위하여 장치 컴포넌트들 및 방법 단계들은 본 발명의 실시예들을 이해하는데 관련한 특정 세부사항만을 도시하는 도면들에서 적절한 위치에 통상의 부호로 표시되었다.
본 명세서에서, 제1 및 제2, 상부 및 하부 등과 같은 관련 용어들은 하나의 엔티티 또는 행위를 단지 다른 엔티티 또는 행위와 구별하는데만 사용될 수 있을 뿐, 엔티티들 또는 행위들 간의 실제로 어떤 관계 또는 순서를 언제나 반드시 요구하거나 함축하지는 않는다. 용어 "포함한다", "포함하는", 또는 이들의 어떤 다른 변형은 구성요소들의 리스트를 포함하는 공정, 방법, 물품, 또는 장치가 단지 그러한 구성요소들만을 포함하지 않고 그러한 공정, 방법, 물품, 또는 장치를 명시적으로 열거하거나 이들에 내재하지 않은 다른 구성요소들을 포함할 수 있도록 비배타적인 포함을 망라하고자 한다. "~을 포함한다"의 앞에 오는 구성요소는 그 구성요소를 포함하는 공정, 방법, 물품, 또는 장치에서 부가적인 동일한 구성요소들의 존재를 제한함이 없이 배제하지 않는다.
본 명세서에 기술된 본 발명의 실시예들은 하나 이상의 통상적인 프로세서들과 그러한 하나 이상의 프로세서들을 제어하여 본 명세서에 기술된 바와 같이 모델 피트에 따라서 선택적인 신호 코딩의 일부, 대부분, 또는 모두를 소정 넌-프로세서(non-processor) 회로와 함께 구현하는 특유의 저장된 프로그램 명령어들로 이루어질 수 있음을 인식할 것이다. 대안으로, 일부 또는 모든 기능들은 프로그램 명령어들을 저장하지 않은 상태 머신으로 구현될 수 있거나, 또는 각각의 기능이나 소정 기능들의 어떤 조합이 커스톰 로직으로서 구현된 하나 이상의 주문형 반도체(ASIC)에서 구현될 수 있다. 물론, 두 가지 접근법들의 조합이 사용될 수 있다. 따라서, 본 명세서에서는 이들 기능들의 방법들과 수단이 기술되었다. 또한, 당업자라면, 어쩌면 상당한 노력과, 예를 들어, 이용가능한 시간, 현재의 기술, 및 경제적인 고려사항에 의해 동기부여된 많은 디자인 선택에도 불구하고, 본 명세서에서 개시된 개념과 원리를 쫓을 때, 그러한 소프트웨어 명령어들 및 프로그램들 및 IC들을 최소한의 실험을 통해 쉽게 만들어 낼 수 있을 것이라고 생각된다.
도 1은 종래 기술의 임베디드 코딩 및 디코딩 시스템(100)의 블록도이다. 도 1에서, 원래의 입력 신호 s(n)(102)가 인코딩 시스템의 코어 계층 인코더(core layer encoder)(104)에 입력된다. 코어 계층 인코더(104)는 신호 s(n)(102)를 인코드하고 코어 계층 인코드된 신호(106)를 생성한다. 또한, 입력 신호 s(n)(102)는 코딩 시스템의 강화 계층 인코더(108)에 입력된다. 강화 계층 인코더(108)는 또한 입력으로서 제1 재구성된 신호 sc(n)(110)를 수신한다. 제1 재구성된 신호 sc(n)(110)는 코어 계층 인코드된 신호(106)를 제1 코어 계층 디코더(112)를 통과시킴으로써 생성된다. 강화 계층 인코더(108)는 입력 신호 s(n)(102) 및 제1 재구성된 신호 sc(n)(110)의 어떤 비교에 의거하여 부가 정보를 코드화하는데 사용되며, 선택적으로 코어 계층 인코더(104)로부터 제공된 파라미터들을 사용할 수 있다. 일 실시예에서, 강화 계층 인코더(108)는 제1 재구성된 신호 sc(n)(110)와 입력 신호 s(n)(102) 간의 차인 에러 신호를 인코드한다. 강화 계층 인코더(108)는 강화 계층 인코드된 신호(114)를 생성한다. 코어 계층 인코드된 신호(106)와 강화 계층 인코드된 신호(114)는 둘다 채널(116)에 전달된다. 채널은 통신 채널 및/또는 저장 매체와 같은 매체를 나타낸다.
채널을 통과한 후, 수신된 코어 계층 인코드된 신호(106')를 제2 코어 계층 디코더(120)를 통과시킴으로써 제2 재구성된 신호(118)가 생성된다. 제2 코어 계층 디코더(120)는 제1 코어 계층 디코더(112)와 동일한 기능을 수행한다. 만일 강화 계층 인코드된 신호(114)가 역시 채널(116)을 통과하고 신호(114')로서 수신되면, 그 신호는 강화 계층 디코더(122)에 전달될 수 있다. 강화 계층 디코더(122)는 입력으로서 제2 재구성된 신호(118)를 수신하고 출력으로서 제3 재구성된 신호(124)를 생성한다. 제3 재구성된 신호(124)는 제2 재구성된 신호(118)가 일치하는 것보다 입력 신호 s(n)(102)에 더 근접하게 일치한다.
강화 계층 인코드된 신호(114)는 입력 신호 s(n)(102)를 제2 재구성된 신호(118)보다 더 정확하게 재구성될 수 있게 해주는 부가 정보를 포함한다. 즉, 이 신호의 재구성이 향상된다.
이러한 임베디드 코딩 시스템의 한가지 장점은 특정한 채널(116)이 고품질 오디오 코딩 알고리즘들과 연관된 대역폭 요건을 일관하게 지원할 수 없을 수 있다는 것이다. 그러나, 임베디드 코더는 채널(116)로부터 일부 비트 스트림(예를 들어, 코어 계층 비트 스트림만)이 수신되게 하여, 예를 들어, 강화 계층 비트 스트림이 유실 또는 손상되는 경우에 코어 출력 오디오만을 생성한다. 그러나, 임베디드 코더 대 넌-임베디드 코더 사이에, 그리고 상이한 임베디드 코딩 최적화 객체들 사이에는 품질 측면에서 상호 이율 배반적 모순이 있다. 즉, 보다 고품질의 강화 계층 코딩은 코어 계층과 강화 계층 사이에서 더 나은 균형을 성취하는데 일조할 수 있고, 또한 더 나은 전송 특성(예를 들어, 충돌 감소)을 위해 전체 데이터 레이트를 줄일 수 있어 이는 결과적으로 강화 계층들에서 더 낮은 패킷 에러 레이트들을 이끌어 낼 수 있다.
많은 인코딩 방식들이 일반화되어 있지만, 일부 인코딩 방식들은 신호의 모델을 추가한다. 일반적으로, 모델이 인코드되는 신호의 전형일 때 더 나은 신호 압축이 성취된다. 따라서, 신호 형태의 분류에 따라서 인코딩 방식을 선택하는 것이 알려져 있다. 예를 들어, 보이스 신호는 음악 신호와는 상이한 방식으로 모델링되고 인코드될 수 있다. 그러나, 신호 분류는 일반적으로 어려운 문제이다.
도 2는 본 발명의 일부 실시예들에 따른 코딩 및 디코딩 시스템(200)의 블록도이다. 도 2를 참조하면, 입력 신호 s(n)(102)는 인코딩 시스템의 코어 계층 인코더(104)에 입력된다. 입력 신호 s(n)(102)는 음성/오디오 신호 또는 다른 종류의 신호일 수 있다. 코어 계층 인코더(104)는 입력 신호 s(n)(102)를 인코드하고 코어 계층 인코드된 신호(106)를 생성한다. 코어 계층 인코드된 신호(106)를 제1 코어 계층 디코더(112)를 통과시킴으로써 제1 재구성된 신호 sc(n)(110)가 생성된다. 입력 신호 s(n)(102) 및 제1 재구성된 신호 sc(n)(110)는 비교기/선택기 모듈(202)에서 비교된다. 비교기/선택기 모듈(202)은 입력 신호 s(n)(102)를 제1 재구성된 신호 sc(n)(110)와 비교하고, 그 비교에 근거하여, 사용할 강화 계층 인코더들(206) 중 어느 하나를 선택하는 선택 신호(204)를 생성한다. 비록 단지 두 개의 강화 계층 인코더들만이 도면에 도시되어 있지만, 다수의 강화 계층 인코더들이 사용될 수 있음을 알아야 한다. 비교기/선택기 모듈(202)은 가장 최선의 재구성된 신호를 발생할 가능성이 있는 강화 계층 인코더를 선택할 수 있다.
비록 코어 계층 디코더(112)가 채널(116)에 대응하여 전송된 코어 계층 인코드된 신호(106)를 수신하는 것으로 도시되어 있지만, 구성요소들(104 및 106) 사이의 물리적 연결을 통해 공통의 프로세싱 구성요소들 및/또는 상태들이 공유되도록 하여 이들이 다시 생성되거나 중복되는 것이 요구되지 않도록 함으로써, 보다 효율적인 구현이 가능하게 할 수 있다.
각각의 강화 계층 인코더(206)는 입력으로서 입력 신호 s(n)(102) 및 제1 재구성된 신호(또는 이들 신호들로부터 유도되는 차이 신호와 같은 신호)를 수신하며, 선택된 인코더는 강화 계층 인코드된 신호(208)를 생성한다. 일 실시예에서, 강화 계층 인코더(206)는 제1 재구성된 신호 sc(n)(110)와 입력 신호 s(n)(102) 간의 차인 에러 신호를 인코드한다. 강화 계층 인코드된 신호(208)는 입력 신호 s(n)(102) 및 제1 재구성된 신호 sc(n)(110)의 비교에 의거한 부가 정보를 포함한다. 선택사항으로, 그 신호는 코어 계층 디코더(104)로부터 제공된 파라미터들을 사용할 수 있다. 코어 계층 인코드된 신호(106), 강화 계층 인코드된 신호(208) 및 선택 신호(204)는 모두 채널(116)에 전달된다. 채널은 통신 채널 및/또는 저장 매체와 같은 매체를 나타낸다.
채널을 통과한 후, 수신된 코어 계층 인코드된 신호(106')를 제2 코어 계층 디코더(120)를 통과시킴으로써 제2 재구성된 신호(118)가 생성된다. 제2 코어 계층 디코더(120)는 제1 코어 계층 디코더(112)와 동일한 기능을 수행한다. 만일 강화 계층 인코드된 신호(208)가 역시 채널(116)을 통과하고 신호(208')로서 수신된다면, 그 신호는 강화 계층 디코더(210)에 전달될 수 있다. 강화 계층 디코더(210) 또한 입력으로서 제2 재구성된 신호(118) 및 수신된 선택 신호(204')를 수신하고 출력으로서 제3 재구성된 신호(212)를 생성한다. 강화 계층 디코더(210)는 수신된 선택 신호(204')에 따라 동작한다. 제3 재구성된 신호(212)는 제2 재구성된 신호(118) 보다 입력 신호 s(n)(102)에 더 가깝게 일치한다.
강화 계층 인코드된 신호(208)는 부가 정보를 포함하며, 따라서 제3 재구성된 신호(212)는 제2 재구성된 신호(118) 보다 더욱 정확하게 입력 신호 s(n)(102)에 일치한다.
도 3은 본 발명의 일부 실시예들에 따른 코딩 시스템을 선택하는 방법의 흐름도이다. 특히, 도 3은 본 발명의 실시예에서 비교기/선택기 모듈의 동작을 기술한다. 시작 블록(302)에 뒤이어, 필요하다면 입력 신호 s(n)(도 2의 102) 및 재구성된 신호 sc(n)(도 2의 110)가 선택된 신호 영역으로 변환된다. 시간 영역 신호들은 변환 없이 사용될 수 있거나, 또는 블록(304)에서, 신호들은 예를 들어, 주파수 영역, 변형된 이산 코사인 변환(modified discrete cosine transform: MDCT) 영역, 또는 웨이브렛 영역과 같은 스펙트럼 영역으로 변환될 수 있으며, 다른 선택적 구성요소, 이를 테면, 소정 주파수의 인지 가중(perceptual weighting) 또는 그 신호들의 시간적 특성에 의해서도 처리될 수 있다. 변환된(또는 시간 영역) 입력 신호는 스펙트럼 컴포넌트 k 에 대해 S(k)로서 표시되며, 변환된(또는 시간 영역) 재구성된 신호는 스펙트럼 컴포넌트 k에 대해 Sc(k)로서 표시된다. 선택된 한 세트의 컴포넌트들(컴포넌트들의 모두 또는 일부일 수 있음)의 각 컴포넌트 k 마다, 재구성된 신호의 모든 컴포넌트들 Sc(k)에서의 에너지, E_tot 는 원래 입력 신호에서 대응하는 컴포넌트 S(k)보다 (예를 들어, 약간의 팩터 만큼) 큰 컴포넌트들에서의 에너지, E_err와 비교된다.
입력 및 재구성된 신호 컴포넌트들은 진폭에서 상당히 상이할 수 있지만, 재구성된 신호 컴포넌트의 진폭이 상당히 증가한 것은 모델로 만들어진 입력 신호가 불충분한 것임을 나타낸다. 이와 같이, 낮은 진폭의 재구성된 신호 컴포넌트는 소정의 강화 계층 코딩 방법에 의해 보상될 수 있는 반면, 높은 진폭(즉, 불충분히 모델로 만들어진)의 재구성된 신호 컴포넌트에는 대안의 강화 계층 코딩 방법이 더 적합할 수 있다. 그러한 대안의 강화 계층 코딩 방법 중 하나는 코어 계층 신호 모델 미스매치의 결과로서 발생된 가청 잡음 또는 왜곡이 줄어들도록, 재구성된 신호의 소정 컴포넌트들의 에너지를 줄인 다음 강화 계층 코딩하는 것을 포함할 수 있다.
다시 도 3을 참조하면, 블록(306)에서, 컴포넌트들의 루프가 초기화되는데, 여기서 컴포넌트 k가 초기화되고 에너지 측정치 E_tot 및 E_err 가 제로로 초기화된다. 판단 블록(308)에서, 재구성된 신호의 컴포넌트의 절대값이 입력 신호의 대응 컴포넌트보다 상당히 큰지를 판단한다. 판단 블록(308)에서 긍정(positive branch)으로 표시된 바와 같이 만일 재구성된 신호의 컴포넌트의 절대값이 상당히 크다면, 블록(310)에서 컴포넌트가 에러 에너지 E_err에 가산되고 흐름은 블록(312)으로 진행한다. 블록(312)에서, 재구성된 신호들의 컴포넌트는 총 에너지 값 E_tot에 가산된다. 판단 블록(314)에서, 컴포넌트 값은 증분되고 모든 컴포넌트들이 처리되었는지의 여부가 판단된다. 판단 결과가 부정이라면, 판단 블록(314)에서 부정 분기(negative branch)로 표시된 바와 같이, 흐름은 블록(308)으로 복귀한다. 그렇지 않다면, 판단 블록(316)에서 긍정으로 표시된 바와 같이, 판단 블록(316)에서 루프가 완료되며 총 누적 에너지가 비교된다. 만일 에러 에너지 E_err가 총 에너지 E_tot 보다 훨씬 낮으면, 판단 블록(316)에서 부정으로 표시된 바와 같이, 블록(318)에서 형태 1의 강화 계층이 선택된다. 그렇지 않으면, 판단 블록(316)에서 긍정으로 표시된 바와 같이, 블록(320)에서 형태 2의 강화 계층이 선택된다. 블록(322)에서 이 블록의 입력 신호의 처리가 종료된다.
당업자에게는 신호 에너지의 다른 측정치, 이를 테면, 컴포넌트를 몇 제곱한 값의 절대값이 사용될 수 있음이 자명할 것이다. 예를 들어, 컴포넌트 Sc(k)의 에너지는 |Sc(k)|P로서 예측될 수 있고, 컴포넌트 S(k)의 에너지는 |S(k)|P로서 예측될 수 있으며, 여기서 P는 제로보다 큰 수이다.
당업자에게는 에러 에너지 E_err는 재구성된 신호의 총 에너지가 아니라, 입력 신호의 총 에너지와 비교될 수 있다는 사실이 자명할 것이다.
인코더는 프로그램된 프로세서에서 구현될 수 있다. 도 3에 대응하는 코드 리스팅의 예는 아래에 제시된다. 도면에서, energy_tot 및 energy_err 라는 변수들은 각기 E_tot 및 E_err 로 표시된다.
Thresh1 = 0.49;
Thresh2 = 0.264;
energy_tot = 0;
energy_err = 0;
for (k = kStart; k <kMax; k++)
{
if (Thresh1*abs (Sc[k]) > abs (S[k])) {
energy_err += abs (Sc[k]);
}
energy_tot += abs (Sc[k]);
}
if (energy_err < Thresh2*energy_tot)
type = 1;
else
type = 2;
이 예에서, 임계값들 Thresh1 및 Thresh2 는 각기 0.49 및 0.264 로 설정된다. 사용되는 강화 계층 인코더들의 형태에 따라서 그리고 또한 어떤 변환 영역이 사용되는 가에 따라서 다른 값들이 사용될 수 있다.
히스테리시스 단계가 추가될 수 있고, 그래서 만일 특정 개수의 신호 블록들이 동일한 형태 경우에만 강화 계층 형태가 바뀔 뿐이다. 예를 들어, 인코더 형태 1이 사용되고 있으면, 연속하는 두 블록들이 형태 2를 사용함을 표시하지 않는 한, 형태 2는 선택되지 않을 것이다.
도 4 내지 도 6은 음성 신호의 예시적인 결과를 보여주는 일련의 플롯들이다. 도 4의 플롯(402)은 재구성된 신호의 에너지 E_tot를 도시한다. 에너지는 20 밀리초 프레임마다 계산되며, 그래서 플롯은 10초 간격 동안 신호 에너지의 변동을 나타낸다. 도 5의 플롯(502)은 위와 같은 기간 동안 에러 신호 E_err 대 총 에너지 E_tot의 비율을 나타낸다. 임계값 Thresh2는 파선(504)으로 도시된다. 비율이 임계치를 초과하는 프레임들에서 음성 신호는 코더에 의해 모델로 잘 만들어지지 않는다. 그러나, 대부분의 프레임들에서, 임계치는 초과되지 않는다. 도 6의 플롯(602)은 위와 같은 기간 동안 선택 또는 판단 신호를 도시한다. 이 예에서, 값 0는 형태 1의 강화 계층 코더가 선택된 것을 나타내고 값 1은 형태 2의 강화 계층 코더가 선택된 것을 나타낸다. 상기 비율이 상기 임계치보다 큰 격리된 프레임들은 무시되며, 연속하는 두 프레임들이 같은 선택을 표시할 때에만 선택이 바뀔 뿐이다. 따라서, 예를 들어, 프레임 141에서 비율이 임계치를 초과할지라도 형태 1의 강화 계층 인코더가 선택된다.
도 7 내지 도 9는 음악 신호에 대해 일련의 대응하는 플롯들을 도시한다. 도 7의 플롯(702)은 입력 신호의 에너지 E_tot를 도시한다. 다시, 에너지는 20밀리초 프레임마다 계산되고, 그래서 플롯은 10 초 간격 동안 입력 에너지에서의 변동을 나타낸다. 도 8의 플롯(802)은 위와 같은 기간 동안 에러 에너지 E_err 대 총 에너지 E_tot를 나타낸다. 임계값 Thresh2는 파선(504)으로서 도시된다. 비율이 임계치를 초과하는 프레임들에서 음악 신호는 코더에 의해 모델로 잘 만들어지지 않는다. 이것은 코어 코더가 음성 신호용도로 설계되기 때문에 대부분의 프레임에서 그러한 경우가 발생한다. 도 9의 플롯(902)은 위와 같은 기간 동안 선택 또는 판단 신호를 도시한다. 앞서와 같이, 값 0는 형태 1의 강화 계층 인코더가 선택된 것을 나타내고 값 1은 형태 2의 강화 계층 인코더가 선택된 것을 나타낸다. 따라서, 형태 2의 강화 계층 인코더는 대부분의 시간에서 선택된다. 그러나, 코어 인코더가 음악용도에 잘 작용하는 프레임들에서, 형태 1의 강화 계층 인코더가 선택된다.
음성 신호의 22,803 프레임들에 대한 테스트에서, 형태 2의 강화 계층 인코더는 단지 227 프레임들만, 즉, 단지 1%의 시간만 선택되었다. 음악의 29,644 프레임들에 대한 테스트에서, 형태 2의 강화 계층 인코더는 16,145 프레임들에서, 즉 54% 시간에서 선택되었다. 다른 프레임들에서, 코어 인코더는 음악에 잘 작용하며 음성용도의 강화 계층 인코더가 선택되었다. 따라서, 비교기/선택기는 음성/음악 분류기가 아니다. 이것은 입력 신호를 음성 또는 음악으로서 분류하고 그런 다음 분류에 따라서 코딩 방식을 선택하려는 종래 기술 방식과 대조를 이룬다. 본 발명의 접근법은 코어 계층 인코더의 성능에 따라서 강화 계층 인코더를 선택하는 것이다.
도 10은 본 발명의 일부 실시예들에 따른 임베디드 코더의 동작을 도시하는 흐름도이다. 이 흐름도는 신호 데이터의 한 프레임을 인코드하는데 사용된 방법을 도시한다. 프레임의 길이는 그 신호의 시간적 특성을 기준으로 하여 선택된다. 예를 들어, 음성 신호의 20 ms 프레임이 사용될 수 있다. 도 10에서 시작 블록(1002)에 뒤이어, 블록(1004)에서 코어 계층 인코더를 이용하여 입력 신호가 인코드되어 코어 계층 인코드된 신호를 생성한다. 블록(1006)에서, 코어 계층 인코드된 신호가 디코드되어 재구성된 신호를 생성한다. 본 실시예에서, 블록(1008)에서, 재구성된 신호와 입력 신호 간의 차 신호로서 에러 신호가 발생된다. 블록(1010)에서, 재구성된 신호가 입력 신호와 비교되며, 판단 블록(1012)에서, 재구성된 신호가 입력 신호와 양호하게 일치하는지가 판단된다. 판단 블록(1012)에서 긍정으로 표시된 바와 같이 만일 일치가 양호하다면, 블록(1014)에서 형태 1의 강화 계층 인코더가 사용되어 에러 신호를 인코드한다. 판단 블록(1012)에서 부정으로 표시된 바와 같이 일치가 양호하지 않으면, 블록(1016)에서 형태 2의 강화 계층 인코더가 사용되어 에러 신호를 인코드한다. 블록(1018)에서, 코어 계층 인코드된 신호, 강화 계층 인코드된 신호 및 선택 표시자는 (예를 들어, 전송 또는 저장을 위해) 채널로 출력된다. 블록(1020)에서 해당 프레임의 처리가 종료된다.
본 실시예에서, 강화 계층 인코더는 에러 신호에 반응하지만, 대안의 실시예에서, 강화 계층 인코더는 입력 신호, 및 선택적으로는 코어 계층 인코더 및/또는 코어 계층 디코더로부터의 하나 이상의 신호들에 반응한다. 또 다른 실시예에서, 입력 신호와 재구성된 신호 사이의 가중된 차 신호와 같은 대안의 에러 신호가 사용된다. 예를 들어, 재구성된 신호의 소정 주파수들은 에러 신호의 형성 전에 감쇄될 수 있다. 그 결과의 에러 신호는 가중된 에러 신호로서 지칭될 수 있다.
또 다른 대안의 실시예에서, 코어 계층 인코더 및 디코더는 다른 강화 계층들을 또한 포함할 수 있으며, 본 발명의 비교기는 재구성된 신호로서 이전의 강화 계층들 중 하나의 출력을 입력으로서 수신할 수 있다. 부가적으로, 비교의 결과로서 스위치될 수 있거나 스위치될 수 없는 전술한 강화 계층들에 후속하는 강화 계층들이 있을 수 있다. 예를 들어, 임베디드 코딩 시스템은 다섯 계층들을 포함할 수 있다. 코어 계층(L1) 및 제2 계층(L2)은 재구성된 신호 Sc(k)를 생성할 수 있다. 그러면 재구성된 신호 Sc(k) 및 입력 신호 S(k)는 제3 및 제4 계층들(L3, L4)에서 강화 계층을 인코딩하는 방법을 선택하는데 사용될 수 있다. 마지막으로, 제5 계층(L5)은 단일 강화 계층 인코딩 방법만을 포함할 수 있다.
인코더는 재구성된 신호와 입력 신호의 비교에 따라서 둘 이상의 강화 계층 인코더들 중에서 선택할 수 있다.
인코더 및 디코더는, 예를 들어, 프로그램된 프로세서, 재구성가능한 프로세서 또는 주문형 반도체에서 구현될 수 있다.
전술한 명세서에서, 본 발명의 특정 실시예들이 기술되었다. 그러나, 당업자라면 아래의 청구범위에서 기술된 바와 같은 본 발명의 범주를 일탈함이 없이 다양한 변형과 변경이 이루어질 수 있음을 인식한다. 따라서, 명세서 및 도면은 제한적인 의미라기보다 예시적인 의미로 간주되며, 그러한 모든 변형은 본 발명의 범주 내에 속하는 것으로 의도된다. 어떤 이익, 장점, 또는 해결책을 유발하거나 또는 더욱 명확해질 수 있는 이익, 장점, 문제의 해결책, 및 어떠한 요소(들)라도 어떤 청구항 또는 모든 청구항들의 중요하고, 필요하고, 또는 필수적인 특징이나 요소들이라고 해석되지 않는다. 본 발명은 본 출원의 계류 중에 이루어지는 모든 보정 사항을 포함하는 첨부된 청구범위와 등록된 청구범위의 모든 등가물로만 규정된다.

Claims (20)

  1. 입력 신호를 선택적으로 코딩하는 방법으로서,
    코어 계층 인코더(core layer encoder)를 이용하여 상기 입력 신호를 인코딩하여 코어 계층 인코드된 신호를 생성하는 단계;
    상기 코어 계층 인코드된 신호를 디코딩하여 재구성된 신호를 생성하는 단계;
    상기 재구성된 신호를 상기 입력 신호와 비교하는 단계 - 상기 비교하는 단계는 상기 재구성된 신호의 컴포넌트의 절대값이 상기 입력 신호의 대응 컴포넌트 S(k)의 절대값에 비해 미리 정해진 임계값보다 더 큰, 상기 재구성된 신호의 컴포넌트들 Sc(k)의 에너지들의 합산으로서 에너지 E_err를 예측하는 단계를 포함함 - ;
    상기 재구성된 신호와 상기 입력 신호의 비교에 따라서 다수의 강화 계층 인코더들로부터 하나의 강화 계층 인코더를 선택하는 단계; 및
    상기 선택된 강화 계층 인코더를 이용하여 상기 입력 신호에 종속하는 강화 계층 인코드된 신호를 생성하는 단계
    를 포함하는, 입력 신호를 선택적으로 코딩하는 방법.
  2. 제1항에 있어서, 상기 재구성된 신호를 상기 입력 신호와 비교하는 단계는 상기 재구성된 신호와 상기 입력 신호 간의 차로서 에러 신호를 생성하는 단계를 포함하며,
    상기 강화 계층 인코드된 신호를 생성하는 단계는 상기 에러 신호를 인코딩하는 단계를 포함하는, 입력 신호를 선택적으로 코딩하는 방법.
  3. 제2항에 있어서, 상기 에러 신호는 상기 재구성된 신호와 상기 입력 신호 간의 가중된 차를 포함하는, 입력 신호를 선택적으로 코딩하는 방법.
  4. 제1항에 있어서, 상기 재구성된 신호를 상기 입력 신호와 비교하는 단계는,
    상기 재구성된 신호의 컴포넌트들의 선택된 집합 내의 에너지들의 합산으로서 에너지 E_tot를 예측하는 단계;
    에러들을 포함하는 상기 재구성된 신호의 컴포넌트들 내의 에너지들의 합산으로서 상기 에너지 E_err을 예측하는 단계; 및
    상기 에너지 E_tot를 상기 에너지 E_err와 비교하는 단계
    를 포함하는, 입력 신호를 선택적으로 코딩하는 방법.
  5. 제4항에 있어서, 상기 E_tot를 예측하는 단계 이전에, 상기 재구성된 신호를 변환하여 상기 재구성된 신호의 상기 컴포넌트들을 생성하는 단계를 더 포함하며,
    상기 변환은 푸리에 변환, 변형된 이산 코사인 변환(modified discrete cosine transform: MDCT) 및 웨이브렛 변환으로 이루어진 변환 그룹 중에서 선택되는, 입력 신호를 선택적으로 코딩하는 방법.
  6. 삭제
  7. 제4항에 있어서, 상기 재구성된 신호를 변환하여 상기 재구성된 신호의 컴포넌트를 생성하는 단계; 및
    상기 입력 신호를 변환하여 상기 입력 신호의 대응 컴포넌트들을 생성하는 단계
    를 더 포함하며,
    상기 재구성된 신호의 컴포넌트를 생성하는 단계 및 상기 입력 신호의 대응 컴포넌트들을 생성하는 단계는 상기 에너지 E_tot를 예측하는 단계 이전에 수행되고,
    상기 변환은 푸리에 변환, 변형된 이산 코사인 변환(modified discrete cosine transform: MDCT) 및 웨이브렛 변환으로 이루어진 변환 그룹 중에서 선택되는, 입력 신호를 선택적으로 코딩하는 방법.
  8. 제4항에 있어서, 상기 컴포넌트 Sc(k)의 에너지는 |Sc(k)|P로서 예측되고, 상기 대응 컴포넌트 S(k)의 에너지는 |S(k)|P로서 예측되며, 여기에서 P는 제로보다 큰 수인, 입력 신호를 선택적으로 코딩하는 방법.
  9. 제4항에 있어서, 상기 에너지 E_tot를 상기 에너지 E_err와 비교하는 단계는,
    에너지들의 비율 E_err/E_tot를 임계값과 비교하는 단계를 포함하는, 입력 신호를 선택적으로 코딩하는 방법.
  10. 제1항에 있어서, 상기 코어 계층 인코더는 음성 인코더를 포함하는, 입력 신호를 선택적으로 코딩하는 방법.
  11. 제1항에 있어서, 상기 강화 계층 인코드된 신호를 생성하는 단계 후에, 상기 코어 계층 인코드된 신호, 상기 강화 계층 인코드된 신호 및 상기 선택된 강화 계층 인코더의 표시자를 채널로 출력하는 단계를 더 포함하는, 입력 신호를 선택적으로 코딩하는 방법.
  12. 선택적 신호 인코더로서,
    인코드될 입력 신호를 수신하고 코어 계층 인코드된 신호를 생성하는 코어 계층 인코더;
    입력으로서 상기 코어 계층 인코드된 신호를 수신하고 재구성된 신호를 생성하는 코어 계층 디코더;
    각기 에러 신호를 인코드하도록 선택가능하여 강화 계층 인코드된 신호를 생성하는 다수의 강화 계층 인코더들 - 상기 에러 신호는 상기 입력 신호와 상기 재구성된 신호 간의 차를 포함함 - ; 및
    상기 입력 신호와 상기 코어 계층 인코드된 신호의 비교에 따라 상기 다수의 강화 계층 인코더들 중 하나의 강화 계층 인코더를 선택하는 비교기/선택기 모듈
    을 포함하고,
    상기 비교기/선택기 모듈은, 상기 재구성된 신호의 컴포넌트의 절대값이 상기 입력 신호의 대응 컴포넌트 S(k)의 절대값에 비해 미리 정해진 임계값보다 더 큰, 상기 재구성된 신호의 컴포넌트들 Sc(k)의 에너지들을 합산함으로써 상기 재구성된 신호의 컴포넌트들의 에너지들의 합산으로서 에너지 E_err를 예측하며,
    상기 입력 신호는 상기 코어 계층 인코드된 신호, 상기 강화 계층 인코드된 신호 및 상기 선택된 강화 계층 인코더의 표시자로서 인코드되는, 선택적 신호 인코더.
  13. 제12항에 있어서, 상기 코어 계층 인코더는 음성 인코더를 포함하는, 선택적 신호 인코더.
  14. 제12항에 있어서, 상기 비교기/선택기 모듈은,
    상기 재구성된 신호의 컴포넌트들의 선택된 집합 내의 에너지들의 합산으로서 에너지 E_tot를 예측하고;
    에러들을 포함하는 상기 재구성된 신호의 컴포넌트들 내의 에너지들의 합산으로서 에너지 E_err을 예측하고;
    상기 에너지 E_tot를 상기 에너지 E_err와 비교하는, 선택적 신호 인코더.
  15. 삭제
  16. 제14항에 있어서, 상기 비교기/선택기 모듈은 에너지들의 비율 E_err/E_tot를 임계값과 비교함으로써 상기 에너지 E_tot를 상기 에너지 E_err와 비교하는, 선택적 신호 인코더.
  17. 제14항에 있어서, 상기 재구성된 신호의 상기 컴포넌트들 및 상기 입력 신호의 대응 컴포넌트들은 푸리에 변환, 변형된 이산 코사인 변환(modified discrete cosine transform: MDCT) 및 웨이브렛 변환으로 이루어진 변환 그룹 중에서 선택된 변환을 통해 계산되는, 선택적 신호 인코더.
  18. 삭제
  19. 삭제
  20. 삭제
KR1020107025140A 2008-04-09 2009-04-09 입력 신호를 선택적으로 코딩하는 방법 및 선택적 신호 인코더 KR101317530B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/099,842 2008-04-09
US12/099,842 US8639519B2 (en) 2008-04-09 2008-04-09 Method and apparatus for selective signal coding based on core encoder performance
PCT/US2009/039984 WO2009126759A1 (en) 2008-04-09 2009-04-09 Method and apparatus for selective signal coding based on core encoder performance

Publications (2)

Publication Number Publication Date
KR20110002088A KR20110002088A (ko) 2011-01-06
KR101317530B1 true KR101317530B1 (ko) 2013-10-15

Family

ID=40909774

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107025140A KR101317530B1 (ko) 2008-04-09 2009-04-09 입력 신호를 선택적으로 코딩하는 방법 및 선택적 신호 인코더

Country Status (9)

Country Link
US (1) US8639519B2 (ko)
EP (1) EP2272063B1 (ko)
KR (1) KR101317530B1 (ko)
CN (1) CN102047325A (ko)
BR (1) BRPI0909487A8 (ko)
ES (1) ES2396481T3 (ko)
MX (1) MX2010011111A (ko)
RU (1) RU2504026C2 (ko)
WO (1) WO2009126759A1 (ko)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US7889103B2 (en) * 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
CN101771417B (zh) 2008-12-30 2012-04-18 华为技术有限公司 信号编码、解码方法及装置、系统
WO2010108332A1 (zh) * 2009-03-27 2010-09-30 华为技术有限公司 编码和解码方法及装置
US8149144B2 (en) * 2009-12-31 2012-04-03 Motorola Mobility, Inc. Hybrid arithmetic-combinatorial encoder
US8442837B2 (en) * 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
CN101964188B (zh) * 2010-04-09 2012-09-05 华为技术有限公司 语音信号编码、解码方法、装置及编解码系统
US9037456B2 (en) * 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
JP6205000B2 (ja) * 2013-03-11 2017-09-27 ドルビー ラボラトリーズ ライセンシング コーポレイション 階層符号化を用いたマルチフォーマットハイダイナミックレンジビデオの配信
US9953660B2 (en) * 2014-08-19 2018-04-24 Nuance Communications, Inc. System and method for reducing tandeming effects in a communication system
CN112639968A (zh) * 2018-08-30 2021-04-09 杜比国际公司 用于控制对经低比特率编码的音频的增强的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6108626A (en) 1995-10-27 2000-08-22 Cselt-Centro Studi E Laboratori Telecomunicazioni S.P.A. Object oriented audio coding
US20030212551A1 (en) 2002-02-21 2003-11-13 Kenneth Rose Scalable compression of audio and other signals
US20060265087A1 (en) * 2003-03-04 2006-11-23 France Telecom Sa Method and device for spectral reconstruction of an audio signal
US7277849B2 (en) 2002-03-12 2007-10-02 Nokia Corporation Efficiency improvements in scalable audio coding

Family Cites Families (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4560977A (en) 1982-06-11 1985-12-24 Mitsubishi Denki Kabushiki Kaisha Vector quantizer
US4670851A (en) 1984-01-09 1987-06-02 Mitsubishi Denki Kabushiki Kaisha Vector quantizer
US4727354A (en) 1987-01-07 1988-02-23 Unisys Corporation System for selecting best fit vector code in vector quantization encoding
JP2527351B2 (ja) 1987-02-25 1996-08-21 富士写真フイルム株式会社 画像デ―タの圧縮方法
US5067152A (en) 1989-01-30 1991-11-19 Information Technologies Research, Inc. Method and apparatus for vector quantization
EP0419752B1 (en) 1989-09-25 1995-05-10 Rai Radiotelevisione Italiana System for encoding and transmitting video signals comprising motion vectors
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
WO1993018505A1 (en) 1992-03-02 1993-09-16 The Walt Disney Company Voice transformation system
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6263312B1 (en) 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
EP0932141B1 (en) 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
US6253185B1 (en) 1998-02-25 2001-06-26 Lucent Technologies Inc. Multiple description transform coding of audio using optimal transforms of arbitrary dimension
US6904174B1 (en) 1998-12-11 2005-06-07 Intel Corporation Simplified predictive video encoder
US6480822B2 (en) 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
JP4249821B2 (ja) 1998-08-31 2009-04-08 富士通株式会社 ディジタルオーディオ再生装置
US6704705B1 (en) 1998-09-04 2004-03-09 Nortel Networks Limited Perceptual audio coding
US6453287B1 (en) 1999-02-04 2002-09-17 Georgia-Tech Research Corporation Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders
AU4072400A (en) 1999-04-05 2000-10-23 Hughes Electronics Corporation A voicing measure as an estimate of signal periodicity for frequency domain interpolative speech codec system
US6691092B1 (en) 1999-04-05 2004-02-10 Hughes Electronics Corporation Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6504877B1 (en) 1999-12-14 2003-01-07 Agere Systems Inc. Successively refinable Trellis-Based Scalar Vector quantizers
JP4149637B2 (ja) 2000-05-25 2008-09-10 株式会社東芝 半導体装置
US6304196B1 (en) 2000-10-19 2001-10-16 Integrated Device Technology, Inc. Disparity and transition density control system and method
AUPR105000A0 (en) 2000-10-27 2000-11-23 Canon Kabushiki Kaisha Method for generating and detecting marks
JP3404024B2 (ja) 2001-02-27 2003-05-06 三菱電機株式会社 音声符号化方法および音声符号化装置
JP3636094B2 (ja) 2001-05-07 2005-04-06 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4506039B2 (ja) 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US6662154B2 (en) 2001-12-12 2003-12-09 Motorola, Inc. Method and system for information signal coding using combinatorial and huffman codes
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
WO2004082288A1 (en) * 2003-03-11 2004-09-23 Nokia Corporation Switching between coding schemes
EP1619664B1 (en) 2003-04-30 2012-01-25 Panasonic Corporation Speech coding apparatus, speech decoding apparatus and methods thereof
JP2005005844A (ja) 2003-06-10 2005-01-06 Hitachi Ltd 計算装置及び符号化処理プログラム
JP4123109B2 (ja) 2003-08-29 2008-07-23 日本ビクター株式会社 変調装置及び変調方法並びに復調装置及び復調方法
SE527670C2 (sv) 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
KR100629997B1 (ko) * 2004-02-26 2006-09-27 엘지전자 주식회사 오디오 신호의 인코딩 방법
EP3561810B1 (en) * 2004-04-05 2023-03-29 Koninklijke Philips N.V. Method of encoding left and right audio input signals, corresponding encoder, decoder and computer program product
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
US20060022374A1 (en) 2004-07-28 2006-02-02 Sun Turn Industrial Co., Ltd. Processing method for making column-shaped foam
US6975253B1 (en) 2004-08-06 2005-12-13 Analog Devices, Inc. System and method for static Huffman decoding
US7161507B2 (en) 2004-08-20 2007-01-09 1St Works Corporation Fast, practically optimal entropy coding
US20060047522A1 (en) 2004-08-26 2006-03-02 Nokia Corporation Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (AAC) system
JP4771674B2 (ja) * 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
WO2006070751A1 (ja) 2004-12-27 2006-07-06 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
US20060190246A1 (en) * 2005-02-23 2006-08-24 Via Telecom Co., Ltd. Transcoding method for switching between selectable mode voice encoder and an enhanced variable rate CODEC
JP4846712B2 (ja) * 2005-03-14 2011-12-28 パナソニック株式会社 スケーラブル復号化装置およびスケーラブル復号化方法
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
US7840411B2 (en) * 2005-03-30 2010-11-23 Koninklijke Philips Electronics N.V. Audio encoding and decoding
US7885809B2 (en) 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
US8428956B2 (en) * 2005-04-28 2013-04-23 Panasonic Corporation Audio encoding device and audio encoding method
US7831421B2 (en) 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
WO2006134992A1 (ja) * 2005-06-17 2006-12-21 Matsushita Electric Industrial Co., Ltd. ポストフィルタ、復号化装置及びポストフィルタ処理方法
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
ATE490454T1 (de) * 2005-07-22 2010-12-15 France Telecom Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate
CN101253557B (zh) 2005-08-31 2012-06-20 松下电器产业株式会社 立体声编码装置及立体声编码方法
US8069035B2 (en) * 2005-10-14 2011-11-29 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, and methods of them
US8086452B2 (en) * 2005-11-30 2011-12-27 Panasonic Corporation Scalable coding apparatus and scalable coding method
EP1989706B1 (fr) 2006-02-14 2011-10-26 France Telecom Dispositif de ponderation perceptuelle en codage/decodage audio
JP5058152B2 (ja) * 2006-03-10 2012-10-24 パナソニック株式会社 符号化装置および符号化方法
US20070239294A1 (en) 2006-03-29 2007-10-11 Andrea Brueckner Hearing instrument having audio feedback capability
US7230550B1 (en) 2006-05-16 2007-06-12 Motorola, Inc. Low-complexity bit-robust method and system for combining codewords to form a single codeword
US7414549B1 (en) 2006-08-04 2008-08-19 The Texas A&M University System Wyner-Ziv coding based on TCQ and LDPC codes
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
WO2008062990A1 (en) * 2006-11-21 2008-05-29 Samsung Electronics Co., Ltd. Method, medium, and system scalably encoding/decoding audio/speech
CA2645863C (en) 2006-11-24 2013-01-08 Lg Electronics Inc. Method for encoding and decoding object-based audio signal and apparatus thereof
US8060363B2 (en) * 2007-02-13 2011-11-15 Nokia Corporation Audio signal encoding
BRPI0807703B1 (pt) 2007-02-26 2020-09-24 Dolby Laboratories Licensing Corporation Método para aperfeiçoar a fala em áudio de entretenimento e meio de armazenamento não-transitório legível por computador
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US20090234642A1 (en) 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US7889103B2 (en) 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
EP2311034B1 (en) 2008-07-11 2015-11-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding frames of sampled audio signals
US20100088090A1 (en) 2008-10-08 2010-04-08 Motorola, Inc. Arithmetic encoding for celp speech encoders
US8140342B2 (en) 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8219408B2 (en) 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8200496B2 (en) 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8442837B2 (en) 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6108626A (en) 1995-10-27 2000-08-22 Cselt-Centro Studi E Laboratori Telecomunicazioni S.P.A. Object oriented audio coding
US20030212551A1 (en) 2002-02-21 2003-11-13 Kenneth Rose Scalable compression of audio and other signals
US7277849B2 (en) 2002-03-12 2007-10-02 Nokia Corporation Efficiency improvements in scalable audio coding
US20060265087A1 (en) * 2003-03-04 2006-11-23 France Telecom Sa Method and device for spectral reconstruction of an audio signal

Also Published As

Publication number Publication date
EP2272063A1 (en) 2011-01-12
CN102047325A (zh) 2011-05-04
KR20110002088A (ko) 2011-01-06
US20090259477A1 (en) 2009-10-15
MX2010011111A (es) 2011-02-23
BRPI0909487A2 (pt) 2017-10-17
RU2504026C2 (ru) 2014-01-10
ES2396481T3 (es) 2013-02-21
WO2009126759A1 (en) 2009-10-15
RU2010145274A (ru) 2012-05-20
EP2272063B1 (en) 2012-11-28
US8639519B2 (en) 2014-01-28
BRPI0909487A8 (pt) 2018-04-03

Similar Documents

Publication Publication Date Title
KR101317530B1 (ko) 입력 신호를 선택적으로 코딩하는 방법 및 선택적 신호 인코더
TWI405187B (zh) 可縮放語音及音訊編碼解碼器、包括可縮放語音及音訊編碼解碼器之處理器、及用於可縮放語音及音訊編碼解碼器之方法及機器可讀媒體
KR101180202B1 (ko) 다중채널 오디오 코딩 시스템 내에 인핸스먼트 레이어를 생성하기 위한 방법 및 장치
KR101125429B1 (ko) 오디오 코딩 시스템내에서 향상 계층을 발생시키는 방법 및 장치
AU2008316860B2 (en) Scalable speech and audio encoding using combinatorial encoding of MDCT spectrum
US8442837B2 (en) Embedded speech and audio coding using a switchable model core
KR101274827B1 (ko) 다수 채널 오디오 신호를 디코딩하기 위한 장치 및 방법, 및 다수 채널 오디오 신호를 코딩하기 위한 방법
KR101275892B1 (ko) 오디오 신호를 인코딩하고 디코딩하기 위한 방법 및 장치
US7693709B2 (en) Reordering coefficients for waveform coding or decoding
KR101274802B1 (ko) 오디오 신호를 인코딩하기 위한 장치 및 방법
US8306827B2 (en) Coding device and coding method with high layer coding based on lower layer coding results
WO2007011653A2 (en) Selectively using multiple entropy models in adaptive coding and decoding
EP1441330B1 (en) Method of encoding and/or decoding digital audio using time-frequency correlation and apparatus performing the method

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
N231 Notification of change of applicant
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160923

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170926

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180921

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190924

Year of fee payment: 7