KR20050006028A - 에프쥐에스 오디오 부호화에서 스케일 팩터방식 비트시프트 - Google Patents

에프쥐에스 오디오 부호화에서 스케일 팩터방식 비트시프트 Download PDF

Info

Publication number
KR20050006028A
KR20050006028A KR1020040034375A KR20040034375A KR20050006028A KR 20050006028 A KR20050006028 A KR 20050006028A KR 1020040034375 A KR1020040034375 A KR 1020040034375A KR 20040034375 A KR20040034375 A KR 20040034375A KR 20050006028 A KR20050006028 A KR 20050006028A
Authority
KR
South Korea
Prior art keywords
data
scale factor
audio signal
bit
quantized data
Prior art date
Application number
KR1020040034375A
Other languages
English (en)
Other versions
KR101033256B1 (ko
Inventor
치우테밍
쳔팡츄
Original Assignee
인더스트리얼 테크놀로지 리서치 인스티튜트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인더스트리얼 테크놀로지 리서치 인스티튜트 filed Critical 인더스트리얼 테크놀로지 리서치 인스티튜트
Publication of KR20050006028A publication Critical patent/KR20050006028A/ko
Application granted granted Critical
Publication of KR101033256B1 publication Critical patent/KR101033256B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01DSEPARATION
    • B01D35/00Filtering devices having features not specifically covered by groups B01D24/00 - B01D33/00, or for applications not specifically covered by groups B01D24/00 - B01D33/00; Auxiliary devices for filtration; Filter housing constructions
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B67OPENING, CLOSING OR CLEANING BOTTLES, JARS OR SIMILAR CONTAINERS; LIQUID HANDLING
    • B67DDISPENSING, DELIVERING OR TRANSFERRING LIQUIDS, NOT OTHERWISE PROVIDED FOR
    • B67D1/00Apparatus or devices for dispensing beverages on draught
    • B67D1/0042Details of specific parts of the dispensers
    • B67D1/0081Dispensing valves
    • B67D1/0082Dispensing valves entirely mechanical
    • B67D1/0083Dispensing valves entirely mechanical with means for separately dispensing a single or a mixture of drinks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Abstract

본 발명의 일 실시예는 스펙트럼선에서 오디오 신호를 최상위 비트(MSB)에서 최하위 비트(LSB)의 순으로 복수의 서브 밴드에서 양자화된 데이터로 양자화하고, 각 서브 밴드의 각 노이즈 허용오차에 따라서 각 서브밴드에 대응하는 복수의 스케일 팩터를 결정하고, 임계값을 초과하면 각 스케일 팩터에 의해 서브밴드에서 양자화된 값을 시프트하고, 기본층에서 양자화된 데이터를 부호화하고, 인핸스먼트층(enhancement layer)에서 양자화된 데이터를 부호화하고, 인핸스먼트층에서 양자화된 데이터를 각 층 사이즈한계까지 절단하고, 각 스케일 팩터로 부호화된 데이터를 역시프트하고, 부호화된 데이터를 역양자화하고, 부호화된 데이터를 복호화하는 단계를 포함하는 기본층 및 인핸스먼트층에서 오디오신호 부호화방법을 제공한다.

Description

에프쥐에스 오디오 부호화에서 스케일 팩터방식 비트시프트{Scale factor based bit shifting in fine granularity scalability audio coding}
본 발명은 일반적으로 오디오 부호화에 관한 것이며, 보다 상세하게 FGS(fine granularity scalability) 오디오 부호화에서 스케일 팩터방식 비트시프트(scale factor based bit shifting; SFBBS)에 관한 것이다.
FGS는 실시간 멀티미디어 스트림 및 다이나믹 멀티미디어 스토리지와 같은 다수의 오디오 부호화 어플리케이션을 포함한다. 특히, FGS는 동영상 전문가 그룹(Motion Picture Experts Group; MPEG)에 의해 채택되었고 AAC를 포함하여 국제표준 MPEG 4에 통합되었다.
MPEG-4의 ACC와 같은 현 부호화에서, 제 1정보코드가 오디오신호처리에서 헤더의 위치에 왼쪽 및 오른쪽 채널에 사용된다. 좌채널 데이터가 부호화되고 그리고 나서 우채널 데이터가 부호화된다. 즉, 부호화는 헤더, 좌우채널 순으로 처리된다. 헤더가 이러한 방식으로 처리된 후 중요도와 상관없이 좌우채널용 정보가 배열되고 전송될 때, 비트율이 저하된다면 뒤에 위치하는 우채널용 신호가 먼저 사라질 것이다. 전송수행은 그 결과 심각하게 열화(degrade)할 것이다.
FGS 오디오 부호화에서, 기본층(base layer)과 인핸스먼트층(enhancement layer)이 전송된다. 데이터의 양자화(quantization) 후, 단일 인핸스먼트층이 변경된 비트율과 함께 전송된다. 또한 층 사이즈제한이 인핸스먼트층에서 적용되는 것처럼 양자화된 데이터의 절단이 일어난다. 노이즈 샤프닝이 양자화 노이즈를 최소화시키도록 수행되어 마스킹 레벨하에서 인간 귀로 감지할 수 없게 될 것이다. 노이즈 샤프닝을 위하여, 복수의 서브밴드와 관련된 스케일 팩터의 양자화 처리에서 사이코어쿠스틱(psychoacoustics)이 에러를 제어하도록 적용된다. 디지털 오디오신호의 부호화에서 인간청력의 가장 중요한 특성은 마스킹 효과(오디오 신호가 다른 신호에 의해 들리지 않는 것) 및 임계 밴드 특성(노이즈신호가 임계밴드내에 있거나 임계밴드없이 있을 때 동일 진폭을 가지는 노이즈가 다르게 감지되는 것)을 포함한다. 이러한 특성은 사용되어 임계 밴드내에 할당된 노이즈의 범위가 부호화에 의한 데이터손실을 최소화하도록 계산된 범위에 따라서 양자화 노이즈를 발생시킴으로써 계산된다. 그러나, 절단된 데이터의 처리에 의해 도입된 에러가 사이코어쿠스틱 모델에 의해 조절되지 않는다.
종래 분야에서 적어도 상술한 단점을 극복하기 위하여 오디오 부호화의 방법 및 시스템에 관한 종래의 일반적인 필요가 있다. 비트율이 저하됨으로써 중요도와 상관없이 채널에서 정보가 배열되고 전송될 때 실행저하문제를 극복하는 오디오 부호화에서 최적방법 및 시스템에 관한 분야에 특별한 필요가 있다. 양자화된 데이터의 절단에서 에러를 제어함으로써 사이코어쿠스틱 모델의 한계를 극복하는 오디오 부호화에서 최적 FGS 방법 및 시스템 분야에 보다 필요가 있다.
도 1은 본 발명의 실시예에 따르는 통신방법을 예로 나타내는 흐름도이다.
도 2는 본 발명을 따르는 스케일 팩터방식 비트시프트(SFBBS)를 예로 나타내는 스펙트럼도이다.
도 3 및 도 4는 본 발명에 관련된 부가적인 SFBBS 구조의 엔코더 및 디코더를 나타내는 도이다.
도 5 및 도 6은 본 발명의 다른 실시예에 따르는 스케일 팩터방식 비트시프트(SFBBS)과 함께 예로 BSAC 엔코더 및 디코더를 각각 나타내는 블럭도이다.
* 도면의 주요부분에 대한 부호설명
302. 405. 필터 303. 양자화기
305. 감산기 306. 역양자화기
307. 시프터 308. 비트 슬라이서
401. 스케일 팩터 디코더 402. 스펙트럼 디코더
404. 가산기 402. 역시프터
407. 비트맵 디코더
따라서, 본 발명의 일 실시예는 종래기술의 한계와 단점에 의한 하나 이상의 문제점을 제거하는 FGS 오디오 부호화에서 스케일 팩터방식 비트시프트(SFBBS) 방법 및 시스템에 대한 것이다.
다른 장점을 달성하기 위하여, 오디오 신호가 최상위 비트(MSB)에서 최하위 비트(LSB) 순으로 양자화됨으로써, MSB의 중요도가 LSB에 관하여 증가된다. 오디오신호가 양자화되는 복수의 서브밴드에서, 사이코어쿠스틱 모델에 의해 그로부터 할당된 각 스케일 팩터에 의한 중요도에 의하여 MSB가 위로 이동된다. 스케일 팩터는 각 서브밴드에서 노이즈 허용오차에 대응한다. 적은 허용 오차를 가지는 서브밴드가 일반적으로 큰 스케일 팩터와 관련된다. 작은 에러 허용오차는 인간의 귀가 작은 에러 허용오차에 따르는 서브 밴드에 의해 정의되는 주파수 범위에 보다 민감할 것이라는 것을 의미한다. 즉, 서브 밴드에서 에러 허용오차가 작으면, 인간 귀에 보다 민감해짐에 따라서 서브밴드에서 양자화된 데이터가 보다 중요하다. 특별한 서브 밴드에서 스케일 팩터가 임계값을 초과하면, 그 서브밴드에서 양자화된 데이터는 각 스케일 팩터에 의해 시프트되는데, 즉, 서브밴드에서의 비트는 서브 밴드의 스케일 팩터의 값과 같은 중요도레벨의 동일 수에 의해 위로 이동된다.
일반적으로 실시되고 널리 기술되는 발명의 목적과 관련하여, 각 서브밴드의 각 노이즈 허용오차에 따르는 복수의 스펙트럼 서브밴드에 대응하는 복수의 스케일 팩터를 결정하는 사이코어쿠스틱 모델, 만약 임계값을 초과하면 각 스케일 팩터에 의해 스펙트럼의 서브밴드에서 처리된 오디오 신호를 이동시키는 비트 시프터와 처리된 오디오 신호를 부호화하고 절단하는 비트 슬라이서를 포함하며 최상위 비트에서 최하위 비트순으로 오디오 신호를 처리하는 스케일 팩터방식 비트시프트(SFBBS)프로세서가 제공된다.
다른 면에서, 본 발명에 따르는 SFBBS 프로세서는 처리된 오디오 신호를 양자화하는 양자화기(quantizer)를 더 포함한다. 이러한 SFBBS 프로세서는 MPEG AAC에서 실행될 수 있다.
또 다른 면에서, 본 발명에 따르는 SFBBS 프로세서는 처리된 오디오신호를 각각 양자화 및 역양자화하는 양자화기 및 역양자화기, 양자화 및 역양자화 오디오신호 사이의 차이를 가지는 감산기를 더 포함한다. 이러한 SFBBS 프로세서는 MPEG-4 비트 슬라이스 연산 부호화(bit slice arithmetic coding)(BSAC)에서 실행될 수 있다.
스펙트럼선에서 오디오 신호를 최상위 비트에서 최하위 비트 순으로 복수의 서브 밴드에서 양자화된 데이터로 양자화하고, 각 서브 밴드의 각 노이즈 허용오차에 따르는 각 서브 밴드에 대응하는 복수의 스케일 팩터를 결정하고, 임계값을 초과하면 각 스케일 팩터에 의해 양자화된 데이터를 비트 시프트하고, 양자화된 데이터를 부호화하고, 양자화된 데이터를 절단하고, 각 스케일 팩터로 부호화된 데이터를 역시프트하고, 부호화된 데이터를 역양자화하고, 부호화된 데이터를 복호화하는 단계를 포함하는 오디오신호 처리방법을 제공한다.
본 발명에 따르는 실시예에 따라서, 기본층 및 인핸스먼트 층에서 스펙트럼선에서 오디오 신호를 최상위 비트에서 최하위 비트 순으로 복수의 서브 밴드에서 양자화된 데이터로 양자화하고, 각 서브 밴드의 각 노이즈 허용오차에 따르는 각 서브 밴드에 대응하는 복수의 스케일 팩터를 결정하고, 임계값을 초과하면 각 스케일 팩터에 의해 양자화된 데이터를 비트 시프트하고, 기본층에서 양자화된 데이터를 부호화하고, 인핸스먼트층에서 양자화된 데이터를 부호화하고, 인핸스먼트층에서 양자화된 데이터를 각 층 사이즈 한계까지 절단하고, 각 스케일 팩터로 부호화된 데이터를 역시프트하고, 부호화된 데이터를 역양자화하고, 부호화된 데이터를 복호화하는 단계를 포함하는 오디오신호 부호화방법을 제공한다.
일측에서, 본 발명에 따르는 방법이 MPEG 추가 연산 부호화(additive arithmetic coding)(AAC) 또는 MPEG-4 비트 슬라이스 연산 부호화(BSAC)에서 실행된다.
다른 일측에서, 본 발명을 따르는 방법은 예를 들어, ACC 엔코더 및 ACC 디코더를 포함하는 MPEG 4 AAC 시스템에서 허프만 부호화(Huffman coding), 런 렝스(run length)(RL)부호화 또는 연산 부호화(AC)를 사용한다.
또 다른 측면에서, 본 발명을 따르는 방법은 각 스케일 팩터로 부호화된 데이터를 증폭시키고, 각 스케일 팩터로 복호화된 데이터를 비증폭시키는 단계를 더 포함한다.
다른 실시예와 관련하여, 본 발명에 따르는 기본층 및 인핸스먼트층을 부호화하고 전송하기 위한 엔코더 및 디코더를 가지는 SFBBS 구조가 제공된다. 대부분의 에러가 양자화 동안에 발생되기 때문에, 역양자화기는 엔코더에 이롭게 설치되고 부호화된 데이터의 차이가 양자화 전후로 주어진다. SFBBS가 수행됨에 따라, 단일 인핸스먼트층이 따라서 구성된다.
본 발명의 일 실시예를 따르는 SFBBS 구조에서 엔코더 예가 우선 사이코어쿠스틱 모델, 필터, 양자화기, 노이즈없는 코더, 감산기, 역양자화기, 시프터 및 비트 슬라이서를 포함한다. 본 발명을 따르는 추가 SFBBS 구조의 디코더는 우선 스케일 팩터 디코더, 스펙트럼 디코더, 역양자화기, 가산기(adder), 필터, 디-시프터 및 비트맵 디코더를 포함한다.
일측에서, 본 발명에 따르는 SFBBS 구조가 MPEG AAC 또는 MPEG-4 BSAC에서 실행된다.
본 발명에 따르는 추가 미세 세분 범위기(FGS)구조에서 스케일 팩터방식 비트시프트(SFBBS)시스템은 스펙트럼선에서 오디오 신호를 최상위 비트에서 최하위 비트 순으로 복수의 서브 밴드에서 양자화된 데이터와 에러로 양자화하는 양자화기, 각 서브밴드의 각 노이즈 허용오차에 따라 각 서브밴드에 대응하는 복수의 스케일 팩터를 결정하는 사이코어쿠스틱 모델, 기본층에서 양자화된 데이터를 부호화하는 코더, 양자화된 데이터를 역양자화하는 역양자화기, 양자화된 데이터 및 역양자화된 데이터의 차이를 가지는 감산기, 만약 임계값을 초과하면 각 스케일 팩터에 의해 서브밴드에서 양자화 및 역양자화된 데이터사이의 차이를 이동시키는 비트시프터, 양자화 및 역양자화된 데이터사이의 차이를 부호화하고 절단하는 비트 슬라이서를 포함하는 엔코더를 포함한다. 본 발명의 상기 특별한 실시예를 따르는 시스템은 스케일 팩터를 복호화하는 스케일 팩터 디코더, 양자화된 데이터를 복호화하는 스펙트럼 디코더, 양자화된 데이터를 역양자화하는 역양자화기, 부호화된 데이터를 역시프트하는 역시프터를 포함하는 디코더를 더 포함하며, 부호화된 데이터를 복호화하는 디코더이다.
다른 측면에서, SFBBS 시스템이 MPEG-4에서 비트 슬라이스 연산부호화(BSAC)와 함께 실행되도록 제공된다.
오디오 신호 품질이 3데시벨로 최적화됨으로써 밴드폭 문제와 추가 오버헤드를 이롭게 피하면서 인핸스먼트층에 더 정보가 보내질 필요가 없다는 것이 본 발명의 특별한 장점이다. 스케일 팩터가 SFBBS에서 사용됨으로써, 본 발명은 FGS 오디오 시스템과 함께 전체적으로 범위성 있고 호환성이 있게 된다.
본 발명의 추가 목적과 장점은 아래의 설명부에서 설명할 것이며, 설명을 통해 명확해질 것이며 또는 발명의 실행으로부터 터득될 것이다. 본 발명의 목적 및 장점은 첨부되는 청구항에 특별하게 지적된 요소 및 조합으로써 실현되고 성취될 것이다.
앞선 일반적인 기술과 아래의 상세한 설명 모두는 예시적이고 설명적이며 이것은 본 발명의 청구에 제한되지 않는다.
이 명세서의 부분을 구성하는 첨부도면은 발명의 몇 실시예를 나타내며 설명과 함께 본 발명의 원리를 설명하는 역할을 한다.
본 발명의 실시예의 상세한 설명을 도면을 참조하여 설명할 것이다. 가능하다면 동일참조번호는 동일 또는 유사부를 참조하여 도면 전체에 사용할 것이다.
도 1은 본 발명의 일 실시예를 따르는 통신방법의 흐름도이다. 도 1을 참조하여, 스펙트럼선에서 오디오 신호를 최상위 비트에서 최하위 비트 순으로 복수의 서브 밴드에서 양자화된 데이터로 양자화(단계 101)하고, 각 서브 밴드의 각 노이즈 허용오차에 따르는 각 서브 밴드에 대응하는 복수의 스케일 팩터를 결정(단계 102)하고, 임계값을 초과하면 각 스케일 팩터에 의해 양자화된 데이터를 비트 시프트(단계 103)하고, 기본층(단계 104) 및 인핸스먼트층(단계 105)에서 양자화된 데이터를 부호화하고, 인핸스먼트층에서 양자화된 데이터를 각 층 사이즈 한계까지 절단(단계 106)하고, 각 스케일 팩터로 부호화된 데이터를 역시프트(단계 107)하고, 부호화된 데이터를 역양자화(단계 108)하고, 부호화된 데이터를 복호화(단계 109)하는 단계를 포함하여 기본층 및 인핸스먼트층에서 오디오신호를 부호화하는 방법이 제공된다. 일측에서, 상기 특별한 실시예에 따르는 방법은 MPEG-4 BSAC에서 이롭게 실행된다.
다른 일측에서, 본 발명을 따르는 방법은 허프만 부호화, 런 렝스(RL) 부호화 또는 연산 부호화(AC)를 사용한다.
또 다른 일측에서, 본 발명을 따르는 방법은 타임 도메인에서 주파수 도메인으로, 예를 들어 변경된 이산 코사인 변환(MDCT)으로 오디오 신호를 변환하고, IMDCT에 의하여 주파수 도메인에서 타임 도메인으로 복호화된 데이터를 변환하는 단계를 더 포함한다.
또 다른 일측에서, 본 발명을 따르는 방법은 각 스케일 팩터로 부호화된 데이터를 증폭하고 각 스케일 팩터로 복호화된 데이터를 비증폭하는 단계를 더 포함한다.
오디오 신호가 최상위 비트(MSB)에서 최하위 비트(LSB) 순으로 양자화됨으로써, 본 발명의 특별한 장점은 MSB의 중요도가 LSB에 관하여 증가되는 것이 된다.
스펙트럼선에서 오디오 신호를 최상위 비트에서 최하위 비트 순으로 복수의 서브 밴드에서 양자화된 데이터로 양자화하고, 각 서브 밴드의 각 노이즈 허용오차에 따르는 각 서브 밴드에 대응하는 복수의 스케일 팩터를 결정하고, 임계값을 초과하면 각 스케일 팩터에 의해 서브 밴드에서 양자화된 데이터와 역양자화된 데이터사이의 차이를 비트 시프트하는 것을 이롭게 포함한다. 일측에서, 상기 특별한 실시예를 따르는 방법은 MPEG AAC에서 실행된다.
도 2는 본 발명을 따르는 스케일 팩터방식 비트시프트(SFBBS)를 예로 나타내는 스펙트럼도이다. 스케일 팩터가 각 스펙트럼 에너지의 각 서브밴드(i, i+1, i+2...)에서 노이즈 허용오차에 대응한다. 에러 오차허용이 거의없는 서브밴드가 일반적으로 큰 스케일 팩터와 관계된다. 작은 에러 허용오차는 인간의 귀가 작은 에러 허용오차에 대응하는 서브밴드에 의해 정의된 주파수 범위에 더욱 민감할 것이라는 것을 의미한다. 즉, 에러 허용오차가 서브밴드에서 작다면, 서브밴드의 양자화된 데이터가 보다 중요해지는데 이것은 양자화된 데이터가 인간귀에 보다 민감해야만 하기 때문이다. 특별한 서브밴드에서 스케일 팩터가 임계값을 초과하면, 서브밴드의 양자화된 데이터는 각 스케일 팩터에 의해 시프트되는데, 즉, 서브밴드의 비트가 서브밴드의 스케일 팩터의 값과 같이 중요레벨의 동일한 수에 의해 위로 시프트된다.
[표A]
[표 B]
위의 표 A 및 표 B는 각각 표와 그래프형식의 단일 MPEG-4 AAC 부호화된 프레임의 마스킹 곡선과 복수의 스케일 팩터사이의 관계를 나타낸다. 마스킹 레벨이 작아지는 서브밴드에서, 각 스케일 팩터의 값은 높아진다. 본 발명은 저 비트율에서 복호화된 오디오 신호품질을 최적화하는데 있어서 스케일 팩터방식 비트시프트(SFBBS)의 상기 관계를 개척한다.
따라서, 본 발명은 각 서브밴드의 각 노이즈 허용오차에 따르는 복수의 스펙트럼 서브밴드에 대응하는 복수의 스케일 팩터를 결정하는 사이코어쿠스틱 모델, 만약 임계값을 초과하면 각 스케일 팩터에 의해 스펙트럼의 서브밴드에서 처리된 오디오 신호를 이동시키는 비트 시프터와 처리된 오디오 신호를 부호화하고 절단하는 비트 슬라이서를 포함하며 최상위 비트에서 최하위 비트순으로 오디오 신호를 처리하는 스케일 팩터방식 비트시프트(SFBBS)프로세서를 일반적으로 제공한다.
다른 측면에서, 본 발명을 따르는 SFBBS 프로세서는 처리된 오디오신호를 양자화하는 양자화기를 더 포함한다. 이러한 SFBBS 프로세서는 MPEG AAC에서 실행될 수 있다.
또 다른 측면에서, 본 발명을 따르는 SFBBS 프로세서는 처리된 오디오신호를 각각 양자화 및 역양자화하는 양자화기 및 역양자화기, 양자화된 오디오신호와 역양자화된 오디오신호사이의 차이를 가지는 감산기를 더 포함한다. 이러한 SFBBS 프로세서는 MPEG-4 비트 슬라이스 연산 부호화(BSAC)에서 실행될 수 있다.
도 2를 다시 참조하여, 예를 들어, 서브밴드(i+2)가 낮은 노이즈 허용오차를 가지고 하이 스케일 팩터를 따르는 서브밴드이다. 서브밴드의 스케일 팩터가 4라면, 서브밴드의 스펙트럼선에서 모든 비트값이 4 에너지 레벨(도 2의 예 참조)에 의해 위로 시프트된다. 상위 비트가 한 번 시프트되고, 따라서 그것은 인핸스먼트층의 시작에 근접한 보다 중요한 서브밴드(즉, 에러가 거의 없는 허용오차를 가지는 서브밴드)에 위치한다. 비트 시프트 후에, 스펙트럼선에서 최하위 비트값의 전부 혹은 일부가 부호화되지 않거나 버려지는데, 유효한 밴드폭을 저장한다.
하이 비트율 오디오 부호화에서, 부호화에러는 마스킹 레벨에 보유되어 부호화에러는 인간 귀에 감지되지 않는다. 그러나, 낮은 비트율에서, 에러는 여전히 감지될 수 있다. 사이코어쿠스틱은 감지가능한 에러를 최소화하기 위하여 엔코더에 사용된다. 주어진 비트율에서, 사이코어쿠스틱 모델은 노이즈 레벨을 베스트로 형성하게 하기 위하여 엔코더에 사용된다. 인핸스먼트층 또는 그 부분이 추가되거나 향상될 때 동일한 노이즈 형태 문제(the same noise shaping issue)가 발생되는데, 이것은 비트 스트림에서 비트율을 변경시키는 것과 유사하다. 비트율할당 알고리즘이 반복적으로 적용된다면 이것은 실질적이지 못할 것인데, 이것은 인핸스먼트층에서 받은 데이터의 실제 비트율이 엔코더에 의해 예견될 수 없기 때문이다. 본 발명은 FGS 인핸스먼트층의 실행을 최적화하는 동안 부호화된 데이터를 노이즈 쉐이핑에서 사이코어쿠스틱을 사용한다. 디코더에 의해 나타난 실제 비트율이 엔코더에 알려지지 않음에도 불구하고, 엔코더는 스케일 팩터방식 비트시프트 즉, SFBBS를 사용하고 여전히 사이코어쿠스틱하게 노이즈 쉐이핑(noise shaping)을 수행할 수 있다.
본 발명을 따르는 방법론은 내부루프 및 외부루프에 반복적으로 표현되고 제거될 수 있다. 내부루프용 예시 가상 코드표현이 아래와 같이 표 C에 나타낸다.
[표C]
표 C에 따라서, 공통 스케일팩터가 카운트된 비트와 사용가능한 비트의 수를 비교함으로써 결정된다. 카운트된 데이터의 수가 사용가능한 비트의 수보다 많으면, 공통 스케일 팩터는 포지티브 양자화 변경에 의해 증가된다. 반대로, 카운트된 데이터의 수가 사용가능한 비트의 수보다 적으면, 공통 스케일 팩터는 양자화 변경에 의해 감소된다.
외부루프는 각 서브밴드의 각 스케일 팩터를 결정하는데 사용된다. 외부루프용 예시 가상 코드 표현이 아래와 같이 표 D에 나타낸다.
[표D]
표 D에 따라서, 서브밴드의 각 에러에너지가 초기 스펙트럼에너지의 값을, 예를 들어, 변형된 이산 코사인 변환 또는 MDCT, 가지고, 공통 스케일 팩터와 밴드 스케일 팩터값의 차이의 역양자화로 조정함으로써 결정된다. 서브밴드의 에러에너지가 임계값보다 크다면 조정이 각 서브밴드용 각 스케일 팩터(즉, 하나씩 증분됨)로 이루어진다.
도 3 및 도 4는 본 발명에 관련한 추가 SFBBS 구조의 엔코더 및 디코더를 나타내는 도이다. 대부분의 에러가 양자화동안에 발생하기 때문에, 역양자화기가 엔코더에 설치되고 부호화된 데이터의 차이가 역양자화 전후에 주어진다. 일측에서, 상기 추가 SFBBS는 MPEG AAC에서 실행된다.
추가 FGS부호화구조에서, 스펙트럼선에서 오디오 신호를 최상위 비트에서 최하위 비트 순으로 복수의 서브 밴드에서 양자화된 데이터와 에러를 양자화하고, 각 서브 밴드의 각 노이즈 허용오차에 따르는 각 서브 밴드에 대응하는 복수의 스케일 팩터를 결정하고, 임계값을 초과하면 각 스케일 팩터에 의해 양자화된 데이터를 비트 시프트하고, 기본층에서 양자화된 데이터를 부호화하고, 인핸스먼트층에서 양자화된 데이터를 부호화하고, 인핸스먼트층에서 양자화된 데이터를 각 층 사이즈 한계까지 절단하고, 각 스케일 팩터로 부호화된 데이터를 역시프트하고, 부호화된 데이터를 역양자화하고, 부호화된 데이터를 복호화하는 단계를 포함하는 방법이 제공된다.
도 3을 참조하여, 본 발명을 따르는 기본층 및 인핸스먼트층을 부호화하고 전송하는 추가 SFBBS 구조의 엔코더는 사이코어쿠스틱 모델(301), 필터(302), 양자화기(303), 노이즈없는 코더(304), 감산기(305), 역양자화기(306), 시프터(307) 및 비트 슬라이서(308)를 포함한다. 초기 오디오신호는 사이코어쿠스틱 모델(301) 및 필터(302)에서 엔코더에 입력된다. 필터(302)는 처리를 위하여 타임도메인의 입력오디오신호를 주파수 도메인의 신호로 변환시킨다. 사이코어쿠스틱 모델(301)은 스케일 팩터에 대응하는 서브밴드의 신호에 의하고 필터(302)에 의해변환되는 주파수-도메인 신호를 결합시킨다. 각 서브밴드에서 마스킹 임계값은 각 신호의 상호작용에 의해 발생된 마스킹 현상을 사용하여 계산된다. 양자화기(303)는 복수의 서브밴드에서 그 스펙트럼 에너지와 그 각 노이즈 허용오차에 관하여 주파수(frequency)-도메인을 양자화시킨다. 역양자화기(306)는 엔코더에 설치되고 부호화된 데이터의 차이가 양자화기(303)에서 양자화 전후에 감산기(305)에서 주어진다. 시프터(307)에서, 복수의 서브밴드용 양자화된 에러는 그것이 임계값을 초과하면 각 스케일 팩터에 의해 비트 시프트된다. 슬라이서(308)의 비트 슬라이싱후, 단일 인핸스먼트층이 부호화되어 구성된다. 비트 슬라이싱에서, 각 워드순서로 비트를 수직으로 보내는 것 대신에, 비트는 수직으로 각 비트배열의 그 중요도에 따라서 각 슬라이스 순서로 보내진다. 인핸스먼트층의 부호화후에, 최상위 비트는 인핸스먼트층의 시작에 가깝게 위치될 것이다. 코더(304)의 노이즈없는 부호화후에, 기본층은 부호화되고 따라서 구성된다.
인핸스먼트층의 오직 한 부분이 받아졌을 때, 본 발명에 따르는 추가 SFBBS의 디코더는 상세부를 잃게 되더라도 전체 스펙트럼의 일반형태를 가질 것이라는 것이 특별한 이점이다. 본 발명에 따르는 장점은, 인핸스먼트층이 어느 포인트에서 절단되던지 상관이 없을 것이고, 수신 데이터가 일반적으로 에러없이 수신되는 한 해독할 수 있는 것이다. 좀 더 긴 인핸스먼트층이 디코더에서 수신될수록, 디코더에 의해 좀 더 구체적으로 디코드될 수 있고, 차례로 우수한 오디오신호품질이 이루어진다.
양자화에러가 수신된 후, 비트 슬라이싱은 비트 슬라이서(308)에서 수행되고, 후에 적어도 비트 부분이 시프터(307)에 시프트된다. 초기에 중요하지 않았던 비트의 중요도는 각 위치가 인핸스먼트층의 시작(beginning)으로 이동됨으로써 증가되어 비트가 빨리 전송되도록한다. 최고의 실행을 위한 시프트에서, 스케일 팩터는 노이즈레벨이 인핸스먼트층으로부터 전송된 각 비트에 재형성됨으로써 사용된다. 디코더에서 스케일 팩터가 수신됨에 따라, 인핸스먼트층에서 어떠한 여분의 정보를 전송할 필요가 없는 것이 장점이다.
도 4를 참조하여, 본 발명을 따르는 추가 SFBBS 구조의 디코더는 스케일 팩터 디코더(401), 스펙트럼 디코더(402), 역양자화기(403), 가산기(404), 필터(405), 디-시프터(406) 및 비트맵 디코더(407)를 포함한다. 디코더(401)에서, 기본층의 부호화된 데이터와 그 대응 스케일 팩터가 복호화된다. 부호화된 데이터와 그 각 스펙트럼선은 스펙트럼 디코더(402)에서 복호화되고 그 각 스펙트럼 에너지는 역양자화기(403)에서 역양자화된다. 인핸스먼트층의 부호화된 데이터는 디-시프터(406)에서 서브밴드의 각 스케일 팩터에 의해 역시프트된다. 비트맵 디코더(407)에서의 복호화 후에, 복호화된 데이터는 가산기(404)로 향하므로 오디오 신호를 구성한다. 그리고 나서 복호화된 오디오 신호는 필터(405)에서, 주파수 도메인으로부터 타임 도메인으로 변환된다.
일측에서, 본 발명은 예를 들어, 비트 슬라이스 계산 코더(BSAC)를 가지는 MPEG-4에서, 허프만 부호화, 런 렝스(RL) 부호화 또는 연산 부호화(AC)를 사용한다. 도 5 및 도 6은 본 발명의 다른 실시에 따르는 스케일 팩터방식비트시프트(SFBBS)으로 실시된 구조에서 BSAC 엔코더 및 디코터의 예를 각각 나타내는 블록도이다. 일측에서, 이 실시된 구조는 MPEG-4 BSAC에서 실시되는 것이 장점이다.
따라서, 엔코더는 필터(502), 사이코어쿠스틱 모델(501), 일시적인 노이즈 쉐이퍼 또는 TNS(503), 예측모듈(504, 506, 507), 강도 프로세서(505), M/S 프로세서(508), 양자화기(509), SFBBS 시프터(510), 비트 슬라이스 계산 코더(511)를 포함한다. 필터(502)는 입력 오디오 신호를 타임 도메인에서 주파수 도메인으로 변환한다. 사이코어쿠스틱 모델(501)은 스케일 팩터에 대응하는 서브밴드의 신호에 의해서 필터(502)에 의해 변환된 주파수 도메인 신호를 결합시킨다. 각 서브밴드에서의 마스킹 임계값은 각 신호의 상호작용에 의해 발생된 현상의 마스킹을 사용함으로써 계산된다. 엔코더에서 선택적으로 사용된 TNS(503)는 신호변환용 각 윈도우 내에 양자화 노이즈의 일시적 노이즈 형태를 제어하는데, 이것은 주파수 데이터를 필터링함으로써 일시적으로 형성될 수 있다. 엔코더에서 선택적으로 또한 사용된 강도 프로세서(505)는 전송된 다른 채널의 서브밴드를 가지고 두개의 채널 중 하나의 서브밴드용 양자화된 정보를 오직 엔코드한다. 엔코더에 선택적으로 사용된 예측 모듈(504, 506, 507)은 현재 프레임의 주파수 계수를 평가한다. 예측된 값과 실제 주파수 성분의 차이가 발생되고 사용가능한 비트의 양을 효과적으로 줄이는 것으로 양자화되고 부호화된다. 엔코더에 선택적으로 사용된 M/S 프로세서(508)는 좌채널신호 및 우채널신호를 2신호의 가산 및 감산신호로 변환하여 처리한다. 양자화기(509)는 각 서브밴드의 주파수 신호를 스칼라 양자화시켜서 각 서브밴드의 양자화 노이즈의 크기가 인간 귀의 불감지를 확보하는 데 있어서 임계값을 마스킹하는 것 보다 작아진다. SFBBS 시프터(510)에서, 복수의 서브밴드를 위한 양자화된 데이터는 임계값을 초과하면 각 스케일 팩터에 의해 비트 시프트되고, 본 발명의 원리에 따라서 설명된다. 비트 슬라이스 계산 코더(511)에서, 양자화된 주파수 데이터가 대응하는 서브밴드의 사이드 정보(스케일 팩터 포함)와 오디오 데이터의 양자화 정보를 결합함으로써 부호화된다. 양자화된 데이터는 최상위 비트(MSB) 시퀀스에서 최하위 비트(LSB) 시퀀스, 저주파수 요소에서 고주파수 요소로 규정하는 순서로 순차적으로 부호화된다. 좌우 채널은 기본층의 부호화를 수행하도록 벡터에서 부호화된다. 기본층이 부호화된 후, 다음 인핸스먼트층의 사이드 정보(스케일 팩터를 포함) 및 양자화된 데이터가 코드되어 형성된 비트 스트림이 층 구조를 가진다. 그리고 나서 비트 스트림은 디코더로 전송되도록 발생되고 멀티플렉서된다.
도 6을 참조하여, 본 발명을 따르는 장착된 구조예에서의 디코더는 비트 슬라이스 계산 디코더(601), SFBBS 디-시프터(602), 역양자화기(603), M/S 프로세서(604), 예측모듈(605, 606, 608), 강도 프로세서(607), TNS(609) 및 필터(610)를 포함한다. 부호화된 데이터를 위한 비트 스트림이 수신되고 비멀티플렉스됨에 따라, 헤더정보 및 부호화된 데이터는 비트 스트림의 발생 순서로 분리된다. 비트 슬라이스 계산 디코더(601)는 입력 비트 스트림의 발생 순서로 사이드 정보(스케일 팩터 포함) 및 비트 슬라이스되고 양자화된 데이터를 디코드한다. SFBBS 디-시프터(602), 부호화된 데이터는 여기서 설명하는 본 발명의 원리와 관련하여 서브밴드에서 각 스케일 팩터에 의해 역시프트된다. 역양자화기(603)에서, 복호화된 데이터는 양자화된다. M/S 프로세서(604)는 엔코더에서 M/S 처리에 대응하는 서브밴드를 처리한다. 평가가 엔코더에서 수행된다면, 평가 모듈(605, 606, 608)은 엔코더에서의 동일한 방식의 평가를 통해 이전 프레임에서 복호화된 데이터와 같은 값을 탐색한다. 예측된 신호는 원래의 주파수 성분을 복구하는데 디코드 및 디멀티플렉스된 차신호에 가산된다. TNS(609)는 주파수 도메인에서 타임 도메인으로의 변환을 위한 각 윈도우와 함께 양자화 노이즈의 일시적 형태를 제어한다. 복호화된 데이터는 MPEG-4의 AAC 같은 종래 오디오 알고리즘을 사용하여 일시적인 신호로써 재기억된다. 역양자화기(603)는 복호화된 시크엘 인자와 양자화된 데이터를 초기 크기를 가지는 신호로 재기억한다. 발명의 다른 실시예는 명세서의 고찰과 여기서 공개된 본 발명의 실행으로부터의 분야에 기술된 것에서 명백해 질 것이다. 다음 청구항에 의해 지시되는 본 발명의 실제 범위와 정신과 함께 설명과 예시는 오직 예시로 고려된다.
본 발명에 의하면, 오디오 신호 품질이 3데시벨로 최적화됨으로써 밴드폭 문제와 추가 오버헤드를 이롭게 피하면서 인핸스먼트층에 더 정보가 보내질 필요가 없다. 스케일 팩터가 SFBBS에서 사용됨으로써, 본 발명은 FGS 오디오 시스템과 함께 전체적으로 범위성 있고 호환성이 있게 되는 효과가 있다.

Claims (40)

  1. 오디오 신호처리방법에 있어서,
    스펙트럼선에서 오디오 신호를 최상위 비트에서 최하위 비트 순으로 복수의 서브 밴드에서 양자화된 데이터로 양자화하고,
    각 서브 밴드의 각 노이즈 허용오차에 따라서 각 서브 밴드에 대응하는 복수의 스케일 팩터를 결정하고,
    임계값을 초과하면 각 스케일 팩터에 의해 서브밴드에서 양자화된 데이터를 비트 시프트하고,
    양자화된 데이터를 부호화하고,
    양자화된 데이터를 절단하는 것을 포함하는 오디오신호 처리방법.
  2. 제 1항에 있어서,
    부호화된 데이터를 역시프트하고,
    부호화된 데이터를 역양자화하고,
    부호화된 데이터를 복호화하는 것을 더 포함하는 오디오신호 처리방법.
  3. 제 2항에 있어서,
    각 스케일 팩터로 양자화된 데이터를 증폭시키고,
    각 스케일 팩터로 복호화된 데이터를 비증폭시키는 것을 더 포함하는 오디오신호 처리방법.
  4. 제 2항에 있어서,
    양자화된 데이터 및 역양자화된 데이터의 차이를 결정하는 것을 더 포함하는 오디오신호 처리방법.
  5. 제 1항에 있어서,
    기본층 및 인핸스먼트층에서 양자화된 데이터를 부호화하는 것을 더 포함하는 오디오신호 처리방법.
  6. 제 5항에 있어서,
    인핸스먼트층에서 각 층 사이즈 한계까지 양자화된 데이터를 절단하는 것을 더 포함하는 오디오신호 처리방법.
  7. 제 1항에 있어서,
    허프만 부호화, 런 렝스(RL) 부호화 또는 양자화된 데이터의 계산적인 부호화중 하나를 더 포함하는 오디오신호 처리방법.
  8. 제 1항에 있어서,
    사이코어쿠스틱에 의한 스케일 팩터를 결정하는 것을 더 포함하는 오디오신호 처리방법.
  9. 제 1항에 있어서,
    타임 도메인에서 주파수 도메인으로 오디오 신호를 변환하는 것을 더 포함하는 오디오신호 처리방법.
  10. 제 2항에 있어서,
    주파수 도메인에서 타임 도메인으로 복호화된 데이터를 변환하는 것을 더 포함하는 오디오신호 처리방법.
  11. 오디오신호를 처리하는 엔코더 및 디코더를 가지는 스케일 팩터방식 비트시프트(SFBBS)시스템에 있어서,
    상기 엔코더는,
    스펙트럼선에서 오디오 신호를 최상위 비트에서 최하위 비트 순으로 복수의 서브 밴드에서 양자화된 데이터를 양자화하는 양자화기,
    각 서브밴드의 각 노이즈 허용오차에 따라 각 서브밴드에 대응하는 복수의 스케일 팩터를 결정하는 사이코어쿠스틱 모델,
    양자화된 데이터를 부호화하는 코더,
    양자화된 데이터를 역양자화하는 역양자화기,
    양자화된 데이터 및 역양자화된 데이터의 차이를 가지는 감산기,
    만약 임계값을 초과하면 각 스케일 팩터에 의해 서브밴드에서 차이를 이동시키는 비트시프터,
    차이를 부호화하고 절단하는 비트 슬라이서를 포함하는 것을 특징으로 하는 스케일 팩터방식 비트시프트(SFBBS) 시스템.
  12. 제 11항에 있어서,
    스케일 팩터를 복호화하는 스케일 팩터 디코더,
    양자화된 데이터를 복호화하는 스펙트럼 디코더,
    부호화된 데이터를 역시프트하는 디-시프터,
    부호화된 데이터를 복호화하는 디코더를 가지는 디코더를 더 포함하는 시스템.
  13. 제 11항에 있어서,
    타임 도메인에서 주파수 도메인으로 양자화된 데이터를 변환하는 필터를 더 포함하는 엔코더를 가지는 시스템.
  14. 제 12항에 있어서,
    주파수 도메인에서 타임도메인으로 복호화된 데이터를 변환하는 필터를 더 포함하는 디코더를 가지는 시스템.
  15. 제 12항에 있어서,
    디코더된 데이터를 추가하는 가산기(adder)를 더 포함하는 디코더를 가지는 시스템.
  16. 제 12항에 있어서,
    각 스케일 팩터를 가지며, 양자화된 데이터가 증폭되고, 디코더된 데이터가 비증폭화되는 시스템.
  17. 제 11항에 있어서,
    런 렝스(RL)엔코더, 허프만 엔코도 또는 양자화된 데이터를 부호화하는 계산 엔코더(arithmetic encoder)를 더 포함하는 시스템.
  18. 제 11항에 있어서,
    추가 FGS 구조에서 실행되는 시스템.
  19. 제 11항에 있어서,
    비트 시프트 후에 최하위 비트가 제거되는 시스템.
  20. 제 11항에 있어서,
    양자화된 차이가 기본층 및 인핸스먼트층에서 부호화되고, 인핸스먼트층의양자화된 차이가 각 층 사이즈 한계까지 절단되는 시스템.
  21. 오디오 신호처리방법에 있어서,
    스펙트럼선에서 오디오 신호를 최상위 비트에서 최하위 비트 순으로 서브밴드의 복수의 서브 밴드에서 양자화된 데이터로 양자화하고,
    각 서브 밴드의 각 노이즈 허용오차에 따라서 각 서브 밴드에 대응하는 복수의 스케일 팩터를 결정하고,
    임계값을 초과하면 각 스케일 팩터에 의해 서브밴드에서 양자화된 데이터를 비트 시프트하고,
    기본층에서 양자화된 데이터를 부호화하고,
    양자화된 데이터를 절단하는 것을 포함하는 오디오신호 처리방법.
  22. 제 21항에 있어서,
    부호화된 데이터를 역시프트하고,
    부호화된 데이터를 역양자화하고,
    부호화된 데이터를 복호화하는 것을 더 포함하는 오디오신호 처리방법.
  23. 제 21항에 있어서,
    비트 시프트후에 최하위 비트를 제거하는 것을 더 포함하는 오디오신호 처리방법.
  24. 제 21항에 있어서,
    기본층 및 인핸스먼트층에서 양자화된 데이터를 부호화하고, 인핸스먼트층의 양자화된 데이터를 각 층 사이즈 한계까지 절단하는 것을 더 포함하는 오디오신호 처리방법.
  25. 제 21항에 있어서,
    허프만 부호화(Huffman coding), 양자화된 데이터의 연산 부호화 또는 런 렝스(RL)부호화 중 하나를 더 포함하는 오디오신호 처리방법.
  26. 제 21항에 있어서,
    사이코어쿠스틱에 의해 스케일 팩터를 결정하는 것을 더 포함하는 오디오신호 처리방법.
  27. 제 21항에 있어서,
    추가 FGS 구조에서 실행되는 오디오신호 처리방법.
  28. 오디오신호를 부호화하는 엔코더 및 디코더를 가지는 스케일 팩터방식 비트시프트(SFBBS)시스템에 있어서,
    상기 엔코더는,
    스펙트럼선에서 오디오 신호를 최상위 비트에서 최하위 비트 순으로 복수의 서브 밴드에서 양자화된 데이터를 양자화하는 양자화기,
    각 서브밴드의 각 노이즈 허용오차에 따라 각 서브밴드에 대응하는 복수의 스케일 팩터를 결정하는 사이코어쿠스틱 모델,
    만약 임계값을 초과하면 각 스케일 팩터에 의해 서브밴드에서 양자화된 데이터를 시프트하는 비트시프터,
    양자화된 데이터를 부호화하고 절단하는 비트 슬라이서를 포함하는 것을 특징으로 하는 스케일 팩터방식 비트시프트(SFBBS) 시스템.
  29. 제 28항에 있어서,
    스케일 팩터를 복호화하는 스케일 팩터 디코더,
    양자화된 데이터를 복호화하는 스펙트럼 디코더,
    부호화된 데이터를 역시프트하는 디-시프터를 더 포함하는 디코더를 더 포함하며,
    부호화된 데이터를 복호화하는 디코더인 것을 특징으로 하는 시스템.
  30. 제 28항에 있어서,
    MPEG-4 비트 슬라이스 연산 부호화(BSAC)에서 실행되는 시스템.
  31. 오디오 신호처리 방법에 있어서,
    스펙트럼선에서 오디오 신호를 최상위 비트에서 최하위 비트 순으로 서브밴드의 복수의 서브 밴드에서 양자화된 데이터로 양자화하고,
    각 서브 밴드의 각 노이즈 허용오차에 따라서 각 서브 밴드에 대응하는 복수의 스케일 팩터를 결정하고,
    양자화된 데이터를 역양자화하고,
    임계값을 초과하면 각 스케일 팩터에 의해 서브밴드에서 차이를 비트 시프트하고,
    양자화된 차이를 부호화 및 절단하는 것을 포함하는 오디오 신호 처리방법.
  32. 제 31항에 있어서,
    부호화된 데이터를 역시프트하고,
    부호화된 데이터를 복호화하는 것을 더 포함하는 오디오 신호 처리방법.
  33. 제 32항에 있어서,
    각 스케일 팩터로 양자화된 데이터를 증폭하고,
    각 스케일 팩터로 복호화된 데이터를 비증폭하는 것을 더 포함하는 오디오 신호 처리방법.
  34. 제 31항에 있어서,
    허프만 부호화, 런 렝스(RL)부호화 또는 양자화된 데이터의 계산적인 부호화중 하나를 더 포함하는 오디오 신호 처리방법.
  35. 제 31항에 있어서,
    비트 시프트 후에, 최하위 비트가 제거되는 오디오 신호 처리방법.
  36. 최상위 비트에서 최하위 비트의 순으로 오디오 신호를 처리하는 스케일 팩터방식 비트시프트(SFBBS) 프로세서에 있어서,
    각 서브밴드의 각 노이즈 허용오차에 따라 복수의 서브밴드에 대응하는 복수의 스케일 팩터를 결정하는 사이코어쿠스틱 모듈,
    임계값을 초과하면 각 스케일 팩터에 의해 스펙트럼 서브밴드에서 처리된 오디오 신호를 시프트하는 비트 시프터,
    처리된 오디오 신호를 부호화하고 절단하는 비트 슬라이서를 포함하는 스케일 팩터방식 비트시프트(SFBBS) 프로세서.
  37. 제 36항에 있어서,
    처리된 오디오 신호를 양자화하는 양자화기를 더 포함하는 프로세서.
  38. 제 36항에 있어서,
    처리된 오디오 신호를 양자화하는 양자화기,
    처리된 오디오 신호를 역양자화는 역양자화기,
    양자화된 오디오 신호 및 역양자화된 오디오 신호사이의 차이를 가지는 감산기를 더 포함하는 프로세서.
  39. 제 36항에 있어서,
    추가 FGS 구조에서 실행되는 프로세서.
  40. 제 36항에 있어서,
    MPEG AAC 또는 MPEG-4 비트 슬라이스 연산 부호화(BSAC)에서 실행되는 프로세서.
KR1020040034375A 2003-07-08 2004-05-14 Fgs 오디오 부호화에서 스케일 팩터방식 비트시프트 KR101033256B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US48516103P 2003-07-08 2003-07-08
US60/485,161 2003-07-08
US10/714,617 US7620545B2 (en) 2003-07-08 2003-11-18 Scale factor based bit shifting in fine granularity scalability audio coding
US10/714,617 2003-11-18

Publications (2)

Publication Number Publication Date
KR20050006028A true KR20050006028A (ko) 2005-01-15
KR101033256B1 KR101033256B1 (ko) 2011-05-06

Family

ID=33567752

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040034375A KR101033256B1 (ko) 2003-07-08 2004-05-14 Fgs 오디오 부호화에서 스케일 팩터방식 비트시프트

Country Status (3)

Country Link
US (1) US7620545B2 (ko)
KR (1) KR101033256B1 (ko)
TW (1) TWI306336B (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100814673B1 (ko) * 2004-02-13 2008-03-18 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. 오디오 부호화
KR101277354B1 (ko) * 2011-12-21 2013-06-20 인텔 코오퍼레이션 메모리 대역폭 및 저장소를 감소시키기 위한 이미지 데이터의 지각적 무손실 압축

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2849727B1 (fr) * 2003-01-08 2005-03-18 France Telecom Procede de codage et de decodage audio a debit variable
KR100537517B1 (ko) * 2004-01-13 2005-12-19 삼성전자주식회사 오디오 데이타 변환 방법 및 장치
US7725799B2 (en) * 2005-03-31 2010-05-25 Qualcomm Incorporated Power savings in hierarchically coded modulation
KR20070037945A (ko) * 2005-10-04 2007-04-09 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
US8392176B2 (en) 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
US20080059201A1 (en) * 2006-09-03 2008-03-06 Chih-Hsiang Hsiao Method and Related Device for Improving the Processing of MP3 Decoding and Encoding
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
CN102237096B (zh) * 2010-04-29 2013-10-02 炬力集成电路设计有限公司 一种对音频数据进行反量化的方法及装置
KR20140095014A (ko) 2011-12-21 2014-07-31 인텔 코오퍼레이션 압축되지 않은 비디오 인터커넥트들 상의 송신을 위한 이미지 데이터의 지각적 무손실 압축
JP5942463B2 (ja) * 2012-02-17 2016-06-29 株式会社ソシオネクスト オーディオ信号符号化装置およびオーディオ信号符号化方法
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
US11570477B2 (en) * 2019-12-31 2023-01-31 Alibaba Group Holding Limited Data preprocessing and data augmentation in frequency domain

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4149263A (en) * 1977-06-20 1979-04-10 Motorola, Inc. Programmable multi-bit shifter
US4727506A (en) * 1985-03-25 1988-02-23 Rca Corporation Digital scaling circuitry with truncation offset compensation
US4811081A (en) * 1987-03-23 1989-03-07 Motorola, Inc. Semiconductor die bonding with conductive adhesive
US5367608A (en) * 1990-05-14 1994-11-22 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit allocation unit for subband coding a digital signal
US5258648A (en) * 1991-06-27 1993-11-02 Motorola, Inc. Composite flip chip semiconductor device with an interposer having test contacts formed along its periphery
US5424652A (en) * 1992-06-10 1995-06-13 Micron Technology, Inc. Method and apparatus for testing an unpackaged semiconductor die
WO1995032499A1 (fr) * 1994-05-25 1995-11-30 Sony Corporation Procede de codage, procede de decodage, procede de codage-decodage, codeur, decodeur et codeur-decodeur
KR970031362A (ko) * 1995-11-06 1997-06-26 김광호 디지탈 오디오 부호화방법
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
DE19826252C2 (de) * 1998-06-15 2001-04-05 Systemonic Ag Verfahren zur digitalen Signalverarbeitung
JP3739959B2 (ja) * 1999-03-23 2006-01-25 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US6263022B1 (en) * 1999-07-06 2001-07-17 Philips Electronics North America Corp. System and method for fine granular scalable video with selective quality enhancement
EP1887561A3 (en) * 1999-08-26 2008-07-02 Sony Corporation Information retrieving method, information retrieving device, information storing method and information storage device
US6678653B1 (en) * 1999-09-07 2004-01-13 Matsushita Electric Industrial Co., Ltd. Apparatus and method for coding audio data at high speed using precision information
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US6931370B1 (en) * 1999-11-02 2005-08-16 Digital Theater Systems, Inc. System and method for providing interactive audio in a multi-channel audio environment
US6639943B1 (en) * 1999-11-23 2003-10-28 Koninklijke Philips Electronics N.V. Hybrid temporal-SNR fine granular scalability video coding
US6931060B1 (en) * 1999-12-07 2005-08-16 Intel Corporation Video processing of a quantized base layer and one or more enhancement layers
DE19959156C2 (de) * 1999-12-08 2002-01-31 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals
DE10010849C1 (de) * 2000-03-06 2001-06-21 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Analysieren eines Analyse-Zeitsignals
US6678647B1 (en) * 2000-06-02 2004-01-13 Agere Systems Inc. Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution
US6542863B1 (en) * 2000-06-14 2003-04-01 Intervideo, Inc. Fast codebook search method for MPEG audio encoding
US20030079222A1 (en) * 2000-10-06 2003-04-24 Boykin Patrick Oscar System and method for distributing perceptually encrypted encoded files of music and movies
US20020076049A1 (en) * 2000-12-19 2002-06-20 Boykin Patrick Oscar Method for distributing perceptually encrypted videos and decypting them
US6792044B2 (en) * 2001-05-16 2004-09-14 Koninklijke Philips Electronics N.V. Method of and system for activity-based frequency weighting for FGS enhancement layers
WO2003009579A2 (en) * 2001-07-17 2003-01-30 Amnis Corporation Computational methods for the segmentation of images of objects from background in a flow imaging instrument
KR100477699B1 (ko) * 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
US7318027B2 (en) * 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
US7103316B1 (en) * 2003-09-25 2006-09-05 Rfmd Wpan, Inc. Method and apparatus determining the presence of interference in a wireless communication channel
JP4398323B2 (ja) * 2004-08-09 2010-01-13 ユニデン株式会社 デジタル無線通信装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100814673B1 (ko) * 2004-02-13 2008-03-18 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. 오디오 부호화
KR101277354B1 (ko) * 2011-12-21 2013-06-20 인텔 코오퍼레이션 메모리 대역폭 및 저장소를 감소시키기 위한 이미지 데이터의 지각적 무손실 압축

Also Published As

Publication number Publication date
US7620545B2 (en) 2009-11-17
TWI306336B (en) 2009-02-11
TW200507467A (en) 2005-02-16
US20050010395A1 (en) 2005-01-13
KR101033256B1 (ko) 2011-05-06

Similar Documents

Publication Publication Date Title
KR101033256B1 (ko) Fgs 오디오 부호화에서 스케일 팩터방식 비트시프트
US9153240B2 (en) Transform coding of speech and audio signals
US7627480B2 (en) Support of a multichannel audio extension
EP2282310B1 (en) Entropy coding by adapting coding between level and run-length/level modes
US7613603B2 (en) Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
US6122618A (en) Scalable audio coding/decoding method and apparatus
KR101019678B1 (ko) 저비트율 오디오 코딩
EP1080462B1 (en) System and method for entropy encoding quantized transform coefficients of a signal
KR19990041073A (ko) 비트율 조절이 가능한 오디오 부호화/복호화 방법 및 장치
KR19990041072A (ko) 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
CN1918630B (zh) 量化信息信号的方法和设备
WO2005096274A1 (fr) Dispositif et procede de codage/decodage audio ameliores
KR100945219B1 (ko) 인코딩된 신호의 처리
JP4063508B2 (ja) ビットレート変換装置およびビットレート変換方法
US20050010396A1 (en) Scale factor based bit shifting in fine granularity scalability audio coding
KR100378796B1 (ko) 디지탈 오디오 부호화기 및 복호화 방법
JP2004094223A (ja) 多数のサブバンド及び重なり合うウィンドウ関数を用いて処理される音声信号を符号化及び復号化する方法及び装置
KR100668319B1 (ko) 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
US6012025A (en) Audio coding method and apparatus using backward adaptive prediction
JP3336619B2 (ja) 信号処理装置
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置
KR100640833B1 (ko) 디지털 오디오의 부호화 방법
GB2322776A (en) Backward adaptive prediction of audio signals
JPH0918348A (ja) 音響信号符号化装置及び音響信号復号装置
Reddy Implementation of AAC Encoder for Audio Broadcasting

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140409

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160412

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170414

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180413

Year of fee payment: 8