KR101135243B1 - 오디오 클립을 플레이하는 디바이스 및 방법 - Google Patents

오디오 클립을 플레이하는 디바이스 및 방법 Download PDF

Info

Publication number
KR101135243B1
KR101135243B1 KR1020087013037A KR20087013037A KR101135243B1 KR 101135243 B1 KR101135243 B1 KR 101135243B1 KR 1020087013037 A KR1020087013037 A KR 1020087013037A KR 20087013037 A KR20087013037 A KR 20087013037A KR 101135243 B1 KR101135243 B1 KR 101135243B1
Authority
KR
South Korea
Prior art keywords
subbands
processor
channel
frequency
audio
Prior art date
Application number
KR1020087013037A
Other languages
English (en)
Other versions
KR20080070844A (ko
Inventor
예 왕
웬동 후앙
사마르지트 차크라보르티
Original Assignee
내셔날유니버서티오브싱가폴
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 내셔날유니버서티오브싱가폴 filed Critical 내셔날유니버서티오브싱가폴
Publication of KR20080070844A publication Critical patent/KR20080070844A/ko
Application granted granted Critical
Publication of KR101135243B1 publication Critical patent/KR101135243B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

오디오 클립을 플레이하는 장치, 오디오 클립을 플레이하는 방법 및 오디오 클립을 플레이하는 방법을 수행하는 컴퓨터를 지시하는 컴퓨터 코드를 저장한 데이터 저장 매체가 개시된다. 오디오 클립을 플레이하는 장치는 전압, 주파수, 또는 전압 및 주파수 모두가 스케일가능한 프로세서, 장치의 복수의 출력 모드들 중 하나를 선택하는 스위치; 및 선택된 출력 모드에 기초하여 오디오 클립을 나타내는, 입력 조인트/MS(joint/MS) 스테레오 모드로 인코딩된 오디오 데이터를 디코딩하도록 프로세서를 제어하는 제어기를 포함하고, 복수의 출력 모드는 각각 조인트/MS 스테레오 모드로 인코딩된 오디오 데이터의 M 채널의 서브밴드들의 개수(m) 및 S 채널의 서브밴드들의 개수(s)를 정의하고, 제어기는 플레이백(playback)에서 상기 m 개 및 s 개의 서브밴드들로부터의 데이터만을 디코딩하고 저장하도록 프로세서를 제어한다.

Description

오디오 클립을 플레이하는 디바이스 및 방법{A DEVICE AND A METHOD OF PLAYING AUDIO CLIPS}
본 발명은 오디오 클립을 플레이하는 디바이스, 오디오 클립을 플레이하는 방법 및 오디오 클립을 플레이하는 방법을 수행하는 컴퓨터를 지시하는 컴퓨터 코드를 저장한 데이터 저장 매체에 관한 것이다.
전력 소모 문제는 휴대용 임베디드(embedded) 시스템에 있어서 하드웨어와 소프트웨어 디자인에 있어서 결정적인 제한요인이 되고 있다. 많은 휴대용 임베드드 시스템들은 오디오 및 비디오 디코딩과 같은 멀티미디어 어플리케이션들을 스트리밍하는 것을 목표로 하고 있다. 전형적으로 이러한 멀티미디어 어플리케이션들은 요구되는 계산량이 매우 다양하다.
현존하는 동적(dynamic) 전압/주파수 스케일링 및 동적 파워 관리 기술들은 이러한 다양성을 이용하여 에너지를 절약하기 위하여 계산량이 적게 요구되는 동안에는 프로세서의 동작 속도를 늦추거나 프로세서를 끈다(switch-off). 이러한 기술들은 계산 요구량의 예측에 기반하고 있고, 종종 제어이론적 피드백 스킴들을 사용한다. 하지만 이러한 피드백 스킴들은 계산적으로 비용이 높고 에러를 일으키는 경향이 있다.
따라서 상기한 문제점들 중 적어도 하나를 해결할 수 있는 기술이나 스킴의 필요성이 대두된다.
본 발명의 제1 측면에 따르는 오디오 클립을 플레이하는 디바이스는 전압, 주파수, 또는 전압 및 주파수 모두가 스케일가능한 프로세서; 상기 디바이스의 복수의 출력 모드들 중 하나를 선택하는 스위치; 및 상기 선택된 출력 모드에 기초하여 상기 오디오 클립을 나타내는, 입력 조인트/MS(joint/MS) 스테레오 모드로 인코딩된 오디오 데이터를 디코딩하도록 프로세서를 제어하는 제어기를 포함하고, 상기 복수의 출력 모드는 각각 조인트/MS 스테레오 모드로 인코딩된 오디오 데이터의 M 채널의 서브밴드들의 개수(m) 및 S 채널의 서브밴드들의 개수(s)를 정의하고, 상기 제어기는 플레이백(playback)에서 상기 m 개 및 s 개의 서브밴드들로부터의 데이터만을 디코딩하고 저장하도록 상기 프로세서를 제어한다.
실시예에 있어서, 상기 S 채널의 서브밴드들의 개수(s)는 상기 M 채널의 서브밴드들의 개수(m)보다 작거나 같을 수 있다.
실시예에 있어서, 상기 M 채널의 서브밴드들의 개수(m)는 상기 S 채널의 서브밴드들의 개수(s)보다 작고, 상기 제어기는 상기 프로세서가 상기 M 채널 중에서 조인트/MS 스테레오 모드 프로세싱 후에 변하지 않는 [s+1, m] 서브밴드들을 카피(copy) 하도록 제어할 수 있다.
실시예에 있어서, 각 출력 모드는 디코딩할 때 프로세서의 서로 다른 전력 소모와 연관될 수 있다.
실시예에 있어서, 각 출력 모드는 디코딩할 때 최소 필요 프로세서 주파수와 연관될 수 있다.
실시예에 있어서, 각 출력 모드는 서로 다른 출력 대역폭과 연관될 수 있다.
실시예에 있어서, 각 출력 모드는 서로 다른 음질 레벨(quality level)과 연관될 수 있다.
본 발명의 제2 측면에 따르는 오디오 클립을 플레이하는 방법은 복수의 출력 모드들 중 하나를 선택하는 단계; 상기 선택된 출력 모드에 기초하여 상기 오디오 클립을 나타내는, 입력 조인트/MS(joint/MS) 스테레오 모드로 인코딩된 오디오 데이터를 디코딩하도록 전압, 주파수, 또는 전압 및 주파수 모두가 스케일가능한 프로세서를 제어하는 단계(여기서 상기 복수의 출력 모드는 각각 조인트/MS 스테레오 모드로 인코딩된 오디오 데이터의 M 채널의 서브밴드들의 개수(m) 및 S 채널의 서브밴드들의 개수(s)를 정의함); 및 상기 m 개 및 s 개의 서브밴드들로부터의 데이터만을 디코딩하고 저장하도록 상기 프로세서를 제어하는 단계를 포함한다.
실시예에 있어서, 상기 M 채널의 서브밴드들의 개수(m)는 상기 S 채널의 서브밴드들의 개수(s)보다 작고, 상기 제어기는 상기 프로세서가 상기 M 채널 중에서 조인트/MS 스테레오 모드 프로세싱 후에 변하지 않는 [s+1, m] 서브밴드들을 카피(copy) 하도록 제어할 수 있다.
실시예에 있어서, 각 출력 모드는 디코딩할 때 프로세서의 서로 다른 전력 소모와 연관될 수 있다.
실시예에 있어서, 각 출력 모드는 디코딩할 때 최소 필요 프로세서 주파수와 연관될 수 있다.
실시예에 있어서, 각 출력 모드는 서로 다른 출력 대역폭과 연관될 수 있다.
실시예에 있어서, 각 출력 모드는 서로 다른 음질 레벨(quality level)과 연관될 수 있다.
본 발명의 제3 측면에 따르는 오디오 클립을 플레이하는 방법을 수행하는 컴퓨터를 지시하는 컴퓨터 코드를 저장한 데이터 저장 매체에 있어서, 상기 오디오 클립을 플레이하는 방법은 복수의 출력 모드들 중 하나를 선택하는 단계; 상기 선택된 출력 모드에 기초하여 상기 오디오 클립을 나타내는, 입력 조인트/MS(joint/MS) 스테레오 모드로 인코딩된 오디오 데이터를 디코딩하도록 전압, 주파수, 또는 전압 및 주파수 모두가 스케일가능한 프로세서를 제어하는 단계(여기서 상기 복수의 출력 모드는 각각 조인트/MS 스테레오 모드로 인코딩된 오디오 데이터의 M 채널의 서브밴드들의 개수(m) 및 S 채널의 서브밴드들의 개수(s)를 정의함); 및 상기 m 개 및 s 개의 서브밴드들로부터의 데이터만을 디코딩하고 저장하도록 상기 프로세서를 제어하는 단계를 포함한다.
본 발명의 하나 이상의 실시예들은 도면들 및 상세한 설명과 함께 설명된다. 본 발명의 다른 특징들, 목적들 및 이점들은 상기 도면들, 상기 상세한 설명 및 청구항들로부터 명백할 것이다.
도 1은 본 발명의 일 실시예에 따른 BSS-MP3 디코더를 나타내는 개략도이다.
도 2는 4 개의 주파수 밴드 그룹들을 나타내는 표이다.
도 3은 BSS-MP3 디코더에서 수행되는 BSS 디코딩 스킴의 프로세스들을 나타내는 흐름도이다.
도 4는 세 가지 다른 플레이백 지연 값들에서 서로 다른 디코딩 레벨에 대하여 최소로 필요한 주파수를 나타내는 표이다.
도 5는 플레이백 지연이 0.5초인 경우에 14 개의 다른 디코딩 레벨들에 대한 정규화(normalized)된 에너지 소비를 나타내는 표이다.
도 6은 5 개의 다른 음악 클립들의 5 개의 다른 프로파일들에 대한 MOS를 나타내는 차트이다.
도 7은 대역폭에 대한 평균 의견 값의 곡선, 대역폭에 대한 작업부하의 곡선 및 대역폭에 대한 에너지 소비 곡선을 나타낸다.
도 8은 본 발명의 일 실시예에 따른 오디오 클립을 플레이하는 디바이스를 개략적으로 나타낸다.
도 9는 본 발명의 일 실시예에 따른 오디오 클립을 플레이하는 방법을 나타내는 흐름도이다.
도 10은 본 발명의 실시예들에 따른 방법과 시스템을 구현하는 컴퓨터 시스템을 개략적으로 나타낸다.
조인트/MS(joint/MS) 스테레오 모드를 사용하여 인코딩된 오디오 파일들에 대한 스테레오-이미지 스케일가능 오디오 디코딩 스킴이 이하에서 상술된다. 실시예에 있어서, MP와 같은 단일 레이어 오디오 포맷을 위한 대역폭 및 스테레오-이미 지 스케일가능 (Bandwidth and Stereo-image Scalable, 이하 BSS) 디코딩 스킴이 상술된다. 상기 BBS 디코딩 스킴은 압축된 비트스트림에서 서로 다른 오디오 컴포넌트들의 지각적 관련성을 분석하는 것에 기초하고 있다. 대역폭과 스테레오-이미지 확장성(scalability)은 직접적으로 확장성을 디코더에 의하여 생성된 계산 작업 부하량의 관점에서 번역한다. 이는 에너지를 절약하고 배터리의 수명을 연장시키기 위하여 전압/주파수 스케일러블 프로세서에 채택될 수 있다.
상기 BBS 디코딩 스킴에 의하여 사용자는 오디오 질이 약간 떨어져도 이는 사용자가 감지할 수 없지만 플레이어의 배터리 수명은 상당히 연장시킬 수 있다는 점을 고려하여 배터리 라이프와 디코딩된 오디오의 질 사이의 트레이드 오프를 제어할 수 있다. 상기 BBS 디코딩 스킴에 의하여 사용자는 사용자의 듣기 능력, 청취 환경 및 필요로하는 서비스 타입에 따라서 상기 디코딩된 오디오의 음질 레벨을 제어할 수 있다. 또한 사용자는 디코더 측면에서 음질 레벨을 제어할 수도 있다. 또한 사용자는 MP3 와 같은 단일 계층 오디오 포맷에 대하여 다중 출력 음질 레벨을 스위칭할 수 있다. 각 음질 레벨은 서로 다른 레벨의 전력 소모와 관련된다. 더욱이 상기 BBS 디코딩 스킴은 구현이 용이하고, 런타임 오버헤드가 없고, 런타임 전압 또는 주파수 스케일링을 필요로 하지 않는다.
상기 BBS 디코딩 스킴을 구현하기 위하여 표준의 MP3 디코더가 BBS-MP3 디코더로 재디자인된다. 본 발명이 속하는 분야에서 통상의 지식을 가진 이들에게는 상기 BBS 디코딩 스킴이 임의의 지각적 오디오 디코더를 사용하여 구현할 수 있음이 자명하다.
하기에 상술되는 부분은 묵시적으로 또는 직접적으로 컴퓨터 메모리 내에 있는 데이터의 동작을 알고리즘 및 기능적 또는 상징적으로 표현한다. 이러한 알고리즘적 기술 및 기능적 또는 상징적 표현은 데이터 프로세싱 기술 분야에서 데이터 프로세싱 기술 분야에 속하는 통상의 지식을 가진 이들에게 가장 효율적으로 의사를 전달하는 방법이다. 여기서 알고리즘은, 일반적으로 원하는 결과로 향하는 일관된 단계들로 생각된다. 상기 단계들은 저장되고, 전송되고, 결합되고 비교되고 또한 다른 방식으로 다뤄질 수 있는 전기, 자기, 광학 신호들과 같은 물리량들을 물리적으로 나타내는 것이 필요한 단계들이다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 "디코딩", "프로세싱", "언패킹", "컴퓨팅", "저장", "카피"와 같은 용어들은 컴퓨터 시스템 내에서 물리량으로 표현되는 데이터를 컴퓨터 시스템이나 다른 정보 저장, 송신 또는 디스플레이 장치 내에서 유사하게 물리량으로 표현되는 다른 데이터로 처리하거나 변환하는 컴퓨터 시스템이나 유사한 전자 장치들의 프로세스나 작용들을 언급한다.
본 발명에서는 상기 방법의 동작을 수행하는 장치를 개시한다. 이러한 장치는 요구되는 목적에 따라서 특별히 제작될 수 있고, 또는 컴퓨터에 저장된 컴퓨터 프로그램에 의하여 선택적으로 구동되거나 구성되는 범용 컴퓨터 또는 다른 디바이스로 구성될 수 있다. 여기서 개시되는 알고리즘이나 디스플레이들은 본질적으로 특정한 컴퓨터나 장치들에만 관련되는 것은 아니다. 다양한 범용 머신들이 본 발명에서 개시되는 사상에 따르는 프로그램들과 사용될 수 있다. 또한 상기 요구되는 방법의 단계들을 수행하는 더 특화된 장치의 구성이 알맞을 수도 있다. 종래의 범용 컴퓨터의 구성이 하기에서 상술된다.
또한 본 발명에서는 묵시적으로 컴퓨터 프로그램을 개시하는데 상기 컴퓨터 프로그램내의 개별적 단계들은 컴퓨터 코드에 의하여 효력을 발휘할 수 있다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 이들에게 자명하다. 상기 컴퓨터 프로그램은 특정한 프로그래밍 언어나 구현을 한정하기 위한 것이 아니다. 다양한 프로그래밍 언어와 코딩이 본 발명에 개시된 사상을 구현하는 데 사용될 수 있다. 더욱이, 상기 컴퓨터 프로그램은 특정한 제어 플로우를 한정하기 위한 것이 아니다. 본 발명의 사상을 벗어나지 않는 범위 내에서 다른 제어 플로우를 사용하는 컴퓨터 프로그램의 다양한 변경이 가능하다.
이러한 컴퓨터 프로그램은 임의의 컴퓨터가 판독 가능한 매체에 저장될 수 있다. 상기 컴퓨터가 판독 가능한 매체는 마그네틱 또는 광 디스크, 메모리 칩들, 또는 범용 컴퓨터와 인터페이싱에 적당한 다른 저장 장치들을 포함할 수 있다. 상기 컴퓨터 프로그램은 이러한 범용 컴퓨터상에서 로딩되고 수행되면 상기 방법을 구현하는 장치가 될 수 있다.
도 1은 BSS-MP3 디코더(100)를 나타내는 개략도이다. 상기 BSS-MP3 디코더(100)는 프로세서(102)와 매뉴얼 스위치(104)를 포함한다. 상기 프로세서(102)는 압축된 오디오 비트스트림을 펄스 코드 변조(pulse code modulation : PCM) 오디오 샘플들로 변환한다. 상기 매뉴얼 스위치(104)는 상기 프로세서(102)에 연결된다. 상기 매뉴얼 스위치(102)에 의하여 사용자는 특정 음질에 대한 디코딩 스킴이나 알 고리즘에 따라서 오디오 클립을 디코딩하는 음질 레벨과 상기 프로세서(102)가 상기 디코딩 스킴을 운영하는 전압과 주파수를 수동으로 선택한다. 클립이 낮은 음질 레벨에서 디코딩되면, 상기 프로세서(102)는 낮은 주파수와 전압에서 동작된다. 따라서 그 결과로 전력이 효율적으로 절감될 수 있다.
상기 BSS 디코딩 스킴은 서로 다른 주파수 밴드들 및 채널들과 관련된 지각적 중요성을 구별하여 지각적으로 불필요한 계산량을 없애는 멀티-레벨 디코딩 스킴이다. 그러므로 상기 BSS 디코딩 스킴은 P. De Smet, F. Rooms, H. Liong 및 W. Phillips의 "do not zero-pute" algorithm (An efficient homespun MPEG-Audio layer Ⅱ decoding and optimization strategy, Proc. of ACM Multemedia 2004, 2004년 10월)과 같은 다른 현존하는 최적화 기술들과 비교하였을 때 작업 부하에서 보다 효율적이다.
상기 BBS-MP3 디코더(100)는 주파수 대역폭과 스테레오-이미지 확장성을 결합하여 그 결과로 다수의 디코딩 레벨을 나타낸다. 각 디코딩 레벨은 서로 다른 플레이백 질과 관련되어 있다. 주파수 대역폭과 스테레오-이미지 범위성은 다음에서 상술된다.
주파수 대역폭 확장성을 달성하기 위하여 MPEG Ⅰ오디오 표준에서 정의된 32 개의 서브밴드들은 4 개의 그룹으로 나누어진다. 각 그룹은 지각적인 음질 레벨에 해당한다. 도 2는 4 개의 주파수 밴드 그룹들을 나타내는 표이다. 예시로서 44.1kHz의 샘플링 주파수가 사용되었다.
제1 주파수 밴드 그룹은 베이스 레이어로 정의된 약 5.5kHz의 가장 낮은 주 파수 대역을 커버한다. 비록 제1 그룹이 전체 대역폭의 1/4 만을 점유하고 전체 계산 작업 부하의 약 1/4 만을 담당한다고 할지라도 제1 그룹은 지각적으로 가장 적당한 주파수 밴드이다. 출력 오디오 음질은 진폭 변조(AM) 음질이고, 뉴스나 스포츠 중계와 같은 서비스들에 충분하다.
제2 주파수 밴드 그룹은 약 11kHz의 대역폭을 커버하고, 그 출력 오디오 음질은 진폭 변조(FM) 음질이며 소음이 있는 환경에서 오디오 클립들을 청취하기에 충분한다. 제3 주파수 밴드 그룹은 약 16.5kHz의 대역폭을 커버하고 그 출력 오디오 음질은 CD(compact disc) 음질에 매우 가까운 음질이다. 제4 주파수 밴드 그룹은 약 22kHz의 전 대역폭을 커버하고 이는 표준 MP3 디코더에 해당한다. 그 출력 오디오 음질은 CD 음질이다.
실시예에 있어서, MP3는 조인트/MS 스테레오 모드를 사용하여 인코딩된다. 이 조인트/MS 스테레오 모드는 좌측 채널 신호와 우측 채널 신호의 유사성을 이용한다. 상기 좌우 채널들은 MP3 파일에서 중앙(M) 및 사이드(S) 채널로서 인코딩된다. 상기 M 채널은 상기 좌우 채널들로부터 가장 본질적인 정보를 포함하고, 상기 S 채널은 스테레오 이미지만을 제공하는 채널이다. 따라서 상기 M 채널과 상기 S 채널을 디코딩하는데는 비슷한 계산 작업 부하량이 필요함에도 불구하고 상기 M 채널이 상기 S 채널보다 지각적으로 중요하다. 따라서 작업부하량을 감소하고 배터리의 수명을 연장할 필요가 있을 때에는 상기 S 채널은 부분적으로 디코딩될 수 있고 또는 아예 무시할 수도 있다.
도 3은 BSS-MP3 디코더(100)에서 수행되는 BSS 디코딩 스킴의 프로세스들을 나타내는 흐름도이다.
상기 프로세스들은 비트스트림 언패킹(unpacking ; 압축한 데이터를 원래대로 되돌리는 것) 및 호프만(Huffman) 디코딩(302), 반양자화(dequantization) 및 스펙트럼 값의 저장(304), 조인트/MS 프로세싱(306), 역수정이산여현변환(Inverse Modified Discrete Cosine Transform ; IMDCT) 프로세싱(308) 및 다상 합성(310)을 포함한다.
상기 프로세스들 중 가장 많은 계산 작업 부하량을 요구하는 프로세스들은 반양자화(304), IMDCT 프로세싱(308) 및 다상 합성(310)이다. 표준 MP3 디코더는 전 주파수 대역을 부호화하고, 이는 가장 높은 계산 작업부하량을 의미한다. 상기 BSS-MP3 디코더(300)에서는 상기 세가지 모듈들은 사용자에 의하여 선택된 디코딩 레벨에 따라서 일부의 주파수 레이지만을 프로세싱한다. 계산 작업 부하량이 줄어들게 된다. 도 3에서 B1은 M 채널에 대한 선택된 대역폭을 나타내고, B2는 S 채널에 대한 선택된 대역폭을 나타내고, B3는 좌 채널에 대한 선택된 대역폭을 나타내고, B4는 우 채널에 대한 선택된 대역폭을 각각 나타낸다.
상기 M 채널중에서 낮은 쪽의 m 개의 서브밴드들, S 채널 중에서 낮은 쪽의 s 개의 서브밴드들(여기서 m은 s 보가 크거나 같다)이 상기 BSS-MP3 디코더(100)에 의하여 부호화된다고 가정한다. 이는 M 채널의 서브밴드들이 S 채널의 서브밴드들보다 더 많이 부호화되는 비대칭 디코딩을 의미한다. 하지만 m 개의 서브밴드들의 개수와 s 개의 서브밴드들의 개수가 동일한 대칭 부분 MS 디코딩도 가능하다.
도 3에 도시된 바와 같이 상기 BSS-MP3 디코더(100)는 호프만 디코딩 후에 상기 M 채널중에서 낮은 쪽의 m 개의 서브밴드들, S 채널 중에서 낮은 쪽의 s 개의 서브밴드들로부터의 데이터만을 디코딩하여 저장한다. S 채널에는 [s+1, m] 서브밴드들의 그룹이 없기 때문에, M 채널 중에서 [s+1, m] 서브밴드들은 상기 조인트/MS 프로세싱 모듈후에도 변하지 않고 그대로이다. M 채널 중에서 [s+1, m] 서브밴드들은 도 3의 IMDCT 모듈 후에 점선이 나타내는 바와 같이 상기 좌 및 우 채널들에 단순히 카피된다. 여기서 진짜 스테레오 컴포넌트들은 상기 좌 및 우 채널들에 있는 낮은 쪽의 서브밴드들 뿐이다.
상기 프로세스들 동안에, 상기 BSS-MP3 디코더(100)의 계산 작업부하량은 상기 양 채널에서 부호화되는 서브밴드들의 수가 감소하는 것에 따라서 선형적으로 감소한다. 에너지 절약과 상기 BSS-MP3 디코더(100)의 효율성은 평가되고, 이에 대하여는 이하에서 상술한다.
상기 BSS-MP3 디코더(100)로 인한 에너지 절약량은 약 128 kbits/sec의 비트 레이트를 갖는 오디오 클립을 사용하여 평가된다. 모든 오디오 클립들은 44.1 kHz의 샘플링 레이트를 가지고 있고, 약 20초의 듀레이션이 조이트/스테레오 모드에 코딩된다. 상기 프로세서 모델은 심플스칼라 인스트럭션 셋 시뮬레이트(SimpleScalar instruction set simulator)의 Sim-Profile 구성에 기초하고 있다. 상기 BSS-MP3 디코더(100)는 0.5초, 1초 및 2초의 세 가지 다른 플레이백 지연 값들로 시뮬레이션된다.
도 4는 세 가지 다른 플레이백 지연 값들에서 서로 다른 디코딩 레벨에 대하여 최소로 필요한 주파수를 나타내는 표이다.
이 주파수 값들은 MP3 비트스트림에서 서로 다른 미립들의 필요 프로세서 사이클들의 변동성과 각 미립들을 구성하는 비트들의 수를 고려하여 계산된 값들이다. 상기 플레이백 지연 값들이 0.5초에서 1초 및 2초로 증가하면, 상기 최소로 필요한 주파수는 모든 디코딩 레벨에서 점진적으로 감소하는 것을 알 수 있다. 그 이유는 버퍼링 시간이 증가하게 되면 작업부하량의 변동성의 일부가 줄어들기 때문이다.
도 5는 플레이백 지연이 0.5초인 경우에 14 개의 다른 디코딩 레벨들에 대한 정규화(normalized)된 에너지 소비를 나타내는 표이다.
도 5를 참조하면, m이 32이고 s가 32인 경우의 디코딩 구성(502)은 가장 많은 정규화된 에너지, 즉 0.99의 에너지를 소비하고 이는 표준 MP3 출력에 해당한다. 다른 한편으로는 m이 8이고 s가 8인 경우의 디코딩 구성(504)은 0.01의 정규화된 에너지를 소비한다. m이 8이고 s가 8인 경우의 디코딩 구성(504)을 선택하면 약 98%의 에너지 절감을 달성할 수 있다.
상기 BSS-MP3 디코더(100)의 효율성을 평가하기 위하여 13 개의 주제들에 대하여 비밀 실험이 수행되었다. 모든 주제들은 평균 의견 점수(mean operation score)를 사용하여 오디오 음질을 평가받았고, 상기 평균 의견 점수는 5점 만점으로 5점은 매우 좋음, 4점은 좋음, 3점은 보통, 2점은 좋지 않음, 1점은 나쁨을 나타낸다. 5 개의 음악 클립들을 사용하여 평가하였고, 5 개의 음악 클립들 중 4 개는 대중 음악이었고 1 개는 악기로 연주되는 순수 클래식 음악이었다. 이 MP3 클립들은 모두 조인트/MS 스테레오 모드였고, 44.1kHz의 샘플링 레이트였으며 약 128 kbits/초에 해당하는 비트레이트였다. 테스트를 위하여 각 뮤직 클립에 대하여 5 개의 다른 카피들이 준비되었다. 이 카피들은 각각 (m:32, s:32), (m:32, s:24), (m:32, s:16), (m:32, s:8), (m:32, s:0)의 프로파일들에 대하여 상기 BSS-MP3 디코더(100)에 의하여 생성되었다. 각 뮤직 클립은 (m:32, s:32)와 (m:32, s:24) 프로파일을 갖는 추가적인 2 개의 카피들을 구비하는데 이는 기초 음질 기준으로 사용된다. (m:32, S:32)의 프로파일의 MOS는 5 점이었고 (m:8, s:8)의 프로파일의 MOS는 3 점이었다. 상기 기초 음질 기준을 제외하고는 모든 테스트 샘플들은 무작위로 배치되었다. 두 세트의 주제 평가들, 즉 하나는 스테레오-이미지 확장성에 대한 평가가, 다른 하나는 대역폭 확장성에 대한 평가가 수행되었다.
상기 스테레오-이미지 확장성에 대한 첫 번째 평가가 도 6에 나타나 있다. 도 6은 5 개의 다른 음악 클립들의 5 개의 다른 프로파일들에 대한 MOS를 나타내는 차트이다. 상기 S 채널을 전적으로 무시하면, 즉, 스테레오를 모노로 변환하면(m 이 32이고 s가 32인 경우(602)의 프로파일을 m이 32이고 s가 8인 경우의 프로파일(606)로 변환하면), 음질의 저하는 무시할 수 있다. 상기 S 채널의 낮은 쪽 1/4 만이 디코딩되어도, 만족할만한 플레이백 오디오 음질을 제공할 수 있다. 이는 낮은 주파수 밴드(도 1의 제1 그룹)가 높은 주파수 밴드들보다 훨씬 더 중요하다는 것을 나타낸다. 또한 프로세서 주파수가 약 30% 감소하고, 프로세서 주파수가 약 30% 감소하면 전력 소모는 약 70% 정도 감소할 수 있다.
상기 대역폭 확장성에 대한 두 번째 평가를 위하여 M 및 S 채널이 모두 부분적으로 디코딩되는, 대칭적 M 및 S 채널 디코딩이 수행된다. 도 7은 상기 제2 평가 의 결과를 나타낸다. 도 7은 대역폭에 대한 평균 의견 값의 곡선(702), 대역폭에 대한 작업부하의 곡선(704) 및 대역폭에 대한 에너지 소비 곡선(706)을 나타낸다. 상기 곡선(702)은 제4 주파수 그룹에서 제3 주파수 그룹으로 스위칭할 때 지각할 수 있는 오디오 음질의 저하는 거의 없음을 나타낸다. 하지만 상기 곡선(706)은 제4 주파수 그룹에서 제3 주파수 그룹으로 스위칭하면 에너지 소모는 약 50% 이상 감소하는 것을 나타낸다. 결과적으로 배터리의 수명이 연장된다. 출력 오디오 음질이 약간 저하되면 상당한 전력 절감효과를 얻을 수 있다.
상기 곡선(704)은 상기 BSS-MP3 디코더(100)의 작업부하가 대략적으로 디코딩되는 주파수 대역폭에 비례하는 것을 나타낸다. 그러므로 디코딩된 오디오 대역폭을 감소시키면 오디오 음질은 점차적으로 저하되지만 에너지 소모는 급격히 감소하게 된다.
도 8은 본 발명의 일 실시예에 따른 오디오 클립을 플레이하는 디바이스(800)를 개략적으로 나타낸다. 상기 디바이스(800)는 전압, 주파수 또는 전압과 주파수 양자가 스케일가능한 프로세서(802)를 포함한다. 상기 디바이스(800)는 상기 디바이스(800)의 복수의 출력 모드들 중 하나를 선택하는 스위치(804)를 더 포함한다. 상기 디바이스(800)는 또한 상기 프로세서(802)와 상기 스위치(804)에 연결되어 상기 프로세서(802)가 상기 출력 모드에 따라서 오디오 클립들을 나타내는, 조인트/MS 스테레오 모드로 인코딩된 입력 오디오 데이터를 디코딩한다. 여기서 각 출력 모드는 상기 조인트/MS 스테레오 모드로 인코딩된 데이터의 M 채널의 서브밴드들의 개수(m)와 S 채널의 서브밴드들의 개수(s)를 정의한다. 상기 제어기(806)는 상기 프로세서(802)가 플레이백에서 m 개 및 s 개의 서브밴드들로부터의 데이터만을 디코딩하고 저장하도록 제어한다.
도 9는 본 발명의 일 실시예에 따른 오디오 클립을 플레이하는 방법을 나타내는 흐름도이다.
도 9를 참조하면, 단계(902)에서, 복수의 출력모드들 중 하나가 선택된다. 단계(904)에서, 전압, 주파수 및 전압과 주파수가 스케일 가능한 프로세서는 상기 출력 모드에 따라서 오디오 클립들을 나타내는, 조인트/MS 스테레오 모드로 인코딩된 입력 오디오 데이터를 디코딩하도록 제어된다. 여기서 각 출력 모드는 상기 조인트/MS 스테레오 모드로 인코딩된 데이터의 M 채널의 서브밴드들의 개수(m)와 S 채널의 서브밴드들의 개수(s)를 정의한다. 단계(S906)에서 상기 프로세서(802)가 플레이백에서 m 개 및 s 개의 서브밴드들로부터의 데이터만을 디코딩하고 저장하도록 제어된다.
이상에서 상세히 설명된 방법과 시스템은 도 10에 개략적으로 도시된 컴퓨터 시스템(1000) 상에 구현될 수 있다. 상기 방법은 소프트웨어로 구현될 수도 있는데 이러한 소프트웨어는 상기 컴퓨터 시스템(100) 내에서 수행되는 컴퓨터 프로그램으로 구현될 수 있고, 본 발명의 실시예에 따른 방법을 수행하는 컴퓨터 시스템(1000)에 지시를 내릴 수 있는 컴퓨터 프로그램으로 구현될 수 있다.
상기 컴퓨터 시스템(1000)은 컴퓨터 모듈(1002), 키보드(1004) 및 마우스(1006)와 같은 입력 모듈들 및 디스플레이(1008) 및 프린터(1010)와 같은 복수의 출력 장치들을 포함한다.
상기 컴퓨터 모듈(1002)은 인터넷이나 LAN(local area network) 또는 WAN(wide area network)과 같은 네트워크 시스템들에 액세스를 가능하게 하는 알맞은 트랜시버 장치(1041)를 통하여 컴퓨터 네트워크(1012)에 연결된다.
실시예에 따라서 상기 컴퓨터 모듈(1002)은 프로세서(1018), 램(1020) 및 롬(1022)을 포함한다. 상기 컴퓨터 모듈(1002)은 또한 상기 디스플레이(1008)에 대한 입/출력 인터페이스(1024) 및 상기 키보드(1004)에 대한 입/출력 인터페이스(1026)와 같은 복수의 입/출력 인터페이스들을 포함한다.
상기 컴퓨터 모듈(1002)의 컴포넌트들은 전형적으로 상호연결된 버스(1028)를 통하여 통신하고, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 이들에게 알려진 방식으로 통신한다.
애플리케이션 프로그램이 CD-ROM이나 플래시 메모리와 같은 데이터 저장 매체에 인코딩되고 데이터 저장 장치(1030)의 해당하는 데이터 저장 매체 드라이브를 이용하여 읽혀져 상기 컴퓨터 시스템(1000)의 사용자에게 전형적으로 제공된다. 상기 애플리케이션 프로그램은 프로세서(1018)에 의하여 읽혀지고 수행된다. RAM(1020)을 사용하여 프로그램 데이터를 중간에서 저장할 수 있다.
상기에서는 본 발명의 실시예들을 참조하여 설명하였지만 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (14)

  1. 오디오 클립들을 플레이하는 디바이스로서,
    전압, 주파수, 또는 전압 및 주파수 모두가 스케일가능한 프로세서;
    상기 디바이스의 복수의 출력 모드들 중 하나를 선택하는 스위치; 및
    상기 프로세서 및 상기 스위치에 커플링되고, 상기 선택된 출력 모드에 기초하여 오디오 클립을 나타내는 입력 조인트/MS(joint/MS) 스테레오 모드로 인코딩된 오디오 데이터를 디코딩하도록 프로세서를 제어하도록 구성되는 제어기를 포함하고,
    상기 복수의 출력 모드는 각각 조인트/MS 스테레오 모드로 인코딩된 오디오 데이터의 M 채널의 서브밴드들의 개수(m) 및 S 채널의 서브밴드들의 개수(s)를 정의하고,
    상기 제어기는 플레이백(playback)에서 상기 m 개 및 s 개의 서브밴드들로부터의 데이터만을 디코딩하고 저장하도록 상기 프로세서를 제어하도록 구성되고,
    상기 S 채널의 서브밴드들의 개수(s)는 상기 M 채널의 서브밴드들의 개수(m)보다 작거나 같은 것을 특징으로 하는 오디오 클립을 플레이하는 디바이스.
  2. 삭제
  3. 제 1 항에 있어서, 상기 제어기는 상기 프로세서가 상기 M 채널 중에서 조인트/MS 스테레오 모드 프로세싱 후에 변하지 않는 [s+1, m] 서브밴드들을 카피(copy) 하도록 상기 프로세서를 제어하는 것을 더 포함하도록 구성되는 것을 특징으로 하는 오디오 클립을 플레이하는 디바이스.
  4. 제 1 항 또는 제 3 항에 있어서, 각 출력 모드는 디코딩할 때 상기 프로세서의 서로 다른 전력 소모와 연관되는 것을 특징으로 하는 오디오 클립을 플레이하는 디바이스.
  5. 제 1 항 또는 제 3 항에 있어서, 각 출력 모드는 디코딩할 때 최소 필요 프로세서 주파수와 연관되는 것을 특징으로 하는 오디오 클립을 플레이하는 디바이스.
  6. 제 1 항 또는 제 3 항에 있어서, 각 출력 모드는 서로 다른 출력 대역폭과 연관되는 것을 특징으로 하는 오디오 클립을 플레이하는 디바이스.
  7. 제 1 항 또는 제 3 항에 있어서, 각 출력 모드는 서로 다른 음질 레벨(quality level)과 연관되는 것을 특징으로 하는 오디오 클립을 플레이하는 디바이스.
  8. 오디오 클립을 플레이하는 방법으로서,
    복수의 출력 모드들 중 하나를 위한 선택을 장치로 수신하는 단계;
    상기 선택된 출력 모드에 기초하여 상기 오디오 클립을 나타내는, 입력 조인트/MS(joint/MS) 스테레오 모드로 인코딩된 오디오 데이터를 디코딩하도록 전압, 주파수, 또는 전압 및 주파수 모두가 스케일가능한 상기 장치의 프로세서를 제어하는 단계(여기서 상기 복수의 출력 모드는 각각 조인트/MS 스테레오 모드로 인코딩된 오디오 데이터의 M 채널의 서브밴드들의 개수(m) 및 S 채널의 서브밴드들의 개수(s)를 정의함);
    상기 m 개 및 s 개의 서브밴드들로부터의 데이터만을 디코딩 및 저장하도록 제어하는 것을 포함하는 상기 프로세서를 제어하는 단계; 및
    상기 S 채널의 서브밴드들의 개수(s)는 상기 M 채널의 서브밴드들의 개수(m)보다 작거나 같은 것을 특징으로 하는 오디오 클립을 플레이하는 방법.
  9. 제 8 항에 있어서, 상기 M 채널 중에서 조인트/MS 스테레오 모드 프로세싱 후에 변하지 않는 [s+1, m] 서브밴드들을 카피(copy) 하도록 제어하는 단계를 더 포함하는 것을 특징으로 하는 오디오 클립을 플레이하는 방법.
  10. 제 8 항 또는 제 9 항에 있어서, 각 출력 모드는 디코딩할 때 상기 프로세서의 서로 다른 전력 소모와 연관되는 것을 특징으로 하는 오디오 클립을 플레이하는 방법.
  11. 제 8 항 또는 제 9 항에 있어서, 각 출력 모드는 디코딩할 때 최소 필요 프로세서 주파수와 연관되는 것을 특징으로 하는 오디오 클립을 플레이하는 방법.
  12. 제 8 항 또는 제 9 항에 있어서, 각 출력 모드는 서로 다른 출력 대역폭과 연관되는 것을 특징으로 하는 오디오 클립을 플레이하는 방법.
  13. 제 8 항 또는 제 9 항에 있어서, 각 출력 모드는 서로 다른 음질 레벨(quality level)과 연관되는 것을 특징으로 하는 오디오 클립을 플레이하는 방법.
  14. 삭제
KR1020087013037A 2005-11-04 2006-11-03 오디오 클립을 플레이하는 디바이스 및 방법 KR101135243B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US73389205P 2005-11-04 2005-11-04
US60/733,892 2005-11-04
PCT/SG2006/000328 WO2007053120A1 (en) 2005-11-04 2006-11-03 A device and a method of playing audio clips

Publications (2)

Publication Number Publication Date
KR20080070844A KR20080070844A (ko) 2008-07-31
KR101135243B1 true KR101135243B1 (ko) 2012-04-12

Family

ID=38006155

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087013037A KR101135243B1 (ko) 2005-11-04 2006-11-03 오디오 클립을 플레이하는 디바이스 및 방법

Country Status (8)

Country Link
US (1) US8036900B2 (ko)
EP (1) EP1943741B1 (ko)
JP (1) JP4920692B2 (ko)
KR (1) KR101135243B1 (ko)
CN (1) CN101356741B (ko)
AT (1) ATE496366T1 (ko)
DE (1) DE602006019762D1 (ko)
WO (1) WO2007053120A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4986243B2 (ja) * 2008-07-04 2012-07-25 Kddi株式会社 メディアストリームの階層数を制御する送信装置、方法及びプログラム
EP2582037B1 (en) 2011-10-12 2017-12-20 Harman Becker Automotive Systems GmbH Device and method for reproducing an audio signal
US20130166924A1 (en) * 2011-12-21 2013-06-27 Jen-Chieh Yang Method for performing scenario driven voltage scaling, and associated apparatus

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5588181A (en) 1995-03-23 1996-12-31 Sutton; Michael R. Hinge for a glass shower door
US20050102150A1 (en) 2003-11-07 2005-05-12 Tzueng-Yau Lin Subband analysis/synthesis filtering method

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL9000338A (nl) 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
WO1995030286A2 (en) * 1994-05-02 1995-11-09 Philips Electronics N.V. Encoding system and encoding method for encoding a digital signal having at least a first and a second digital signal component
JP2001189659A (ja) * 1999-12-28 2001-07-10 Toshiba Corp 圧縮データ復号装置および復号方法
JP2001319407A (ja) * 2000-05-10 2001-11-16 Canon Inc 音楽再生装置及び方法並びに記憶媒体
JP3569266B2 (ja) * 2002-03-22 2004-09-22 株式会社東芝 再生装置及び省電力方法
US8498422B2 (en) * 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
CN1585029A (zh) * 2003-08-22 2005-02-23 何刚 无线的mp3,wma播放器
TW200610363A (en) * 2004-09-03 2006-03-16 Inventec Appliances Corp Device and method for playing MP3 at mobile phone
US7945448B2 (en) * 2004-11-29 2011-05-17 National University Of Singapore Perception-aware low-power audio decoder for portable devices

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5588181A (en) 1995-03-23 1996-12-31 Sutton; Michael R. Hinge for a glass shower door
US20050102150A1 (en) 2003-11-07 2005-05-12 Tzueng-Yau Lin Subband analysis/synthesis filtering method

Also Published As

Publication number Publication date
EP1943741A4 (en) 2009-11-18
US20080306744A1 (en) 2008-12-11
US8036900B2 (en) 2011-10-11
ATE496366T1 (de) 2011-02-15
CN101356741B (zh) 2012-10-31
EP1943741A1 (en) 2008-07-16
CN101356741A (zh) 2009-01-28
JP4920692B2 (ja) 2012-04-18
EP1943741B1 (en) 2011-01-19
KR20080070844A (ko) 2008-07-31
JP2009515215A (ja) 2009-04-09
DE602006019762D1 (de) 2011-03-03
WO2007053120A1 (en) 2007-05-10

Similar Documents

Publication Publication Date Title
JP4521170B2 (ja) 純可逆的音声圧縮における技術革新
JP4610650B2 (ja) 多チャンネルオーディオ符号化
JP5688862B2 (ja) 混合の可逆的音声圧縮
US9349376B2 (en) Bitstream syntax for multi-process audio decoding
JP4778196B2 (ja) 統合化不可逆的可逆的音声圧縮
JP4616349B2 (ja) ステレオ互換性のあるマルチチャネルオーディオ符号化
JP5106383B2 (ja) オーディオ符号化および復号化
US9779736B2 (en) Systems and methods for implementing efficient cross-fading between compressed audio streams
EP1817845A1 (en) Perception-aware low-power audio decoder for portable devices
KR101135243B1 (ko) 오디오 클립을 플레이하는 디바이스 및 방법
JP2023072027A (ja) 復号装置および方法、並びにプログラム
CN108352165A (zh) 解码装置、解码方法以及程序
WO2023286698A1 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
JP2002304198A (ja) 信号処理装置および信号処理方法
Nithin et al. Low complexity Bit allocation algorithms for MP3/AAC encoding

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160330

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170330

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180329

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190327

Year of fee payment: 8