KR20220028159A - 다중 채널 신호 인코딩 방법 및 인코더 - Google Patents

다중 채널 신호 인코딩 방법 및 인코더 Download PDF

Info

Publication number
KR20220028159A
KR20220028159A KR1020227005726A KR20227005726A KR20220028159A KR 20220028159 A KR20220028159 A KR 20220028159A KR 1020227005726 A KR1020227005726 A KR 1020227005726A KR 20227005726 A KR20227005726 A KR 20227005726A KR 20220028159 A KR20220028159 A KR 20220028159A
Authority
KR
South Korea
Prior art keywords
parameter
channel
current frame
signal
correlation
Prior art date
Application number
KR1020227005726A
Other languages
English (en)
Other versions
KR102486604B1 (ko
Inventor
제신 리우
싱타오 장
하이팅 리
레이 미아오
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20220028159A publication Critical patent/KR20220028159A/ko
Application granted granted Critical
Publication of KR102486604B1 publication Critical patent/KR102486604B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

다중 채널 신호 인코딩 방법 및 인코더가 개시된다. 인코딩 방법은, 현재 프레임의 다중 채널 신호를 획득하는 단계(510)와, 현재 프레임의 초기 다중 채널 파라미터를 판정하는 단계(520)와, 현재 프레임의 초기 다중 채널 파라미터 및 현재 프레임의 이전의 K개의 프레임의 다중 채널 파라미터에 기반하여 차이 파라미터를 판정하는 단계(530)(차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 이전의 K개의 프레임의 다중 채널 파라미터 간의 차이를 나타내기 위해 사용되고, K는 1보다 크거나 같은 정수임)와, 현재 프레임의 특성 파라미터 및 차이 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 단계(540)와, 현재 프레임의 다중 채널 파라미터에 기반하여 다중 채널 신호를 인코딩하는 단계(550)를 포함한다. 이 출원은 다중 채널 신호의 채널간 정보의 정확성을 더 잘 보장할 수 있다.

Description

다중 채널 신호 인코딩 방법 및 인코더{MULTI-CHANNEL SIGNAL ENCODING METHOD AND ENCODER}
상호 참조
이 출원은 2016년 8월 10일 중국 특허청에 "MULTI-CHANNEL SIGNAL ENCODING METHOD AND ENCODER"라는 표제로 출원된 중국 특허 출원 제201610652506.X호에 대한 우선권을 주장하는데, 이는 본 문서에서 그 전체로서 참조에 의해 포함된다.
기술 분야
이 출원은 오디오 신호 인코딩 분야에 관련되고, 더욱 구체적으로, 다중 채널 신호 인코딩 방법 및 인코더에 관련된다.
삶의 질의 개선과 함께 고품질 오디오에 대한 사람들의 요구가 계속 늘어나고 있다. 모노(mono) 신호와 비교하여, 스테레오(stereo)는 음향 소스(acoustic source)의 방향감(sense of direction) 및 분포감(a sense of distribution)을 가지며, 소리의 명료도(clarity), 양해도(intelligibility) 및 현장감(sense of immediacy)을 개선할 수 있고, 따라서 사람들에게 인기가 있다.
스테레오 처리 기술은 주로 미드/사이드 (Mid/Side: MS) 인코딩, 세기 스테레오(Intensity Stereo: IS) 인코딩 및 파라메트릭 스테레오(Parametric Stereo: PS) 인코딩을 포함한다.
MS 인코딩에서, 미드(mid)/사이드(side) 변환은 채널간 코히어런스(inter-channel coherence)에 기반하여 두 신호에 대해 수행되고, 채널의 에너지는 미드 채널(mid channel)에 집중되어, 채널간 용장성(inter-channel redundancy)이 제거된다. MS 인코딩 기술에서, 코드 레이트(code rate)의 감소는 입력 신호 사이의 코히어런스에 달려 있다. 좌 채널 신호 및 우 채널 신호 사이의 코히어런스가 약한 경우, 좌 채널 신호 및 우 채널 신호는 개별적으로 송신될 필요가 있다.
IS 인코딩에서, 좌 채널 및 우 채널의 고주파 성분(high-frequency component)은 인간의 청각 시스템이 채널의 고주파 성분(가령, 2 kHz 위의 성분) 사이의 위상 차이(phase difference)에 둔감하다는 특징에 기반하여 단순화된다. 그러나, IS 인코딩 기술은 오직 고주파 성분에 대해서만 효과적이다. IS 인코딩 기술이 저주파로 확장되는 경우, 심각한 인위적인 노이즈(noise)가 야기된다.
PS 인코딩은 양이 청각 모델(binaural auditory model)에 기반한 인코딩 기법이다. 도 1에서 도시된 바와 같이(도 1에서, xL은 좌 채널 시간 영역(time-domain) 신호이고, xR은 우 채널 시간 영역 신호임), PS 인코딩 처리에서, 인코더(encoder) 측은 스테레오 신호를 모노 신호, 그리고 공간 음장(spatial sound field)을 기술하는 몇 개의 공간 파라미터(spatial parameter)(또는 공간 지각 파라미터(spatial perception parameter))로 변환한다. 도 2에 도시된 바와 같이, 모노 신호 및 공간 파라미터를 획득한 후, 디코더(decoder) 측은 공간 파라미터를 참조하여 스테레오 신호를 복원한다. MS 인코딩에 비해, PS 인코딩은 더 높은 압축률을 갖는다. 그러므로, PS 인코딩에서, 상대적으로 양호한 음질이 유지된다는 전제 하에서 더 높은 인코딩 이득(encoding gain)이 얻어질 수 있다. 추가로, PS 인코딩은 전(full) 오디오 대역폭에서 수행될 수 있고, 스테레오의 공간 지각 효과를 양호하게 복원할 수 있다.
PS 인코딩에서, 다중 채널 파라미터(또한 공간 파라미터로 지칭됨)는 채널간 코히어런스(Inter-channel Coherence: IC), 채널간 레벨 차이(Inter-channel Level Difference: ILD), 채널간 시간 차이(Inter-channel Time Difference: ITD), 전체 위상 차이(Overall Phase Difference: OPD), 채널간 위상 차이(Inter-Channel Phase Difference: IPD) 등을 포함한다. IC는 채널간 교차상관(cross-correlation) 또는 코히어런스를 설명한다. 이 파라미터는 음장(sound field) 범위의 지각을 판정하며, 오디오 신호의 공간감 및 소리 안정성을 개선할 수 있다. ILD는 스테레오 음향 소스의 수평 방위각(horizontal azimuth)을 구별하기 위해 사용되고, 채널간 에너지 차이를 기술한다. 이 파라미터는 전체 스펙트럼의 주파수 성분에 영향을 준다. ITD 및 IPD는 음향 소스의 수평 배향(horizontal orientation)을 나타내는 공간 파라미터이고, 채널간 시간 및 위상 차이를 기술한다. ILD, ITD 및 IPD는 음향 소스의 위치에 대한 사람의 귀의 지각을 판정할 수 있고, 음장 위치를 효과적으로 판정하기 위해 사용될 수 있으며, 스테레오 신호의 복원에서 중요한 역할을 한다.
스테레오 레코딩 프로세스에서, 배경 노이즈, 반향(reverberation) 및 다자 통화(multi-party speaking)와 같은 요인의 영항으로 인해, 기존의 PS 인코딩 방안에 따라 계산된 다중 채널 파라미터는 항상 불안정하다(다중 채널 파라미터 값은 자주 그리고 급격히 변함). 그러한 다중 채널 파라미터에 기반하여 계산된 다운믹스된(downmixed) 신호는 불연속적이다. 결과적으로, 디코더 측에서 획득된 스테레오의 품질이 떨어진다. 예를 들어, 디코더 측에서 플레이되는(played) 스테레오의 음상(acoustic image)은 자주 흔들거리며(jitter), 심지어는 청각적인 멈춤(auditory freezing)이 발생한다.
이 출원은 다중 채널(multi-channel) 신호 인코딩(encoding) 방법 및 인코더(encoder)를 제공하여, PS 인코딩에서 다중 채널 파라미터의 안정성을 개선하는바, 이로써 오디오 신호의 인코딩 품질을 개선한다.
제1 양상에 따르면, 다음을 포함하는 다중 채널 신호 인코딩 방법이 제공된다:
현재 프레임(frame)의 다중 채널 신호를 획득하는 것;
현재 프레임의 초기 다중 채널 파라미터를 판정하는 것;
현재 프레임의 초기 다중 채널 파라미터 및 현재 프레임의 이전의 K개의 프레임의 다중 채널 파라미터에 기반하여 차이 파라미터(difference parameter)를 판정하는 것(차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 이전의 K개의 프레임의 다중 채널 파라미터 간의 차이를 나타내기 위해 사용되고, K는 1보다 크거나 같은 정수임);
현재 프레임의 특성 파라미터(characteristic parameter) 및 차이 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 것; 및
현재 프레임의 다중 채널 파라미터에 기반하여 다중 채널 신호를 인코딩하는 것.
현재 프레임의 다중 채널 파라미터는 현재 프레임의 특성 파라미터 및 현재 프레임와 이전의 K개의 프레임 간의 차이에 대한 포괄적 고려에 기반하여 판정된다. 이 판정 방식은 더 적절하다. 현재 프레임을 위해 이전 프레임의 다중 채널 파라미터를 직접적으로 재사용하는 방식에 비해, 이 방식은 다중 채널 신호의 채널 간 정보의 정확성을 더 잘 보장할 수 있다.
제1 양상을 참조하여, 제1 양상의 몇몇 구현에서, 현재 프레임의 특성 파라미터 및 차이 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 것은 다음을 포함한다:
차이 파라미터가 제1 사전설정된 조건을 충족시키는 경우, 현재 프레임의 특성 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 것.
제1 양상을 참조하여, 제1 양상의 몇몇 구현에서, 차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 현재 프레임의 이전 프레임의 다중 채널 파라미터 간의 차이의 절대 값이고, 제1 사전설정된 조건은 차이 파라미터가 사전설정된 제1 임계치보다 크다는 것이다.
제1 양상을 참조하여, 제1 양상의 몇몇 구현에서, 차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 현재 프레임의 이전 프레임의 다중 채널 파라미터의 곱이고, 제1 사전설정된 조건은 차이 파라미터가 0보다 작거나 같다는 것이다.
제1 양상을 참조하여, 제1 양상의 몇몇 구현에서, 현재 프레임의 특성 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 것은 다음을 포함한다:
현재 파라미터의 상관 파라미터(correlation parameter)에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 것(상관 파라미터는 현재 프레임 및 현재 프레임의 이전 프레임 간의 상관의 정도를 나타내기 위해 사용됨).
제1 양상을 참조하여, 제1 양상의 몇몇 구현에서, 방법은 다음을 더 포함한다:
현재 프레임의 다중 채널 신호 내의 타겟 채널 신호(target channel signal) 및 이전 프레임의 다중 채널 신호 내의 타겟 채널 신호에 기반하여 상관 파라미터를 판정하는 것.
제1 양상을 참조하여, 제1 양상의 몇몇 구현에서, 현재 프레임의 다중 채널 신호 내의 타겟 채널 신호 및 이전 채널의 다중 채널 신호 내의 타겟 채널 신호에 기반하여 상관 파라미터를 판정하는 것은 다음을 포함한다:
현재 프레임의 다중 채널 신호 내의 타겟 채널 신호의 주파수 영역 파라미터 및 이전 프레임의 다중 채널 신호 내의 타겟 채널 신호의 주파수 영역 파라미터에 기반하여 상관 파라미터를 판정하는 것(주파수 영역 파라미터는 타겟 채널 신호의 주파수 영역 진폭 값(amplitude value) 및 주파수 영역 계수(coefficient) 중 적어도 하나임).
제1 양상을 참조하여, 제1 양상의 몇몇 구현에서, 방법은 다음을 더 포함한다:
현재 프레임의 피치 주기(pitch period) 및 이전 프레임의 피치 주기에 기반하여 상관 파라미터를 판정하는 것.
제1 양상을 참조하여, 제1 양상의 몇몇 구현에서, 현재 프레임의 특성 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 것은 다음을 포함한다:
특성 파라미터가 제2 사전설정된 조건을 충족시키는 경우, 현재 프레임의 이전의 T개의 프레임의 다중 채널 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 것(T는 1 보다 크거나 같은 정수임).
제1 양상을 참조하여, 제1 양상의 몇몇 구현에서, 현재 프레임의 이전의 T개의 프레임의 다중 채널 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 것은 다음을 포함한다:
이전의 T개의 프레임의 다중 채널 파라미터를 현재 프레임의 다중 채널 파라미터로서 판정하는 것(T는 1과 같음).
제1 양상을 참조하여, 제1 양상의 몇몇 구현에서, 현재 프레임의 이전의 T개의 프레임의 다중 채널 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 것은 다음을 포함한다:
이전의 T개의 프레임의 다중 채널 파라미터의 변화 경향에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 것(T는 2보다 크거나 같음).
제1 양상을 참조하여, 제1 양상의 몇몇 구현에서, 특성 파라미터는 현재 프레임의 피크 대 평균 비율(peak-to-average ratio) 파라미터 및 상관 파라미터 중 적어도 하나를 포함하되, 상관 파라미터는 현재 프레임 및 현재 프레임의 이전 프레임 간의 상관의 정도를 나타내기 위해 사용되고, 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용되며, 제2 사전설정된 조건은 특성 파라미터가 사전설정된 임계치보다 크다는 것이다.
제1 양상을 참조하여, 제1 양상의 몇몇 구현에서, 현재 프레임의 초기 다중 채널 파라미터는 다음 중 적어도 하나를 포함한다: 현재 프레임의 초기 채널간 코히어런스(Inter-channel Coherence: IC) 값, 현재 프레임의 초기 채널간 시간 차이(Inter-channel Time Difference: ITD) 값, 현재 프레임의 초기 채널간 위상 차이(Inter-channel Phase Difference: IPD) 값, 현재 프레임의 초기 전체 위상 차이(Overall Phase Difference: OPD) 값 및 현재 프레임의 초기 채널간 레벨 차이(Inter-channel Level Difference: ILD) 값.
제1 양상을 참조하여, 제1 양상의 몇몇 구현에서, 현재 프레임의 특성 파라미터는 현재 프레임의 다음 파라미터 중 적어도 하나를 포함한다: 상관 파라미터, 피크 대 평균 비율 파라미터, 신호 대 노이즈 비율(signal-to-noise ratio) 파라미터 및 스펙트럼 기울기(spectrum tilt) 파라미터(상관 파라미터는 현재 프레임 및 이전 프레임 간의 상관의 정도를 나타내기 위해 사용되고, 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용되며, 신호 대 노이즈 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 신호 대 노이즈 비율을 나타내기 위해 사용되고, 스펙트럼 기울기 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 스펙트럼 기울기 정도를 나타내기 위해 사용됨).
제2 양상에 따르면, 다음을 포함하는 인코더가 제공된다:
현재 프레임의 다중 채널 신호를 획득하도록 구성된 획득 유닛;
현재 프레임의 초기 다중 채널 파라미터를 판정하도록 구성된 제1 판정 유닛;
현재 프레임의 초기 다중 채널 파라미터 및 현재 프레임의 이전의 K개의 프레임의 다중 채널 파라미터에 기반하여 차이 파라미터를 판정하도록 구성된 제2 판정 유닛(차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 이전의 K개의 프레임의 다중 채널 파라미터 간의 차이를 나타내기 위해 사용되고, K는 1보다 크거나 같은 정수임);
현재 프레임의 특성 파라미터 및 차이 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구성된 제3 판정 유닛; 및
현재 프레임의 다중 채널 파라미터에 기반하여 다중 채널 신호를 인코딩하도록 구성된 인코딩 유닛.
현재 프레임의 다중 채널 파라미터는 현재 프레임의 특성 파라미터 및 현재 프레임과 이전 K 프레임 간의 차이에 대한 포괄적인 고려에 기반하여 판정된다. 이 판정 방식은 더 적절하다. 현재 프레임을 위해 이전 프레임의 다중 채널 파라미터를 직접적으로 재사용하는 방식에 비해, 이 방식은 다중 채널 신호의 채널간 정보를 더 잘 보장할 수 있다.
제2 양상을 참조하여, 제2 양상의 몇몇 구현에서, 제3 판정 유닛은, 차이 파라미터가 제1 사전설정된 조건을 충족시키는 경우, 현재 프레임의 특성 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성된다.
제2 양상을 참조하여, 제2 양상의 몇몇 구현에서, 차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 현재 프레임의 이전 프레임의 다중 채널 파라미터 간의 차이의 절대 값이고, 제1 사전설정된 조건은 차이 파라미터가 사전설정된 제1 임계치보다 크다는 것이다.
제2 양상을 참조하여, 제2 양상의 몇몇 구현에서, 차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 현재 프레임의 이전 프레임의 다중 채널 파라미터의 곱이고, 제1 사전설정된 조건은 차이 파라미터가 0보다 작거나 같다는 것이다.
제2 양상을 참조하여, 제2 양상의 몇몇 구현에서, 제3 판정 유닛은 현재 프레임의 상관 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성되되, 상관 파라미터는 현재 프레임 및 현재 프레임의 이전 프레임 간의 상관의 정도를 나타내기 위해 사용된다.
제2 양상을 참조하여, 제2 양상의 몇몇 구현에서, 인코더는 다음을 더 포함한다:
현재 프레임의 다중 채널 신호 내의 타겟 채널 신호 및 이전 프레임의 다중 채널 신호 내의 타겟 채널 신호에 기반하여 상관 파라미터를 판정하도록 구성된 제4 판정 유닛.
제2 양상을 참조하여, 제2 양상의 몇몇 구현에서, 제4 판정 유닛은 현재 프레임의 다중 채널 신호 내의 타겟 채널 신호의 주파수 영역 파라미터 및 이전 프레임의 다중 채널 신호 내의 타겟 채널 신호의 주파수 영역 파라미터에 기반하여 상관 파라미터를 판정하도록 구체적으로 구성되되, 주파수 영역 파라미터는 타겟 채널 신호의 주파수 영역 진폭 값 및 주파수 영역 계수 중 적어도 하나이다.
제2 양상을 참조하여, 제2 양상의 몇몇 구현에서, 인코더는 다음을 더 포함한다:
현재 프레임의 피치 주기 및 이전 프레임의 피치 주기에 기반하여 상관 파라미터를 판정하도록 구성된 제5 판정 유닛.
제2 양상을 참조하여, 제2 양상의 몇몇 구현에서, 제3 판정 유닛은, 특성 파라미터가 제2 사전설정된 조건을 충족시키는 경우, 현재 프레임의 이전의 T개의 프레임의 다중 채널 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성되되, T는 1 보다 크거나 같은 정수이다.
제2 양상을 참조하여, 제2 양상의 몇몇 구현에서, 제3 판정 유닛은 이전의 T개의 프레임의 다중 채널 파라미터를 현재 프레임의 다중 채널 파라미터로서 판정하도록 구체적으로 구성되되, T는 1과 같다.
제2 양상을 참조하여, 제2 양상의 몇몇 구현에서, 제3 판정 유닛은 이전의 T개의 프레임의 다중 채널 파라미터의 변화 경향에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성되되, T는 2보다 크거나 같다.
제2 양상을 참조하여, 제2 양상의 몇몇 구현에서, 특성 파라미터는 현재 프레임의 피크 대 평균 비율 파라미터 및 상관 파라미터 중 적어도 하나를 포함하되, 상관 파라미터는 현재 프레임 및 현재 프레임의 이전 프레임 간의 상관의 정도를 나타내기 위해 사용되고, 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용되며, 제2 사전설정된 조건은 특성 파라미터가 사전설정된 임계치보다 크다는 것이다.
제2 양상을 참조하여, 제2 양상의 몇몇 구현에서, 현재 프레임의 초기 다중 채널 파라미터는 다음 중 적어도 하나를 포함한다: 현재 프레임의 초기 채널간 코히어런스(Inter-channel Coherence: IC) 값, 현재 프레임의 초기 채널간 시간 차이(Inter-channel Time Difference: ITD) 값, 현재 프레임의 초기 채널간 위상 차이(Inter-channel Phase Difference: IPD) 값, 현재 프레임의 초기 전체 위상 차이(Overall Phase Difference: OPD) 값 및 현재 프레임의 초기 채널간 레벨 차이(Inter-channel Level Difference: ILD) 값.
제2 양상을 참조하여, 제2 양상의 몇몇 구현에서, 현재 프레임의 특성 파라미터는 현재 프레임의 다음 파라미터 중 적어도 하나를 포함한다: 상관 파라미터, 피크 대 평균 비율 파라미터, 신호 대 노이즈 비율 파라미터 및 스펙트럼 기울기 파라미터(상관 파라미터는 현재 프레임 및 이전 프레임 간의 상관의 정도를 나타내기 위해 사용되고, 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용되며, 신호 대 노이즈 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 신호 대 노이즈 비율을 나타내기 위해 사용되고, 스펙트럼 기울기 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 스펙트럼 기울기 정도를 나타내기 위해 사용됨).
제3 양상에 따르면, 메모리 및 프로세서를 포함하는 인코더가 제공된다. 메모리는 프로그램을 저장하도록 구성되고, 프로세서는 프로그램을 실행하도록 구성된다. 프로그램이 실행되는 경우, 프로세서는 제1 양상에서의 방법을 수행한다.
제4 양상에 따르면, 컴퓨터 판독가능 매체가 제공된다. 컴퓨터 판독가능 매체는 인코더에 의해 실행될 프로그램 코드를 저장한다. 프로그램 코드는 제1 양상에서의 방법을 수행하기 위해 사용되는 명령어를 포함한다.
이 출원에서, 현재 프레임의 다중 채널 파라미터는 현재 프레임의 특성 파라미터와 및 현재 프레임과 이전의 K개의 프레임 간의 차이에 대한 포괄적인 고려에 기반하여 판정된다. 이 판정 방식은 더 적절하다. 현재 프레임을 위해 이전 프레임의 다중 채널 파라미터를 직접적으로 재사용하는 방식에 비해, 이 방식은 다중 채널 신호의 채널간 정보의 정확성을 더 잘 보장할 수 있다.
도 1은 종래 기술에서의 PS 인코딩의 흐름도이고,
도 2는 종래 기술에서의 PS 디코딩의 흐름도이며,
도 3은 종래 기술에서의 시간 영역 기반의 ITD 파라미터 추출 방법의 개략적 흐름도이고,
도 4는 종래 기술에서의 주파수 영역 기반의 ITD 파라미터 추출 방법의 개략적 흐름도이며,
도 5는 이 출원의 실시예에 따른 다중 채널 신호 인코딩 방법의 개략적 흐름도이고,
도 6은 도 5에서의 단계(540)의 상세한 흐름도이며,
도 7은 이 출원의 실시예에 따른 다중 채널 신호 인코딩 방법의 개략적 흐름도이고,
도 8은 이 출원의 실시예에 따른 인코더의 개략적 블록도이며,
도 9는 이 출원의 실시예에 따른 인코더의 개략적 구조도이다.
스테레오 신호는 또한 다중 채널 신호로 지칭될 수 있음에 유의하여야 한다. 전술한 내용은 다중 채널 신호의 다중 채널 파라미터인 ILD, ITD 및 IPD의 기능과 의미를 간략히 기술한다. 이해의 용이함을 위해, 다음은 제1 마이크로폰에 의해 취득된 신호는 제1 채널 신호이고 제2 마이크로폰에 의해 취득된 신호는 제2 채널 신호인 예를 사용함으로써 더욱 상세한 방식으로 ILD, ITD 및 IPD를 기술한다.
ILD는 제1 채널 신호 및 제2 채널 신호 간의 에너지 차이를 기술한다. 보통, 좌 채널의 에너지 대비 우 채널의 에너지의 비율이 계산되고, 이후 그 비율은 대수 영역(logarithm-domain) 값으로 변환된다. 예를 들어, ILD 값이 0보다 큰 경우, 그것은 제1 채널 신호의 에너지가 제2 채널 신호의 에너지보다 큰 것을 나타내거나; ILD 값이 0과 같은 경우, 그것은 제1 채널 신호의 에너지가 제2 채널 신호의 에너지와 같음을 나타내거나; ILD 값이 0보다 작은 경우, 그것은 제1 채널 신호의 에너지가 제2 채널 신호의 에너지보다 작은 것을 나타낸다. 다른 예로서, ILD가 0보다 작은 경우, 그것은 제1 채널 신호의 에너지가 제2 채널 신호의 에너지보다 큰 것을 나타내거나; ILD가 0과 같은 경우, 그것은 제1 채널 신호의 에너지가 제2 채널 신호의 에너지와 같음을 나타내거나; ILD가 0보다 큰 경우, 그것은 제1 채널 신호의 에너지가 제2 채널 신호의 에너지보다 작은 것을 나타낸다. 전술된 값은 단지 예이며, 제1 채널 신호 및 제2 채널 신호 사이의 에너지 차이 및 ILD 값 간의 관계는 경험 또는 실제의 요구사항에 기반하여 정의될 수 있다는 것이 이해되어야 한다.
ITD는 제1 채널 신호 및 제2 채널 신호 사이의 시간 차이, 즉, 음향 소스에 의해 생성된 소리가 제1 마이크로폰에 도달하는 시간 및 음향 소스에 의해 생성된 소리가 제2 마이크로폰에 도달하는 시간 사이의 차이를 기술한다. 예를 들어, ITD 값이 0보다 큰 경우, 그것은 음향 소스에 의해 생성된 소리가 제1 마이크로폰에 도달하는 시간이 음향 소스에 의해 생성된 소리가 제2 마이크로폰에 도달하는 시간 보다 이른 것을 나타내거나; ITD 값이 0과 같은 경우, 그것은 음향 소스에 의해 생성된 소리가 제1 마이크로폰 및 제2 마이크로폰에 동시에 도달하는 것을 나타내거나; ITD 값이 0보다 작은 경우, 그것은 음향 소스에 의해 생성된 소리가 제1 마이크로폰에 도달하는 시간이 음향 소스에 의해 생성된 소리가 제2 마이크로폰에 도달하는 시간보다 나중인 것을 나타낸다. 다른 예를 들면, ITD 값이 0보다 작은 경우, 그것은 음향 소스에 의해 생성된 소리가 제1 마이크로폰에 도달하는 시간이 음향 소스에 의해 생성된 소리가 제2 마이크로폰에 도달하는 시간보다 이른 것을 나타내거나; ITD 값이 0과 같은 경우, 그것은 음향 소스에 의해 생성된 소리가 제1 마이크로폰 및 제2 마이크로폰에 동시에 도달하는 것을 나타내거나; ITD 값이 0보다 큰 경우, 그것은 음향 소스에 의해 생성된 소리가 제1 마이크로폰에 도달하는 시간이 음향 소스에 의해 생성된 소리가 제2 마이크로폰에 도달하는 시간보다 나중인 것을 나타낸다. 전술된 값은 단지 예이며, 제1 채널 신호 및 제2 채널 신호 사이의 시간 차이 및 ITD 값 간의 관계는 경험 또는 실제의 요구사항에 기반하여 정의될 수 있다는 것이 이해되어야 한다.
IPD는 제1 채널 신호와 제2 채널 사이의 위상 차이를 기술한다. 이 파라미터는 디코더 측의 다중 채널 신호의 위상 정보를 복원하기 위해 보통 ITD와 함께 사용된다.
기존의 다중 채널 파라미터 계산 방식은 다중 채널 파라미터의 불연속성을 야기한다는 것을 전술된 설명으로부터 알 수 있다. 이해의 용이함을 위해, 도 3 및 도 4를 참조하여, 다음은 다중 채널 신호가 좌 채널 신호 및 우 채널 신호를 포함하고, 다중 채널 파라미터가 ITD 값인 예를 사용함으로써 기존의 다중 채널 파라미터 계산 방식과 및 기존의 다중 채널 파라미터 계산 방식의 단점을 상세히 기술한다.
종래 기술에서, ITD 값은 복수의 방식으로 계산될 수 있다. 예를 들어, ITD 값은 시간 영역(time domain)에서 계산될 수 있거나, ITD 값은 주파수 영역(frequency domain)에서 계산될 수 있다.
도 3은 시간 영역 기반의 ITD 값 계산 방법의 개략적 흐름도이다. 도 3의 방법은 다음 단계를 포함한다.
310: 좌 채널 시간 영역 신호 및 우 채널 시간 영역 신호에 기반하여 ITD 값을 계산한다.
구체적으로, ITD 파라미터는 시간 영역 교차상관 함수를 사용함으로써 좌 채널 시간 영역 신호 및 우 채널 시간 영역 신호에 기반하여 계산될 수 있다. 예를 들어, 범위 0 ≤ i ≤ Tmax 안에서 계산이 수행된다:
Figure pat00001
; 및
Figure pat00002
.
Figure pat00003
인 경우, T1은 max(Cn(i))에 대응하는 인덱스 값의 상반수(opposite number); 그렇지 않으면, T1은 max(Cp(i))에 대응하는 인덱스 값인데, i는 교차상관 함수의 인덱스 값이고,
Figure pat00004
은 우 채널 시간 영역 신호이며,
Figure pat00005
은 좌 채널 시간 영역 신호이고, Tmax는 상이한 샘플링 레이트에서 최대 ITD 값에 대응하며, Length는 프레임 길이이다.
320: ITD 값에 대해 양자화 처리(quantization processing)를 수행한다.
도 4는 주파수 영역 기반의 ITD 값 계산 방법의 개략적 흐름도이다. 도 4의 방법은 다음 단계를 포함한다.
410: 좌 채널 주파수 영역 신호 및 우 채널 주파수 영역 신호를 획득하기 위해, 좌 채널 시간 영역 신호 및 우 채널 시간 영역 신호에 대해 시간-주파수 변환을 수행한다.
구체적으로, 시간-주파수 변환에서, 시간 영역 신호는 이산 푸리에 변환(Discrete Fourier Transform: DFT) 또는 수정된 이산 코사인 변환(Modified Discrete Cosine Transform: MDCT)과 같은 기술을 사용하여 주파수 영역 신호로 변환될 수 있다.
예를 들어, 시간-주파수 변환은 DFT 변환을 사용함으로써 입력 좌 채널 시간 영역 신호 및 우 채널 시간 영역 신호에 대해 수행될 수 있다. 구체적으로, DFT 변환은 다음 공식을 사용하여 수행될 수 있다:
Figure pat00006
, 여기서
n은 시간 영역 신호의 샘플(sample)의 인덱스 값이고, k는 주파수 영역 신호의 주파수 빈(bin)의 인덱스 값이며, L은 시간-주파수 변환 길이이고,
Figure pat00007
은 좌 채널 시간 영역 신호 또는 우 채널 시간 영역 신호이다.
420: 좌 채널 주파수 영역 및 우 채널 주파수 영역 신호에 기반하여 ITD 값을 계산한다.
구체적으로, 주파수 영역 신호의 L개의 주파수 빈이 복수의 서브밴드(sub-band)로 분할될 수 있다. 제b 서브밴드 내에 포함된 주파수 빈의 인덱스 값은
Figure pat00008
이다. 검색 범위(search range)
Figure pat00009
내에서, 진폭 값은 다음 공식을 사용하여 계산될 수 있다:
Figure pat00010
.
이 경우, 제b 서브밴드의 ITD 값은
Figure pat00011
, 즉, 전술된 공식에 기반하여 계산된 최대 값에 대응하는 샘플의 인덱스 값일 수 있다.
430: ITD 값에 대해 양자화 처리를 수행한다.
종래 기술에서, 현재의 프레임의 다중 채널 신호의 교차 상관 계수의 피크 값(peak value)이 비교적 작은 경우, 계산된 ITD 값은 부정확한 것으로 여겨질 수 있다. 이 경우, 현재 프레임의 ITD 값은 0으로 맞춰진다(zeroed). 배경 노이즈, 반향 및 다자 통화와 같은 요인의 영향으로 인해, 기존의 PS 인코딩 방안에 따라 계산된 ITD 값은 자주 0으로 맞춰진다. 결과적으로, ITD 값은 자주 그리고 급격히 변하고, 그러한 ITD 값에 기반하여 계산된 다운믹스된 신호에 대하여 프레임간 불연속성(inter-frame discontinuity)이 야기되며, 따라서 다중 채널 신호의 음향 품질은 열악하다.
다중 채널 파라미터가 자주 그리고 급격히 변화하는 문제를 해결하기 위해서, 실현가능한 처리 방식은 다음과 같다: 현재의 프레임의 계산된 다중 채널 파라미터가 부정확하다고 여겨지는 경우에, 현재 프레임의 이전 프레임의 다중 채널 파라미터가 재사용될 수 있다. 이 처리 방식에서, 다중 채널 파라미터가 자주 그리고 급격히 변한다는 문제는 잘 해결될 수 있다. 그러나, 이 처리 방식은 다음의 문제를 야기할 수 있다: 현재 프레임의 신호 품질이 비교적 좋은 경우, 현재 프레임의 계산된 다중 채널 파라미터는 보통 비교적 정확하다. 이 경우에, 그 처리 방식이 여전히 사용되는 경우, 이전 프레임의 다중 채널 파라미터가 현재 프레임의 다중 채널 파라미터로서 여전히 재사용될 수 있고, 현재 프레임의 비교적 정확한 다중 채널 파라미터는 폐기된다. 결과적으로, 다중 채널 신호의 채널간 정보는 부정확하다.
도 5 및 도 6을 참조하여, 다음은 이 출원의 실시예에 따른 오디오 신호 인코딩 방법을 상세히 설명한다.
도 5는 이 출원의 실시예에 따른 다중 채널 신호 인코딩 방법의 개략적 흐름도이다. 도 5의 방법은 다음 단계를 포함한다.
510. 현재 프레임의 다중 채널 신호를 획득한다.
다중 채널 신호의 품질은 이 출원의 이 실시예에서 구체적으로 한정되지 않는다는 것에 유의하여야 한다. 구체적으로, 다중 채널 신호는 이중 채널 신호, 3 채널 신호, 또는 3개 초과 채널의 신호일 수 있다. 예를 들어, 다중 채널 신호는 좌 채널 신호 및 우 채널 신호를 포함할 수 있다. 다른 예를 들면, 다중 채널 신호는 좌 채널 신호, 중앙 채널(middle-channel) 신호, 우 채널 신호 및 후방 채널(rear-channel) 신호를 포함할 수 있다.
520. 현재 프레임의 초기 다중 채널 파라미터를 판정한다.
몇몇 실시예에서, 현재 프레임의 초기 다중 채널 파라미터는 다중 채널 신호 간의 상관(correlation)을 제시하기 위해 사용될 수 있다.
몇몇 실시예에서, 현재 프레임의 초기 다중 채널 파라미터는 다음 중 적어도 하나를 포함한다: 현재 프레임의 초기 IC 값, 현재 프레임의 초기 ITD 값, 현재 프레임의 초기 IPD 값, 현재 프레임의 초기 OPD 값, 현재 프레임의 초기 ILD 값 등.
현재 프레임의 초기 다중 채널 파라미터는 복수의 방식으로 계산될 수 있다. 세부사항에 대해서는, 종래 기술을 참조한다. 예를 들어, 다중 채널 파라미터는 ITD 값이다. 도 3에 도시된 시간 영역 기반 ITD 값 계산 방식 또는 도 4에서의 주파수 영역 기반 ITD 값 계산 방식이 단계(520)에서 사용될 수 있다. 대안적으로, 하이브리드 영역(hybrid-domain)(시간 영역 + 주파수 영역) 기반의 ITD 값 계산 방식이 다음의 공식에 기반하여 사용될 수 있다:
Figure pat00012
, 여기서
Figure pat00013
은 좌 채널 주파수 영역 신호의 주파수 영역 계수를 나타내고,
Figure pat00014
은 우 채널 주파수 영역 신호의 주파수 영역 계수의 공액(conjugate)을 나타내며,
Figure pat00015
는 복수의 값으로부터 최대값을 선택하는 것을 의미하고,
Figure pat00016
는 역 이산 푸리에 변환(inverse discrete Fourier transform)을 나타낸다.
530. 현재 프레임의 초기 다중 채널 파라미터와 현재 프레임의 이전의 K개의 프레임의 다중 채널 파라미터에 기반하여 차이 파라미터(difference parameter)를 판정하되, 차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 이전의 K개의 프레임의 다중 채널 파라미터 간의 차이를 나타내기 위해 사용되고, K는 1보다 크거나 같은 정수이다.
현재 프레임의 이전 K개 프레임은 인코딩될 오디오 신호의 모든 프레임 내의 현재 프레임에 가깝게 인접한 이전의 K개의 프레임임이 이해되어야 한다. 예를 들어, 인코딩될 오디오 신호가 10개의 프레임을 포함하고 K=1이라고 가정하면, 현재 프레임이 10개의 프레임 내의 제5 프레임인 경우, 현재 프레임의 이전의 K개의 프레임은 10개의 프레임 내의 제4 프레임이다. 다른 예를 들면, 인코딩될 오디오 신호가 10개의 프레임을 포함하고 K=2라고 가정하면, 현재 프레임이 10개의 프레임 내의 제7 프레임인 경우, 현재 프레임의 이전의 K개의 프레임은 10개의 프레임 내의 제5 프레임 및 제6 프레임이다.
달리 명시되지 않는 한, 다음에 나타나는 이전의 K개의 프레임은 현재 프레임의 이전의 K개의 프레임이고, 다음에 나타나는 이전의 프레임은 현재 프레임의 이전 프레임이다.
540. 현재 프레임의 차이 파라미터 및 특성 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정한다.
(초기 다중 채널 파라미터를 포함하는) 다중 채널 파라미터는 수치 값의 형태로 표현될 수 있음에 유의하여야 한다. 그러므로, 다중 채널 파라미터는 또한 다중 채널 파라미터 값으로 지칭될 수 있다.
몇몇 실시예에서, 현재 프레임의 특성 파라미터는 현재 프레임의 모노 파라미터를 포함할 수 있다. 모노 파라미터는 현재 프레임의 다중 채널 신호 내의 채널의 신호의 특징을 나타내기 위해 사용될 수 있다.
몇몇 실시예에서, 단계(540)에서 현재 프레임의 다중 채널 파라미터를 판정하는 것은 다음을 포함할 수 있다: 현재 프레임의 다중 채널 파라미터를 획득하기 위해 초기 다중 채널 파라미터를 수정하는 것. 예를 들어, 현재 프레임의 특성 파라미터는 현재 프레임의 모노 파라미터이다. 단계(540)는 다음을 포함할 수 있다: 현재 프레임의 다중 채널 파라미터를 획득하기 위해, 현재 프레임의 모노 파라미터 및 차이 파라미터에 기반하여 현재 프레임의 초기 다중 채널 파라미터를 수정하는 것.
몇몇 실시예에서, 현재 프레임의 특성 파라미터는 현재 프레임의 다음의 파라미터 중 적어도 하나를 포함한다: 상관 파라미터, 피크 대 평균 비율(peak-to-average ratio) 파라미터, 신호 대 노이즈 비율(signal-to-noise ratio) 파라미터 및 스펙트럼 기울기(spectrum tilt) 파라미터. 상관 파라미터는 현재 프레임과 이전 프레임 사이의 상관 정도를 나타내기 위해 사용된다. 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 중의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용된다. 신호 대 노이즈 비율 파라미터는 현재 프레임의 다중 채널 신호 중의 적어도 하나의 채널의 신호의 신호 대 노이즈 비율을 나타내기 위해 사용된다. 스펙트럼 기울기 파라미터는 현재 프레임의 다중 채널 신호 중의 적어도 하나의 채널의 신호의 스펙트럼 기울기 정도 또는 스펙트럼 에너지 변화 경향을 나타내기 위해 사용된다.
550. 현재 프레임의 다중 채널 파라미터에 기반하여 다중 채널 신호를 인코딩한다.
예를 들어, 도 1에 도시된, 모노 오디오 인코딩, 공간 파라미터 인코딩 및 비트스트림 멀티플렉싱(bitstream multiplexing)과 같은 동작이 수행될 수 있다. 특정 인코딩 방안에 대해서는, 종래 기술을 참조하라.
이 출원의 이 실시예에서, 현재 프레임의 다중 채널 파라미터는 현재 프레임의 특성 파라미터 및 현재 프레임와 이전의 K개의 프레임 간의 차이에 대한 포괄적인 고려에 기반하여 판정된다. 이 판정 방식은 더 적절하다. 현재 프레임을 위해 이전 프레임의 다중 채널 파라미터를 직접적으로 재사용하는 방식이 비해, 이 방식은 다중 채널 신호의 채널간 정보의 정확성을 더 잘 보장할 수 있다.
다음은 단계(540)의 구현을 상세히 설명한다.
선택적으로, 몇몇 실시예에서, 단계(540)는 다음을 포함할 수 있다: 차이 파라미터가 제1 사전설정된 조건을 충족시키는 경우, 현재 프레임의 다중 채널 파라미터를 획득하기 위해, 현재 프레임의 특성 파라미터의 값에 기반하여 현재 프레임의 초기 다중 채널 파라미터의 값을 조정하는 것.
선택적으로, 몇몇 실시예에서, 단계(540)는 다음을 포함할 수 있다: 특성 파라미터가 제1 사전설정된 조건을 충족시키는 경우, 현재 프레임의 다중 채널 파라미터를 획득하기 위해, 차이 파라미터의 값에 기반하여 현재 프레임의 초기 다중 채널 파라미터의 값을 조정하는 것.
제1 사전설정된 조건은 하나의 조건일 수 있거나, 복수의 조건의 조합일 수 있음이 이해되어야 한다. 추가로, 제1 사전설정된 조건이 충족되는 경우, 판정하는 것은 다른 조건에 기반하여 더 수행될 수 있다. 모든 조건이 충족되는 경우, 후속의 단계가 수행된다.
선택적으로, 몇몇 실시예에서, 도 6에 도시된 바와 같이, 단계(540)는 다음 하위단계를 포함할 수 있다:
542. 차이 파라미터가 제1 사전설정된 조건을 충족시키는지를 판정하는 것.
544. 차이 파라미터가 제1 사전설정된 조건을 충족시키는 경우, 현재 프레임의 특성 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 것.
차이 파라미터는 복수의 방식으로 정의될 수 있다는 것이 이해되어야 한다. 차이 파라미터를 정의하는 상이한 방식은 상이한 제1 사전설정된 조건에 대응할 수 있다. 다음은 차이 파라미터 및 차이 파라미터에 대응하는 제1 사전설정된 조건을 상세히 설명한다.
선택적으로, 몇몇 실시예에서, 차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 이전 프레임의 다중 채널 파라미터 사이의 차이일 수 있거나, 그 차이의 절대 값일 수 있다. 제1 사전설정된 조건은 차이 파라미터가 사전설정된 제1 임계치(threshold)보다 크다는 것일 수 있다. 제1 임계치는 타겟 값(target value)의 0.3 내지 0.7 배일 수 있다. 예를 들어, 제1 임계치는 타겟 값의 0.5 배일 수 있다. 타겟 값은 이전 프레임의 다중 채널 파라미터 및 현재 프레임의 초기 다중 채널 파라미터에서 절대 값이 더 큰 다중 채널 파라미터이다.
선택적으로, 몇몇 실시예에서, 차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 이전의 K개의 프레임의 다중 채널 파라미터의 평균 값 사이의 차이일 수 있거나, 그 차이의 절대 값일 수 있다. 제1 사전설정된 조건은 차이 파라미터가 사전설정된 제1 임계치보다 더 크다는 것일 수 있다. 제1 임계치는 타겟 값의 0.3 내지 0.7 배일 수 있다. 예를 들어, 제1 임계치는 타겟 값의 0.5 배일 수 있다. 타겟 값은 이전 프레임의 다중 채널 파라미터 및 현재 프레임의 초기 다중 채널 파라미터에서 절대 값이 더 큰 다중 채널 파라미터이다.
선택적으로, 몇몇 실시예에서, 차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 이전 프레임의 다중 채널 파라미터의 곱일 수 있고, 제1 사전설정된 조건은 차이 파라미터가 0보다 작거나 같은 것일 수 있다.
다음은 단계(544)의 특정 구현을 상세히 설명한다.
선택적으로, 몇몇 실시예에서, 단계(544)는 다음을 포함할 수 있다: 현재 프레임의 상관 파라미터 및/또는 스펙트럼 기울기 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 것(여기서 상관 파라미터는 현재 프레임 및 이전 프레임 사이의 상관의 정도를 나타내기 위해 사용되고, 스펙트럼 기울기 파라미터는 현재 프레임의 다중 채널 신호 중의 적어도 하나의 채널의 신호의 스펙트럼 에너지 변화 경향 또는 스펙트럼 기울기 정도를 나타내기 위해 사용됨).
선택적으로, 몇몇 실시예에서, 단계(544)는 다음을 포함할 수 있다: 현재 프레임의 상관 파라미터 및/또는 피크 대 평균 비율 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 것(여기서 상관 파라미터는 현재 프레임 및 이전 프레임 사이의 상관의 정도를 나타내기 위해 사용되고, 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 중의 적어도 한 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용됨).
다음은 현재 프레임의 상관 파라미터를 상세히 설명한다.
구체적으로, 상관 파라미터는 현재 프레임 및 이전 프레임 사이의 상관의 정도를 나타내기 위해 사용된다. 현재 프레임 및 이전 프레임 사이의 상관의 정도는 복수의 방식으로 나타낼 수 있다. 상이한 표현 방식은 상관 파라미터를 계산하는 상이한 방식에 대응할 수 있다. 다음은 특정 실시예를 참조하여 상세한 설명을 제공한다.
선택적으로, 몇몇 실시예에서, 현재 프레임 및 이전 프레임 사이의 상관의 정도는 현재 프레임의 다중 채널 신호 내의 타겟 채널 신호 및 이전 프레임의 다중 채널 신호 내의 타겟 채널 신호 사이의 상관의 정도를 사용하여 나타낼 수 있다. 현재 프레임의 타겟 채널 신호는 이전 프레임의 타겟 채널 신호에 대응하고 있음이 이해되어야 한다. 구체적으로, 현재 프레임의 타겟 채널 신호가 좌 채널 신호인 경우, 이전 프레임의 타겟 채널 신호는 좌 채널 신호이거나; 현재 프레임의 타겟 채널 신호가 우 채널 신호인 경우, 이전 프레임의 타겟 채널 신호는 우 채널 신호이거나; 현재 프레임의 타겟 채널 신호가 좌 채널 신호 및 우 채널 신호를 포함하는 경우, 이전 프레임의 타겟 채널 신호는 좌 채널 신호 및 우 채널 신호를 포함한다. 타겟 채널 신호는 타겟 채널 시간 영역 신호 또는 타겟 채널 주파수 영역 신호일 수 있음이 또한 이해되어야 한다.
예를 들어, 타겟 채널 신호는 주파수 영역 신호이다. 현재 프레임의 다중 채널 신호 내의 타겟 채널 신호 및 이전 프레임의 다중 채널 신호 내의 타겟 채널 신호에 기반하여 상관 파라미터를 판정하는 것은 구체적으로 다음을 포함할 수 있다: 현재 프레임의 다중 채널 신호 내의 타겟 채널 신호의 주파수 영역 파라미터 및 이전 프레임의 다중 채널 신호 내의 타겟 채널 신호의 주파수 영역 파라미터에 기반하여 상관 파라미터를 판정하는 것(여기서 타겟 채널 신호의 주파수 영역 파라미터는 타겟 채널 신호의 주파수 영역 진폭 값 및/또는 주파수 영역 계수를 포함함).
몇몇 실시예에서, 타겟 채널 신호의 주파수 영역 진폭 값은 타겟 채널 신호의 일부 또는 모든 서브밴드의 주파수 영역 진폭 값일 수 있다. 예를 들어, 타겟 채널 신호의 주파수 영역 진폭 값은 타겟 채널 신호의 저주파 부분 내의 서브밴드의 주파수 영역 진폭 값일 수 있다.
구체적으로, 예를 들어, 타겟 채널 신호는 좌 채널 주파수 영역 신호이다. 좌 채널 주파수 영역 신호의 저주파 부분이 M개의 서브밴드를 포함하며, 각 서브밴드는 N개의 주파수 영역 진폭 값을 포함한다고 가정하면, M개의 서브밴드와의 일대일 대응(one-to-one correspondence)이 된 M개의 정규화된 교차상관 값을 획득하기 위하여, 현재 프레임 및 이전 프레임의 서브밴드의 주파수 영역 진폭 값의 정규화된 교차상관 값은 다음 공식에 기반하여 계산될 수 있다:
Figure pat00017
, 여기서,
Figure pat00018
은 현재 프레임의 좌 채널 주파수 영역 신호의 저주파 부분 내의 제i 서브밴드의 제j 주파수 영역 진폭 값을 나타내고,
Figure pat00019
은 이전 프레임의 좌 채널 주파수 영역 신호의 저주파 부분 내의 제i 서브밴드의 제j 주파수 영역 진폭 값을 나타내며,
Figure pat00020
는 M개의 서브밴드 내의 제i 서브밴드의 정규화된 교차상관 값을 나타낸다.
그러면, M개의 정규화된 교차상관 값이 현재 프레임 및 이전 프레임의 상관 파라미터로서 판정될 수 있거나; M개의 정규화된 교차상관 값의 합 또는 M개의 정규화된 교차상관 값의 평균 값이 현재 프레임의 상관 파라미터로서 판정될 수 있다.
몇몇 실시예에서, 주파수 영역 진폭 값에 기반하여 상관 파라미터를 계산하는 전술된 방식은 주파수 영역 계수에 기반하여 상관 파라미터를 계산하는 방식으로 교체될 수 있다.
몇몇 실시예에서, 주파수 영역 진폭 값에 기반하여 상관 파라미터를 계산하는 전술된 방식은 주파수 영역 계수의 절대 값에 기반하여 상관 파라미터를 계산하는 방식으로 교체될 수 있다.
현재 프레임의 다중 채널 신호는 현재 프레임의 하나 이상의 서브프레임의 다중 채널 신호일 수 있다는 것이 이해되어야 한다. 마찬가지로, 이전 프레임의 다중 채널 신호는 이전 프레임의 하나 이상의 서브프레임의 다중 채널 신호일 수 있다. 다시 말해, 상관 파라미터는 현재 프레임의 모든 다중 채널 신호 및 이전 프레임의 모든 다중 채널 신호에 기반하여 계산될 수 있거나, 현재 프레임의 하나 또는 일부 서브프레임의 다중 채널 신호 및 이전 프레임의 하나 또는 일부 서브프레임의 다중 채널 신호에 기반하여 계산될 수 있다.
예를 들어, 타겟 채널 신호는 좌 채널 시간 영역 신호 및 우 채널 시간 영역 신호를 포함한다. N개의 정규화된 교차상관 값을 획득하기 위해, 각 샘플에서의 현재 프레임의 좌 채널 시간 영역 신호와 우 채널 시간 영역 신호 및 이전 프레임의 좌 채널 시간 영역 신호와 우 채널 시간 영역 신호의 정규화된 교차상관 값이 다음 공식에 기반하여 계산될 수 있고, 최대의 정규화된 교차상관 값을 위해 N개의 정규화된 교차상관 값이 탐색된다:
Figure pat00021
, 여기서
Figure pat00022
은 좌 채널 시간 영역 신호를 나타내고,
Figure pat00023
은 우 채널 시간 영역 신호를 나타내며, N은 좌 채널 시간 영역 신호의 샘플의 전체 수량이고, L은 우 채널 시간 영역 신호의 제n 샘플과 좌 채널 신호의 제n 샘플 사이의 오프셋 샘플의 수량이다.
몇몇 실시예에서, 전술된 공식에서 계산된 최대의 정규화된 교차상관 값은 현재 프레임의 상관 파라미터로서 사용될 수 있다.
현재 프레임의 다중 채널 신호는 현재 프레임의 하나 이상의 서브프레임의 다중 채널 신호일 수 있다는 것이 이해되어야 한다. 마찬가지로, 이전 프레임의 다중 채널 신호는 이전 프레임의 하나 이상의 서브프레임의 다중 채널 신호일 수 있다. 예를 들어, 복수의 서브프레임과의 일대일 대응이 된 복수의 최대의 정규화된 교차상관 값은 단위로서 서브프레임을 사용함으로써 전술된 공식에 기반하여 계산될 수 있다. 이후, 복수의 최대의 정규화된 교차상관 값 중 하나 이상, 복수의 최대의 정규화된 교차상관 값의 합, 또는 복수의 최대의 정규화된 교차상관 값의 평균 값이 현재 프레임의 상관 파라미터로서 사용된다.
전술한 내용은 시간 영역 신호에 기반하여 상관 파라미터를 계산하는 방식을 제공한다. 다음은 피치 주기(pitch period)에 기반하여 상관 파라미터를 계산하는 방식을 상세히 설명한다.
선택적으로, 몇몇 실시예에서, 현재 프레임 및 이전 프레임 사이의 상관의 정도는 현재 프레임의 피치 주기 및 이전 프레임의 피치 주기 간의 상관의 정도를 사용함으로써 나타낼 수 있다. 이 경우에, 상관 파라미터는 현재 프레임의 피치 주기 및 이전 프레임의 피치 주기에 기반하여 판정될 수 있다.
몇몇 실시예에서, 현재 프레임 또는 이전 프레임의 피치 주기는 현재 프레임 또는 이전 프레임의 각 서브프레임의 피치 주기를 포함할 수 있다.
구체적으로, 현재 프레임의 피치 주기 또는 현재 프레임의 각 서브프레임의 피치 주기, 그리고 이전 프레임의 피치 주기 또는 이전 프레임의 각 서브프레임의 피치 주기는 기존의 피치 주기 알고리즘에 기반하여 계산될 수 있다. 그러면, 현재 프레임의 피치 주기 및 이전 프레임의 각 서브프레임의 피치 주기 사이의 편차 값 또는 현재 프레임의 각 서브프레임의 피치 주기 및 이전 프레임의 각 서브프레임의 피치 주기 값 사이의 편차 값이 계산될 수 있다. 그러면, 계산된 피치 주기 편차 값은 현재 프레임 및 이전 프레임의 상관 파라미터로서 사용될 수 있다.
다음은 현재 프레임의 피크 대 평균 비율 파라미터를 상세히 설명한다.
현재 프레임의 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용될 수 있다.
예를 들어, 다중 채널 신호는 좌 채널 신호 및 우 채널 신호를 포함한다. 피크 대 평균 비율 파라미터는 좌 채널 신호의 피크 대 평균 비율일 수 있거나, 우 채널 신호의 피크 대 평균 비율일 수 있거나, 좌 채널 신호의 피크 대 평균 비율 및 우 채널 신호의 피크 대 평균 비율의 조합일 수 있다.
피크 대 평균 비율 파라미터는 복수의 방식으로 계산될 수 있다. 예를 들어, 피크 대 평균 비율 파라미터는 주파수 영역 신호의 주파수 영역 진폭 값에 기반하여 계산될 수 있다. 다른 예를 들면, 피크 대 평균 비율 파라미터는 주파수 영역 신호의 주파수 영역 계수 또는 주파수 영역 계수의 절대 값에 기반하여 계산될 수 있다.
몇몇 실시예에서, 주파수 영역 신호의 주파수 영역 진폭 값은 주파수 영역 신호의 일부 또는 모든 서브밴드의 주파수 영역 진폭 값일 수 있다. 예를 들어, 주파수 영역 신호의 주파수 영역 진폭 값은 주파수 영역 신호의 저주파 부분 내의 서브밴드의 주파수 영역 진폭 값일 수 있다.
좌 채널 주파수 영역 신호가 예로서 사용된다. 좌 채널 주파수 영역 신호의 저주파 부분이 M개의 서브밴드를 포함하고, 각 서브밴드는 N개의 주파수 영역 진폭 값을 포함한다고 가정하면, M개의 서브밴드와의 일대일 대응이 되는 M개의 피크 대 평균 비율을 획득하기 위해, 각 서브 밴드의 N개의 주파수 영역 진폭 값의 피크 대 평균 비율이 계산될 수 있다. 그러면, M개의 피크 대 평균 비율, M개의 피크 대 평균 비율의 합, 또는 M개의 피크 대 평균 비율의 평균 값은 현재 프레임의 피크 대 평균 비율 파라미터로 사용된다. 각 서브밴드의 피크 대 평균 비율을 계산하는 프로세스에서, 계산 복잡성을 줄이기 위해, 각 서브 밴드의 N개의 주파수 영역 진폭 값의 합에 대한 각 서브밴드의 최대 주파수 영역 진폭 값의 비율이 피크 대 평균 비율로서 사용될 수 있다. 피크 대 평균 비율이 사전설정된 임계치와 비교되는 경우, 최대 주파수 영역 진폭 값은 각 서브밴드의 N개의 주파수 영역 진폭 값의 합 및 사전설정된 임계치의 곱과 비교될 수 있거나, 최대 주파수 영역 진폭 값은 각 서브밴드의 N개의 주파수 영역 진폭 값의 평균 값 및 사전설정된 임계치의 곱과 비교될 수 있다.
몇몇 실시예에서, 현재 프레임의 다중 채널 신호는 현재 프레임의 하나 이상의 서브프레임의 다중 채널 신호일 수 있다.
현재 프레임의 특성 파라미터는 현재 프레임의 신호 대 노이즈 비율 파라미터를 더 포함할 수 있다. 다음은 신호 대 노이즈 비율 파라미터를 상세히 설명한다.
현재 프레임의 신호 대 노이즈 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 신호 대 노이즈 비율 또는 신호 대 노이즈 비율 특징을 나타내기 위해 사용될 수 있다.
현재 프레임의 신호 대 노이즈 비율 파라미터는 하나 이상의 파라미터를 포함할 수 있다는 것이 이해되어야 한다. 본 출원의 이 실시예에서 특정 파라미터 선택 방식이 한정되는 것은 아니다. 예를 들어, 현재 프레임의 신호 대 노이즈 비율 파라미터는 다중 채널 신호의 서브밴드 신호 대 노이즈 비율, 수정된 서브밴드 신호 대 노이즈 비율, 분절(segmental) 신호 대 노이즈 비율, 수정된 분절 신호 대 노이즈 비율, 전 대역(full-band) 신호 대 노이즈 비율 및 수정된 전 대역 신호 대 노이즈 비율, 그리고 다중 채널 신호의 신호 대 노이즈 비율 특징을 나타낼 수 있는 다른 파라미터 중 적어도 하나를 포함할 수 있다.
신호 대 노이즈 비율 파라미터를 판정하는 방식은 이 출원의 이 실시예에서 구체적으로 한정되지 않는다는 점에 유의하여야 한다.
예를 들어, 현재 프레임의 신호 대 노이즈 비율 파라미터는 다중 채널 신호 내의 모든 신호를 사용하여 계산될 수 있다.
다른 예를 들면, 현재 프레임의 신호 대 노이즈 비율 파라미터는 다중 채널 신호 내의 일부 신호를 사용하여 계산될 수 있다.
다른 예를 들면, 현재 프레임의 신호 대 노이즈 비율 파라미터는 다중 채널 신호 내의 임의의 채널의 신호를 적응적으로 선택함으로써 계산될 수 있다.
다른 예를 들면, 가중 평균(weighted averaging)은, 새로운 신호를 형성하기 위해, 다중 채널 신호를 나타내는 데이터에 대해 우선 수행될 수 있고, 이후 현재 프레임의 신호 대 노이즈 비율은 그 새로운 신호의 신호 대 노이즈 비율을 사용하여 나타내어진다.
현재 프레임의 특성 파라미터는 현재 프레임의 스펙트럼 기울기 파라미터를 더 포함할 수 있다. 다음은 스펙트럼 기울기 파라미터를 상세히 설명한다.
현재 프레임의 스펙트럼 기울기 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 스펙트럼 기울기 정도 또는 스펙트럼 에너지 변화 경향을 나타내기 위해 사용될 수 있다. 더 큰 스펙트럼 기울기 정도는 더 약한 신호 유음화(signal voicing)을 지시하고, 더 작은 스펙트럼 기울기 정도는 더 강한 신호 유음화를 지시한다는 것이 이해되어야 한다.
다음은 단계(544)에서 현재 프레임의 특성 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하는 방식을 상세히 설명한다.
선택적으로, 몇몇 실시예에서, 현재 프레임의 특성 파라미터에 기반하여, 현재 프레임을 위해 이전 프레임의 다중 채널 파라미터를 재사용할지가 판정될 수 있다.
예를 들어, 특성 파라미터가 제2 사전설정된 조건을 충족시키는 경우, 이전 프레임의 다중 채널 파라미터는 현재 프레임을 위해 사용된다. 대안적으로, 특성 파라미터가 제2 사전설정된 조건을 충족시키지 않는 경우, 현재 프레임의 초기 다중 채널 파라미터가 현재 프레임의 다중 채널 파라미터로서 사용된다. 특성 파라미터가 제2 사전설정된 조건을 충족시키지 않는 경우에 사용되는 처리 방식은 이 출원의 실시예에서 구체적으로 한정되지 않는다는 것이 이해되어야 한다. 예를 들어, 초기 다중 채널 파라미터는 다른 기존의 방식으로 수정될 수 있다.
선택적으로, 몇몇 실시예에서, 현재 프레임의 특성 파라미터에 기반하여, 이전의 T개의 프레임의 다중 채널 파라미터의 변화 경향에 기반하여 현재 프레임의 다중 채널 파라미터를 정할 것인지가 판정될 수 있는데, 여기서 T는 2보다 크거나 같다.
예를 들어, 특성 파라미터가 제2 사전설정된 조건을 충족시키는 경우, 현재 프레임의 다중 채널 파라미터는 이전의 T개의 프레임의 다중 채널 파라미터의 변화 경향에 기반하여 판정된다. 대안적으로, 특성 파라미터가 제2 사전설정된 조건을 충족시키지 않는 경우, 현재 프레임의 초기 다중 채널 파라미터는 현재 프레임의 다중 채널 파라미터로서 사용된다. 특성 파라미터가 제2 사전설정된 조건을 충족시키지 않는 경우에 사용되는 처리 기법은 이 출원의 이 실시예에서 구체적으로 한정되지 않는다는 것이 이해되어야 한다. 예를 들어, 초기 다중 채널 파라미터는 다른 기존의 방식으로 수정될 수 있다.
제2 사전설정된 조건은 하나의 조건일 수 있거나, 복수의 조건의 조합일 수 있다. 추가로, 제2 사전설정된 조건이 충족되는 경우, 판정하는 것이 다른 조건에 기반하여 또한 수행될 수 있다. 모든 조건이 충족되는 경우, 차후의 단계가 수행된다.
현재 프레임의 이전의 T개 프레임은 인코딩될 오디오 신호의 모든 프레임 내에서 현재 프레임에 가깝게 인접한 이전의 T개의 프레임임이 이해되어야 한다. 예를 들어, 인코딩될 오디오 신호가 10개의 프레임을 포함하고, T=2이며, 현재 프레임이 10개의 프레임 중의 제5 프레임인 경우, 현재 프레임의 이전의 T개 프레임은 10개의 프레임 중의 제3 프레임 및 제4 프레임이다.
현재 프레임의 다중 채널 파라미터가 복수의 방식으로 이전의 T개의 프레임의 다중 채널 파라미터의 변화 경향에 기반하여 판정될 수 있다는 것이 이해되어야 한다. 예를 들어, 다중 채널 파라미터는 ITD 값이다. 현재 프레임의 ITD 값 ITD[i]은 다음 방식으로 계산될 수 있다:
ITD[i] = ITD[i-1] + delta, 여기서
delta = ITD[i-1] - ITD[i-2]이고, ITD[i-1]는 현재 프레임의 이전의 프레임의 ITD 값을 나타내고, ITD[i-2]는 현재 프레임의 이전의 프레임의 이전의 프레임의 ITD 값을 나타낸다.
다음은 전술된 제2 사전설정된 조건을 상세히 설명한다.
제2 사전설정된 조건은 복수의 방식으로 정의될 수 있고, 제2 사전설정된 조건의 설정은 특성 파라미터의 선택에 관련됨이 이해되어야 한다. 이것은 이 출원의 이 실시예에서 구체적으로 한정되지 않는다.
예를 들어, 특성 파라미터는 상관 파라미터 및/또는 피크 대 평균 비율 파라미터이며, 상관 파라미터는 서브밴드에서의 이전 프레임의 다중 채널 신호 및 현재 프레임의 다중 채널 신호의 상관 값의 평균 값이고, 피크 대 신호 평균 비율 파라미터는 서브밴드에서의 현재 프레임의 다중 채널 신호의 피크 대 평균 비율의 평균 값이다. 제2 사전설정된 조건은 다음의 조건 중 하나 이상일 수 있다:
상관 파라미터는 제2 임계치보다 큰데, 제2 임계치의 값 범위는, 예를 들어, 0.6 내지 0.95일 수 있으니, 예를 들어, 제2 임계치는 0.85일 수 있음;
피크 대 평균 비율 파라미터는 제3 임계치보다 큰데, 제3 임계치의 값 범위는, 예를 들어, 0.4 내지 0.8일 수 있으니, 예를 들어, 제3 임계치는 0.6일 수 있음;
상관 파라미터는 제4 임계치보다 크고, 서브밴드에서의 상관 값은 제5 임계치보다 큰데, 제4 임계치의 값 범위는 0.6 내지 0.85일 수 있으니, 예를 들어, 제4 임계치는 0.7일 수 있고; 제5 임계치의 값 범위는 0.8 내지 0.95일 수 있으니, 예를 들어, 제5 임계치는 0.9일 수 있음; 및
피크 대 평균 비율 파라미터는 제6 임계치보다 크고, 서브밴드에서의 피크 대 평균 비율은 제7 임계치보다 큰데, 제6 임계치의 값 범위는 0.4 내지 0.75일 수 있으니, 예를 들어, 제6 임계치는 0.55일 수 있고; 제7 임계치의 값 범위는 0.6 내지 0.9일 수 있으니, 예를 들어, 제7 임계치는 0.7일 수 있음.
제2 임계치는 제4 임계치보다 클 수 있고, 제4 임계치는 제5 임계치보다 작을 수 있거나; 제3 임계치는 제6 임계치보다 크고, 제6 임계치는 제7 임계치보다 작을 수 있다.
특성 파라미터가 피크 대 평균 비율 파라미터를 포함하고, 제2 사전설정된 조건은 피크 대 평균 비율 파라미터가 사전설정된 임계치보다 크거나 같다는 것을 포함하는 경우, 피크 대 평균 비율 파라미터 및 사전설정된 임계치 사이의 값 관계가 판정될 필요가 있음이 이해되어야 한다. 계산을 단순화하기 위해, 피크 대 평균 비율 파라미터를 사전설정된 임계치와 비교하는 프로세스는 피크 대 평균 비율의 피크 값과 타겟 값 간의 비교로 변환될 수 있다. 타겟 값은 피크 대 평균 비율의 평균 값 및 사전설정된 임계치의 곱일 수 있거나, 피크 대 평균 비율을 계산하기 위해 사용되는 파라미터의 합 및 사전설정된 임계치의 곱일 수 있다. 예를 들어, 피크 대 평균 비율을 계산하기 위해 사용되는 파라미터는 서브밴드의 주파수 영역 진폭 값이고, 각 서브 밴드는 N개의 주파수 영역 진폭 값을 포함한다. 피크 대 평균 비율이 사전설정된 임계치와 비교되는 경우에, 각 서브밴드의 최대 주파수 영역 진폭 값은 각 서브밴드의 N개의 주파수 영역 진폭 값의 합 및 사전설정된 임계치의 곱과 비교될 수 있거나, 각 서브 밴드의 최대 주파수 영역 진폭 값은 각 서브밴드의 N개의 주파수 영역 진폭 값의 평균 값 및 사전설정된 임계치의 곱과 비교될 수 있다.
다음은 도 7에서의 예를 참조하여 더욱 상세한 방식으로 이 출원의 실시예를 설명한다. 도 7은 현재 프레임의 다중 채널 신호가 좌 채널 신호 및 우 채널 신호를 포함하고, 다중 채널 파라미터가 ITD 값인 예를 사용하여 주로 설명된다. 도 7의 예는 단지 당업자가 이 출원의 실시예를 이해하는 것을 돕도록 의도된 것이지, 이 출원의 실시예를 한정하도록 의도된 것은 아니라는 점에 유의하여야 한다. 명백히, 당업자는 도 7에서의 제공된 예에 기반하여 다양한 균등한 수정 또는 변형을 수행할 수 있고, 그러한 수정 또는 변형은 또한 이 출원의 실시예의 범위 내에 속한다.
도 7은 이 출원의 실시예에 따른 다중 채널 신호 인코딩 방법의 개략적 흐름도이다. 도 7에 도시된 처리 단계 또는 동작은 단지 예이고, 도 7에서의 동작의 변형 또는 다른 동작이 이 출원의 이 실시예에서 또한 수행될 수 있다는 것이 이해되어야 한다. 추가로, 도 7에서의 단계는 도 7에 도시된 것과는 상이한 순차로 수행될 수 있고, 도 7에서의 일부 동작은 수행될 필요가 없을 수 있다.
도 7에서의 방법은 다음 단계를 포함한다.
710: 좌 채널 주파수 영역 신호 및 우 채널 주파수 영역 신호를 획득하기 위해, 현재 프레임의 좌 채널 시간 영역 신호 및 우 채널 시간 영역 신호에 대해 시간-주파수 변환을 수행한다.
720: 타겟 주파수 영역 신호를 획득하기 위해, 정규화된 교차상관 동작을 좌 채널 주파수 영역 신호 및 우 채널 주파수 영역 신호에 대해 수행한다.
730: 타겟 시간 영역 신호를 획득하기 위해, 타겟 주파수 영역 신호에 대해 주파수 시간 변환을 수행한다.
740: 타겟 시간 영역 신호에 기반하여 현재 프레임의 초기 ITD 값을 판정한다.
단계(720) 내지 단계(740)에서 기술된 프로세스는 다음 공식을 사용하여 나타낼 수 있다.
Figure pat00024
, 여기서
Figure pat00025
는 좌 채널 주파수 영역 신호의 주파수 영역 계수를 나타내고,
Figure pat00026
는 우 채널 주파수 영역 신호의 주파수 영역 계수의 공액을 나타내며,
Figure pat00027
은 복수의 값으로부터 최대 값을 선택하는 것을 의미하고,
Figure pat00028
은 역 이산 푸리에 변환을 나타낸다.
750: 현재 프레임의 ITD 값을 계산하기 위해, 세밀화된(fine-grained) ITD 제어를 수행한다.
760: 현재 프레임의 ITD 값에 기반하여 좌 채널 시간 영역 신호 및 우 채널 시간 영역 신호에 대해 위상 오프셋(phase offset)을 수행한다.
770: 좌 채널 시간 영역 신호 및 우 채널 시간 영역 신호에 대해 다운믹싱을 수행한다.
단계(760 및 770)의 구현에 대해서는, 종래 기술을 참조하라. 세부사항은 여기에서 기술되지 않는다.
단계(750)는 도 5에서의 단계(540)에 대응한다. 단계(530)에서 제공되는 임의의 구현은 단계(750)를 위해 사용될 수 있다. 다음은 몇 개의 선택적 구현을 나열한다.
구현 1:
단계 1: 현재 프레임의 좌 채널 주파수 영역 신호의 저주파 부분을 M개의 서브밴드로 분할하는데, 각 서브밴드는 N개의 주파수 영역 진폭 값을 포함한다.
단계 2: 다음 공식에 기반하여 현재 프레임 및 이전 프레임의 상관 파라미터를 계산한다:
Figure pat00029
, 여기서
Figure pat00030
은 현재 프레임의 좌 채널 주파수 영역 신호의 저주파 부분에서의 제i 서브밴드의 제j 주파수 영역 진폭 값을 나타내고,
Figure pat00031
은 이전 프레임의 좌 채널 주파수 영역 신호의 저주파 부분에서의 제i 서브밴드의 제j 주파수 영역 진폭 값을 나타내며,
Figure pat00032
은 M개의 서브밴드 중의 제i 서브밴드에 대응하는 정규화된 교차상관 값을 나타낸다.
현재 프레임 및 이전 프레임의 상관 파라미터는 단계 2의 계산을 통해 획득됨이 이해되어야 한다. 상관 파라미터는 각 서브밴드의 정규화된 교차상관 값일 수 있거나, 서브 밴드의 정규화된 교차상관 값의 평균 값일 수 있다.
단계 3: 현재 프레임의 각 서브밴드의 피크 대 평균 비율을 계산한다.
단계 2 및 단계 3은 동시에 수행될 수 있거나, 순차적으로 수행될 수 있음이 이해되어야 한다. 추가로, 각 서브밴드의 피크 대 평균 비율은 각 서브밴드의 주파수 영역 진폭 값의 피크 값 대 각 서브밴드의 주파수 영역 진폭 값의 평균 값의 비율을 사용하여 나타낼 수 있거나, 각 서브밴드의 주파수 영역 진폭 값 대 서브밴드의 주파수 영역 진폭 값의 합의 비율을 사용하여 나타낼 수 있다. 이것은 계산 복잡도를 줄일 수 있다.
현재 프레임의 다중 채널 신호의 피크 대 평균 비율 파라미터는 단계 3에서의 계산을 통해 획득될 수 있음이 이해되어야 한다. 피크 대 평균 비율 파라미터는 각 서브밴드의 피크 대 평균 비율, 서브밴드의 피크 대 평균 비율의 합, 또는 서브 밴드의 피크 대 평균 비율의 평균 값일 수 있다.
단계 4: 현재 프레임의 초기 ITD 값 및 이전 프레임의 ITD 값이 제1 사전설정된 조건을 충족시키는 경우, 현재 프레임의 상관 파라미터 및/또는 피크 대 평균 비율 파라미터에 기반하여, 현재 프레임을 위해 이전 프레임의 ITD 값을 재사용할지 판정한다.
예를 들어, 제1 사전설정된 조건은 다음일 수 있다:
이전 프레임의 ITD 값과 현재 프레임의 초기 ITD 값의 곱이 0임; 또는
이전 프레임의 ITD 값과 현재 프레임의 초기 ITD 값의 곱이 음(negative)임; 또는
이전 프레임의 ITD 값과 현재 프레임의 초기 ITD 값 사이의 차이의 절대 값이 타겟 값의 절반보다 큰데, 타겟 값은 이전 프레임의 ITD 값 및 현재 프레임의 초기 ITD 값에서 절대 값이 더 큰 ITD 값이다.
제1 사전설정된 조건은 하나의 조건일 수 있거나, 복수의 조건의 조합일 수 있음이 이해되어야 한다. 추가로, 제1 사전설정된 조건이 충족되는 경우, 판정하는 것이 다른 조건에 기반하여 더 수행될 수 있다. 모든 조건이 충족되는 경우, 후속 단계가 수행된다.
현재 프레임의 상관 파라미터 및/또는 피크 대 평균 비율 파라미터에 기반하여, 현재 프레임을 위해 이전 프레임의 ITD 값을 재사용할지를 판정하는 것은 구체적으로 다음일 수 있다: 현재 프레임의 상관 파라미터 및/또는 피크 대 평균 비율 파라미터가 제2 사전설정된 조건을 충족시키는지 판정하는 것; 그리고 현재 프레임의 상관 파라미터 및/또는 피크 대 평균 비율 파라미터가 제2 사전설정된 조건을 충족시키는 경우, 현재 프레임을 위해 이전 프레임의 ITD 값을 재사용하는 것.
예를 들어, 제2 사전설정된 조건은 다음일 수 있다:
서브밴드의 정규화된 교차상관 값의 평균 값이 제1 임계치보다 큼; 또는
서브밴드의 피크 대 평균 비율의 평균 값이 제2 임계치보다 큼; 또는
서브밴드의 정규화된 교차상관 값의 평균 값이 제3 임계치보다 크고, 서브밴드의 정규화된 교차상관 값이 제4 임계치보다 큼; 또는
서브밴드의 피크 대 평균 비율의 평균 값이 제5 임계치보다 크고, 서브밴드의 피크 대 평균 비율이 제6 임계치보다 큼.
제1 임계치는 제3 임계치보다 크고, 제3 임계치는 제4 임계치보다 작거나; 제2 임계치는 제5 임계치보다 크고, 제5 임계치는 제6 임계치보다 작다.
제2 사전설정된 조건은 하나의 조건일 수 있거나, 복수의 조건의 조합일 수 있음에 유의하여야 한다. 추가로, 제2 사전설정된 조건이 충족되는 경우, 판정하는 것은 다른 조건에 기반하여 더 수행될 수 있다. 모든 조건이 충족되는 경우 후속 단계가 수행된다.
현재 프레임의 전술된 설명된 좌 채널 주파수 영역 신호는 현재 프레임의 하나 또는 일부 서브프레임의 좌 채널 주파수 영역 신호일 수 있고, 이전 프레임의 전술된 좌 채널 주파수 영역 신호는 이전 프레임의 하나 또는 일부 서브프레임의 좌 채널 주파수 영역 신호일 수 있음에 유의하여야 한다. 다시 말해, 상관 파라미터는 현재 프레임의 파라미터 및 이전 프레임의 파라미터를 사용하여 계산 될 수 있거나, 현재 프레임의 하나 또는 일부 서브프레임의 파라미터 및 이전 프레임의 하나 또는 일부 서브프레임의 파라미터를 사용하여 계산될 수 있다. 마찬가지로, 피크 대 평균 비율 파라미터는 현재 프레임의 파라미터를 사용하여 계산될 수 있거나, 현재 프레임의 하나 또는 일부 서브프레임의 파라미터를 사용하여 계산될 수 있다.
구현 2:
구현 2 및 전술된 구현 간의 차이는 다음과 같다: 전술된 구현에서, 현재 프레임 및 이전 프레임의 상관 파라미터는 서브밴드의 주파수 영역 진폭 값에 기반하여 계산되나, 구현 2에서, 현재 프레임 및 이전 프레임의 상관 파라미터는 서브밴드의 주파수 영역 계수 또는 주파수 영역 계수의 절대 값에 기반하여 계산된다. 구현 2의 구체적인 구현 프로세스는 전술된 구현의 그것과 유사하다. 세부사항은 여기에서 기술되지 않는다.
구현 3:
구현 3 및 전술된 구현 간의 차이는 다음과 같다: 전술된 구현에서, 현재 프레임 및 이전 프레임의 피크 대 평균 비율 파라미터는 서브밴드의 주파수 영역 진폭 값에 기반하여 계산되나, 구현 3에서, 피크 대 평균 비율 파라미터는 서브밴드의 주파수 영역 계수의 절대 값에 기반하여 계산된다. 구현 3의 구체적인 구현 프로세스는 전술된 구현의 그것과 유사하다. 세부사항은 여기에서 기술되지 않는다.
구현 4:
구현 4 및 전술된 구현 간의 차이는 다음과 같다: 전술된 구현에서, 현재 프레임 및 이전 프레임의 상관 파라미터 및/또는 피크 대 평균 비율 파라미터는 좌 채널 주파수 영역 신호에 기반하여 계산되나, 구현 4에서, 상관 파라미터 및/또는 피크 대 평균 비율 파라미터는 우 채널 주파수 영역 신호에 기반하여 계산된다. 구현 4의 구체적인 구현 프로세스는 전술된 구현의 그것과 유사하다. 세부사항은 여기에서 기술되지 않는다.
구현 5:
구현 5 및 전술된 구현 간의 차이는 다음과 같다: 전술된 구현에서, 상관 파라미터 및/또는 피크 대 평균 비율 파라미터는 좌 채널 주파수 영역 신호 또는 우 채널 주파수 영역 신호에 기반하여 계산되나, 구현 5에서, 상관 파라미터 및/또는 피크 대 평균 비율 파라미터는 좌 채널 주파수 영역 신호 및 우 채널 주파수 영역 신호에 기반하여 계산된다.
특정 구현 동안, 상관 파라미터 및/또는 피크 대 평균 비율 파라미터의 그룹은 좌 채널 주파수 영역 신호에 기반하여 계산될 수 있고, 그러면 상관 파라미터 및/또는 피크 대 평균 비율 파라미터의 그룹은 우 채널 주파수 영역 신호에 기반하여 계산될 수 있다. 그러면, 파라미터의 두 그룹 중에서 더 큰 것은 최종 상관 파라미터 및/또는 피크 대 평균 비율 파라미터로서 선택될 수 있다. 구현 5의 다른 프로세스는 전술된 구현의 그것과 유사하다. 세부사항은 여기에서 기술되지 않는다.
구현 6:
구현 6 및 전술된 구현 간의 차이는 다음과 같다: 전술된 구현에서, 상관 파라미터는 주파수 영역 신호에 기반하여 계산되나, 구현 6에서, 상관 파라미터는 시간 영역 신호에 기반하여 계산된다.
구체적으로, 현재 프레임 및 이전 프레임의 상관 파라미터는 다음 공식을 사용하여 계산될 수 있다:
Figure pat00033
, 여기서,
Figure pat00034
은 좌 채널 시간 영역 신호를 나타내고,
Figure pat00035
은 우 채널 시간 영역 신호를 나타내며, N은 좌 채널 시간 영역 신호의 샘플의 전체 수량이고, L은 우 채널 신호의 제n 샘플 및 좌 채널의 제n 샘플 사이의 오프셋 샘플의 수량이다.
여기에서 좌 채널 시간 영역 신호 및 우 채널 시간 영역 신호는 현재 프레임의 모든 좌 채널 신호 및 우 채널 신호 일 수 있거나, 현재 프레임의 하나 또는 일부 서브프레임의 좌 패널 신호 및 우 채널 신호일 수 있음이 이해되어야 한다.
구현 6의 다른 구현 프로세스는 전술된 구현의 그것과 유사하다. 세부사항은 여기에서 기술되지 않는다.
구현 7:
구현 7 및 전술된 구현 간의 차이는 다음과 같다: 전술된 구현에서, 현재 프레임을 위해 이전 프레임의 ITD 값을 재사용할지가 판정될 필요가 있으나, 구현 7에서, 현재 프레임의 이전의 T개의 프레임의 ITD 값의 변화 경향에 기반하여 현재 프레임의 ITD 값을 추정할지가 판정될 필요가 있는데, 여기서 T는 2보다 크거나 같은 정수이다.
현재 프레임의 ITD 값 ITD[i]은 다음 방식으로 계산될 수 있다:
ITD[i] = ITD[i-1] + delta, 여기서
delta = ITD[i-1] - ITD[i-2]이고, ITD[i-1]는 현재 프레임의 이전 프레임의 ITD 값을 나타내며, ITD[i-2]는 현재 프레임의 이전 프레임의 이전 프레임의 ITD 값을 나타낸다.
구현 8:
구현 8 및 전술된 구현 간의 차이는 다음과 같다: 전술된 구현에서, 현재 프레임 및 이전 프레임의 상관 파라미터는 현재 프레임 및 이전 프레임의 시간/주파수 신호에 기반하여 계산되나, 구현 8에서, 상관 파라미터는 현재 프레임 및 이전 프레임의 피치 주기에 기반하여 계산된다.
구체적으로, 현재 프레임의 피치 주기 및 대응하는 이전 프레임의 피치 주기는 기존의 피치 주기 알고리즘에 기반하여 계산될 수 있고; 현재 프레임의 피치 주기 및 이전 프레임의 피치 주기 사이의 편차가 계산되며; 현재 프레임의 피치 주기 및 이전 프레임의 피치 주기 사이의 편차는 현재 프레임 및 이전 프레임의 상관 파라미터로서 사용된다.
현재 프레임의 피치 주기 및 이전 프레임의 피치 주기 사이의 편차는 현재 프레임의 전체 피치 주기 및 이전 프레임의 전체 피치 주기 사이의 편차일 수 있거나, 현재 프레임의 하나 또는 일부 서브프레임의 피치 주기 및 이전 프레임의 하나 또는 일부 서브프레임의 피치 주기 사이의 편차일 수 있거나, 현재 프레임의 일부 서브프레임의 피치 주기 및 이전 프레임의 일부 서브프레임의 피치 주기 사이의 편차의 합일 수 있거나, 현재 프레임의 일부 서브프레임의 피치 주기 및 이전 프레임의 일부 서브프레임의 피치 주기 사이의 편차의 평균일 수 있음이 이해되어야 한다.
구현 9:
구현 9 및 전술된 구현 간의 차이는 다음과 같다: 전술된 구현에서, 현재 프레임의 ITD 값은 상관 파라미터 및/또는 피크 대 평균 비율 파라미터에 기반하여 판정되나, 구현 9에서, 현재 프레임의 ITD 값은 상관 파라미터 및/또는 스펙트럼 기울기 파라미터에 기반하여 판정된다.
이 경우에, 제2 사전설정된 조건은 다음일 수 있다: 현재 프레임 및 이전 프레임의 상관 파라미터의 상관 값은 임계치보다 크고/거나 스펙트럼 기울기 파라미터의 스펙트럼 기울기 값은 임계치보다 작음(더 큰 스펙트럼 기울기 값은 더 약한 신호 유음화를 지시하고, 더 작은 스펙트럼 기울기 값은 더 강한 신호 유음화를 지시함이 이해되어야 한다).
구현 9의 다른 구현 프로세스는 전술된 구현의 그것과 유사하다. 세부사항은 여기에서 기술되지 않는다.
구현 10:
구현 10 및 전술된 구현 간의 차이는 다음과 같다: 전술된 구현에서, 현재 프레임의 ITD 값이 계산되나, 구현 10에서, 현재 프레임의 IPD 값이 계산된다. 단계(710) 내지 단계(770)에서의 ITD 값 관련 계산 프로세스는 IPD 값 관련 프로세스로 교체될 필요가 있음이 이해되어야 한다. IPD 값을 계산하는 방식에 대해서는, 종래 기술을 참조하라. 세부사항은 여기에서 기술되지 않는다.
구현 10의 다른 구현 프로세스는 전술된 구현의 그것과 대략 유사하다. 세부사항은 여기에서 기술되지 않는다.
전술된 10개의 구현은 설명을 위한 예일 뿐임이 이해되어야 한다. 실제로, 이들 구현은, 새로운 구현을 얻기 위해, 서로 조합되거나 교체될 수 있다. 간결함을 위해, 여기에서 예가 하나하나 나열되지는 않는다.
다음은 이 출원의 장치 실시예를 설명한다. 장치 실시예는 전술된 방법을 수행하기 위해 사용될 수 있다. 그러므로, 상세히 설명되지 않는 부분에 대해서는, 전술된 방법 실시예를 참조하라.
도 8은 이 출원의 실시예에 따른 인코더의 개략적 블록도이다. 도 8에서의 인코더(800)은 다음을 포함한다:
현재 프레임의 다중 채널 신호를 획득하도록 구성된 획득 유닛(810);
현재 프레임의 초기 다중 채널 파라미터를 판정하도록 구성된 제1 판정 유닛(820);
현재 프레임의 초기 다중 채널 파라미터 및 현재 프레임의 이전의 K개의 프레임의 다중 채널 파라미터에 기반하여 차이 파라미터를 판정하도록 구성된 제2 판정 유닛(830)(차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 이전의 K개의 프레임의 다중 채널 파라미터 사이의 차이를 나타내기 위해 사용되고, K는 1 보다 크거나 같은 정수임);
현재 프레임의 특성 파라미터 및 차이 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구성된 제3 판정 유닛(840); 및
현재 프레임의 다중 채널 파라미터에 기반하여 다중 채널 신호를 인코딩하도록 구성된 인코딩 유닛(850).
이 출원의 이 실시예에서, 현재 프레임의 다중 채널 파라미터는 현재 프레임의 특성 파라미터 및 현재 프레임과 이전의 K개의 프레임 간의 차이에 대한 포괄적인 고려에 기반하여 판정된다. 이 판정 방식은 더 적절하다. 현재 프레임을 위해 이전 프레임의 다중 채널 파라미터를 직접적으로 재사용하는 방식에 비해, 이 방식은 다중 채널 신호의 채널간 정보의 정확성을 더 잘 보장할 수 있다.
선택적으로, 몇몇 실시예에서, 제3 판정 유닛(840)은, 차이 파라미터가 제1 사전설정된 조건을 충족시키는 경우, 현재 프레임의 특성 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성된다.
선택적으로, 몇몇 실시예에서, 차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 현재 프레임의 이전 프레임의 다중 채널 파라미터 간의 차이의 절대 값이고, 제1 사전설정된 조건은 차이 파라미터가 사전설정된 제1 임계치보다 크다는 것이다.
선택적으로, 몇몇 실시예에서, 차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 현재 프레임의 이전 프레임의 다중 채널 파라미터의 곱이고, 제1 사전설정된 조건은 차이 파라미터가 0보다 작거나 같다는 것이다.
선택적으로, 몇몇 실시예에서, 제3 판정 유닛(840)은, 현재 프레임의 상관 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성되되, 상관 파라미터는 현재 프레임 및 현재 프레임의 이전 프레임 간의 상관의 정도를 나타내기 위해 사용된다.
선택적으로, 몇몇 실시예에서, 제3 판정 유닛(840)은, 현재 프레임의 피크 대 평균 비율 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성되되, 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용된다.
선택적으로, 몇몇 실시예에서, 제3 판정 유닛(840)은, 현재 프레임의 피크 대 평균 비율 파라미터 및 상관 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성되되, 상관 파라미터는 현재 프레임 및 이전 프레임 간의 상관의 정도를 나타내기 위해 사용되고, 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용된다.
선택적으로, 몇몇 실시예에서, 인코더는 다음을 더 포함한다:
현재 프레임의 다중 채널 신호 내의 타겟 채널 신호 및 이전 프레임의 다중 채널 신호 내의 타겟 채널 신호에 기반하여 상관 파라미터를 판정하도록 구성된 제4 판정 유닛.
선택적으로, 몇몇 실시예에서, 제4 판정 유닛은 현재 프레임의 다중 채널 신호 내의 타겟 채널 신호의 주파수 영역 파라미터 및 이전 프레임의 다중 채널 신호 내의 타겟 채널 신호의 주파수 영역 파라미터에 기반하여 상관 파라미터를 판정하도록 구체적으로 구성되되, 주파수 영역 파라미터는 타겟 채널 신호의 주파수 영역 진폭 값 및 주파수 영역 계수 중 적어도 하나이다.
선택적으로, 몇몇 실시예에서, 인코더는 다음을 더 포함한다:
현재 프레임의 피치 주기 및 이전 프레임의 피치 주기에 기반하여 상관 파라미터를 판정하도록 구성된 제5 판정 유닛.
선택적으로, 몇몇 실시예에서, 제3 판정 유닛(840)은, 특성 파라미터가 제2 사전설정된 조건을 충족시키는 경우, 현재 프레임의 이전의 T개의 프레임의 다중 채널 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성되되, T는 1보다 크거나 같은 정수이다.
선택적으로, 몇몇 실시예에서, 제3 판정 유닛(840)은, 이전의 T개의 프레임의 다중 채널 파라미터를 현재 프레임의 다중 채널 파라미터로서 판정하도록 구체적으로 구성되되, T는 1과 같다.
선택적으로, 몇몇 실시예에서, 제3 판정 유닛(840)은, 이전의 T개의 프레임의 다중 채널 파라미터의 변화 경향에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성되되, T는 2보다 크거나 같다.
선택적으로, 몇몇 실시예에서, 특성 파라미터는 현재 프레임의 상관 파라미터 및/또는 피크 대 평균 비율 파라미터를 포함하는데, 상관 파라미터는 현재 프레임 및 현재 프레임의 이전 프레임 간의 상관의 정도를 나타내기 위해 사용되고, 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용되며; 제2 사전설정된 조건은 특성 파라미터가 사전설정된 임계치보다 크다는 것이다.
선택적으로, 몇몇 실시예에서, 현재 프레임의 초기 다중 채널 파라미터는 다음 중 적어도 하나를 포함한다: 현재 프레임의 초기 채널간 코히어런스(inter-channel coherence) IC 값, 현재 프레임의 초기 채널간 시간 차이(inter-channel time difference) ITD 값, 현재 프레임의 초기 채널간 위상 차이(inter-channel phase difference) IPD 값, 현재 프레임의 초기 전체 위상 차이(overall phase difference) OPD 값 및 현재 프레임의 초기 채널간 레벨 차이(inter-channel level difference) ILD 값.
선택적으로, 몇몇 실시예에서, 현재 프레임의 특성 파라미터는 현재 프레임의 다음 파라미터 중 적어도 하나를 포함한다: 상관 파라미터, 피크 대 평균 비율 파라미터, 신호 대 노이즈 비율 파라미터 및 스펙트럼 기울기 파라미터(여기서 상관 파라미터는 현재 프레임 및 이전 프레임 간의 상관의 정도를 나타내기 위해 사용되고, 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용되며, 신호 대 노이즈 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 신호 대 노이즈 비율을 나타내기 위해 사용되고, 스펙트럼 기울기 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 스펙트럼 기울기 정도를 나타내기 위해 사용됨).
도 9는 이 출원의 실시예에 따른 인코더의 개략적 블록도이다. 도 9에서의 인코더(900)는 다음을 포함한다:
프로그램을 저장하도록 구성된 메모리(910); 및
프로그램을 실행하도록 구성된 프로세서(920). 프로그램이 실행되는 경우, 프로세서(920)는, 현재 프레임의 다중 채널 신호를 획득하고; 현재 프레임의 초기 다중 채널 파라미터를 판정하며; 현재 프레임의 초기 다중 채널 파라미터 및 현재 프레임의 이전의 K개의 프레임의 다중 채널 파라미터에 기반하여 차이 파라미터를 판정하고(여기서 차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 이전의 K개의 프레임의 다중 채널 파라미터 간의 차이를 나타내기 위해 사용되고, K는 1보다 크거나 같은 정수임); 현재 프레임의 특성 파라미터 및 차이 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하며; 현재 프레임의 다중 채널 파라미터에 기반하여 다중 채널 신호를 인코딩하도록 구성된다.
이 출원의 이 실시예에서, 현재 프레임의 다중 채널 파라미터는 현재 프레임의 특성 파라미터 및 현재 프레임과 이전의 K개의 프레임 간의 차이에 대한 포괄적 고려에 기반하여 판정된다. 이 판정 기법은 더 적절하다. 현재 프레임을 위해 이전 프레임의 다중 채널 파라미터를 직접적으로 재사용하는 방식에 비해, 이 방식은 다중 채널 신호의 채널간 정보의 정확성을 더 잘 보장할 수 있다.
선택적으로, 몇몇 실시예에서, 프로세서(920)는, 차이 파라미터가 제1 사전설정된 조건을 충족시키는 경우, 현재 프레임의 특성 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성된다.
선택적으로, 몇몇 실시예에서, 차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 현재 프레임의 이전 프레임의 다중 채널 파라미터 간의 차이의 절대 값이고, 제1 사전설정된 조건은 차이 파라미터가 사전설정된 제1 임계치보다 크다는 것이다.
선택적으로, 몇몇 실시예에서, 차이 파라미터는 현재 프레임의 초기 다중 채널 파라미터 및 현재 프레임의 이전 프레임의 다중 채널 파라미터의 곱이고, 제1 사전설정된 조건은 차이 파라미터가 0보다 작거나 같다는 것이다.
선택적으로, 몇몇 실시예에서, 프로세서(920)는 현재 프레임의 상관 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성되되, 상관 파라미터는 현재 프레임 및 현재 프레임의 이전 프레임 간의 상관의 정도를 나타내기 위해 사용된다.
선택적으로, 몇몇 실시예에서, 프로세서(920)는 현재 프레임의 피크 대 평균 비율 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성되되, 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용된다.
선택적으로, 몇몇 실시예에서, 프로세서(920)는 현재 프레임의 상관 파라미터 및 피크 대 평균 비율 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성되되, 상관 파라미터는 현재 프레임 및 현재 프레임의 이전 프레임 간의 상관의 정도를 나타내기 위해 사용되고, 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용된다.
선택적으로, 몇몇 실시예에서, 프로세서(920)는 현재 프레임의 다중 채널 신호 내의 타겟 채널 신호 및 이전 프레임의 다중 채널 신호 내의 타겟 채널 신호에 기반하여 상관 파라미터를 판정하도록 또한 구성된다.
선택적으로, 몇몇 실시예에서, 프로세서(920)는 현재 프레임의 다중 채널 신호 내의 타겟 채널 신호의 주파수 영역 파라미터 및 이전 프레임의 다중 채널 신호 내의 타겟 채널 신호의 주파수 영역 파라미터에 기반하여 상관 파라미터를 판정하도록 구체적으로 구성되되, 주파수 영역 파라미터는 타겟 채널 신호의 주파수 영역 진폭 값이다.
선택적으로, 몇몇 실시예에서, 프로세서(920)는 현재 프레임의 다중 채널 신호 내의 타겟 채널 신호의 주파수 영역 파라미터 및 이전 프레임의 다중 채널 신호 내의 타겟 채널 신호의 주파수 영역 파라미터에 기반하여 상관 파라미터를 판정하도록 구체적으로 구성되되, 주파수 영역 파라미터는 타겟 채널 신호의 주파수 영역 계수이다.
선택적으로, 몇몇 실시예에서, 프로세서(920)는 현재 프레임의 다중 채널 신호 내의 타겟 채널 신호의 주파수 영역 파라미터 및 이전 프레임의 다중 채널 신호 내의 타겟 채널 신호의 주파수 영역 파라미터에 기반하여 상관 파라미터를 판정하도록 구체적으로 구성되되, 주파수 영역 파라미터는 타겟 채널 신호의 주파수 영역 진폭 값 및 주파수 영역 계수이다.
선택적으로, 몇몇 실시예에서, 프로세서(920)는 현재 프레임의 피치 주기 및 이전 프레임의 피치 주기에 기반하여 상관 파라미터를 판정하도록 또한 구성된다.
선택적으로, 몇몇 실시예에서, 프로세서(920)는, 특성 파라미터가 제2 사전설정된 조건을 충족시키는 경우, 현재 프레임의 이전의 T개의 프레임의 다중 채널 파라미터에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성되되, T는 1보다 크거나 같은 정수이다.
선택적으로, 몇몇 실시예에서, 프로세서(920)는 이전의 T개의 프레임의 다중 채널 파라미터를 현재 프레임의 다중 채널 파라미터로서 판정하도록 구체적으로 구성되되, T는 1과 같다.
선택적으로, 몇몇 실시예에서, 프로세서(920)는, 이전의 T개의 프레임의 다중 채널 파라미터의 변화 경향에 기반하여 현재 프레임의 다중 채널 파라미터를 판정하도록 구체적으로 구성되되, T는 2보다 크거나 같다.
선택적으로, 몇몇 실시예에서, 특성 파라미터는 현재 프레임의 상관 파라미터 및/또는 피크 대 평균 비율 파라미터를 포함하되, 상관 파라미터는 현재 프레임 및 현재 프레임의 이전 프레임 간의 상관의 정도를 나타내기 위해 사용되고, 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용되며, 제2 사전설정된 조건은 특성 파라미터가 사전설정된 임계치보다 크다는 것이다.
선택적으로, 몇몇 실시예에서, 현재 프레임의 초기 다중 채널 파라미터는 다음 중 적어도 하나를 포함한다: 현재 프레임의 초기 채널간 코히어런스 IC 값, 현재 프레임의 초기 채널간 시간 차이 ITD 값, 현재 프레임의 초기 채널간 위상 차이 IPD 값, 현재 프레임의 초기 전체 위상 차이 OPD 값 및 현재 프레임의 초기 채널간 레벨 차이 ILD 값.
선택적으로, 몇몇 실시예에서, 현재 프레임의 특성 파라미터는 현재 프레임의 다음 파라미터 중 적어도 하나를 포함한다: 상관 파라미터, 피크 대 평균 비율 파라미터, 신호 대 노이즈 비율 파라미터 및 스펙트럼 기울기 파라미터(여기서 상관 파라미터는 현재 프레임 및 이전 프레임 간의 상관의 정도를 나타내기 위해 사용되고, 피크 대 평균 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용되며, 신호 대 노이즈 비율 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 신호 대 노이즈 비율을 나타내기 위해 사용되고, 스펙트럼 기울기 파라미터는 현재 프레임의 다중 채널 신호 내의 적어도 하나의 채널의 신호의 스펙트럼 기울기 정도를 나타내기 위해 사용된다.
이 명세서에서의 용어 "및/또는"는 3개의 관계가 존재할 수 있다는 것을 나타낸다. 예를 들어, A 및/또는 B는 다음의 세 경우를 지시할 수 있다: A가 단독으로 존재함, A 및 B 양자 모두가 존재함, 그리고 B가 단독으로 존재함. 추가로, 이 명세서에서의 문자 "/"은 보통 연관된 객체가 "또는" 관계에 있다는 것을 나타낸다.
당업자는 이 명세서에 개시된 실시예에서 설명된 예를 참조하여, 유닛 및 알고리즘 단계가 전자 하드웨어 또는 컴퓨터 소프트웨어 및 전자 하드웨어의 조합에 의해 구현될 수 있다는 것을 알 수 있다. 기능이 하드웨어에 의해 또는 소프트웨어에 의해 수행되는지는 기술적 해결안의 특정한 응용 및 설계 제약에 달려 있다. 당업자는 각각의 특정한 응용을 위한 기술된 기능을 구현하기 위해 상이한 방법을 사용할 수 있으나, 구현이 이 출원의 범위를 넘어서는 것으로 간주되어서는 안 된다.
설명의 용이성 및 간결성을 위해, 전술된 설명된 시스템, 장치 및 유닛의 상세한 작동 프로세스에 대해서, 전술된 방법 실시예에서의 대응하는 프로세스가 참조될 수 있다는 것은 당업자에 의해 명확히 이해될 수 있으며, 세부사항은 여기에서 다시 기술되지 않는다.
이 출원에서 제공되는 몇 가지 실시예에서, 개시된 시스템, 장치 및 방법은 다른 방식으로 구현될 수 있음이 이해되어야 한다. 예를 들어, 기술된 장치 실시예는 예일 뿐이다. 예를 들어, 유닛 구분은 단지 논리적 기능 구분이며 실제의 구현 동안에 다른 구분일 수 있다. 예를 들어, 복수의 유닛 또는 컴포넌트가 다른 시스템에 통합되거나 조합되될 수 있거나, 몇몇 특징은 무시되거나 수행되지 않을 수 있다. 추가로, 현시되거나 논의된 상호 커플링 또는 직접적인 커플링 또는 통신 연결은 몇몇 인터페이스를 사용하여 구현될 수 있다. 장치 또는 유닛 간의 간접적인 커플링 또는 통신 연결은 전기적, 기계적 또는 다른 형태로 구현될 수 있다.
별개의 부분으로서 설명된 유닛은 물리적으로 분리될 수 있거나 그렇지 않을 수 있고, 유닛으로서 현시된 부분은 물리적 유닛일 수 있거나 그렇지 않을 수 있는바; 다시 말해, 하나의 장소에 위치될 수 있거나, 복수의 네트워크 유닛 상에 분산될 수 있다. 유닛 중 일부 또는 전부는 실시예의 해결안의 목적을 달성하기 위해 실제의 요구사항에 기반하여 선택될 수 있다.
추가로, 이 출원의 실시예에서의 기능적 유닛은 하나의 처리 유닛으로 통합될 수 있거나, 유닛 각각은 물리적으로 단독으로 존재할 수 있거나, 두 개 이상의 유닛이 하나의 유닛으로 통합될 수 있다.
기능이 소프트웨어 기능 유닛의 형태로 구현되고 독립적인 제품으로서 판매되거나 사용되는 경우에, 기능은 컴퓨터 판독가능 저장 매체(computer-readable storage medium)에 저장될 수 있다. 그러한 이해에 기반하여, 이 출원의 기술적 해결안은 본질적으로, 또는 종래 기술에 기여하는 부분은, 또는 기술적 해결안 중 일부는 소프트웨어 제품의 형태로 구현될 수 있다. 컴퓨터 소프트웨어 제품은 저장 매체 내에 저장되고, 이 출원의 실시예에서 기술된 방법의 단계의 전부 또는 일부를 수행하도록 컴퓨터 디바이스(이는 개인용 컴퓨터, 서버, 네트워크 디바이스 또는 유사한 것일 수 있음)를 명령하기 위한 몇 개의 명령어를 포함한다. 저장 매체는 USB 플래시 드라이브, 탈착가능(removable) 하드 디스크, 판독 전용 메모리(ROM, Read-Only Memory), 랜덤 액세스 메모리(RAM, Random Access Memory), 자기 디스크 또는 광학 디스크와 같은, 프로그램 코드를 저장할 수 있는 임의의 매체를 포함한다.
전술된 설명은 이 출원의 특정 구현일 뿐이며, 이 출원의 보호 범위를 한정하도록 의도되지 않는다. 이 출원에서 개시된 기술적 범위 내에서 당업자에 의해 쉽게 안출되는 임의의 변형 또는 교체는 이 출원의 보호 범위 내에 응당 속한다. 그러므로, 이 출원의 보호 범위는 청구항의 보호 범위를 응당 따른다.

Claims (13)

  1. 다중 채널 신호(multi-channel signal) 인코딩(encoding) 방법으로서,
    현재 프레임(current frame)의 다중 채널 신호를 획득하는 단계와,
    상기 현재 프레임의 제1 다중 채널 파라미터를 획득하는 단계와,
    상기 제1 다중 채널 파라미터 및 이전의 프레임(previous frame)의 제2 다중 채널 파라미터에 기반하여 차이 파라미터를 획득하는 단계 - 상기 차이 파라미터는 상기 제1 다중 채널 파라미터 및 상기 제2 다중 채널 파라미터 간의 차이를 나타냄 - 와,
    상기 현재 프레임의 특성 파라미터를 획득하는 단계와,
    상기 차이 파라미터 및 상기 특성 파라미터에 기반하여 상기 현재 프레임의 제3 다중 채널 파라미터를 획득하는 단계와,
    상기 제3 다중 채널 파라미터에 기초하여 상기 다중 채널 신호를 인코딩하는 단계를 포함하는,
    방법.
  2. 제1항에 있어서,
    상기 차이 파라미터 및 상기 특성 파라미터에 기반하여 상기 현재 프레임의 제3 다중 채널 파라미터를 획득하는 단계는,
    상기 차이 파라미터가 제1 사전설정된 조건을 충족시키는지 판정하는 단계; 및
    상기 차이 파라미터가 상기 제1 사전설정된 조건을 충족시키는 경우, 상기 특성 파라미터에 기반하여 상기 제3 다중 채널 파라미터를 획득하는 단계를 포함하는,
    방법.
  3. 제2항에 있어서,
    상기 차이 파라미터는 상기 제1 다중 채널 파라미터 및 상기 제2 다중 채널 파라미터 간의 차이의 절대 값이고, 상기 제1 사전설정된 조건은 상기 절대 값이 사전설정된 제1 임계치보다 크다는 것이거나, 또는
    상기 차이 파라미터는 상기 제1 다중 채널 파라미터 및 상기 제2 다중 채널 파라미터의 곱(product)이고, 상기 제1 사전설정된 조건은 상기 곱이 0보다 작거나 같다는 것인,
    방법.
  4. 제2항에 있어서,
    상기 특성 파라미터에 기반하여 상기 제3 다중 채널 파라미터를 획득하는 단계는,
    상기 현재 프레임의 상관 파라미터(correlation parameter)에 기초하여 상기 제3 다중 채널 파라미터를 획득하는 단계 - 상기 상관 파라미터는 상기 현재 프레임 및 상기 이전의 프레임 사이의 상관의 정도를 나타냄 - 를 포함하는,
    방법.
  5. 제4항에 있어서,
    상기 방법은,
    상기 현재 프레임의 상기 다중 채널 신호 내의 제1 타겟 채널 신호 및 상기 이전의 프레임의 다중 채널 신호 내의 제2 타겟 채널 신호에 기반하여 상기 상관 파라미터를 획득하는 단계를 더 포함하는,
    방법.
  6. 제5항에 있어서,
    상기 현재 프레임의 상기 다중 채널 신호 내의 제1 타겟 채널 신호 및 상기 이전의 프레임의 다중 채널 신호 내의 제2 타겟 채널 신호에 기반하여 상기 상관 파라미터를 획득하는 단계는,
    상기 제1 타겟 채널 신호의 주파수 영역 파라미터 및 상기 제2 타겟 채널 신호의 주파수 영역 파라미터에 기초하여 상기 상관 파라미터를 획득하는 단계 - 상기 주파수 영역 파라미터는 주파수 영역 진폭 값 및 주파수 영역 계수 중 적어도 하나임 - 를 포함하는,
    방법.
  7. 제4항에 있어서,
    상기 방법은,
    상기 현재 프레임의 제1 피치 주기 및 상기 이전의 프레임의 제2 피치 주기에 기초하여 상기 상관 파라미터를 획득하는 단계를 더 포함하는,
    방법.
  8. 제2항에 있어서,
    상기 특성 파라미터에 기반하여 상기 제3 다중 채널 파라미터를 획득하는 단계는,
    상기 특성 파라미터가 제2 사전설정된 조건을 충족시키는지 판정하는 단계; 및
    상기 특성 파라미터가 상기 제2 사전설정된 조건을 충족시키는 경우 상기 제2 다중 채널 파라미터에 기초하여 상기 제3 다중 채널 파라미터를 획득하는 단계를 포함하는,
    방법.
  9. 제8항에 있어서,
    상기 제2 다중 채널 파라미터에 기초하여 상기 제3 다중 채널 파라미터를 획득하는 단계는,
    상기 제2 다중 채널 파라미터를 상기 제3 다중 채널 파라미터로서 판정하는 단계, 또는
    이전의 T개의 프레임의 상기 다중 채널 파라미터의 변화 경향에 기반하여 상기 현재 프레임의 다중 채널 파라미터를 판정하는 단계 - T는 2보다 크거나 같고, 상기 이전의 T개의 프레임은 상기 이전의 프레임을 포함함 - 를 포함하는,
    방법.
  10. 제8항에 있어서,
    상기 현재 프레임의 상기 특성 파라미터는 상기 현재 프레임의 피크 대 평균 비율(peak-to-average ratio) 파라미터 및 상관 파라미터 중 적어도 하나를 포함하되, 상기 상관 파라미터는 상기 현재 프레임 및 상기 현재 프레임의 상기 이전 프레임 간의 상관의 정도를 나타내기 위해 사용되고, 상기 피크 대 평균 비율 파라미터는 상기 현재 프레임의 상기 다중 채널 신호 내의 적어도 하나의 채널의 신호의 피크 대 평균 비율을 나타내기 위해 사용되며, 상기 제2 사전설정된 조건은 상기 특성 파라미터가 사전설정된 임계치보다 크다는 것인,
    방법.
  11. 인코더로서,
    컴퓨터 실행가능 명령어들을 저장하기 위한 메모리; 및
    상기 메모리에 동작 가능하게 연결된 프로세서를 포함하고,
    상기 프로세서는 제1항 내지 제10항 중 어느 한 항에 따른 방법을 실행하기 위해 상기 컴퓨터 실행가능 명령어들을 실행하도록 구성되는,
    인코더.
  12. 프로그램이 기록된 컴퓨터 판독가능 저장 매체로서, 상기 프로그램은 컴퓨터로 하여금 제1항 내지 제10항 중 어느 한 항에 따른 방법을 실행하도록 구성되는,
    컴퓨터 판독가능 저장 매체.
  13. 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 컴퓨터로 하여금 제1항 내지 제10항 중 어느 한 항에 따른 방법을 실행하도록 구성되는,
    컴퓨터 프로그램.
KR1020227005726A 2016-08-10 2017-02-22 다중 채널 신호 인코딩 방법 및 인코더 KR102486604B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201610652506.X 2016-08-10
CN201610652506.XA CN107731238B (zh) 2016-08-10 2016-08-10 多声道信号的编码方法和编码器
PCT/CN2017/074419 WO2018028170A1 (zh) 2016-08-10 2017-02-22 多声道信号的编码方法和编码器
KR1020217001206A KR102367538B1 (ko) 2016-08-10 2017-02-22 다중 채널 신호 인코딩 방법 및 인코더

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020217001206A Division KR102367538B1 (ko) 2016-08-10 2017-02-22 다중 채널 신호 인코딩 방법 및 인코더

Publications (2)

Publication Number Publication Date
KR20220028159A true KR20220028159A (ko) 2022-03-08
KR102486604B1 KR102486604B1 (ko) 2023-01-09

Family

ID=61161463

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020217001206A KR102367538B1 (ko) 2016-08-10 2017-02-22 다중 채널 신호 인코딩 방법 및 인코더
KR1020197005937A KR102205596B1 (ko) 2016-08-10 2017-02-22 다중 채널 신호 인코딩 방법 및 인코더
KR1020227005726A KR102486604B1 (ko) 2016-08-10 2017-02-22 다중 채널 신호 인코딩 방법 및 인코더

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020217001206A KR102367538B1 (ko) 2016-08-10 2017-02-22 다중 채널 신호 인코딩 방법 및 인코더
KR1020197005937A KR102205596B1 (ko) 2016-08-10 2017-02-22 다중 채널 신호 인코딩 방법 및 인코더

Country Status (11)

Country Link
US (3) US11133014B2 (ko)
EP (2) EP4120252A1 (ko)
JP (4) JP6768924B2 (ko)
KR (3) KR102367538B1 (ko)
CN (1) CN107731238B (ko)
AU (3) AU2017310759B2 (ko)
BR (1) BR112019002656A2 (ko)
CA (1) CA3033225C (ko)
ES (1) ES2928335T3 (ko)
RU (1) RU2705427C1 (ko)
WO (1) WO2018028170A1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4360697A1 (en) 2014-06-02 2024-05-01 Cala Health, Inc. Systems and methods for peripheral nerve stimulation to treat tremor
CA2988586A1 (en) 2015-06-10 2016-12-15 Cala Health, Inc. Neuromodulation system for peripheral nerve stimulation with detachable therapy unit
CN108348746B (zh) 2015-09-23 2021-10-12 卡拉健康公司 用于手指或手中的周围神经刺激以治疗手震颤的系统和方法
EP3405251A4 (en) 2016-01-21 2019-08-28 Cala Health, Inc. SYSTEMS, METHODS AND DEVICES FOR PERIPHERAL NEUROMODULATION FOR THE TREATMENT OF DISEASES RELATED TO BUBBLE HYPERACTIVITY
CN107731238B (zh) * 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
EP3606604A4 (en) 2017-04-03 2020-12-16 Cala Health, Inc. PERIPHERAL NEUROMODULATION SYSTEMS, METHODS AND DEVICES FOR THE TREATMENT OF DISEASES ASSOCIATED WITH BLADDER HYPERACTIVITY
CN108877815B (zh) * 2017-05-16 2021-02-23 华为技术有限公司 一种立体声信号处理方法及装置
WO2019143790A1 (en) 2018-01-17 2019-07-25 Cala Health, Inc. Systems and methods for treating inflammatory bowel disease through peripheral nerve stimulation
CN110556116B (zh) 2018-05-31 2021-10-22 华为技术有限公司 计算下混信号和残差信号的方法和装置
CN110556118B (zh) 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置
CN109243471B (zh) * 2018-09-26 2022-09-23 杭州联汇科技股份有限公司 一种快速编码广播用数字音频的方法
EP3856330B1 (en) * 2018-09-26 2024-01-10 Cala Health, Inc. Predictive therapy neurostimulation systems
CN112233682A (zh) * 2019-06-29 2021-01-15 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置
US11890468B1 (en) 2019-10-03 2024-02-06 Cala Health, Inc. Neurostimulation systems with event pattern detection and classification
WO2023097686A1 (zh) * 2021-12-03 2023-06-08 北京小米移动软件有限公司 一种立体声音频信号处理方法及设备/存储介质/装置
CN115691515A (zh) * 2022-07-12 2023-02-03 南京拓灵智能科技有限公司 一种音频编解码方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090119111A1 (en) * 2005-10-31 2009-05-07 Matsushita Electric Industrial Co., Ltd. Stereo encoding device, and stereo signal predicting method
US20130236022A1 (en) * 2010-09-28 2013-09-12 Huawei Technologies Co., Ltd. Device and method for postprocessing a decoded multi-channel audio signal or a decoded stereo signal
EP3035330A1 (en) * 2011-02-02 2016-06-22 Telefonaktiebolaget LM Ericsson (publ) Determining the inter-channel time difference of a multi-channel audio signal
KR102205596B1 (ko) * 2016-08-10 2021-01-20 후아웨이 테크놀러지 컴퍼니 리미티드 다중 채널 신호 인코딩 방법 및 인코더

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6168568B1 (en) * 1996-10-04 2001-01-02 Karmel Medical Acoustic Technologies Ltd. Phonopneumograph system
DE60128677T2 (de) * 2000-04-24 2008-03-06 Qualcomm, Inc., San Diego Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen
ATE332003T1 (de) * 2002-04-22 2006-07-15 Koninkl Philips Electronics Nv Parametrische beschreibung von mehrkanal-audio
ATE377339T1 (de) * 2002-07-12 2007-11-15 Koninkl Philips Electronics Nv Audio-kodierung
EP1914722B1 (en) * 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
US8843378B2 (en) 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
RU2393550C2 (ru) * 2005-06-30 2010-06-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Устройство и способ кодирования и декодирования звукового сигнала
RU2473062C2 (ru) * 2005-08-30 2013-01-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ кодирования и декодирования аудиосигнала и устройство для его осуществления
US7839948B2 (en) * 2005-12-02 2010-11-23 Qualcomm Incorporated Time slicing techniques for variable data rate encoding
CN101506874B (zh) * 2006-09-13 2011-12-07 日本电信电话株式会社 情感检测方法、情感检测装置
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
CN101188878B (zh) * 2007-12-05 2010-06-02 武汉大学 立体声音频信号的空间参数量化及熵编码方法和所用系统
US8239210B2 (en) * 2007-12-19 2012-08-07 Dts, Inc. Lossless multi-channel audio codec
CA2730355C (en) 2008-07-11 2016-03-22 Guillaume Fuchs Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
WO2010036062A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
CN102307323B (zh) * 2009-04-20 2013-12-18 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法
CN101582262B (zh) * 2009-06-16 2011-12-28 武汉大学 一种空间音频参数帧间预测编解码方法
CN102025892A (zh) * 2009-09-16 2011-04-20 索尼株式会社 镜头转换检测方法及装置
WO2011034374A2 (en) * 2009-09-17 2011-03-24 Lg Electronics Inc. A method and an apparatus for processing an audio signal
BR112012007138B1 (pt) * 2009-09-29 2021-11-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de sinal de áudio, codificador de sinal de áudio, método para prover uma representação de mescla ascendente de sinal, método para prover uma representação de mescla descendente de sinal e fluxo de bits usando um valor de parâmetro comum de correlação intra- objetos
ES2529219T3 (es) * 2009-10-20 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato para proporcionar una representación de señal de mezcla ascendente sobre la base de la representación de una señal de mezcla descendente, aparato para proporcionar un flujo de bits que representa una señal de audio de canales múltiples, métodos, programa de computación y un flujo de bits que utiliza una señalización de control de distorsión
CN102157151B (zh) * 2010-02-11 2012-10-03 华为技术有限公司 一种多声道信号编码方法、解码方法、装置和系统
EP2375410B1 (en) * 2010-03-29 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal
US9112591B2 (en) * 2010-04-16 2015-08-18 Samsung Electronics Co., Ltd. Apparatus for encoding/decoding multichannel signal and method thereof
US8305099B2 (en) 2010-08-31 2012-11-06 Nxp B.V. High speed full duplex test interface
US9514757B2 (en) * 2010-11-17 2016-12-06 Panasonic Intellectual Property Corporation Of America Stereo signal encoding device, stereo signal decoding device, stereo signal encoding method, and stereo signal decoding method
JP5714180B2 (ja) * 2011-05-19 2015-05-07 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーディング方式の鑑識検出
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
EP2702776B1 (en) 2012-02-17 2015-09-23 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
ES2555579T3 (es) 2012-04-05 2016-01-05 Huawei Technologies Co., Ltd Codificador de audio multicanal y método para codificar una señal de audio multicanal
CN104380376B (zh) * 2012-06-14 2017-03-15 杜比国际公司 解码系统、重构方法和设备、编码系统、方法和设备及音频发布系统
US20140086416A1 (en) * 2012-07-15 2014-03-27 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
EP2875510A4 (en) * 2012-07-19 2016-04-13 Nokia Technologies Oy STEREO AUDIO SIGNAL ENCODER
KR20140017338A (ko) * 2012-07-31 2014-02-11 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
CN108074579B (zh) 2012-11-13 2022-06-24 三星电子株式会社 用于确定编码模式的方法以及音频编码方法
WO2014108738A1 (en) * 2013-01-08 2014-07-17 Nokia Corporation Audio signal multi-channel parameter encoder
US9715880B2 (en) * 2013-02-21 2017-07-25 Dolby International Ab Methods for parametric multi-channel encoding
EP2989631A4 (en) * 2013-04-26 2016-12-21 Nokia Technologies Oy AUDIO SIGNAL ENCODER
EP3005351A4 (en) * 2013-05-28 2017-02-01 Nokia Technologies OY Audio signal encoder
US9412385B2 (en) * 2013-05-28 2016-08-09 Qualcomm Incorporated Performing spatial masking with respect to spherical harmonic coefficients
CN104282309A (zh) * 2013-07-05 2015-01-14 杜比实验室特许公司 丢包掩蔽装置和方法以及音频处理系统
EP2838086A1 (en) * 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
EP2830051A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
CN104681029B (zh) * 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
US9595269B2 (en) * 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry
EP3067886A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
JP6721977B2 (ja) * 2015-12-15 2020-07-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法
ES2768052T3 (es) * 2016-01-22 2020-06-19 Fraunhofer Ges Forschung Aparatos y procedimientos para codificar o decodificar una señal de audio multicanal usando sincronización de control de trama
US9978381B2 (en) * 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090119111A1 (en) * 2005-10-31 2009-05-07 Matsushita Electric Industrial Co., Ltd. Stereo encoding device, and stereo signal predicting method
US20130236022A1 (en) * 2010-09-28 2013-09-12 Huawei Technologies Co., Ltd. Device and method for postprocessing a decoded multi-channel audio signal or a decoded stereo signal
EP3035330A1 (en) * 2011-02-02 2016-06-22 Telefonaktiebolaget LM Ericsson (publ) Determining the inter-channel time difference of a multi-channel audio signal
KR102205596B1 (ko) * 2016-08-10 2021-01-20 후아웨이 테크놀러지 컴퍼니 리미티드 다중 채널 신호 인코딩 방법 및 인코더

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ISO/IEC JTC 1/SC 29/WG 11N9500, ISO/IEC 14496-3, MPEG-4 Audio Fourth Edition, Subpart 8: Technical description of parametric coding for high quality audio, 2009.04.21.* *
ZHOU, Cheng; HU, Ruimin; WANG, Heng. A higher-order prediction method of spatial cues based on Bayesian Gradient model. In: 2010 IEEE International Conference on Wireless Communications, Networking an *

Also Published As

Publication number Publication date
JP7091411B2 (ja) 2022-06-27
EP3493203B1 (en) 2022-07-27
US20210383815A1 (en) 2021-12-09
US20240161756A1 (en) 2024-05-16
AU2022218507A1 (en) 2022-09-08
KR102205596B1 (ko) 2021-01-20
CN107731238B (zh) 2021-07-16
JP2019527856A (ja) 2019-10-03
CA3033225A1 (en) 2018-02-15
ES2928335T3 (es) 2022-11-17
AU2020267256B2 (en) 2022-05-26
AU2017310759B2 (en) 2020-12-03
KR20190034302A (ko) 2019-04-01
KR102486604B1 (ko) 2023-01-09
US20190172474A1 (en) 2019-06-06
US11133014B2 (en) 2021-09-28
JP7443423B2 (ja) 2024-03-05
EP4120252A1 (en) 2023-01-18
KR20210008566A (ko) 2021-01-22
EP3493203A1 (en) 2019-06-05
JP6768924B2 (ja) 2020-10-14
KR102367538B1 (ko) 2022-02-24
AU2020267256A1 (en) 2020-12-10
RU2705427C1 (ru) 2019-11-07
CA3033225C (en) 2021-11-16
AU2017310759A1 (en) 2019-02-28
JP2024063059A (ja) 2024-05-10
BR112019002656A2 (pt) 2019-05-28
CN107731238A (zh) 2018-02-23
US11935548B2 (en) 2024-03-19
JP2022137052A (ja) 2022-09-21
EP3493203A4 (en) 2019-06-19
JP2021009399A (ja) 2021-01-28
WO2018028170A1 (zh) 2018-02-15
AU2022218507B2 (en) 2024-05-02

Similar Documents

Publication Publication Date Title
KR102367538B1 (ko) 다중 채널 신호 인코딩 방법 및 인코더
US11217257B2 (en) Method for encoding multi-channel signal and encoder

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant