KR20230107909A - 채널-간 위상 차이 파라미터 인코딩 방법 및 장치 - Google Patents

채널-간 위상 차이 파라미터 인코딩 방법 및 장치 Download PDF

Info

Publication number
KR20230107909A
KR20230107909A KR1020237023244A KR20237023244A KR20230107909A KR 20230107909 A KR20230107909 A KR 20230107909A KR 1020237023244 A KR1020237023244 A KR 1020237023244A KR 20237023244 A KR20237023244 A KR 20237023244A KR 20230107909 A KR20230107909 A KR 20230107909A
Authority
KR
South Korea
Prior art keywords
ipd
ipd parameter
parameter encoding
current frame
frame
Prior art date
Application number
KR1020237023244A
Other languages
English (en)
Inventor
싱타오 장
하이팅 리
쩌신 류
레이 먀오
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20230107909A publication Critical patent/KR20230107909A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Manipulation Of Pulses (AREA)

Abstract

본 출원은 IPD 파라미터 인코딩 방법을 개시하며, 그 방법은: 다채널 신호의 현재 프레임의 IPD 파라미터 인코딩 방식을 결정하는 데 사용되는 기준 파라미터를 획득하는 단계; 기준 파라미터에 기초하여 현재 프레임의 IPD 파라미터 인코딩 방식을 결정하는 단계 - 현재 프레임의 결정된 IPD 파라미터 인코딩 방식은 적어도 2개의 미리 설정된 IPD 파라미터 인코딩 방식 중 하나임 - ; 및 현재 프레임의 결정된 IPD 파라미터 인코딩 방식에 기초하여 현재 프레임의 IPD 파라미터를 처리하는 단계를 포함한다. 본 출원에서 제공되는 기술적 해결책들은 다채널 신호의 인코딩 품질을 향상시킬 수 있다.

Description

채널-간 위상 차이 파라미터 인코딩 방법 및 장치{INTER-CHANNEL PHASE DIFFERENCE PARAMETER ENCODING METHOD AND APPARATUS}
본 출원은 2017년 6월 30일자로 중국 특허청에 출원되고 발명의 명칭이 "INTER-CHANNEL PHASE DIFFERENCE PARAMETER ENCODING METHOD AND APPARATUS"인 중국 특허 출원 제201710524352.0호에 대한 우선권을 주장하며, 이는 그 전체가 본 명세서에 참고로 포함된다.
본 발명은 통신 기술 분야에 관한 것으로, 특히, 채널-간 위상 차이 파라미터 인코딩 방법 및 장치에 관한 것이다.
삶의 질이 향상됨에 따라, 고품질 오디오에 대한 요건이 계속 증가하고 있다. 모노 오디오와 비교하여, 스테레오 오디오는 각각의 음향 소스에 대한 방위감(sense of orientation) 및 분포감(sense of distribution)을 제시하고, 오디오 정보의 선명도 및 명료도를 향상시키고 오디오 재생의 존재감(sense of presence)을 향상시킬 수 있다. 따라서, 스테레오 오디오는 사람들에 의해 매우 선호된다.
파라메트릭 스테레오(Parametric Stereo, PS) 인코딩 기술은 공통 스테레오 인코딩 기술이다. PS 인코딩 기술에서는, 공간 감지 특성에 기초하여 스테레오 신호(즉, 다채널 신호)에 대해 인코딩 및 디코딩 처리가 수행된다. 구체적으로, 다채널 신호의 인코딩 및 디코딩은 모노 오디오 신호의 인코딩 및 디코딩과 공간 감지 파라미터들의 인코딩 및 디코딩으로 변환된다. PS 인코딩에서의 공간 감지 파라미터들은 채널-간 상관(Inter-channel Correlation, IC), 채널-간 레벨 차이(Inter-channel Level Difference, ILD), 채널-간 시간 차이(Inter-channel Time Difference, ITD), 채널-간 위상 차이(Inter-channel Phase Difference, IPD) 등을 포함한다. ITD 파라미터 및 IPD 파라미터는 음향 소스의 수평 배향을 나타내는 공간 감지 파라미터들이다. ILD 파라미터, ITD 파라미터, 및 IPD 파라미터는 음향 소스의 위치의 인간 귀의 감지를 결정하고, 음장 위치(sound field location)를 효과적으로 결정할 수 있고 스테레오 신호 복구에 중요하다. 따라서, IPD 파라미터와 같은 파라미터들의 결정은 스테레오 신호 복구에 중요하다.
종래 기술 1에서, 스테레오 신호의 각각의 프레임의 IPD 파라미터가 계산되는 경우, 구체적으로 시간 도메인 신호가 주파수 도메인 신호로 변환되고, 주파수 도메인 신호가 복수의 부대역으로 분할되고, 부대역들의 IPD 파라미터들이 하나씩 계산되고, 이후 모든 부대역들의 IPD 파라미터들이 양자화되어 스테레오 신호를 인코딩하는 데 사용된다. 종래 기술 1에서의 IPD 파라미터의 계산은 부대역들에 대해 하나씩 수행될 필요가 있다는 것을 알 수 있다. 결과적으로, 복수의 자원이 점유되고, 인코딩 효율이 낮다.
종래 기술 2에서, 스테레오 신호의 각각의 프레임의 IPD 파라미터가 계산될 때, 구체적으로, 시간 도메인 신호가 주파수 도메인 신호로 변환되고, 주파수 도메인 신호에 기초하여 하나의 프레임을 갖는 스테레오 신호의 IPD 파라미터가 계산된다. 프레임을 갖는 스테레오 신호의 IPD 파라미터는 그룹 채널-간 위상 차이(그룹 IPD) 파라미터이고, 그 후 그룹 IPD 파라미터는 양자화되어 스테레오 신호를 인코딩하는 데 사용된다. 종래 기술에서는, 하나의 IPD 파라미터(그룹 IPD 파라미터)만이 계산되고, 그 후 하나의 IPD 파라미터만이 양자화될 수 있다는 것을 알 수 있다. 더 적은 자원들이 점유되지만, 인코딩에 대한 위상 정보 정밀도는 낮고, 인코딩 품질은 열악하다.
본 출원은, IPD 파라미터 인코딩 방식을 선택하는 다양성을 증가시키고, 위상 정보를 더 양호하게 유지하며, 오디오 인코딩 품질을 향상시키기 위한 IPD 파라미터 인코딩 방법 및 장치를 제공한다.
본 발명의 제1 양태에 따르면, IPD 파라미터 인코딩 방법이 제공되고, 이 방법은:
다채널 신호의 현재 프레임의 IPD 파라미터 인코딩 방식을 결정하는 데 사용되는 기준 파라미터를 획득하는 단계;
기준 파라미터에 기초하여 현재 프레임의 IPD 파라미터 인코딩 방식을 결정하는 단계 - 현재 프레임의 결정된 IPD 파라미터 인코딩 방식은 적어도 2개의 미리 설정된 IPD 파라미터 인코딩 방식 중 하나임 - ; 및
현재 프레임의 결정된 IPD 파라미터 인코딩 방식에 기초하여 현재 프레임의 IPD 파라미터를 처리하는 단계를 포함한다.
IPD 파라미터가 인코딩될 때, 기준 파라미터가 획득되고, 기준 파라미터에 기초하여 현재 프레임에 대응하는 현재 프레임의 IPD 파라미터 인코딩 방식이 결정되고, 결정된 IPD 파라미터 인코딩 방식을 사용하여 현재 프레임의 IPD 파라미터가 처리되어, 현재 프레임의 IPD 파라미터가 적응적으로 처리될 수 있을 뿐만 아니라, 현재 프레임의 IPD 파라미터의 처리도 현재 프레임과 매칭되어, 다채널 신호의 인코딩 품질을 향상시킬 수 있다는 것을 알 수 있다.
제1 양태를 참조하면, 제1 양태의 제1 구현에서, 기준 파라미터는 현재 프레임의 신호 특성 파라미터 및 현재 프레임 이전의 A개의 프레임의 신호 특성 파라미터들 중 적어도 하나를 포함하고, A는 1 이상의 정수이다.
현재 프레임의 신호 특성 파라미터는 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터, 현재 프레임의 부대역 IPD 파라미터들의 분산, 현재 프레임의 신호 타입, 및 현재 프레임의 ITD 파라미터 중 적어도 하나를 포함한다.
현재 프레임 이전의 A개의 프레임의 신호 특성 파라미터들은 이전의 A개의 프레임 각각의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터, 이전의 A개의 프레임 각각의 부대역 IPD 파라미터들의 분산, 이전의 A개의 프레임 각각의 ITD 파라미터, 이전의 A개의 프레임 각각의 IPD 파라미터 인코딩 방식, 및 이전의 A개의 프레임 각각의 신호 타입 중 적어도 하나를 포함한다.
신호 타입은 음성 타입 또는 음악 타입을 포함한다.
A의 값은 1, 2, 3, 4, 5 등일 수 있다.
일부 경우들에서, 현재 프레임의 IPD 파라미터 인코딩 방식이 결정될 때, 현재 프레임의 신호 특성 파라미터가 사용될 뿐만 아니라, 현재 프레임 이전의 A개의 프레임의 신호 특성 파라미터들도 사용되어, 현재 프레임의 결정된 IPD 파라미터 인코딩 방식이 현재 프레임과 매칭될 뿐만 아니라, 현재 프레임 이전의 A개의 프레임과도 매칭되어, 인코딩 방식의 연속성을 보장하고, 인코딩 품질을 추가로 향상시킬 수 있다는 것을 알 수 있다.
제1 양태의 제1 구현을 참조하면, 제1 양태의 제2 구현에서, 기준 파라미터는 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터를 포함한다.
현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터의 값이 제1 임계값 이상이면, 현재 프레임의 IPD 파라미터 인코딩 방식은 적어도 2개의 IPD 파라미터 인코딩 방식에서의 제1 인코딩 방식이다.
제1 양태의 제2 구현을 참조하면, 제1 양태의 제3 구현에서, 제1 임계값은 0.75이다.
제1 양태의 제1 구현 내지 제3 구현 중 어느 하나를 참조하면, 제1 양태의 제4 구현에서, 기준 파라미터는 이전의 A개의 프레임 각각의 IPD 파라미터 인코딩 방식 및 이전의 A개의 프레임 각각의 신호 타입을 포함한다.
이전의 A개의 프레임 각각의 IPD 파라미터 인코딩 방식이 적어도 2개의 IPD 파라미터 인코딩 방식에서의 제1 인코딩 방식이고, 이전의 A개의 프레임 각각의 신호 타입이 음악 타입이면, 현재 프레임의 IPD 파라미터 인코딩 방식은 제1 인코딩 방식이고, A의 값은 1일 수 있다.
제1 양태의 제1 구현을 참조하면, 제1 양태의 제5 구현에서, 기준 파라미터는 현재 프레임의 ITD 파라미터, 현재 프레임의 부대역 IPD 파라미터들의 분산, 및 이전의 A개의 프레임 각각의 신호 타입을 포함한다.
현재 프레임의 ITD 파라미터의 값이 제3 임계값보다 크고, 현재 프레임의 부대역 IPD 파라미터들의 분산이 제4 임계값보다 작고, 현재 프레임 이전의 A개의 프레임 각각의 신호 타입이 음성 타입이면, 현재 프레임의 IPD 파라미터 인코딩 방식은 적어도 2개의 IPD 파라미터 인코딩 방식에서의 제1 인코딩 방식이다.
제1 양태의 제2 구현 내지 제5 구현 중 어느 하나를 참조하면, 제1 양태의 제6 구현에서, 제1 인코딩 방식은 다음의 방식들:
그룹 IPD 파라미터 인코딩 방식;
IPD 파라미터의 인코딩 스킵; 또는
IPD 파라미터의 값을 0으로 설정 중 어느 하나를 포함한다.
일부 경우들에서, 현재 프레임의 IPD 파라미터가 디코더에 송신되는지는 디코딩 효과를 향상시키지 않는다. 따라서, 제1 인코딩 방식은 IPD 파라미터의 인코딩을 스킵, IPD 파라미터의 값을 0으로 설정, 또는 그룹 ID 파라미터 인코딩 방식일 수 있다. 제1 인코딩 방식이 IPD 파라미터의 인코딩을 스킵하는 것일 때, 디코딩 효과를 향상시킬 수 있는 파라미터를 인코딩하기 위해 모든 인코딩 비트들이 사용될 수 있다. 제1 인코딩 방식이 IPD 파라미터의 값을 0으로 설정하는 것이거나, 그룹 ID 파라미터 인코딩 방식일 때, 0의 값을 갖는 IPD 파라미터 또는 그룹 ID 파라미터는 매우 적은 비트를 점유하기 때문에, 인코딩 비트들은 대안적으로 디코딩 효과를 향상시킬 수 있는 파라미터를 인코딩하기 위해 가능한 한 많이 사용되어, 인코딩 효과를 향상시킬 수 있다.
제1 양태의 제6 구현을 참조하면, 제1 양태의 제7 구현에서, 제1 인코딩 방식이 그룹 IPD 파라미터 인코딩 방식일 때, 현재 프레임의 결정된 IPD 파라미터 인코딩 방식에 기초하여 현재 프레임의 IPD 파라미터를 처리하는 것은:
현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 부대역 IPD 파라미터들을 추출하는 것;
추출된 부대역 IPD 파라미터들에 기초하여 현재 프레임의 그룹 IPD 파라미터를 결정하는 것; 및
현재 프레임의 그룹 IPD 파라미터를 인코딩하는 것을 포함한다.
제1 양태의 제2 구현 내지 제7 구현 중 어느 하나를 참조하면, 제1 양태의 제8 구현에서, 현재 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식이 아니면,
현재 프레임의 IPD 파라미터 인코딩 방식은 제2 인코딩 방식이다.
제2 인코딩 방식은 부대역 세트의 IPD 파라미터 인코딩 방식, 또는 부대역 IPD 파라미터 인코딩 방식을 포함하고, 부대역 IPD 파라미터 인코딩 방식은 현재 프레임의 일부 또는 모든 부대역들의 부대역 IPD 파라미터들을 인코딩하는 것이다.
제1 양태의 제8 구현을 참조하면, 제1 양태의 제9 구현에서, 제2 인코딩 방식은 부대역 IPD 파라미터 인코딩 방식이다.
현재 프레임의 결정된 IPD 파라미터 인코딩 방식에 기초하여 현재 프레임의 IPD 파라미터를 처리하는 것은:
현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 또는 일부 부대역들의 IPD 파라미터들을 계산하는 것; 및
계산을 통해 획득되는 모든 또는 일부 부대역들의 IPD 파라미터들을 인코딩하는 것을 포함한다.
제2 인코딩 방식이 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 일부 부대역들의 IPD 파라미터들을 인코딩하는 것일 때, 비교적 낮은 주파수에 있는, 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 일부 부대역들의 부대역 IPD 파라미터들만이 인코딩될 수 있다. 일 구현에서, 가장 높은 주파수에서의 부대역 및 두번째로 가장 높은 주파수에서의 부대역과 상이한 나머지 부대역들의 IPD 파라미터들이 인코딩될 수 있다. 가장 높은 주파수에서의 부대역 및 두번째로 가장 높은 주파수에서의 부대역과 상이한 부대역 IPD 파라미터들은 인코딩 효과를 크게 향상시키지 않기 때문에, 2개의 부대역의 부대역 IPD 파라미터들의 인코딩을 스킵하면, 인코딩 효과를 더 양호하게 향상시킬 수 있는 파라미터를 위해 인코딩 비트가 사용되는 것을 보장하여, 인코딩 품질을 추가로 향상시킬 수 있다.
제1 양태 또는 제1 양태의 제1 구현 내지 제9 구현 중 어느 하나를 참조하면, 제1 양태의 제10 구현에서, 방법은:
현재 프레임의 결정된 IPD 파라미터 인코딩 방식에 기초하여 인코딩을 수행하는 단계를 추가로 포함한다.
예를 들어, 인코딩 방식 플래그 비트가 설정될 수 있고, 플래그 비트는 현재 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식 또는 제2 인코딩 방식인지를 표시하기 위해 1 비트를 점유한다. 이러한 방식으로, 디코더가 인코딩 방식 플래그 비트에 기초하여 현재 프레임의 IPD 파라미터 인코딩 방식을 결정할 수 있어, 대응하는 디코딩 방식을 사용하여 디코딩을 수행할 수 있다.
제1 양태 또는 제1 양태의 제1 구현 내지 제10 구현 중 어느 하나를 참조하면, 제1 양태의 제11 구현에서, 현재 프레임의 결정된 IPD 파라미터 인코딩 방식에 기초하여 현재 프레임의 IPD 파라미터를 처리하기 전에, 방법은:
현재 프레임의 결정된 IPD 파라미터 인코딩 방식이 조정될 필요가 있는지를 결정하는 단계;
현재 프레임의 결정된 IPD 파라미터 인코딩 방식이 조정될 필요가 있다고 결정되면, 현재 프레임의 결정된 IPD 파라미터 인코딩 방식을 조정하는 단계를 추가로 포함한다.
현재 프레임의 결정된 IPD 파라미터 인코딩 방식에 기초하여 현재 프레임의 IPD 파라미터를 처리하는 것은:
현재 프레임의 조정된 IPD 파라미터 인코딩 방식에 기초하여 현재 프레임의 IPD 파라미터를 처리하는 것을 포함한다.
제1 양태의 제11 구현을 참조하면, 제1 양태의 제12 구현에서, 현재 프레임의 결정된 IPD 파라미터 인코딩 방식이 조정될 필요가 있는지를 결정하는 것은 현재 프레임 이전의 A개의 프레임의 IPD 파라미터 인코딩 방식들에 기초하여 수행된다.
현재 프레임의 IPD 파라미터 인코딩 방식이 현재 프레임 이전의 A개의 프레임의 IPD 파라미터 인코딩 방식들에 기초하여 결정되므로, 현재 프레임의 IPD 파라미터 인코딩 방식과 현재 프레임 이전의 A개의 프레임의 IPD 파라미터 인코딩 방식들 사이의 평활한 전이를 보장하여, 인코딩 효과의 갑작스러운 변화를 방지한다.
제1 양태의 제1 구현 내지 제12 구현 중 어느 하나를 참조하면, 제1 양태의 제13 구현에서, 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터는 다음의 계산 공식을 사용하여 획득된다:
여기서, El(b)는 오디오-좌측 채널의 에너지 합계를 나타내고, Er(b)는 오디오-우측 채널의 에너지 합계를 나타내고, Lr(k)는 오디오-좌측 채널 주파수 도메인 신호의 k번째 주파수 값의 실수부를 나타내고, Rr(k)는 오디오-우측 채널 주파수 도메인 신호의 k번째 주파수 값의 실수부를 나타내고, Li(k)는 오디오-좌측 채널 주파수 도메인 신호의 k번째 주파수 값의 허수부를 나타내고, Ri(k)는 오디오-우측 채널 주파수 도메인 신호의 k번째 주파수 값의 허수부를 나타내고, L은 부대역 스펙트럼 계수들의 수량을 나타내고, N은 부대역들의 수량을 나타내고, n은 시간 도메인 신호의 인덱스 값을 나타내고, k는 주파수 도메인 신호의 인덱스 값을 나타내고, Length는 프레임 길이를 나타내고, xL(n)은 오디오-좌측 채널 시간 도메인 신호를 나타내고, xR(n)은 오디오-우측 채널 시간 도메인 신호를 나타내고, L(k)는 IPD 파라미터를 계산하는 데 사용되는 오디오-좌측 채널 주파수 도메인 신호의 k번째 주파수 값을 나타내고, R(k)는 IPD 파라미터를 계산하는 데 사용되는 오디오-우측 채널 주파수 도메인 신호의 k번째 주파수 값을 나타내고, 여기서, xL(n) 및 xR(n)은 실수 시퀀스(sequences of real numbers)를 나타낸다.
제1 양태의 제1 구현 내지 제12 구현 중 어느 하나를 참조하면, 제1 양태의 제14 구현에서, 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터는 다음의 계산 공식을 사용하여 획득된다:
여기서, L은 부대역 스펙트럼 계수들의 수량을 나타내고, n은 시간 도메인 신호의 인덱스 값을 나타내고, k는 주파수 도메인 신호의 인덱스 값을 나타내고, Length는 프레임 길이를 나타내고, xL(n)은 오디오-좌측 채널 시간 도메인 신호를 나타내고, xR(n)은 오디오-우측 채널 시간 도메인 신호를 나타내고, 여기서, xL(n) 및 xR(n)은 실수 시퀀스를 나타낸다.
제1 양태의 제1 구현 내지 제12 구현 중 어느 하나를 참조하면, 제1 양태의 제15 구현에서, 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터는 다음의 계산 공식을 사용하여 획득된다:
L은 부대역 스펙트럼 계수들의 수량을 나타내고, n은 시간 도메인 신호의 인덱스 값을 나타내고, k는 주파수 도메인 신호의 인덱스 값을 나타내고, Length는 프레임 길이를 나타내고, xL(n)은 오디오-좌측 채널 시간 도메인 신호를 나타내고, xR(n)은 오디오-우측 채널 시간 도메인 신호를 나타내고, 여기서, xL(n) 및 xR(n)은 실수 시퀀스를 나타낸다. 는 R(k)의 켤레를 나타낸다. 구체적으로, 는 오디오-우측 채널 주파수 도메인 신호의 k번째 주파수 값의 켤레를 나타낸다.
본 발명의 제2 양태에 따르면, IPD 파라미터 인코딩 장치가 제공되고, 그 장치는:
기준 파라미터를 획득하도록 구성되는 획득 유닛 - 기준 파라미터는 다채널 신호의 현재 프레임의 IPD 파라미터 인코딩 방식을 결정하는 데 사용됨 - ;
기준 파라미터에 기초하여 현재 프레임의 IPD 파라미터 인코딩 방식을 결정하도록 구성되는 결정 유닛 - 현재 프레임의 결정된 IPD 파라미터 인코딩 방식은 적어도 2개의 미리 설정된 IPD 파라미터 인코딩 방식 중 하나임 - ; 및
현재 프레임의 결정된 IPD 파라미터 인코딩 방식에 기초하여 현재 프레임의 IPD 파라미터를 처리하도록 구성되는 처리 유닛을 포함한다.
IPD 파라미터가 인코딩될 때, 기준 파라미터가 획득되고, 기준 파라미터에 기초하여 현재 프레임에 대응하는 현재 프레임의 IPD 파라미터 인코딩 방식이 결정되고, 결정된 IPD 파라미터 인코딩 방식을 사용하여 현재 프레임의 IPD 파라미터가 처리되어, 현재 프레임의 IPD 파라미터가 적응적으로 처리될 수 있을 뿐만 아니라, 현재 프레임의 IPD 파라미터의 처리도 현재 프레임과 매칭되어, 다채널 신호의 인코딩 품질을 향상시킬 수 있다는 것을 알 수 있다.
제2 양태를 참조하면, 제2 양태의 제1 구현에서, 기준 파라미터는 현재 프레임의 신호 특성 파라미터 및 현재 프레임 이전의 A개의 프레임의 신호 특성 파라미터들 중 적어도 하나를 포함하고, A는 1 이상의 정수이다.
현재 프레임의 신호 특성 파라미터는 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터, 현재 프레임의 부대역 IPD 파라미터들의 분산, 현재 프레임의 신호 타입, 및 현재 프레임의 ITD 파라미터 중 적어도 하나를 포함한다.
현재 프레임 이전의 A개의 프레임의 신호 특성 파라미터들은 이전의 A개의 프레임 각각의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터, 이전의 A개의 프레임 각각의 부대역 IPD 파라미터들의 분산, 이전의 A개의 프레임 각각의 ITD 파라미터, 이전의 A개의 프레임 각각의 IPD 파라미터 인코딩 방식, 및 이전의 A개의 프레임 각각의 신호 타입 중 적어도 하나를 포함한다.
신호 타입은 음성 타입 또는 음악 타입을 포함한다.
일부 경우들에서, 현재 프레임의 IPD 파라미터 인코딩 방식이 결정될 때, 현재 프레임의 신호 특성 파라미터가 사용될 뿐만 아니라, 현재 프레임 이전의 A개의 프레임의 신호 특성 파라미터들도 사용되어, 현재 프레임의 결정된 IPD 파라미터 인코딩 방식이 현재 프레임과 매칭될 뿐만 아니라, 현재 프레임 이전의 A개의 프레임과도 매칭되어, 인코딩 방식의 연속성을 보장하고, 인코딩 품질을 추가로 향상시킬 수 있다는 것을 알 수 있다.
제2 양태의 제1 구현을 참조하면, 제2 양태의 제2 구현에서, 기준 파라미터는 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터를 포함한다.
현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터의 값이 제1 임계값 이상이면, 현재 프레임의 IPD 파라미터 인코딩 방식은 적어도 2개의 IPD 파라미터 인코딩 방식에서의 제1 인코딩 방식이다.
제2 양태의 제2 구현을 참조하면, 제2 양태의 제3 구현에서, 제1 임계값은 0.75이다.
제2 양태의 제1 구현을 참조하면, 제2 양태의 제4 구현에서, 기준 파라미터는 이전의 A개의 프레임 각각의 IPD 파라미터 인코딩 방식 및 이전의 A개의 프레임 각각의 신호 타입을 포함한다.
이전의 A개의 프레임 각각의 IPD 파라미터 인코딩 방식이 적어도 2개의 IPD 파라미터 인코딩 방식에서의 제1 인코딩 방식이고, 이전의 A개의 프레임 각각의 신호 타입이 음악 타입이면, 현재 프레임의 IPD 파라미터 인코딩 방식은 제1 인코딩 방식이고, A의 값은 1일 수 있다.
제2 양태의 제2 구현 내지 제4 구현 중 어느 하나를 참조하면, 제2 양태의 제5 구현에서, 기준 파라미터는 현재 프레임의 ITD 파라미터, 현재 프레임의 부대역 IPD 파라미터들의 분산, 및 이전의 A개의 프레임 각각의 신호 타입을 포함한다.
현재 프레임의 ITD 파라미터의 값이 제3 임계값보다 크고, 현재 프레임의 부대역 IPD 파라미터들의 분산이 제4 임계값보다 작고, 현재 프레임 이전의 A개의 프레임 각각의 신호 타입이 음성 타입이면, 현재 프레임의 IPD 파라미터 인코딩 방식은 적어도 2개의 IPD 파라미터 인코딩 방식에서의 제1 인코딩 방식이다.
제2 양태의 제2 구현 내지 제5 구현 중 어느 하나를 참조하면, 제2 양태의 제6 구현에서, 제1 인코딩 방식은 다음의 방식들:
그룹 IPD 파라미터 인코딩 방식;
IPD 파라미터의 인코딩 스킵; 또는
IPD 파라미터의 값을 0으로 설정 중 어느 하나를 포함한다.
일부 경우들에서, 현재 프레임의 IPD 파라미터가 디코더에 송신되는지는 디코딩 효과를 향상시키지 않는다. 따라서, 제1 인코딩 방식은 IPD 파라미터의 인코딩을 스킵, IPD 파라미터의 값을 0으로 설정, 또는 그룹 ID 파라미터 인코딩 방식일 수 있다. 제1 인코딩 방식이 IPD 파라미터의 인코딩을 스킵하는 것일 때, 디코딩 효과를 향상시킬 수 있는 파라미터를 인코딩하기 위해 모든 인코딩 비트들이 사용될 수 있다. 제1 인코딩 방식이 IPD 파라미터의 값을 0으로 설정하는 것이거나, 그룹 ID 파라미터 인코딩 방식일 때, 0의 값을 갖는 IPD 파라미터 또는 그룹 ID 파라미터는 매우 적은 비트를 점유하기 때문에, 인코딩 비트들은 대안적으로 디코딩 효과를 향상시킬 수 있는 파라미터를 인코딩하기 위해 가능한 한 많이 사용되어, 인코딩 효과를 향상시킬 수 있다.
제2 양태의 제2 구현 내지 제5 구현 중 어느 하나를 참조하면, 제2 양태의 제7 구현에서, 현재 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식이 아니면,
현재 프레임의 IPD 파라미터 인코딩 방식은 제2 인코딩 방식이다.
제2 인코딩 방식은 부대역 세트의 IPD 파라미터 인코딩 방식, 또는 부대역 IPD 파라미터 인코딩 방식을 포함하고, 부대역 IPD 파라미터 인코딩 방식은 현재 프레임의 일부 또는 모든 부대역들의 부대역 IPD 파라미터들을 인코딩하는 것이다.
제2 양태의 제7 구현을 참조하면, 제2 양태의 제8 구현에서, 제2 인코딩 방식은 부대역 IPD 파라미터 인코딩 방식이다.
현재 프레임의 결정된 IPD 파라미터 인코딩 방식에 기초하여 현재 프레임의 IPD 파라미터를 처리하는 것은:
현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 또는 일부 부대역들의 IPD 파라미터들을 계산하는 것; 및
계산을 통해 획득되는 모든 또는 일부 부대역들의 IPD 파라미터들을 인코딩하는 것을 포함한다.
제2 인코딩 방식이 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 일부 부대역들의 IPD 파라미터들을 인코딩하는 것일 때, 비교적 낮은 주파수에 있는, 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 일부 부대역들의 부대역 IPD 파라미터들만이 인코딩될 수 있다. 일 구현에서, 가장 높은 주파수에서의 부대역 및 두번째로 가장 높은 주파수에서의 부대역과 상이한 나머지 부대역들의 IPD 파라미터들이 인코딩될 수 있다. 가장 높은 주파수에서의 부대역 및 두번째로 가장 높은 주파수에서의 부대역과 상이한 부대역 IPD 파라미터들은 인코딩 효과를 크게 향상시키지 않기 때문에, 2개의 부대역의 부대역 IPD 파라미터들의 인코딩을 스킵하면, 인코딩 효과를 더 양호하게 향상시킬 수 있는 파라미터를 위해 인코딩 비트가 사용되는 것을 보장하여, 인코딩 품질을 추가로 향상시킬 수 있다.
제2 양태 또는 제2 양태의 제1 구현 내지 제8 구현 중 어느 하나를 참조하면, 제2 양태의 제9 구현에서, 그 장치는:
현재 프레임의 결정된 IPD 파라미터 인코딩 방식에 기초하여 인코딩을 수행하도록 구성되는 인코딩 유닛을 추가로 포함한다.
예를 들어, 인코딩 방식 플래그 비트가 설정될 수 있고, 플래그 비트는 현재 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식 또는 제2 인코딩 방식인지를 표시하기 위해 1 비트를 점유한다. 이러한 방식으로, 디코더가 인코딩 방식 플래그 비트에 기초하여 현재 프레임의 IPD 파라미터 인코딩 방식을 결정할 수 있어, 대응하는 디코딩 방식을 사용하여 디코딩을 수행할 수 있다.
제2 양태 또는 제2 양태의 제1 구현 내지 제9 구현 중 어느 하나를 참조하면, 제2 양태의 제10 구현에서, 결정 유닛은 결정 유닛에 의해 결정되는 현재 프레임의 IPD 파라미터 인코딩 방식이 조정될 필요가 있는지를 결정하도록 추가로 구성된다.
그 장치는:
결정 유닛이 현재 프레임의 결정된 IPD 파라미터 인코딩 방식이 조정될 필요가 있다고 결정하면, 현재 프레임의 결정된 IPD 파라미터 인코딩 방식을 조정하도록 구성되는 조정 유닛을 추가로 포함하고;
상기 처리 유닛은 현재 프레임의 조정된 IPD 파라미터 인코딩 방식에 기초하여 현재 프레임의 IPD 파라미터를 처리하도록 추가로 구성된다.
제2 양태의 제10 구현을 참조하면, 제2 양태의 제11 구현에서, 현재 프레임의 결정된 IPD 파라미터 인코딩 방식이 조정될 필요가 있는지를 결정하는 것은 현재 프레임 이전의 A개의 프레임의 IPD 파라미터 인코딩 방식들에 기초하여 수행된다.
현재 프레임의 IPD 파라미터 인코딩 방식이 현재 프레임 이전의 A개의 프레임의 IPD 파라미터 인코딩 방식들에 기초하여 결정되므로, 현재 프레임의 IPD 파라미터 인코딩 방식과 현재 프레임 이전의 A개의 프레임의 IPD 파라미터 인코딩 방식들 사이의 평활한 전이를 보장하여, 인코딩 효과의 갑작스러운 변화를 방지한다.
제2 양태 또는 제2 양태의 제1 구현 내지 제11 구현 중 어느 하나를 참조하면, 제2 양태의 제12 구현에서, 획득 유닛은 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터를 다음의 계산 공식을 사용하여 획득하도록 구체적으로 구성된다:
El(b)는 오디오-좌측 채널의 에너지 합계를 나타내고, Er(b)는 오디오-우측 채널의 에너지 합계를 나타내고, Lr(k)는 오디오-좌측 채널 주파수 도메인 신호의 k번째 주파수 값의 실수부를 나타내고, Rr(k)는 오디오-우측 채널 주파수 도메인 신호의 k번째 주파수 값의 실수부를 나타내고, Li(k)는 오디오-좌측 채널 주파수 도메인 신호의 k번째 주파수 값의 허수부를 나타내고, Ri(k)는 오디오-우측 채널 주파수 도메인 신호의 k번째 주파수 값의 허수부를 나타내고, L은 부대역 스펙트럼 계수들의 수량을 나타내고, N은 부대역들의 수량을 나타내고, n은 시간 도메인 신호의 인덱스 값을 나타내고, k는 주파수 도메인 신호의 인덱스 값을 나타내고, Length는 프레임 길이를 나타내고, xL(n)은 오디오-좌측 채널 시간 도메인 신호를 나타내고, xR(n)은 오디오-우측 채널 시간 도메인 신호를 나타내고, L(k)는 IPD 파라미터를 계산하는 데 사용되는 오디오-좌측 채널 주파수 도메인 신호의 k번째 주파수 값을 나타내고, R(k)는 IPD 파라미터를 계산하는 데 사용되는 오디오-우측 채널 주파수 도메인 신호의 k번째 주파수 값을 나타내고, 여기서, xL(n) 및 xR(n)은 실수 시퀀스를 나타낸다.
제1 양태의 제1 구현 내지 제11 구현 중 어느 하나를 참조하면, 제1 양태의 제13 구현에서, 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터는 다음의 계산 공식을 사용하여 획득된다:
L은 부대역 스펙트럼 계수들의 수량을 나타내고, n은 시간 도메인 신호의 인덱스 값을 나타내고, k는 주파수 도메인 신호의 인덱스 값을 나타내고, Length는 프레임 길이를 나타내고, xL(n)은 오디오-좌측 채널 시간 도메인 신호를 나타내고, xR(n)은 오디오-우측 채널 시간 도메인 신호를 나타내고, 여기서, xL(n) 및 xR(n)은 실수 시퀀스를 나타낸다.
제1 양태의 제1 구현 내지 제11 구현 중 어느 하나를 참조하면, 제1 양태의 제14 구현에서, 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터는 다음의 계산 공식을 사용하여 획득된다:
L은 부대역 스펙트럼 계수들의 수량을 나타내고, n은 시간 도메인 신호의 인덱스 값을 나타내고, k는 주파수 도메인 신호의 인덱스 값을 나타내고, Length는 프레임 길이를 나타내고, xL(n)은 오디오-좌측 채널 시간 도메인 신호를 나타내고, xR(n)은 오디오-우측 채널 시간 도메인 신호를 나타내고, 여기서, xL(n) 및 xR(n)은 실수 시퀀스를 나타낸다. 는 R(k)의 켤레를 나타낸다. 구체적으로, 는 오디오-우측 채널 주파수 도메인 신호의 k번째 주파수 값의 켤레를 나타낸다.
본 발명의 제3 양태에 따르면, 단말이 제공되고 메모리 및 프로세서를 포함한다.
메모리는 실행가능 코드의 그룹을 저장하도록 구성된다.
프로세서는 메모리에 저장된 실행가능 코드를 실행하여 제1 양태 또는 제1 양태의 제1 구현 내지 제13 구현 중 어느 하나를 수행하도록 구성된다.
본 발명의 제4 양태는 저장 매체를 제공한다. 저장 매체는 실행가능 코드를 저장한다. 실행가능 코드가 실행될 때, 제1 양태 또는 제1 양태의 제1 구현 내지 제13 구현 중 어느 하나가 수행될 수 있다.
본 발명의 제5 양태에 따르면, 컴퓨터 프로그램이 제공된다. 컴퓨터 프로그램은 제1 양태 또는 제1 양태의 제1 구현 내지 제13 구현 중 어느 하나를 수행할 수 있다.
본 발명의 실시예들에서는, IPD 파라미터가 인코딩될 때, 기준 파라미터가 획득되고, 기준 파라미터에 기초하여 현재 프레임에 대응하는 현재 프레임의 IPD 파라미터 인코딩 방식이 결정되고, 결정된 IPD 파라미터 인코딩 방식을 사용하여 현재 프레임의 IPD 파라미터가 처리되어, 현재 프레임의 IPD 파라미터가 적응적으로 처리될 수 있을 뿐만 아니라, 현재 프레임의 IPD 파라미터의 처리도 현재 프레임과 매칭되어, 다채널 신호의 인코딩 품질을 향상시킬 수 있다.
본 발명의 실시예들에서의 기술적 해결책들을 더욱 명확하게 설명하기 위해, 이하에서는 실시예들을 설명하기 위해 요구되는 첨부 도면들을 간단히 설명한다. 명백히, 다음의 설명에서의 첨부 도면들은 단지 본 발명의 일부 실시예들을 도시하고, 본 기술분야의 통상의 기술자는 창의적인 노력들 없이도 이러한 첨부 도면들로부터 다른 도면들을 도출할 수 있다.
도 1은 PS 인코딩의 개략적인 원리도이다.
도 2는 PS 디코딩의 개략적인 원리도이다.
도 3은 본 발명의 실시예에 따른 본 발명의 해결책의 응용 시나리오의 개략도이다.
도 4는 본 발명의 실시예에 따른 본 발명의 해결책의 다른 응용 시나리오의 개략도이다.
도 5는 본 발명의 실시예에 따른 IPD 파라미터 인코딩 방법의 개략적인 흐름도이다.
도 6은 본 발명의 실시예에 따른 IPD 파라미터 인코딩 방법의 다른 개략적인 흐름도이다.
도 7은 본 발명의 실시예에 따른 IPD 파라미터 인코딩 방법의 다른 개략적인 흐름도이다.
도 8은 본 발명의 실시예에 따른 IPD 파라미터 인코딩 장치의 개략적인 구조도이다.
도 9는 본 발명의 다른 실시예에 따른 IPD 파라미터 인코딩 장치의 개략적인 구조도이다.
이하에서는 본 발명의 실시예들에서의 첨부 도면들을 참조하여 본 발명의 실시예들에서의 기술적 해결책들을 분명히 설명한다. 명백하게도, 설명된 실시예들은 본 발명의 실시예들 전부가 아닌 일부일 뿐이다. 본 기술분야의 통상의 기술자가 창의적 노력 없이 본 발명의 실시예들에 기초하여 얻어내는 모든 다른 실시예들은 본 발명의 보호 범위 내에 있어야 한다.
도 1은 PS 인코딩의 개략적인 원리도이다.
PS 인코딩에서, 인코더는 다채널(예를 들어, x1 채널 및 x2 채널)로부터 입력된 스테레오 신호를 모노 오디오 신호로 다운믹싱(downmix)하고, 공간 감지 파라미터 분석(spatial perception parameter analysis)을 통해 스테레오 신호의 공간 감지 파라미터들을 추출하고, 모노 오디오 신호 인코딩을 통해 모노 오디오 비트스트림을 획득하고, 공간 감지 파라미터 인코딩을 통해 공간 감지 파라미터 비트스트림을 획득한다. 또한, 인코더는 모노 오디오 비트스트림 및 공간 감지 파라미터 비트스트림에 대해 비트스트림 멀티플렉싱(bitstream multiplexing)을 수행하여 스테레오 신호 인코딩을 위한 비트스트림을 획득한다.
도 2는 PS 디코딩의 개략적인 원리도이다.
디코더는 스테레오 신호 인코딩을 위한 비트스트림에 대해 비트스트림 디멀티플렉싱(bitstream demultiplexing)을 수행하여 모노 오디오 비트스트림 및 공간 감지 파라미터 비트스트림을 획득하고, 모노 오디오 비트스트림에 대해 모노 오디오 신호 디코딩을 수행하고, 공간 감지 파라미터 비트스트림에 대해 공간 감지 파라미터 디코딩을 수행한다. 또한, 모노 오디오 신호를 디코딩한 후에, 디코더는 공간 감지 파라미터들을 사용하여 재구성된 스테레오 신호를 합성한다.
특정 구현에서, 전술한 PS 인코딩 및 PS 디코딩에서의 공간 감지 파라미터들은 IC, ILD, ITD, 및 IPD와 같은 파라미터들을 포함한다. IC는 채널-간 상관 또는 상관을 설명한다. 이 파라미터는 음장 범위(sound field range)의 감지를 결정하고, 오디오 신호의 공간 감각 및 사운드 안정성을 향상시킬 수 있다. ILD 파라미터는 스테레오 소스들의 수평 방향 각도들 사이를 구별하는 데 사용되고 채널-간 강도 차이를 설명한다. 이 파라미터는 전체 스펙트럼의 주파수 성분들에 영향을 미친다. ITD 파라미터 및 IPD 파라미터는 음향 소스의 수평 배향을 나타내는 공간 감지 파라미터들이다. ILD 파라미터, ITD 파라미터, 및 IPD 파라미터는 음원의 위치에 대한 인간의 귀의 감지를 결정하고, 음장 위치를 효과적으로 결정할 수 있으며 스테레오 신호 복구에 중요하다. 따라서, IPD 파라미터와 같은 파라미터들의 결정은 스테레오 신호 복구에 중요하다.
본 발명의 해결책의 응용 시나리오가 도 3에 도시되어 있다. 수집된 다채널 신호를 인코딩(IPD 파라미터 인코딩을 포함함)한 후에, 단말(301)이 인코딩을 통해 획득된 코드 스트림을 무선 액세스 네트워크(RAN: Radio Access Network)(302)에 전송하고, 예를 들어, 코드 스트림을 RAN(302) 내의 기지국(3021)에 직접 전송할 수 있다. 기지국(3021)을 통과한 후, 코드 스트림은 패킷 데이터 네트워크 게이트웨이(Packet Data Network Gateway, PGW)(3022)에 송신된다. PGW(3022)를 통과한 후, 코드 스트림은 코어 네트워크(303)에 송신되고, 구체적으로, 코드 스트림은 코어 네트워크(303) 내의 세션 경계 제어기(SBC: Session Border Controller)(3031)를 통과할 수 있다. 코어 네트워크(303)를 통과한 코드 스트림은 RAN(304)에 진입한다. RAN(304)은 PGW(3042) 및 기지국(3041)을 포함한다. 코드 스트림이 PGW(3042)를 통과하여 기지국(3041)에 도달한 후에, 기지국(3041)은 코드 스트림을 단말(305)에 전송하고, 단말(305)은 코드 스트림을 디코딩하고 디코딩을 통해 획득된 다채널 신호를 재생한다.
전술한 설명에서, RAN은 단지 2개의 네트워크 요소(기지국 및 PGW)의 예를 포함한다는 점에 유의해야 한다. 실제 구현 동안, RAN은 복수의 다른 네트워크 요소를 추가로 포함한다. 설명을 용이하게 하기 위해, 본 발명의 실시예들에서는 다른 네트워크 요소가 생략된다. 유사하게, 코어 네트워크는 또한 단지 SBC의 예를 포함한다. 설명을 용이하게 하기 위해, 본 발명의 실시예들에서는 다른 네트워크 요소가 생략된다. 전술한 네트워크에서의 네트워크 요소들은 단지 예들이고, 네트워크 요소들의 이름들은 상이한 네트워크들에서 상이할 수 있다는 점이 이해될 수 있다. 예를 들어, PGW는 LTE 네트워크에서 진화된 패킷 데이터 게이트웨이(ePDG: Evolved Packet Data Gateway)로 지칭된다. 유사하게, 네트워크가 진화함에 따라 전술한 네트워크 요소들 사이의 접속 방식도 또한 변화할 수 있다. 따라서, 본 발명의 실시예들에서, 본 발명의 응용 시나리오는 전술한 예들로 제한되지 않는다.
단말(301) 및 단말(305)은 셀룰러 네트워크 액세스 능력을 갖는 단말들이고, 웨어러블 디바이스, 가상 현실(VR: Virtual Reality) 디바이스, 증강 현실(AR: Augmented Reality) 디바이스, 모바일 폰, 태블릿 컴퓨터(패드), 노트북 컴퓨터(NB: Notebook Computer), 퍼스널 컴퓨터(PC: Personal Computer) 등일 수 있다.
본 발명의 해결책의 다른 응용 시나리오가 도 4에 도시되어 있다. 수집된 다채널 신호를 인코딩(IPD 파라미터 인코딩을 포함함)한 후에, 단말(401)이 인코딩을 통해 획득된 코드 스트림을 인터넷(402)을 통해 단말(403)에 전송한다. 단말(403)은 코드 스트림을 디코딩하고 디코딩을 통해 획득된 다채널 신호를 재생한다.
단말(401) 및 단말(403)은 인터넷 액세스 능력을 갖는 단말들이고, 웨어러블 디바이스들, VR 디바이스들, AR 디바이스들, 모바일 폰들, 패드들, NB들, PC들 등일 수 있다.
도 5는 본 발명의 실시예에 따른 IPD 파라미터 인코딩 방법의 개략적인 흐름도이다. 그 방법은 다음의 단계들을 포함한다.
S501. 다채널 신호의 현재 프레임의 IPD 파라미터 인코딩 방식을 결정하는 데 사용되는 기준 파라미터를 획득한다.
특정 구현 동안, 본 발명의 이 실시예에서 제공되는 IPD 파라미터 인코딩 방법은 다채널 신호를 인코딩할 수 있는 인코더에 의해 수행될 수 있다. 본 발명의 이 실시예에서 제공되는 IPD 파라미터 인코딩 방법을 사용하여 현재 프레임의 IPD 파라미터를 인코딩한 후에, 인코더는 인코딩된 IPD 파라미터를 송신한다. 디코더는, 스테레오 합성 처리를 위해, 디코딩을 통해 획득된 IPD 파라미터를 사용한다. 이하에서는 본 발명의 이 실시예에서 제공되는 IPD 파라미터 인코딩 방법을 상세히 설명한다. 본 발명의 이 실시예에서의 인코더 및 디코더는 단지 기능의 관점에서 설명되고, 인코더 및 디코더의 실제 형태들은 전술한 단말들일 수 있다는 점에 유의해야 한다. 호출 프로세스에서, 단말은 인코더와 디코더 둘 다의 기능을 가질 수 있다는 점이 이해될 수 있다. 설명을 용이하게 하기 위해, 다채널 신호의 현재 프레임이 후속하여 설명될 때 현재 프레임이 직접 사용된다. 본 발명의 이 실시예에서의 다채널 신호는 구체적으로 듀얼-채널 신호, 3-채널 신호, 4-채널 신호 등일 수 있다. 다채널 신호에 대응하는 채널들의 특정 수량은 본 발명의 이 실시예에서 제한되지 않는다.
일부 실현가능한 구현들에서, 현재 프레임의 IPD 파라미터를 인코딩할 때, 인코더는 먼저 현재 프레임의 IPD 파라미터 인코딩 방식을 결정하는 데 사용되는 기준 파라미터를 획득하고, 그 후에 기준 파라미터에 기초하여 현재 프레임의 IPD 파라미터 인코딩 방식을 결정할 수 있다. 즉, 기준 파라미터는 현재 프레임의 IPD 파라미터 인코딩 방식을 결정하는 데 사용된다. 기준 파라미터는 대안적으로 현재 프레임의 다른 파라미터에 대한 인코딩 방식을 결정하는 데 사용될 수 있다는 점이 이해될 수 있다. 본 발명의 이 실시예에서, 기준 파라미터는 IPD 파라미터 인코딩 방식을 결정하는 데 사용되는 것으로 제한되지 않는다. 특정 구현 동안, 기준 파라미터는 현재 프레임의 신호 특성 파라미터 및 현재 프레임 이전의 A개의 프레임의 신호 특성 파라미터들 중 적어도 하나를 포함할 수 있다. 구체적으로, 기준 파라미터는 현재 프레임의 신호 특성 파라미터, 현재 프레임 이전의 A개의 프레임의 신호 특성 파라미터들, 현재 프레임의 신호 특성 파라미터와 현재 프레임 이전의 A개의 프레임의 신호 특성 파라미터들 등을 포함할 수 있고, 실제 응용 시나리오에 기초하여 구체적으로 결정될 수 있다. 이것은 여기서 제한되지 않는다. 여기서, A는 1 이상의 정수이다. 구체적으로, 현재 프레임 이전의 A개의 프레임은 현재 프레임 이전의 1개의 프레임, 2개의 프레임, 3개의 프레임 등일 수 있다. 이것은 여기서 제한되지 않는다. 현재 프레임 이전의 프레임 및 현재 프레임은 시간 시퀀스에서 연속적이다. 현재 프레임 이전의 2개의 프레임은 시간 시퀀스에서 연속적이고 현재 프레임 이전의 프레임을 포함한다. 현재 프레임 이전의 3개의 프레임은 시간 시퀀스에서 연속적이고 현재 프레임 이전의 2개의 프레임을 포함한다.
특정 구현 동안, 현재 프레임의 신호 특성 파라미터는 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터, 현재 프레임의 부대역 IPD 파라미터들의 분산, 현재 프레임의 신호 타입, 및 현재 프레임의 ITD 파라미터와 같은 파라미터들 중 하나 이상을 포함할 수 있다. 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터, 및 현재 프레임의 부대역 IPD 파라미터들의 분산은 다채널 신호의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호에 기초한 계산을 통해 획득될 수 있다. 현재 프레임의 ITD 파라미터는 현재 프레임의 다채널 신호의 ITD 파라미터를 추출하는 방식에 기초하여 결정될 수 있다. 현재 프레임의 ITD 파라미터를 추출하는 방식은 표준 프로토콜에서 제공되는 추출 방식 또는 본 기술분야의 통상의 기술자에게 알려진 추출 방식을 포함할 수 있다. 이것은 여기서 제한되지 않는다.
현재 프레임 이전의 A개의 프레임의 신호 특성 파라미터들은, 현재 프레임 이전의 A개의 프레임 각각의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터, 현재 프레임 이전의 A개의 프레임 각각의 부대역 IPD 파라미터들의 분산, 현재 프레임 이전의 A개의 프레임 각각의 ITD 파라미터, 현재 프레임 이전의 A개의 프레임 각각의 IPD 파라미터 인코딩 방식, 및 현재 프레임 이전의 A개의 프레임 각각의 신호 타입과 같은 파라미터들 중 하나 이상을 포함한다. 특정 파라미터 또는 특정 파라미터들의 선택은 실제 응용 시나리오에 기초하여 결정될 수 있다. 이것은 여기서 제한되지 않는다. 현재 프레임 이전의 A개의 프레임 각각의 IPD 파라미터 인코딩 방식은 캐시 또는 메모리에 저장될 수 있다. 신호 타입은 음성 타입 또는 음악 타입을 포함할 수 있다. 현재 프레임 이전의 A개의 프레임의 신호 특성 파라미터들은 캐시에 저장될 수 있다. 현재 프레임의 신호 특성 파라미터가 획득된 후에, 현재 프레임의 신호 특성 파라미터는 또한 다음 프레임의 IPD 파라미터 인코딩 방식을 결정하기 위해 캐시에 저장된다는 것을 이해할 수 있다.
일부 실현가능한 구현들에서, 인코더는 현재 프레임의 다채널 신호의 좌측 채널 및 우측 채널 시간 도메인 신호들에 대해 시간-주파수 변환을 수행하여 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호를 획득할 수 있다. 구체적으로, 전술한 시간-주파수 변환은 고속 푸리에 변환(Fast Fourier Transformation, FFT) 또는 수정된 이산 코사인 변환(Modified Discrete Cosine Transform, MDCT)과 같은 구현을 사용하여 구현될 수 있다. 이것은 여기서 제한되지 않는다. 현재 프레임의 다채널 신호의 좌측 채널 및 우측 채널 시간 도메인 신호들에 대해 수행되는 시간-주파수 변환은 프레임의 형태로 또는 서브프레임의 형태로 수행될 수 있다. 1개의 프레임은 보통 4개의 서브프레임, 2개의 서브프레임, 또는 8개의 서브프레임을 포함할 수 있다. 서브프레임들의 특정 수량은 특정 상황에 기초하여 결정될 수 있다.
예를 들어, 구현에서, 인코더가 FFT를 통해 현재 프레임의 다채널 신호의 좌측 채널 및 우측 채널 시간 도메인 신호들을 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호로 변환할 때, 다음의 변환 공식들이 구체적으로 사용될 수 있다:
여기서, n은 시간 도메인 신호의 인덱스 값을 나타내고, k는 주파수 도메인 신호의 인덱스 값을 나타내고, Length는 프레임 길이를 나타내고, M은 시간 도메인 신호를 주파수 도메인 신호로 변환하기 위한 시간-주파수 변환 길이를 나타내고, xL(n)은 오디오-좌측 채널 시간 도메인 신호를 나타내고, xR(n)은 오디오-우측 채널 시간 도메인 신호를 나타내고, L(k)는 IPD 파라미터를 계산하는 데 사용되는 오디오-좌측 채널 주파수 도메인 신호의 k번째 주파수 값을 나타내고, R(k)는 IPD 파라미터를 계산하는 데 사용되는 오디오-우측 채널 주파수 도메인 신호의 k번째 주파수 값을 나타내고, 여기서, xL(n) 및 xR(n)은 실수 시퀀스를 나타낸다.
실수 시퀀스 x(n)(xL(n) 및 xR(n)을 포함함)의 푸리에 변환 계수 X(k)는 복소수이고, 실수 시퀀스 x(n)의 실수부는 짝수 대칭(even symmetry)이고 허수부는 홀수 대칭(odd symmetry)을 갖는다. 구체적으로, X(k)는 켤레 대칭(conjugate symmetry)을 갖는다. X(0)과 X(N/2) 둘 다는 실수들이고 다음의 관계 공식을 충족한다:
, 여기서, 이다.
이산 푸리에 변환이 수행될 때, 이러한 켤레 대칭을 사용함으로써, 인코더는 X(k), , 및 X(0) 및 X(L/2)의 허수부들을 계산하고 저장할 필요가 없으며, X(0) 내지 X(L/2)만을 계산할 필요가 있어, 인코더의 계산 자원 및 저장 자원의 점유를 감소시킬 수 있다.
현재 프레임의 좌측 채널 및 우측 채널 시간 도메인 신호들을 프레임 또는 서브프레임의 형태로 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호로 변환한 후에, 인코더는, 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호에 기초하여, 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터를 계산할 수 있다.
일 구현에서, 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터는 다음의 계산 공식을 사용하여 계산을 통해 획득될 수 있다:
El(b)는 오디오-좌측 채널의 에너지 합계를 나타내고, Er(b)는 오디오-우측 채널의 에너지 합계를 나타내고, Lr(k)는 오디오-좌측 채널 주파수 도메인 신호의 k번째 주파수 값의 실수부를 나타내고, Rr(k)는 오디오-우측 채널 주파수 도메인 신호의 k번째 주파수 값의 실수부를 나타내고, Li(k)는 오디오-좌측 채널 주파수 도메인 신호의 k번째 주파수 값의 허수부를 나타내고, Ri(k)는 오디오-우측 채널 주파수 도메인 신호의 k번째 주파수 값의 허수부를 나타내고, L은 부대역 스펙트럼 계수들의 수량을 나타내고, N은 부대역들의 수량을 나타낸다.
다른 구현에서, 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터는 다음의 계산 공식을 사용하여 계산을 통해 획득될 수 있다:
다른 구현에서, 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터는 다음의 계산 공식을 사용하여 계산을 통해 획득될 수 있다:
여기서, 는 R(k)의 켤레를 나타낸다. 구체적으로, 는 오디오-우측 채널 주파수 도메인 신호의 k번째 주파수 값의 켤레를 나타낸다.
일부 실현가능한 구현들에서, 현재 프레임의 좌측 채널 및 우측 채널 시간 도메인 신호들을 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호로 변환한 후에, 인코더는 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호에 기초하여 현재 프레임의 부대역 IPD 파라미터들의 분산을 추가로 계산할 수 있다. 구체적으로, 인코더는 먼저 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호를 적어도 2개의 부대역(즉, 복수의 부대역)으로 분할할 수 있다. 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호는 Nsubband개의 부대역으로 분할되고, 여기서 Nsubband는 2보다 큰 정수이다. 그 후, 인코더는 분할을 통해 획득된 Nsubband개의 부대역의 주파수 도메인 신호들에 기초하여 모든 부대역들의 IPD 파라미터들을 계산하고, 계산을 통해 획득된 Nsubband개의 부대역의 IPD 파라미터들에 기초하여 현재 프레임의 부대역 IPD 파라미터들의 분산을 계산할 수 있다.
일 구현에서, 인코더는 구체적으로 다음의 계산 공식을 사용하여 부대역 IPD 파라미터를 계산할 수 있다:
여기서, b는 부대역의 인덱스 값을 나타내고, 부대역 b에 포함된 주파수는 이다.
일 구현에서, 인코더는 다음의 계산 공식을 사용하여 부대역 IPD 파라미터들의 분산을 계산할 수 있다:
본 발명의 다른 구현에서, 부대역 IPD 파라미터는 다음의 계산 공식을 사용하여 계산을 통해 획득될 수 있다:
여기서, atan2는 아크탄젠트 함수(arctan function)를 나타낸다.
실제 응용 동안, 부대역 IPD 파라미터는 대안적으로 다른 방식으로 계산을 통해 획득될 수 있다는 점이 이해될 수 있다. 부대역 IPD 파라미터의 특정 계산 방식은 본 발명의 이 실시예에서 제한되지 않는다.
S502. 획득된 기준 파라미터에 기초하여 현재 프레임의 IPD 파라미터 인코딩 방식을 결정한다.
특정 구현 동안, 인코더는, 획득된 기준 파라미터에 기초하여, 복수의 미리 설정된 IPD 파라미터 인코딩 방식 중 하나를 현재 프레임의 IPD 파라미터 인코딩 방식으로서 적응적으로 선택할 수 있다.
복수의 미리 설정된 IPD 파라미터 인코딩 방식은 제1 인코딩 방식 및 제2 인코딩 방식을 포함할 수 있다. 제1 인코딩 방식은 그룹 IPD 파라미터 인코딩 방식, IPD 파라미터의 인코딩 스킵, IPD 파라미터의 값을 0으로 설정 등을 포함한다. 제2 인코딩 방식은 부대역 세트의 IPD 파라미터 인코딩 방식, 부대역 IPD 파라미터 인코딩 방식 등을 포함한다. 부대역 IPD 파라미터 인코딩 방식은 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 또는 일부 부대역들의 IPD 파라미터들을 인코딩하는 것일 수 있다.
일부 구현들에서, 제1 인코딩 방식은 구체적으로: 그룹 IPD 파라미터 인코딩 방식, IPD 파라미터의 인코딩 스킵, 및 IPD 파라미터의 값을 0으로 설정 중 하나라는 것이 미리 결정될 수 있다는 것이 이해될 수 있다. 따라서, 인코더는, 인코딩 방식이 그룹 IPD 파라미터 인코딩 방식, IPD 파라미터의 인코딩 스킵, 또는 IPD 파라미터의 값을 0으로 설정이라고 직접 결정할 수 있고, 3개의 인코딩 방식으로부터 선택을 수행할 필요가 없다. 대응하여, 제2 인코딩 방식이 구체적으로 부대역 세트의 IPD 파라미터 인코딩 방식 및 부대역 IPD 파라미터 인코딩 방식 중 하나인 것이 추가로 미리 결정될 수 있다. 따라서, 인코더는, 인코딩 방식이 부대역 세트의 IPD 파라미터 인코딩 방식 또는 부대역 IPD 파라미터 인코딩 방식이라고 직접 결정할 수 있고, 2개의 인코딩 방식으로부터 선택을 수행할 필요가 없다.
일부 다른 구현들에서, 인코더는 먼저 제1 인코딩 방식 또는 제2 인코딩 방식을 결정할 수 있다. 제1 인코딩 방식을 결정할 때, 인코더는 전술한 3개의 인코딩 방식 중 하나를 선택한다. 대응하여, 제2 인코딩 방식을 결정할 때, 인코더는 전술한 2개의 제2 인코딩 방식 중 하나를 선택한다.
일부 구현들에서, 현재 프레임의 IPD 파라미터 인코딩 방식이 결정된 후에, 현재 프레임의 결정된 IPD 파라미터 인코딩 방식이 인코딩될 수 있다. 특정 인코딩 방식은 미리 설정된 파라미터를 미리 설정된 값으로서 설정하는 것일 수 있고, 상이한 값들을 사용하여 상이한 인코딩 방식들을 나타낼 수 있다. 예를 들어, 구현에서, 현재 프레임의 IPD 파라미터 인코딩 방식은 인코딩 방식 플래그 비트를 사용하여 표시될 수 있다. 플래그 비트는 1 비트를 점유할 수 있다. 이 비트의 값이 0일 때, 그것은 현재 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식임을 나타낸다. 이 비트의 값이 1일 때, 그것은 현재 프레임의 IPD 파라미터 인코딩 방식이 제2 인코딩 방식임을 나타낸다. 분명히, 이 비트의 값이 1일 때, 그것은 대안적으로 현재 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식임을 나타낼 수 있고, 이 비트의 값이 0일 때, 그것은 대안적으로 현재 프레임의 IPD 파라미터 인코딩 방식이 제2 인코딩 방식임을 나타낼 수 있다. 디코더는 플래그 비트의 값에 기초하여 IPD 파라미터 인코딩 방식을 결정하여, 대응하는 디코딩 방식을 결정할 수 있다.
S503. 현재 프레임의 결정된 IPD 파라미터 인코딩 방식에 기초하여 현재 프레임의 IPD 파라미터를 처리한다.
일부 실현가능한 구현들에서, 기준 파라미터는 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터를 포함한다. 이 경우, 현재 프레임의 IPD 파라미터 인코딩 방식이 결정될 때, 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터가 미리 정의된 제1 임계값과 비교될 수 있다. 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터의 값이 제1 임계값 이상이면, 현재 프레임의 IPD 파라미터 인코딩 방식은 제1 인코딩 방식이다. 반대로, 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터의 값이 제1 임계값 미만이면, 현재 프레임의 IPD 파라미터 인코딩 방식은 제2 인코딩 방식이다. 미리 정의된 제1 임계값의 범위는 0.6 내지 0.95이다. 예를 들어, 그 값은 구체적으로 0.89, 0.8, 0.75 등일 수 있다.
일부 실현가능한 구현들에서, 기준 파라미터는 현재 프레임의 부대역 IPD 파라미터들의 분산을 포함한다. 이 경우, 현재 프레임의 IPD 파라미터 인코딩 방식이 결정될 때, 현재 프레임의 부대역 IPD 파라미터들의 분산은 미리 정의된 제2 임계값과 비교될 수 있다. 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터의 값이 제2 임계값 미만이면, 그것은 현재 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식임을 나타낸다. 반대로, 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터의 값이 제2 임계값 이상이면, 그것은 현재 프레임의 IPD 파라미터 인코딩 방식이 제2 인코딩 방식임을 나타낸다. 미리 정의된 제2 임계값의 범위는 0.05 내지 0.5이다. 예를 들어, 그 값은 구체적으로 0.45, 0.25, 0.3 등일 수 있다.
일부 실현가능한 구현들에서, 기준 파라미터는 현재 프레임의 신호 타입을 포함한다. 예를 들어, 구현에서, 현재 프레임의 신호 타입이 음성 타입일 때, 현재 프레임의 IPD 파라미터 인코딩 방식이 제2 인코딩 방식이라고 결정될 수 있다. 현재 프레임의 신호 타입이 음악 타입일 때, 현재 프레임의 IPD 파라미터 인코딩 방식이 제1 IPD 파라미터 인코딩 방식이라고 결정될 수 있다. 일부 다른 실시예들에서, 현재 프레임의 신호 타입은 현재 프레임의 IPD 파라미터 인코딩 방식을 결정하기 위한 유일한 기준 파라미터가 아니라는 점이 이해될 수 있다. IPD 파라미터 인코딩 방식은 다른 기준 파라미터를 참조하여 추가로 결정될 수 있다.
일부 실현가능한 구현들에서, 기준 파라미터는 현재 프레임의 ITD 파라미터를 포함한다. 현재 프레임의 ITD 파라미터의 값이 미리 설정된 임계값 초과이면, 현재 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식이라고 결정된다. 그렇지 않으면, 현재 프레임의 IPD 파라미터 인코딩 방식은 제2 인코딩 방식이다. 실시예에서, 미리 설정된 임계값은 1, 2, 3, 4, 또는 5일 수 있다.
현재 프레임의 신호 특성 파라미터는 전술한 파라미터들 중 하나만을 포함할 수 있다는 점이 이해될 수 있다. 이 경우, 현재 프레임의 IPD 파라미터 인코딩 방식은, 파라미터가 대응하는 파라미터 조건을 충족하면 결정될 수 있다. 분명히, 현재 프레임의 신호 특성 파라미터는 전술한 파라미터들 중 적어도 2개를 대안적으로 포함할 수 있다. 이 경우, 현재 프레임의 IPD 파라미터 인코딩 방식은 적어도 2개의 파라미터가 각각 대응하는 파라미터 조건들을 충족할 때에만 결정될 수 있다.
일부 실현가능한 구현들에서, 기준 파라미터는 현재 프레임 이전의 A개의 프레임 각각의 IPD 파라미터 인코딩 방식 및 현재 프레임 이전의 A개의 프레임 각각의 신호 타입을 포함한다. 이 경우, 현재 프레임 이전의 A개의 프레임 각각의 IPD 파라미터 인코딩 방식이 미리 설정된 IPD 파라미터 인코딩 방식인지 및 현재 프레임 이전의 A개의 프레임 각각의 신호 타입이 미리 설정된 신호 타입인지가 결정될 수 있다. 현재 프레임 이전의 A개의 프레임 각각의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식이고, 현재 프레임의 A개의 프레임 각각의 신호 타입이 음악 타입인 경우, 현재 프레임의 IPD 파라미터 인코딩 방식은 제1 인코딩 방식으로서 결정될 수 있다.
예를 들어, A=1일 때, 현재 프레임 이전의 A개의 프레임은 현재 프레임 이전의 하나의 프레임이다. 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식이고, 현재 프레임 이전의 프레임의 신호 타입이 음악 타입인 경우, 현재 프레임의 IPD 파라미터 인코딩 방식은 제1 인코딩 방식으로서 결정될 수 있다. 그렇지 않으면, 현재 프레임의 IPD 파라미터 인코딩 방식은 제1 인코딩 방식, 예를 들어, 제2 인코딩 방식이 아니라고 결정된다.
A=2일 때, 현재 프레임 이전의 A개의 프레임은 현재 프레임 이전의 2개의 프레임이다. 현재 프레임 이전의 2개의 프레임의 IPD 파라미터 인코딩 방식들 둘 다가 제1 인코딩 방식들이고, 현재 프레임 이전의 2개의 프레임의 신호 타입들이 음악 타입들인 경우, 현재 프레임의 IPD 파라미터 인코딩 방식은 제1 인코딩 방식으로서 결정될 수 있다. 그렇지 않으면, 현재 프레임의 IPD 파라미터 인코딩 방식은 제1 인코딩 방식, 예를 들어, 제2 인코딩 방식이 아니라고 결정된다.
일부 실현가능한 구현들에서, 기준 파라미터는 현재 프레임의 ITD 파라미터, 현재 프레임의 부대역 IPD 파라미터들의 분산, 및 현재 프레임 이전의 A개의 프레임 각각의 신호 타입을 포함한다. 이 경우, 현재 프레임의 ITD 파라미터의 절대값은 미리 정의된 제3 임계값과 비교될 수 있고, 현재 프레임의 부대역 IPD 파라미터들의 분산은 미리 정의된 제4 임계값과 비교되고, 현재 프레임 이전의 A개의 프레임 각각의 신호 타입이 음성 타입인지가 결정된다. 미리 정의된 제3 임계값의 범위는 0 내지 4일 수 있다. 예를 들어, 제3 임계값의 값은 4, 2, 0 등일 수 있다. 미리 정의된 제4 임계값의 범위는 0.05 내지 0.4일 수 있다. 제4 임계값의 값은 0.4, 0.35, 0.25, 0.05 등일 수 있다. 현재 프레임의 ITD 파라미터의 절대값이 제3 임계값보다 크고, 현재 프레임의 부대역 IPD 파라미터들의 분산이 제4 임계값보다 작고, 현재 프레임 이전의 A개의 프레임 각각의 신호 타입이 음성 타입인 경우, 현재 프레임의 IPD 파라미터 인코딩 방식은 제1 인코딩 방식으로서 결정될 수 있다. 그렇지 않으면, 현재 프레임의 IPD 파라미터 인코딩 방식은 제1 인코딩 방식, 예를 들어, 제2 인코딩 방식이 아니라고 결정된다.
현재 프레임들 이전의 A개의 프레임이 현재 프레임 이전의 프레임인 경우, 현재 프레임의 ITD 파라미터의 절대값이 제3 임계값보다 크고, 현재 프레임의 부대역 IPD 파라미터들의 분산이 제4 임계값보다 작고, 현재 프레임 이전의 프레임의 신호 타입이 음성 타입일 때, 현재 프레임의 IPD 파라미터 인코딩 방식은 제1 인코딩 방식으로서 결정될 수 있다. 현재 프레임들 이전의 A개의 프레임이 현재 프레임 이전의 2개의 프레임인 경우, 현재 프레임의 ITD 파라미터의 절대값이 제3 임계값보다 크고, 현재 프레임의 부대역 IPD 파라미터들의 분산이 제4 임계값보다 작고, 현재 프레임 이전의 2개의 프레임 각각의 신호 타입이 음성 타입일 때, 현재 프레임의 IPD 파라미터 인코딩 방식은 제1 인코딩 방식으로서 결정될 수 있다.
일부 실현가능한 구현들에서, 현재 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식이라고 결정한 후에, 인코더는 제1 인코딩 방식에 기초하여 현재 프레임의 IPD 파라미터를 처리할 수 있다. 예를 들어, 제1 인코딩 방식이 IPD 파라미터의 인코딩을 스킵하는 것이면, 어떠한 동작도 수행되지 않고, 구체적으로는, 현재 프레임의 IPD 파라미터의 인코딩에 대응하는 처리를 종료한다. 제1 인코딩 방식이 그룹 IPD 파라미터 인코딩 방식이면, 현재 프레임의 그룹 IPD 파라미터는 인코딩될 수 있다. 현재 프레임의 그룹 IPD 파라미터는 현재 프레임의 IPD 파라미터로서 사용된다. 제1 인코딩 방식이 IPD 파라미터의 값을 0으로 설정하는 것이면, 현재 프레임의 IPD 파라미터의 값은 0으로 설정될 수 있고, 이어서 0의 값을 갖는 IPD 파라미터가 후속적으로 처리된다. 예를 들어, IPD 파라미터의 값이 일부 처리 동안 입력으로서 요구된다면, 현재 프레임의 IPD 파라미터의 값이 0으로 설정된 후에, 처리의 입력으로서 0이 사용될 수 있다.
일부 구현들에서, 기준 파라미터는 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터를 포함하고, 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식 및 이전 프레임의 신호 타입을 추가로 포함할 수 있다. 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터의 값이 제1 임계값 이상이면, 현재 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식이라고 결정될 수 있다. 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터의 값이 제1 임계값 미만이고, 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식이고 이전 프레임의 신호 타입이 음악 신호 타입이면, 현재 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식이라고 또한 결정될 수 있다. 그렇지 않으면, 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터의 값이 제1 임계값 미만이고, 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식이 제2 인코딩 방식이거나 현재 프레임 이전의 프레임의 신호 타입이 음성 타입인 경우, 현재 프레임의 IPD 파라미터 인코딩 방식이 제2 인코딩 방식이라고 결정된다.
또한, 선택적인 구현에서, 현재 프레임의 IPD 파라미터 인코딩 방식이 전술한 구현을 사용하여 결정된 후에, 현재 프레임의 IPD 파라미터 인코딩 방식을 조정할지는 현재 프레임 이전의 A개의 프레임의 IPD 파라미터 인코딩 방식들에 기초하여 추가로 결정될 수 있다. 예를 들어, 현재 프레임의 IPD 파라미터 인코딩 방식을 조정할지는 현재 프레임 이전의 프레임, 2개의 프레임, 3개의 프레임, 4개의 프레임, 또는 5개의 프레임의 IPD 파라미터 인코딩 방식에 기초하여 결정될 수 있다. 가능한 구현에서, 현재 프레임의 IPD 파라미터 인코딩 방식이 이전의 A개의 프레임의 IPD 파라미터 인코딩 방식과 동일한 경우, 현재 프레임의 IPD 파라미터 인코딩 방식은 조정될 필요가 없다. 현재 프레임의 IPD 파라미터 인코딩 방식이 이전의 A개의 프레임의 IPD 파라미터 인코딩 방식과 상이한 경우, 현재 프레임의 IPD 파라미터 인코딩 방식을 조정하는 것이 고려될 수 있다. 예를 들어, 현재 프레임 이전의 프레임을 포함하여, 현재 프레임 이전의 2개의 프레임, 3개의 프레임, 4개의 프레임, 또는 5개의 프레임은 동일한 IPD 파라미터 인코딩 방식을 사용한다. 또한, 현재 프레임 이전의 2개의 프레임, 3개의 프레임, 4개의 프레임, 또는 5개의 프레임에 의해 사용되는 IPD 파라미터 인코딩 방식이 현재 프레임의 IPD 파라미터 인코딩 방식과 상이한 경우, 현재 프레임의 IPD 파라미터 인코딩 방식이 조정될 수 있다. 구체적으로, 현재 프레임의 IPD 파라미터 인코딩 방식은 이전의 A개의 프레임의 IPD 파라미터 인코딩 방식과 동일하도록 조정된다. 현재 프레임의 IPD 파라미터 인코딩 방식을 조정하는 것은, 현재 프레임의 인코딩 방식이 이전 프레임의 인코딩 방식과 어느 정도 일관되게 유지되는 것을 보장할 수 있어, 인코딩된 코드 스트림이 디코딩 동안 이전 프레임과 현재 프레임 사이의 매끄러운 전이를 보장할 수 있고, 청각적 감지가 더 양호해진다.
구체적으로, 일부 구현들에서, 인코더는 인코딩 방식이 제2 인코딩 방식일 때 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 적어도 일부 부대역들의 IPD 파라미터들을 추출할 수 있다. 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 적어도 일부 부대역들은 구체적으로 현재 프레임의 좌측 채널 주파수 도메인 신호와 우측 채널 주파수 도메인 신호의 분할을 통해 획득된 Nsubband개의 부대역의 모든 또는 일부 부대역을 포함할 수 있다. 이것은 여기서 제한되지 않는다. 특정 구현 동안, 사용자는, 다채널 신호 인코딩의 인코딩 속도 또는 인코딩 품질과 같은 인코딩 요건들에 기초하여, 현재 프레임의 그룹 IPD 파라미터를 인코딩하는 데 사용되는 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 주파수 도메인 범위가 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 전체 주파수 도메인 범위, 구체적으로, 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 부대역들의 주파수 도메인 신호들을 포함하거나, 또는 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 특정 주파수 도메인 범위, 구체적으로, 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 일부 프레임들의 주파수 도메인 신호들을 포함한다고 결정할 수 있다. 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 일부 프레임들의 주파수 도메인 신호들은 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 일부 부대역들의 주파수 도메인 신호들에 포함된다.
일부 실현가능한 구현들에서, 인코더는 먼저 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 또는 일부 부대역들의 IPD 파라미터들을 추출하지 않고, 이어서 현재 프레임의 IPD 파라미터 인코딩 방식을 결정할 수 있다. 제1 인코딩 방식이 현재 프레임의 IPD 파라미터의 인코딩을 스킵하는 것이면, 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 또는 일부 부대역들의 IPD 파라미터들은 직접 추출되지 않을 수 있다. 일부 다른 구현들에서, 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 또는 일부 부대역들 각각의 IPD 파라미터가 대안적으로 먼저 추출될 수 있고, 이어서 현재 프레임의 IPD 파라미터 인코딩 방식이 결정된다.
일부 실현가능한 구현들에서, 인코더가, 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 그룹 IPD 파라미터들을 인코딩하는 데 사용되는 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 주파수 도메인 범위가 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 전체 주파수 도메인 범위라고 결정하는 경우, 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 부대역들(구체적으로, 현재 프레임의 Nsubband개의 부대역) 각각의 IPD 파라미터가 추출될 수 있고, 모든 추출된 부대역들의 IPD 파라미터들의 평균 값이 계산될 수 있고, 이어서 모든 부대역들의 IPD 파라미터들의 획득된 평균 값이 현재 프레임의 그룹 IPD 파라미터로서 사용된다. 일 구현에서, 현재 프레임의 그룹 IPD 파라미터를 계산하기 위한 공식은 다음과 같다:
G_IPD는 현재 프레임의 그룹 IPD 파라미터를 나타내고, IPD(b)는 b번째 부대역의 IPD 파라미터를 나타낸다.
선택적으로, 일부 실현가능한 구현들에서, 인코더가, 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 그룹 IPD 파라미터들을 인코딩하는 데 사용되는 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 주파수 도메인 범위가 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 특정 주파수 도메인 범위, 예를 들어, [k1, k2], 구체적으로, (k1)번째 주파수와 (k2)번째 주파수 사이의 주파수 도메인 신호들이라고 결정하는 경우, 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 일부 부대역들(구체적으로, (k1)번째 주파수와 (k2)번째 주파수 사이의 주파수 도메인 신호들의 부대역들) 각각의 IPD 파라미터가 추출될 수 있고, 모든 추출된 부대역들의 IPD 파라미터들의 평균 값이 계산될 수 있고, 이어서 모든 부대역들의 IPD 파라미터들의 획득된 평균 값이 현재 프레임의 그룹 IPD 파라미터로서 사용된다.
특정 구현 동안, (k1)번째 주파수와 (k2)번째 주파수 사이의 주파수 도메인 신호들의 부대역들의 IPD 파라미터들 각각은 각각의 주파수의 IPD 파라미터로서 미리 정의될 수 있다. 구체적으로, 이 경우, 부대역들의 IPD 파라미터들의 계산은 각각의 주파수의 IPD 파라미터의 계산으로 대체될 수 있다. 현재 프레임의 그룹 IPD 파라미터는 각각의 주파수의 IPD 파라미터를 각각의 부대역의 IPD 파라미터로서 사용함으로써 계산된다. 미리 설정된 주파수 도메인 범위 [k1, k2]에서 각각의 주파수의 IPD 파라미터를 하나씩 계산하는 방식은 다음과 같다:
여기서, ∠은 복소수의 각도를 계산하는 것을 나타낸다. L(k)는 오디오-좌측 채널 주파수 도메인 신호의 k번째 주파수 값을 나타내고, 는 오디오-우측 채널 주파수 도메인 신호의 k번째 주파수 값의 켤레를 나타낸다.
또한, 미리 설정된 범위(현재 프레임 및 현재 프레임 이전의 A개의 프레임을 포함하는 다채널 주파수 도메인 신호의 멀티-프레임 신호) 내의 IPD(k)에 대해 통계적 처리를 수행하여 그룹 IPD 파라미터를 획득할 수 있다.
예를 들어, 특정 주파수 도메인 범위 [k1, k2]가 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 6개의 프레임 각각의 선택 범위인 경우, 6개의 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호에서의 각각의 프레임의 (k2-k1+1)번째 주파수들의 IPD 파라미터들의 평균 값이 계산될 수 있고, 계산 공식은 다음과 같다:
또한, 현재 프레임을 포함하는 6개의 연속 프레임의 IPD 파라미터들의 평균 값이 계산될 수 있고, 현재 프레임의 그룹 IPD 파라미터로서 사용된다:
은 현재 프레임의 IPD 파라미터들의 평균 값을 나타내고, 은 현재 프레임에 인접하는 이전의 프레임의 IPD 파라미터들의 평균 값을 나타내고, 은 현재 프레임에 인접하는 이전의 프레임에 인접하는 이전의 프레임의 IPD 파라미터들의 평균 값을 나타내며, 이와 같이 된다.
일부 실현가능한 구현들에서, 제2 인코딩 방식은 부대역 세트의 IPD 파라미터 인코딩 방식, 또는 부대역 IPD 파라미터 인코딩 방식일 수 있다. 예를 들어, 현재 프레임의 IPD 파라미터 인코딩 방식이 부대역 IPD 파라미터 추출 방식일 때, 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 또는 일부 부대역들 각각의 IPD 파라미터가 추출되고, 이어서 부대역의 IPD 파라미터가 임의의 양자화 방식으로 양자화된다. 이것은 구체적으로 제한되지 않는다.
도 6은 본 발명의 다른 실시예에 따른 IPD 파라미터 인코딩 방법의 절차를 설명한다. 이 실시예는, 기준 파라미터가 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터, 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식, 및 현재 프레임 이전의 프레임의 신호 타입을 포함하고, 제1 임계값의 값이 0.75이고, A의 값이 1인 예를 사용하여 설명된다. 도 6에 도시된 바와 같이, 이 실시예는 다음의 단계들을 포함한다.
S601. 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터를 획득한다.
현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터를 획득하는 특정 방식에 대해서는, 전술한 설명을 참조한다. 상세사항들은 여기서 다시 설명되지 않는다.
S602. 현재 프레임의 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터의 값이 0.75 이상인지를 결정한다. 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터의 값이 0.75 미만이면, 단계 S603으로 진행하고; 좌측 채널과 우측 채널 사이의 상관을 나타내는 파라미터의 값이 0.75 이상이면, 단계 S607로 진행한다.
S603. 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식을 획득한다.
현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식은 캐시에 저장될 수 있다. 이전 프레임의 IPD 파라미터 인코딩 방식은 IPD 파라미터의 인코딩을 스킵하는 것, 또는 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 또는 일부 부대역들의 부대역 IPD 파라미터들을 인코딩하는 것일 수 있다.
S604. 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식이 IPD 파라미터의 인코딩을 스킵하는 것인지를 결정한다. 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식이 IPD 파라미터의 인코딩을 스킵하는 것이면, 단계 S605로 진행한다. 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식이 IPD 파라미터의 인코딩을 스킵하는 것이 아니면, 단계 S608로 진행한다.
S605. 현재 프레임 이전의 프레임의 신호 타입을 획득한다.
현재 프레임 이전의 프레임의 신호 타입은 캐시에 저장될 수 있다. 이전 프레임의 신호 타입은 음악 신호 타입 또는 음성 신호 타입일 수 있다.
S606. 현재 프레임 이전의 프레임의 신호 타입이 음악 신호 타입인지를 결정한다. 현재 프레임 이전의 프레임의 신호 타입이 음악 신호 타입이면, 단계 S607로 진행하고; 현재 프레임 이전의 프레임의 신호 타입이 음악 신호 타입이 아니면, 단계 S608로 진행한다.
S607. 현재 프레임의 IPD 파라미터의 인코딩을 스킵하며, 구체적으로, 현재 프레임의 IPD 파라미터 인코딩 방식이 IPD 파라미터의 인코딩을 스킵하는 것이라고 결정한다. 현재 프레임의 처리 절차를 종료한다.
S608. 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 또는 일부 부대역들의 부대역 IPD 파라미터들을 인코딩한다. 부대역은 부대역 IPD 파라미터에 일대일 대응관계에 있다. 다시 말해서, 각각의 부대역은 대응하는 부대역 IPD 파라미터를 갖는다.
부대역 IPD 파라미터를 획득하는 특정 처리는 위에서 설명되고, 상세사항들은 여기서 다시 설명되지 않는다.
현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 일부 부대역들의 부대역 IPD 파라미터들이 인코딩될 때, 부대역들의 특정 부분의 인코딩될 부대역 IPD 파라미터들은 요건에 기초하여 설정될 수 있다. 예를 들어, 전체적으로 a개의 부대역이 존재하고, a개의 부대역의 주파수 값들은 0번째 부대역으로부터 (a-1)번째 부대역까지 점진적으로 증가한다고 가정된다. 일 실시예에서, 0번째 부대역 내지 (a-3)번째 부대역의 부대역 IPD 파라미터들만이 인코딩될 수 있다. 다시 말해서, 가장 높은 주파수 및 두번째로 가장 높은 주파수를 각각 갖는 2개의 부대역의 부대역 IPD 파라미터들은 인코딩되지 않는다. 다른 실시예에서, 제2 부대역 내지 (a-1)번째 부대역의 부대역 IPD 파라미터들만이 인코딩될 수 있다. 다시 말해서, 가장 낮은 주파수 및 두번째로 가장 낮은 주파수를 각각 갖는 2개의 부대역의 부대역 IPD 파라미터들은 인코딩되지 않는다. 분명히, 부대역들 중 임의의 2개의 부대역의 부대역 IPD 파라미터들은 대안적으로 인코딩되지 않을 수 있다. 일부 실시예들에서, 인코딩된 부대역 IPD 파라미터들에 대응하는 부대역들의 수량은 특정 요건에 기초하여 설정될 수 있다는 점이 이해될 수 있다. 예를 들어, a개의 부대역 내의 (a-1)개의 부대역의 부대역 IPD 파라미터들이 인코딩될 수 있거나, 또는 a개의 부대역 내의 (a-2)개의 부대역의 부대역 IPD 파라미터들이 인코딩될 수 있거나, 또는 a개의 부대역 내의 (a-3)개의 부대역의 부대역 IPD 파라미터들이 인코딩될 수 있거나, 또는 a개의 부대역 내의 (a-4)개의 부대역의 부대역 IPD 파라미터들이 인코딩될 수 있다.
도 6의 획득 단계들 S601, S603, 및 S605의 수행 순서가 제한되지 않는다는 점이 이해될 수 있다. 획득 단계들 S601, S603, 및 S605 중 어느 하나가 먼저 수행될 수 있거나, 획득 단계들 S601, S603, 및 S605이 동시에 수행될 수 있다. 유사하게, 결정 단계들 S602, S604, 및 S606의 수행 순서도 제한되지 않는다. 결정 단계들 S602, S604, 및 S606 중 어느 하나가 먼저 수행될 수 있거나, 결정 단계들 S602, S604, 및 S606이 동시에 수행될 수 있다.
도 7은 본 발명의 다른 실시예에 따른 IPD 파라미터 인코딩 방법의 절차를 설명한다. 이 실시예는 다음의 단계들을 포함한다.
S701. 다채널 신호의 현재 프레임의 IPD 파라미터 인코딩 방식을 결정하는 데 사용되는 기준 파라미터를 획득한다.
특정 기준 파라미터 및 기준 파라미터를 획득하는 특정 방식에 대해서는, 전술한 실시예에서의 설명을 참조한다. 상세사항들은 여기서 다시 설명되지 않는다.
S702. 획득된 파라미터에 기초하여 현재 프레임의 IPD 파라미터 인코딩 방식을 결정한다.
현재 프레임의 IPD 파라미터 인코딩 방식에 대해서는, 전술한 실시예에서의 설명을 참조한다. 상세사항들은 여기서 다시 설명되지 않는다.
S703. 현재 프레임의 IPD 파라미터 인코딩 방식이 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식과 동일한지를 결정한다. 현재 프레임의 IPD 파라미터 인코딩 방식이 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식과 동일하면, 단계 S704로 진행한다. 현재 프레임의 IPD 파라미터 인코딩 방식이 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식과 상이하면, 단계 S705로 진행한다.
S704. 카운터의 미리 설정된 값을 0으로 설정하고, 단계 S707로 진행한다.
다시 말해서, 현재 프레임의 IPD 파라미터 인코딩 방식은 조정될 필요가 없다.
S705. 카운터의 미리 설정된 값이 5 미만인지를 결정한다. 카운터의 미리 설정된 값이 5 미만이면, 단계 S706으로 진행한다. 카운터의 미리 설정된 값이 5 이상이면, 단계 S707로 진행한다.
S706. 현재 프레임의 IPD 파라미터 인코딩 방식을 조정하고, 카운터의 미리 설정된 값을 1 만큼 증가시키고, 단계 S708로 진행한다.
현재 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식일 때, 현재 프레임의 IPD 파라미터 인코딩 방식은 제2 인코딩 방식으로 조정된다. 예를 들어, 현재 프레임의 IPD 파라미터 인코딩 방식이 IPD 파라미터의 인코딩을 스킵하는 것일 때, 현재 프레임의 IPD 파라미터 인코딩 방식은 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 또는 일부 부대역들의 부대역 IPD 파라미터들을 인코딩하는 것으로 조정된다. 대안적으로, 현재 프레임의 IPD 파라미터 인코딩 방식이 제2 인코딩 방식일 때, 현재 프레임의 IPD 파라미터 인코딩 방식은 제1 인코딩 방식으로 조정된다. 예를 들어, 현재 프레임의 IPD 파라미터 인코딩 방식이 현재 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 또는 일부 부대역들의 부대역 IPD 파라미터들을 인코딩하는 것일 때, 현재 프레임의 IPD 파라미터 인코딩 방식은 IPD 파라미터의 인코딩을 스킵하는 것으로 조정된다.
S707. 현재 프레임의 결정된 IPD 파라미터 인코딩 방식을 사용하여 현재 프레임의 IPD 파라미터를 처리한다. 절차를 종료한다.
S708. 현재 프레임의 조정된 IPD 파라미터 인코딩 방식을 사용하여 현재 프레임의 IPD 파라미터를 처리한다.
본 발명의 다른 구현에서, 현재 프레임의 IPD 파라미터 인코딩 방식을 조정할지가 결정될 때, 2개의 카운터가 사용될 수 있다. 특정 처리 방식은 다음과 같다:
현재 프레임의 IPD 파라미터 인코딩 방식과 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식이 둘 다 제1 인코딩 방식일 때, 제1 카운터의 값은 0으로 설정된다. 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식이고, 현재 프레임의 IPD 파라미터 인코딩 방식이 제2 인코딩 방식이고, 제1 카운터의 값이 5 미만이면, 현재 프레임의 IPD 파라미터 인코딩 방식은 제1 인코딩 방식으로 조정되고, 제1 카운터의 값은 1 만큼 증가된다. 제1 인코딩 방식은 IPD 파라미터의 인코딩을 스킵하는 것일 수 있고, 제2 인코딩 방식은 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 또는 일부 부대역들의 부대역 IPD 파라미터들을 인코딩하는 것일 수 있다.
현재 프레임의 IPD 파라미터 인코딩 방식과 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식이 둘 다 제2 인코딩 방식일 때, 제2 카운터의 값은 0으로 설정된다. 현재 프레임 이전의 프레임의 IPD 파라미터 인코딩 방식이 제2 인코딩 방식이고, 현재 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식이고, 제2 카운터의 값이 5 미만이면, 현재 프레임의 IPD 파라미터 인코딩 방식은 제2 인코딩 방식으로 조정되고, 제2 카운터의 값은 1 만큼 증가된다. 제1 인코딩 방식은 IPD 파라미터의 인코딩을 스킵하는 것일 수 있고, 제2 인코딩 방식은 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 또는 일부 부대역들의 부대역 IPD 파라미터들을 인코딩하는 것일 수 있다.
현재 프레임의 IPD 파라미터 인코딩 방식이 조정되면, 현재 프레임의 조정된 IPD 파라미터 인코딩 방식이 캐싱된다는 점이 이해될 수 있다. 다시 말해서, 현재 프레임 이후의 프레임의 IPD 파라미터 인코딩 방식이 결정될 때, 현재 프레임의 조정된 IPD 파라미터 인코딩 방식을 참조한다.
도 8은 본 발명의 실시예에 따른 IPD 파라미터 인코딩 장치(800)의 실시예의 개략적인 구조도이다. IPD 파라미터 인코딩 장치(800)는:
기준 파라미터를 획득하도록 구성되는 획득 유닛(801) - 기준 파라미터는 다채널 신호의 현재 프레임의 IPD 파라미터 인코딩 방식을 결정하는 데 사용되고,
특정 기준 파라미터 및 기준 파라미터의 특정 획득 파라미터에 대해서는, 전술한 실시예에서의 설명을 참조할 수 있고, 상세사항들은 여기서 다시 설명되지 않음 - ;
획득 유닛(801)에 의해 획득된 기준 파라미터에 기초하여 현재 프레임의 IPD 파라미터 인코딩 방식을 결정하도록 구성되는 결정 유닛(802) - 현재 프레임의 결정된 IPD 파라미터 인코딩 방식은 적어도 2개의 미리 설정된 IPD 파라미터 인코딩 방식 중 하나이고,
현재 프레임의 IPD 파라미터 인코딩 방식을 결정하기 위해서는, 방법 실시예 부분에서의 설명을 구체적으로 참조할 수 있고, 적어도 2개의 미리 설정된 IPD 파라미터 인코딩 방식의 특정 인코딩 방식들에 대해서는, 방법 실시예 부분에서의 설명을 또한 참조할 수 있고, 상세사항들은 여기서 다시 설명되지 않음 - ; 및
결정 유닛(802)에 의해 결정되는 현재 프레임의 IPD 파라미터 인코딩 방식에 기초하여 현재 프레임의 IPD 파라미터를 처리하도록 구성되는 처리 유닛(803)을 포함한다.
특정 처리 과정에 대해서는, 방법 실시예 부분에서의 설명을 참조한다. 상세사항들은 여기서 다시 설명되지 않는다.
본 발명의 다른 실시예에서, 결정 유닛(802)은 현재 프레임의 결정된 IPD 파라미터 인코딩 방식이 조정될 필요가 있는지를 결정하도록 추가로 구성될 수 있다. 이 경우에, 도 8에 도시된 바와 같이, IPD 파라미터 인코딩 장치(800)는, 결정 유닛(802)이 현재 프레임의 결정된 IPD 파라미터 인코딩 방식이 조절될 필요가 있다고 결정할 때 현재 프레임의 결정된 IPD 파라미터 인코딩 방식을 조정하도록 구성되는 조정 유닛(804)을 추가로 포함할 수 있다. 대응하여, 처리 유닛(803)은 현재 프레임의 조정된 IPD 파라미터 인코딩 방식에 기초하여 현재 프레임의 IPD 파라미터를 처리하도록 구체적으로 구성된다. 현재 프레임의 결정된 IPD 파라미터 인코딩 방식이 조정될 필요가 있는지를 어떻게 결정하는지, 그리고 현재 프레임의 IPD 파라미터 인코딩 방식을 어떻게 조정하는지는 방법 실시예에서의 설명을 참조한다. 상세사항들은 여기서 다시 설명되지 않는다.
도 8에 도시된 바와 같이, 본 발명의 다른 실시예에서, IPD 파라미터 인코딩 장치(800)는 결정 유닛(802)에 의해 결정되는 현재 프레임의 IPD 파라미터 인코딩 방식을 인코딩하도록 구성되는 인코딩 유닛(805)을 추가로 포함할 수 있다. 예를 들어, 인코딩 방식 플래그 비트가 설정될 수 있고, 플래그 비트는 현재 프레임의 IPD 파라미터 인코딩 방식이 제1 인코딩 방식 또는 제2 인코딩 방식인지를 표시하기 위해 1 비트를 점유한다. 이러한 방식으로, 디코더가 인코딩 방식 플래그 비트에 기초하여 현재 프레임의 IPD 파라미터 인코딩 방식을 결정할 수 있어, 대응하는 디코딩 방식을 사용하여 디코딩을 수행할 수 있다. 일부 구현들에서, 인코딩 유닛(805) 및 처리 유닛(803)은 하나의 논리 유닛일 수 있다는 점이 이해될 수 있다.
도 9는 본 발명의 다른 실시예에 따른 단말의 구조를 설명한다. 단말은 웨어러블 디바이스, VR 디바이스, AR 디바이스, 모바일 폰, 패드, 노트북, PC 등일 수 있다. 도 9에 도시된 바와 같이, 본 발명의 이 실시예에서 제공되는 단말은 네트워크 인터페이스(910)(도 9의 점선 박스로 도시된 바와 같음)를 포함한다. 네트워크 인터페이스(910)는 데이터를 전송 및 수신하도록 구성된다. 예를 들어, 단말이 인코더로서 역할을 할 때, 전송된 데이터는 단말에 의해 인코딩된 다채널 신호(코드 스트림에서 운반됨)를 포함한다. IPD 파라미터가 인코딩될 때, 전송된 데이터는 IPD 파라미터를 추가로 포함한다(IPD 파라미터는 또한 코드 스트림에서 운반되고 다채널 신호의 일부로서 사용될 수 있다). 단말이 디코더로서 역할을 할 때, 수신된 데이터는 다채널 신호를 운반하는 코드 스트림을 포함한다. 인코더가 IPD 파라미터를 인코딩할 때, 수신된 데이터는 IPD 파라미터를 추가로 포함할 수 있다. 네트워크 인터페이스(910)의 구체적인 형태는 다양할 수 있고, 구체적으로 단말의 구체적인 형태 및 상이한 응용 시나리오들에 기초하여 상이할 수 있다. 도 9는 3가지 예를 도시한다. 제1 예는 무선 주파수 송수신기(RF 송수신기)(901) 및 모뎀(Modem)(902)을 포함하는 셀룰러 네트워크 액세스 모듈이다. 셀룰러 네트워크 액세스 모듈은 모바일 운영자에 의해 제공되는 모바일 통신 네트워크, 예를 들어, 2G(2nd Generation), 3G(3rd Generation), 4G(4th Generation), 구체적으로, 롱 텀 에볼루션(LTE: Long Term Evolution) 네트워크, 미래의 5G(5th Generation) 또는 6G(6th Generation) 네트워크 등에 액세스하도록 구성된다. 제2 예는 액세스 포인트(AP: Access Point)에 액세스하는 것에 의해 네트워크에 액세스하도록 구성되는 무선 충실도(WiFi: Wireless Fidelity) 모듈(903)이다. 제3 예는 트위스트 페어 케이블(twisted pair cable) 또는 광섬유를 사용하여 네트워크에 액세스하도록 구성되는 이더넷 네트워크 어댑터(904)이다. 단말은 전술한 3개의 네트워크 인터페이스 모두를 포함할 필요는 없으며, 단말이 네트워크에 액세스할 수 있도록 전술한 3개의 네트워크 인터페이스 단말 중 적어도 하나만을 포함할 수 있다는 점에 유의해야 한다. 또한, 단말에 포함된 네트워크 인터페이스는 전술한 3가지 타입 중 하나가 아닐 수 있으며, 예를 들어, 블루투스 인터페이스 또는 모뎀일 수 있다. 따라서, 네트워크 인터페이스(910)의 특정 형태는 본 발명의 이 실시예에서 제한되지 않고, 본 발명의 이 실시예의 구현은 단말이 네트워크 인터페이스(910)를 통해 네트워크에 액세스할 수 있다면 영향을 받지 않는다.
도 9에 도시된 바와 같이, 단말은 다채널 신호를 수집하도록 구성되는 마이크로폰(905)을 추가로 포함할 수 있다. 아날로그-디지털 변환기(analog-to-digital converter)가 마이크로폰(905)에 내장될 수 있다. 따라서, 마이크로폰은 아날로그 신호 형태의 수집된 다채널 신호를 디지털 신호 형태의 다채널 신호로 변환할 수 있다. 분명히, 아날로그-디지털 변환기가 대안적으로 마이크로폰(905)에 내장되지 않을 수 있다. 이 경우, 단말은 또한 마이크로폰(905)에 의해 수집된 아날로그 신호 형태의 다채널 신호에 대해 아날로그-디지털 변환(analog-to-digital conversion)을 수행하고 디지털 신호 형태의 다채널 신호를 획득하는 아날로그-디지털 변환기를 포함할 필요가 있다. 1개, 2개, 3개, 또는 그 이상의 마이크로폰(905)이 있을 수 있다. 마이크로폰(905)의 특정 수량은 본 발명의 이 실시예에서 제한되지 않는다. 단말이 대안적으로 외부 마이크로폰을 사용하여 다채널 신호를 수집할 수 있다는 점이 이해될 수 있다. 이 경우, 단말은 외부 마이크로폰의 삽입을 용이하게 하고 나서 단말과 외부 마이크로폰 사이의 데이터 교환을 구현하기 위해, 외부 마이크로폰의 적응 인터페이스를 포함할 필요가 있다.
도 9에 도시된 바와 같이, 단말은 단말에 의한 디코딩을 통해 획득된 다채널 신호를 재생(play)하도록 구성되는 라우드스피커(loudspeaker)(906)를 추가로 포함할 수 있다. 다채널 신호를 포함하고 단말에 의해 수신되는 비트스트림이 IPD 파라미터를 포함하는 경우, 이 디코딩 프로세스는 IPD 파라미터에 기초하여 수행될 수 있다. 디지털-아날로그 변환기(digital-to-analog converter)가 라우드스피커(906)에 내장될 수 있다. 다시 말해서, 단말은 디지털 신호 형태의 다채널 신호를 라우드스피커(906)에 전송할 수 있고,
라우드스피커(906)는 디지털 신호 형태의 다채널 신호에 대해 아날로그-디지털 변환을 수행하여, 디지털 신호 형태의 다채널 신호를 아날로그 신호 형태의 다채널 신호로 변환하고 재생한다. 분명히, 디지털-아날로그 변환기가 대안적으로 라우드스피커(906)에 내장되지 않을 수 있다. 이 경우, 단말은 디지털 신호 형태의 다채널 신호를 아날로그 신호 형태의 다채널 신호로 변환하는 아날로그-디지털 변환기를 포함할 필요가 있고, 아날로그 신호 형태의 다채널 신호를 재생을 위해 라우드스피커(906)에 전송한다. 1개, 2개, 3개, 또는 그 이상의 라우드스피커(906)가 있을 수 있다. 라우드스피커(906)의 수량은 본 발명의 이 실시예에서 제한되지 않는다. 단말은 대안적으로 외부 라우드스피커를 사용하여 다채널 신호를 재생할 수 있다는 점이 이해될 수 있다. 이 경우, 단말은 외부 라우드스피커의 삽입을 용이하게 하고 나서 외부 라우드스피커와의 데이터 교환을 구현하기 위해, 외부 라우드스피커의 적응 인터페이스를 포함할 필요가 있다.
도 9에 도시된 바와 같이, 단말은 프로세서(908) 및 메모리(909)를 추가로 포함한다. 메모리(909)는 프로세서에 의해 실행가능한 코드를 저장하도록 구성되고, 프로세서(908)는 메모리(909)에 저장된 코드를 실행하여 전술한 방법 실시예들에서 설명된 방법을 구현하도록 구성된다.
도 9에 도시된 바와 같이, 단말은 버스(907)를 추가로 포함한다. 네트워크 인터페이스(910), 마이크로폰(905), 라우드스피커(906), 프로세서(908), 및 메모리(909)와 같은 전술한 컴포넌트들 사이의 데이터 교환은 버스(907)를 사용하여 수행될 수 있다. 도 9는 단지 단말의 구조의 예를 설명한다는 점이 이해될 수 있다. 구조에서의 일부 접속 관계들은 단순화된다. 실제 응용 동안, 네트워크 인터페이스(910), 마이크로폰(905), 또는 라우드스피커(906)와 같은 컴포넌트들은 버스(907)에 직접 접속되지 않을 수 있다. 다시 말해서, 네트워크 인터페이스(910), 마이크로폰(905), 또는 라우드스피커(906)와 같은 컴포넌트들 사이의 데이터 교환은 추가로 다른 컴포넌트를 통과할 필요가 있을 수 있다.
일부 구현들에서, 프로세서(908) 및 메모리(909)는 데이터 교환 인터페이스를 추가로 가질 수 있다. 프로세서(908)와 메모리(909) 사이의 데이터 교환은 데이터 교환 인터페이스를 통해 직접 수행될 수 있고, 프로세서(908)와 메모리(909) 사이의 데이터 교환 효율을 향상시키기 위해 버스(907)를 통과할 필요는 없다.
일부 구현들에서, 프로세서(908) 및 메모리(909)는 디지털 신호 프로세서(DSP: Digital Signal Processor) 내의 프로세서 및 메모리일 수 있다. 즉, 프로세서(908)와 메모리(909) 둘 다는 DSP 내에 캡슐화된다. 이 경우, 프로세서(908)와 메모리(909) 사이의 데이터 교환은 DSP 내부의 데이터 교환 인터페이스를 통해 수행될 수 있다. 또한, 프로세서(908)와 메모리(909) 둘 다가 DSP 내에 캡슐화되기 때문에, 프로세서(908) 및 메모리(909)는 DSP와 버스(907) 사이의 하나의 데이터 교환 인터페이스를 통해 다른 컴포넌트와 데이터를 교환할 수 있다.
본 발명의 실시예는 컴퓨터 프로그램을 추가로 제공한다. 컴퓨터 프로그램이 실행될 때, 전술한 방법 실시예들 중 어느 하나의 절차가 실행될 수 있다.
본 발명의 실시예는 저장 매체를 추가로 제공한다. 저장 매체는 실행가능 코드를 저장하고, 실행가능 코드가 실행될 때, 전술한 방법 실시예들 중 어느 하나의 절차가 실행될 수 있다.
본 기술 분야의 통상의 기술자는, 실시예들에서의 방법의 모든 또는 일부 절차들이 관련 하드웨어에 명령하는 컴퓨터 프로그램에 의해 구현될 수 있다는 점을 이해할 수 있다. 프로그램은 컴퓨터 판독가능 저장 매체에 저장될 수 있다. 프로그램이 실행될 때, 실시예들에서의 방법의 절차들이 포함된다. 저장 매체는: 자기 디스크, 광 디스크, 판독 전용 메모리(Read-Only Memory, ROM) 또는 랜덤 액세스 메모리(Random Access Memory, RAM) 등을 포함할 수 있다.
본 발명의 명세서, 청구항들, 및 첨부 도면들에서, 용어들 "제1", "제2", "제3", "제4" 등은 상이한 객체들을 구분하려는 것이며, 특정 순서를 나타내지 않는다. 또한, 용어들 "포함하다", "갖다", 및 이들의 임의의 다른 변형은 비배타적 포함(non-exclusive inclusion)을 커버하려는 것이다. 예를 들어, 일련의 단계들 또는 유닛들을 포함하는 프로세스, 방법, 시스템, 제품, 또는 디바이스는 열거된 단계들 또는 유닛들로 제한되는 것이 아니라, 열거되지 않은 단계 또는 유닛을 선택적으로 추가로 포함하거나, 또는 프로세스, 방법, 시스템, 제품, 또는 디바이스의 다른 고유한 단계 또는 유닛을 선택적으로 추가로 포함한다.
위에서 개시된 것은 본 발명의 예시적인 실시예들일 뿐이며, 확실히 본 발명의 보호 범위를 제한하도록 의도되지 않는다. 따라서, 본 발명의 청구항들에 따라 이루어지는 균등한 변형들은 본 발명의 범위 내에 있다.

Claims (10)

  1. 채널-간 위상 차이(IPD) 파라미터 인코딩 방법으로서,
    오디오 신호의 제1 프레임의 신호 클래스를 획득하는 단계 - 상기 신호 클래스는 음악 타입이거나 음악 타입이 아님 -;
    상기 제1 프레임의 제1 IPD 파라미터 인코딩 방식을 획득하는 단계 - 상기 제1 IPD 파라미터 인코딩 방식은 제1 미리 설정된 IPD 파라미터 인코딩 방식 또는 제2 미리 설정된 IPD 파라미터 인코딩 방식 중 어느 하나임 -;
    상기 제1 IPD 파라미터 인코딩 방식에 기초하여 상기 제1 프레임의 제1 IPD 파라미터를 처리하는 단계;
    상기 제1 프레임의 신호 클래스 및 상기 제1 IPD 파라미터 인코딩 방식에 기초하여, 상기 오디오 신호의 제2 프레임의 제2 IPD 파라미터 인코딩 방식을 결정하는 단계 - 상기 제2 프레임은 시간 도메인에서 상기 제1 프레임에 후속하고,
    상기 제1 프레임의 신호 클래스가 상기 음악 클래스가 아니고, 상기 제1 IPD 파라미터 인코딩 방식이 상기 제1 미리 설정된 IPD 파라미터 인코딩 방식일 때, 상기 제2 IPD 파라미터 인코딩 방식은 상기 제2 미리 설정된 IPD 파라미터 인코딩 방식이거나; 또는
    상기 제1 프레임의 신호 클래스가 상기 음악 클래스이고, 상기 제1 IPD 파라미터 인코딩 방식이 상기 제2 미리 설정된 IPD 파라미터 인코딩 방식일 때, 상기 제2 IPD 파라미터 인코딩 방식은 상기 제2 미리 설정된 IPD 파라미터 인코딩 방식임 -; 및
    상기 제2 IPD 파라미터 인코딩 방식에 기초하여 상기 제2 프레임의 제2 IPD 파라미터를 처리하는 단계
    를 포함하는, 방법.
  2. 제1항에 있어서,
    상기 오디오 신호의 제3 프레임의 신호 클래스를 획득하는 단계- 상기 제1 프레임은 시간 도메인에서 상기 제3 프레임에 후속함 -; 및
    상기 제3 프레임의 제3 IPD 파라미터 인코딩 방식을 획득하는 단계
    를 더 포함하고,
    상기 제1 프레임의 신호 클래스 및 상기 제1 IPD 파라미터 인코딩 방식에 기초하여, 상기 오디오 신호의 제2 프레임의 제2 IPD 파라미터 인코딩 방식을 결정하는 단계는:
    상기 제1 프레임의 신호 클래스, 상기 제3 프레임의 신호 클래스, 상기 제3 IPD 파라미터 인코딩 방식 및 상기 제1 IPD 파라미터 인코딩 방식에 기초하여, 상기 제2 IPD 파라미터 인코딩 방식을 결정하는 단계
    를 포함하는, 방법.
  3. 제2항에 있어서,
    상기 제1 프레임의 신호 클래스가 상기 음악 클래스가 아니고, 상기 제3 프레임의 신호 클래스가 상기 음악 클래스이고, 상기 제3 IPD 파라미터 인코딩 방식이 상기 제1 미리 설정된 IPD 파라미터 인코딩 방식이고, 상기 제1 IPD 파라미터 인코딩 방식이 상기 제1 미리 설정된 IPD 파라미터 인코딩 방식일 때, 상기 제2 IPD 파라미터 인코딩 방식은 상기 제2 미리 설정된 IPD 파라미터 인코딩 방식이거나;
    상기 제1 프레임의 신호 클래스가 상기 음악 클래스이고, 상기 제3 프레임의 신호 클래스가 상기 음악 클래스가 아니고, 상기 제3 IPD 파라미터 인코딩 방식이 상기 제1 미리 설정된 IPD 파라미터 인코딩 방식이고, 상기 제1 IPD 파라미터 인코딩 방식이 상기 제1 미리 설정된 IPD 파라미터 인코딩 방식일 때, 상기 제2 IPD 파라미터 인코딩 방식이 상기 제2 미리 설정된 IPD 파라미터 인코딩 방식인 것으로 결정하거나;
    상기 제1 프레임의 신호 클래스가 상기 음악 클래스이고, 상기 제3 프레임의 신호 클래스가 상기 음악 클래스이고, 상기 제3 IPD 파라미터 인코딩 방식이 상기 제2 미리 설정된 IPD 파라미터 인코딩 방식이고, 상기 제1 IPD 파라미터 인코딩 방식이 상기 제1 미리 설정된 IPD 파라미터 인코딩 방식일 때, 상기 제2 IPD 파라미터 인코딩 방식이 상기 제2 미리 설정된 IPD 파라미터 인코딩 방식인 것으로 결정하거나; 또는
    상기 제1 프레임의 신호 클래스가 상기 음악 클래스이고, 상기 제3 프레임의 신호 클래스가 상기 음악 클래스이고, 상기 제3 IPD 파라미터 인코딩 방식이 상기 제1 미리 설정된 IPD 파라미터 인코딩 방식이고, 상기 제1 IPD 파라미터 인코딩 방식이 상기 제2 미리 설정된 IPD 파라미터 인코딩 방식일 때, 상기 제2 IPD 파라미터 인코딩 방식이 상기 제2 미리 설정된 IPD 파라미터 인코딩 방식인 것으로 결정하는, 방법.
  4. 제1항에 있어서,
    상기 제1 미리 설정된 IPD 파라미터 인코딩 방식은 다음의 방식들:
    그룹 IPD 파라미터 인코딩 방식;
    IPD 파라미터의 인코딩을 스킵하는 것; 또는
    IPD 파라미터의 값을 0으로 설정하는 것
    중 어느 하나를 포함하는, 방법.
  5. 제1항에 있어서,
    상기 제2 미리 설정된 IPD 파라미터 인코딩 방식은 부대역 세트의 IPD 파라미터 인코딩 방식, 또는 부대역 IPD 파라미터 인코딩 방식을 포함하고, 상기 부대역 IPD 파라미터 인코딩 방식은 현재 프레임의 일부 또는 모든 부대역들의 부대역 IPD 파라미터들을 인코딩하는 것을 나타내는, 방법.
  6. 제5항에 있어서,
    상기 제2 미리 설정된 IPD 파라미터 인코딩 방식은 상기 부대역 IPD 파라미터 인코딩 방식이고;
    상기 제2 IPD 파라미터 인코딩 방식에 기초하여 상기 제2 프레임의 IPD 파라미터를 처리하는 단계는:
    상기 제2 프레임의 좌측 채널 주파수 도메인 신호 및 우측 채널 주파수 도메인 신호의 모든 또는 일부 부대역들의 IPD 파라미터들을 계산하는 단계; 및
    계산을 통해 획득되는 모든 또는 일부 상기 부대역들의 상기 IPD 파라미터들을 인코딩하는 단계
    를 포함하는, 방법.
  7. 제1항에 있어서,
    현재 프레임의 상기 결정된 IPD 파라미터 인코딩 방식에 기초하여 인코딩을 수행하는 단계
    를 더 포함하는, 방법.
  8. 채널-간 위상 차이(IPD) 파라미터 인코딩 장치로서,
    적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서에 결합되고, 상기 인코딩 장치로 하여금 제1항 내지 제7항 중 어느 한 항의 방법을 실행하게 하기 위해 상기 적어도 하나의 프로세서에 의한 실행을 위한 프로그래밍 명령어들을 저장하는 하나 이상의 메모리
    를 포함하는, 장치.
  9. 프로그램이 기록되어 있는 컴퓨터 판독가능 저장 매체로서,
    상기 프로그램은 컴퓨터로 하여금 제1항 내지 제7항 중 어느 한 항의 방법을 실행하게 하는, 컴퓨터 판독가능 저장 매체.
  10. 컴퓨터로 하여금 제1항 내지 제7항 중 어느 한 항의 방법을 실행하게 하도록 구성된, 컴퓨터 판독가능 저장 매체 상에 저장된 컴퓨터 프로그램.
KR1020237023244A 2017-06-30 2018-05-05 채널-간 위상 차이 파라미터 인코딩 방법 및 장치 KR20230107909A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201710524352.0 2017-06-30
CN201710524352.0A CN109215668B (zh) 2017-06-30 2017-06-30 一种声道间相位差参数的编码方法及装置
KR1020227025384A KR102554892B1 (ko) 2017-06-30 2018-05-05 채널-간 위상 차이 파라미터 코딩 방법 및 디바이스
PCT/CN2018/085756 WO2019001142A1 (zh) 2017-06-30 2018-05-05 一种声道间相位差参数的编码方法及装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020227025384A Division KR102554892B1 (ko) 2017-06-30 2018-05-05 채널-간 위상 차이 파라미터 코딩 방법 및 디바이스

Publications (1)

Publication Number Publication Date
KR20230107909A true KR20230107909A (ko) 2023-07-18

Family

ID=64741065

Family Applications (4)

Application Number Title Priority Date Filing Date
KR1020207001994A KR102299916B1 (ko) 2017-06-30 2018-05-05 채널-간 위상 차이 파라미터 코딩 방법 및 디바이스
KR1020227025384A KR102554892B1 (ko) 2017-06-30 2018-05-05 채널-간 위상 차이 파라미터 코딩 방법 및 디바이스
KR1020237023244A KR20230107909A (ko) 2017-06-30 2018-05-05 채널-간 위상 차이 파라미터 인코딩 방법 및 장치
KR1020217028047A KR102425236B1 (ko) 2017-06-30 2018-05-05 채널-간 위상 차이 파라미터 코딩 방법 및 디바이스

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020207001994A KR102299916B1 (ko) 2017-06-30 2018-05-05 채널-간 위상 차이 파라미터 코딩 방법 및 디바이스
KR1020227025384A KR102554892B1 (ko) 2017-06-30 2018-05-05 채널-간 위상 차이 파라미터 코딩 방법 및 디바이스

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020217028047A KR102425236B1 (ko) 2017-06-30 2018-05-05 채널-간 위상 차이 파라미터 코딩 방법 및 디바이스

Country Status (9)

Country Link
US (3) US11031021B2 (ko)
EP (2) EP4390920A2 (ko)
JP (3) JP7080262B2 (ko)
KR (4) KR102299916B1 (ko)
CN (1) CN109215668B (ko)
BR (1) BR112019028256A2 (ko)
RU (1) RU2769789C2 (ko)
SG (1) SG11201913610VA (ko)
WO (1) WO2019001142A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109215668B (zh) * 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN115881140A (zh) * 2021-09-29 2023-03-31 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序产品
WO2023097686A1 (zh) * 2021-12-03 2023-06-08 北京小米移动软件有限公司 一种立体声音频信号处理方法及设备/存储介质/装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
TWI396188B (zh) * 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
KR101108060B1 (ko) 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
EP2169664A3 (en) * 2008-09-25 2010-04-07 LG Electronics Inc. A method and an apparatus for processing a signal
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
US9112591B2 (en) * 2010-04-16 2015-08-18 Samsung Electronics Co., Ltd. Apparatus for encoding/decoding multichannel signal and method thereof
EP2702776B1 (en) 2012-02-17 2015-09-23 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
WO2013149672A1 (en) * 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder
ES2555579T3 (es) * 2012-04-05 2016-01-05 Huawei Technologies Co., Ltd Codificador de audio multicanal y método para codificar una señal de audio multicanal
EP2702587B1 (en) * 2012-04-05 2015-04-01 Huawei Technologies Co., Ltd. Method for inter-channel difference estimation and spatial audio coding device
US9536540B2 (en) * 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
CN104681029B (zh) * 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
CN107452387B (zh) * 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
US10217467B2 (en) * 2016-06-20 2019-02-26 Qualcomm Incorporated Encoding and decoding of interchannel phase differences between audio signals
CN109215668B (zh) * 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置

Also Published As

Publication number Publication date
JP2020525847A (ja) 2020-08-27
KR102299916B1 (ko) 2021-09-09
SG11201913610VA (en) 2020-01-30
JP7439152B2 (ja) 2024-02-27
KR102425236B1 (ko) 2022-07-27
KR20210110757A (ko) 2021-09-08
JP2022087124A (ja) 2022-06-09
US11031021B2 (en) 2021-06-08
US20230131892A1 (en) 2023-04-27
JP2024059711A (ja) 2024-05-01
KR102554892B1 (ko) 2023-07-12
BR112019028256A2 (pt) 2020-08-04
EP3637415B1 (en) 2024-04-03
WO2019001142A1 (zh) 2019-01-03
JP7080262B2 (ja) 2022-06-03
CN109215668A (zh) 2019-01-15
EP4390920A2 (en) 2024-06-26
EP3637415A1 (en) 2020-04-15
US20210264926A1 (en) 2021-08-26
KR20220109475A (ko) 2022-08-04
RU2020103799A3 (ko) 2021-07-30
EP3637415A4 (en) 2020-04-29
US11568882B2 (en) 2023-01-31
US20200126571A1 (en) 2020-04-23
RU2769789C2 (ru) 2022-04-06
CN109215668B (zh) 2021-01-05
KR20200019987A (ko) 2020-02-25
RU2020103799A (ru) 2021-07-30

Similar Documents

Publication Publication Date Title
JP7439152B2 (ja) チャネル間位相差パラメータ符号化方法および装置
US11915709B2 (en) Inter-channel phase difference parameter extraction method and apparatus
EP3874492A1 (en) Determination of spatial audio parameter encoding and associated decoding
US20230298600A1 (en) Audio encoding and decoding method and apparatus
EP4131261A1 (en) Audio signal encoding method, decoding method, encoding device, and decoding device
GB2590651A (en) Combining of spatial audio parameters
JP7159351B2 (ja) ダウンミックスされた信号の計算方法及び装置
EP4246509A1 (en) Audio encoding/decoding method and device
EP4174851A1 (en) Audio encoding method, audio decoding method, related apparatus and computer-readable storage medium
CN115346537A (zh) 一种音频编码、解码方法及装置
BR122023025938A2 (pt) Método e aparelho de extração de parâmetro de diferença de fase intercanal, e meio de armazenamento

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right