KR20190009363A - 채널 간 위상차 파라미터 추출 방법 및 장치 - Google Patents

채널 간 위상차 파라미터 추출 방법 및 장치 Download PDF

Info

Publication number
KR20190009363A
KR20190009363A KR1020187036928A KR20187036928A KR20190009363A KR 20190009363 A KR20190009363 A KR 20190009363A KR 1020187036928 A KR1020187036928 A KR 1020187036928A KR 20187036928 A KR20187036928 A KR 20187036928A KR 20190009363 A KR20190009363 A KR 20190009363A
Authority
KR
South Korea
Prior art keywords
current frame
ipd
parameter
signal
channel
Prior art date
Application number
KR1020187036928A
Other languages
English (en)
Other versions
KR102196390B1 (ko
Inventor
싱타오 장
하이팅 리
제신 리우
레이 미아오
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Priority to KR1020207036972A priority Critical patent/KR102288841B1/ko
Publication of KR20190009363A publication Critical patent/KR20190009363A/ko
Application granted granted Critical
Publication of KR102196390B1 publication Critical patent/KR102196390B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Stereophonic System (AREA)
  • Telephonic Communication Services (AREA)

Abstract

채널 간 위상차 파라미터 추출 방법 및 장치가 제공된다. 상기 채널 간 위상차 파라미터 추출 방법은, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터를 획득하는 단계(S01); 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정하는 단계(S102) - 여기서 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식은 둘 이상의 미리 설정된 IPD 파라미터 추출 방식 중 하나임 -; 및 상기 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식에 기초하여, 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하는 단계(S103)를 포함한다. 따라서, IPD 파라미터 추출 방식이 풍부해질 수 있어, 위상 정보를 더욱 양호하게 유지할 수 있고, 오디오 코딩 품질을 향상시킬 수 있다.

Description

채널 간 위상차 파라미터 추출 방법 및 장치
본 발명은 통신 기술 분야에 관한 것으로, 특히, 채널 간 위상차 파라미터 추출 방법 및 장치에 관한 것이다.
삶의 질이 향상됨에 따라, 사람들의 고음질 오디오에 대한 요구가 증가하고있다. 모노 오디오와 비교할 때, 스테레오 오디오는 오디오 재생 중에 음원의 방위감 및 분포감을 전달하고, 오디오 정보를 더욱 선명하고 더 잘 이해할 수 있게 하며, 존재감을 향상시킨다. 따라서 스테레오 오디오는 사람들에 의해 매우 선호된다.
파라메트릭 스테레오(Parametric Stereo, PS) 코딩은 스테레오 처리 기술에 대한 일반적인 코딩 방식 중 하나이다. PS 코딩이란, 공간 지각 특성(spatial perception feature)에 기초하여 스테레오 신호(즉, 다중 채널 신호)에 대해 인코딩 및 디코딩 처리를 수행하여, 다중 채널 신호의 코딩 및 디코딩이 모노 오디오 신호의 인코딩 및 디코딩과 공간 지각 파라미터의 인코딩 및 디코딩으로 변환될 수 있도록 하는 것을 의미한다. PS 코딩에서의 공간 지각 파라미터는 채널 간 코히어런스(Inter-channel Coherence, IC), 채널 간 레벨차(Inter-channel Level Difference, ILD), 채널 간 시간차(Inter-channel Time Difference, ITD), 채널 간 위상차(Inter-channel Phase Difference, IPD) 등을 포함한다. ITD 및 IPD는 음원의 수평 방위를 나타내는 공간 지각 파라미터이다. ILD, ITD 및 IPD는, 음장 위치(sound field location)를 효과적으로 결정할 수 있고 스테레오 신호 복원에 중요한 음원의 위치를 인간의 귀가 지각하는 방법을 결정한다. 따라서 IPD와 같은 파라미터를 결정하는 것은 스테레오 신호 복원에 중요하다.
종래 기술 1에서, 스테레오 신호의 각각의 프레임의 IPD 파라미터에 대해, 시간 도메인 신호는 주파수 도메인 신호로 변환되고, 주파수 도메인 신호는 복수의 부대역으로 분할되고, IPD 파라미터는 각각의 부대역 대해 계산되며, 각각의 부대역의 IPD 파라미터는 양자화되고 인코딩된 후에 스테레오 신호 코딩에 사용된다. 종래 기술 1에서, 복수의 부대역에 대한 주파수 도메인 신호의 경우, IPD 파라미터는 각각의 부대역에 대해 계산되어야 하므로, 대량의 자원을 점유하고 낮은 코딩 레이트를 야기한다.
종래 기술 2에서, 스테레오 신호의 각각의 프레임의 IPD 파라미터에 대해, 시간 도메인의 신호를 주파수 도메인의 신호로 변환한 다음, 주파수 도메인의 신호에 기초하여 하나의 프레임의 IPD 파라미터가 계산되며 - 여기서 하나의 프레임의 IPD 파라미터는 그룹 간 채널 위상차(Group IPD) 파라미터로 지칭됨 -, 마지막으로, 그룹 IPD 파라미터는 양자화되고 인코딩된 후에 스테레오 신호 코딩에 사용된다. 종래 기술 2에서는 하나의 IPD 파라미터(그룹 IPD 파라미터)만 추출되므로, 하나의 IPD 파라미터만이 양자화되고 인코딩될 수 있다. 소량의 자원이 사용되지만 추출된 위상 정보의 정확도는 낮고 코딩 품질은 나쁘다.
본 출원은 IPD 파라미터 추출 방식의 선택을 풍부하게 하고, 위상 정보를 더욱 양호하게 유지하며, 오디오 코딩 품질을 향상시키기 위한 채널 간 위상차 파라미터 추출 방법 및 장치를 제공한다.
제1 측면에 따르면, 채널 간 위상차 파라미터 추출 방법이 제공되며, 상기 채널 간 위상차 파라미터 추출 방법은,
현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터를 획득하는 단계;
상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 채널 간 위상차(inter-channel phase difference, IPD) 파라미터 추출 방식을 결정하는 단계 - 여기서 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식은 둘 이상의 미리 설정된 IPD 파라미터 추출 방식 중 하나임 -; 및
상기 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식에 기초하여, 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하는 단계를 포함한다.
본 출원에서 제공되는 방법에 따르면, 복수의 채널 간 위상차(IPD) 파라미터 추출 방식이 미리 설정될 수 있으므로, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 때, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 획득된 파라미터에 기초하여 결정될 수 있고, 그후 현재 프레임의 다중 채널 신호의 IPD 파라미터 신호는 결정된 IPD 파라미터 추출 방식에 기초하여 추출될 수 있다. 본 출원에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식의 선택이 풍부해지고, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 현재 프레임에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터와 관련되므로, 위상 정보를 더욱 양호하게 잘 유지할 수 있고, 다중 채널 신호 코딩 품질을 향상시킬 수 있다.
제1 측면을 참조하여, 제1 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임의 신호 특성 파라미터 및 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터 중 적어도 하나를 포함하며, 여기서 A는 1 이상의 정수이고;
상기 현재 프레임의 신호 특성 파라미터는 현재 프레임의 좌우 채널 코히어런스(left-right channel coherence) 값, 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터, 현재 프레임의 부대역 IPD 분산, 현재 프레임의 신호 클래스 및 현재 프레임의 채널 간 시간차(inter-channel time difference, ITD) 중 적어도 하나를 포함하고;
상기 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터는, 현재 프레임 이전의 A개의 프레임 각각의 좌우 채널 코히어런스 값, 현재 프레임 이전의 A개의 프레임 각각의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터, 현재 프레임 이전의 A개의 프레임 각각의 부대역 IPD 분산, 현재 프레임 이전의 A개 프레임 각각의 ITD, 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식, 및 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스 중 적어도 하나를 포함하고;
상기 신호 클래스는 음성 프레임 또는 음악 프레임을 포함한다.
본 출원에서서 제공되는, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정에 사용되는 파라미터는 현재 프레임의 신호 특성 파라미터, 또는 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터, 또는 현재 프레임의 신호 특성 파라미터 및 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터 등을 포함한다. 현재 프레임의 신호 특성 파라미터 및 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터는 각각 하나 이상의 파라미터를 포함할 수 있으므로, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 현재 프레임의 신호 특성 파라미터 또는 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터와 더욱 밀접하게 관련되고, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식의 적용성(applicability)이 향상된다.
제1 측면의 제1 가능한 구현예를 참조하여, 제2 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임의 좌우 채널 코히어런스 값 및 상기 현재 프레임의 부대역 IPD 분산을 포함하고;
상기 현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값보다 크고, 상기 현재 프레임의 부대역 IPD 분산이 제2 임계 값보다 작으면, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정하는 단계는,
상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하는 단계를 포함한다.
본 출원에서 제공되는 방법에 따르면, 현재 프레임의 좌우 채널 코히어런스 값이 조건을 충족시키고, 현재 프레임의 부대역 IPD 분산이 조건을 충족시키는 경우, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정될 수 있으며, 제1 추출 방식은 현재 프레임의 좌우 채널 코히어런스 값과 현재 프레임의 다중 채널 신호의 부대역 IPD 분산 모두와 더욱 밀접하게 관련이 있고, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식의 적용성이 향상된다.
제1 측면의 제1 가능한 구현예를 참조하여, 제3 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터 및 상기 현재 프레임의 부대역 IPD 분산을 포함하고;
상기 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터의 값이 제1 임계 값보다 크고, 상기 현재 프레임의 부대역 IPD 분산이 제2 임계 값보다 작으면, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정하는 단계는,
상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하는 단계를 포함한다.
본 출원에서 제공되는 방법에 따르면, 현재 프레임의 파라미터로서, 좌우 채널의 코히어런스를 나타내는 파라미터가 조건을 충족시키는 경우, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정될 수 있으므로, 다중 채너 신호의 현재 프레임에 대한 IPD 추출 방식의 적용성이 향상된다.
제1 측면의 제2 가능한 구현예를 참조하여, 제4 가능한 구현예에서, 상기 제1 임계 값은 0.75이다.
제1 측면의 제1 가능한 구현예를 참조하여, 제5 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식 및 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스를 포함하고;
상기 현재 프레임 이전의 A개의 프레임 각각의 IPD 파라미터 추출 방식이 제1 추출 방식이고, 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 음악 프레임이면, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정하는 단계는,
상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 상기 제1 추출 방식인 것으로 결정하는 단계를 포함한다.
본 출원에서 제공되는 방법에 따르면, 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식이 요건을 충족시키고, 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 요건을 충족시키는 경우, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정될 수 있어, 제1 추출 방식은 현재 프레임 이전의 A개의 프레임 각각의 신호 특징 파라미터와 더욱 밀접하게 관련되고, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식의 선택 정확도가 향상될 수 있다.
제1 측면의 제1 가능한 구현예를 참조하여, 제6 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임의 ITD 파라미터, 상기 현재 프레임의 부대역 IPD 분산 및 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스를 포함하고;
상기 현재 프레임의 ITD 파라미터의 값이 제3 임계 값보다 크고, 상기 현재 프레임의 부대역 IPD 분산이 제4 임계 값보다 작고, 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 음성 프레임이면, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정하는 단계는,
상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하는 단계를 포함한다.
본 출원에서 제공되는 방법에 따르면, 현재 프레임의 ITD 파라미터 및 부대역 IPD 분산과 같은 신호 특성 파라미터가 조건을 충족시키고, 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 요건을 중촉시키는 경우, 현재 프레임의 다중 채널 신호에 대한 IPD 추출 방식을 제1 추출 방식으로 결정하므로, 제1 추출 방식이 현재 프레임의 신호 특징 파라미터와, 현재 프레임 이전의 A개의 프레임 각각의 신호 특징 파라미터 모두와 더욱 밀접하게 괸련되도록 할 수 있고, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식의 적용성을 향상시킬 수 있다.
제1 측면의 제2 가능한 구현예 내지 제1 측면의 제6 가능한 구현예 중 어느 하나를 참조하여, 제7 가능한 구현예에서, 상기 제1 추출 방식은 상기 현재 프레임의 다중 채널 신호의 그룹 채널 간 위상차(group IPD) 파라미터를 추출하거나, 또는 상기 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하지 않거나, 또는 상기 현재 프레임의 다중 채널 신호의 IPD 파라미터를 0으로 설정하는 것을 포함한다.
본 출원에서, 두 가지 선택적인 구현예가 제1 추출 방식으로서 제공되므로, 현재 프레임의 다중 채널 신호에 대한 IPD 추출 방식의 선택이 풍부해지고, 현재 프레임의 다중 채널 신호에 대한 IPD 추출 방법의 적용성이 향상된다.
제1 측면의 제7 가능한 구현예를 참조하여, 제8 가능한 구현예에서, 상기 제1 추출 방식이 상기 현재 프레임의 다중 채널 신호의 그룹 IPD 파라미터를 추출하는 것인 경우, 상기 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식에 기초하여, 상기 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하는 단계는,
현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역 IPD 파라미터를 추출하고, 추출된 부대역 IPD 파라미터에 기초하여, 상기 현재 프레임의 다중 채널 신호의 그룹 IPD를 결정하는 단계를 포함한다.
본 출원에 제공되는 방법에 따르면, 현재의 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 그룹 IPD를 추출하는 것인 경우, 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역 IPD 파라미터를 추출할 수 있고, 현재 프레임의 다중 채널 신호의 그룹 IPD는 추출된 부대역 IPD 파라미터에 기초하여 결정될 수 있어, 현재 프레임의 다중 채널 신호의 그룹 IPD는 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역 IPD 파라미터와 관련되고, IPD 파라미터 코딩 품질이 향상될 수 있다. 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 그룹 IPD를 추출하는 것인 경우, IPD 파라미터 코딩은 비교적 소량의 비트를 점유하고, 더 많은 비트가 다른 파라미터의 코딩에 사용될 수 있어, 오디오 코딩 품질을 향상시킬 수 있다.
제1 측면의 제2 가능한 구현예 내지 제1 측면의 제6 가능한 구현예를 참조하여, 제9 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니면, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정하는 단계는,
상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제2 추출 방식인 것으로 결정하는 단계를 포함하고,
상기 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하거나 부대역 IPD 파라미터를 추출하는 것을 포함한다.
제1 측면의 제9 가능한 구현예를 참조하여, 제10 가능한 구현예에서, 상기 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하는 것이고, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제2 추출 방식인 것으로 결정하는 단계는,
상기 현재 프레임의 다중 채널 신호의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 둘 이상의 부대역 세트로 분류하는 단계 - 각각의 부대역 세트는 하나 이상의 부대역을 포함하고, 하나 이상의 부대역 세트는 둘 이상의 부대역을 포함함 -;
각각의 부대역 세트의 부대역 IPD 분산을 획득하는 단계; 및
각각의 부대역 세트의 부대역 IPD 분산이 상기 제2 임계 값보다 작고, 상기 현재 프레임의 좌우 채널 코히어런스 값이 상기 제1 임계 값보다 크면, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 세트 IPD 파라미터를 추출하는 것이라고 결정하는 단계를 포함하고;
상기 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식에 기초하여 상기 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하는 단계는,
상기 둘 이상의 부대역 세트 각각의 IPD 파라미터를 계산하는 단계를 포함한다.
본 출원에서 제공되는 방법에 따르면, 현재 프레임의 다중 채널 신호의 IPD 파라미터가 제1 추출 방식이 아닌 것으로 결정되는 경우, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 추가로, 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 분류하여 획득되는 복수의 부대역 세트의 부대역 IPD에 기초하여 결정될 수 있다. 분류를 통해 획득된 각각의 부대역 세트의 부대역 IPD 분산이 조건을 충족시키고, 현재 프레임의 좌우 채널 코히어런스 값이 조건을 충족시키는 경우, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 세트 IPD 파라미터를 추출하는 것으로 결정되므로, 각각의 부대역 세트의 IPD 파라미터는 현재 프레임의 다중 채널 신호의 IPD 파라미터로서 결정될 수 있다. 본 출원에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식의 선택이 풍부해질 수 있다. 복수의 IPD 파라미터가 현재 프레임의 다중 채널 신호의 IPD 파라미터로서 사용되므로, 위상 정보가 더욱 양호하게 유지될 수 있고, 오디오 코딩 정확도가 향상될 수 있다. 또한, 부대역이 부대역 세트로 분류된 후에 추출된 IPD 파라미터의 수량은 모든 부대역에 대해 추출된 IPD 파라미터의 수량보다 적고, 더 많은 비트가 다른 파라미터의 코딩에 사용될 수 있어, 오디오 코딩 품질을 향상시킬 수 있다.
제1 측면의 제9 가능한 구현예를 참조하여, 제11 가능한 구현예에서, 상기 제2 추출 방식은 부대역 IPD 파라미터를 추출하는 것이고, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제2 추출 방식인 것으로 결정하는 단계는,
상기 현재 프레임의 다중 채널 신호의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 둘 이상의 부대역 세트로 분류하는 단계 - 각각의 부대역 세트는 하나 이상의 부대역을 포함하고, 하나 이상의 부대역 세트는 둘 이상의 부대역을 포함함 -; 및
상기 둘 이상의 부대역 세트 각각의 IPD 파라미터를 계산하는 단계를 포함한다.
제1 측면의 제9 가능한 구현예를 참조하여, 제12 가능한 구현예에서, 상기 제2 추출 방식은 부대역 IPD 파라미터를 추출하는 것이고, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제2 추출 방식인 것으로 결정하는 단계는,
하나 이상의 부대역 세트의 부대역 IPD 분산이 상기 제2 임계 값보다 크거나, 또는 상기 현재 프레임의 좌우 채널 코히어런스 값이 상기 제1 임계 값 이하이면, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 IPD 파라미터를 추출하는 것으로 결정하는 단계; 및
상기 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식에 기초하여 상기 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하는 단계는,
현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 전부 또는 일부 부대역의 IPD 파라미터를 계산하는 단계를 포함한다.
본 출원에서 제공되는 방법에 따르면, 현재 프레임의 다중 채널 신호의 IPD 파라미터가 제1 추출 방식이 아니라고 결정되는 경우, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 부대역 IPD 파라미터를 추출하는 것으로 결정될 수 있고, 그후 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 전부 또는 일부 부대역의 IPD 파라미터가 계산될 수 있어, 각각의 부대역의 IPD 파라미터는 현재 프레임의 다중 채널 신호의 IPD 파라미터로서 결정될 수 있다. 본 출원에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식의 선택이 풍부해질 수 있다. 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 전부 또는 일부 부대역의 IPD 파라미터는 현재 프레임의 다중 채널 신호의 IPD 파라미터로서 사용되므로, 위상 정보가 더욱 양호하게 유지될 수 있고, 오디오 코딩 정확도가 향상될 수 있다.
제1 측면의 제9 구현예를 참조하면, 제13 가능한 구현예에서, 상기 제2 추출 방식은 부대역 IPD 파라미터를 추출하는 것이고, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제2 추출 방식인 것으로 결정하는 단계는,
상기 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 전부 또는 일부 부대역의 IPD 파라미터를 계산하는 단계를 포함한다.
제1 측면의 제1 가능한 구현예를 참조하면, 제14 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터가 현재 프레임의 좌우 채널 코히어런스 값을 포함하는 경우, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터를 획득하는 단계는,
상기 현재 프레임의 다중 채널 신호의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 획득하고, 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호로 변환하는 단계; 및
상기 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호에 기초하여, 상기 현재 프레임의 다중 채널 신호의 좌우 채널 코히어런스 값을 계산하는 단계를 포함한다.
본 출원에서 제공되는 방법에 따르면, 현재 프레임의 다중 채널 신호의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호는 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호로 변환될 수 있고, 현재 프레임의 좌우 채널 코히어런스 값은 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호에 기초하여 계산되어 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 수 있으므로, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호와 더욱 밀접하게 관련될 수 있으며, IPD 파라미터 추출 방식을 결정하는 정확도가 향상될 수 있다.
제1 측면의 제1 가능한 구현예를 참조하면, 제15 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터가 현재 프레임의 부대역 IPD 분산을 포함하는 경우, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터를 획득하는 단계는,
상기 현재 프레임의 다중 채널 신호의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 획득하고, 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호로 변환하는 단계; 및
상기 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호를 둘 이상의 부대역으로 분할하고, 각각의 부대역의 주파수 도메인 신호에 기초하여 각각의 부대역의 IPD를 계산하고, 각각의 부대역의 IPD에 기초하여 상기 현재 프레임의 부대역 IPD 분산을 계산하는 단계를 포함한다.
본 출원에서 제공되는 방법에 따르면, 현재 프레임의 다중 채널 신호의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호는 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호로 변환될 수 있고, 현재 프레임의 부대역 IPD 분산을 계산하기 위해, 현재 프레임의 각각의 부대역의 IPD가 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호에 기초하여 계산되고, 그후 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 수 있으므로, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정하는 것이 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호와 더욱 밀접하게 관련될 수 있고, IPD 파라미터 추출 방식을 결정하는 정확도가 향상될 수 있다.
제2 측면에 따르면, 채널 간 위상차 파라미터 추출 장치가 제공되며, 상기 채널 간 위상차 파라미터 추출 장치는,
현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터를 획득하도록 구성된 획득 모듈;
상기 획득 모듈에 의해 획득되는, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 채널 간 위상차(IPD) 파라미터 추출 방식을 결정하도록 구성된 결정 모듈 - 여기서 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식은 둘 이상의 미리 설정된 IPD 파라미터 추출 방식 중 하나임 -; 및
상기 결정 모듈에 의해 결정되는, 상기 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식에 기초하여, 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하도록 구성된 추출 모듈을 포함한다.
본 출원에서 제공되는 추출 장치에 따르면, 복수의 채널 간 위상차(IPD) 파라미터 추출 방식이 미리 설정될 수 있으므로, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 때, IPD 파라미터 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식은 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 획득된 파라미터에 기초하여 결정될 수 있고, 그후 현재 프레임의 다중 채널 신호의 IPD 파라미터 신호는 결정된 IPD 파라미터 추출 방식에 기초하여 추출될 수 있다. 본 출원에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식의 선택이 풍부해지고, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 현재 프레임에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터와 더욱 밀접하게 관련되므로, 위상 정보를 더욱 양호하게 유지할 수 있고, 다중 채널 신호 코딩 품질을 향상시킬 수 있다.
제2 측면을 참조하면, 제1 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는, 현재 프레임의 신호 특성 파라미터 및 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터 중 적어도 하나를 포함하며, 여기서 A는 1 이상의 정수이고;
상기 현재 프레임의 신호 특성 파라미터는 현재 프레임의 좌우 채널 코히어런스 값, 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터, 현재 프레임의 부대역 IPD 분산, 현재 프레임의 신호 클래스 및 현재 프레임의 채널 간 시간차(ITD) 중 적어도 하나를 포함하고;
상기 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터는, 현재 프레임 이전의 A개의 프레임 각각의 좌우 채널 코히어런스 값, 현재 프레임 이전의 A개의 프레임 각각의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터, 현재 프레임 이전의 A개의 프레임 각각의 부대역 IPD 분산, 현재 프레임 이전의 A개 프레임 각각의 ITD, 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식, 및 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스 중 적어도 하나를 포함하고;
상기 신호 클래스는 음성 프레임 또는 음악 프레임을 포함한다.
제2 측면의 제1 가능한 구현예를 참조하여, 제2 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임의 좌우 채널 코히어런스 값 및 상기 현재 프레임의 부대역 IPD 분산을 포함하고;
상기 현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값보다 크고, 상기 현재 프레임의 부대역 IPD 분산이 제2 임계 값보다 작으면, 상기 결정 모듈은 구체적으로,
상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성된다.
제2 측면의 제1 가능한 구현예를 참조하여, 제3 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터를 포함하고;
상기 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터가 제1 임계 값보다 크면, 상기 결정 모듈은 구체적으로,
상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성된다.
제2 측면의 제1 가능한 구현예를 참조하여, 제4 가능한 구현예에서, 상기 제1 임계 값은 0.75이다.
제2 측면의 제1 가능한 구현예를 참조하여, 제5 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식 및 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스를 포함하고;
상기 현재 프레임 이전의 A개의 프레임 각각의 IPD 파라미터 추출 방식이 제1 추출 방식이고, 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 음악 프레임이면, 상기 결정 모듈은 구체적으로,
상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 상기 제1 추출 방식인 것으로 결정하도록 구성된다.
제2 측면의 제1 가능한 구현예를 참조하여, 제6 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임의 ITD 파라미터, 현재 프레임의 부대역 IPD 분산 및 현재 프레임 이전의 A개 프레임 각각의 신호 클래스를 포함하고;
현재 프레임의 ITD 파라미터의 값이 제3 임계 값보다 크고, 현재 프레임의 부대역 IPD 분산은 제4 임계 값보다 작고, 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스는 음성 프레임이면, 상기 결정 모듈은 구체적으로,
상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성된다.
제2 측면의 제2 가능한 구현예 내지 제2 측면의 제6 가능한 구현예 중 어느 하나를 참조하여, 제7 가능한 구현예에서, 상기 제1 추출 방식은 상기 현재 프레임의 다중 채널 신호의 그룹 채널 간 위상차(group IPD) 파라미터를 추출하거나, 또는 상기 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하지 않거나, 또는 상기 현재 프레임의 다중 채널 신호의 IPD 파라미터를 0으로 설정하는 것을 포함한다.
제2 측면의 제7 가능한 구현예를 참조하여, 제8 가능한 구현예에서, 상기 결정 모듈이, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 그룹 IPD를 추출하는 것으로 결정하는 경우, 상기 추출 모듈은 구체적으로,
현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역 IPD 파라미터를 추출하고, 추출된 부대역 IPD 파라미터에 기초하여, 상기 현재 프레임의 다중 채널 신호의 그룹 IPD를 결정하도록 구성된다.
제2 측면의 제2 가능한 구현예 내지 제2 측면의 제5 가능한 구현예 중 어느 하나를 참조하여, 제9 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니면, 상기 결정 모듈은 구체적으로,
상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제2 추출 방식인 것으로 결정하도록 구성되고,
상기 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하거나 부대역 IPD 파라미터를 추출하는 것을 포함한다.
제2 측면의 제9 가능한 구현예를 참조하여, 제10 가능한 구현예에서, 상기 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하는 것이고, 상기 결정 모듈은 구체적으로,
상기 현재 프레임의 다중 채널 신호의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 둘 이상의 부대역 세트로 분류하고 - 각각의 부대역 세트는 하나 이상의 부대역을 포함하고, 하나 이상의 부대역 세트는 둘 이상의 부대역을 포함함 -;
부대역 세트 각각의 부대역 IPD 분산을 획득하고;
각각의 부대역 세트의 부대역 IPD 분산이 제2 임계 값보다 작고 상기 현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값보다 크면, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 세트 IPD 파라미터를 추출하는 것으로 결정하도록 구성되며,
상기 추출 모듈은 구체적으로,
상기 결정 모듈에 의해 결정되는 둘 이상의 부대역 세트 각각의 IPD 파라미터를 계산하도록 구성된다.
제2 측면의 제9 가능한 구현예를 참조하여, 제11 가능한 구현예에서, 상기 제2 추출 방식은 부대역 IPD 파라미터를 추출하는 것이고, 상기 결정 모듈은 구체적으로,
상기 현재 프레임의 다중 채널 신호의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 둘 이상의 부대역 세트로 분류하도록 구성되고, 각각의 부대역 세트는 하나 이상의 부대역을 포함하고, 하나 이상의 부대역 세트는 둘 이상의 부대역을 포함하며;
상기 추출 모듈은 구체적으로,
상기 획득 모듈에 의해 결정되는 둘 이상의 부대역 세트 각각의 IPD 파라미터를 계산하도록 구성된다.
제2 측면의 제10 가능한 구현예를 참조하여, 제12 가능한 구현예에서, 상기 제2 추출 방식은 부대역 IPD 파라미터를 추출하는 것이고, 상기 결정 모듈은 구체적으로,
하나 이상의 부대역 세트의 부대역 IPD 분산이 제2 임계 값보다 크거나, 또는 상기 현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값 이하이면, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 IPD 파라미터를 추출하는 것으로 결정하도록 구성되고;
상기 추출 모듈은 구체적으로.
현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 모든 부대역의 IPD 파라미터를 계산하도록 구성된다.
제2 측면의 제10 구현예를 참조하면, 제13 가능한 구현예에서, 상기 제2 추출 방식은 부대역 IPD 파라미터를 추출하는 것이고, 상기 추출 모듈은 구체적으로,
상기 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 모든 부대역의 IPD 파라미터를 계산하도록 구성된다.
제2 측면의 제1 가능한 구현예를 참조하면, 제14 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터가 현재 프레임의 좌우 채널 코히어런스 값을 포함하는 경우, 상기 획득 모듈은 구체적으로,
상기 현재 프레임의 다중 채널 신호의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 획득하고, 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호로 변환하고;
상기 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호에 기초하여 상기 현재 프레임의 좌우 채널 코히어런스 값을 계산하도록 구성된다.
제2 측면의 제1 가능한 구현예를 참조하면, 제15 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터가 현재 프레임의 부대역 IPD 분산을 포함하는 경우, 상기 획득 모듈은 구체적으로,
상기 현재 프레임의 다중 채널 신호의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 획득하고, 상기 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호로 변환하고;
상기 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호를 둘 이상의 부대역으로 분할하고, 각각의 부대역의 주파수 도메인 신호에 기초하여 각각의 부대역의 IPD를 계산하고, 각각의 부대역의 IPD에 기초하여 상기 현재 프레임의 부대역 IPD 분산을 계산하도록 구성된다.
본 출원에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 그룹 IPD를 추출하는 것인 경우, IPD 파라미터 코딩은 비교적 소량의 비트를 점유하고, 더 많은 비트가 다른 파라미터의 코딩에 사용될 수 있으므로, 오디오 코딩 품질을 향상시킨다. 본 출원에서, 복수의 IPD 파라미터가 현재 프레임의 다중 채널 신호의 IPD 파라미터로서 사용될 수 있으므로, 위상 정보는 더 양호하게 유지될 수 있고, 오디오 코딩 정확도가 향상될 수 있다. 또한, 부대역이 부대역 세트로 분류된 후에 추출된 IPD 파라미터의 품질은 모든 부대역에 대해 추출된 IPD 파라미터의 품질보다 못하고, 더 많은 비트가 다른 파라미터의 코딩에 사용될 수 있어, 오디오 코딩 품질을 향상시킨다.
제3 측면에 따르면, 메모리 및 프로세서를 포함하는 단말기가 제공되며, 상기 메모리는 상기 프로세서에 연결되고;
상기 메모리는 프로그램 코드의 세트를 저장하도록 구성되고;
상기 프로세서는, 상기 메모리에 저장된 프로그램 코드를 호출하여,
현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터를 획득하는 작업;
상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 채널 간 위상차(IPD) 파라미터 추출 방식을 결정하는 작업 - 여기서 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식은 둘 이상의 미리 설정된 IPD 파라미터 추출 방식 중 하나임 -; 및
상기 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식에 기초하여, 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하는 작업을 수행하도록 구성된다.
본 출원에서 제공되는 단말기에 따르면, 복수의 채널 간 위상차(IPD) 파라미터 추출 방식이 미리 설정될 수 있으므로, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 때, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 획득된 파라미터에 기초하여 결정될 수 있고, 그후 현재 프레임의 다중 채널 신호의 IPD 파라미터 신호는 결정된 IPD 파라미터 추출 방식에 기초하여 추출될 수 있다. 본 출원에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식의 선택이 풍부해지고, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 현재 프레임에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터와 관련되므로, 위상 정보를 더욱 양호하게 유지할 수 있고, 다중 채널 신호 코딩 품질을 향상시킬 수 있다.
제3 측면을 참조하여, 제1 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임의 신호 특성 파라미터 및 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터 중 적어도 하나를 포함하며, 여기서 A는 1 이상의 정수이고;
상기 현재 프레임의 신호 특성 파라미터는 현재 프레임의 좌우 채널 코히어런스 값, 현재 프레임의 부대역 IPD 분산, 및 현재 프레임의 채널 간 시간차(ITD) 중 적어도 하나를 포함하고;
상기 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터는, 현재 프레임 이전의 A개의 프레임 각각의 좌우 채널 코히어런스 값, 현재 프레임 이전의 A개의 프레임 각각의 부대역 IPD 분산, 현재 프레임 이전의 A개 프레임 각각의 ITD, 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식, 및 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스 중 적어도 하나를 포함하고;
상기 신호 클래스는 음성 프레임 또는 음악 프레임을 포함한다.
제3 측면의 제1 가능한 구현예를 참조하여, 제2 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임의 좌우 채널 코히어런스 값 및 상기 현재 프레임의 부대역 IPD 분산을 포함하고;
상기 현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값보다 크고, 상기 현재 프레임의 부대역 IPD 분산이 제2 임계 값보다 작으면, 상기 프로세서는 구체적으로,
상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성된다.
제3 측면의 제1 가능한 구현예를 참조하여, 제3 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식 및 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스를 포함하고;
상기 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이고, 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 음악 프레임이면, 상기 프로세서는 구체적으로,
상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 상기 제1 추출 방식인 것으로 결정하도록 구성된다.
제3 측면의 제1 가능한 구현예를 참조하여, 제4 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임의 ITD 파라미터, 상기 현재 프레임의 부대역 IPD 분산 및 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스를 포함하고;
상기 현재 프레임의 ITD 파라미터의 값이 제3 임계 값보다 크고, 상기 현재 프레임의 부대역 IPD 분산이 제4 임계 값보다 작고, 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 음성 프레임이면, 상기 프로세서는 구체적으로,
상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성된다.
제3 측면의 제2 가능한 구현예 내지 제3 측면의 제4 가능한 구현예 중 어느 하나를 참조하여, 제5 가능한 구현예에서, 상기 제1 추출 방식은 상기 현재 프레임의 다중 채널 신호의 그룹 채널 간 위상차(group IPD) 파라미터를 추출하거나, 또는 상기 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하지 않는 것을 포함한다.
제3 측면의 제5 가능한 구현예를 참조하여, 제6 가능한 구현예에서, 상기 제1 추출 방식이 상기 현재 프레임의 다중 채널 신호의 그룹 IPD 파라미터를 추출하는 것인 경우, 상기 프로세서는 구체적으로,
현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역 IPD 파라미터를 추출하고, 추출된 부대역 IPD 파라미터에 기초하여, 상기 현재 프레임의 다중 채널 신호의 그룹 IPD를 결정하도록 구성된다.
제3 측면의 제2 가능한 구현예 내지 제3 측면의 제4 가능한 구현예 중 어느 하나를 참조하여, 제7 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니면, 상기 프로세서는 구체적으로,
상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제2 추출 방식인 것으로 결정하도록 구성되고,
상기 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하거나 부대역 IPD 파라미터를 추출하는 것을 포함한다.
제3 측면의 제7 가능한 구현예를 참조하여, 제8 가능한 구현예에서, 상기 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하는 것이고, 상기 프로세서는 구체적으로,
상기 현재 프레임의 다중 채널 신호의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 둘 이상의 부대역 세트로 분류하고 - 각각의 부대역 세트는 하나 이상의 부대역을 포함하고, 하나 이상의 부대역 세트는 둘 이상의 부대역을 포함함 -;
각각의 부대역 세트의 부대역 IPD 분산을 획득하고;
각각의 부대역 세트의 부대역 IPD 분산이 상기 제2 임계 값보다 작고, 상기 현재 프레임의 좌우 채널 코히어런스 값이 상기 제1 임계 값보다 크면, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 세트 IPD 파라미터를 추출하는 것이라고 결정하고;
상기 둘 이상의 부대역 세트 각각의 IPD 파라미터를 계산하도록 구성된다.
제3 측면의 제8 가능한 구현예를 참조하여, 제9 가능한 구현예에서, 상기 제2 추출 방식은 부대역 IPD 파라미터를 추출하는 것이고, 상기 프로세서는 구체적으로,
하나 이상의 부대역 세트의 부대역 IPD 분산이 상기 제2 임계 값보다 크거나, 또는 상기 현재 프레임의 좌우 채널 코히어런스 값이 상기 제1 임계 값 이하이면, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 IPD 파라미터를 추출하는 것으로 결정하고;
현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 모든 부대역의 IPD 파라미터를 계산하도록 구성된다.
제3 측면의 제1 구현예를 참조하여, 제10 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터가 현재 프레임의 좌우 채널 코히어런스 값을 포함하는 경우, 상기 프로세서는 구체적으로,
상기 현재 프레임의 다중 채널 신호의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 획득하고, 상기 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호로 변환하고;
상기 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호에 기초하여, 상기 현재 프레임의 좌우 채널 코히어런스 값을 계산하도록 구성된다.
제3 측면의 제1 가능한 구현예를 참조하면, 제11 가능한 구현예에서, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터가 현재 프레임의 부대역 IPD 분산을 포함하는 경우, 상기 프로세서는 구체적으로,
상기 현재 프레임의 다중 채널 신호의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 획득하고, 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호로 변환하고;
상기 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호를 둘 이상의 부대역으로 분할하고, 각각의 부대역의 주파수 도메인 신호에 기초하여 각각의 부대역의 IPD를 계산하고, 각각의 부대역의 IPD에 기초하여 상기 현재 프레임의 부대역 IPD 분산을 계산하도록 구성된다.
본 출원에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 그룹 IPD를 추출하는 것일 때, IPD 파라미터 코딩은 비교적 소량의 비트를 점유하고, 더 많은 비트가 다른 파라미터의 코딩에 사용될 수 있어, 오디오 코딩 품질을 향상시킬 수 있다. 본 출원에서, 복수의 IPD 파라미터가 현재 프레임의 다중 채널 신호의 IPD 파라미터로서 사용될 수 있으므로, 위상 정보가 더욱 양호하게 유지될 수 있고, 오디오 코딩 정확도가 향상될 수 있다. 또한, 부대역이 부대역 세트로 분류된 후에 추출된 IPD 파라미터의 수량은 모든 부대역에 대해 추출된 IPD 파라미터의 수량보다 작고, 더 많은 비트가 다른 파라미터의 코딩에 사용될 수 있어, 오디오 코딩 품질을 향상시킬 수 있다.
본 발명의 실시예에서의 기술적 방안을 더욱 명확하게 설명하기 위해, 이하에서는 실시예의 설명에 필요한 첨부도면을 간단히 설명한다. 명백하게, 이하의 설명에서의 첨부도면은 단지 본 발명의 일부 실시예를 보여줄 뿐이고, 해당 기술분야의 통상의 지식을 가진자(이하, 당업자라고 함)는 창의적인 노력없이도 이들 도면으로부터 다른 도면을 도출할 수 있다.
도 1은 PS 인코딩의 개략 원리도이다.
도 2는 PS 디코딩의 개략 원리도이다.
도 3은 본 발명의 일 실시예에 따른 IPD 파라미터 추출 방법의 개략 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 IPD 파라미터 추출 방법의 다른 개략 흐름도이다.
도 5는 다중 채널 신호 코딩에 사용되는 비트의 총량의 할당에 대한 개략도이다.
도 6a는 다중 채널 신호의 원래 신호 스펙트로그램이다.
도 6b는 원래의 신호 스펙트로그램을 디코딩하여 획득된 오디오 신호 스펙트로그램이다.
도 6c는 원래의 신호 스펙트로 램을 디코딩하여 획득된 다른 오디오 신호 스펙트로그램이다.
도 7은 본 발명의 일 실시예에 따른 IPD 파라미터 추출 장치의 개략 구성도이다.
도 8은 본 발명의 실시예에 따른 단말기의 개략 구성도이다.
이하, 본 발명의 실시예에서의 기술적 방안을, 본 발명의 실시예에서의 첨부 도면을 참조하여 명확하고 완전하게 설명한다. 명백하게, 설명된 실시예는 본 발명의 일부 실시예에 불과하고 전부는 아니다. 창의적인 노력없이 본 발명의 실시예에 기초하여 당업자에 의해 획득된 다른 모든 실시예는 본 발명의 보호 범위 내에 있다.
도 1은 PS 인코딩의 개략 원리도이다.
PS 인코딩에서, 인코더는 복수의 채널(예를 들어, x1 채널 및 x2 채널)에 의해 입력되는 스테레오 신호의 코드를 모노 오디오 신호로 다운믹스(downmix)하고, 공간 지각 파라미터 분석을 통해 스테레오 신호의 공간 지각 파라미터를 추출하고, 공각 지각 파라 미터를 인코딩하여 공간 지각 파라미터 비트스트림을 획득한다. 또한, 인코더는 모노 오디오 비트스트림과 공간 지각 파라미터 비트스트림을 다중화함으로써 스테레오 신호가 인코딩되어 있는 비트스트림을 획득한다.
도 2를 참조하면, 도 2는 PS 디코딩의 개략 원리도이다.
디코더는 스테레오 신호가 인코딩되어 있는 비트스트림을 역다중화하여 모노 오디오 비트스트림 및 공간 지각 파라미터 비트스트림을 획득한 다음, 모노 오디오 비트스트림에 대해 모노 오디오 신호 디코딩을 수행하고, 공간 지각 파라미터 비트스트림에 대해 공각 지각 파라미터 디코딩을 수행한다. 또한, 디코더는 모노 오디오 신호를 디코딩한 다음, 공간 지각 파라미터를 사용하여 스테레오 신호를 합성 하여 재구성한다.
구체적인 구현 시에, PS 인코딩 및 PS 디코딩에서 공간 지각 파라미터는 IC, ILD, ITD, IPD 등을 포함한다. IC는 채널 간의 코히어런스를 설명한다. 이 파라미터는 음장 범위(sound field range)의 지각을 결정하고, 오디오 신호의 공간감 및 음향 안정성을 향상시킬 수 있다. ILD는 스테레오 소스의 수평각을 식별하는 데 사용되며, 채널 간의 강도 차이를 설명한다. 이 파라미터는 스펙트럼의 모든 주파수 성분에 영향을 준다. ITD 및 IPD는 음원의 수평 방위를 나타내는 공간 지각 파라미터이다. ILD, ITD 및 IPD는 인간의 귀가 음원의 위치를 어떻게 지각하는지를 결정하는데, 이는 음장 위치를 효과적으로 결정할 수 있고 스테레오 신호 복원에 중요하다. 따라서 IPD와 같은 파라미터를 결정하는 것은 스테레오 신호 복원에 중요하다.
도 3 내지 도 8을 참조하여, 이하에 본 발명의 실시예에서 제공되는 IPD 파라미터 추출 방법 및 장치를 상세하게 설명한다.
도 3을 참조하면, 도 3은 본 발명의 일 실시예에 따른 IPD 파라미터 추출 방법의 개략 흐름도이다. 본 발명의 본 실시예에서 제공되는 방법은 다음의 단계들을 포함한다.
S101. 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터를 획득한다.
구체적인 구현 시에, 본 발명의 본 실시예에서 제공되는 IPD 파라미터 추출 방법은 다중 채널 신호 코딩을 위한 인코더에 의해 실행될 수 있다. 본 발명의 본 실시예에서 제공되는 IPD 파라미터 추출 방법에 따라 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출한 후, 인코더는 추출된 IPD 파라미터를 양자화하여 부호화할 수 있다. 디코딩을 통해 IPD 파라미터를 획득한 후, 디코더는 디코딩을 통해 획득된 IPD 파라미터를 사용하여 스테레오 합성 처리를 수행할 수 있다. 다음은 본 발명의 본 실시예에서 제공되는 IPD 파라미터 추출 방법을 상세하게 설명한다.
몇몇 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출할 때, 인코더는 먼저 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터를 획득할 수 있고, 그후 현재 프레임에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 수 있다. 다시 말해, 현재 프레임에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임의 다중 채널 신호의 IPD 파라미터와 같은 정보를 추출하는 방식을 결정하는 데 사용된다. 구체적인 구현 시에, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임의 신호 특성 파라미터 및 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터 중 적어도 하나를 포함한다. 구체적으로, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임의 신호 특성 파라미터, 또는 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터, 또는 현재 프레임의 신호 특성 파라미터 및 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터 등을 포함할 수 있다. 파라미터는 실제 적용 시나리오에 따라 구체적으로 결정될 수 있으며, 여기서 이를 한정하지 않는다. A는 1 이상의 정수이다. 구체적으로, 현재 프레임 이전의 A개의 프레임은, 예를 들어 현재 프레임 이전의 하나의 프레임, 두 개의 프레임, 또는 세 개의 프레임일 수 있다. 여기서 이를 한정하지 않는다.
구체적인 구현 시에, 현재 프레임의 신호 특성 파라미터는 현재 프레임의 좌우 채널 코히어런스 값, 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터, 현재 프레임의 부대역 IPD 분산, 현재 프레임의 신호 클래스, 및 현재 프레임의 ITD와 같은 파라미터 중 하나 이상을 포함할 수 있다. 현재 프레임의 좌우 채널 코히어런스 값, 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터 및 현재 프레임의 부대역 IPD 분산은 다중 채널 신호의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호에 기초하여 계산될 수 있다 . 현재 프레임의 ITD 파라미터는 현재 프레임의 다중 채널 신호에 대한 ITD 파라미터 추출 방식에 기초하여 인코더에 의해 결정될 수 있다. 현재 프레임에 대한 ITD 파라미터 추출 방식은 두 개 프로토콜에 제공된 추출 방식 또는 당업자에게 공지된 기존의 추출 방식을 포함할 수 있다. 여기서는 이를 한정하지 않는다.
현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터는 현재 프레임 이전의 A개의 프레임 각각의 좌우 채널 코히어런스 값, 현재 프레임 이전의 A개의 프레임 각각의 파라미터로서, 좌우 채널 코히런스를 나타내는 파라미터, 현재 프레임 이전의 A개의 프레임 각각의 부대역 IPD 분산, 현재 프레임 이전의 A개의 프레임 각각의 ITD, 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식 및 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스를 포함한다. 구체적으로, 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터는 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식, 또는 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스, 또는 현재 프레임 이전의 A개의 프레임 각각의 IPD 파라미터 추출 방식 및 신호 클래스 등을 포함할 수 있다. 신호 특성 파라미터는 실제 적용 시나리오에 따라 구체적으로 결정될 수 있으며, 여기서는 이를 한정하지 않는다. 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식은 멀티 채널 신호의 현재 프레임 이전의 A개의 프레임 각각에 대한 것이고, 현재 프레임의 다중 채널 신호 이전의 A개의 프레임 각각에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터, 표준 프로토콜에서 제공되는 IPD 파라미터 추출 방식, 또는 당업자에게 공지된 기존의 IPD 파라미터 추출 방식 등에 기초하여, 인코더에 의해 결정되는 IPD 파라미터 추출 방식을 포함할 수 있다. 여기서는 이를 한정하지 않는다. 신호 클래스는 음성 프레임 또는 음악 프레임을 포함할 수 있다.
일부 실현 가능한 구현예에서, 인코더는 현재 프레임의 다중 채널 신호의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호에 대해 시간-주파수 변환(time-to-frequency conversion)을 수행하여, 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호를 획득할 수 있다. 구체적으로, 시간-주파수 변환은 고속 푸리에 변환(Fast Fourier Transformation, FFT), 또는 수정 이산 코사인 변환(Modified Discrete Cosine Transformation, MDCT), 또는 다른 방식으로 구현될 수 있다. 여기서는 이를 한정하지 않는다. 시간-주파수 변환은 프레임 단위로 수행될 수도 있고, 서브프레임 단위로 수행될 수도 있다. 예를 들어, 인코더는 현재 프레임의 다중 채널 신호의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 FFT를 통해 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호로 변환할 수 있다. 구체적인 변환식에는 다음이 포함될 수 있다:
Figure pct00001
; 및
Figure pct00002
,
여기서 n은 시간 도메인 신호 인덱스 값이고, k는 주파수 도메인 신호 인덱스 값이고,
Figure pct00003
는 프레임 길이이고,
Figure pct00004
은 시간 도메인 신호를 주파수 도메인 신호로 변환하기 위한 시간-주파수 변환 길이이고,
Figure pct00005
Figure pct00006
는 각각 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호이고,
Figure pct00007
Figure pct00008
는 각각 IPD 파라미터를 계산하는 데 사용되는 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 k번째(제k) 주파수 값이다.
실수 시퀀스 x(n)(
Figure pct00009
또는
Figure pct00010
포함함)의 푸리에 변환 계수 X(k)는 복소수이다. X(k)의 실수부는 우수 대칭(even symmetry)이고, X(k)의 허수부는 기수 대칭(odd symmetry)이다. 다시말해, X(k)는 다음과 같은 공액 대칭(conjugate symmetry)이다. X(0)과 X(N/2)는 모두 실수이며 다음 관계식이 성립한다:
Figure pct00011
Figure pct00012
.
이산 퓨리에 변환 계산 시에, 공액 대칭에 의해, X(k), 또는
Figure pct00013
, 또는 X(0) 및 X(L/2)의 허수부를 계산하거나 저장할 필요가 없을 수 있고, X(0) 내지 X(L/2)만 계산할 필요가 있다.
현재 프레임의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호로 변환한 후, 인코더는 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호에 기초하여 현재 프레임의 좌우 채널 코히어런스 값을 계산할 수 있다. 구체적으로, 좌우 채널 코히어런스 값의 표현식은 다음과 같다:
Figure pct00014
여기서
Figure pct00015
은 시간 도메인 신호를 주파수 도메인 신호로 변환하기 위한 시간-주파수 변환 길이이고,
Figure pct00016
Figure pct00017
는 각각 IPD 파라미터를 계산하는 데 사용되는 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 제k 주파수 값이다.
Figure pct00018
Figure pct00019
의 공액 (conjugate), 즉
Figure pct00020
는 우 채절 주파수 도메인 신호의 제k 주파수 값의 공액이다.
일부 실현 가능한 구현예에서, 현재 프레임의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 프레임 단위 또는 서브 프레임 단위로, 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호로 변환한 후, 인코더는 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호에 기초하여, 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터를 계산할 수 있다. 구체적으로, 좌우 채널 코히어런스를 나타내는 파라미터에 대한 표현식은 다음과 같다:
Figure pct00021
;
Figure pct00022
;
Figure pct00023
;
Figure pct00024
; 및
Figure pct00025
,
여기서
Figure pct00026
Figure pct00027
는 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 제k 주파수 값이고,
Figure pct00028
Figure pct00029
는 각각 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 제k 주파수 값의 실수부이고,
Figure pct00030
Figure pct00031
는 각각 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 제k 주파수 값의 허수부이고, L은 부대역 공간 계수의 수량이고, N은 부대역의 수량이다.
또는, 좌우 채널 코히어런스를 나타내는 파라미터에 대한 표현식은 다음과 같다:
Figure pct00032
,
여기서 L은 전부 또는 일부 주파수 대역의 스펙트럼 계수의 수량이다.
또는, 좌우 채널 코히어런스를 나타내는 파라미터에 대한 표현식은 다음과 같다:
Figure pct00033
.
일부 실현 가능한 구현예에서, 현재 프레임의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호로 변환한 후, 인코더는 추가로 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호에 기초하여 현재 프레임의 부대역 IPD 분산을 계산할 수 있다. 구체적으로, 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호는 먼저 둘 이상의 부대역(즉, 복수의 부대역)로 분할될 수 있다. Nsubband개의 부대역이 있다고 가정하며, 여기서 Nsubband는 2보다 큰 정수이다. 또한, 각각의 부대역의 IPD 파라미터는 나눗셈을 통해 획득되는 각각의 부대역의 주파수 도메인 신호에 기초하여 계산될 수 있고, 현재 프레임의 부대역의 IPD 분산은 각각의 부대역의 IPD 파라미터에 기초하여 계산될 수 있다. 제b 부대역의 경우, 여기서 b는 0 이상이고 N보다 작은 정수이고, 제b 부대역은 주파수
Figure pct00034
를 포함하고, 제b 부대역의 IPD 파라미터는 다음의 표현식을 사용하여 계산될 수 있다:
Figure pct00035
,
여기서
Figure pct00036
는 좌 채널 주파수 도메인 신호이고,
Figure pct00037
는 우 채널 주파수 도메인 신호의 제k 주파수 값의 공액이다.
인코더가 전술한 표현식에 기초하여 각각의 부대역의 IPD 파라미터를 계산한 다음, 각각의 부대역의 IPD 파라미터에 기초하여 현재 프레임의 부대역 IPD 분산을 계산할 수 있다. 부대역 IPD 분산은 다음 표현식을 사용하여 계산될 수 있다:
Figure pct00038
, 여기서
Figure pct00039
; 및
Figure pct00040
.
인코더가 현재 프레임의 좌우 채널 코히어런스 값 및 현재 프레임의 부대역 IPD 분산을 획득한 후, 인코더는 현재 프레임의 좌우 채널 코히어런스 값과 현재 프레임의 부대역 IPD 분산에 기초하여 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 필요가 있으면, 인코더는 는 현재 프레임의 좌우 채널 코히어런스 값과 현재 프레임의 부대역 IPD 분산을 사용하여 직접 IPD 파라미터 추출 방식을 결정할 수 있다.
인코더가 현재 프레임의 파라미터를 결정하고, 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터 및 현재 프레임의 부대역 IPD 분산을 결정한 후, 인코더가 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터 및 현재 프레임의 부대역 IPD 분산에 기초하여 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 필요가 있으면, 인코더는 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터 및 현재 프레임의 부대역 IPD 분산을 사용하여 IPD 파라미터 추출 방식을 직접 결정할 수 있다,
S102. 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정한다.
구체적인 구현 시에, 본 발명의 본 실시예에서 제공되는 IPD 파라미터 추출 방법에서, 인코더는 현재 프레임의 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 적응적으로 선택할 수 있다. 즉, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식으로서 복수의 미리 설정된 IPD 파라미터 추출 방식 중 하나를 선택할 수 있다. 복수의 미리 설정된 IPD 파라미터 추출 방식은 제1 추출 방식 및 제2 추출 방식을 포함할 수 있다. 제1 추출 방식은 그룹 IPD를 추출하는 것, 또는 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하지 않는 것, 또는 현재 프레임의 다중 채널 신호의 IPD 파라미터를 0으로 설정하는 것을 포함할 수 있다. 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하는 것, 부대역 IPD 파라미터를 추출하는 것 등을 포함할 수 있다. 단계 S103과 결합하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정하고 다양한 IPD 파라미터 추출 방식에 대응하는 IPD 파라미터 추출하는 구현예를 이하에 설명한다.
S103. 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식에 기초하여 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출한다.
일부 실현 가능한 구현예에서, 인코더는 먼저 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인지를 판정할 수 있다. IPD 파라미터 추출 방식이 제1 추출 방식이면, 인코더는 대응하는 추출 방식에 기초하여, 현재 프레임의 다중 채널 신호의 그룹 IPD를 추출하거나, IPD 파라미터를 추출하지 않거나, 현재 프레임의 다중 채널 신호의 IPD 파라미터를 0으로 설정한다. IPD 파라미터 추출 방식이 제1 추출 방식이 아니면, 인코더는 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 세트 IPD 파라미터를 추출하거나 부대역 IPD 파라미터를 추출하는 것으로 직접 결정할 수 있다. 이 경우, 실제로 적용 시에, 제2 추출 방식이 두 가지 추출 방식 중 하나인 것으로 결정되었을 수 있고, 따라서 일단 제2 추출 방식이 사용되는 것으로 결정되면 두 가지 추출 방식 중 어느 하나가 구체적으로 사용되는지가 결정될 수 있다. 또는, 인코더는 추가로, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 세트 IPD를 추출하는 것인지 또는 부대역 IPD 파라미터를 추출하는 것인지를 결정할 수 있다.
일부 실현 가능한 구현예에서, 인코더에 의해 획득되고 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터가 현재 프레임의 좌우 채널 코히어런스 값 및 현재 프레임의 부대역 IPD 분산을 포함하면, 현재 프레임의 좌우 채널 코히어런스 값은 미리 정의된 제1 임계 값과 비교될 수 있고, 현재 프레임의 부대역 IPD 분산은 미리 정의된 제2 임계 값과 비교될 수 있다. 미리 정의된 제1 임계 값의 범위는 [0.6, 0.95]이고, 미리 정의된 제2 임계 값의 범위는 [0.05, 0.5]이다. 구체적인 구현 시에, 제1 임계 값은 0.89, 0.8, 0.75 등일 수 있다. 0.89는 최대 값일 수 있고, 0.8은 중간 값일 수 있고, 0.75는 최소 값일 수 있다. 제1 임계 값은 실제 적용 시나리오에 따라 구체적으로 결정될 수 있으며, 여기서는 이를 한정하지 않는다. 제2 임계 값은 0.45, 0.25, 0.3 등일 수 있다. 0.45는 최대 값일 수 있고, 0.3은 중간 값일 수 있고, 0.25는 최소 값일 수 있다. 제2 임계 값은 실제 적용 시나리오에 따라 구체적으로 결정될 수 있으며, 여기서는 이를 한정하지 않는다. 현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값보다 크고, 현재 프레임의 부대역 IPD 분산 값이 제2 임계 값보다 작은 것을 비교를 통해 알게 되면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 제1 방식이다. 그렇지 않으면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니라고 결정한다.
선택적으로, 일부 실현 가능한 구현예에서, 인코더에 의해 획득되고 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터가 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터이면, 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터의 값은 미리 정의된 제1 임계 값과 비교될 수 있다. 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터의 값이 제1 임계 값보다 크면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정된다. 예를 들어, 현재 프레임의 다중 채널 신호의 IPD 파라미터를 0으로 설정할 수 있거나, 그룹 IPD를 추출할 수 있거나, 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하지 않을 수 있다. 제1 임계 값의 값 범위 및 구체적인 값은 전술한 값일 수 있다. 예를 들어, 제1 임계 값은 0.75일 수 있다.
선택적으로, 일부 실현 가능한 구현에서, 인코더에 의해 획득되고 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터가 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식 및 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스를 포함하는, 현재 프레임 이전의 A개의 프레임 각각의 신호 특징 파라미터이면, 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식이 미리 설정된 IPD 파라미터 추출 방식인지, 및 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 미리 설정된 신호 클래스인지를 판정할 수 있다. 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이고, 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 음악 프레임이면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 제1 추출 방식인 것으로 결정될 수 있다.
예를 들어, A=1일 때, 현재 프레임 이전의 A개의 프레임은 현재 프레임 이전의 하나의 프레임이다. 현재 프레임 이전의 하나의 프레임에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이고, 현재 프레임 이전의 하나의 프레임의 신호 클래스가 음악 프레임이면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정될 수 있다. 그렇지 않으면, 다중 채널 신호의 현재 프레임에 대한 IPD 파라미터 추출 방식은 제1 추출 방식이 아닌 것으로 결정된다.
A=2일 때, 현재 프레임 이전의 A개의 프레임은 현재 프레임 이전의 두 개의 프레임이다. 현재 프레임 이전의 두 개의 프레임 각각에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이고, 현재 프레임 이전의 두 개의 프레임 각각의 신호 클래스가 음악 프레임이면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정될 수 있다. 그렇지 않으면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 제1 추출 방식이 아닌 것으로 결정된다.
일부 실현 가능한 구현예에서, 인코더에 의해 획득되고 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터가 현재 프레임의 ITD 파라미터, 현재 프레임의 부대역 IPD 분산, 및 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스를 포함하면, 현재 프레임의 ITD 파라미터의 절대 값은 미리 정의된 제3 임계 값과 비교될 수 있고, 현재 프레임의 부대역 IPD 분산은 미리 정의된 제4 임계 값과 비교될 수 있다. 또한, 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 타깃 신호 클래스인지를 더 판정할 수 있다. 미리 정의된 제3 임계 값은 [0, 4]이고, 미리 정의된 제4 임계 값의 값 범위는 [0.05, 0.4]이다. 제3 임계 값은 4, 2, 0 등이 될 수 있다. 4는 최대 값일 수 있고, 2는 중간 값일 수 있고, 0은 최소값일 수 있다. 제3 임계 값은 실제 적용 시나리오에 따라 구체적으로 결정될 수 있으며, 여기서는 이를 한정하지 않는다. 제4 임계 값은 0.4, 0.35, 0.25 등일 수 있다. 0.4는 최대 값일 수 있고, 0.35는 중간 값일 수 있고, 0.25는 최소값일 수 있다. 제4 임계 값은 실제 적용 시나리오에 따라 구체적으로 결정될 수 있으며, 여기서는 이를 한정하지 않는다. 타깃 신호 클래스는 음성 프레임이다. 비교를 통해, 현재 프레임의 ITD 파라미터의 절대 값이 제3 임계 값보다 크다는 ㄱ것을 알게되면, 현재 프레임의 부대역 IPD 분산은 제4 임계 값보다 작고, 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 음성 프레임이면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 제1 추출 방식인 것으로 결정될 수 있다. 그렇지 않으면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 제1 추출 방식이 아닌 것으로 결정한다.
현재 프레임 이전의 A개의 프레임은 현재 프레임 이전의 하나의 프레임, 현재의 프레임 이전의 두 개의 프레임, 현재의 프레임 이전의 세 개의 프레임 등을 포함할 수 있다. 여기서는 이를 한정되지 않는다. 현재 프레임 이전의 A개의 프레임이 현재 프레임 이전의 하나의 프레임이면, 현재 프레임 이전의 하나의 프레임의 ITD 파라미터의 절대 값이 제3 임계 값보다 크고, 현재 프레임의 부대역 IPD 분산이 제4 임계 값보다 작고, 현재 프레임 이전의 하나의 프레임의 신호 클래스가 음성 프레임인 경우, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 그룹 IPD를 추출하는 것으로 결정할 수 있다. 현재 프레임 이전의 A개의 프레임이 현재 프레임 이전의 복수의 프레임이면, 현재 프레임의 ITD 파라미터의 절대 값이 제3 임계 값보다 크고, 현재 프레임의 부대역 IPD 분산이 제4 임계 값보다 작고, 현재 프레임 이전의 복수의 프레임 각각의 신호 클래스가 음성 프레임인 경우, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 제1 추출 방식인 것으로 결정될 수 있다.
일부 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정한 후, 인코더는 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식의 플래그 비트를 인코딩한 다음, 상이한 방식으로 상이한 추출 방식에 기초하여 현재 프레임의 다중 채널 신호의 IPD 파라미터를 양자화한다.
일부 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정한 후, 인코더는 제1 추출 방식에 기초하여 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출할 수 있다. 구체적으로, 제1 추출 방식이 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하지 않는 것이면, 어떠한 작업도 수행되지 않고, 현재 프레임의 IPD 파라미터의 추출에 대응하는 처리가 종료된다. 제1 추출 방식이 현재 프레임의 다중 채널 신호의 IPD 파라미터를 0으로 설정하는 것이면, 현재 프레임의 다중 채널 신호의 추출된 IPD 파라미터의 값은 0으로 설정된다. 제1 추출 방식이 현재 프레임의 다중 채널 신호의 그룹 IPD 파라미터를 추출하는 것이면, 그룹 IPD 파라미터를 추출하는 방식에 기초하여 현재 프레임의 다중 채널 신호의 그룹 IPD가 추출될 수 있다. 현재 프레임의 다중 채널 신호의 추출된 그룹 IPD는 현재 프레임의 다중 채널 신호의 IPD 파라미터로서 사용된다. 구체적으로, 인코더는 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 적어도 일부 부대역의 IPD 파라미터를 추출할 수 있다. 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 적어도 일부 부대역은 구체적으로, 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호를 나눔으로써 획득되는 Nsubband 부대역의 전부 또는 일부를 포함할 수 있다. 여기서는 이를 한정하지 않는다. 구체적인 구현 시에, 사용자는 다중 채널 신호 코딩에 대한 코딩 요건, 예를 들어, 코딩 레이트 또는 코딩 품질에 기초하여, 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 전체 주파수 도메인 범위 내의 주파수 도메인 신호, 즉 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 모든 부대역의 주파수 도메인 신호; 또는 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 특정 주파수 도메인 범위, 즉 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호 중의 일부 프레임의 주파수 도메인 신호를 포함하는, 현재의 프레임의 다중 채널 신호의 그룹 IPD를 추출하는 데 사용되는 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 주파수 도메인 범위를 결정할 수 있다. 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호 내의 일부 프레임의 주파수 도메인 신호는 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 일부 부대역의 주파수 도메인 신호에 포함된다.
일부 가능한 구현예에서, 인코더가 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 그룹 IPD를 추출하는 데 사용되는, 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 주파수 도메인 범위가 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 전체 주파수 도메인 범위인 것으로 결정하면, 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 모든 부대역의 IPD 파라미터(즉, 현재 프레임의 Nsubband 부대역)이 추출될 수 있고, 부대역의 모든 추출된 IPD 파라미터의 평균이 계산될 수 있고, 그후 부대역의 모든 추출된 IPD 파라미터의 평균이 현재 프레임의 다중 채널 신호의 그룹 IPD로서 사용될 수 있다. 현재 프레임의 다중 채널 신호의 그룹 IPD는 다음 공식에 기초하여 추출된다:
Figure pct00041
,
여기서 G_IPD는 현재 프레임의 다중 채널 신호의 그룹 IPD이고, IPD(b)는 b번째(제b) 부대역의 IPD 파라미터이다.
일부 실현 가능한 구현예에서, 인코더가, 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 그룹 IPD를 추출하는 데 사용되는 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 주파수 도메인 범위가, 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 특정 주파수 도메인 범위, 예를 들어 [k1, k2], 즉 k1 번째(제k1) 주파수와 k2 번째(제k2) 주파수 사이의 주파수 도메인 신호인 것으로 결정하면, 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 일부 부대역(즉, 제k1 주파수와 제k2 주파수 사이의 주파수 도메인 신호가 속하는 부대역)의 IPD 파라미터가 추출될 수 있고, 부대역의 모든 추출된 IPD 파라미터의 평균값이 계산될 수 있으며, 그후, 부대역의 모든 IPD 파라미터의 획득된 평균값이 현재 프레임의 다중 채널 신호의 그룹 IPD로서 사용될 수 있다.
구체적인 구현 시에, 제k1 주파수와 제k2 주파수 사이의 주파수 도메인 신호가 속하는 부대역의 IPD 파라미터는 모든 주파수의 IPD 파라미터로서 미리 정의될 수 있다. 이 경우, 부대역의 IPD 파라미터의 계산은 모든 주파수의 IPD 파라미터의 계산으로 치환될 수 있고, 현재 프레임의 다중 채널 신호의 그룹 IP를 계산하기 위해, 각각의 주파수의 IPD 파라미터는 각각의 부대역의 IPD 파라미터로서 계산된다. 미리 설정된 주파수 도메인 범위 [k1, k2] 내의 모든 주파수의 IPD 파라미터는 다음 방식으로 하나씩 계산된다:
Figure pct00042
,
여기서
Figure pct00043
는 좌 채널 주파수 도메인 신호의 제k 주파수 값이고,
Figure pct00044
는 우 채널 주파수 도메인 신호의 제k 주파수 값의 공액이다.
또한, 그룹 IPD 파라미터를 획득하기 위해, 미리 설정된 범위(다중 채널 주파수 도메인 신호의 신호 중, 현재 프레임 및 현재 프레임 이전의 A개 프레임을 포함하는 복수의 프레임)에서 IPD(k)에 대해 통계 처리가 수행된다.
예를 들어, 특정 주파수 도메인 범위 [k1, k2]가 6개 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호 각각의 선택 범위이면, 6개 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호 각각 내의 (k2-k1+1)개의 주파수의 IPD 파라미터의 평균이 계산될 수 있다. 계산식은 다음과 같다:
Figure pct00045
.
또한, 현재 프레임을 포함하는 6개의 연속적인 프레임의 IPD 파라미터의 평균이 계산되어 현재 프레임의 다중 채널 신호의 그룹 IPD로서 사용될 수 있다:
Figure pct00046
,
여기서
Figure pct00047
는 현재 프레임에 인접한 하나의 이전 프레임의 IPD 파라미터의 평균이고,
Figure pct00048
는 현재 프레임 이전의 두 개의 프레임의 IPD 파라미터의 평균 등이다.
일부 실현 가능한 구현예에서, 인코더가 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니라고 결정하면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 세트 IPD 파라미터를 추출하거나 부대역 IPD 파라미터를 추출하는 것이라고 직접 결정될 수 있다.
일부 실현 가능한 구현예에서, 인코더가 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니라고 결정하면, 인코더는 추가로, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 수 있다. 구체적으로, 인코더는 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 둘 이상의 부대역 세트(즉, 복수의 부대역 세트)로 분류할 수 있다. 각각의 부대역 세트는 하나 이상의 부대역을 포함한다. 또한, 인코더는 각각의 부대역 세트의 부대역 IPD 분산을 획득할 수 있다. 각각의 부대역 세트의 부대역 IPD 분산이 제2 임계 값보다 작고, 현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값보다 크면, 인코더는 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 세트 IPD 파라미터를 추출하는 것이라고 결정할 수 있다. 그러면, 인코더는 각각의 부대역 세트의 IPD 파라미터를 계산할 수 있고, 각각의 부대역 세트의 획득된 IPD 파라미터를 현재 프레임의 다중 채널 신호의 IPD 파라미터로서 사용할 수 있다.
일부 실현 가능한 구현예에서, 인코더가 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니라고 결정하면, 인코더는 또한 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 수 있다. 구체적으로, 인코더는 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 둘 이상의 부대역 세트(즉, 복수의 부대역 세트)로 분류할 수 있다. 각각의 부대역 세트는 하나 이상의 부대역을 포함한다. 또한, 인코더는 각각의 부대역 세트의 부대역 IPD 분산을 획득할 수 있다. 각각 부대역 세트의 부대역 IPD 분산이 제2 임계 값보다 작고, 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터의 값이 제1 임계 값보다 크면, 인코더는 현재 프레임의 다중 채널 신호에 대한 파라미터 추출 방식이 부대역 세트 IPD 파라미터를 추출하는 것이라고 결정할 수 있다. 그러면, 인코더는 각각의 부대역 세트의 IPD 파라미터를 계산할 수 있고, 각각의 부대역 세트의 획득된 IPD 파라미터를 현재 프레임의 다중 채널 신호의 IPD 파라미터로서 사용할 수 있다.
예를 들어, 도 4를 참조하면, 도 4는 본 발명의 일 실시예에 따른 IPD 파라미터 추출 방법의 다른 개략 흐름도이다. 이 방법은 다음 단계를 포함한다.
S201. 현재 프레임의 좌우 채널 코히어런스 값과 현재 프레임의 부대역 IPD 분산을 계산한다.
일부 구현예에서, 단계 S201은, 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터의 값, 및 현재 프레임의 부대역 IPD 분산을 결정할 수 있다.
S202. 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인지를 판정하고; 판정 결과가 예(yes)이면 단계 S203을 수행하고; 그렇지 않으면(no), 단계 S205를 수행한다.
인코더는 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호와 현재 프레임의 부대역 IPD 분산 사이의 좌우 채널 코히어런스 값에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인지를 판정할 수 있다. 구체적인 판정 방법에 대해서는 전술한 실시예를 참조하고, 여기서는 세부사항을 다시 설명하지 않는다.
또는, 인코더는, 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터의 값, 및 현재 프레임의 부대역 IPD 분산에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인지를 판정할 수 있다. 구체적인 판정 방법에 대해서는 전술한 실시예를 참조하고, 여기서는 세부사항을 다시 설명하지 않는다.
S203. 현재 프레임의 다중 채널 신호의 그룹 IPD를 추출한다.
S204. 그룹 IPD를 양자화 및 인코딩한다.
인코더가 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 그룹 IPD를 추출하는 것이라고 결정하면, 인코더는 현재 프레임의 다중 채널 신호의 그룹 IPD를 추출할 수 있다. 구체적인 추출 방식에 대해서는 전술한 실시예를 참조하고 여기서는 세부사항을 다시 설명하지 않는다. 현재 프레임의 다중 채널 신호의 그룹 IPD를 추출한 후, 인코더는 그룹 IPD에 대해 양자화 및 인코딩과 같은 작업을 수행할 수 있다. 구체적인 양자화 및 인코딩 방식에 대해서는 표준 프로토콜에 기재된 구현 방식을 참조하고, 여기서는 세부사항을 설명하지 않는다.
S205. P1개의 부대역의 부대역 IPD 분산과 P2개의 부대역의 부대역 IPD 분산을 계산한다.
S206. 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 2개의 IPD 파라미터를 추출하는 것인지를 판정하고; 판정 결과가 예이면 단계 S207을 수행하고; 그렇지 않다면, 단계 S209를 수행한다.
인코더가 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 그룹 IPD를 추출하지 않는 것이라고 결정하면, 인코더는 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 부대역 세트 1(부대역 세트 1은 P1개의 부대역을 포함함) 및 부대역 세트 2 (부대역 세트 2는 P2개의 부대역을 포함함)를 포함하는 두 개의 부대역 세트로 분류할 수 있고, 그후 부대역 세트 1(즉, P1개의 부대역)의 IPD 분산(제1 분산이라고 함) 및 부대역 세트 2(즉, P2개의 부대역)의 IPD 분산(제2 분산이라고 함)을 계산할 수 있다. P1과 P2의 합은 Nsubband와 같다. 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호 사이의 좌우 채널 코히어런스 값이 제1 임계 값보다 크고, 제1 분산 및 제2 분산 모두가 제2 임계 값보다 작은 경우, 인코더는 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 두 개의 IPD 파라미터를 추출하는 것, 즉 두 개의 부대역 세트의 IPD 파라미터를 추출하는 것이라고 결정한다. 또는, 현재 프레임의 파라미터로서, 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호 사이의 좌우 채널 코히어런스를 나타내는 파라미터의 값이 제1 임계 값보다 크고, 제1 분산 및 제2 분산 양자 모두가 제2 임계 값보다 작은 경우, 인코더는 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 두 개의 IPD 파라미터를 추출, 즉 두 개의 부대역 세트의 IPD 파라미터를 추출하는 것이라고 결정한다.
제1 분산은 다음 방식으로 계산된다:
Figure pct00049
, 여기서
Figure pct00050
.
제2 분산은 다음 방식으로 계산된다:
Figure pct00051
, 여기서
Figure pct00052
.
S207. 제1 IPD 파라미터와 제2 IPD 파라미터를 계산한다.
S208. 제1 IPD 파라미터와 제2 IPD 파라미터를 양자화하고 인코딩한다.
또한, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 두 개의 IPD 파라미터를 추출하는 것이라고 결정한 후, 인코더는 부대역 세트 1에 대응하는 제1 IPD 파라미터와 부대역 세트 2에 대응하는 제2 IPD 파라미터를 별도로 계산할 수 있다. 제1 IPD 파라미터를 계산하는 방법 및 제2 IPD 파라미터를 계산하는 방법은 그룹 IPD를 계산하는 방법과 동일할 수 있다. 자세한 것은 전술한 실시예를 참조하고, 여기서는 세부사항을 다시 설명하지 않는다. 제1 IPD 파라미터 및 제2 IPD 파라미터를 계산한 후, 인코더는 제1 IPD 파라미터 및 제2 IPD 파라미터를 양자화하고 인코딩할 수 있다. 구체적인 양자화 및 인코딩 방식에 대해서는 표준 프로토콜에 설명된 구현 방식을 참조하고, 여기서는 세부사항을 설명하지 않는다.
S209. P3개의 부대역의 부대역 IPD 분산 및 P4개의 부대역의 부대역 IPD 분산을 계산한다.
S210. 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 세 개의 IPD 파라미터를 추출하는 것인지를 판정하고; 판정 결과가 예(yes)이면 단계 S211을 수행하고; 그렇지 않으면(no), 단계 S213을 수행한다.
또한, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 두 개의 IPD 파라미터를 추출하는 것이 아니면, 부대역 세트 1은 더욱 세분한 부대역 세트(예를 들어, 부대역 세트 3 및 부대역 세트 4, 여기서 부대역 세트 3은 P3개의 부대역을 포함하고, 부대역 세트 4는 P4개의 부대역을 포함하고, P3+P4=1)를 얻기 위해 분할될 수 있다. 그후, 모든 부대역 세트(부대역 세트 2, 부대역 세트 3 및 부대역 세트 4)의 부대역 IPD 분산이 계산될 수 있다. 부대역 IPD 분산은 제2 분산, 제3 분산 및 제4 분산을 포함한다. 제3 분산(즉, P3개의 부대역의 부대역 IPD 분산) 및 제4 분산(즉, P4개의 부대역의 부대역 IPD 분산)을 계산하는 방식에 대해서는, 제1 분산 및 제2 분산을 계산하는 전술한 방식을 참조하고, 여기서는 세부사항을 다시 설명하지 않는다. 현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값보다 크고, 제2 분산, 제3 분산 및 제4 분산이 모두 제2 임계 값보다 작은 경우, 인코더는 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 세 개의 IPD 파라미터를 추출하는 것이라고 결정한다.
S211. 제2 IPD 파라미터, 제3 IPD 파라미터 및 제4 IPD 파라미터를 계산한다.
S212. 제2 IPD 파라미터, 제3 IPD 파라미터 및 제4 IPD 파라미터를 양자화하고 인코딩한다.
현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 세 개의 IPD 파라미터를 추출하는 것이라고 결정한 후, 인코더는 부대역 세트 2에 대응하는 제2 IPD 파라미터, 부대역 세트 3에 대응하는 제3 IPD 파라미터 및 부대역 세트 4에 대응하는 제4 IPD 파라미터를 개별적으로 추출할 수 있고, 그후 제2 IPD 파라미터, 제3 IPD 파라미터 및 제4 IPD 파라미터를 양자화하고 인코딩할 수 있다. 구체적인 양자화 및 인코딩 방식에 대해서는 표준 프로토콜에 설명된 구현 방식을 참조하고, 여기서는 세부사항을 설명하지 않는다. 제2 IPD 파라미터, 제3 IPD 파라미터 및 제4 IPD 파라미터를 계산하는 방법은 전술한 그룹 IPD를 계산하는 방법과 동일할 수 있다. 자세한 것은 전술한 실시예를 참조하고, 여기서는 세부사항을 다시 형명하지 않는다.
제3 분산은 다음 방식으로 계산된다:
Figure pct00053
, 여기서
Figure pct00054
.
제4 분산은 다음 방식으로 계산된다:
Figure pct00055
, 여기서
Figure pct00056
, 여기서
1=P3, P4<P1 및 P3+P4=P1.
S213. K개의 IPD 파라미터를 계산한다.
S214. K개의 IPD 파라미터를 양자화하고 인코딩한다.
유의해야 할 것은, 본 발명의 본 실시예는 제1 IPD 파라미터, 제2 IPD 파라미터, 제3 IPD 파라미터 및 제4 IPD 파라미터의 추출하는 것으로 한정되지 않는다는 것이다. 제3 분산, 제4 분산 및 제2 분산 중 어느 하나가 조건을 충족시키지 못하는 경우, K개의 IPD 파라미터를 계산하고 K개의 IPD 파라미터를 양자화 및 인코딩하기 위해, 계산 범위를 더 줄일 수 있다. M개의 IPD 추출 방법이 최종적으로 구현된다. K와 M은 모두 4 이상이고 Nsubband 이하의 정수이다.
선택적으로, 몇몇 선택적 구현예에서, 인코더가 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니라고 결정하면, 인코더는 모든 부대역 세트의 부대역 IPD 분산을 획득할을 수 있고, 모든 부대역 세트의 획득된 부대역 IPD 분산 중 하나 이상이 제2 임계 값보다 크거나, 또는 현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값보다 이하인 경우, 인코더는 현재 프레임의 다중 채널 신호에 대한 파라미터 추출 방식이 부대역 세트 IPD 파라미터 추출 방식이라고 결정할 수 있다. 그러면, 인코더는 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호에 기초하여 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 모든 부대역의 IPD 파라미터를 계산하고, 모든 부대역의 추출된 IPD 파라미터를 현재 프레임의 다중 채널 신호의 IPD 파라미터로서 사용할 수 있다. 다시 말해, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니라고 결정한 후, 인코더는 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 모든 Nsubband개의 부대역의 IPD 파라미터를 계산한 다음, Nsubband개의 부대역의 IPD 파라미터를 현재 서브 프레임의 다중 채널 신호의 IPD 파라미터로서 결정할 수 있다. 모든 부대역의 IPD 파라미터를 계산하는 방법에 대해서는, 전술한 구현예를 참조하고, 여기서는 세부사항을 다시 설명하지 않는다.
선택적으로, 몇몇 선택적 구현예에서, 인코더가 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니라고 결정하면, 인코더는 모든 부대역 세트의 부대역 IPD 분산을 획득할 수 있고, 모든 부대역 세트의 획득된 부대역 IPD 분산 중 하나 이상이 제2 임계 값보다 크거나, 또는 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터의 값이 제1 임계 값이하이면, 인코더는 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 세트 IPD 파라미터를 추출하는 것이라고 결정할 수 있다. 그러면, 인코더는 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호에 기초하여 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 모든 부대역의 IPD 파라미터를 계산하고, 모든 부대역의 추출된 IPD 파라미터를 현재 프레임의 다중 채널 신호의 IPD 파라미터로서 사용할 수 있다. 다시 말해, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니라고 결정한 후, 인코더는 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 모든 Nsubband개의 부대역의 IPD 파라미터를 계산한 다음, Nsubband개의 부대역의 IPD 파라미터를 현재 프레임의 다중 채널 신호의 IPD 파라미터로서 결정할 수 있다. 모든 부대역의 IPD 파라미터를 계산하는 방식에 대해서는 전술한 구현예를 참조하고, 여기서는 세부사항을 다시 설명하지 않는다.
도 5를 참조하면, 도 5는 다중 채널 신호 코딩에 사용되는 총 비트량의 할당에 대한 개략도이다. 본 발명의 본 실시예에서, 다중 채널 신호 코딩에 사용되는 된 총 비트량이 변하지 않는(즉, N1+M1=N2+M2) 적용 시나리오에서, 그룹 IPD 파라미터 추출 방식이 사용되는 경우, IPD 파라미터 코딩에 의해 점유되는 비트의 수량이 감소될 수 있고, 더 많은 비트가 다른 파라미터의 코딩에 사용될 수 있어, 코딩 품질을 유지하면서 코딩 레이트를 감소시키고; 부대역 IPD 파라미터를 추출하는 방식 (부대역 세트 IPD 파라미터를 추출하고 부대역 IPD 파라미터를 추출하는 것을 포함 함)이 사용되는 경우, IPD 파라미터 코딩에 의해 점유되는 비트의 수량은 그룹 IPD 파라미터를 추출하는 방식이 사용되는 경우보다 많고, 코딩 레이트를 유지하면서 코딩 품질을 향상시키기 위해 IPD 파라미터 추출 방식이 적응적으로 선택될 수 있다. N1은 부대역 IPD 파라미터의 코딩에 사용되는 비트 수량이고, M1은 부대역 IPD 파라미터 이외의 파라미터의 코딩에 사용되는 현재 프레임의 비트 수량이고, N2는 부대역 IPD 파라미터의 코딩에 사용되는 비트 수량이고, M2는 그룹 IPD 파라미터 이외의 파라미터의 코딩에 사용되는 현재 프레임의 비트 수량이고, N1, N2, M1 및 M2는 양의 정수이다.
도 6a 내지도 6c는 코딩을위한 총 비트 수량은 변하지 않는다는 전제하에, 본 발명의 본 실시예에서 제공되는 IPD 파라미터 추출 방법(그룹 IPD 파라미터를 추출하는 방식과 부대역 IPD 파라미터를 추출하는 방식 사이의 적응적 스위칭, 여기서 IPD 파라미터 추출 방식은 현재의 프레임에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여 적응적으로 결정됨) 및 코딩을 위한 총 비트 수량이 변하지 않는다는 전제하에 존재하는 기술 (N 부대역 부대역의 부대역 IPD 파라미터를 추출)과, 기존 기술(Nsubband개의 부대역의 부대역 IPD 파라미터를 추출함)의 효과를 비교하기 위한 스펙트로그램을 보여준다. 도 6a는 다중 채널 신호의 원래 신호 스펙트로그램이며, 원래의 신호는 고조파 신호이다. 도 6b는 기존의 기술을 이용하여 추출되어 인코딩된 IPD 파라미터를 대응하는 디코딩 알고리즘에 따라 디코더로 디코딩함으로써 획득된 오디오 신호 스펙트로그램이다. 도 6b에 도시된 바와 같이, 원래 신호의 고주파 부분(원 부분)의 고조파 성분은 디코더에 의해 원래 신호를 디코딩함으로써 획득된 오디오 신호에 복원되어 있지 않으므로, 오디오 신호는 듣기에 비교적 강한 잡음감을 야기하여, 인간의 귀에 불편함을 야기한다. 도 6c는 본 발명의 본 실시예에서 제공된 방법으로 추출되어 인코딩된 IPD 파라미터를, 대응하는 디코딩 알고리즘에 기초한 디코더에 의해 디코딩함으로써 획득된 오디오 신호 스펙트로그램이다. 도 6c에 도시된 바와 같이, 원래 신호의 고주파 부분의 고조파 성분은 디코더로 원래 신호를 디코딩함으로써 획득된 오디오 신호에 양호하게 복원되어 있으므로, 듣기에 잡음감을 야기하지 않는다. 비교 결과로부터, 본 발명의 본 실시예에 제공된 방법에서, 최종 출력 신호의 청각 품질(auditory quality)이 스테레오 신호 위상을 유지하면서 향상될 수 있음을 알 수 있다.
본 발명의 본 실시예에서, 인코더는 복수의 IPD 파라미터 추출 방식을 미리 설정할 수 있어, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 때, 인코더는 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 획득된 파라미터에 기초하여 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 수 있으므로, IPD 파라미터 추출 방식 중에서 적응적 선택을 구현할 수 있고, 그러면 인코더는 결정된 IPD 파라미터 추출 방식에 기초하여 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출할 수 있다. 본 발명의 본 실시예에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식의 선택이 풍부해지고, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 현재 프레임에 대한 정보 추출 방식을 결정하는 데 사용하는 파라미터와 더욱 밀접하게 관련된다. 본 발명의 본 실시예에서, 다중 채널 신호 코딩에 사용되는 총 비트 수량이 변하지 않는다는 전제하에, IPD 파라미터 추출 방식 중에서 적응적 선택을 통해, 그룹 IPD 파라미터 추출 방식이 사용되는 경우, IPD 파라미터 코딩에 의해 점유되는 비트 수량이 감소될 수 있고, 더 많은 비트가 다른 파라미터의 코딩에 사용될 수 있어, 코딩 품질을 유지하면서 코딩 레이트를 감소시키고; 부대역 IPD 파라미터를 추출하는 방식(부대역 세트 IPD 파라미터를 추출하고 부대역 IPD 파라미터를 하나씩 추출하는 것을 포함함)이 사용되는 경우, IPD 파라미터 코딩에 의해 점유되는 비트 수량은 그룹 IPD 파라미터 추출 방식이 사용되는 경우보다 많으며, 코딩 레이트를 유지하면서 코딩 품질을 향상시키기 위해 IPD 파라미터 추출 방식이 적응적으로 선택될 수 있다.
도 7은 본 발명의 실시예에 따른 IPD 파라미터 추출 장치의 일 실시예의 개략 구성도이다. 본 발명의 본 실시예에서 제공되는 추출 장치는,
현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터를 획득하도록 구성된 획득 모듈(10);
획득 모듈에 의해 획득되는, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 채널 간 위상차(IPD) 파라미터 추출 방식을 결정하도록 구성된 결정 모듈(20) - 여기서 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식은 둘 이상의 미리 설정된 IPD 파라미터 추출 방식 중 하나임 -; 및
결정 모듈에 의해 결정되는, 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식에 기초하여, 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하도록 구성된 추출 모듈(30)을 포함한다.
일부 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는, 현재 프레임의 신호 특성 파라미터 및 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터 중 적어도 하나를 포함하며, 여기서 A는 1 이상의 정수이고;
현재 프레임의 신호 특성 파라미터는 현재 프레임의 좌우 채널 코히어런스 값, 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터, 현재 프레임의 부대역 IPD 분산, 현재 프레임의 신호 클래스 및 현재 프레임의 채널 간 시간차(ITD) 중 적어도 하나를 포함하고;
현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터는, 현재 프레임 이전의 A개의 프레임 각각의 좌우 채널 코히어런스 값, 현재 프레임 이전의 A개의 프레임 각각의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터, 현재 프레임 이전의 A개의 프레임 각각의 부대역 IPD 분산, 현재 프레임 이전의 A개 프레임 각각의 ITD, 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식, 및 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스 중 적어도 하나를 포함하고;
신호 클래스는 음성 프레임 또는 음악 프레임을 포함한다.
일부 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임의 좌우 채널 코히어런스 값 및 현재 프레임의 부대역 IPD 분산을 포함하고;
현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값보다 크고, 현재 프레임의 부대역 IPD 분산이 제2 임계 값보다 작으면, 결정 모듈은 구체적으로,
현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성된다.
일부 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는, 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터를 포함하고; 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터가 제1 임계 값보다 크면, 결정 모듈은 구체적으로,
현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성된다. 제1 임계 값은 전술한 것일 수 있으며, 여기서는 다시 설명하지 않는다.
일부 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식 및 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스를 포함하고;
현재 프레임 이전의 A개의 프레임 각각의 IPD 파라미터 추출 방식이 제1 추출 방식이고, 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 음악 프레임이면, 결정 모듈은 구체적으로,
현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성된다.
일부 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임의 ITD 파라미터, 현재 프레임의 부대역 IPD 분산 및 현재 프레임 이전의 A개 프레임 각각의 신호 클래스를 포함하고;
현재 프레임의 ITD 파라미터의 값이 제3 임계 값보다 크고, 현재 프레임의 부대역 IPD 분산은 제4 임계 값보다 작고, 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스는 음성 프레임이면, 결정 모듈은 구체적으로,
현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성된다.
일부 실현 가능한 구현예에서, 제1 추출 방식은 현재 프레임의 다중 채널 신호의 그룹 채널 간 위상차(group IPD) 파라미터를 추출하거나, 또는 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하지 않거나, 또는 현재 프레임의 다중 채널 신호의 IPD 파라미터를 0으로 설정하는 것을 포함한다.
일부 실현 가능한 구현예에서, 결정 모듈이, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 그룹 IPD를 추출하는 것이라고 결정하는 경우, 추출 모듈은 구체적으로,
현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역 IPD 파라미터를 추출하고, 추출된 부대역 IPD 파라미터에 기초하여, 현재 프레임의 다중 채널 신호의 그룹 IPD를 결정하도록 구성된다.
일부 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니면, 결정 모듈은 구체적으로,
현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제2 추출 방식인 것으로 결정하도록 구성되고,
제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하거나 부대역 IPD 파라미터를 추출하는 것을 포함한다.
일부 실현 가능한 구현예에서, 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하는 것이고, 결정 모듈은 구체적으로,
현재 프레임의 다중 채널 신호의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 둘 이상의 부대역 세트로 분류하고 - 각각의 부대역 세트는 하나 이상의 부대역을 포함하고, 하나 이상의 부대역 세트는 둘 이상의 부대역을 포함함 -;
부대역 세트 각각의 부대역 IPD 분산을 획득하고;
각각의 부대역 세트의 부대역 IPD 분산이 제2 임계 값보다 작고 현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값보다 크면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 세트 IPD 파라미터를 추출하는 것이라고 결정하도록 구성되며,
추출 모듈은 구체적으로,
결정 모듈에 의해 결정되는 둘 이상의 부대역 세트 각각의 IPD 파라미터를 계산하도록 구성된다.
일부 실현 가능한 구현예에서, 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하는 것이고, 결정 모듈은 구체적으로,
현재 프레임의 다중 채널 신호의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 둘 이상의 부대역 세트로 분류하고 - 각각의 부대역 세트는 하나 이상의 부대역을 포함하고, 하나 이상의 부대역 세트는 둘 이상의 부대역을 포함함 -;
각각의 부대역 세트의 부대역 IPD 분산을 획득하고;
각각의 부대역 세트의 부대역 IPD 분산이 제2 임계 값보다 작고 현재 프레임의 파라미터로서, 좌위 채널 코히어런스를 나타내는 파라미터의 값이 제1 임계 값보다 크면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 세트 IPD 파라미터를 추출하는 것이라고 결정하도록 구성되고;
추출 모듈은 구체적으로,
결정 모듈에 의해 결정되는 둘 이상의 부대역 세트 각각의 IPD 파라미터를 계산하도록 구성된다.
일부 실현 가능한 구현예에서, 제2 추출 방식은 부대역 IPD 파라미터를 추출하는 것이고, 결정 모듈은 구체적으로,
하나 이상의 부대역 세트의 부대역 IPD 분산이 제2 임계 값보다 크거나, 또는 현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값 이하이면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 IPD 파라미터를 추출하는 것이라고 결정하도록 구성되고;
추출 모듈은 구체적으로.
현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 모든 부대역의 IPD 파라미터를 계산하도록 구성된다.
일부 실현 가능한 구현예에서, 제2 추출 방식은 부대역 IPD 파라미터를 추출하는 것이고, 결정 모듈은 구체적으로,
하나 이상의 부대역 세트의 부대역 IPD 분산이 제2 임계 값보다 크거나, 또는
현재 프레임의 파라미터로서 좌우 채널 코히어런스를 나타내는 파라미터의 값이 제1 임계 값 이하이면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 IPD 파라미터를 추출하는 것이라고 결정하도록 구성되고;
추출 모듈은 구체적으로,
현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 전부 또는 일부 부대역의 IPD 파라미터를 계산하도록 구성된다.
구체적인 구현 시에, IPD 파라미터 추출 장치는 구체적으로 본 발명의 실시예에 기재된 인코더일 수 있다. 이 IPD 파라미터 추출 장치는 내장된 모듈을 사용하여, IPD 파라미터 추출 방식에서의 단계들에 기재된 구현예를 수행할 수 있다. 여기서는 세부사항을 설명하지 않는다.
본 발명의 본 실시예에서, 인코더는 복수의 IPD 파라미터 추출 방식을 미리 설정할 수 있어, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 때, 인코더는 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 획득된 파라미터에 기초하여 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 수 있고, 이에 따라 IPD 파라미터 추출 방식 중에서 적응적 선택을 구현할 수 있고, 그러면 인코더는 결정된 IPD 파라미터 추출 방식에 기초하여 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출할 수 있다. 본 발명의 본 실시예에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식의 선택이 풍부해지고, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 현재 프레임에 대한 정보 추출 방식을 결정하는 데 사용하는 파라미터와 더욱 밀접하게 관련된다. 본 발명의 본 실시예에서, 다중 채널 신호 코딩에 사용되는 총 비트 수량이 변하지 않는다는 전제하에, IPD 파라미터 추출 방식 중에서 적응적 선택을 통해, 그룹 IPD 파라미터 추출 방식이 사용되는 경우, IPD 파라미터 코딩에 의해 점유되는 비트 수량이 감소될 수 있고, 더 많은 비트가 다른 파라미터의 코딩에 사용될 수 있어, 코딩 품질을 유지하면서 코딩 레이트를 감소시킬 수 있고; 부대역 IPD 파라미터를 추출(부대역 세트 IPD 파라미터를 추출하고 부대역 IPD 파라미터를 하나씩 추출하는 것을 포함함)이 사용되는 경우, IPD 파라미터 코딩에 의해 점유되는 비트 수량은 그룹 IPD 파라미터 추출 방식이 사용되는 경우보다 많아, 코딩 레이트를 유지하면서 코딩 품질을 향상시키기 위해 IPD 파라미터 추출 방식이 적응적으로 선택될 수 있다.
도 8을 참조하면, 도 8은 본 발명의 일 실시예에 따른 단말기의 개략 구성도이다. 본 발명의 본 실시예에서 제공되는 단말기는 메모리(1000) 및 프로세서(2000)를 포함한다. 메모리(1000)는 프로세서(2000)에 연결된다.
메모리(1000)는 프로그램 코드의 세트를 저장하도록 구성된다.
프로세서(2000)는, 메모리(1000)에 저장된 프로그램 코드를 호출하여,
현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터를 획득하는 작업;
현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 채널 간 위상차(IPD) 파라미터 추출 방식을 결정하는 작업 - 여기서 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식은 둘 이상의 미리 설정된 IPD 파라미터 추출 방식 중 하나임 -; 및
현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식에 기초하여, 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하는 작업을 수행하도록 구성된다.
일부 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임의 신호 특성 파라미터 및 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터 중 적어도 하나를 포함하며, 여기서 A는 1 이상의 정수이고;
현재 프레임의 신호 특성 파라미터는 현재 프레임의 좌우 채널 코히어런스 값, 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터, 현재 프레임의 부대역 IPD 분산, 및 현재 프레임의 채널 간 시간차(ITD) 중 적어도 하나를 포함하고;
현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터는, 현재 프레임 이전의 A개의 프레임 각각의 좌우 채널 코히어런스 값, 현재 프레임 이전의 A개의 프레임 각각의 파라미터로서 좌우 채널 코히어런스를 나타내는 파라미터, 현재 프레임 이전의 A개의 프레임 각각의 부대역 IPD 분산, 현재 프레임 이전의 A개 프레임 각각의 ITD, 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식, 및 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스 중 적어도 하나를 포함하고;
신호 클래스는 음성 프레임 또는 음악 프레임을 포함한다.
일부 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임의 좌우 채널 코히어런스 값 및 현재 프레임의 부대역 IPD 분산을 포함하고;
현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값보다 크고, 현재 프레임의 부대역 IPD 분산이 제2 임계 값보다 작으면, 프로세서(2000)는 구체적으로,
현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성된다.
일부 가능한 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임의 파라미터로서, 좌우 패널 코히어런스를 나타내는 파라미터 및 현재 프레임의 부대역 IPD 분산을 포함하고;
현재 프레임의 파라미터로서, 좌우 패널 코히어런스를 나타내는 파라미터의 값이 제1 임계 값보다 크고, 현재 프레임의 부대역 IPD 분산이 제2 임계 값보다 작으면, 프로세서(2000)는 구체적으로,
현재 프레임의 다중 채널 신호의 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성된다.
일부 가능한 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는
현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식 및 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스를 포함하고;
현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이고, 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 음악 프레임이면, 프로세서(2000)는 구체적으로,
현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성된다.
일부 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임의 ITD 파라미터, 현재 프레임의 부대역 IPD 분산 및 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스를 포함하고;
현재 프레임의 ITD 파라미터의 값이 제3 임계 값보다 크고, 현재 프레임의 부대역 IPD 분산이 제4 임계 값보다 작고, 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 음성 프레임이면, 프로세서(2000)는 구체적으로,
현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성된다.
일부 실현 가능한 구현예서, 제1 추출 방식은 현재 프레임의 다중 채널 신호의 그룹 채널 간 위상차(group IPD) 파라미터를 추출하거나, 또는 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하지 않는 것을 포함한다.
일부 실현 가능한 구현예에서, 제1 추출 방식이 현재 프레임의 다중 채널 신호의 그룹 IPD 파라미터를 추출하는 것인 경우, 프로세서(2000)는 구체적으로,
현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역 IPD 파라미터를 추출하고, 추출된 부대역 IPD 파라미터에 기초하여, 현재 프레임의 다중 채널 신호의 그룹 IPD를 결정하도록 구성된다.
일부 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니면, 프로세서(2000)는 구체적으로,
현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제2 추출 방식인 것으로 결정하도록 구성되고,
제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하거나 부대역 IPD 파라미터를 추출하는 것을 포함한다.
일부 실현 가능한 구현예에서, 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하는 것이고, 프로세서(2000)는 구체적으로,
현재 프레임의 다중 채널 신호의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 둘 이상의 부대역 세트로 분류하고 - 각각의 부대역 세트는 하나 이상의 부대역을 포함하고, 하나 이상의 부대역 세트는 둘 이상의 부대역을 포함함 -;
각각의 부대역 세트의 부대역 IPD 분산을 획득하고;
각각의 부대역 세트의 부대역 IPD 분산이 제2 임계 값보다 작고, 현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값보다 크면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 세트 IPD 파라미터를 추출하는 것이라고 결정하고;
둘 이상의 부대역 세트 각각의 IPD 파라미터를 계산하도록 구성된다.
일부 실현 가능한 구현예에서, 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하는 것이고, 프로세서(2000)는 구체적으로,
현재 프레임의 다중 채널 신호의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 둘 이상의 부대역 세트로 분류하고 - 각각의 부대역 세트는 하나 이상의 부대역을 포함하고, 하나 이상의 부대역 세트는 둘 이상의 부대역을 포함함 -;
각각의 부대역 세트의 부대역 IPD 분산을 획득하고;
각각의 부대역 세트의 부대역 IPD 분산이 제2 임계 값보다 작고, 현재 프레임의 파라미터로서 좌우 채널 코히어런스를 나타내는 파라미터의 값이 제1 임계 값보다 크면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 세트 IPD 파라미터를 추출하는 것이라고 결정하고;
둘 이상의 부대역 세트 각각의 IPD 파라미터를 계산하도록 구성된다.
일부 실현 가능한 구현예에서, 제2 추출 방식은 부대역 IPD 파라미터를 추출하는 것이고, 프로세서(2000)는 구체적으로,
하나 이상의 부대역 세트의 부대역 IPD 분산이 제2 임계 값보다 크거나, 또는 현재 프레임의 좌우 채널 코히어런스 값이 제1 임계 값 이하이면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 IPD 파라미터를 추출하는 것이라고 결정하고;
현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 전부 또는 일부 부대역의 IPD 파라미터를 계산하도록 구성된다.
일부 실현 가능한 구현예에서, 제2 추출 방식이 부대역 IPD 파라미터를 추출하는 것인 경우, 프로세서(2000)는 구체적으로,
하나 이상의 부대역 세트의 부대역 IPD 분산이 제2 임계 값보다 크거나, 또는 현재 프레임의 파라미터로서, 좌추 채널 코히어런스를 나타내는 파라미터의 값이 제1 임계 값 이하이면, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 부대역 IPD 파라미터를 추출하는 것이라고 결정하고;
현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 전부 또는 일부 부대역의 IPD 파라미터를 계산하도록 구성된다.
일부 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터가 현재 프레임의 좌우 채널 코히어런스 값을 포함하는 경우, 프로세서(2000)는 구체적으로,
현재 프레임의 다중 채널 신호의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 획득하고, 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호로 변환하고;
좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호에 기초하여, 현재 프레임의 좌우 채널 코히어런스 값을 계산하도록 구성된다.
일부 실현 가능한 구현예에서, 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터가 현재 프레임의 부대역 IPD 분산을 포함하는 경우, 프로세서(2000)는 구체적으로,
현재 프레임의 다중 채널 신호의 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 획득하고, 좌 채널 시간 도메인 신호 및 우 채널 시간 도메인 신호를 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호로 변환하고;
좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호를 둘 이상의 부대역으로 분할하고, 각각의 부대역의 주파수 도메인 신호에 기초하여 각각의 부대역의 IPD를 계산하고, 각각의 부대역의 IPD에 기초하여 현재 프레임의 부대역 IPD 분산을 계산하도록 구성된다.
본 출원에서, 복수의 IPD 파라미터 추출 방식이 미리 설정될 수 있어, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정할 때, 현재 프레임에 대한 IPD 파라미터 추출 방식이 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용 되는 획득된 파라미터에 기초하여 결정될 수 있고, 이에 따라 IPD 파라미터 추출 방식 중에서 적응적 선택을 구현한 다음, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터가 결정된 IPD 파라미터 추출 방식에 기초하여 추출될 수 있다. 본 출원에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식의 선택이 풍부해지고, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식은 현재 프레임에 대한 정보 추출 방식을 결정하는 데 사용하는 파라미터와 더욱 밀접하게 관련된다. 본 출원에서, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 그룹 IPD를 추출하는 것인 경우, IPD 파라미터 코딩은 비교적 소량의 비트를 점유하고, 더 많은 비트가 다른 파라미터의 코딩에 사용될 수 있어, 코딩 품질을 향상시킬 수 있다. 본 출원에서, 복수의 IPD 파라미터가 현재 프레임의 다중 채널 신호의 IPD 파라미터로서 사용될 수 있어, 위상 정보가 더욱 양호하게 유지될 수 있고, 오디오 코딩 정확도가 향상될 수 있다. 또한 부대역 세트로 분류된 후에 추출된 IPD 파라미터의 수량은 모든 부대역에 대해 추출된 IPD 파라미터의 수량보다 적어, 더 많은 비트가 다른 파라미터들 부호화에 사용될 수 있고, 따라서 오디오 코딩 품질을 향상시킬 수 있다.
당업자라면 실시예에서의 방법들의 프로세스의 전부 또는 일부가 관련 하드웨어에 명령하는 컴퓨터 프로그램으로 구현될 수 있다는 것을 이해할 수 있을 것이다. 프로그램은 컴퓨터로 판독 가능한 저장 매체에 저장될 수 있다. 프로그램이 실행될 때, 실시예에서의 방법의 프로세스가 수행될 수 있다. 저장 매체는 자기 디스크, 광 디스크, 판독 전용 메모리(Read-Only Memory, ROM), 랜덤 액세스 메모리 (Random Access Memory, RAM) 등을 포함할 수 있다.
본 발명의 명세서, 청구범위, 및 첨부 도면에서, "제1", "제2", "제3", "제4" 등의 용어는 서로 다른 대상을 구별하기 위한 것이이고 특정 순서를 지시하는 것은 아니다. 또한, 용어 "포함한다" 또는 그 변형은 비배타적인 포함을 포함하는 것이다. 예를 들어, 일련의 단계 또는 유닛를 포함하는 프로세스, 방법, 시스템, 제품 또는 기기는 열거된 단계 또는 유닛으로 한정되는 것이 아니라, 선택적으로 열거되지 않은 단계 또는 유닛을 추가로 포함하거나, 또는 프로세스, 방법, 시스템, 제품 또는 기기의 다른 고유한 단계 또는 유닛을 더 포함한다.
이상에 개시된 것은 본 발명의 실시예의 일례에 지나지 않으며, 본 발명의 보호 범위를 한정하는 것은 아니다. 따라서, 본 발명의 특허 청구범위에 따라 이루어진 균등한 변형은 본 발명의 범위 내에 있다.

Claims (22)

  1. 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터를 획득하는 단계;
    상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 채널 간 위상차(inter-channel phase difference, IPD) 파라미터 추출 방식을 결정하는 단계 - 여기서 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식은 둘 이상의 미리 설정된 IPD 파라미터 추출 방식 중 하나임 -; 및
    상기 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식에 기초하여, 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하는 단계
    를 포함하는 채널 간 위상차 파라미터 추출 방법.
  2. 제1항에 있어서,
    상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임의 신호 특성 파라미터 및 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터 중 적어도 하나를 포함하며, 여기서 A는 1 이상의 정수이고;
    상기 현재 프레임의 신호 특성 파라미터는 현재 프레임의 파라미터로서, 좌우 채널 코히어런스(left-right channel coherence)를 나타내는 파라미터, 현재 프레임의 부대역 IPD 분산, 현재 프레임의 신호 클래스 및 현재 프레임의 채널 간 시간차(inter-channel time difference, ITD) 중 적어도 하나를 포함하고;
    상기 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터는, 현재 프레임 이전의 A개의 프레임 각각의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터, 현재 프레임 이전의 A개의 프레임 각각의 부대역 IPD 분산, 현재 프레임 이전의 A개 프레임 각각의 ITD, 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식, 및 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스 중 적어도 하나를 포함하고;
    상기 신호 클래스는 음성 프레임 또는 음악 프레임을 포함하는, 채널 간 위상차 파라미터 추출 방법.
  3. 제2항에 있어서,
    상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터를 포함하고;
    상기 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터의 값이 제1 임계 값보다 크면, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정하는 단계는,
    상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하는 단계를 포함하는, 채널 간 위상차 파라미터 추출 방법.
  4. 제3항에 있어서,
    상기 제1 임계 값은 0.75인, 채널 간 위상차 파라미터 추출 방법.
  5. 제2항에 있어서,
    상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식 및 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스를 포함하고;
    상기 현재 프레임 이전의 A개의 프레임 각각의 IPD 파라미터 추출 방식이 제1 추출 방식이고, 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 음악 프레임이면, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정하는 단계는,
    상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 상기 제1 추출 방식인 것으로 결정하는 단계를 포함하는, 채널 간 위상차 파라미터 추출 방법.
  6. 제2항에 있어서,
    상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임의 ITD 파라미터, 상기 현재 프레임의 부대역 IPD 분산 및 상기 현재 프레임 이전의 A개 프레임 각각의 신호 클래스를 포함하고;
    상기 현재 프레임의 ITD 파라미터의 값이 제3 임계 값보다 크고, 상기 현재 프레임의 부대역 IPD 분산이 제4 임계 값보다 작고, 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 음성 프레임이면, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정하는 단계는,
    상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하는 단계를 포함하는, 채널 간 위상차 파라미터 추출 방법.
  7. 제3항 내지 제6항 중 어느 한 항에 있어서,
    상기 제1 추출 방식은 상기 현재 프레임의 다중 채널 신호의 그룹 채널 간 위상차(group IPD) 파라미터를 추출하거나, 또는 상기 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하지 않거나, 또는 상기 현재 프레임의 다중 채널 신호의 IPD 파라미터를 0으로 설정하는 것을 포함하는, 채널 간 위상차 파라미터 추출 방법.
  8. 제7항에 있어서,
    상기 제1 추출 방식이 상기 현재 프레임의 다중 채널 신호의 그룹 IPD 파라미터를 추출하는 것인 경우, 상기 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식에 기초하여, 상기 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하는 단계는,
    현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역 IPD 파라미터를 추출하고, 추출된 부대역 IPD 파라미터에 기초하여, 상기 현재 프레임의 다중 채널 신호의 그룹 IPD를 결정하는 단계를 포함하는, 채널 간 위상차 파라미터 추출 방법.
  9. 제3항 내지 제6항 중 어느 한 항에 있어서,
    상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니면, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식을 결정하는 단계는,
    상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제2 추출 방식인 것으로 결정하는 단계를 포함하고,
    상기 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하거나 부대역 IPD 파라미터를 추출하는 것을 포함하는, 채널 간 위상차 파라미터 추출 방법.
  10. 제9항에 있어서,
    상기 제2 추출 방식은 부대역 IPD 파라미터를 추출하는 것이고, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제2 추출 방식인 것으로 결정하는 단계는,
    현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 전부 또는 일부 부대역의 IPD 파라미터를 계산하는 단계를 포함하는, 채널 간 위상차 파라미터 추출 방법.
  11. 제9항에 있어서,
    상기 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하는 것이고, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제2 추출 방식인 것으로 결정하는 단계는,
    상기 현재 프레임의 다중 채널 신호의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 둘 이상의 부대역 세트로 분류하는 단계 - 각각의 부대역 세트는 하나 이상의 부대역을 포함하고, 하나 이상의 부대역 세트는 둘 이상의 부대역을 포함함 -; 및
    상기 둘 이상의 부대역 세트 각각의 IPD 파라미터를 계산하는 단계를 포함하는, 채널 간 위상차 파라미터 추출 방법.
  12. 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터를 획득하도록 구성된 획득 모듈;
    상기 획득 모듈에 의해 획득되는, 상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터에 기초하여, 현재 프레임의 다중 채널 신호에 대한 채널 간 위상차(IPD) 파라미터 추출 방식을 결정하도록 구성된 결정 모듈 - 여기서 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식은 둘 이상의 미리 설정된 IPD 파라미터 추출 방식 중 하나임 -; 및
    상기 결정 모듈에 의해 결정되는, 상기 현재 프레임의 다중 채널 신호에 대한 결정된 IPD 파라미터 추출 방식에 기초하여, 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하도록 구성된 추출 모듈
    을 포함하는 채널 간 위상차 파라미터 추출 장치.
  13. 제12항에 있어서,
    상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는, 현재 프레임의 신호 특성 파라미터 및 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터 중 적어도 하나를 포함하며, 여기서 A는 1 이상의 정수이고;
    상기 현재 프레임의 신호 특성 파라미터는, 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터, 현재 프레임의 부대역 IPD 분산, 현재 프레임의 신호 클래스 및 현재 프레임의 채널 간 시간차(ITD) 중 적어도 하나를 포함하고;
    상기 현재 프레임 이전의 A개의 프레임 각각의 신호 특성 파라미터는, 상기 현재 프레임 이전의 A개의 프레임 각각의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터, 현재 프레임 이전의 A개의 프레임 각각의 부대역 IPD 분산, 현재 프레임 이전의 A개 프레임 각각의 ITD, 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식, 및 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스 중 적어도 하나를 포함하고;
    상기 신호 클래스는 음성 프레임 또는 음악 프레임을 포함하는, 채널 간 위상차 파라미터 추출 장치.
  14. 제13항에 있어서,
    상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터를 포함하고;
    상기 현재 프레임의 파라미터로서, 좌우 채널 코히어런스를 나타내는 파라미터가 제1 임계 값보다 크면, 상기 결정 모듈은 구체적으로,
    상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성되는, 채널 간 위상차 파라미터 추출 장치.
  15. 제14항에 있어서,
    상기 제1 임계 값은 0.75인, 채널 간 위상차 파라미터 추출 장치.
  16. 제13항에 있어서,
    상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 상기 현재 프레임 이전의 A개의 프레임 각각에 대한 IPD 파라미터 추출 방식 및 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스를 포함하고;
    상기 현재 프레임 이전의 A개의 프레임 각각의 IPD 파라미터 추출 방식이 제1 추출 방식이고, 상기 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스가 음악 프레임이면, 상기 결정 모듈은 구체적으로,
    상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 상기 제1 추출 방식인 것으로 결정하도록 구성되는, 채널 간 위상차 파라미터 추출 장치.
  17. 제13항에 있어서,
    상기 현재 프레임의 다중 채널 신호에 대한 정보 추출 방식을 결정하는 데 사용되는 파라미터는 현재 프레임의 ITD 파라미터, 현재 프레임의 부대역 IPD 분산 및 현재 프레임 이전의 A개 프레임 각각의 신호 클래스를 포함하고;
    현재 프레임의 ITD 파라미터의 값이 제3 임계 값보다 크고, 현재 프레임의 부대역 IPD 분산은 제4 임계 값보다 작고, 현재 프레임 이전의 A개의 프레임 각각의 신호 클래스는 음성 프레임이면, 상기 결정 모듈은 구체적으로,
    상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식인 것으로 결정하도록 구성되는, 채널 간 위상차 파라미터 추출 장치.
  18. 제14항 내지 제17항 중 어느 한 항에 있어서,
    상기 제1 추출 방식은 상기 현재 프레임의 다중 채널 신호의 그룹 채널 간 위상차(group IPD) 파라미터를 추출하거나, 또는 상기 현재 프레임의 다중 채널 신호의 IPD 파라미터를 추출하지 않거나, 또는 상기 현재 프레임의 다중 채널 신호의 IPD 파라미터를 0으로 설정하는 것을 포함하는, 채널 간 위상차 파라미터 추출 장치.
  19. 제18항에 있어서,
    상기 결정 모듈이, 상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 그룹 IPD를 추출하는 것이라고 결정하는 경우, 상기 추출 모듈은 구체적으로,
    현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역 IPD 파라미터를 추출하고, 추출된 부대역 IPD 파라미터에 기초하여, 상기 현재 프레임의 다중 채널 신호의 그룹 IPD를 결정하도록 구성되는, 채널 간 위상차 파라미터 추출 장치.
  20. 제14항 내지 제17항 중 어느 한 항에 있어서,
    상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제1 추출 방식이 아니면, 상기 결정 모듈은 구체적으로,
    상기 현재 프레임의 다중 채널 신호에 대한 IPD 파라미터 추출 방식이 제2 추출 방식인 것으로 결정하도록 구성되고,
    상기 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하거나 부대역 IPD 파라미터를 추출하는 것을 포함하는, 채널 간 위상차 파라미터 추출 장치.
  21. 제20항에 있어서,
    상기 제2 추출 방식은 부대역 세트 IPD 파라미터를 추출하는 것이고, 상기 결정 모듈은 구체적으로,
    상기 현재 프레임의 다중 채널 신호의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 부대역을 둘 이상의 부대역 세트로 분류하도록 구성되며, 각각의 부대역 세트는 하나 이상의 부대역을 포함하고, 하나 이상의 부대역 세트는 둘 이상의 부대역을 포함하고;
    상기 추출 모듈은 구체적으로,
    상기 결정 모듈에 의해 결정되는 둘 이상의 부대역 세트 각각의 IPD 파라미터를 계산하도록 구성되는, 채널 간 위상차 파라미터 추출 장치.
  22. 제20항에 있어서,
    상기 제2 추출 방식은 부대역 IPD 파라미터를 추출하는 것이고,
    상기 추출 모듈은 구체적으로,
    상기 현재 프레임의 좌 채널 주파수 도메인 신호 및 우 채널 주파수 도메인 신호의 전부 또는 일부 부대역의 IPD 파라미터를 계산하도록 구성되는, 채널 간 위상차 파라미터 추출 장치.
KR1020187036928A 2016-05-31 2017-05-25 채널 간 위상차 파라미터 추출 방법 및 장치 KR102196390B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020207036972A KR102288841B1 (ko) 2016-05-31 2017-05-25 채널 간 위상차 파라미터 추출 방법 및 장치

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201610377800.4A CN107452387B (zh) 2016-05-31 2016-05-31 一种声道间相位差参数的提取方法及装置
CN201610377800.4 2016-05-31
CNPCT/CN2016/102128 2016-10-14
PCT/CN2016/102128 WO2017206416A1 (zh) 2016-05-31 2016-10-14 一种声道间相位差参数的提取方法及装置
PCT/CN2017/085909 WO2017206794A1 (zh) 2016-05-31 2017-05-25 一种声道间相位差参数的提取方法及装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020207036972A Division KR102288841B1 (ko) 2016-05-31 2017-05-25 채널 간 위상차 파라미터 추출 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20190009363A true KR20190009363A (ko) 2019-01-28
KR102196390B1 KR102196390B1 (ko) 2020-12-29

Family

ID=60478483

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020207036972A KR102288841B1 (ko) 2016-05-31 2017-05-25 채널 간 위상차 파라미터 추출 방법 및 장치
KR1020187036928A KR102196390B1 (ko) 2016-05-31 2017-05-25 채널 간 위상차 파라미터 추출 방법 및 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020207036972A KR102288841B1 (ko) 2016-05-31 2017-05-25 채널 간 위상차 파라미터 추출 방법 및 장치

Country Status (7)

Country Link
US (3) US11393480B2 (ko)
EP (3) EP3451331B1 (ko)
KR (2) KR102288841B1 (ko)
CN (3) CN107452387B (ko)
BR (1) BR112018074333A2 (ko)
ES (1) ES2836682T3 (ko)
WO (2) WO2017206416A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107452387B (zh) 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN109215668B (zh) * 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN110556116B (zh) 2018-05-31 2021-10-22 华为技术有限公司 计算下混信号和残差信号的方法和装置
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2296142A2 (en) * 2005-08-02 2011-03-16 Dolby Laboratories Licensing Corporation Controlling spatial audio coding parameters as a function of auditory events

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
WO2010036060A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
KR20100035121A (ko) * 2008-09-25 2010-04-02 엘지전자 주식회사 신호 처리 방법 및 이의 장치
WO2010037427A1 (en) * 2008-10-03 2010-04-08 Nokia Corporation Apparatus for binaural audio coding
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
BR112012008793B1 (pt) * 2009-10-15 2021-02-23 France Telecom Processos de codificação e de decodificação paramétrica de um sinalaudiodigital multicanal, codificador e decodificador paramétricos de um sinalaudiodigital multicanal
US9112591B2 (en) * 2010-04-16 2015-08-18 Samsung Electronics Co., Ltd. Apparatus for encoding/decoding multichannel signal and method thereof
KR101033241B1 (ko) * 2010-07-23 2011-05-06 엘아이지넥스원 주식회사 위상 배열 안테나 시스템을 위한 신호 처리 장치 및 방법
WO2012045203A1 (en) 2010-10-05 2012-04-12 Huawei Technologies Co., Ltd. Method and apparatus for encoding/decoding multichannel audio signal
WO2012058805A1 (en) 2010-11-03 2012-05-10 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
CN102446507B (zh) * 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置
EP2834813B1 (en) 2012-04-05 2015-09-30 Huawei Technologies Co., Ltd. Multi-channel audio encoder and method for encoding a multi-channel audio signal
WO2013149673A1 (en) 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Method for inter-channel difference estimation and spatial audio coding device
KR102114440B1 (ko) * 2013-07-30 2020-05-22 디티에스, 인코포레이티드 일정-파워 페어와이즈 패닝을 갖는 매트릭스 디코더
CN104681029B (zh) 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
CN104053120B (zh) * 2014-06-13 2016-03-02 福建星网视易信息系统有限公司 一种立体声音频的处理方法和装置
CN107452387B (zh) 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
US10217467B2 (en) * 2016-06-20 2019-02-26 Qualcomm Incorporated Encoding and decoding of interchannel phase differences between audio signals

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2296142A2 (en) * 2005-08-02 2011-03-16 Dolby Laboratories Licensing Corporation Controlling spatial audio coding parameters as a function of auditory events

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Draft International Standard ISO/IEC DIS 23008-3. ISO/IEC JTC 1/SC 29/WG 11. 2014.07.25. *
ETSI TS 103 190 V1.1.1, Digital Audio Compression (AC-4) Standard, 2014.04. *
ETSI TS 103 190-2 V1.1.1, Digital Audio Compression (AC-4) Standard Part 2: Immersive and personalized audio, 2015.09. *
G.722 : New Appendix V extending Annex B superwideband for mid-side stereo. Recommendation G.722 (1988) Amendment 2. 2011.03.25. *

Also Published As

Publication number Publication date
CN115662449A (zh) 2023-01-31
CN108475509A (zh) 2018-08-31
US20190096411A1 (en) 2019-03-28
EP4336495A3 (en) 2024-05-01
US20240161755A1 (en) 2024-05-16
WO2017206416A1 (zh) 2017-12-07
EP3822967B1 (en) 2023-12-27
EP4336495A2 (en) 2024-03-13
US11915709B2 (en) 2024-02-27
EP3451331A4 (en) 2019-06-19
US20220328053A1 (en) 2022-10-13
WO2017206794A1 (zh) 2017-12-07
EP3451331A1 (en) 2019-03-06
US11393480B2 (en) 2022-07-19
BR112018074333A2 (pt) 2019-03-06
EP3451331B1 (en) 2020-10-21
ES2836682T3 (es) 2021-06-28
CN107452387A (zh) 2017-12-08
KR102288841B1 (ko) 2021-08-10
KR20200145859A (ko) 2020-12-30
CN108475509B (zh) 2022-10-04
EP3822967A1 (en) 2021-05-19
KR102196390B1 (ko) 2020-12-29
CN107452387B (zh) 2019-11-12

Similar Documents

Publication Publication Date Title
US11178505B2 (en) Multi-channel signal encoding method, multi-channel signal decoding method, encoder, and decoder
US11915709B2 (en) Inter-channel phase difference parameter extraction method and apparatus
JP7439152B2 (ja) チャネル間位相差パラメータ符号化方法および装置
CN110462733B (zh) 多声道信号的编解码方法和编解码器
EP4258697A2 (en) Encoding and decoding method and encoding and decoding apparatus for stereo signal
BR122023025938A2 (pt) Método e aparelho de extração de parâmetro de diferença de fase intercanal, e meio de armazenamento

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant