KR20220044857A - 스테레오 신호 인코딩 방법 및 인코딩 장치 - Google Patents

스테레오 신호 인코딩 방법 및 인코딩 장치 Download PDF

Info

Publication number
KR20220044857A
KR20220044857A KR1020227010056A KR20227010056A KR20220044857A KR 20220044857 A KR20220044857 A KR 20220044857A KR 1020227010056 A KR1020227010056 A KR 1020227010056A KR 20227010056 A KR20227010056 A KR 20227010056A KR 20220044857 A KR20220044857 A KR 20220044857A
Authority
KR
South Korea
Prior art keywords
window
linear prediction
prediction analysis
attenuation
current frame
Prior art date
Application number
KR1020227010056A
Other languages
English (en)
Other versions
KR102486258B1 (ko
Inventor
이얄 슬로못
요나단 알라스테어 기브스
하이팅 리
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20220044857A publication Critical patent/KR20220044857A/ko
Application granted granted Critical
Publication of KR102486258B1 publication Critical patent/KR102486258B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

스테레오 신호 인코딩 방법 및 인코딩 장치가 제공된다. 이 방법은, 현재 프레임(310)에서의 채널 간 시간차에 기초하여 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 결정하는 단계; 현재 프레임에서 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 단계 ― 수정된 선형 예측 분석에서 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 적어도 일부 포인트의 값은 초기 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 대응하는 포인트 값보다 작고, sub_window_len은 현재 프레임에서 감쇠 윈도우의 윈도우 길이를 나타내며, L은 수정된 선형 예측 분석 윈도우의 길이를 나타내고, 수정된 선형 예측 분석 윈도우의 윈도우 길이는 초기 선형 예측 분석 윈도우(320)의 윈도우 길이와 동일함 ―; 및 상기 수정된 선형 예측 분석 윈도우(330)에 기초하여 처리될 사운드 채널 신호에 대한 선형 예측 분석을 수행하는 단계를 포함한다. 따라서, 선형 예측의 정확도가 향상될 수 있다.

Description

스테레오 신호 인코딩 방법 및 인코딩 장치{ENCODING METHOD AND ENCODING APPARATUS FOR STEREO SIGNAL}
본 출원은 2017년 8월 23일에 중국 특허청에 출원된 중국 특허 출원 제201710731482.1호('스테레오 신호 인코딩 방법 및 인코딩 장치')의 우선권을 주장하며 이것은 그 전체가 참조로서 본 명세서 포함된다.
본 출원은 오디오 신호 인코딩/디코딩 기술 분야에 관한 것으로, 구체적으로는 스테레오 신호 인코딩 방법 및 인코딩 장치에 관한 것이다.
시간 도메인 스테레오 인코딩 기술을 사용하여 스테레오 신호를 인코딩하는 일반적인 프로세스는,
스테레오 신호의 채널 간 시간차를 추정하는 단계;
채널 간 시간차에 기초하여 스테레오 신호에 대해 지연 정렬 처리를 수행하는 단계;
1차 사운드 채널 신호 및 2차 사운드 채널 신호를 획득하기 위해, 시간 도메인 다운믹싱 처리를 위한 파라미터에 기초하여, 지연 정렬 처리 후에 획득된 신호에 대한 시간 도메인 다운믹싱 처리를 수행하는 단계; 및
인코딩된 비트스트림을 획득하기 위해, 채널 간 시간차, 시간 도메인 다운믹싱 처리를 위한 파라미터, 1차 사운드 채널 신호 및 2차 사운드 채널 신호를 인코딩하는 단계를 포함한다.
채널 간 시간차에 기초하여 스테레오 신호에 대해 지연 정렬 처리가 수행되기 전에, 먼저, 타깃 사운드 채널로서 작용하기 위해 채널 간 시간차에 기초하여 스테레오 신호의 좌측 사운드 채널 및 우측 사운드 채널로부터 더 큰 지연을 갖는 사운드 채널이 선택될 수 있고, 다른 사운드 채널은 타깃 사운드 채널에 대해 지연 정렬 처리를 수행하기 위한 기준 사운드 채널로서 선택되며, 그 후, 타깃 사운드 채널 신호에 대해 지연 정렬 처리가 수행된다. 이러한 방식으로, 지연 정렬 처리 후에 획득된 타깃 사운드 채널 신호와 기준 사운드 채널 신호 사이에 채널 간 시간차가 없다. 또한, 지연 정렬 처리는 타깃 사운드 채널 상에서 순방향 신호를 수동으로 재구성하는 것을 더 포함한다.
그러나, 타깃 사운드 채널 상의 일부 신호(천이 세그먼트 신호(transition segment signal) 및 순방향 신호를 포함)가 수동으로 결정되며, 이들 수동으로 결정된 신호와 실제 신호는 크게 다르다. 결과적으로, 실제 선형 예측 계수 및 선형 예측 계수는 어느 정도 상이할 수 있으며, 여기서 선형 예측 분석이 수행되는 경우, 지연 정렬 처리 후에 획득된 스테레오 신호에 기초하여 결정되는 1차 사운드 채널 신호 및 2차 사운드 채널에 대해 모노 코딩 알고리즘을 사용하여 선형 예측 계수가 획득되며, 인코딩 품질이 영향을 받는다.
본 출원은 인코딩 프로세스에서 선형 예측의 정확도를 향상시키기 위해 스테레오 신호 인코딩 방법 및 인코딩 장치를 제공한다.
본 출원에서의 스테레오 신호는 원시 스테레오 신호, 멀티채널 신호에 포함 된 2개의 신호를 포함하는 스테레오 신호, 또는 멀티채널 신호에 포함된 복수의 신호에 의해 공동으로 생성된 2개의 신호를 포함하는 스테레오 신호일 수 있음을 이해해야 한다.
또한, 본 출원에서의 스테레오 신호 인코딩 방법은 멀티채널 인코딩 방법에서 사용되는 스테레오 신호 인코딩 방법일 수 있다.
제1 측면에 따르면, 스테레오 신호 인코딩 방법이 제공된다. 이 방법은, 현재 프레임에서의 채널 간 시간차에 기초하여 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 결정하는 단계; 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 단계 ―상기 수정된 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 적어도 일부 포인트의 값은 초기 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 대응하는 포인트 값보다 작고, sub_window_len은 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 나타내며, L은 상기 수정된 선형 예측 분석 윈도우의 윈도우 길이를 나타내고, 상기 수정된 선형 예측 분석 윈도우의 윈도우 길이는 상기 초기 선형 예측 분석 윈도우의 윈도우 길이와 같음 ―; 및 상기 수정된 선형 예측 분석 윈도우에 기초하여, 처리될 사운드 채널 신호에 대해 선형 예측 분석을 수행하는 단계를 포함한다.
수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 적어도 일부 점의 포인트의 값이 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 대응하는 포인트의 값보다 작기 때문에, 선형 예측 분석 결과의 정확도에 대한 수동으로 재구성된 신호와 실제 신호 사이의 오차의 영향이 감소될 수 있도록, 현재 프레임에서의 타깃 사우드 채널 상에서 수동으로 재구성된 신호(여기서 재구성된 신호는 천이 세그먼트 신호 및 순방향 신호를 포함할 수 있음)에 의한 영향이 선형 예측 동안 감소될 수 있다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 수정된 선형 예측 분석 윈도우에서 상기 포인트(L - sub_window_len)로부터 상기 포인트(L - 1)까지의 임의의 포인트의 값은 상기 초기 선형 예측 분석 윈도우에서 상기 포인트(L - sub_window_len)로부터 상기 포인트(L - 1)까지의 대응하는 포인트의 값보다 작다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 현재 프레임에서의 채널 간 시간차에 기초하여 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 결정하는 단계는, 상기 현재 프레임에서의 채널 간 시간차 및 미리 설정된 천이 세그먼트의 길이에 기초하여 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 결정하는 단계를 포함한다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 현재 프레임에서의 채널 간 시간차 및 미리 설정된 천이 세그먼트의 길이에 기초하여 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 결정하는 단계는, 상기 현재 프레임에서의 채널 간 시간차의 절대값과 상기 미리 설정된 천이 세그먼트의 길이의 합을 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이로서 결정하는 단계를 포함한다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 현재 프레임에서의 채널 간 시간차 및 미리 설정된 천이 세그먼트의 길이에 기초하여 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 결정하는 단계는, 상기 현재 프레임에서의 채널 간 시간차의 절대값이 상기 미리 설정된 천이 세그먼트의 길이보다 크거나 같은 경우, 상기 현재 프레임에서의 채널 간 시간차의 절대값과 상기 미리 설정된 천이 세그먼트의 길이의 합을 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이로서 결정하거나, 또는 상기 현재 프레임에서의 채널 간 시간차의 절대값이 상기 미리 설정된 천이 세그먼트의 길이보다 작은 경우, 상기 현재 프레임에서의 채널 간 시간차의 절대 값의 N배를 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이로서 결정하는 단계 ― N은 0보다 크고 L/MAX_DELAY보다 작은 미리 설정된 실수이고, MAX_DELAY는 0보다 큰 미리 설정된 실수임 ―를 포함한다.
선택적으로, MAX_DELAY는 채널 간 시간차의 절대값의 최대 값이다. 여기에서의 채널 간 시간차는 스테레오 신호의 인코딩/디코딩 동안 미리 설정된 채널 간 시간차일 수 있음을 이해해야 한다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 단계는, 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 상기 초기 선형 예측 분석 윈도우를 수정하는 단계 ― 상기 초기 선형 예측 분석 윈도우에서의 상기 포인트(L - sub_window_len)로부터 상기 포인트(L - 1)까지의 대응하는 포인트의 값에 대한 상기 수정된 선형 예측 분석 윈도우에서의 상기 포인트(L - sub_window_len)로부터 상기 포인트(L - 1)까지의 값의 감쇠값은 상승 추세를 나타냄 ―를 포함한다.
감쇠값은 초기 선형 예측 분석 윈도우에서의 대응하는 포인트의 값에 대한 수정된 선형 예측 분석 윈도우에서의 포인트의 값의 감쇠값일 수 있다.
구체적으로, 예를 들어, 제1 포인트는 수정된 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 임의의 포인트이고, 제2 포인트는 선형 예측 분석 윈도우에 있는 포인트이자 또한 제1 포인트에 대응하는 포인트이다. 이 경우, 감쇠값은 제2 포인트의 값에 대한 제1 포인트의 값의 감쇠값일 수 있다.
지연 정렬 처리가 사운드 채널 신호에 대해 수행되는 경우, 현재 프레임에서의 타깃 사운드 채널 상의 순방향 신호는 수동으로 재구성될 필요가 있다. 그러나, 수동으로 재구성된 순방향 신호에서, 현재 프레임에서의 타깃 사운드 채널 상의 실제 신호로부터 멀리 떨어진 포인트의 추정된 신호 값은 더 부정확하다. 그러나, 수정된 선형 예측 분석 윈도우는 수동으로 재구성된 순방향 신호에 대해 작용한다. 따라서, 본 출원에서의 수정된 선형 예측 분석 윈도우를 사용하여 순방향 신호가 처리되는 경우, 수동으로 재구성된 순방향 신호에 있는 신호이자 또한 선형 예측 분석에서 실제 신호로부터 더 멀리 떨어진 포인트에 대응하는 신호의 비율은 선형 예측의 정확도가 더 향상될 수 있도록 감소될 수 있다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 수정된 선형 예측 분석 윈도우는 다음의 수학식
Figure pat00001
을 충족시키며,
wadp(i)는 상기 수정된 선형 예측 분석 윈도우를 나타내고, w(i)는 상기 초기 선형 예측 분석 윈도우를 나타내며,
Figure pat00002
이고, MAX_ATTEN은 0보다 큰 미리 설정된 실수이다.
MAX_ATTEN은 사운드 채널 신호의 인코딩/디코딩 동안 미리 설정된 복수의 감쇠값의 최대 감쇠값일 수 있음을 이해해야 한다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 단계는, 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 상기 현재 프레임에서의 감쇠 윈도우를 결정하는 단계; 및 상기 현재 프레임에서의 감쇠 윈도우에 기초하여 상기 초기 선형 예측 분석 윈도우를 수정하는 단계 ― 상기 초기 선형 예측 분석 윈도우에서의 상기 포인트(L - sub_window_len)로부터 상기 포인트(L - 1)까지의 대응하는 포인트의 값에 대한 상기 수정된 선형 예측 분석 윈도우에서의 상기 포인트(L - sub_window_len)로부터 상기 포인트(L - 1)까지의 값의 감쇠값은 상승 추세를 나타냄 ―를 포함한다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 상기 현재 프레임에서의 감쇠 윈도우를 결정하는 단계는, 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 복수의 미리 저장된 후보 감쇠 윈도우로부터 상기 현재 프레임에서의 감쇠 윈도우를 결정하는 단계 ― 상기 복수의 후보 감쇠 윈도우는 상이한 윈도우 길이 값 범위에 대응하고, 상기 상이한 윈도우 길이 값 범위 사이에는 교집합이 없음 ―를 포함한다.
감쇠 윈도우를 결정하기 위한 계산 복잡도가 감소될 수 있도록 현재 프레임에서의 감쇠 윈도우는 미리 저장된 복수의 후보 감쇠 윈도우로부터 결정된다.
구체적으로, 대응하는 감쇠 윈도우가 상이한 값 범위 내의 감쇠 윈도우의 윈도우 길이에 대응하는 미리 선택된 감쇠 윈도우의 윈도우 길이에 기초하여 개별적으로 계산된 후, 상이한 값 범위 내의 감쇠 윈도우의 윈도우 길이에 대응하는 감쇠 윈도우가 저장될 수 있다. 이러한 방식으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 후속적으로 결정된 후에, 현재 프레임에서의 감쇠 윈도우는 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 충족시키는 값 범위에 기초하여 복수의 미리 저장된 감쇠 윈도우로부터 직접 결정될 수 있다. 이것은 계산 프로세스를 감소시키고 계산 복잡도를 단순화시킬 수 있다.
감쇠 윈도우가 계산되는 경우, 미리 선택된 감쇠 윈도우의 윈도우 길이는 감쇠 윈도우의 윈도우 길이의 모든 가능한 값 또는 감쇠 윈도우의 윈도우 길이의 모든 가능한 값의 서브 세트일 수 있음을 이해해야한다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 현재 프레임에서의 감쇠 윈도우는 다음의 수학식
Figure pat00003
을 충족시키며,
sub_window(i)는 상기 현재 프레임에서의 감쇠 윈도우를 나타내고, MAX_ATTEN은 0보다 큰 미리 설정된 실수이다.
MAX_ATTEN은 사운드 채널 신호의 인코딩/디코딩 동안 미리 설정된 복수의 감쇠값의 최대 감쇠값일 수 있음을 이해해야 한다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 수정된 선형 예측 분석 윈도우는 다음의 수학식
Figure pat00004
을 충족시키며,
wadp(i)는 상기 수정된 선형 예측 분석 윈도우의 윈도우 함수를 나타내고, w(i)는 상기 초기 선형 예측 분석 윈도우를 나타내며, sub_window(.)는 상기 현재 프레임에서의 감쇠 윈도우를 나타낸다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 단계는, 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 복수의 미리 저장된 후보 선형 예측 분석 윈도우로부터 상기 수정된 선형 예측 분석 윈도우를 결정하는 단계 - 상기 복수의 후보 선형 예측 분석 윈도우는 상이한 윈도우 길이 값 범위에 대응하고, 상기 상이한 윈도우 길이 값 범위 사이에는 교집합이 없음 ―를 포함한다.
수정된 선형 예측 분석 윈도우를 결정하기 위한 계산 복잡도가 감소될 수 있도록, 수정된 선형 예측 분석 윈도우는 복수의 미리 저장된 후보 선형 예측 분석 윈도우로부터 결정된다.
구체적으로, 대응하는 수정된 선형 예측 분석 윈도우는 초기 선형 예측 분석 윈도우 및 상이한 값 범위 내의 감쇠 윈도우의 윈도우 길이에 대응하는 미리 선택된 감쇠 윈도우의 윈도우 길이에 기초하여 개별적으로 계산된 후, 상이한 값 범위 내의 감쇠 윈도우의 윈도우 길이에 대응하는 수정된 선형 예측 분석 윈도우가 저장될 수 있다. 이러한 방식으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 후속적으로 결정된 후에, 수정된 선형 예측 분석 윈도우가 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 충족시키는 값 범위에 기초하여 복수의 미리 저장된 선형 예측 분석 윈도우로부터 직접 결정될 수 있다. 이것은 계산 프로세스를 감소시키고 계산 복잡도를 단순화시킬 수 있다.
선택적으로, 수정된 선형 예측 분석 윈도우가 계산되는 경우, 미리 선택된 감쇠 윈도우의 윈도우 길이는 감쇠 윈도우의 윈도우 길이의 모든 가능한 값 또는 감쇠 윈도우의 윈도우 길이의 모든 가능한 값의 서브 세트일 수 있다 .
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 단계 전에, 상기 스테레오 신호 인코딩 방법은, 상기 감쇠 윈도우의 수정된 윈도우 길이를 획득하기 위해, 미리 설정된 간격 스텝에 기초하여 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 수정하는 단계 - 상기 간격 스텝은 미리 설정된 양의 정수임 -를 더 포함하며, 상기 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 단계는, 상기 초기 선형 예측 분석 윈도우 및 상기 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 상기 수정된 선형 예측 분석 윈도우를 결정하는 단계를 포함한다.
선택적으로, 간격 스텝은 감쇠 윈도우의 윈도우 길이의 최대값보다 작은 양의 정수이다.
감쇠 윈도우의 윈도우 길이가 감소될 수 있도록, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이는 미리 설정된 간격 스텝을 사용하여 수정된다. 또한, 감쇠 윈도우의 수정된 윈도우 길이의 가능한 값은 제한된 개수의 값을 포함하는 세트에 포함되도록 제한되고, 후속 계산 복잡도가 감소될 수 있도록 감쇠 윈도우의 수정된 윈도우 길이의 가능한 값에 대응하는 감쇠 윈도우를 저장하는 것이 편리하다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 감쇠 윈도우의 수정된 윈도우 길이는 다음의 수학식
Figure pat00005
을 충족시키며,
sub_window_len_mod는 상기 감쇠 윈도우의 수정된 윈도우 길이를 나타내고, len_step은 상기 간격 스텝을 나타낸다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 초기 선형 예측 분석 윈도우 및 상기 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 상기 수정된 선형 예측 분석 윈도우를 결정하는 단계는, 상기 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 상기 초기 선형 예측 분석 윈도우를 수정하는 단계를 포함한다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 초기 선형 예측 분석 윈도우 및 상기 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 상기 수정된 선형 예측 분석 윈도우를 결정하는 단계는, 상기 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 상기 현재 프레임에서의 감쇠 윈도우를 결정하는 단계; 및 상기 수정된 감쇠 윈도우에 기초하여 상기 현재 프레임에서의 상기 초기 선형 예측 분석 윈도우를 수정하는 단계를 포함한다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 상기 현재 프레임에서의 감쇠 윈도우를 결정하는 단계는, 상기 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 복수의 미리 저장된 후보 감쇠 윈도우로부터 상기 현재 프레임에서의 감쇠 윈도우를 결정하는 단계를 포함하며, 상기 복수의 미리 저장된 후보 감쇠 윈도우는 상기 감쇠 윈도우의 수정된 윈도우 길이의 상이한 값에 대응하는 감쇠 윈도우이다.
미리 선택된 수정된 감쇠 윈도우의 그룹의 윈도우 길이에 기초하여 대응하는 감쇠 윈도우가 계산된 후, 미리 선택된 수정된 감쇠 윈도우의 윈도우 길이에 대응하는 감쇠 윈도우가 저장될 수 있다. 이러한 방식으로, 감쇠 윈도우의 수정된 윈도우 길이가 후속으로 결정된 후에, 현재 프레임에서의 감쇠 윈도우는 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 복수의 미리 저장된 후보 감쇠 윈도우로부터 직접 결정될 수 있다. 이것은 계산 프로세스를 감소시키고 계산 복잡도를 단순화시킬 수 있다.
여기에서 미리 선택된 수정된 감쇠 윈도우의 윈도우 길이는 감쇠 윈도우의 수정된 윈도우 길이의 모든 가능한 값 또는 감쇠 윈도우의 수정된 윈도우 길이의 모든 가능한 값의 서브 세트일 수 있음을 이해해야 한다.
제1 측면을 참조한, 제1 측면의 일부 구현예에서, 상기 현재 프레임에서의 초기 선형 예측 분석 윈도우 및 상기 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 상기 수정된 선형 예측 분석 윈도우를 결정하는 단계는, 상기 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 복수의 미리 저장된 후보 선형 예측 분석 윈도우로부터 상기 수정된 선형 예측 분석 윈도우를 결정하는 단계를 포함하며, 상기 복수의 미리 저장된 후보 선형 예측 분석 윈도우는 상기 감쇠 윈도우의 수정된 윈도우 길이가 상이한 값인 경우 대응하는 수정된 선형 예측 분석 윈도우이다.
대응하는 수정된 선형 예측 분석 윈도우가 현재 프레임에서의 초기 선형 예측 분석 윈도우 및 미리 선택된 수정된 감쇠 윈도우의 그룹의 윈도우 길이에 기초하여 개별적으로 계산된 후, 미리 선택된 수정된 감쇠 윈도우의 윈도우 길이에 대응하는 수정된 선형 예측 분석 윈도우가 저장될 수 있다. 이러한 방식으로, 감쇠 윈도우의 수정된 윈도우 길이가 후속으로 결정된 후에, 수정된 선형 예측 분석 윈도우는 현재 프레임에서의 수정된 감쇠 윈도우의 윈도우 길이에 기초하여 복수의 미리 저장된 후보 선형 예측 분석 윈도우로부터 직접 결정될 수 있다. 이것은 계산 프로세스를 감소시키고 계산 복잡도를 단순화시킬 수 있다.
선택적으로, 여기에서 미리 선택된 수정된 감쇠 윈도우의 윈도우 길이는 감쇠 윈도우의 수정된 윈도우 길이의 모든 가능한 값 또는 감쇠 윈도우의 수정된 윈도우 길이의 모든 가능한 값의 서브 세트이다.
제2 측면에 따르면, 인코딩 장치가 제공된다. 인코딩 장치는 제1 측면에서 또는 제1 측면의 다양한 구현예에서의 방법을 수행하도록 구성된 모듈을 포함한다.
제3 측면에 따르면, 인코딩 장치가 제공되며, 메모리 및 프로세서를 포함한다. 메모리는 프로그램을 저장하도록 구성되고, 프로세서는 프로그램을 실행하도록 구성된다. 프로그램이 실행될 때, 프로세서는 제1 측면 중 어느 하나 또는 제1 측면의 구현예에서의 방법을 수행한다.
제4 측면에 따르면, 컴퓨터 판독 가능 저장 매체가 제공된다. 컴퓨터 판독 가능 저장 매체는 장치에 의해 실행되는 프로그램 코드를 저장하도록 구성되며, 프로그램 코드는 제1 측면 또는 제1 측면의 다양한 구현예에서의 방법을 수행하는 데 사용되는 명령을 포함한다.
제5 측면에 따르면, 칩이 제공된다. 칩은 프로세서 및 통신 인터페이스를 포함한다. 통신 인터페이스는 외부 컴포넌트와 통신하도록 구성되고, 프로세서는 제1 측면 중 어느 하나 또는 제1 측면의 가능한 구현예에서의 방법을 수행하도록 구성된다.
선택적으로, 구현예에서, 칩은 메모리를 더 포함할 수 있다. 메모리는 명령을 저장하고, 프로세서는 메모리에 저장된 명령을 실행하도록 구성된다. 명령이 실행될 때, 프로세서는 제1 측면 중 어느 하나 또는 제1 측면의 가능한 구현예에서의 방법을 수행하도록 구성된다.
선택적으로, 구현예에서, 칩은 단말 장치 또는 네트워크 장치에 통합된다.
도 1은 시간 도메인 스테레오 인코딩 방법의 개략적인 흐름도이다.
도 2는 시간 도메인 스테레오 디코딩 방법의 개략적인 흐름도이다.
도 3은 본 출원의 실시예에 따른 스테레오 신호 인코딩 방법의 개략적인 흐름도이다.
도 4는 본 출원의 실시예에 따라 스테레오 신호 인코딩 방법을 사용하여 획득된 선형 예측 계수와 실제 선형 예측 계수 사이의 차이의 스펙트럼 도면이다.
도 5는 본 출원의 실시예에 따른 스테레오 신호 인코딩 방법의 개략적인 흐름도이다.
도 6은 본 출원의 실시예에 따른 지연 정렬 처리의 개략도이다.
도 7은 본 출원의 실시예에 따른 지연 정렬 처리의 개략도이다.
도 8은 본 출원의 실시예에 따른 지연 정렬 처리의 개략도이다.
도 9는 본 출원의 실시예에 따른 선형 예측 분석 프로세스의 개략적인 흐름도이다.
도 10은 본 출원의 실시예에 따른 선형 예측 분석 프로세스의 개략적인 흐름도이다.
도 11은 본 출원의 실시예에 따른 인코딩 장치의 개략적인 블록도이다.
도 12는 본 출원의 실시예에 따른 인코딩 장치의 개략적인 블록도이다.
도 13은 본 출원의 실시예에 따른 단말 장치의 개략도이다.
도 14는 본 출원의 실시예에 따른 네트워크 장치의 개략도이다.
도 15는 본 출원의 실시예에 따른 네트워크 장치의 개략도이다.
도 16은 본 출원의 실시예에 따른 단말 장치의 개략도이다.
도 17은 본 출원의 실시예에 따른 네트워크 장치의 개략도이다.
도 18은 본 출원의 실시예에 따른 네트워크 장치의 개략도이다.
이하, 첨부 도면을 참조하여 본 출원의 기술적 해결수단을 설명한다.
본 출원의 실시예에서의 스테레오 신호 인코딩 방법의 이해를 돕기 위해, 이하에서 먼저 도 1 및 도 2를 참조하여 시간 도메인 스테레오 인코딩/디코딩 방법의 일반적인 인코딩/디코딩 프로세스를 간략하게 설명한다.
도 1은 시간 도메인 스테레오 인코딩 방법의 개략적인 흐름도이다. 인코딩 방법(100)은 구체적으로 다음 단계를 포함한다.
단계 110. 인코더 측은 스테레오 신호의 채널 간 시간차를 획득하기 위해 스테레오 신호의 채널 간 시간차를 추정한다.
스테레오 신호는 좌측 사운드 채널 신호 및 우측 사운드 채널 신호를 포함하고, 스테레오 신호의 채널 간 시간차는 좌측 사운드 채널 신호와 우측 사운드 채널 신호 사이의 시간차이다.
단계 120. 채널 간 시간차에 기초하여 좌측 사운드 채널 신호 및 우측 사운드 채널 신호에 대해 지연 정렬 처리를 수행한다.
단계 130. 채널 간 시간차의 인코딩 인덱스를 획득하기 위해, 스테레오 신호의 채널 간 시간차를 인코딩하고, 인코딩된 인덱스를 스테레오 인코딩된 비트스트림에 기록한다.
단계 140. 사운드 채널 결합 비율 인자를 결정하고, 사운드 채널 결합 비율 인자의 인코딩 인덱스를 획득하기 위해 사운드 채널 결합 비율 인자를 인코딩하며, 인코딩 인덱스를 스테레오 인코딩된 비트스트림에 기록한다.
단계 150. 사운드 채널 결합 비율 인자에 기초하여, 지연 정렬 처리 후에 획득된 좌측 사운드 채널 신호 및 우측 사운드 채널 신호에 대한 시간 도메인 다운믹싱 처리를 수행한다.
단계 160. 1차 사운드 채널 신호 및 2차 사운드 채널 신호를 포함하는 비트스트림을 획득하기 위해, 다운믹싱 처리 후에 획득된 1차 사운드 채널 신호 및 2차 사운드 채널 신호를 별도로 인코딩하고, 비트스트림을 스테레오 인코딩된 비트스트림에 기록한다.
도 2는 시간 도메인 스테레오 디코딩 방법의 개략적인 흐름도이다. 인코딩 방법(200)은 구체적으로 다음 단계를 포함한다.
단계 210. 수신된 비트스트림에 기초한 디코딩을 통해 1차 사운드 채널 신호 및 2차 사운드 채널 신호를 획득한다.
단계 210에서의 비트스트림은 인코더 측으로부터 디코더 측에 의해 수신될 수 있다. 또한, 단계 210은 1차 사운드 채널 신호 및 2차 사운드 채널 신호를 획득하기 위해 1차 사운드 채널 신호 및 2차 사운드 채널 신호를 개별적으로 디코딩하는 것과 동등하다.
단계 220. 수신된 비트스트림에 기초한 디코딩을 통해 사운드 채널 결합 비율 인자를 획득한다.
단계 230. 시간 도메인 업믹싱 처리 후에 획득된 재구성된 좌측 사운드 채널 신호 및 재구성된 우측 사운드 채널 신호를 획득하기 위해, 사운드 채널 결합 비율 인자에 기초하여 1차 사운드 채널 신호 및 2차 사운드 채널 신호에 대해 시간 도메인 업믹싱 처리를 수행한다.
단계 240. 수신된 비트스트림에 기초한 디코딩을 통해 채널 간 시간차를 획득한다.
단계 250. 디코딩된 스테레오 신호를 획득하기 위해, 채널 간 시간차에 기초하여, 시간 도메인 업믹싱 처리 후에 획득된 재구성된 좌측 사운드 채널 신호 및 재구성된 우측 사운드 채널 신호에 대해 지연 조정을 수행한다.
지연 정렬 처리가 방법(100)에서의 단계 120에서 수행되는 경우, 현재 프레임에서 타깃 사운드 채널 상의 순방향 신호는 수동으로 재구성될 필요가 있다. 그러나, 현재 프레임의 타깃 사운드 채널에서 수동으로 재구성된 순방향 신호와 실제 순방향 신호는 크게 다르다. 따라서, 선형 예측 분석 동안, 수동으로 재구성된 순방향 신호로 인해, 다운믹싱 처리 후에 획득된 1차 사운드 채널 신호 및 2차 사운드 채널 신호가 단계 160에서 개별적으로 인코딩되는 경우 선형 예측 분석을 통해 획득된 선형 예측 계수가 부정확하고, 선형 예측 분석을 통해 획득된 선형 예측 계수와 실제 선형 예측 계수가 어느 정도 다르다. 따라서, 새로운 스테레오 신호 인코딩 방법이 제공될 필요가 있다. 인코딩 방법은 선형 예측 분석의 정확도를 향상시킬 수 있고, 선형 예측 분석을 통해 획득된 선형 예측 계수와 실제 선형 예측 계수 사이의 차이를 감소시킬 수 있다.
따라서, 본 출원은 새로운 스테레오 인코딩 방법을 제공한다. 이 방법에서, 초기 선형 예측 분석 윈도우가 수정되어, 수정된 선형 예측 분석 윈도우 내에 있는 포인트의 값이자 또한 현재 프레임의 타깃 사운드 채널 상에서 수동으로 재구성된 순방향 신호에 대응하는 포인트의 값이 수정될 선형 예측 분석 윈도우 내에 있는 포인트의 값이자 또한 현재 프레임의 타깃 사운드 채널 상에서 수동으로 재구성된 순방향 신호에 대응하는 포인트의 값보다 작도록 할 수 있다. 따라서, 선형 예측 동안, 현재 프레임의 타깃 사운드 채널 상에서 수동으로 재구성된 순방향 신호의 영향이 감소될 수 있고, 선형 예측 분석 결과의 정확도에 대한 수동으로 재구성된 순방향 신호와 실제 순방향 신호 사이의 오차의 영향이 감소된다. 이러한 방식으로, 선형 예측 분석을 통해 획득된 선형 예측 계수와 실제 선형 예측 계수 사이의 차이가 감소될 수 있고, 선형 예측 분석의 정확도가 향상될 수 있다.
도 3은 본 출원의 실시예에 따른 인코딩 방법의 개략적인 흐름도이다. 방법(300)은 인코더 측에 의해 수행될 수 있다. 인코더 측은 인코더 또는 스테레오 신호를 인코딩하는 기능을 갖는 장치일 수 있다. 방법(300)은 방법(100)에서의 단계 160에서의 다운믹싱 처리 후에 획득된 1차 사운드 채널 신호 및 2차 사운드 채널 신호를 인코딩하는 전체 프로세스의 일부일 수 있음이 이해되어야 한다. 구체적으로, 방법(300)은 단계 160에서의 다운믹싱 처리 후에 획득된 1차 사운드 채널 신호 또는 2차 사운드 채널 신호에 대해 선형 예측을 수행하는 프로세스일 수 있다.
방법(300)은 구체적으로 다음 단계를 포함한다.
단계 310. 현재 프레임의 채널 간 시간차에 기초하여 현재 프레임의 감쇠 윈도우의 윈도우 길이를 결정한다.
선택적으로, 현재 프레임에서의 채널 간 시간차의 절대값과 현재 프레임에서의 천이 세그먼트의 미리 설정된 길이(천이 세그먼트는 현재 프레임에서 실제 신호와 수동으로 재구성된 순방향 신호 사이에 위치함)의 합은 감쇠 윈도우의 윈도우 길이로서 직접 결정될 수 있다.
구체적으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이는 [수학식 1]에 따라 결정될 수 있다.
[수학식 1]
sub_window_len = abs(cur_itd) + Ts2
[수학식 1]에서, sub_window_len은 감쇠 윈도우의 윈도우 길이를 나타내고, cur_itd는 현재 프레임에서의 채널 간 시간차를 나타내며, abs(cur_itd)는 현재 프레임에서의 채널 간 시간차의 절대값을 나타내고, Ts2는 현재 프레임에서의 실제 신호와 수동으로 재구성된 순방향 신호 사이의 평활도 변이(transition)를 향상시키기 위해 미리 설정된 천이 세그먼트의 길이를 나타낸다.
감쇠 윈도우의 윈도우 길이의 최대값이 [수학식 2]를 충족한다는 것을 [수학식 1]에서 알 수 있다.
[수학식 2]
MAX_WIN_LEN = MAX_DELAY + Ts2
MAX_WIN_LEN은 감쇠 윈도우의 윈도우 길이의 최대값을 나타내고, [수학식 2]에서의 Ts2의 의미는 [수학식 1]에서의 Ts2의 의미와 동일하며, MAX_DELAY는 미리 설정된 0보다 큰 실수이다. 또한, MAX_DELAY는 채널 간 시간차의 절대값의 획득 가능한 최대값일 수 있다. 다른 코덱에 대해, 채널 간 시간차의 절대값의 획득 가능한 최대값은 상이할 수 있고, MAX_DELAY는 사용자 또는 코덱 제조업자에 의해 요구되는 대로 설정될 수 있다. 코덱이 작동하는 경우, MAX_DELAY의 특정 값은 이미 결정된 값이라는 것을 이해할 수 있다.
예를 들어, 스테레오 신호의 샘플링 레이트가 16 kHz인 경우, MAX_DELAY는 40이고, Ts2는 10일 수 있다. 이 경우, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이의 최대값 MAX_WIN_LEN이 50이라는 것을 [수학식 2]에 따라 알 수 있다.
선택적으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이는 현재 프레임에서의 채널 간 시간차의 절대값과 현재 프레임에서의 천이 세그먼트의 미리 설정된 길이 사이의 비교 결과에 따라 결정될 수 있다.
구체적으로, 현재 프레임에서의 채널 간 시간차의 절대값이 현재 프레임에서의 천이 세그먼트의 미리 설정된 길이 이상인 경우, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이는 현재 프레임에서의 채널 간 시간차의 절대값과 천이 세그먼트의 미리 설정된 길이의 합이거나, 또는 현재 프레임에서의 채널 간 시간차의 절대값이 현재 프레임에서의 천이 세그먼트의 미리 설정된 길이보다 작은 경우, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이는 현재 프레임에서의 채널 간 시간차의 절대값의 N배이다. 이론적으로, N은 0보다 크고 L/MAX_DELAY보다 작은 임의의 미리 설정된 실수일 수 있다. 일반적으로, N은 0보다 크고 2 이하의 미리 설정된 정수일 수 있다.
구체적으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이는 [수학식 3]에 따라 결정될 수 있다.
[수학식 3]
Figure pat00006
[수학식 3]에서, sub_window_len은 감쇠 윈도우의 윈도우 길이를 나타내고, cur_itd는 현재 프레임에서의 채널 간 시간차를 나타내며, abs(cur_itd)는 현재 프레임에서의 채널 간 시간차의 절대값을 나타내고, Ts2는 현재 프레임에서 실제 신호와 수동으로 재구성된 순방향 신호 사이의 평활도 변이를 향상시키기 위해 미리 설정된 천이 세그먼트의 길이를 나타내며, N은 0보다 크고 L/MAX_DELAY보다 작은 미리 설정된 실수이다. 바람직하게, N은 0보다 크고 2 이하의 미리 설정된 정수이다. 예를 들어, N은 2이다.
선택적으로 Ts2는 미리 설정된 양의 정수이다. 예를 들어, 샘플링 레이트가 16 kHz인 경우, Ts2는 10이다. 또한, 스테레오 신호의 상이한 샘플링 레이트와 관련하여, Ts2는 동일한 값 또는 다른 값으로 설정될 수 있다.
현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 [수학식 3]에 따라 결정되는 경우, 감쇠 윈도우의 윈도우 길이의 최대값은 [수학식 4] 또는 [수학식 5]를 충족시킨다.
[수학식 4]
MAX_WIN_LEN = MAX_DELAY + Ts2
[수학식 5]
MAX_WIN_LEN = n*MAX_DELAY
예를 들어, 스테레오 신호의 샘플링 레이트가 16 kHz인 경우 MAX_DELAY는 40일 수 있고, Ts2는 10일 수 있으며, N은 2일 수 있다. 이 경우, [수학식 4]에 따라서 현재 프레임에서의 감쇠 윈도우의 윈도우 길이의 최대값 MAX_WIN_LEN이 50이라는 것을 알 수 있다.
예를 들어, 스테레오 신호의 샘플링 레이트가 16 kHz인 경우, MAX_DELAY는 40일 수 있고, Ts2는 50일 수 있으며, N은 2일 수 있다. 이 경우, [수학식 5]에 따라서 현재 프레임에서의 감쇠 윈도우의 윈도우 길이의 최대값 MAX_WIN_LEN이 80이라는 것을 알 수 있다.
단계 320. 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하며, 여기서 수정된 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 적어도 일부 포인트의 값은 초기 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 대응하는 포인트의 값보다 작고, sub_window_len은 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 나타내며, L은 수정된 선형 예측 분석 윈도우의 윈도우 길이를 나타내고, 수정된 선형 예측 분석 윈도우의 윈도우 길이는 초기 선형 예측 분석 윈도우의 윈도우 길이와 동일하다.
또한, 수정된 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 임의의 포인트의 값은 초기 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 대응하는 포인트의 값보다 작다.
수정된 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 임의의 포인트에 대응하는 초기 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 포인트는 초기 선형 예측 분석 윈도우에 있는 포인트이자 또한 임의의 포인트와 동일한 인덱스(index)를 갖는 포인트이다. 예를 들어, 수정된 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)에 대응하는 초기 선형 예측 분석 윈도우에서의 포인트는 초기 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)이다.
선택적으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 것은 구체적으로, 수정된 선형 예측 분석 윈도우를 획득하기 위해, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 초기 선형 예측 분석 윈도우를 수정하는 것을 포함한다. 또한, 초기 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 대응하는 포인트의 값에 대한 수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 값의 감쇠값은 상승 추세를 나타낸다.
감쇠값은 초기 선형 예측 분석 윈도우에서 대응하는 포인트의 값에 대한 수정된 선형 예측 분석 윈도우에서의 포인트의 값의 감쇠값일 수 있음을 이해해야 한다. 예를 들어, 초기 선형 예측 분석 윈도우에서 대응하는 포인트의 값에 대한 수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)의 값의 감쇠값은 구체적으로 수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)의 값과 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)의 값 사이의 차이를 결정함으로써 결정된다.
예를 들어, 제1 포인트는 수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 임의의 포인트이고, 제2 포인트는 선형 예측 분석 윈도우 내에 있는 포인트이자 또한 제1 포인트에 대응하는 포인트이다. 이 경우, 감쇠값은 제1 포인트의 값과 제2 포인트의 값 사이의 차이일 수 있다.
현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 초기 선형 예측 분석 윈도우를 수정하는 것은 초기 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 적어도 일부 포인트의 값을 감소시키는 것임을 이해해야 한다. 즉, 초기 선형 예측 분석 윈도우가 수정된 선형 예측 분석 윈도우를 획득하기 위해 수정된 후, 수정된 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 적어도 일부 포인트의 값은 초기 선형 예측 분석 윈도우에서 대응하는 포인트의 값보다 작다.
감쇠 윈도우의 윈도우 길이 범위 내의 모든 포인트에 대응하는 감쇠값 또는 감쇠 윈도우 내의 모든 포인트의 값은 0을 포함할 수 있거나 또는 0을 포함하지 않을 수 있음을 이해해야 한다. 또한, 감쇠 윈도우의 윈도우 길이 범위 내의 모든 포인트의 값 및 감쇠 윈도우 내의 모든 포인트의 값은 0 이하의 실수일 수 있거나, 또는 0 이상의 실수일 수 있다.
감쇠 윈도우에서의 모든 포인트의 값이 0 이하의 실수인 경우, 초기 선형 예측 분석 윈도우가 감쇠 윈도우의 윈도우 길이에 기초하여 수정될 때, 초기 선형 예측 윈도우에서 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 임의의 포인트의 값은 수정된 선형 예측 분석 윈도우에서 대응하는 포인트의 값을 획득하기 위해 감쇠 윈도우에서 대응하는 포인트의 값에 가산될 수 있다.
그러나, 감쇠 윈도우 내의 모든 포인트의 값이 0 이상의 실수인 경우, 초기 선형 예측 분석 윈도우가 감쇠 윈도우의 윈도우 길이에 기초하여 수정될 때, 초기 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 임의의 포인트의 값은 수정된 선형 예측 분석 윈도우에서 대응하는 포인트의 값을 획득하기 위해 감쇠 윈도우에서 대응하는 포인트의 값으로부터 감산될 수 있다.
전술한 두 단락은 감쇠 윈도우 내의 모든 포인트의 값이 0 이상의 실수이거나 또는 감쇠 윈도우 내의 모든 포인트의 값이 0 이하의 실수인 경우에 수정된 선형 예측 분석 윈도우에서 대응하는 포인트의 값을 결정하는 방식을 설명한다. 감쇠 윈도우의 윈도우 길이 범위 내의 모든 포인트의 값이 0 이상의 실수 또는 0 이하의 실수인 경우, 수정된 선형 예측 분석 윈도우에서 대응하는 포인트의 값은 또한 전술한 두 단락의 내용에서와 유사한 방식으로 각각 결정될 수 있다.
감쇠 윈도우 내의 모든 포인트의 값이 0이 아닌 실수인 경우, 초기 선형 예측 분석 윈도우가 수정된 후, 수정된 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 값 모두는 초기 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 대응하는 포인트의 값보다 작다.
그러나, 감쇠 윈도우 내의 일부 포인트의 값이 모두 0인 경우, 초기 선형 예측 분석 윈도우가 수정된 후, 수정된 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 적어도 일부 포인트의 모든 값은 초기 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 대응하는 포인트의 값보다 작다.
임의의 유형의 선형 예측 분석 윈도우가 현재 프레임에서의 초기 선형 예측 분석 윈도우로서 선택될 수 있음을 이해해야 한다. 구체적으로, 현재 프레임에서의 초기 선형 예측 분석 윈도우는 대칭 윈도우 또는 비대칭 윈도우일 수 있다.
또한, 스테레오 신호의 샘플링 레이트가 12.8 kHz인 경우, 초기 선형 예측 분석 윈도우의 윈도우 길이 L은 320 포인트일 수 있다. 이 경우, 초기 선형 예측 분석 윈도우
Figure pat00007
은 [수학식 6]을 충족시킨다.
[수학식 6]
Figure pat00008
L = L1 + L2이고, L1 = 188이며, L2 = 132이다.
또한, 초기 선형 예측 분석 윈도우를 결정하는 복수의 방식이 있다. 구체적으로, 초기 선형 예측 분석 윈도우는 초기 선형 예측 분석 윈도우를 실시간으로 계산함으로써 획득될 수 있거나, 또는 초기 선형 예측 분석 윈도우는 미리 저장된 선형 예측 분석 윈도우로부터 직접 획득될 수 있다. 이러한 미리 저장된 선형 예측 분석 윈도우는 계산되어 테이블 형태로 저장될 수 있다.
초기 선형 예측 분석 윈도우를 실시간으로 계산하여 초기 선형 예측 분석 윈도우를 획득하는 방식과 비교하면, 초기 선형 예측 분석 윈도우는 미리 저장된 선형 예측 분석 윈도우로부터 선형 예측 분석 윈도우를 획득하는 방식으로 신속하게 획득될 수 있다. 이는 계산 복잡성을 줄이고 인코딩 효율을 향상시킨다.
사운드 채널 신호에 대해 지연 정렬 처리가 수행되는 경우, 현재 프레임에서 타깃 사운드 채널에 대한 순방향 신호는 수동으로 재구성될 필요가 있다. 그러나, 수동으로 재구성된 순방향 신호에서, 현재 프레임에서 타깃 사운드 채널 상의 실제 신호로부터 멀리 떨어진 포인트의 추정된 신호 값은 더 부정확하다. 그러나, 수정된 선형 예측 분석 윈도우는 수동으로 재구성된 순방향 신호에 대해 작용한다. 따라서, 본 출원에서 수정된 선형 예측 분석 윈도우를 사용하여 순방향 신호가 처리되는 경우, 수동으로 재구성된 순방향 신호 내에 있는 신호이자 또한 선형 예측 분석에서 실제 신호로부터 멀리 떨어진 포인트에 대응하는 신호의 비율은 선형 예측의 정확도가 더 향상될 수 있도록 감소될 수 있다.
구체적으로, 수정된 선형 예측 분석 윈도우는 [수학식 7]을 충족시키고, 수정된 선형 예측 분석 윈도우는 [수학식 7]에 따라 결정될 수 있다.
[수학식 7]
Figure pat00009
[수학식 7]에서, sub_window_len은 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 나타내고, Wadp(i)는 수정된 선형 예측 분석 윈도우를 나타내며, w(i)는 초기 선형 예측 분석 윈도우를 나타내고, L은 수정된 선형 예측 분석 윈도우의 윈도우 길이를 나타내며,
Figure pat00010
이고, MAX_ATTEN은 미리 설정된 0보다 큰 실수이다.
MAX_ATTEN은 구체적으로 초기 선형 예측 분석 윈도우가 초기 선형 예측 분석 윈도우의 수정 동안 감쇠되는 경우 획득될 수 있는 최대 감쇠값일 수 있음을 이해해야 한다. MAX_ATTEN의 값은 0.07, 0.08 등일 수 있으며, MAX_ATTEN은 경험에 기초하여 당업자에 의해 미리 설정될 수 있다.
선택적으로, 실시예에서, 초기 선형 예측 분석 윈도우 및 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 것은 구체적으로, 감쇠 윈도우의 윈도우 길이에 기초하여 현재 프레임에서의 감쇠 윈도우를 결정하고, 현재 프레임에서의 감쇠 윈도우에 기초하여 초기 선형 예측 분석 윈도우를 수정하는 것을 포함하며, 여기서 초기 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 대응하는 포인트의 값에 대한 수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 값의 감쇠값은 상승 추세를 나타낸다. 감쇠값이 상승 추세를 나타내는 것은 감쇠값이 수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)에서 포인트(L - 1)까지의 포인트의 인덱스(index)에서의 증가에 따라 증가하는 추세에 있음을 의미한다. 즉, 포인트(L - sub_window_len)의 감쇠값이 가장 작고, 포인트(L - 1)의 감쇠값이 가장 크며, 포인트 N의 감쇠값은 포인트(N-1)의 감쇠값보다 크며, 여기서 L - sub_window_len ≤ N ≤ L - 1이다.
감쇠 윈도우는 선형 윈도우 또는 비선형 윈도우일 수 있음을 이해해야 한다.
구체적으로, 감쇠 윈도우가 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 결정되는 경우, 감쇠 윈도우는 [수학식 8]을 충족시킨다. 즉, 감쇠 윈도우는 [수학식 8]에 따라 결정될 수 있다.
[수학식 8]
Figure pat00011
MAX_ATTEN은 감쇠값의 최대값을 나타내고, [수학식 8]에서의 MAX_ATTEN의 의미는 [수학식 7]에서의 것과 동일하다.
현재 프레임에서의 감쇠 윈도우에 기초하여 선형 예측 분석 윈도우를 수정함으로써 획득되는 수정된 선형 예측 분석 윈도우는 [수학식 9]를 충족시킨다. 다시 말해서, 감쇠 윈도우가 [수학식 8]에 따라 결정된 후, 수정된 선형 예측 분석 윈도우는 [수학식 9]에 따라 결정될 수 있다.
[수학식 9]
Figure pat00012
[수학식 8] 및 [수학식 9]에서, sub_window_len은 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 나타내고, sub_window(.)는 현재 프레임에서의 감쇠 윈도우를 나타낸다. 구체적으로, sub_window(i-(L - sub_window_len))는 포인트 i-(L - sub_window_len)에서 현재 프레임의 감쇠 윈도우의 값을 나타내고, Wadp(i)는 수정된 선형 예측 분석 윈도우를 나타내며, w(i)는 초기 선형 예측 분석 윈도우를 나타내고, L은 수정된 선형 예측 분석 윈도우의 윈도우 길이를 나타낸다.
선택적으로, 감쇠 윈도우가 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 결정되는 경우, 현재 프레임에서의 감쇠 윈도우는 구체적으로 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 복수의 미리 저장된 후보 감쇠 윈도우로부터 결정될 수 있다. 복수의 후보 감쇠 윈도우는 상이한 윈도우 길이 값 범위에 대응하고, 상이한 윈도우 길이 값 범위 사이에 교집합은 없다.
감쇠 윈도우를 결정하기 위한 계산 복잡도가 감소될 수 있도록 현재 프레임에서의 감쇠 윈도우는 미리 저장된 복수의 후보 감쇠 윈도우로부터 결정된다. 그 후, 수정된 선형 예측 분석 윈도우는 복수의 미리 저장된 감쇠 윈도우로부터 직접 결정될 수 있다.
구체적으로, 대응하는 감쇠 윈도우가 상이한 값 범위 내의 감쇠 윈도우의 윈도우 길이에 대응하는 미리 선택된 감쇠 윈도우의 윈도우 길이에 기초하여 개별적으로 계산된 후, 상이한 값 범위 내의 감쇠 윈도우의 윈도우 길이에 대응하는 감쇠 윈도우는 저장될 수 있다. 이러한 방식으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 후속적으로 결정된 후에, 현재 프레임에서의 감쇠 윈도우는 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 충족하는 값 범위에 기초하여 복수의 미리 저장된 감쇠 윈도우로부터 직접 결정될 수 있다. 이것은 계산 프로세스를 감소시키고 계산 복잡도를 단순화할 수 있다.
감쇠 윈도우가 계산될 때, 미리 선택된 감쇠 윈도우의 윈도우 길이는 감쇠 윈도우의 윈도우 길이의 모든 가능한 값 또는 감쇠 윈도우의 윈도우 길이의 모든 가능한 값의 서브 세트일 수 있음을 이해해야 한다.
구체적으로, 감쇠 윈도우의 윈도우 길이가 20인 경우, 대응하는 감쇠 윈도우는 sub_window_20(i)과 같이 표시되고, 감쇠 윈도우의 윈도우 길이가 40인 경우, 대응하는 감쇠 윈도우는 sub_window_40(i)과 같이 표시되며, 감쇠 윈도우의 윈도우 길이가 60인 경우, 대응하는 감쇠 윈도우는 sub_window_60(i)과 같이 표시되거나, 또는 감쇠 윈도우의 윈도우 길이가 80인 경우, 대응하는 감쇠 윈도우는 sub_window_80(i)와 같이 표시되는 것으로 가정된다.
따라서, 현재 프레임에서의 감쇠 윈도우가 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 복수의 미리 저장된 감쇠 윈도우로부터 결정되는 경우, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 20이상이고 40 미만이면, sub_window_20(i)가 현재 프레임에서의 감쇠 윈도우로서 결정될 수 있고, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 40 이상이고 60 미만이면, sub_window_40(i)가 현재 프레임에서의 감쇠 윈도우로서 결정될 수 있으며, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 60 이상이고 80 미만이면, sub_widnow_60(i)가 현재 프레임에서의 감쇠 윈도우로 결정될 수 있거나, 또는 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 80이상이면, sub_window_80(i)가 현재 프레임에서의 감쇠 윈도우로서 결정될 수 있다.
구체적으로, 현재 프레임에서의 감쇠 윈도우가 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 복수의 미리 저장된 감쇠 윈도우로부터 결정되는 경우, 현재 프레임에서의 감쇠 윈도우는 현재 프레임에서의 감쇠 윈도우의 윈도우 길이의 값 범위에 기초하여 복수의 미리 저장된 감쇠 윈도우로부터 직접 결정될 수 있다. 구체적으로, 현재 프레임에서의 감쇠 윈도우는 [수학식 10]에 따라 결정될 수 있다.
[수학식 10]
Figure pat00013
sub_window(i)는 현재 프레임에서의 감쇠 윈도우를 나타내고, sub_window_len은 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 나타내며, sub_window_20(i), sub_window_40(i), sub_window_60(i) 및 sub_window_80(i)는 윈도우 길이가 각각 20, 40, 60 및 80인 미리 저장된 감쇠 윈도우에 대응하는 감쇠 윈도우이다.
[수학식 10]에 따라 결정되는 감쇠 윈도우는 선형 윈도우인 것으로 이해되어야 한다. 본 출원에서의 감쇠 윈도우는 선형 윈도우 또는 비선형 윈도우일 수 있다.
감쇠 윈도우가 비선형 윈도우인 경우, 감쇠 윈도우는 [수학식 11] 내지 [수학식 13] 중 어느 하나에 따라 결정될 수 있다.
[수학식 11]
Figure pat00014
[수학식 12]
Figure pat00015
[수학식 13]
Figure pat00016
[수학식 11] 내지 [수학식 13]에서, sub_window(i)는 현재 프레임에서의 감쇠 윈도우를 나타내고, sub_window_len은 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 나타내며, MAX_ATTEN의 의미는 전술한 것과 동일하다.
감쇠 윈도우가 [수학식 11] 내지 [수학식 13] 중 어느 하나에 따라 결정된 후, 수정된 선형 예측 분석 윈도우는 또한 [수학식 9]에 따라 결정될 수 있음이 이해되어야 한다.
현재 프레임에서의 감쇠 윈도우에 기초하여 선형 예측 분석 윈도우를 수정함으로써 획득되는 수정된 선형 예측 분석 윈도우는 [수학식 14]를 충족시킨다. 다시 말해서, 감쇠 윈도우가 [수학식 10]에 따라 결정된 후, 수정된 선형 예측 분석 윈도우는 [수학식 14] 내지 [수학식 17] 중 어느 하나에 따라 결정될 수 있다.
[수학식 14]
Figure pat00017
[수학식 15]
Figure pat00018
[수학식 16]
Figure pat00019
[수학식 17]
Figure pat00020
[수학식 14] 내지 [수학식 17]에서, sub_window_len은 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 나타내고, wadp(i)는 수정된 선형 예측 분석 윈도우를 나타내며, w(i)는 초기 선형 예측 분석 윈도우를 나타내고, L은 수정된 선형 예측 분석 윈도우의 윈도우 길이를 나타내며, sub_window_20(.), sub_window_40(.), sub_window_60(.) 및 sub_window_80(.)은 길이가 각각 20, 40, 60 및 80인 미리 저장된 감쇠 윈도우에 대응하는 감쇠 윈도우이다. [수학식 10] 내지 [수학식 13] 중 어느 하나에 따르면, 감쇠 윈도우의 윈도우 길이가 20, 40, 60 및 80인 경우에 대응하는 감쇠 윈도우가 미리 계산되어 저장될 수 있다.
수정된 선형 예측 분석 윈도우가 [수학식 14] 내지 [수학식 17] 중 어느 하나에 따라 계산되는 경우, 수정된 선형 예측 분석 윈도우는 현재 프레임의 감쇠 윈도우의 윈도우 길이가 알려져 있는 경우, 감쇠 윈도우의 윈도우 길이의 값의 범위에 기초하여 결정될 수 있다. 예를 들어, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 50인 경우, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이의 값은 40 내지 60(40 이상 60 미만)의 범위이다. 따라서, 수정된 선형 예측 분석 윈도우는 [수학식 15]에 따라 결정될 수 있다. 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 70인 경우, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이의 값은 60 내지 80(60 이상 80 미만)의 범위이다. 이 경우, 수정된 선형 예측 분석 윈도우는 [수학식 16]에 따라 결정될 수 있다.
단계 330. 수정된 선형 예측 분석 윈도우에 기초하여 처리될 사운드 채널 신호에 대해 선형 예측 분석을 수행한다.
처리될 사운드 채널 신호는 1차 사운드 채널 신호 또는 2차 사운드 채널 신호일 수 있다. 또한, 처리될 사운드 채널 신호는 시간 도메인 전처리가 1차 사운드 채널 신호 또는 2차 사운드 채널 신호에 대해 수행된 후에 획득되는 사운드 채널 신호일 수 있다. 1차 사운드 채널 신호 및 2차 사운드 채널 신호는 다운믹싱 처리 후에 획득되는 사운드 채널 신호일 수 있다.
수정된 선형 예측 분석 윈도우에 기초하여 처리될 사운드 채널 신호에 대해 선형 예측 분석을 수행하는 단계는 구체적으로 수정된 선형 예측 분석 윈도우에 기초하여 처리될 사운드 채널 신호에 대해 윈도잉(windowing) 처리를 수행하고, 그 후, 윈도잉 처리 후에 획득되는 신호에 기초하여 현재 프레임에서의 선형 예측 계수를 (구체적으로 레빈슨-더빈 알고리즘에 따라) 계산하는 단계일 수 있다.
본 출원에서, 수정된 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 적어도 일부 포인트의 값이 선형 예측 분석 윈도우에서 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 대응하는 포인트의 값보다 작기 때문에, 선형 예측 분석 결과의 정확도에 대해 수동으로 재구성된 신호와 실제 순방향 신호 사이의 오차의 영향이 감소될 수 있도록, 현재 프레임에서의 타깃 사운드 채널에 대해 수동으로 재구성된 신호(재구성된 신호는 천이 세그먼트 신호 및 순방향 신호를 포함할 수 있음)에 의한 영향이 선형 예측 동안 감소될 수 있다. 따라서, 선형 예측 분석을 통해 획득되는 선형 예측 계수와 실제 선형 예측 계수 사이의 차이가 감소될 수 있고, 선형 예측 분석의 정확도가 향상될 수 있다.
구체적으로, 도 4에 도시된 바와 같이, 기존의 해결수단에 따라 획득되는 선형 예측 계수와 실제 선형 예측 계수 사이에는 비교적 큰 스펙트럼 왜곡이 존재하는 반면, 본 출원에 따라 획득되는 선형 예측 계수와 실제 선형 예측 계수 사이에는 비교적 작은 스펙트럼 왜곡이 존재한다. 따라서, 본 출원의 본 실시예에서의 스테레오 신호 인코딩 방법에 따르면, 선형 예측 분석 동안 획득되는 선형 예측 계수의 스펙트럼 왜곡이 감소될 수 있으며, 이에 의해 선형 예측 분석의 정확도를 향상시킬 수 있음을 알 수 있다.
선택적으로, 실시예에서, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 단계는, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 복수의 미리 저장된 후보 선형 예측 분석 윈도우로부터 수정된 선형 예측 분석 윈도우를 결정하는 단계를 포함하며, 여기서 복수의 후보 선형 예측 분석 윈도우는 상이한 윈도우 길이 값 범위에 대응하고, 상이한 윈도우 길이 값 범위 사이에는 교집합이 없다.
복수의 미리 저장된 후보 선형 예측 분석 윈도우는 현재 프레임에서 상이한 값 범위 내의 감쇠 윈도우의 윈도우 길이에 대응하는 수정된 선형 예측 분석 윈도우이다.
구체적으로, 대응하는 수정된 선형 예측 분석 윈도우는 초기 선형 예측 분석 윈도우 및 상이한 값 범위 내의 감쇠 윈도우의 윈도우 길이에 대응하는 미리 선택된 감쇠 윈도우의 윈도우 길이에 기초하여 개별적으로 계산된 후, 상이한 값 범위 내의 감쇠 윈도우의 윈도우 길이에 대응하는 수정된 선형 예측 분석 윈도우가 저장될 수 있다. 이러한 방식으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 후속적으로 결정된 후에, 수정된 선형 예측 분석 윈도우는 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 충족시키는 값 범위에 기초하여 복수의 미리 저장된 선형 예측 분석 윈도우로부터 직접 결정될 수 있다. 이것은 계산 프로세스를 줄이고 계산 복잡도를 단순화시킬 수 있다.
선택적으로, 수정된 선형 예측 분석 윈도우가 계산되는 경우, 미리 선택된 감쇠 윈도우의 윈도우 길이는 감쇠 윈도우의 윈도우 길이의 모든 가능한 값 또는 감쇠 윈도우의 윈도우 길이의 모든 가능한 값의 서브 세트일 수 있다.
구체적으로, 수정된 선형 예측 분석 윈도우가 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 복수의 미리 저장된 후보 선형 예측 분석 윈도우로부터 결정되는 경우, 수정된 선형 예측 분석 윈도우는 [수학식 18]에 따라 결정될 수 있다.
[수학식 18]
Figure pat00021
wadp(i)는 수정된 선형 예측 분석 윈도우를 나타내고, w(i)는 초기 선형 예측 분석 윈도우를 나타내며, wadp_20(i), wadp_40(i), wadp_60(i) 및 wadp_80(i)은 복수의 미리 저장된 선형 예측 분석 윈도우이다. 구체적으로, wadp_20(i), wadp_40(i), wadp_60(i) 및 wadp_80(i)에 대응하는 감쇠 윈도우의 윈도우 길이는 각각 20, 40, 60 및 80이다.
수정된 선형 예측 분석 윈도우가 [수학식 18]에 따라 결정되는 경우, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이의 값이 결정된 후, 수정된 선형 예측 분석 윈도우는 [수학식 18]에 따라 현재 프레임에서의 감쇠 윈도우의 윈도우 길이가 충족하는 값 범위에 기초하여 직접 결정될 수 있다
선택적으로, 실시예에서, 수정된 선형 예측 분석 윈도우가 감쇠 윈도우의 윈도우 길이에 기초하여 결정되기 전에, 방법(300)은,
감쇠 윈도우의 수정된 윈도우 길이를 획득하기 위해, 미리 설정된 간격 스텝에 기초하여 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 수정하는 단계를 더 포함하며, 여기서 간격 스텝은 미리 설정된 양의 정수이고, 간격 스텝은 감쇠 윈도우의 윈도우 길이의 최대값보다 작은 양의 정수일 수 있다.
감쇠 윈도우의 윈도우 길이가 수정되는 경우, 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 단계는 구체적으로, 초기 선형 예측 분석 윈도우 및 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 단계를 포함한다.
구체적으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이는 먼저 현재 프레임에서의 채널 간 시간차에 기초하여 결정될 수 있고, 그 후, 감쇠 윈도우의 윈도우 길이는 감쇠 윈도우의 수정된 윈도우 길이를 획득하기 위해, 미리 설정된 간격 스텝에 기초하여 수정된다.
적응형 감쇠 윈도우의 윈도우 길이는 감쇠 윈도우의 윈도우 길이가 감소될 수 있도록 미리 설정된 간격 스텝을 사용하여 수정된다. 또한, 후속 계선 복잡도가 감소될 수 있도록 값을 미리 저장하는 것이 편리하기 위해, 감쇠 윈도우의 수정된 윈도우 길이의 값은 제한된 양의 상수를 포함하는 세트에 포함되는 것으로 제한된다.
감쇠 윈도우의 수정된 윈도우 길이는 [수학식 19]를 충족시킨다. 다시 말해서, 미리 설정된 간격 스텝에 기초하여 감쇠 윈도우의 윈도우 길이를 수정하는 단계는 구체적으로 [수학식 19]에 따라 감쇠 윈도우의 윈도우 길이를 수정하는 단계일 수 있다.
[수학식 19]
Figure pat00022
sub_window_len_mod는 감쇠 윈도우의 수정된 윈도우 길이를 나타내고,
Figure pat00023
는 라운딩 다운(rounding down) 연산자를 나타내며, sub_window_len은 감쇠 윈도우의 윈도우 길이를 나타내고, len_step은 간격 스텝을 나타내며, 여기서 간격 스텝은 적응형 감쇠 윈도우의 윈도우 길이의 최대값, 예를 들어 15 또는 20보다 작은 양의 정수일 수 있으며, 간격 스텝은 다르게는 당업자에 의해 미리 설정될 수 있다.
sub_window_len의 최대값이 80이고, len_step이 20인 경우, 감쇠 윈도우의 수정된 윈도우 길이의 값은 0, 20, 40, 60 및 80만을 포함한다. 즉, 감쇠 윈도우의 수정된 윈도우 길이는 단지 {0, 20, 40, 60, 80}에만 속한다. 감쇠 윈도우의 수정된 윈도우 길이가 0인 경우, 초기 선형 예측 분석 윈도우는 수정된 선형 예측 분석 윈도우로서 직접 사용된다.
선택적으로, 실시예에서, 초기 선형 예측 분석 윈도우 및 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 단계는, 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 초기 선형 예측 분석 윈도우를 수정하는 단계를 포함한다.
선택적으로, 실시예에서, 초기 선형 예측 분석 윈도우 및 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 단계는, 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 현재 프레임에서의 감쇠 윈도우를 결정하는 단계; 및 수정된 감쇠 윈도우에 기초하여 현재 프레임에서의 선형 예측 분석 윈도우의 초기 선형 예측 분석 윈도우를 수정하는 단계를 더 포함한다.
선택적으로, 실시예에서, 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 현재 프레임에서의 감쇠 윈도우를 결정하는 단계는, 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 복수의 미리 저장된 후보 감쇠 윈도우로부터 현재 프레임에서의 감쇠 윈도우를 결정하는 단계를 포함하며, 여기서 복수의 미리 저장된 후보 감쇠 윈도우는 감쇠 윈도우의 수정된 윈도우 길이의 상이한 값에 대응하는 감쇠 윈도우이다.
대응하는 감쇠 윈도우가 미리 선택된 수정된 감쇠 윈도우의 그룹의 윈도우 길이에 기초하여 계산된 후, 미리 선택된 수정된 감쇠 윈도우의 윈도우 길이에 대응하는 감쇠 윈도우가 저장될 수 있다. 이러한 방식으로, 감쇠 윈도우의 수정된 윈도우 길이가 후속으로 결정된 후에, 현재 프레임에서의 감쇠 윈도우가 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 복수의 미리 저장된 후보 감쇠 윈도우로부터 직접 결정될 수 있다. 이것은 계산 프로세스를 감소시키고 계산 복잡도를 단순화시킬 수 있다.
본 명세서에서 미리 선택된 수정된 감쇠 윈도우의 윈도우 길이는 감쇠 윈도우의 수정된 윈도우 길이의 모든 가능한 값 또는 감쇠 윈도우의 수정된 윈도우 길이의 모든 가능한 값의 서브 세트일 수 있음을 이해해야 한다.
구체적으로, 현재 프레임에서의 감쇠 윈도우가 현재 프레임에서의 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 복수의 미리 저장된 후보 감쇠 윈도우로부터 결정되는 경우, 현재 프레임에서의 감쇠 윈도우는 [수학식 20]에 따라 결정될 수 있다.
[수학식 20]
Figure pat00024
sub_window(i)는 현재 프레임에서의 감쇠 윈도우를 나타내고, sub_window_len_mod는 감쇠 윈도우의 수정된 윈도우 길이를 나타내며, sub_window_20(i), sub_window_40(i), sub_window_60(i) 및 sub_window_80(i)은 길이가 각각 20, 40, 60 및 80의 윈도우 길이를 갖는 미리 저장된 감쇠 윈도우에 대응하는 감쇠 윈도우이다. sub_window_len_mod가 0인 경우, 초기 선형 예측 분석 윈도우는 수정된 선형 예측 분석 윈도우로서 직접 사용되므로, 현재 프레임에서의 감쇠 윈도우는 결정될 필요가 없다.
선택적으로, 실시예에서, 초기 선형 예측 분석 윈도우 및 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하는 단계는, 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 복수의 미리 저장된 후보 선형 예측 분석 윈도우로부터 수정된 선형 예측 분석 윈도우를 결정하는 단계를 포함하며, 여기서 복수의 미리 저장된 후보 선형 예측 분석 윈도우는 상이한 값의 수정된 감쇠 윈도우의 윈도우 길이에 대응하는 수정된 선형 예측 분석 윈도우이다.
대응하는 수정된 선형 예측 분석 윈도우가 초기 선형 예측 분석 윈도우 및 미리 선택된 수정된 감쇠 윈도우의 그룹의 윈도우 길이에 기초하여 개별적으로 계산된 후, 미리 선택된 수정된 감쇠 윈도우의 윈도우 길이에 대응하는 수정된 선형 예측 분석 윈도우가 저장될 수 있다. 이러한 방식으로, 감쇠 윈도우의 수정된 윈도우 길이가 후속으로 결정된 후에, 수정된 선형 예측 분석 윈도우는 현재 프레임에서의 수정된 감쇠 윈도우의 윈도우 길이에 기초하여 복수의 미리 저장된 후보 선형 예측 분석 윈도우로부터 직접 결정될 수 있다. 이것은 계산 프로세스를 감소시키고 계산 복잡도를 단순화시킬 수 있다.
선택적으로, 본 명세서에서 미리 선택된 수정된 감쇠 윈도우의 윈도우 길이는 감쇠 윈도우의 수정된 윈도우 길이의 모든 가능한 값 또는 감쇠 윈도우의 수정된 윈도우 길이의 모든 가능한 값의 서브 세트이다.
구체적으로, 수정된 선형 예측 분석 윈도우가 현재 프레임에서의 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 복수의 미리 저장된 후보 선형 예측 분석 윈도우로부터 결정되는 경우, 수정된 선형 예측 분석 윈도우는 [수학식 21]에 따라 결정될 수 있다.
[수학식 21]
Figure pat00025
wadp(i)는 수정된 선형 예측 분석 윈도우를 나타내고, w(i)는 초기 선형 예측 분석 윈도우를 나타내며, wadp_20(i), wadp_40(i), wadp_60(i) 및 wadp_80(i)은 복수의 미리 저장된 선형 예측 분석 윈도우이다. 구체적으로, wadp_20(i), wadp_40(i), wadp_60(i) 및 wadp_80(i)에 대응하는 감쇠 윈도우의 윈도우 길이는 각각 20, 40, 60 및 80이다.
도 3에 도시된 방법(300)은 스테레오 신호 인코딩 프로세스의 일부인 것으로 이해되어야 한다. 본 출원에서의 스테레오 신호 인코딩 방법을 더 잘 이해하기 위해, 이하에서는 도 5 내지 도 10을 참조하여 본 출원의 실시예에서의 스테레오 신호 인코딩 방법의 전체 프로세스를 상세하게 설명한다.
도 5는 본 출원의 실시예에 따른 스테레오 신호 인코딩 방법의 개략적인 흐름도이다. 도 5에서의 방법(500)은 구체적으로 다음 단계를 포함한다.
단계 510. 현재 프레임에서의 스테레오 신호에 대해 시간 도메인 전처리를 수행한다.
구체적으로, 여기에서의 스테레오 신호는 시간 도메인 신호이고, 스테레오 신호는 구체적으로 좌측 사운드 채널 신호 및 우측 사운드 채널 신호를 포함한다. 스테레오 신호에 대해 시간 도메인 전처리를 수행하는 단계는 구체적으로, 현재 프레임에서 전처리된 좌측 사운드 채널 신호 및 전처리된 우측 사운드 채널 신호를 획득하기 위해, 현재 프레임에서의 좌측 사운드 채널 신호 및 우측 사운드 채널 신호에 대해 고역 통과 필터링 처리를 수행하는 단계일 수 있다. 또한, 여기에서의 시간 도메인 전처리는 고역 통과 필터링 처리에 추가하여, 프리 엠퍼시스(pre-emphasis) 처리와 같은 다른 처리일 수 있다.
예를 들어, 스테레오 오디오 신호의 샘플링 레이트가 16 HKz이고, 각각의 신호 프레임이 20 ms인 경우, 프레임 길이는 N = 320이다. 즉, 각각의 프레임은 320개의 샘플링 포인트를 포함한다. 현재 프레임에서의 스테레오 신호는 현재 프레임에서의 좌측 사운드 채널 시간 도메인 신호 xL(n) 및 현재 프레임에서의 우측 사운드 채널 시간 도메인 신호 xR(n)을 포함하며, 여기서 n은 샘플링 포인트 개수를 나타내고, n = 0, 1, L, N-1이다. 그 후, 시간 도메인 전처리는 현재 프레임에서의 좌측 사운드 채널 시간 도메인 신호 xL(n) 및 현재 프레임에서의 우측 사운드 채널 시간 도메인 신호 xR(n)에 대해 수행되어, 현재 프레임에서의 전처리된 좌측 사운드 채널 시간 도메인 신호
Figure pat00026
및 현재 프레임에서의 전처리된 우측 사운드 채널 시간 도메인 신호
Figure pat00027
을 획득할 수 있다.
단계 520. 좌측 사운드 채널 신호와 우측 사운드 채널 신호 사이의 채널 간 시간차를 획득하기 위해, 전처리된 좌측 사운드 채널 시간 도메인 신호와 전처리된 우측 사운드 채널 시간 도메인 신호 사이의 채널 간 시간차를 추정한다.
채널 간 시간차를 추정하는 단계는 구체적으로 현재 프레임에서 전처리된 좌측 사운드 채널 신호 및 전처리된 우측 사운드 채널 신호에 기초하여 좌측 사운드 채널과 우측 사운드 채널 사이의 교차 상관 계수를 계산하는 단계일 수 있고, 그 후, 교차 상관 계수의 최대값에 대응하는 인덱스 값이 현재 프레임에서의 채널 간 시간차로서 사용된다.
구체적으로, 채널 간 시간차는 방식 1 내지 방식 3에서 추정될 수 있다. 본 출원은 채널 간 시간차를 추정하기 위해 방식 1 내지 방식 3의 방법을 사용하는 것으로 제한되지 않으며, 채널 간 시간차를 추정하기 위해 다른 종래 기술이 본 출원에서 사용될 수 있음을 이해해야 한다.
방식 1:
현재 샘플링 속도에서, 채널 간 시간차의 최대값과 최소값은 각각 Tmax와 Tmin이며, 여기서 Tmax와 Tmin은 미리 설정된 실수이고, Tmax > Tmin이다. 따라서, 좌측 사운드 채널과 우측 사운드 채널 사이의 교차 상관 계수의 최대값은 채널 간 시간차의 최대값과 최소값 사이에서 검색된다. 마지막으로, 좌측 사운드 채널과 우측 사운드 채널 사이의 교차 상관 계수의 발견된 최대값에 대응하는 인덱스 값은 현재 프레임에서의 채널 간 시간차로서 결정된다. 예를 들어, Tmax와 Tmin의 값은 40 및 -40일 수 있다. 따라서, 좌측 사운드 채널과 우측 사운드 채널 사이의 교차 상관 계수의 최대값은 -40≤i≤40의 범위에서 검색된다. 그 후, 교차 상관 계수의 최대값에 대응하는 인덱스 값이 현재 프레임에서의 채널 간 시간차로 사용된다.
방식 2:
현재 샘플링 레이트에서 채널 간 시간차의 최대값과 최소값은 Tmax와 Tmin이며, 여기서 Tmax와 Tmin은 미리 설정된 실수이며, Tmax > Tmin이다. 따라서, 좌측 사운드 채널과 우측 사운드 채널 사이의 교차 상관 함수는 현재 프레임에서의 좌측 사운드 채널 신호와 우측 사운드 채널 신호에 기초하여 계산될 수 있다. 그 후, 제1 L 프레임에서의 좌측 사운드 채널과 우측 사운드 채널 사이의 교차 상관 함수에 따라 현재 프레임에서의 좌측 사운드 채널과 우측 사운드 채널 사이의 계산된 교차 상관 함수에 대해 평활화 처리가 수행되어, 평활화 처리 후에 획득되는 좌측 사운드 채널과 우측 사운드 채널 사이의 교차 상관 함수를 획득할 수 있다. 다음, 평활화 처리 후에 획득되는, 좌측 사운드 채널과 우측 사운드 채널 사이의 교차 상관 계수의 최대값은 Tmin ≤ i ≤ Tmax의 범위에서 검색되고, 최대값에 대응하는 인덱스 값 i는 현재 프레임에서의 채널 간 시간차로서 사용된다.
방식 3:
현재 프레임에서의 채널 간 시간차가 예시 1 또는 예시 2에 따라 추정된 후, M(M은 1 이상의 정수) 프레임에서의 채널 간 시간차에 대해 프레임 간 평활화 처리가 수행된다. 현재 프레임 이전의 M(여기서 M은 1 이상의 정수임)개 프레임에서의 채널 간 시간차 및 현재 프레임에서 추정된 채널 간 시간차에 대해 프레임 간 평활화 처리가 수행되고, 평활화 처리 후에 획득되는 채널 간 시간차는 현재 프레임에서의 최종 채널 간 시간차로서 사용된다.
단계 510에서의 현재 프레임에서의 좌측 사운드 채널 시간 도메인 신호 및 우측 사운드 채널 시간 도메인 신호에 대해 시간 도메인 전처리를 수행하는 단계는 필수적인 단계가 아님을 이해해야 한다. 시간 도메인 전처리를 수행하는 단계가 없는 경우, 채널 간 시간차가 추정되는 좌측 사운드 채널 신호 및 우측 사운드 채널 신호는 원시 스테레오 신호에서의 좌측 사운드 채널 신호 및 우측 사운드 채널 신호이다. 원시 스테레오 신호에서의 좌측 사운드 채널 신호 및 우측 사운드 채널 신호는 아날로그-디지털(analog-to-digital, A/D) 변환을 통해 획득되는 수집된 펄스 코드 변조(Pulse Code Modulation, PCM) 신호일 수 있다. 또한, 스테레오 오디오 신호의 샘플링 레이트는 8 kHz, 16 kHz, 32 kHz, 44.1 kHz, 48 kHz 등일 수 있다.
단계 530. 추정된 채널 간 시간차에 기초하여 현재 프레임에서의 좌측 사운드 채널 전처리된 시간 도메인 신호 및 전처리된 우측 사운드 채널 시간 도메인 신호에 대해 지연 정렬 처리를 수행한다.
구체적으로, 현재 프레임에서의 좌측 사운드 채널 신호 및 우측 사운드 채널 신호에 대해 지연 정렬 처리를 수행하는 단계는 구체적으로 지연 정렬 처리 후에 획득되는 좌측 사운드 채널 신호와 우측 사운드 채널 신호 사이에 채널 간 시간 차가 존재하지 않도록 현재 프레임에서의 채널 간 시간차에 기초하여 좌측 사운드 채널 신호 및 우측 사드 채널 신호 중 하나 또는 둘 다에 대해 압축 또는 신장(stretching) 처리를 수행하는 단계일 수 있다. 현재 프레임에서의 지연 정렬 처리 후에 획득되는 좌측 사운드 채널 신호 및 우측 사운드 채널 신호는 현재 프레임에서의 지연 정렬 처리 후에 획득되는 스테레오 신호이다.
채널 간 시간차에 기초하여 현재 프레임에서의 좌측 사운드 채널 신호 및 우측 사운드 채널 신호에 대해 지연 정렬 처리가 수행되는 경우, 현재 프레임에서의 타깃 사운드 채널 및 기준 사운드 채널은 먼저 현재 프레임에서의 채널 간 시간차 및 이전 프레임에서의 채널 간 시간차에 기초하여 선택될 필요가 있다. 그 후, 현재 프레임에서의 채널 간 시간차의 절대값 abs(cur_itd)와 현재 프레임의 이전 프레임에서의 채널 간 시간차의 절대값 abs(prev_itd) 사이의 비교 결과에 따라 지연 정렬 처리가 다른 방식으로 수행될 수 있다.
현재 프레임에서의 채널 간 시간차는 cur_itd로 표시되고, 이전 프레임에서의 채널 간 시간차는 prev_itd로 표시됩니다. 구체적으로, 현재 프레임에서의 채널 간 시간차 및 이전 프레임에서의 채널 간 시간차에 기초하여 현재 프레임에서의 타깃 사운드 채널 및 기준 사운드 채널을 선택하는 단계는 다음과 같이 설명될 수 있다. cur_itd = 0이면, 현재 프레임에서의 타깃 사운드 채널은 이전 프레임에서의 타깃 사운드 채널과 일치하고, cur_itd < 0이면, 현재 프레임에서의 타깃 사운드 채널은 좌측 사운드 채널이며, 또는 cur_itd > 0이면, 현재 프레임에서의 타깃 사운드 채널은 우측 사운드 채널이다.
타깃 사운드 채널 및 기준 사운드 채널이 결정된 후, 현재 프레임에서의 채널 간 시간차의 절대값 abs(cur_itd)와 현재 프레임의 이전 프레임에서의 채널 간 시간차의 절대값 abs(prev_itd) 사이의 상이한 비교 결과에 따라 상이한 지연 정렬 처리 방식이 사용될 수 있다. 구체적으로, 이하 세 가지 사례가 포함된다. 본 출원에서, 지연 정렬 처리를 위해 사용되는 처리 방식은 다음의 세 가지 사례에서의 처리 방식으로 제한되지 않는다는 것을 이해해야 한다. 본 출원에서, 종래 기술에서의 임의의 다른 지연 정렬 처리 방식이 지연 정렬 처리를 수행하는 데 사용될 수 있다.
사례 1: abs(cur_itd)는 abs(prev_itd)와 같다.
현재 프레임에서의 채널 간 시간차의 절대값이 현재 프레임의 이전 프레임에서의 채널 간 시간차의 절대값과 같은 경우, 타깃 사운드 채널 신호에 대해 압축 또는 신장 처리가 수행되지 않는다. 도 6에 도시된 바와 같이, Ts2 포인트의 길이를 갖는 신호는 현재 프레임에서의 기준 사운드 채널 신호 및 현재 프레임에서의 타깃 사운드 채널 신호에 기초하여 생성되고, 타깃 채널 사운드에 대한 포인트(N - Ts2)로부터 포인트(N - 1)까지의 지연 정렬 처리 후에 획득되는 신호로서 사용된다. 또한, abs(cur_itd) 포인트의 길이를 갖는 신호는 기준 사운드 채널 신호에 기초하여 수동으로 재구성되고, 타깃 사운드 채널에 대해 포인트 N으로부터 포인트(N + abs(cur_itd) - 1)까지의 지연 정렬 처리 후에 획득되는 신호로서 사용된다. abs()는 절대값을 획득하기 위한 연산을 지시하고, 현재 프레임의 프레임 길이는 N이다. 샘플링 레이트가 16 kHz이면, N = 320이고, Ts2는 천이 세그먼트의 미리 설정된 길이이다. 예를 들어, Ts2 = 10이다.
마지막으로, 지연 정렬 처리 후, 현재 프레임에서의 타깃 사운드 채널에 대해 abs(cur_itd) 샘플링 포인트의 지연을 갖는 신호는 현재 프레임에서의 지연 정렬 후에 획득되는 타깃 사운드 채널 신호로서 사용되고, 현재 프레임에서의 기준 사운드 채널 신호는 현재 프레임에서의 지연 정렬 후에 획득되는 기준 사운드 채널 신호로서 직접 사용된다.
사례 2: abs(cur_itd)는 abs(prev_itd)보다 작다.
도 7에 도시된 바와 같이, 현재 프레임에서의 채널 간 시간차의 절대값이 현재 프레임의 이전 프레임에서의 채널 간 시간차의 절대값보다 작은 경우, 버퍼링된 타깃 사운드 채널 신호가 신장될 필요가 있다. 구체적으로, 현재 프레임에서 버퍼링된 타깃 사운드 채널 신호의 포인트(-ts + abs(prev_itd) - abs(cur_itd))로부터 포인트(L - ts - 1)까지의 신호는 L 포인트의 길이를 갖는 신호로 신장되고, L 포인트의 길이를 갖는 신호는 타깃 사운드 채널 상의 포인트 -ts로부터 포인트(L - ts - 1)까지의 지연 정렬 처리 후에 획득되는 신호로서 사용된다. 그 후, 현재 프레임에서의 타깃 사운드 채널 신호의 포인트(L - ts)로부터 포인트(N - Ts2 - 1)까지의 신호는 타깃 사운드 채널 상의 포인트(L - ts)로부터 포인트(N - Ts2 - 1)까지의 지연 정렬 처리 후에 획득되는 신호로서 직접 사용된다. 그 후, Ts2 포인트의 길이를 갖는 신호는 현재 프레임에서의 기준 사운드 채널 신호 및 타깃 사운드 채널 신호에 기초하여 생성되고, 타깃 사운드 채널 상의 포인트(N - Ts2)로부터 포인트(N - 1)까지의 지연 정렬 처리 후에 획득되는 신호로서 사용된다. 마지막으로, abs(cur_itd) 포인트의 길이를 갖는 신호는 기준 사운드 채널 신호에 기초하여 수동으로 재구성되고, 타깃 사운드 채널 상의 포인트 N으로부터 포인트(N + abs(cur_itd) - 1)까지의 지연 정렬 처리 후에 획득되는 신호로서 사용된다. ts는 프레임 간 평활 천이 세그먼트의 길이를 나타낸다. 예를 들어, ts는 abs(cur_itd)/2이고, L은 지연 정렬 처리를 위한 처리 길이를 나타낸다. L은 현재 레이트에서 프레임 길이 N이하의 임의의 미리 설정된 양의 정수일 수 있고, 일반적으로 허용 가능한 최대 채널 시간 차보다 큰 양의 정수로 설정된다. 예를 들어, L = 290 또는 L = 200이다. 상이한 샘플링 레이트와 관련하여, 지연 정렬 처리를 위한 처리 길이 L은 상이한 값 또는 동일한 값으로 설정될 수 있다. 일반적으로, 가장 간단한 방법은 경험에 기초하여 당업자에 의해 L의 값을 미리 설정하는 것이며, 예를 들어, 이 값은 290으로 설정된다.
마지막으로, 지연 정렬 처리 후에, 타깃 사운드 채널 상의 포인트 abs(cur_itd)로부터 시작하는 N개의 포인트의 길이를 갖는 지연 정렬 처리 후에 획득되는 신호는 현재 프레임에서의 지연 정렬 후에 획득되는 타깃 사운드 채널 신호로서 사용된다. 현재 프레임에서의 기준 사운드 채널 신호는 현재 프레임에서의 지연 정렬 후에 획득되는 기준 사운드 채널 신호로서 직접 사용된다.
사례 3: abs(cur_itd)는 abs(prev_itd)보다 크다.
도 8에 도시된 바와 같이, 현재 프레임에서의 채널 간 시간차의 절대값이 현재 프레임의 이전 프레임에서의 채널 간 시간차의 절대값보다 작은 경우, 버퍼링된 타깃 사운드 채널 신호는 압축될 필요가 있다. 구체적으로, 현재 프레임에서 버퍼링된 타깃 사운드 채널 신호의 포인트(-ts + abs(prev_itd) - abs(cur_itd))로부터 포인트(L - ts - 1)까지의 신호는 L 포인트의 길이를 갖는 신호로서 압축되고, L 포인트의 길이를 갖는 신호는 타깃 사운드 채널 상의 포인트 -ts로부터 포인트(L - ts - 1)까지의 지연 정렬 처리 후에 획득되는 신호로서 사용된다. 그 후, 현재 프레임에서의 타깃 사운드 채널 신호의 포인트(L - ts)로부터 포인트(N - Ts2 - 1)까지의 신호는 타깃 사운드 채널 상의 포인트(L - ts)로부터 포인트(N - Ts2 - 1)까지의 지연 정렬 처리 후에 획득되는 신호로서 직접 사용된다. 그 후, Ts2 포인트의 길이를 갖는 신호는 현재 프레임에서의 기준 사운드 채널 신호 및 타깃 사운드 채널 신호에 기초하여 생성되고, 타깃 사운드 채널 상의 포인트(N - Ts2)로부터 포인트(N - 1)까지의 지연 정렬 처리 후에 획득되는 신호로서 사용된다. 또한, abs(cur_itd)의 길이를 갖는 신호는 기준 사운드 채널 신호에 기초하여 생성되고, 타깃 사운드 채널 상의 포인트 N으로부터 포인트(N + abs(cur_itd) - 1)까지의 지연 정렬 처리 후에 획득되는 신호로서 사용된다. L은 여전히 지연 정렬 처리를 위한 처리 길이를 나타낸다.
최종적으로, 지연 정렬 처리 후에, 타깃 사운드 채널 상의 포인트 abs(cur_itd)로부터 시작하는 N 포인트의 길이를 갖는 지연 정렬 처리 후에 획득되는 신호는 여전히 현재 프레임에서의 지연 정렬 후에 획득되는 타깃 사운드 채널 신호로서 사용된다. 현재 프레임에서의 기준 사운드 채널 신호는 현재 프레임에서의 지연 정렬 후에 획득되는 기준 사운드 채널 신호로서 직접 사용된다.
단계 540. 채널 간 시간차를 양자화한다.
구체적으로, 현재 프레임에서의 채널 간 시간차에 대해 양자화가 수행되는 경우, 임의의 종래 기술의 양자화 알고리즘은 양자화 인덱스를 획득하기 위해 현재 프레임에서의 채널 간 시간차에 대해 양자화 처리를 수행하는 데 사용될 수 있고, 양자화 인덱스는 인코딩되어 비트스트림에 기록된다.
단계 550. 사운드 채널 결합 비율 인자를 계산하고, 사운드 채널 결합 비율 인자를 양자화한다.
사운드 채널 결합 비율 인자를 계산하기 위한 복수의 방법이 존재한다. 예를 들어, 현재 프레임에서의 사운드 채널 결합 비율 인자는 좌측 사운드 채널 및 우측 사운드 채널 상의 프레임 에너지에 기초하여 계산될 수 있다. 구체적인 프로세스는 다음과 같이 설명된다.
(1). 지연 정렬 후에 획득되는 좌측 사운드 채널 신호 및 우측 사운드 채널 신호에 기초하여 좌측 사운드 채널 신호 및 우측 사운드 채널 신호의 프레임 에너지를 계산한다.
현재 프레임에서의 좌측 사운드 채널에 대한 프레임 에너지 rms_L는 다음을 충족시킨다.
[수학식 22]
Figure pat00028
, 여기서 i = 0, 1, ..., N-1이다.
현재 프레임에서의 우측 사운드 채널에 대한 프레임 에너지는 다음을 충족시킨다.
[수학식 23]
Figure pat00029
, 여기서 i = 0, 1, ..., N-1이다.
Figure pat00030
는 현재 프레임에서의 지연 정렬 후에 획득되는 좌측 사운드 채널 신호를 나타내고,
Figure pat00031
는 현재 프레임에서의 지연 정렬 후에 획득되는 우측 사운드 채널 신호를 나타내며, i는 샘플링 포인트 개수를 나타낸다.
(2) 좌측 사운드 채널과 우측 사운드 채널에 대한 프레임 에너지에 기초하여 현재 프레임에서의 사운드 채널 결합 비율 인자를 계산한다.
현재 프레임에서의 사운드 채널 결합 비율 인자(ratio)는 다음을 충족시킨다.
[수학식 24]
Figure pat00032
따라서, 사운드 채널 결합 비율 인자는 좌측 사운드 채널 신호 및 우측 사운드 채널 신호의 프레임 에너지에 기초하여 계산된다.
(3) 사운드 채널 결합 비율 인자를 양자화하고, 양자화가 수행된 사운드 채널 결합 비율 인자를 비트스트림으로 기록한다.
단계 560. 1차 사운드 채널 신호 및 2차 사운드 채널 신호를 획득하기 위해, 사운드 채널 결합 비율 인자에 기초하여 현재 프레임에서의 지연 정렬 후에 획득되는 스테레오 신호에 대한 시간 도메인 다운믹싱 처리를 수행한다.
구체적으로, 종래 기술에서의 임의의 시간 도메인 다운믹싱 처리 방법이 지연 정렬 후에 획득되는 스테레오 신호에 대해 시간 도메인 다운믹싱 처리를 수행하는 데 사용될 수 있다. 그러나, 시간 도메인 다운믹싱 프로세싱이 수행되는 경우, 1차 사운드 채널 신호 및 2차 사운드 채널 신호를 획득하도록, 지연 정렬 후에 획득되는 스테레오 신호에 대해 시간 도메인 전처리를 수행하기 위해, 대응하는 시간 도메인 다운믹싱 처리 방식이 사운드 채널 결합 비율 인자를 계산하는 방법에 기초하여 선택될 필요가 있다.
예를 들어, 사운드 채널 결합 비율 인자가 단계 550에 따른 방법에서 계산된 후에, 시간 도메인 다운믹싱 처리는 사운드 채널 결합 비율 인자(ratio)에 기초하여 수행될 수 있다. 예를 들어, 시간 도메인 다운믹싱 처리 후에 획득되는 1차 사운드 채널 신호 및 2차 사운드 채널 신호는 [수학식 25]에 따라 결정될 수 있다.
[수학식 25]
Figure pat00033
, 여기서 i = 0, 1, ..., N-1이다.
Y(i)는 현재 프레임에서의 1차 사운드 채널 신호를 나타내고, X(i)는 현재 프레임에서의 2차 사운드 채널 신호를 나타내며,
Figure pat00034
는 현재 프레임에서의 지연 정렬 후에 획득되는 좌측 사운드 채널 신호를 나타내고,
Figure pat00035
는 현재 프레임에서의 지연 정렬 후에 획득되는 우측 사운드 채널 신호를 나타내며, i는 샘플링 포인트 수를 나타내고, N은 프레임 길이를 나타내고, 비율은 사운드 채널 조합비 계수를 나타낸다.
단계 570. 1차 사운드 채널 신호 및 2차 사운드 채널 신호를 인코딩한다.
인코딩 처리는 다운믹싱 처리 후에 획득되는 1차 사운드 채널 신호 및 2차 사운드 채널 신호에 대해 모노 신호 인코딩/디코딩 방법을 사용하여 수행될 수 있음을 이해해야 한다. 구체적으로, 1차 사운드 채널 및 2차 사운드 채널에서 인코딩될 비트는 이전 프레임에서의 1차 사운드 채널 신호 및/또는 2차 사운드 채널 신호를 인코딩하는 프로세스에서 획득되는 파라미터 정보 및 1차 사운드 채널 신호 및 2차 사운드 채널 신호를 인코딩하기 위해 사용될 총 비트 수량에 기초하여 할당될 수 있다. 그 후, 1차 사운드 채널 신호 및 2차 사운드 채널 신호는 1차 사운드 채널 신호가 인코딩된 후에 획득되는 인코딩 인덱스 및 2차 사운드 채널 신호가 인코딩된 후에 획득되는 인코딩 인덱스를 획득하기 위해 비트 할당 결과에 기초하여 개별적으로 인코딩된다. 또한, 인코딩 방식의 대수 코드 여기 선형 예측(Algebraic Code Excited Linear Prediction, ACELP)은 1차 사운드 채널 신호 및 2차 사운드 채널 신호를 인코딩하는 데 사용될 수 있다.
본 출원의 본 실시예에서의 스테레오 신호 인코딩 방법은 방법(500)에서의 다운믹싱 처리 후에 획득되는 1차 사운드 채널 신호 및 2차 사운드 채널 신호를 인코딩하기 위한 단계 570의 일부일 수 있음을 이해해야 한다. 구체적으로, 본 출원의 본 실시예에서의 스테레오 신호 인코딩 방법은 단계 570에서의 다운믹싱 처리 후에 획득되는 1차 사운드 채널 신호 또는 2차 사운드 채널 신호에 대해 선형 예측을 수행하는 프로세스일 수 있다. 현재 프레임에서의 스테레오 신호에 대해 선형 예측 분석을 수행하는 복수의 방식이 존재한다. 선형 예측 분석은 현재 프레임에서의 1차 사운드 채널 신호 및 2차 사운드 채널 신호에 대해 개별적으로 2번 수행될 수 있거나, 또는 선형 예측 분석은 현재 프레임에서의 1차 사운드 채널 신호 및 2차 사운드 채널 신호에 대해 개별적으로 한 번 수행될 수 있다. 이하에서는 도 9 및 도 10을 참조하여 두 개의 선형 예측 분석 방식을 개별적으로 상세하게 설명한다.
도 9는 본 출원의 실시예에 따른 선형 예측 분석 프로세스의 개략적인 흐름도이다. 도 9에 도시된 선형 예측 프로세스는 현재 프레임에서의 1차 사운드 채널 신호에 대해 선형 예측 분석을 두 번 수행하는 것이다. 도 9에 도시된 선형 예측 분석 프로세스는 구체적으로 다음 단계를 포함한다.
단계 910. 현재 프레임에서의 1차 사운드 채널 신호에 대해 시간 도메인 전처리를 수행한다.
여기에서의 전처리는 샘플링 레이트 변환, 프리 엠퍼시스 처리 등을 포함할 수 있다. 예를 들어, 샘플링 레이트가 16 kHz인 1차 사운드 채널 신호는 인코딩 방식의 대수 코드 여기 선형 예측(Algebraic Code Excited Linear Prediction, ACELP)이 후속 인코딩 처리를 위해 사용될 수 있도록 샘플링 레이트가 12.8 kHz인 신호로 변환될 수 있다.
단계 920. 현재 프레임에서의 초기 선형 예측 분석 윈도우를 획득한다.
단계 920에서의 초기 선형 예측 분석 윈도우는 단계 320에서의 초기 선형 예측 분석 윈도우와 동일하다.
단계 930. 초기 선형 예측 분석 윈도우에 기초하여 전처리된 1차 사운드 채널 신호에 대해 1차 윈도잉 처리를 수행하고, 윈도잉 처리 후에 획득되는 신호에 기초하여 현재 프레임에서의 제1 선형 예측 계수 그룹을 계산한다.
초기 선형 예측 분석 윈도우에 기초하여 전처리된 1차 사운드 채널 신호에 대해 1차 윈도잉 프로세싱을 수행하는 단계는 구체적으로 [수학식 26]에 따라 수행될 수 있다.
[수학식 26]
swmid(n) = spre(n-80)w(n), 여기서 n = 0, 1, ..., L - 1이다.
spre는 프리 엠퍼시스 처리 후에 획득되는 신호를 나타내고, swmid(n)은 1차 윈도잉 처리 후에 획득되는 신호를 나타내며, L은 선형 예측 분석 윈도우의 윈도우 길이를 나타내고, w(n)은 초기 선형 예측 분석 윈도우를 나타낸다.
현재 프레임에서의 제1 선형 예측 계수 그룹은 구체적으로 레빈슨-더빈 알고리즘에 따라 계산될 수 있다. 구체적으로, 현재 프레임에서의 제1 선형 예측 계수 그룹은 레빈슨-더빈 알고리즘에 따라 그리고 1차 윈도잉 처리 후에 획득되는 신호 swmid(n)에 기초하여 계산될 수 있다.
단계 940. 현재 프레임에서의 채널 간 시간차에 기초하여 수정된 선형 예측 분석 윈도우를 적응적으로 생성한다.
수정된 선형 예측 분석 윈도우는 전술한 [수학식 7] 및 [수학식 9]를 충족하는 선형 예측 분석 윈도우일 수 있다.
단계 950. 수정된 선형 예측 분석 윈도우에 기초하여 전처리된 1차 사운드 채널 신호에 대해 2차 윈도잉 처리를 수행하고, 윈도잉 처리 후에 획득되는 신호에 기초하여 현재 프레임에서의 선형 예측 계수의 제2 그룹을 계산한다.
수정된 선형 예측 분석 윈도우에 기초하여 전처리된 1차 사운드 채널 신호에 대해 2차 윈도잉 처리를 수행하는 단계는 구체적으로 [수학식 27]에 따라 수행될 수 있다.
[수학식 27]
swend(n) = spre(n+48)wadp(n), 여기서 n = 0, 1, ..., L - 1이다.
spre(n)은 프리 엠퍼시스 처리 후에 획득되는 신호를 나타내고, swend(n)은 2차 윈도잉 처리 후에 획득되는 신호를 나타내며, L은 수정된 선형 예측 분석 윈도우의 윈도우 길이를 나타내고, wadp(n)은 수정된 선형 예측 분석 윈도우를 나타낸다.
현재 프레임에서의 제2 선형 예측 계수 그룹은 구체적으로 레빈슨-더빈 알고리즘에 따라 계산될 수 있다. 구체적으로, 현재 프레임에서의 제2 선형 예측 계수 그룹은 레빈슨-더빈 알고리즘에 따라 그리고 2차 윈도잉 처리 후에 획득되는 신호 swend(n)에 기초하여 계산될 수 있다.
유사하게, 현재 프레임에서의 2차 사운드 채널 신호에 대해 선형 예측 분석을 수행하는 처리 프로세스는 단계 910 내지 단계 950에서 현재 프레임에서의 1차 사운드 채널 신호에 대해 선형 예측 분석을 수행하는 프로세스와 동일하다.
본 출원에서의 스테레오 신호 인코딩 방법이 방식 1에서의 제2 윈도잉 처리 방식과 동일하다는 것을 이해해야 한다.
도 10은 본 출원의 실시예에 따른 선형 예측 분석 프로세스의 개략적인 흐름도이다. 도 10에 도시된 선형 예측 프로세스는 현재 프레임에서의 1차 사운드 채널 신호에 대해 선형 예측 분석을 한 번 수행하는 것이다. 도 10에 도시된 선형 예측 분석 프로세스는 구체적으로 다음 단계를 포함한다.
단계 1010. 현재 프레임에서의 1차 사운드 채널 신호에 대해 시간 도메인 전처리를 수행한다.
여기에서의 전처리는 샘플링 레이트 변환, 프리 엠퍼시스 처리 등을 포함할 수 있다.
단계 1020. 현재 프레임에서의 초기 선형 예측 분석 윈도우를 획득한다.
단계 1020에서의 초기 선형 예측 분석 윈도우는 단계 320에서의 초기 선형 예측 분석 윈도우와 동일하다.
단계 1030. 현재 프레임에서의 채널 간 시간차에 기초하여 수정된 선형 예측 분석 윈도우를 적응적으로 생성한다.
구체적으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이는 먼저 현재 프레임에서의 채널 간 시간차에 기초하여 결정될 수 있고, 그 후, 수정된 선형 예측 분석 윈도우가 단계 320에서의 방식으로 결정된다.
단계 1040. 수정된 선형 예측 분석 윈도우에 기초하여 전처리된 1차 사운드 채널 신호에 대해 윈도우 처리를 수행하고, 윈도잉 처리 후에 획득되는 신호에 기초하여 현재 프레임에서의 선형 예측 계수를 계산한다.
수정된 선형 예측 분석 윈도우에 기초하여 전처리된 일차 사운드 채널 신호에 대해 윈도잉 처리를 수행하는 단계는 구체적으로 [수학식 28]에 따라 수행될 수 있다.
[수학식 28]
sw(n) = spre(n)wadp(n), 여기서 n = 0, 1, ..., L - 1이다.
spre(n)은 프리 엠퍼시스 처리 후에 획득되는 신호를 나타내고, sw(n)은 윈도잉 처리 후에 획득되는 신호를 나타내며, L은 수정된 선형 예측 분석 윈도우의 윈도우 길이를 나타내고, wadp(n)은 수정된 선형 예측 분석 윈도우를 나타낸다.
현재 프레임에서의 선형 예측 계수는 레빈슨-더빈 알고리즘에 따라 구체적으로 계산될 수 있음을 이해해야 한다. 구체적으로, 현재 프레임에서의 선형 예측 계수는 레빈슨-더빈 알고리즘에 따라 그리고 윈도잉 처리 후에 획득되는 신호 sw(n)에 기초하여 계산될 수 있다.
유사하게, 현재 프레임에서의 2차 사운드 채널 신호에 대해 선형 예측 분석을 수행하는 처리 프로세스는 단계 1010 내지 단계 1040에서 현재 프레임에서의 1차 사운드 채널 신호에 대해 선형 예측 분석을 수행하는 프로세스와 동일하다.
전술한 것은 도 1 내지 도 10을 가지고 본 출원의 실시예에서의 스테레오 신호 인코딩 방법을 상세하게 설명한 것이다. 이하에서는 도 11 및 도 12를 참조하여 본 출원의 실시예에서의 스테레오 신호 인코딩 장치를 설명한다. 도 11 및 도 12에서의 장치는 본 출원의 실시예에서의 스테레오 신호 인코딩 방법에 대응한다. 또한, 도 11 및 도 12에서의 장치는 본 출원의 실시예에서의 스테레오 신호 인코딩 방법을 수행할 수 있다. 간결하게 하기 위해, 반복되는 설명은 아래에서 적절하게 생략된다.
도 11은 본 출원의 실시예에 따른 스테레오 신호 인코딩 장치의 개략적인 블록도이다. 도 11에서의 장치(1100)는,
현재 프레임에서의 채널 간 시간차에 기초하여 현재 프레임에서 감쇠 윈도우의 윈도우 길이를 결정하도록 구성된 제1 결정 모듈(1110);
현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하도록 구성된 제2 결정 모듈(1120) ― 수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L- 1)까지의 적어도 일부 포인트의 값은 초기 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 대응하는 포인트의 값보다 작고, sub_window_len은 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 나타내며, L은 수정된 선형 예측 분석 윈도우의 윈도우 길이를 나타내고, 수정된 선형 예측 분석 윈도우의 윈도우 길이는 초기 선형 예측 분석 윈도우의 윈도우 길이와 같음 ―; 및
수정된 선형 예측 분석 윈도우에 기초하여 처리될 사운드 채널 신호에 대해 선형 예측 분석을 수행하도록 구성된 처리 모듈(1130)
을 포함한다.
본 출원에서, 수정된 선형 예측 분석 윈도우에서의 포인트의 값이자 또한 현재 프레임에서의 타깃 사운드 채널 상의 수동으로 재구성된 순방향 신호에 대응하는 값이 수정될 선형 예측 분석 윈도우에서의 포인트의 값이자 또한 현재 프레임에서의 타깃 사운드 채널 상의 수동으로 재구성된 순방향 신호에 대응하는 값보다 작기 때문에, 현재 프레임에서의 타깃 사운드 채널 상의 수동으로 재구성된 순방향 신호에 의한 영향은, 선형 예측 분석 결과의 정확도에 대한 수동으로 재구성된 순방향 신호와 실제 순방향 신호 사이의 오차의 영향이 감소될 수 있도록, 선형 예측 동안 감소될 수 있다. 따라서, 선형 예측 분석을 통해 획득된 선형 예측 계수와 실제 선형 예측 계수 사이의 차이가 감소될 수 있고, 선형 예측 분석의 정확도가 향상될 수 있다.
선택적으로, 실시예에서, 수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 임의의 포인트의 값은 초기 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 대응하는 포인트의 값보다 작다.
선택적으로, 실시예에서, 제1 결정 모듈(1110)은 구체적으로 현재 프레임에서의 채널 간 시간차 및 천이 세그먼트의 미리 설정된 길이에 기초하여 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 결정하도록 구성된다.
선택적으로, 실시예에서, 제1 결정 모듈(1110)은 구체적으로 현재 프레임에서의 채널 간 시간차의 절대값과 미리 설정된 천이 세그먼트의 길이의 합을 현재 프레임에서의 감쇠 윈도우의 윈도우 길이로서 결정하도록 구성된다.
선택적으로, 실시예에서, 제1 결정 모듈(1110)은 구체적으로, 현재 프레임에서의 채널 간 시간차의 절대값이 천이 세그먼트의 미리 설정된 길이 이상인 경우, 현재 프레임에서의 채널 간 시간차의 절대값과 천이 세그먼트의 미리 설정된 길이의 합을 현재 프레임에서의 감쇠 윈도우의 윈도우 길이로서 결정하거나, 또는 현재 프레임에서의 채널 간 시간차의 절대값이 천이 세그먼트의 미리 설정된 길이보다 작은 경우, 현재 프레임에서의 채널 간 시간차의 절대값의 N배를 현재 프레임에서의 감쇠 윈도우의 윈도우 길이로서 결정하도록 구성되며, 여기서 N은 0보다 크고 L/MAX_DELAY보다 작은 미리 설정된 실수이고, MAX_DELAY는 0보다 큰 미리 설정된 실수이다.
선택적으로, MAX_DELAY는 채널 간 시간차의 절대값의 최대값이다.
선택적으로, 실시예에서, 제2 결정 모듈(1120)은 구체적으로 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 초기 선형 예측 분석 윈도우를 수정하도록 구성되며, 여기서 초기 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 대응하는 포인트의 값에 대한 수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 값의 감쇠값은 상승 추세를 나타낸다.
선택적으로, 실시예에서, 수정된 선형 예측 분석 윈도우는 다음의 수학식
Figure pat00036
을 충족시키며, 여기서 wadp(i)는 수정된 선형 예측 분석 윈도우를 나타내고, w(i)는 초기 선형 예측 분석 윈도우를 나타내며,
Figure pat00037
이고, MAX_ATTEN은 0보다 큰 미리 설정된 실수이다.
선택적으로, 실시예에서, 제2 결정 모듈(1120)은 구체적으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 현재 프레임에서의 감쇠 윈도우를 결정하고, 현재 프레임에서의 감쇠 윈도우에 기초하여 초기 선형 예측 분석 윈도우를 수정하도룩 구성되며, 여기서 초기 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 대응하는 포인트의 값에 대한 수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 값의 감쇠값은 상승 추세를 나타낸다.
선택적으로, 실시예에서, 제2 결정 모듈(1120)은 구체적으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 복수의 미리 저장된 후보 감쇠 윈도우로부터 현재 프레임에서의 감쇠 윈도우를 결정하도록 구성되며, 여기서 복수의 후보 감쇠 윈도우는 상이한 윈도우 길이 값 범위에 대응하고, 상이한 윈도우 길이 값 범위 사이에 교집합이 존재하지 않는다.
선택적으로, 실시예에서, 현재 프레임에서의 감쇠 윈도우는 수학식
Figure pat00038
을 충족시키며, 여기서 sub_window(i)는 현재 프레임에서의 감쇠 윈도우를 나타내고, MAX_ATTEN은 0보다 큰 미리 설정된 실수이다.
선택적으로, 실시예에서, 수정된 선형 예측 분석 윈도우는 수학식
Figure pat00039
을 충족시키며, 여기서 wadp(i)는 수정된 선형 예측 분석 윈도우의 윈도우 함수를 나타내고, w(i)는 초기 선형 예측 분석 윈도우를 나타내며, sub_window(.)는 현재 프레임에서의 감쇠 윈도우를 나타낸다.
선택적으로, 실시예에서, 제2 결정 모듈(1120)은 구체적으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 복수의 미리 저장된 후보 선형 예측 분석 윈도우로부터 수정된 선형 예측 분석 윈도우를 결정하도록 구성되며, 여기서 복수의 후보 선형 예측 분석 윈도우는 상이한 윈도우 길이 값 범위에 대응하고, 상이한 윈도우 길이 값 범위 사이에는 교집합이 존재하지 않는다.
선택적으로, 실시예에서, 제2 결정 모듈(1120)이 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하기 전에, 장치는,
감쇠 윈도우의 수정된 윈도우 길이를 획득하기 위해, 미리 설정된 간격 스텝에 기초하여 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 수정하도록 구성된 수정 모듈(1140)을 더 포함하며, 여기서 간격 스텝은 미리 설정된 양의 정수이다.
제2 결정 모듈(1120)은 구체적으로 초기 선형 예측 분석 윈도우 및 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하도록 구성된다.
선택적으로, 실시예에서, 감쇠 윈도우의 수정된 윈도우 길이는 수학식
Figure pat00040
을 충족시키며, 여기서 sub_window_len_mod는 감쇠 윈도우의 수정된 윈도우 길이를 나타내고, len_step은 간격 스텝을 나타낸다.
도 12는 본 출원의 실시예에 따른 스테레오 신호 인코딩 장치의 개략적인 블록도이다. 도 12에서의 장치(1200)는,
프로그램을 저장하도록 구성된 메모리(1210); 및
메모리(1210)에 저장된 프로그램을 실행하도록 구성된 프로세서(1220)
를 포함하며, 메모리(1210) 내의 프로그램이 실행될 때, 프로세서(1220)는 구체적으로, 현재 프레임에서의 채널 간 시간차에 기초하여 현재 프레임에서 감쇠 윈도우의 윈도우 길이를 결정하고, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하며 ― 수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L- 1)까지의 적어도 일부 포인트의 값은 초기 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 대응하는 포인트의 값보다 작고, sub_window_len은 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 나타내며, L은 수정된 선형 예측 분석 윈도우의 윈도우 길이를 나타내고, 수정된 선형 예측 분석 윈도우의 윈도우 길이는 초기 선형 예측 분석 윈도우의 윈도우 길이와 같음 ―, 수정된 선형 예측 분석 윈도우에 기초하여 처리될 사운드 채널 신호에 대해 선형 예측 분석을 수행하도록 구성된다.
본 출원에서, 수정된 선형 예측 분석 윈도우에서의 포인트의 값이자 또한 현재 프레임에서의 타깃 사운드 채널 상의 수동으로 재구성된 순방향 신호에 대응하는 값이 수정될 선형 예측 분석 윈도우에서의 포인트의 값이자 또한 현재 프레임에서의 타깃 사운드 채널 상의 수동으로 재구성된 순방향 신호에 대응하는 값보다 작기 때문에, 선형 예측 분석 결과의 정확도에 대한 수동으로 재구성된 순방향 신호와 실제 순방향 신호 사이의 오차의 영향이 감소될 수 있도록, 현재 프레임에서의 타깃 사운드 채널 상의 수동으로 재구성된 순방향 신호에 의한 영향은이 선형 예측 동안 감소될 수 있다. 따라서, 선형 예측 분석을 통해 획득된 선형 예측 계수와 실제 선형 예측 계수 사이의 차이가 감소될 수 있고, 선형 예측 분석의 정확도가 향상될 수 있다.
선택적으로, 실시예에서, 수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 임의의 포인트의 값은 초기 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 대응하는 포인트의 값보다 작다.
선택적으로, 실시예에서, 프로세서(1220)는 구체적으로 현재 프레임에서의 채널 간 시간차 및 천이 세그먼트의 미리 설정된 길이에 기초하여 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 결정하도록 구성된다.
선택적으로, 실시예에서, 프로세서(1220)는 구체적으로 현재 프레임에서의 채널 간 시간차의 절대값과 미리 설정된 천이 세그먼트의 길이의 합을 현재 프레임에서의 감쇠 윈도우의 윈도우 길이로서 결정하도록 구성된다.
선택적으로, 실시예에서, 프로세서(1220)는 구체적으로, 현재 프레임에서의 채널 간 시간차의 절대값이 천이 세그먼트의 미리 설정된 길이 이상인 경우, 현재 프레임에서의 채널 간 시간차의 절대값과 천이 세그먼트의 미리 설정된 길이의 합을 현재 프레임에서의 감쇠 윈도우의 윈도우 길이로서 결정하거나, 또는 현재 프레임에서의 채널 간 시간차의 절대값이 천이 세그먼트의 미리 설정된 길이보다 작은 경우, 현재 프레임에서의 채널 간 시간차의 절대값의 N배를 현재 프레임에서의 감쇠 윈도우의 윈도우 길이로서 결정하도록 구성되며, 여기서 N은 0보다 크고 L/MAX_DELAY보다 작은 미리 설정된 실수이고, MAX_DELAY는 0보다 큰 미리 설정된 실수이다.
선택적으로, MAX_DELAY는 채널 간 시간차의 절대값의 최대값이다.
선택적으로, 실시예에서, 프로세서(1220)는 구체적으로 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 초기 선형 예측 분석 윈도우를 수정하도록 구성되며, 여기서 초기 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 대응하는 포인트의 값에 대한 수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 값의 감쇠값은 상승 추세를 나타낸다.
선택적으로, 실시예에서, 수정된 선형 예측 분석 윈도우는 수학식
Figure pat00041
을 충족시키며, 여기서 wadp(i)는 수정된 선형 예측 분석 윈도우를 나타내고, w(i)는 초기 선형 예측 분석 윈도우를 나타내며,
Figure pat00042
이고, MAX_ATTEN은 0보다 큰 미리 설정된 실수이다.
선택적으로, 실시예에서, 프로세서(1220)는 구체적으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 현재 프레임에서의 감쇠 윈도우를 결정하고, 현재 프레임에서의 감쇠 윈도우에 기초하여 초기 선형 예측 분석 윈도우를 수정하도룩 구성되며, 여기서 초기 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 대응하는 포인트의 값에 대한 수정된 선형 예측 분석 윈도우에서의 포인트(L - sub_window_len)로부터 포인트(L - 1)까지의 값의 감쇠값은 상승 추세를 나타낸다.
선택적으로, 실시예에서, 프로세서(1220)는 구체적으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 복수의 미리 저장된 후보 감쇠 윈도우로부터 현재 프레임에서의 감쇠 윈도우를 결정하도록 구성되며, 여기서 복수의 후보 감쇠 윈도우는 상이한 윈도우 길이 값 범위에 대응하고, 상이한 윈도우 길이 값 범위 사이에는 교집합이 존재하지 않는다.
선택적으로, 실시예에서, 현재 프레임에서의 감쇠 윈도우는 수학식
Figure pat00043
을 충족시키며, 여기서 sub_window(i)는 현재 프레임에서의 감쇠 윈도우를 나타내고, MAX_ATTEN은 0보다 큰 미리 설정된 실수이다.
선택적으로, 실시예에서, 수정된 선형 예측 분석 윈도우는 수학식
Figure pat00044
을 충족시키며, 여기서 wadp(i)는 수정된 선형 예측 분석 윈도우의 윈도우 함수를 나타내고, w(i)는 초기 선형 예측 분석 윈도우를 나타내며, sub_window(.)는 현재 프레임에서의 감쇠 윈도우를 나타낸다.
선택적으로, 실시예에서, 프로세서(1220)는 구체적으로, 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 복수의 미리 저장된 후보 선형 예측 분석 윈도우로부터 수정된 선형 예측 분석 윈도우를 결정하도록 구성되며, 여기서 복수의 후보 선형 예측 분석 윈도우는 상이한 윈도우 길이 값 범위에 대응하고, 상이한 윈도우 길이 값 범위 사이에는 교집합이 존재하지 않는다.
선택적으로, 실시예에서, 프로세서(1220)가 현재 프레임에서의 감쇠 윈도우의 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하기 전에, 프로세서(1220)는, 감쇠 윈도우의 수정된 윈도우 길이를 획득하기 위해, 미리 설정된 간격 스텝에 기초하여 현재 프레임에서의 감쇠 윈도우의 윈도우 길이를 수정하고 ― 간격 스텝은 미리 설정된 양의 정수임 ―, 초기 선형 예측 분석 윈도우 및 감쇠 윈도우의 수정된 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 결정하도록 추가로 구성된다.
선택적으로, 실시예에서, 감쇠 윈도우의 수정된 윈도우 길이는 수학식
Figure pat00045
을 충족시키며, 여기서 sub_window_len_mod는 감쇠 윈도우의 수정된 윈도우 길이를 나타내고, len_step은 간격 스텝을 나타낸다.
전술한 것은 도 11 및 도 12를 참조하여 본 출원의 실시예에서의 스테레오 신호 인코딩 장치를 설명한 것이다. 이하에서는 도 13 내지 도 18을 참조하여 본 출원의 실시예에서의 단말 장치 및 네트워크 장치를 설명한다. 본 출원의 실시예에서의 스테레오 신호 인코딩 방법은 도 13 내지 도 18에서의 단말 장치 또는 네트워크 장치에 의해 수행될 수 있음을 이해해야 한다. 또한, 본 출원의 실시예에서의 인코딩 장치는 도 13 내지 도 18에서의 단말 장치 또는 네트워크 장치에 배치될 수 있다. 구체적으로, 본 출원의 실시예에서의 인코딩 장치는 도 13 내지 도 18에서의 단말 장치 또는 네트워크 장치에서의 스테레오 인코더일 수 있다.
도 13에 도시된 바와 같이, 오디오 통신에서, 제1 단말 장치의 스테레오 인코더는 수집된 스테레오 신호에 대해 스테레오 인코딩을 수행하고, 제1 단말 장치의 채널 인코더는 스테레오 인코더에 의해 획득된 비트스트림에 대해 채널 인코딩을 수행할 수 있다. 다음, 제1 단말 장치는 제1 네트워크 장치 및 제2 네트워크 장치를 사용하여 채널 인코딩 후에 획득되는 데이터를 제2 단말 장치로 전송한다. 제2 단말 장치가 제2 네트워크 장치로부터 데이터를 수신한 후, 제2 단말 장치의 채널 디코더는 스테레오 신호의 인코딩된 비트스트림을 획득하기 위해 채널 디코딩을 수행한다. 제2 단말 장치의 스테레오 디코더는 디코딩을 통해 스테레오 신호를 복원하고, 제2 단말 장치는 스테레오 신호를 재생한다. 이러한 방식으로, 서로 다른 단말 장치 사이에서 오디오 통신이 완료된다.
도 13에서, 제2 단말 장치는 또한 수집된 스테레오 신호를 인코딩하고, 최종적으로 제2 네트워크 장치 및 제1 네트워크 장치를 사용하여 인코딩 후에 획득되는 데이터를 제1 단말 장치로 전송한다. 제1 단말 장치는 스테레오 신호를 획득하기 위해 데이터에 대해 채널 디코딩 및 스테레오 디코딩을 수행한다.
도 13에서, 제1 네트워크 장치 및 제2 네트워크 장치는 무선 네트워크 통신 장치 또는 유선 네트워크 통신 장치일 수 있다. 제1 네트워크 장치 및 제2 네트워크 장치는 디지털 채널을 통해 서로 통신할 수 있다.
도 13에서의 제1 단말 장치 또는 제2 단말 장치는 본 출원의 실시예에서의 스테레오 신호 인코딩/디코딩 방법을 수행할 수 있다. 본 출원의 실시예에서의 인코딩 장치 및 디코딩 장치는 각각 제1 단말 장치에서의 스테레오 인코더 및 스테레오 디코더일 수 있거나, 또는 제2 단말 장치에서의 스테레오 인코더 및 스테레오 디코더일 수 있다.
오디오 통신에서, 네트워크 장치는 오디오 신호의 코덱 포맷의 트랜스코딩을 구현할 수 있다. 도 14에 도시된 바와 같이, 네트워크 장치에 의해 수신된 신호의 코덱 포맷이 다른 스테레오 디코더에 대응하는 코덱 포맷인 경우, 네트워크 장치의 채널 디코더는 다른 스테레오 디코더에 대응하는 인코딩된 비트스트림을 획득하기 위해 수신된 신호에 대해 채널 디코딩을 수행한다. 다른 스테레오 디코더는 스테레오 신호를 획득하기 위해 인코딩된 비트스트림을 디코딩한다. 스테레오 인코더는 스테레오 신호의 인코딩된 비트스트림을 획득하기 위해 스테레오 신호를 인코딩한다. 마지막으로, 채널 인코더는 최종 신호(여기서 그 신호는 단말 장치 또는 다른 네트워크 장치로 전송될 수 있음)를 획득하기 위해 스테레오 신호의 인코딩된 비트스트림에 대해 채널 인코딩을 수행한다. 도 14에서의 스테레오 인코더에 대응하는 코덱 포맷이 다른 스테레오 디코더에 대응하는 코덱 포맷과 상이하다는 것이 이해되어야 한다. 다른 스테레오 디코더에 대응하는 코덱 포맷이 제1 코덱 포맷이고, 스테레오 인코더에 대응하는 코덱 포맷이 제2 코덱 포맷인 것으로 가정하면, 도 14에서, 오디오 신호를 제1 코덱 포맷에서 제2 코덱 포맷으로 변환하는 것은 네트워크 장치에 의해 구현된다.
마찬가지로, 도 15에 도시된 바와 같이, 네트워크 장치에 의해 수신된 신호의 코덱 포맷이 스테레오 디코더에 대응하는 코덱 포맷과 동일하면, 네트워크 장치의 채널 디코더가 스테레오 신호의 인코딩된 비트스트림을 획득하기 위해 채널 디코딩을 수행한 후, 스테레오 디코더는 스테레오 신호를 획득하기 위해 스테레오 신호의 인코딩된 비트스트림을 디코딩할 수 있다. 다음, 다른 스테레오 인코더는 다른 스테레오 인코더에 대응하는 인코딩된 비트스트림을 획득하기 위해 다른 코덱 포맷에 기초하여 스테레오 신호를 인코딩한다. 마지막으로, 채널 인코더는 최종 신호(여기서 그 신호는 단말 장치 또는 다른 네트워크 장치로 전송될 수 있음)를 획득하기 위해 다른 스테레오 인코더에 대응하는 인코딩된 비트스트림에 대해 채널 인코딩을 수행한다. 도 14에서의 경우와 유사하게, 도 15에서의 스테레오 디코더에 대응하는 코덱 포맷은 또한 다른 스테레오 인코더에 대응하는 코덱 포맷과 상이하다. 다른 스테레오 인코더에 대응하는 코덱 포맷이 제1 코덱 포맷이고, 스테레오 디코더에 대응하는 코덱 포맷이 제2 코덱 포맷인 경우, 도 15에서, 오디오 신호를 제2 코덱 포맷에서 제1 코덱 포맷으로 변환하는 것은 네트워크 장치에 의해 구현된다.
도 14에서의 다른 스테레오 디코더 및 스테레오 인코더는 상이한 코덱 포맷에 대응하고, 도 15에서의 스테레오 디코더 및 다른 스테레오 인코더는 상이한 코덱 포맷에 대응한다. 따라서, 스테레오 신호의 코덱 포맷의 트랜스코딩은 다른 스테레오 디코더 및 스테레오 인코더에 의해 수행되거나 스테레오 디코더 및 다른 스테레오 인코더에 의해 수행되는 처리를 통해 구현된다.
도 14에서의 스테레오 인코더는 본 출원의 실시예에서의 스테레오 신호 인코딩 방법을 구현할 수 있고, 도 15에서의 스테레오 디코더는 본 출원의 실시예에서의 스테레오 신호 디코딩 방법을 구현할 수 있다는 것이 또한 이해되어야 한다. 본 출원의 실시예에서의 인코딩 장치는 도 14의 네트워크 장치에서의 스테레오 인코더일 수 있다. 본 출원의 실시예에서의 디코딩 장치는 도 15의 네트워크 장치에서의 스테레오 디코더일 수 있다. 또한, 도 14 및 도 15에서의 네트워크 장치는 구체적으로 무선 네트워크 통신 장치 또는 유선 네트워크 통신 장치일 수 있다.
도 16에 도시된 바와 같이, 오디오 통신에서, 제1 단말 장치의 멀티채널 인코더에서의 스테레오 인코더는 수집된 멀티채널 신호로부터 생성된 스테레오 신호에 대해 스테레오 인코딩을 수행하며, 여기서 멀티채널 인코더에 의해 획득되는 비트스트림은 스테레오 인코더에 의해 획득되는 비트스트림을 포함한다. 제1 단말 장치의 채널 인코더는 멀티채널 인코더에 의해 획득되는 비트스트림에 대해 채널 인코딩을 수행할 수 있다. 다음, 제1 단말 장치는 제1 네트워크 장치 및 제2 네트워크 장치를 사용하여 채널 인코딩 후에 획득되는 데이터를 제2 단말 장치로 전송한다. 제2 단말 장치가 제2 네트워크 장치로부터 데이터를 수신한 후, 제2 단말 장치의 채널 디코더는 멀티채널 신호의 인코딩된 비트스트림을 획득하기 위해 채널 디코딩을 수행하며, 여기서 멀티채널 신호의 인코딩된 비트스트림은 스테레오 신호의 인코딩된 비트스트림을 포함한다. 제2 단말 장치의 멀티채널 디코더 내의 스테레오 디코더는 디코딩을 통해 스테레오 신호를 복원한다. 멀티채널 디코더는 복원된 스테레오 신호에 기초한 디코딩을 통해 멀티채널 신호를 획득하고, 제2 단말 장치는 멀티채널 신호를 재생한다. 이러한 방식으로, 서로 다른 단말 장치 사이에서 오디오 통신이 완료된다.
도 16에서, 제2 단말 장치는 또한 수집된 멀티채널 신호를 인코딩할 수 있고(구체적으로, 제2 단말 장치의 멀티채널 인코더 내의 스테레오 인코더는 수집된 멀티채널 신호로부터 생성되는 스테레오 신호에 대해 스테레오 인코딩을 수행한다는 것이 이해되어야 한다. 그 후, 제2 단말 장치에서의 채널 인코더는 멀티채널 인코더에 의해 획득되는 비트스트림에 대해 채널 인코딩을 수행한다), 최종적으로 제2 네트워크 장치 및 제1 네트워크 장치를 사용하여 제1 단말 장치에게 인코딩된 비트스트림을 전송한다. 제1 단말 장치는 채널 디코딩 및 멀티채널 디코딩을 통해 멀티채널 신호를 획득한다.
도 16에서, 제1 네트워크 장치 및 제2 네트워크 장치는 무선 네트워크 통신 장치 또는 유선 네트워크 통신 장치일 수 있다. 제1 네트워크 장치 및 제2 네트워크 장치는 디지털 채널을 통해 서로 통신할 수 있다.
도 16에서의 제1 단말 장치 또는 제2 단말 장치는 본 출원의 실시예에서의 스테레오 신호 인코딩/디코딩 방법을 수행할 수 있다. 또한, 본 출원의 실시예에서의 인코딩 장치는 제1 단말 장치 또는 제2 단말 장치의 스테레오 인코더일 수 있고, 본 출원의 실시예에서의 디코딩 장치는 제1 단말 장치 또는 제2 단말 장치의 스테레오 디코더일 수 있다.
오디오 통신에서, 네트워크 장치는 오디오 신호의 코덱 포맷의 트랜스코딩을 구현할 수 있다. 도 17에 도시된 바와 같이, 네트워크 장치에 의해 수신된 신호의 코덱 포맷이 다른 멀티채널 디코더에 대응하는 코덱 포맷인 경우, 네트워크 장치의 채널 디코더는 다른 멀티채널 디코더에 대응하는 인코딩된 비트스트림을 획득하기 위해 수신된 신호에 대해 채널 디코딩을 수행한다. 다른 멀티채널 디코더는 멀티채널 신호를 획득하기 위해 인코딩된 비트스트림을 디코딩한다. 멀티채널 인코더는 멀티채널 신호의 인코딩된 비트스트림을 획득하기 위해 멀티채널 신호를 인코딩한다. 멀티채널 인코더의 스테레오 인코더는 스테레오 신호의 인코딩된 비트스트림을 획득하기 위해 멀티채널 신호로부터 생성된 스테레오 신호에 대해 스테레오 인코딩을 수행하며, 여기서 멀티채널 신호의 인코딩된 비트스트림은 스테레오 신호의 인코딩된 비트스트림을 포함한다. 마지막으로, 채널 인코더는 최종 신호(여기서 그 신호는 단말 장치 또는 다른 네트워크 장치로 전송될 수 있음)를 획득하기 위해 인코딩된 비트스트림에 대해 채널 인코딩을 수행한다.
마찬가지로, 도 18에 도시된 바와 같이, 네트워크 장치에 의해 수신된 신호의 코덱 포맷이 멀티채널 디코더에 대응하는 코덱 포맷과 동일한 경우, 네트워크 장치의 채널 디코더가 멀티채널 신호의 인코딩된 비트스트림을 획득하기 위해 채널 디코딩을 수행한 후, 멀티채널 디코더는 멀티채널 신호를 획득하기 위해 멀티채널 신호의 인코딩된 비트스트림을 디코딩할 수 있다. 멀티채널 디코더의 스테레오 디코더는 멀티채널 신호의 인코딩된 비트스트림 내의 스테레오 신호의 인코딩된 비트스트림에 대해 스테레오 디코딩을 수행한다. 다음, 다른 멀티채널 인코더는 다른 멀티채널 인코더에 대응하는 멀티채널 신호의 인코딩된 비트스트림을 획득하기 위해 다른 코덱 포맷에 기초하여 멀티채널 신호를 인코딩한다. 마지막으로, 채널 인코더는 최종 신호(여기서 그 신호는 단말 장치 또는 다른 네트워크 장치로 전송될 수 있음)를 획득하기 위해 다른 멀티채널 인코더에 대응하는 인코딩된 비트스트림에 대해 채널 인코딩을 수행한다.
도 17에서의 다른 스테레오 디코더 및 멀티채널 인코더가 서로 다른 코덱 포맷에 대응하고, 도 18에서의 멀티채널 디코더 및 다른 다른 스테레오 디코더가 서로 다른 코덱 포맷에 대응한다는 것이 이해되어야 한다. 예를 들어, 도 17에서, 다른 스테레오 디코더에 대응하는 코덱 포맷이 제1 코덱 포맷이고, 멀티채널 인코더에 대응하는 코덱 포맷이 제2 코덱 포맷인 경우, 오디오 신호를 제1 코덱 포맷에서 제2 코덱 포맷으로 변환하는 것은 네트워크 장치에 의해 구현된다. 유사하게,도 18에서, 멀티채널 디코더에 대응하는 코덱 포맷이 제2 코덱 포맷이고, 다른 스테레오 인코더에 대응하는 코덱 포맷이 제1 코덱 포맷인 것으로 가정하면, 오디오 신호를 제2 코덱 포맷에서 제1 코덱 포맷으로 변환하는 것은 네트워크 장치에 의해 구현된다. 따라서, 오디오 신호의 코덱 포맷의 트랜스코딩은 다른 스테레오 디코더 및 멀티채널 인코더에 의해 수행되거나 또는 멀티채널 디코더 및 다른 스테레오 인코더에 의해 수행되는 처리를 통해 구현된다.
도 17에서의 스테레오 인코더는 본 출원의 실시예에서의 스테레오 신호 인코딩 방법을 구현할 수 있고, 도 17에서의 스테레오 디코더는 본 출원의 실시예에서의 스테레오 신호 디코딩 방법을 구현할 수 있다는 것이 또한 이해되어야 한다. 본 출원의 실시예에서의 인코딩 장치는 도 17에서의 네트워크 장치에서의 스테레오 인코더일 수 있다. 본 출원의 실시예에서의 디코딩 장치는 도 18의 네트워크 장치에서의 스테레오 디코더일 수 있다. 또한, 도 17 및 도 18에서의 네트워크 장치 구체적으로 무선 네트워크 통신 장치 또는 유선 네트워크 통신 장치일 수 있다.
본 출원은 칩을 더 제공한다. 칩은 프로세서 및 통신 인터페이스를 포함한다. 통신 인터페이스는 외부 컴포넌트와 통신하도록 구성되고, 프로세서는 본 출원의 실시예에서의 스테레오 신호 인코딩 방법을 수행하도록 구성된다.
선택적으로, 구현에서, 칩은 메모리를 더 포함할 수 있다. 메모리는 명령을 저장하고, 프로세서는 메모리에 저장된 명령을 실행하도록 구성된다. 명령이 실행될 때, 프로세서는 본 출원의 실시예에서의 스테레오 신호 인코딩 방법을 수행하도록 구성된다.
선택적으로, 구현에서, 칩은 단말 장치 또는 네트워크 장치에 통합된다.
본 출원은 컴퓨터 판독 가능 저장 매체를 제공한다. 컴퓨터 판독 가능 저장 매체는 장치에 의해 실행되는 프로그램 코드를 저장하도록 구성되며, 프로그램 코드는 본 출원의 실시예에서의 스테레오 신호 인코딩 방법을 수행하는 데 사용되는 명령을 포함한다.
당업자는 본 명세서에서 설명된 실시예와 관련하여 설명된 예와 조합하여, 유닛 및 알고리즘 단계는 전자식 하드웨어 또는 컴퓨터 소프트웨어 및 전자식 하드웨어의 조합으로 구현될 수 있다는 것을 알 수 있다. 이러한 기능이 하드웨어 또는 소프트웨어로 수행되느냐는 것은 기술적 해결수단의 특별한 애플리케이션 및 설계 제약 조건에 달려 있다. 당업자라면 상이한 방법들을 사용하여 각각의 특별한 애플리케이션에 대해 설명된 기능을 구현할 수 있을 것이지만, 이것은 그 구현이 본 출원의 범주를 넘어서는 것으로 파악되어서는 안된다.
편리하고 간단한 설명을 위해, 전술한 시스템, 장치 및 유닛의 상세한 작동 과정에 대해, 전술한 방법 실시예에서의 대응하는 과정에 대한 참조가 이루어질 수 있고, 상세한 것이 여기에서 다시 설명되지는 않는다는 점이 당업자에 의해 명확하게 이해될 수 있다.
본 출원에서 제공되는 여러 실시예에서, 개시된 시스템, 장치, 및 방법은 다른 방식으로 구현될 수 있다는 점이 이해되어야 한다. 예를 들어, 설명된 장치 실시예는 단지 예시적인 것이다. 예를 들어, 유닛 분할은 논리적 기능 분할일 뿐이며, 실제 구현에서는 다른 분할일 수 있다. 예를 들어, 복수의 유닛 또는 컴포넌트가 다른 시스템에 결합 또는 통합될 수 있거나, 또는 일부 특징이 무시되거나 수행되지 않을 수 있다. 또한, 표시되거나 논의된 상호 결합 또는 직접 결합 또는 통신 연결은 일부 인터페이스를 사용하여 구현될 수 있다. 장치 또는 유닛 사이의 사이의 간접 결합 또는 통신 연결은 전기적, 기계적, 또는 다른 형태로 구현될 수 있다.
별도의 부품으로 설명된 유닛은 물리적으로 분리되어 있거나 분리되어 있지 않을 수 있으며, 유닛으로 표시되는 부품은 물리적 유닛일 수도 있고 아닐 수도 있으며, 한 위치에 있을 수도 있고 복수의 네트워크 유닛에 분산될 수도 있다. 이러한 유닛의 일부 또는 전부는 실시예의 해결수단의 목적을 달성하기 위해 실제 요구에 따라 선택될 수 있다.
또한, 본 발명의 실시예에서의 기능 유닛은 하나의 처리 유닛으로 통합될 수 있거나, 또는 각가긔 유닛은 물리적으로 단독으로 존재할 수 있거나, 또는 둘 이상의 유닛이 하나의 유닛으로 통합된다.
기능이 소프트웨어 기능 유닛의 형태로 구현되고, 독립 제품으로서 판매되거나 사용될 때, 기능은 컴퓨터 판독가능 저장 매체에 저장될 수 있다. 이러한 이해에 기초하여, 본 출원의 기술적 해결수단은 본질적으로, 또는 종래 기술에 기여하는 부분, 또는 기술적 해결수단의 일부는 소프트웨어 제품의 형태로 구현될 수 있다. 컴퓨터 소프트웨어 제품은 저장 매체에 저장되고, (개인용 컴퓨터, 서버, 네트워크 장치 등일 수 있는) 컴퓨터 장치에, 본 출원의 실시예에서 설명된 방법의 단계의 전부 또는 일부를 수행할 것을 명령하기 위한 여러 개의 명령을 포함한다. 전술한 저장 매체는, USB 플래시 드라이브, 착탈식 하드 디스크, 리드 온리 메모리(read-only memory, ROM), 랜덤 액세스 메모리(random access memory, RAM), 자기 디스크, 또는 광 디스크와 같은, 프로그램 코드를 저장할 수 있는 임의의 매체를 포함한다.
전술한 설명은 본 출원의 구체적인 구현 방식일 뿐이고, 본 출원의 보호 범위를 제한하고자 함이 아니다. 본 출원에 개시되는 기술적인 범위 내에서 당업자가 용이하게 생각할 수 있는 임의의 변형 또는 대체는 본 출원의 보호 범위 내에 있을 것이다. 따라서, 본 출원의 보호 범위는 청구항의 보호 범위에 따라야 한다.

Claims (14)

  1. 스테레오 신호 인코딩 방법으로서,
    스테레오 신호의 현재 프레임의 채널 간 시간차(ITD)를 획득하는 단계;
    상기 ITD에 기초하여 상기 현재 프레임의 감쇠 윈도우의 제1 윈도우 길이를 획득하는 단계;
    상기 제1 윈도우 길이에 기초하여 수정된 선형 예측 분석 윈도우를 획득하는 단계 ― 상기 수정된 선형 예측 분석 윈도우에서의 제1 포인트(L - sub_window_len)로부터 상기 수정된 선형 예측 분석 윈도우에서의 제2 포인트(L - 1)까지의 적어도 일부 포인트의 값은 초기 선형 예측 분석 윈도우에서의 제3 포인트(L - sub_window_len)로부터 상기 초기 선형 예측 분석 윈도우에서의 제4 포인트(L - 1)까지의 대응하는 포인트의 값보다 작고, 여기서 sub_window_len은 상기 제1 윈도우 길이를 나타내며, L은 상기 수정된 선형 예측 분석 윈도우의 제2 윈도우 길이를 나타내고, 상기 제2 윈도우 길이는 상기 초기 선형 예측 분석 윈도우의 제3 윈도우 길이에 대응함 ― ; 및
    상기 수정된 선형 예측 분석 윈도우에 기초하여, 상기 스테레오 신호의 채널 신호에 대해 선형 예측 분석을 수행하는 단계
    를 포함하는 스테레오 신호 인코딩 방법.
  2. 제1항에 있어서,
    천이 세그먼트(transition segment)의 미리 설정된 길이에 기초하여 상기 제1 윈도우 길이를 추가로 획득하는 단계를 더 포함하는 스테레오 신호 인코딩 방법.
  3. 제2항에 있어서,
    상기 미리 설정된 길이와 상기 ITD의 절대값의 합을 상기 제1 윈도우 길이로 설정하는 단계; 또는
    상기 ITD의 절대값이 상기 미리 설정된 길이 이상일 때, 상기 합을 상기 제1 윈도우 길이로 설정하는 단계; 또는
    상기 ITD의 절대값이 상기 미리 설정된 길이 미만일 때, 상기 ITD의 절대값의 N배를 상기 제1 윈도우 길이로 설정하는 단계 - 여기서 N은 N은 0보다 크고 L/MAX_DELAY보다 작은 제1 미리 설정된 실수이고, 상기 MAX_DELAY는 0보다 큰 제2 미리 설정된 실수임 -
    를 더 포함하는 스테레오 신호 인코딩 방법.
  4. 제1항에 있어서,
    상기 수정된 선형 예측 분석 윈도우를 획득하는 단계가,
    상기 제1 윈도우 길이에 기초하여 상기 초기 선형 예측 분석 윈도우를 수정하는 단계를 포함하고, 여기서 상기 제3 포인트로부터 상기 제4 포인트까지의 대응하는 포인트의 값에 대한 상기 제1 포인트로부터 상기 제2 포인트까지의 값의 감쇠값은 상승 추세를 나타내는, 스테레오 신호 인코딩 방법.
  5. 제4항에 있어서,
    상기 수정된 선형 예측 분석 윈도우는 다음의 수학식:
    Figure pat00046

    을 충족하며, 여기서 wadp(i)는 상기 수정된 선형 예측 분석 윈도우를 나타내고, w(i)는 상기 초기 선형 예측 분석 윈도우를 나타내며,
    Figure pat00047
    이고, MAX_ATTEN은 0보다 큰 미리 설정된 실수인, 스테레오 신호 인코딩 방법.
  6. 제1항에 있어서,
    상기 제1 윈도우 길이에 기초하여 상기 감쇠 윈도우를 획득하는 단계; 및
    상기 감쇠 윈도우에 기초하여 상기 초기 선형 예측 분석 윈도우를 수정하는 단계
    를 더 포함하고, 여기서 상기 제3 포인트로부터 상기 제4 포인트까지의 대응하는 포인트의 값에 대한 상기 제1 포인트로부터 상기 제2 포인트(L - 1)까지의 값의 감쇠값은 상승 추세를 나타내는, 스테레오 신호 인코딩 방법.
  7. 제6항에 있어서,
    상기 감쇠 윈도우는 다음의 수학식:
    Figure pat00048

    을 충족하며, 여기서 sub_window()는 상기 감쇠 윈도우를 나타내고, MAX_ATTEN은 0보다 큰 미리 설정된 실수인, 스테레오 신호 인코딩 방법.
  8. 제7항에 있어서,
    상기 수정된 선형 예측 분석 윈도우는 다음의 수학식:
    Figure pat00049

    을 충족하며, 여기서 wadp(i)는 상기 수정된 선형 예측 분석 윈도우의 윈도우 함수를 나타내고, w(i)는 상기 초기 선형 예측 분석 윈도우를 나타내는, 스테레오 신호 인코딩 방법.
  9. 제1항에 있어서,
    상기 제1 윈도우 길이에 기초하여 복수의 미리 저장된 후보 선형 예측 분석 윈도우로부터 상기 수정된 선형 예측 분석 윈도우를 획득하는 단계 - 상기 복수의 미리 저장된 후보 선형 예측 분석 윈도우는 상이한 윈도우 길이 값 범위에 대응하고, 상기 상이한 윈도우 길이 값 범위 사이에는 교집합이 없음 ―
    를 더 포함하는 스테레오 신호 인코딩 방법.
  10. 제1항에 있어서,
    수정된 제1 윈도우 길이를 획득하기 위해, 미리 설정된 간격 스텝에 기초하여 상기 제1 윈도우 길이를 수정하는 단계 - 상기 미리 설정된 간격 스텝은 미리 설정된 양의 정수임 - ; 및
    상기 초기 선형 예측 분석 윈도우 및 상기 수정된 제1 윈도우 길이에 기초하여 상기 수정된 선형 예측 분석 윈도우를 획득하는 단계
    를 더 포함하는 스테레오 신호 인코딩 방법.
  11. 제10항에 있어서,
    상기 수정된 제1 윈도우 길이는 다음의 수학식:
    Figure pat00050

    을 충족시키며, 여기서 sub_window_len_mod는 상기 수정된 제1 윈도우 길이를 나타내고, len_step은 상기 미리 설정된 간격 스텝을 나타내는, 스테레오 신호 인코딩 방법.
  12. 인코딩 장치로서,
    프로그램을 저장하도록 구성된 메모리; 및
    상기 메모리 내에 저장되는 프로그램을 실행하도록 구성된 프로세서
    를 포함하고, 상기 메모리 내의 프로그램이 실행될 때, 상기 프로세서는 제1항 내지 제11항 중 어느 한 항에 따른 스테레오 신호 인코딩 방법을 수행하도록 구성되는, 인코딩 장치.
  13. 프로그램이 기록된 컴퓨터가 판독 가능한 저장 매체로서,
    상기 프로그램은 컴퓨터로 하여금 제1항 내지 제11항 중 어느 한 항에 따른 스테레오 신호 인코딩 방법을 실행하도록 하는, 컴퓨터가 판독 가능한 저장 매체.
  14. 컴퓨터로 하여금 제1항 내지 제11항 중 어느 한 항에 따른 스테레오 신호 인코딩 방법을 실행하게끔 야기하도록 구성되는, 컴퓨터가 판독 가능한 저장 매체에 저장된 컴퓨터 프로그램.
KR1020227010056A 2017-08-23 2018-08-21 스테레오 신호 인코딩 방법 및 인코딩 장치 KR102486258B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201710731482.1A CN109427338B (zh) 2017-08-23 2017-08-23 立体声信号的编码方法和编码装置
CN201710731482.1 2017-08-23
KR1020207008343A KR102380642B1 (ko) 2017-08-23 2018-08-21 스테레오 신호 인코딩 방법 및 인코딩 장치
PCT/CN2018/101524 WO2019037714A1 (zh) 2017-08-23 2018-08-21 立体声信号的编码方法和编码装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020207008343A Division KR102380642B1 (ko) 2017-08-23 2018-08-21 스테레오 신호 인코딩 방법 및 인코딩 장치

Publications (2)

Publication Number Publication Date
KR20220044857A true KR20220044857A (ko) 2022-04-11
KR102486258B1 KR102486258B1 (ko) 2023-01-09

Family

ID=65438398

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020227010056A KR102486258B1 (ko) 2017-08-23 2018-08-21 스테레오 신호 인코딩 방법 및 인코딩 장치
KR1020207008343A KR102380642B1 (ko) 2017-08-23 2018-08-21 스테레오 신호 인코딩 방법 및 인코딩 장치

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020207008343A KR102380642B1 (ko) 2017-08-23 2018-08-21 스테레오 신호 인코딩 방법 및 인코딩 장치

Country Status (6)

Country Link
US (2) US11244691B2 (ko)
EP (2) EP3901949B1 (ko)
KR (2) KR102486258B1 (ko)
CN (1) CN109427338B (ko)
ES (1) ES2873880T3 (ko)
WO (1) WO2019037714A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109427338B (zh) 2017-08-23 2021-03-30 华为技术有限公司 立体声信号的编码方法和编码装置
CN113129910A (zh) * 2019-12-31 2021-07-16 华为技术有限公司 音频信号的编解码方法和编解码装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997021211A1 (en) * 1995-12-01 1997-06-12 Digital Theater Systems, Inc. Multi-channel predictive subband coder using psychoacoustic adaptive bit allocation
KR20090083070A (ko) * 2008-01-29 2009-08-03 삼성전자주식회사 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
US20170116997A1 (en) * 2007-09-25 2017-04-27 Google Technology Holdings LLC Apparatus and method for encoding a multi channel audio signal
US20170236521A1 (en) * 2016-02-12 2017-08-17 Qualcomm Incorporated Encoding of multiple audio signals
KR20180056661A (ko) * 2015-09-25 2018-05-29 보이세지 코포레이션 스테레오 사운드 신호를 1차 및 2차 채널로 시간 영역 다운 믹싱하기 위해 좌측 및 우측 채널들간의 장기 상관 차이를 이용하는 방법 및 시스템
KR102380642B1 (ko) * 2017-08-23 2022-03-29 후아웨이 테크놀러지 컴퍼니 리미티드 스테레오 신호 인코딩 방법 및 인코딩 장치

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
WO2009107054A1 (en) * 2008-02-26 2009-09-03 Koninklijke Philips Electronics N.V. Method of embedding data in stereo image
US8355921B2 (en) * 2008-06-13 2013-01-15 Nokia Corporation Method, apparatus and computer program product for providing improved audio processing
CN102307323B (zh) * 2009-04-20 2013-12-18 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法
US9424852B2 (en) * 2011-02-02 2016-08-23 Telefonaktiebolaget Lm Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
JP5705086B2 (ja) * 2011-10-14 2015-04-22 日本電信電話株式会社 声道スペクトル抽出装置、声道スペクトル抽出方法及びプログラム
WO2013149671A1 (en) * 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Multi-channel audio encoder and method for encoding a multi-channel audio signal
EP2838086A1 (en) * 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997021211A1 (en) * 1995-12-01 1997-06-12 Digital Theater Systems, Inc. Multi-channel predictive subband coder using psychoacoustic adaptive bit allocation
US20170116997A1 (en) * 2007-09-25 2017-04-27 Google Technology Holdings LLC Apparatus and method for encoding a multi channel audio signal
KR20090083070A (ko) * 2008-01-29 2009-08-03 삼성전자주식회사 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
US20090198501A1 (en) * 2008-01-29 2009-08-06 Samsung Electronics Co. Ltd. Method and apparatus for encoding/decoding audio signal using adaptive lpc coefficient interpolation
KR20180056661A (ko) * 2015-09-25 2018-05-29 보이세지 코포레이션 스테레오 사운드 신호를 1차 및 2차 채널로 시간 영역 다운 믹싱하기 위해 좌측 및 우측 채널들간의 장기 상관 차이를 이용하는 방법 및 시스템
US20170236521A1 (en) * 2016-02-12 2017-08-17 Qualcomm Incorporated Encoding of multiple audio signals
KR102380642B1 (ko) * 2017-08-23 2022-03-29 후아웨이 테크놀러지 컴퍼니 리미티드 스테레오 신호 인코딩 방법 및 인코딩 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Bertrand Fatus. Parametric Coding for Spatial Audio. Master’s Thesis, KTH, Stockholm, Sweden. 2015.12.* *

Also Published As

Publication number Publication date
KR102380642B1 (ko) 2022-03-29
KR20200039789A (ko) 2020-04-16
US11636863B2 (en) 2023-04-25
US20220108709A1 (en) 2022-04-07
US11244691B2 (en) 2022-02-08
CN109427338A (zh) 2019-03-05
EP3664089B1 (en) 2021-03-31
EP3901949B1 (en) 2022-12-28
WO2019037714A1 (zh) 2019-02-28
KR102486258B1 (ko) 2023-01-09
CN109427338B (zh) 2021-03-30
ES2873880T3 (es) 2021-11-04
EP3664089A4 (en) 2020-08-19
EP3664089A1 (en) 2020-06-10
US20200194015A1 (en) 2020-06-18
EP3901949A1 (en) 2021-10-27

Similar Documents

Publication Publication Date Title
KR101162275B1 (ko) 오디오 신호 처리 방법 및 장치
KR101276849B1 (ko) 오디오 신호의 처리 방법 및 장치
KR102606259B1 (ko) 신호 화이트닝 또는 신호 후처리를 이용하는 다중신호 인코더, 다중신호 디코더, 및 관련 방법들
EP2850613B1 (en) Efficient encoding and decoding of multi-channel audio signal with multiple substreams
US11238875B2 (en) Encoding and decoding methods, and encoding and decoding apparatuses for stereo signal
US11636863B2 (en) Stereo signal encoding method and encoding apparatus
US20220335961A1 (en) Audio signal encoding method and apparatus, and audio signal decoding method and apparatus
KR102353050B1 (ko) 스테레오 신호 인코딩에서의 신호 재구성 방법 및 디바이스
EP3186808B1 (en) Audio parameter quantization
KR20100054749A (ko) 신호의 처리 방법 및 이의 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant