KR20240005152A - 다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치 - Google Patents

다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치 Download PDF

Info

Publication number
KR20240005152A
KR20240005152A KR1020237044298A KR20237044298A KR20240005152A KR 20240005152 A KR20240005152 A KR 20240005152A KR 1020237044298 A KR1020237044298 A KR 1020237044298A KR 20237044298 A KR20237044298 A KR 20237044298A KR 20240005152 A KR20240005152 A KR 20240005152A
Authority
KR
South Korea
Prior art keywords
frame
target frame
signal
target
residual
Prior art date
Application number
KR1020237044298A
Other languages
English (en)
Inventor
하이팅 리
빈 왕
제신 리우
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20240005152A publication Critical patent/KR20240005152A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks

Abstract

다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치가 제공된다. 방법은: 오디오 신호의 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 초기 다운믹스 신호 및 초기 잔차 신호를 획득하는 단계(S610)-여기서, 오디오 신호는 스테레오 신호임-; 오디오 신호의 제1 타깃 프레임이 스위칭 프레임인지 여부를 판단하는 단계(S620)-여기서, 제1 타깃 프레임은 현재 프레임 또는 현재 프레임의 이전 프레임임-; 및 제1 타깃 프레임이 스위칭 프레임인 경우, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터, 초기 다운믹스 신호, 및 초기 잔차 신호에 기초하여, 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호를 계산하는 단계(S630)-여기서, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 제2 타깃 프레임의 잔차 신호 코딩 파라미터 및 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터 중 적어도 하나에 기초하여 계산됨-;를 포함한다. 이 방법은, 인코딩 및 디코딩된 오디오 신호가 재생될 때, 스위칭 프레임과 스위칭 프레임의 이전 프레임 사이의 전환이 더 부드러워지도록 도와주어, 인코딩 및 디코딩된 오디오 신호의 더 나은 청각 품질을 제공한다.

Description

다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치{METHOD AND APPARATUS FOR COMPUTING DOWN-MIXED SIGNAL AND RESIDUAL SIGNAL}
본 출원은 2018년 5월 31일자로 중국특허청에 출원되고 발명의 명칭이 " 다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치"인 중국 특허 출원 번호 제201810548874.9호에 대해 우선권을 주장하며, 이러한 문헌의 내용은 원용에 의해 전체적으로 본 명세서에 포함된다.
본 출원은 오디오 분야에 관한 것으로서, 더욱 구체적으로, 다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치에 관한 것이다.
삶의 질이 향상됨에 따라 사람들은 고품질 오디오에 대한 요구가 증가하고 있다. 모노포닉(monophonic) 신호와 비교하여, 스테레오 신호는 모든 음원의 방향감과 분포감이 있어, 정보의 명확성, 명료성, 몰입감을 향상시킬 수 있다. 따라서, 스테레오 신호는 사람들에게 매우 선호된다.
제한된 대역폭에서 스테레오 신호를 더 잘 전송하려면, 일반적으로 스테레오 신호를 먼저 인코딩한 다음 인코딩 처리된 비트스트림을 디코더 측으로 전송해야 한다. 디코더 측은 수신된 비트스트림에 대해 디코딩 처리를 수행하여 디코딩된 스테레오 신호를 획득하고, 디코딩된 스테레오 신호는 재생에 사용된다.
스테레오 신호에 대한 인코딩 및 디코딩 기술에는 여러 가지가 있다. 파라미터 스테레오 인코딩 및 디코딩 기술은 일반적인 스테레오 인코딩 및 디코딩 기술이다. 파라미터 스테레오 인코딩 및 디코딩 기술에서, 스테레오 신호가 분석된 후, 공간적 지각 파라미터(spatial perception parameter), 다운믹스 신호(downmixed signal), 및 잔차 신호(residual signal)가 획득될 수 있다.
프레임 처리-기반 파라메트릭(parametric) 스테레오 인코딩 및 디코딩 기술에서, 코딩 속도가 비교적 낮은 경우, 예를 들어, 코딩 속도가 초당 26 킬로비트(kbps), 16.4 kbps, 24.4 kbps, 또는 32 kbps인 경우, 향상 인코딩 및 디코딩된 스테레오 신호를 재생하는 동안 공간감과 안정성을 향상하고 스테레오 신호의 고주파 왜곡을 줄이기 위해, 미리 설정된 조건이 만족되면, 스테레오 신호의 각각의 프레임의 다운믹스 신호가 인코딩될 수 있고, 미리 설정된 대역폭 범위를 충족하는 서브밴드(subband)의 잔차 신호가 또한 인코딩될 수 있다. 예를 들어, 잔차 신호가 인코딩될 때, 미리 설정된 조건이 충족되면, 미리 설정된 대역폭 범위를 충족하는 잔차 신호만이 인코딩된다. 미리 설정된 조건이 충족되지 않으면, 잔차 신호가 인코딩되지 않는다.
이 스테레오 인코딩 방법을 사용하면, 인접한 두 프레임의 잔차 신호의 인코딩 상태가 일치하지 않을 수 있다. 예를 들어, 인접한 두 프레임 중 이전 프레임의 잔차 신호는 인코딩된 상태에 있고, 인접한 두 프레임 중 현재 프레임의 잔차 신호는 인코딩되지 않은 상태에 있다. 다른 예로, 인접한 두 프레임 중 이전 프레임의 잔차 신호는 인코딩되지 않은 상태에 있고, 인접한 두 프레임 중 현재 프레임의 잔차 신호는 인코딩된 상태에 있다.
인접한 두 프레임의 잔차 신호의 인코딩 상태가 일치하지 않는 경우, 두 프레임 중 나중 프레임을 스위칭 프레임이라고 지칭할 수 있다.
스테레오 신호 인코딩 프로세스에 스위칭 프레임이 있는 경우, 인코딩 및 디코딩된 스테레오 신호가 재생되면, 스위칭 프레임과 스위칭 프레임의 이전 프레임 사이의 전환이 부드럽지 않아, 인코딩 및 디코딩된 스테레오 신호의 청각 품질에 영향을 미친다.
본 출원은, 인코딩 및 디코딩된 스테레오 신호가 재생될 때 스위칭 프레임과 스위칭 프레임의 이전 프레임 사이의 전환을 더욱 부드럽게 하고, 이에 따라 인코딩 및 디코딩된 스테레오 신호의 더 나은 청각 품질을 제공하는, 다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치를 제공한다.
제1 측면에 따르면, 본 출원은 다운믹스 신호 및 잔차 신호를 계산하는 방법을 제공한다. 이 방법은,
오디오 신호의 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 초기 다운믹스 신호 및 초기 잔차 신호를 획득하는 단계-여기서, 상기 오디오 신호는 스테레오 신호임-;
상기 오디오 신호의 제1 타깃 프레임이 스위칭 프레임인지 여부를 판단하는 단계-여기서, 상기 제1 타깃 프레임은 상기 현재 프레임 또는 상기 현재 프레임의 이전 프레임임-; 및
상기 제1 타깃 프레임이 스위칭 프레임인 경우, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터, 그리고 상기 미리 설정된 주파수 대역에 대응하는 서브밴드의 초기 다운믹스 신호 및 초기 잔차 신호에 기초하여, 상기 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호를 계산하는 단계-여기서, 상기 제2 타깃 프레임은 상기 제1 타깃 프레임의 이전 프레임 또는 현재 프레임이고, 상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터 및 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터 중 적어도 하나에 기초하여 결정되며; 그리고 상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호와 잔차 신호 사이의 에너지 관계를 나타내는데 사용되고, 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 신호와 상기 제2 타깃 프레임 이전 M 프레임의 신호 사이의 에너지 또는 진폭 관계를 나타내는데 사용되며, 여기서 M은 양의 정수임-;를 포함한다.
상기 제1 타깃 프레임 및 상기 제2 타깃 프레임은 동일한 프레임이거나 상이한 프레임일 수 있다.
상기 제1 측면을 참조하면, 제1 가능한 구현예로서, 상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 상기 제2 타깃 프레임의 잔차 신호에 대한 상기 제2 타깃 프레임의 다운믹스 신호의 에너지 비율을 나타내는데 사용되거나;
상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호와 상기 제2 타깃 프레임의 잔차 신호 사이의 에너지 차이를 나타내는데 사용되거나; 또는
상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호와 상기 제2 타깃 프레임의 잔차 신호 사이의 로그 에너지 차이를 나타내는데 사용된다.
상기 제1 측면 또는 상기 제1 가능한 구현예를 참조하여, 제2 가능한 구현예로서, 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지에 대한 상기 제2 타깃 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 잔차 신호의 총 에너지의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 잔차 신호의 총 에너지와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 잔차 신호의 총 에너지의 로그와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지의 로그 사이의 차이를 나타내는데 사용될 수 있거나;
상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지에 대한 상기 제2 타깃 프레임의 다운믹스 신호의 에너지의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 에너지와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 에너지의 로그와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지의 로그 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지에 대한 상기 제2 타깃 프레임의 잔차 신호의 에너지의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 잔차 신호의 에너지와 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지 사이의 차이를 나타내는데 사용되거나; 또는
상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 잔차 신호의 에너지의 로그와 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지의 로그 사이의 차이를 나타내는데 사용된다.
상기 제1 측면 또는 전술한 가능한 구현예 중 어느 하나를 참조하여, 제3 가능한 구현예로서, 상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합에 대한 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 합의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 합과 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 합의 로그와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합의 로그 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합에 대한 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합과 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합의 로그와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합의 로그 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합에 대한 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 잔차 신호의 진폭 합과 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합 사이의 차이를 나타내는데 사용되거나; 또는
상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 로그와 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 로그 사이의 차이를 나타내는데 사용된다.
상기 제1 측면 또는 전술한 가능한 구현예 중 어느 하나를 참조하여, 제4 가능한 구현예로서, 상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 다음 방식으로 결정된다:
인 경우, ;
인 경우, ; 또는
다른 경우, ; 여기서,
는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터를 나타내고; 는 상기 프레임 간 에너지 변동 파라미터 또는 상기 프레임 간 진폭 변동 파라미터의 미리 설정된 제1 임계를 나타내고; 는 상기 프레임 간 에너지 변동 파라미터 또는 상기 프레임 간 진폭 변동 파라미터의 미리 설정된 제2 임계를 나타내고; 는 상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터를 나타내고; 는 상기 잔차 신호 코딩 파라미터의 미리 설정된 제1 임계를 나타내고; 는 상기 잔차 신호 코딩 파라미터의 미리 설정된 제2 임계를 나타내고; 는 상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 그리고 , , 및 는 미리 설정된 값을 나타내고; 그리고
, , 및 이다.
상기 제1 측면 또는 제1 내지 제3 가능한 구현예 중 어느 하나를 참조하여, 제5 가능한 구현예로서, 상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 다음 방식으로 결정된다:
인 경우, ;
인 경우, ; 또는
다른 경우, ; 여기서,
는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터를 나타내고; 는 상기 프레임 간 에너지 변동 파라미터 또는 상기 프레임 간 진폭 변동 파라미터의 미리 설정된 제1 임계를 나타내고; 는 상기 프레임 간 에너지 변동 파라미터 또는 상기 프레임 간 진폭 변동 파라미터의 미리 설정된 제2 임계를 나타내고; 는 상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터를 나타내고; 는 상기 잔차 신호 코딩 파라미터의 미리 설정된 제1 임계를 나타내고; 는 상기 잔차 신호 코딩 파라미터의 미리 설정된 제2 임계를 나타내고; 는 상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 그리고 , , 및 는 미리 설정된 값을 나타내고; 그리고
, , 및 이다.
제4 또는 제5 가능한 구현예를 참조하여, 제6 가능한 구현예로서, 이다.
상기 제4 내지 제6 가능한 구현예 중 어느 하나를 참조하여, 제7 가능한 구현예로서, = 0.75이다.
상기 제4 내지 제7 가능한 구현예 중 어느 하나를 참조하여, 제8 가능한 구현예로서, = 0.25이다.
상기 제1 측면 또는 상기 제1 내지 상기 제8 가능한 구현예 중 어느 하나를 참조하여, 제9 가능한 구현예로서, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터, 초기 다운믹스 신호 및 초기 잔차 신호에 기초하여, 상기 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호를 계산하는 단계는,
상기 인코딩될 다운믹스 신호를 공식 에 따라 계산하는 단계; 및
상기 인코딩될 잔차 신호를 공식 에 따라 계산하는 단계;를 포함하되, 여기서,
는 상기 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 인코딩될 다운믹스 신호를 나타내고; 는 상기 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 초기 다운믹스 신호를 나타내고; 는 상기 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 는 상기 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 보상된 다운믹스 신호를 나타내고; 는 상기 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 초기 잔차 신호를 나타내고; 는 상기 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 인코딩될 잔차 신호를 나타내고; 상기 현재 프레임 내의 서브프레임에서 서브밴드 b는 상기 미리 설정된 주파수 대역에 대응하는 적어도 하나의 서브밴드 내의 서브밴드이고; k는 상기 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 주파수 빈 인덱스(frequency bin index)를 나타내고; 그리고 이며, 여기서 는 상기 현재 프레임에 포함된 서브프레임의 수량을 나타낸다.
상기 제9 가능한 구현예를 참조하여, 제10 가능한 구현예로서, , , , 또는 이고, 여기서, Th1은 상기 미리 설정된 주파수 대역에 대응하는 서브밴드에서 가장 작은 인덱스 값을 가지는 서브밴드의 인덱스 값을 나타내고, Th2는 상기 미리 설정된 주파수 대역에 대응하는 서브밴드에서 가장 큰 인덱스 값을 가지는 서브밴드의 인덱스 값을 나타내고, 이며, 여기서 M은 상기 미리 설정된 주파수 대역에 대응하는 서브밴드의 수량을 나타내고, 그리고 이다.
상기 제1 측면 또는 상기 제1 내지 제10 가능한 구현예 중 어느 하나를 참조하여, 제11 가능한 구현예로서, 상기 제1 타깃 프레임이 스위칭 프레임인지 여부를 판단하는 단계는, 상기 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값에 기초하여, 상기 제1 타깃 프레임이 스위칭 프레임인지 여부를 판단하는 단계를 포함한다.
상기 제11 가능한 구현예를 참조하여, 제12 가능한 구현예로서, 상기 제1 타깃 프레임의 잔차 코딩 플래그 값이 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않은 경우, 상기 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 상기 제1 타깃 프레임이 스위칭 프레임을 표시하거나;
상기 제1 타깃 프레임의 잔차 코딩 플래그 값이 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않고, 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그의 수정 플래그 값이 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값이 수정되지 않았음을 표시하는 경우, 상기 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 상기 제1 타깃 프레임이 스위칭 프레임을 표시하거나; 또는
상기 제1 타깃 프레임의 잔차 코딩 플래그 값이 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않고, 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 스위칭 플래그가 상기 제1 타깃 프레임의 이전 프레임이 스위칭 프레임임을 표시하는 경우, 상기 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 상기 제1 타깃 프레임이 스위칭 프레임을 표시하며; 여기서,
상기 제1 타깃 프레임의 잔차 코딩 플래그 값은 상기 제1 타깃 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용되고, 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값은 상기 제1 타깃 프레임의 이전 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용된다.
상기 제1 측면 또는 상기 제1 내지 제10 가능한 구현예 중 어느 하나를 참조하여, 제13 가능한 구현예로서, 상기 제1 타깃 프레임이 스위칭 프레임인지 여부를 판단하는 단계는,
상기 제1 타깃 프레임의 잔차 코딩 플래그 값이 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않은 경우, 상기 제1 타깃 프레임이 스위칭 프레임임을 결정하는 단계;를 포함하고, 여기서,
상기 제1 타깃 프레임의 잔차 코딩 플래그 값은 상기 제1 타깃 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용되고, 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값은 상기 제1 타깃 프레임의 이전 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용된다.
제2 측면에 따르면, 본 출원은 다운믹스 신호 및 잔차 신호를 계산하는 장치를 제공한다. 상기 장치는,
오디오 신호의 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 초기 다운믹스 신호 및 초기 잔차 신호를 획득하도록 구성되는 획득 모듈-여기서, 상기 오디오 신호는 스테레오 신호임-;
상기 오디오 신호의 제1 타깃 프레임이 스위칭 프레임인지 여부를 판단하도록 구성되는 결정 모듈-여기서, 상기 제1 타깃 프레임은 상기 현재 프레임 또는 상기 현재 프레임의 이전 프레임임-; 및
상기 제1 타깃 프레임이 스위칭 프레임인 경우, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터, 상기 초기 다운믹스 신호, 및 상기 초기 잔차 신호에 기초하여, 상기 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호를 계산하도록 구성되는 계산 모듈-여기서, 상기 제2 타깃 프레임은 상기 현재 프레임 또는 상기 현재 프레임의 상기 이전 프레임이고, 상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터 및 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터 중 적어도 하나에 기초하여 결정되며; 그리고 상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호와 잔차 신호 사이의 에너지 관계를 나타내는데 사용되고, 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 신호와 상기 제2 타깃 프레임 이전 M 프레임의 신호 사이의 에너지 또는 진폭 관계를 나타내는데 사용되며, 여기서 M은 양의 정수임-;을 포함한다.
가능한 일부 구현예로서, 상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호와 상기 제2 타깃 프레임의 잔차 신호 사이의 에너지 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호와 상기 제2 타깃 프레임의 잔차 신호 사이의 에너지 차이를 나타내는데 사용되거나; 또는
상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호와 상기 제2 타깃 프레임의 잔차 신호 사이의 로그 에너지 차이를 나타내는데 사용된다.
가능한 일부 구현예로서, 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지에 대한 상기 제2 타깃 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 잔차 신호의 총 에너지의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 잔차 신호의 총 에너지와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 잔차 신호의 총 에너지의 로그와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지의 로그 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지에 대한 상기 제2 타깃 프레임의 다운믹스 신호의 에너지의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 에너지와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 에너지의 로그와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지의 로그 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지에 대한 상기 제2 타깃 프레임의 잔차 신호의 에너지의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 잔차 신호의 에너지와 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지 사이의 차이를 나타내는데 사용되거나; 또는
상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 잔차 신호의 에너지의 로그와 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지의 로그 사이의 차이를 나타내는데 사용된다.
가능한 일부 구현예로서, 상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합에 대한 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 합의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 합과 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 합의 로그와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합의 로그 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합에 대한 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합과 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합의 로그와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합의 로그 사이의 차이를 나타내는데 사용되거나;
상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합에 대한 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 잔차 신호의 진폭 합과 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합 사이의 차이를 나타내는데 사용되거나; 또는
상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 로그와 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 로그 사이의 차이를 나타내는데 사용된다.
가능한 일부 구현예로서, 상기 계산 모듈은 상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터를 다음 방식으로 계산하도록 구성된다:
인 경우, ;
인 경우, ; 또는
다른 경우, ; 여기서,
는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터를 나타내고; 는 상기 프레임 간 에너지 변동 파라미터 또는 상기 프레임 간 진폭 변동 파라미터의 미리 설정된 제1 임계를 나타내고; 는 상기 프레임 간 에너지 변동 파라미터 또는 상기 프레임 간 진폭 변동 파라미터의 미리 설정된 제2 임계를 나타내고; 는 상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터를 나타내고; 는 상기 잔차 신호 코딩 파라미터의 미리 설정된 제1 임계를 나타내고; 는 상기 잔차 신호 코딩 파라미터의 미리 설정된 제2 임계를 나타내고; 는 상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 그리고 , , 및 는 미리 설정된 값을 나타내고; 그리고
, , 및 이다.
가능한 일부 구현예로서, 상기 계산 모듈은 상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터를 다음 방식으로 계산하도록 구성된다:
인 경우, ;
인 경우, ; 또는
다른 경우, ; 여기서,
는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터를 나타내고; 는 상기 프레임 간 에너지 변동 파라미터 또는 상기 프레임 간 진폭 변동 파라미터의 제1 임계를 나타내고; 는 상기 프레임 간 에너지 변동 파라미터 또는 상기 프레임 간 진폭 변동 파라미터의 미리 설정된 제2 임계를 나타내고; 는 상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터를 나타내고; 는 상기 잔차 신호 코딩 파라미터의 미리 설정된 제1 임계를 나타내고; 는 상기 잔차 신호 코딩 파라미터의 미리 설정된 제2 임계를 나타내고; 는 상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 그리고 , , 및 는 미리 설정된 값을 나타내고; 그리고
, , 및 이다.
가능한 일부 구현예로서, 이다.
가능한 일부 구현예로서, = 0.75이다.
가능한 일부 구현예로서, = 0.25이다.
가능한 일부 구현예로서, 상기 계산 모듈은,
공식 에 따라서, 상기 상기 미리 설정된 주파수 대역에 대응하는 상기 서브밴드의 인코딩될 다운믹스 신호를 계산하도록; 그리고
공식 에 따라서, 상기 상기 미리 설정된 주파수 대역에 대응하는 상기 서브밴드의 인코딩될 잔차 신호를 계산하도록; 구체적으로 구성되며, 여기서,
는 상기 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 인코딩될 다운믹스 신호를 나타내고; 는 상기 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 초기 다운믹스 신호를 나타내고; 는 상기 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 는 상기 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 보상된 다운믹스 신호를 나타내고; 는 상기 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 초기 잔차 신호를 나타내고; 는 상기 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 인코딩될 잔차 신호를 나타내고; 상기 현재 프레임 내의 서브프레임에서 서브밴드 b는 상기 미리 설정된 주파수 대역에 대응하는 적어도 하나의 서브밴드 내의 서브밴드이고; k는 상기 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 주파수 빈 인덱스를 나타내고; 그리고 이며, 여기서 는 상기 현재 프레임에 포함된 서브프레임의 수량을 나타낸다.
선택사항으로서, , , , 또는 이며, 여기서, Th1은 상기 미리 설정된 주파수 대역에 대응하는 서브밴드에서 가장 작은 인덱스 값을 가지는 서브밴드의 인덱스 값을 나타내고, Th2는 상기 미리 설정된 주파수 대역에 대응하는 서브밴드에서 가장 큰 인덱스 값을 가지는 서브밴드의 인덱스 값을 나타내고, 이며, 여기서 M은 상기 미리 설정된 주파수 대역에 대응하는 서브밴드의 수량을 나타내고, 이다.
가능한 일부 구현예로서, 상기 결정 모듈은,
상기 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값에 기초하여, 상기 제1 타깃 프레임이 스위칭 프레임인지 여부를 판단하도록, 구체적으로 구성된다.
선택사항으로서, 상기 제1 타깃 프레임의 잔차 코딩 플래그 값이 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않은 경우, 상기 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 상기 제1 타깃 프레임이 스위칭 프레임을 표시하거나;
상기 제1 타깃 프레임의 잔차 코딩 플래그 값이 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않고, 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그의 수정 플래그 값이 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값이 수정되지 않았음을 표시하는 경우, 상기 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 상기 제1 타깃 프레임이 스위칭 프레임을 표시하거나; 또는
상기 제1 타깃 프레임의 잔차 코딩 플래그 값이 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않고, 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 스위칭 플래그가 상기 제1 타깃 프레임의 이전 프레임이 스위칭 프레임임을 표시하는 경우, 상기 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 상기 제1 타깃 프레임이 스위칭 프레임을 표시하며; 여기서,
상기 제1 타깃 프레임의 잔차 코딩 플래그 값은 상기 제1 타깃 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용되고, 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값은 상기 제1 타깃 프레임의 이전 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용된다.
가능한 일부 구현예로서, 상기 결정 모듈은,
상기 제1 타깃 프레임의 잔차 코딩 플래그 값이 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않은 경우, 상기 제1 타깃 프레임이 스위칭 프레임임을 결정하도록 구체적으로 구성되며, 여기서,
상기 제1 타깃 프레임의 잔차 코딩 플래그 값은 상기 제1 타깃 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용되고, 상기 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값은 상기 제1 타깃 프레임의 이전 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용된다.
제3 측면에 따르면, 본 출원은 다운믹스 신호 및 잔차 신호를 계산하는 장치를 제공한다. 상기 장치는 프로세서와 메모리를 포함한다. 상기 프로세서는 상기 메모리 내의 프로그램을 실행하도록 구성된다. 상기 프로세서가 상기 프로그램을 실행하는 경우, 상기 제1 측면 또는 상기 제1 측면의 가능한 구현예 중 어느 하나에 따른 방법이 구현된다.
제4 측면에 따르면, 본 출원은 컴퓨터-판독 가능한 저장 매체를 제공한다. 상기 컴퓨터-판독 가능한 저장 매체는 다운믹스 신호 및 잔차 신호를 계산하는 장치에 의해 실행되는 프로그램 코드를 저장한다. 상기 프로그램 코드는 상기 제1 측면 또는 상기 제1 측면의 가능한 구현예 중 어느 하나에 따른 방법을 수행하는데 사용되는 명령을 포함한다.
제5 측면에 따르면, 본 출원은 명령을 포함하는 컴퓨터 프로그램 제품을 제공한다. 상기 컴퓨터 프로그램 제품이 다운믹스 신호 및 잔차 신호를 계산하는 장치 상에서 실행되는 경우, 상기 장치는 상기 제1 측면 또는 상기 제1 측면의 가능한 구현예 중 어느 하나에 따른 방법을 수행할 수 있게 된다.
제6 측면에 따르면, 칩이 제공된다. 상기 칩은 프로세서 및 통신 인터페이스를 포함한다. 상기 통신 인터페이스는 외부 콤포넌트와 통신하도록 구성되고, 상기 프로세서는 상기 제1 측면 또는 상기 제1 측면의 가능한 구현예 중 어느 하나에 따른 방법을 수행하도록 구성된다.
선택사항으로서, 구현예로서, 상기 칩은 메모리를 더 포함할 수 있다. 상기 메모리는 명령을 저장하고, 상기 프로세서는 상기 메모리에 저장된 명령을 실행하도록 구성된다. 상기 명령을 실행하는 경우, 상기 프로세서는 상기 제1 측면 또는 상기 제1 측면의 가능한 구현예 중 어느 하나에 따른 방법을 수행하도록 구성된다.
선택사항으로서, 구현예로서, 상기 칩은 단말 디바이스 또는 네트워크 디바이스에 통합된다.
본 출원에서 제공되는 다운믹스 신호와 잔차 신호를 계산하는 방법 및 장치에 따르면, 상기 현재 프레임 또는 상기 현재 프레임의 이전 프레임이 스위칭 프레임인 경우, 상기 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 다운믹스 신호 및 잔차 신호는 현재 프레임 또는 이전 프레임의 다운믹스 신호 및 잔차 신호 사이의 에너지 관계에 기초하여 그리고 신호의 현재 프레임 또는 신호의 이전 프레임과 현재 프레임 또는 이전 프레임 이전 M프레임의 신호 사이의 에너지 또는 진폭 관계에 ??초하여 계산된다. 이러한 방식으로, 인코딩 및 디코딩된 스테레오 신호가 재생될 때 상기 스위칭 프레임과 상기 이전 프레임 사이의 전환이 더 부드러워지고, 상기 인코딩 및 디코딩된 스테레오 신호의 더 나은 청각 품질이 제공된다.
도 1은 시간 도메인에서 스테레오 인코딩 및 디코딩 시스템의 개략적인 구조도이다.
도 2는 스테레오 인코딩 방법의 개략적인 흐름도이다.
도 3은 다른 스테레오 인코딩 방법의 개략적인 흐름도이다.
도 4는 본 출원의 실시예에 따른 모바일 단말의 개략도이다.
도 5는 본 출원의 실시예에 따른 네트워크 엘리먼트의 개략도이다.
도 6은 본 출원의 실시예에 따른 다운믹스 신호 및 잔차 신호를 계산하는 방법의 개략적인 흐름도이다.
도 7a 및 도 7b는 본 출원의 실시예에 따른 스테레오 신호 인코딩 방법의 개략적인 흐름도이다.
도 8a 및 도 8b은 본 출원의 실시예에 따른 스테레오 신호 인코딩 방법의 개략적인 흐름도이다.
도 9a 및 도 9b는 본 출원의 실시예에 따른 스테레오 신호 인코딩 방법의 개략적인 흐름도이다.
도 10a 및 도 10b는 본 출원의 실시예에 따른 스테레오 신호 인코딩 방법의 개략적인 흐름도이다.
도 11a 및 도 11b는 본 출원의 실시예에 따른 스테레오 신호 인코딩 방법의 개략적인 흐름도이다.
도 12는 본 출원의 실시예에 따른 다운믹스 신호 및 잔차 신호를 계산하는 장치의 개략적인 구조도이다.
도 13은 본 출원의 다른 실시예에 따른 다운믹스 신호 및 잔차 신호를 계산하는 장치의 개략적인 구조도이다.
다음은 첨부된 도면을 참조하여 본 출원의 기술적 해결 수단을 설명한다.
본 출원에서 스테레오 신호는 원래의 스테레오 신호일 수도 있고, 다채널 신호에 포함된 두 채널의 신호로 구성되는 스테레오 신호일 수도 있고, 다채널 신호에 포함된 신호의 적어도 3개의 채널에 기초하여 생성되는 두 채널의 신호로 구성되는 스테레오 신호일 수도 있음을 이해해야 한다..
본 출원에서 스테레오 인코딩 방식은 독립적으로 적용될 수 있는 스테레오 인코딩 방식일 수도 있고, 다채널 신호 인코딩에 적용되는 스테레오 인코딩 방식일 수도 있다.
도 1은 본 출원의 예시적인 실시예에 따른 스테레오 인코딩 및 디코딩 시스템의 개략적인 구조도이다. 스테레오 인코딩 및 디코딩 시스템은 인코딩 콤포넌트(110) 및 디코딩 콤포넌트(120)를 포함한다.
인코딩 컴포넌트(110)는 주파수 도메인에서 스테레오 신호를 인코딩하도록 구성된다. 선택사항으로서, 인코딩 콤포넌트(110)는 소프트웨어를 사용하여 구현될 수 있거나, 하드웨어를 사용하여 구현될 수 있거나, 소프트웨어와 하드웨어의 조합을 사용하여 구현될 수 있다. 이는 본 출원의 이 실시예에서 제한되지 않는다.
인코딩 컴포넌트(110)가 주파수 도메인에서 스테레오 신호를 인코딩할 때, 가능한 구현예로서, 도 2에 도시된 단계들이 포함될 수 있다.
S210. 시간-도메인 스테레오 신호를 주파수-도메인 스테레오 신호로 변환한다.
S220. 주파수-도메인 스테레오 신호에 대해 주파수 도메인 분석을 수행하여 주파수-도메인 스테레오 파라미터를 획득한다.
S230. 주파수-도메인 스테레오 신호에서 다운믹스 처리를 수행하여 다운믹스 신호 및 잔차 신호를 획득한다.
다운믹스 신호는 미드 채널 신호(mid channel signal) 또는 1차 채널 신호로 지칭될 수 있고, 잔차 신호는 사이드 채널 신호(side channel signal) 또는 2차 채널 신호로 지칭될 수 있다.
S240. 다운믹스 신호를 인코딩하여 다운믹스 신호에 대응하는 코딩 파라미터를 획득하고, 다운믹스 신호에 대응하는 코딩 파라미터를 인코딩된 비트스트림에 기록한다.
S250. 잔차 신호를 인코딩하여 잔차 신호에 대응하는 코딩 파라미터를 획득하고, 잔차 신호에 대응하는 코딩 파라미터를 인코딩된 비트스트림에 기록한다. 일부 코딩 모드에서, S250은 필수 단계가 아닌 점, 즉 잔차 신호가 반드시 인코딩될 필요는 없다는 점에 유의해야 한다.
S260. 주파수-도메인 스테레오 파라미터를 인코딩하여 주파수-도메인 스테레오 파라미터에 대응하는 코딩 파라미터를 획득하고, 주파수-도메인 스테레오 파라미터에 대응하는 코딩 파라미터를 인코딩된 비트스트림에 기록한다.
S270. 획득한 인코딩된 비트스트림을 다중화한다.
인코딩 컴포넌트(110)가 주파수 도메인에서 스테레오 신호를 인코딩할 때, 다른 가능한 구현예로서, 도 3에 도시된 단계들이 포함될 수 있다.
S310. 시간-도메인 스테레오 신호에서 시간-도메인 분석을 수행하여 시간-도메인 스테레오 파라미터를 획득한다.
S320. 시간-도메인 스테레오 신호를 주파수-도메인 스테레오 신호로 변환한다.
S330. 주파수-도메인 스테레오 신호에 대해 주파수-도메인 분석을 수행하여 주파수-도메인 스테레오 파라미터를 획득한다.
S340. 주파수-도메인 스테레오 파라미터 및 시간-도메인 스테레오 파라미터를 인코딩하여 대응되는 코딩 파라미터를 얻고, 코딩 파라미터를 인코딩된 비트스트림에 기록한다.
S350. 주파수-도메인 스테레오 신호에 다운믹스 처리를 수행하여, 다운믹스 신호와 잔차 신호를 획득한다.
S360. 다운믹스 신호를 인코딩하여, 다운믹스 신호에 대응하는 코딩 파라미터를 획득하고, 다운믹스 신호에 대응하는 코딩 파라미터를 인코딩된 비트스트림에 기록한다.
S370. 잔차 신호를 인코딩하여 잔차 신호에 대응하는 코딩 파라미터를 획득하고, 잔차 신호에 대응하는 코딩 파라미터를 인코딩된 비트스트림에 기록한다. 일부 코딩 모드에서, S370은 필수 단계가 아님에, 즉 잔차 신호가 반드시 인코딩될 필요는 없다는 점에 유의해야 한다.
S380. 획득한 인코딩된 비트스트림을 다중화한다.
디코딩 컴포넌트(120)는, 스테레오 신호를 획득하기 위해, 인코딩 컴포넌트(110)에 의해 생성된 스테레오 인코딩된 비트스트림을 디코딩하도록 구성된다.
선택사항으로서, 인코딩 컴포넌트(110) 및 디코딩 컴포넌트(120)는 유선 또는 무선으로 서로 연결될 수 있다. 디코딩 컴포넌트(120)는 디코딩 컴포넌트(120)와 인코딩 컴포넌트(110) 사이의 이러한 연결을 통해, 인코딩 컴포넌트(110)에 의해 생성된 스테레오 인코딩된 비트스트림을 획득할 수 있다. 대안적으로, 인코딩 컴포넌트(110)는 생성된 스테레오 인코딩된 비트스트림을 메모리에 저장할 수 있고, 디코딩 컴포넌트(120)는 스테레오 인코딩된 비트스트림을 메모리로부터 판독한다.
선택사항으로서, 디코딩 컴포넌트(120)는 소프트웨어를 사용하여 구현될 수 있거나, 하드웨어를 사용하여 구현될 수 있거나, 소프트웨어와 하드웨어의 조합을 사용하여 구현될 수 있다. 이는 본 출원의 이 실시예에서 제한되지 않는다.
디코딩 컴포넌트(120)가 스테레오 인코딩된 비트스트림을 스테레오 신호를 획득하기 위해 디코딩하는 프로세스는 다음과 같은 여러 단계를 포함할 수 있다.
(1) 스테레오 인코딩된 비트스트림에서 제1 모노포닉 인코딩된 비트스트림 및 제2 모노포닉 인코딩된 비트스트림을 디코딩하여 다운믹스 신호 및 잔차 신호를 획득한다.
(2) 스테레오 인코딩된 비트스트림에 기초하여, 업믹스 처리에 사용되는 스테레오 파라미터의 코딩 인덱스를 획득하고, 다운믹스 신호 및 잔차 신호에 대해 업믹스 처리를 수행하여 업믹스-처리된 좌측 채널 신호 및 업믹스-처리된 우측 채널 신호를 획득한다.
(3) 업믹스-처리된 좌측 채널 신호와 업믹스-처리된 우측 채널 신호를 조정하여 스테레오 신호를 획득한다.
선택사항으로서, 인코딩 콤포넌트(110) 및 디코딩 콤포넌트(120)는 하나의 디바이스에 배치될 수 있거나 상이한 디바이스에 배치될 수 있다. 디바이스는 휴대폰, 태블릿 컴퓨터, 랩탑 휴대용 컴퓨터, 데스크톱 컴퓨터, 블루투스 스피커, 녹음 펜, 웨어러블 디바이스와 같이 오디오 신호 처리 기능을 가진 단말기일 수 있다. 대안적으로, 디바이스는 코어 네트워크 또는 무선 네트워크에서 오디오 신호 처리 능력을 가지는 네트워크 엘리먼트일 수 있다. 이는 이 실시예에서 제한되지 않는다.
예를 들어, 도 4에 도시된 바와 같이, 다음의 예가 본 실시예에서 설명을 위해 사용된다. 인코딩 콤포넌트(110)는 모바일 단말(130)에 배치되고, 디코딩 콤포넌트(120)는 모바일 단말(140)에 배치된다. 모바일 단말(130)과 모바일 단말(140)은 오디오 신호 처리 능력을 가진 상호 독립적인 전자 장치이다. 예를 들어, 모바일 단말(130) 및 모바일 단말(140)은 휴대폰, 웨어러블 디바이스, 가상 현실(virtual reality, VR) 디바이스, 증강 현실(augmented reality, AR) 디바이스 등일 수 있다. 또한, 모바일 단말(130)과 모바일 단말(140)은 무선 또는 유선 네트워크를 이용하여 연결된다.
선택사항으로서, 모바일 단말(130)은 수집 컴포넌트(131), 인코딩 컴포넌트(110) 및 채널 인코딩 컴포넌트(132)를 포함할 수 있다. 수집 콤포넌트(131)는 인코딩 컴포넌트(110)에 연결되고, 인코딩 컴포넌트(110)는 채널 인코딩 컴포넌트(132)에 연결된다.
선택사항으로서, 모바일 단말(140)은 오디오 재생 컴포넌트(141), 디코딩 컴포넌트(120), 및 채널 디코딩 컴포넌트(142)를 포함할 수 있다. 오디오 재생 컴포넌트(141)는 디코딩 컴포넌트(120)에 연결되고, 디코딩 컴포넌트(120)는 채널 디코딩 컴포넌트(142)에 연결된다.
수집 컴포넌트(131)를 사용하여 스테레오 신호를 수집한 후, 모바일 단말(130)은 스테레오 신호를 인코딩 컴포넌트(110)를 사용하여 인코딩하여 스테레오 인코딩된 비트스트림을 획득하고; 그런 다음, 스테레오 인코딩된 비트스트림을 채널 인코딩 콤포넌트(132)를 사용하여 인코딩하여 전송 신호를 획득한다.
모바일 단말(130)은 무선 또는 유선 네트워크를 이용하여 전송 신호를 모바일 단말(140)로 전송한다.
전송 신호를 수신한 후, 모바일 단말(140)은 채널 디코딩 콤포넌트(142)를 사용하여 전송 신호를 디코딩하여 스테레오 인코딩된 비트스트림을 획득하고; 스테레오 인코딩된 비트스트림을 디코딩 컴포넌트(120)를 사용하여 디코딩함으로써 스테레오 신호를 획득하고; 오디오 재생 컴포넌트를 사용하여 스테레오 신호를 재생한다. 모바일 단말(140)에 포함되는 콤포넌트를 모바일 단말(130)가 대신하여 포함할 수 있고, 모바일 단말(130)에 포함되는 콤포넌트를 모바일 단말(140)가 대신하여 포함할 수 있음을 이해할 수 있을 것이다.
예를 들어, 도 5에 도시된 바와 같이, 다음 예시가 설명을 위해 사용된다. 인코딩 컴포넌트(110) 및 디코딩 컴포넌트(120)는 코어 네트워크 또는 무선 네트워크에서 오디오 신호 처리 능력을 가지는 하나의 네트워크 엘리먼트(150)에 배치된다.
선택사항으로서, 네트워크 엘리먼트(150)는 채널 디코딩 콤포넌트(151), 디코딩 콤포넌트(120), 인코딩 콤포넌트(110), 및 채널 인코딩 콤포넌트(152)를 포함한다. 채널 디코딩 콤포넌트(151)는 디코딩 콤포넌트(120)에 연결되고, 디코딩 콤포넌트(120)는 인코딩 콤포넌트(110)에 연결되고, 인코딩 콤포넌트(110)는 채널 인코딩 콤포넌트(152)에 연결된다.
다른 디바이스에 의해 송신된 전송 신호를 수신한 후, 채널 디코딩 콤포넌트(151)는 전송 신호를 디코딩하여 제1 스테레오 인코딩된 비트스트림을 획득한다. 디코딩 컴포넌트(120)는 스테레오 인코딩된 비트스트림을 디코딩하여 스테레오 신호를 획득한다. 인코딩 컴포넌트(110)는 스테레오 신호를 인코딩하여 제2 스테레오 인코딩된 비트스트림을 획득한다. 채널 인코딩 컴포넌트(152)는 제2 스테레오 인코딩된 비트스트림을 인코딩하여 전송 신호를 획득한다.
다른 디바이스는 오디오 신호 처리 능력을 가진 모바일 단말일 수 있거나, 오디오 신호 처리 능력을 가진 다른 네트워크 엘리먼트일 수 있다. 이는 이 실시예에서 제한되지 않는다.
선택사항으로서, 네트워크 엘리먼트 내의 인코딩 콤포넌트(110) 및 디코딩 콤포넌트(120)는 모바일 단말에 의해 송신된 스테레오 인코딩된 비트스트림을 트랜스코딩(transcode)할 수 있다.
선택사항으로서, 본 출원의 이 실시예에서, 인코딩 콤포넌트(110)가 장착된 디바이스는 오디오 인코딩 디바이스로 지칭될 수 있다. 실제 구현예에서, 오디오 인코딩 디바이스는 오디오 디코딩 기능을 또한 가질 수 있다. 이는 본 출원의 이 실시예에서 제한되지 않는다.
선택사항으로서, 본 출원의 이 실시예는 스테레오 신호의 예만을 사용하여 설명된다. 본 출원에서, 오디오 인코딩 디바이스는 대안적으로 다채널 신호를 처리할 수 있고, 다채널 신호는 적어도 두 채널의 신호를 포함한다.
본 출원은 스테레오 신호 인코딩 프로세스에서 다운믹스 신호 및 잔차 신호를 계산하는 방법을 제공한다. 이 방법에서, 현재 프레임 또는 현재 프레임의 이전 프레임이 스위칭 프레임인 경우, 현재 프레임에서 미리 설정된 대역폭 범위를 만족하는 서브밴드의 다운믹스 신호 및 잔차 신호가 계산되고, 다운믹스 신호 및 잔차 신호가 인코딩됨으로써, 디코더 측에 의해 디코딩되고 재생되는 스테레오 신호의 스위칭 프레임의 이전 프레임과 스위칭 프레임 사이의 전환이 더 부드러워지게 되고, 인코딩 및 디코딩된 스테레오 신호의 청각 품질을 향상할 수 있다.
본 출원에서 제공되는 다운믹스 신호 및 잔차 신호를 계산하는 방법은 S230 또는 S340 단계에 적용될 수 있다.
도 6은 본 출원의 실시예에 따른 다운믹스 신호 및 잔차 신호를 계산하는 방법의 개략적인 흐름도이다. 이 방법은 인코더에 의해 수행되거나 스테레오 신호 인코딩 기능을 가지는 디바이스에 의해 수행될 수 있다.
S610. 오디오 신호의 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 초기 다운믹스 신호 및 초기 잔차 신호를 획득하며, 여기서 오디오 신호는 스테레오 신호이다.
미리 설정된 주파수 대역에 대응하는 서브밴드는 미리 설정된 주파수 대역의 모든 서브밴드이거나, 미리 설정된 주파수 대역의 일부 서브밴드일 수 있다.
이 단계에 대해서는 종래 기술을 참조한다. 세부사항은 여기에서 설명하지 않는다.
S620. 오디오 신호의 제1 타깃 프레임이 스위칭 프레임인지 여부를 판단하며, 여기서 제1 타깃 프레임은 현재 프레임 또는 현재 프레임의 이전 프레임이다.
제1 타깃 프레임이 스위칭 프레임인지 여부는 복수의 방식으로 결정될 수 있다. 다음은 제1 타깃 프레임이 스위칭 프레임인지 여부를 판단하는 단계의 몇 가지 가능한 구현예를 제공한다.
가능한 일부 구현예로서, 제1 타깃 프레임이 스위칭 프레임인지 여부는 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값에 기초하여 결정될 수 있다. 예를 들어, 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값이 제1 타깃 프레임이 스위칭 프레임임을 표시하는 경우, 제1 타깃 프레임은 스위칭 프레임이다.
제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값이 "제1 타깃 프레임이 스위칭 프레임임" 또는 "제1 타깃 프레임이 스위칭 프레임이 아님"을 표시하는지 여부는 복수의 방식으로 결정될 수 있다.
예를 들어, 제1 타깃 프레임의 잔차 코딩 플래그 값이 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않은 경우, 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임이 스위칭 프레임임을 표시한다. 제1 타깃 프레임의 잔차 코딩 플래그 값이 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같은 경우, 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임이 스위칭 프레임이 아님을 표시한다.
설명의 편의상, 제1 타깃 프레임의 잔차 코딩 플래그 값은 제1 잔차 코딩 플래그 값으로 지칭될 수 있고, 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값은 제2 잔차 코딩 플래그 값으로 지칭될 수 있다. 제1 잔차 코딩 플래그 값은 제1 타깃 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용되고, 제2 잔차 코딩 플래그 값은 제1 타깃 프레임의 이전 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용된다.
다른 예로, 제1 잔차 코딩 플래그 값이 제2 잔차 코딩 플래그 값과 같지 않고, 제2 잔차 코딩 플래그의 수정 플래그 값이 제2 잔차 코딩 플래그 값이 수정되지 않았음을 표시하는 경우, 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임이 스위칭 프레임임을 표시한다. 제1 잔차 코딩 플래그 값이 제2 잔차 코딩 플래그 값과 같지 않고, 제2 잔차 코딩 플래그의 수정 플래그 값이 제2 잔차 코딩 플래그 값이 수정되지 않았음을 표시하는 경우, 또는, 제1 잔차 코딩 플래그 값이 제2 잔차 코딩 플래그 값과 같고, 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임이 스위칭 프레임이 아님을 표시한다.
제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값이 결정된 후, 후속 프레임에 대한 처리를 용이하도록, 제1 잔차 코딩 플래그의 수정 플래그 값이 추가적으로 업데이트될 수 있다. 제1 타깃 프레임의 제1 잔차 코딩 플래그의 수정 플래그 값은 수정되지 않음이 디폴트(default)이다.
예를 들어, 제1 잔차 코딩 플래그 값은 제2 잔차 코딩 플래그 값과 같지 않고, 제2 잔차 코딩 플래그의 수정 플래그 값은 제2 잔차 코딩 플래그가 수정되었음을 표시하고, 제1 잔차 코딩 플래그는 제1 타깃 프레임의 잔차 신호가 인코딩될 필요가 없음을 표시하는 경우, 제1 잔차 코딩 플래그 값은 제1 타깃 프레임의 잔차 신호가 수정되어야 함을 표시하도록 수정되고, 제1 잔차 코딩 플래그의 수정 플래그 값은 제1 잔차 코딩 플래그 값이 수정되었음을 표시하도록 설정된다. 제1 잔차 코딩 플래그 값이 제2 잔차 코딩 플래그 값과 같지 않고, 제2 잔차 코딩 플래그의 수정 플래그 값이 제2 잔차 코딩 플래그 값이 수정되었음을 표시하는 경우, 또는 제1 잔차 코딩 플래그 값이 제2 잔차 코딩 플래그 값과 같은 경우, 제1 잔차 코딩 플래그의 수정 플래그 값은 제1 잔차 코딩 플래그 값이 수정되지 않았음을 표시하도록 설정된다.
제1 타깃 프레임의 잔차 코딩 플래그 값은 제1 타깃 프레임의 것이고 다운믹스 신호와 잔차 신호 사이의 에너지 관계를 나타내는 계산된 파라미터를 사용하여 결정될 수 있다.
예를 들어, 제1 타깃 프레임의 것이고 다운믹스 신호와 잔차 신호 사이의 에너지 관계를 나타내는 계산된 파라미터가 미리 설정된 임계 이상이면, 제1 타깃 프레임의 잔차 코딩 플래그 값은 제1 타깃 프레임의 잔차 신호가 인코딩되어야 함을 표시하도록 설정될 수 있고; 그렇지 않으면, 제1 타깃 프레임의 잔차 코딩 플래그 값은 제1 타깃 프레임의 잔차 신호가 인코딩될 필요가 없음을 표시하도록 설정될 수 있다.
대안적으로, 제1 타깃 프레임의 잔차 코딩 플래그 값은 다운믹스 신호와 잔차 신호 사이의 에너지 관계를 나타내는 파라미터에 기초하여 및/또는 다른 파라미터에 기초하여 결정될 수 있다.
예를 들어, 제1 타깃 프레임의 것이고 다운믹스 신호와 잔차 신호 사이의 에너지 관계를 나타내는 계산된 파라미터에 추가로, 제1 타깃 프레임의 잔차 코딩 플래그 값은, 대안적으로, 음성/음악 분류 결과, 음성 활성화 감지 결과, 잔차 신호 에너지, 및 좌측 채널 주파수-도메인 신호와 우측 채널 주파수-도메인 신호 사이의 상관 관계와 같은 하나 이상의 파라미터에 기초하여 결정될 수 있다.
다른 예로, 먼저 제1 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임이 스위칭 프레임이 아님을 표시하도록 설정될 수 있다. 다른 예를 들어, 제1 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임이 스위칭 프레임이 아님을 나타 내기 위해 설정될 수 있다. 그 다음, 제1 잔차 코딩 플래그 값이 제2 잔차 코딩 플래그 값과 같지 않고, 제1 타깃 프레임의 이전 프레임의 잔차 코딩 스위칭 플래그 값이 제1 타깃 프레임의 이전 프레임이 스위칭 프레임이 아님을 표시하면, 제1 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임이 스위칭 프레임임을 표시하도록 수정된다. 다음으로, 제1 잔차 코딩 플래그 값은 제2 잔차 코딩 플래그 값과 같지 않고, 제1 타깃 프레임의 이전 프레임의 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임의 이전 프레임이 스위칭 프레임이 아님을 표시하고, 제1 잔차 코딩 플래그 값은 제1 타깃 프레임의 잔차 신호가 인코딩될 필요가 없음을 표시하면, 제1 잔차 코딩 플래그 값은, 제1 타깃 프레임의 잔차 신호가 인코딩되어야 함을 표시하도록 수정된다. 마지막으로, 제1 타깃 프레임의 이전 프레임의 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값에 기초하여 업데이트된다.
제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값은 유사한 방식으로 획득될 수 있다. 자세한 내용은 여기에서 설명하지 않는다.
가능한 일부 구현예로서, 제1 타깃 프레임이 스위칭 프레임인지 여부는 제1 타깃 프레임의 잔차 코딩 플래그 값 및 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값에 기초하여 직접적으로 결정될 수 있다.
예를 들어, 제1 타깃 프레임의 잔차 코딩 플래그 값이 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않은 경우, 제1 타깃 프레임이 스위칭 프레임인 것으로 판단한다.
S630. 제1 타깃 프레임이 스위칭 프레임이면, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터, 그리고 미리 설정된 주파수 대역에 대응하는 서브밴드의 초기 다운믹스 신호 및 초기 잔차 신호에 기초하여, 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호를 계산하며, 여기서, 제2 타깃 프레임은 제1 타깃 프레임의 이전 프레임 또는 현재 프레임이고, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 제2 타깃 프레임의 잔차 신호 코딩 파라미터 및 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터 중 적어도 하나에 기초하여 결정되며; 그리고 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 제2 타깃 프레임의 다운믹스 신호와 잔차 신호 사이의 에너지 관계를 나타내는데 사용되고, 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 신호와 제2 타깃 프레임 이전 M 프레임의 신호 사이의 에너지 또는 진폭 관계를 나타내는데 사용되며, 여기서 M은 양의 정수이다.
제2 타깃 프레임의 잔차 신호 코딩 파라미터는 특히 제2 타깃 프레임의 잔차 신호에 대한 제2 타깃 프레임의 다운믹스 신호의 에너지 비율을 나타내는데 사용될 수 있거나;
제2 타깃 프레임의 잔차 신호 코딩 파라미터는 특히 제2 타깃 프레임의 다운믹스 신호와 제2 타깃 프레임의 잔차 신호 사이의 에너지 차이을 나타내는데 사용될 수 있거나; 또는
제2 타깃 프레임의 잔차 신호 코딩 파라미터는 특히 제2 타깃 프레임의 다운믹스 신호와 제2 타깃 프레임의 잔차 신호 사이의 로그 에너지 차이를 나타내는데 사용될 수 있다.
제2 타깃 프레임의 프레임 간 에너지 또는 진폭 변동 파라미터는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터 중 하나일 수 있다.
제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지에 대한 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지의 비율을 나타내는데 사용될 수 있거나, 또는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지 사이의 차이를 나타내는데 사용될 수 있다.
대안적으로, 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지의 로그와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지의 로그 사이의 차이를 나타내는데 사용될 수 있다.
대안적으로, 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지에 대한 제2 타깃 프레임의 다운믹스 신호의 에너지의 비율을 나타내는데 사용될 수 있거나, 또는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 에너지와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지 사이의 차이를 나타내는데 사용될 수 있다.
대안적으로, 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 에너지의 로그와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지의 로그 사이의 차이를 나타내는데 사용될 수 있다.
대안적으로, 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지에 대한 제2 타깃 프레임의 잔차 신호의 에너지의 비율을 나타내는데 사용될 수 있거나, 또는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 잔차 신호의 에너지와 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지 사이의 차이를 나타내는데 사용될 수 있다.
대안적으로, 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 잔차 신호의 에너지의 로그와 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지의 로그 사이의 차이를 나타내는데 사용된다.
제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합에 대한 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 잔차 신호의 진폭 합의 합의 비율을 나타내는데 사용될 수 있거나, 또는 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 잔차 신호의 진폭 합의 합과 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합 사이의 차이를 나타내는데 사용될 수 있다.
대안적으로, 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 진폭 합의 로그 및 제2 타깃 프레임의 잔차 신호의 진폭 합의 합과 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합의 로그 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합 사이의 차이를 나타내는데 사용될 수 있다.
대안적으로, 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합에 대한 제2 타깃 프레임의 다운믹스 신호의 진폭 합의 비율을 나타내는데 사용될 수 있거나, 또는 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 진폭 합과 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 사이의 차이를 나타내는데 사용될 수 있다.
대안적으로, 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 진폭 합의 로그와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합의 로그 사이의 차이를 나타내는데 사용될 수 있다.
대안적으로, 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합에 대한 제2 타깃 프레임의 잔차 신호의 진폭 합의 비율을 나타내는데 사용될 수 있거나, 또는 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 잔차 신호의 진폭 합과 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합 사이의 차이를 나타내는데 사용될 수 있다.
대안적으로, 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 잔차 신호의 진폭 합의 로그와 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 로그 사이의 차이를 나타내는데 사용될 수 있다.
본 출원의 이 실시예의 방법에서, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 제2 타깃 프레임의 잔차 신호 코딩 파라미터 및 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터 중 적어도 하나에 기초하여 복수의 방식으로 결정될 수 있다.
예를 들어, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 제2 타깃 프레임의 잔차 신호 코딩 파라미터 및 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터에 기초하여 획득될 수 있다. 대안적으로, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 제2 타깃 프레임의 잔차 신호 코딩 파라미터 및 2 타깃 프레임의 프레임 간 진폭 변동 파라미터에 기초하여 결정될 수 있다. 대안적으로, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 제2 타깃 프레임의 잔차 신호 코딩 파라미터, 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터, 및 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터에 기초하여 결정될 수 있다.
일부 가능한 방식에서, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 다음 공식을 충족한다.
인 경우, ;
인 경우, ; 또는
다른 경우, ; 여기서,
는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터를 나타내고; 는 제2 타깃 프레임의 잔차 신호 코딩 파라미터를 나타내고; 는 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터의 미리 설정된 제1 임계를 나타내고; 는 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터의 미리 설정된 제2 임계를 나타내고; 는 잔차 신호 코딩 파라미터의 미리 설정된 제1 임계를 나타내고; 는 잔차 신호 코딩 파라미터의 미리 설정된 제2 임계를 나타내고; 는 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터을 나타내고; , , 및 는 미리 설정된 값을 나타내고; 그리고 , , 및 이다.
달리 말하면, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 전술한 공식에 따라 결정될 수 있다.
가능한 일부 구현예로서, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 다음 공식을 충족한다:
인 경우, ;
인 경우, ; 또는
다른 경우, ; 여기서,
는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터를 나타내고; 는 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터의 미리 설정된 제1 임계를 나타내고; 는 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터의 미리 설정된 제2 임계를 나타내고; 는 제2 타깃 프레임의 잔차 신호 코딩 파라미터를 나타내고; 는 잔차 신호 코딩 파라미터의 미리 설정된 제1 임계를 나타내고; 는 잔차 신호 코딩 파라미터의 미리 설정된 제2 임계를 나타내고; 는 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터을 나타내고; , , 및 는 미리 설정된 값을 나타내고; 그리고 , , 및 이다.
달리 말하면, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 전술한 공식에 따라 결정될 수 있다.
선택사항으로서, 이러한 가능한 구현예에서, 의 예시적인 값은 0.5이다.
다른 예로, 의 값은 0.65, 0.7, 0.75, 또는 0.8일 수 있고; 의 값은 0.15, 0.20, 0.25, 0.30, 또는 0.35일 수 있고; 그리고 의 값은 0.45 또는 0.55일 수 있다.
가능한 구현예로서, 의 값은 3.2, 2.7, 3.0, 3.1, 3.3, 3.4, 3.7, 등일 수 있고; 의 값은 0.21, 0.16, 0.19, 0.20, 0.22, 0.23, 0.26, 등일 수 있고; 의 값은 0.10, 0.05, 0.08, 0.09, 0.11, 0.12, 0.15, 등일 수 있고; 그리고 의 값은 0.40, 0.30, 0.35, 0.45, 0.50, 등일 수 있다.
본 출원의 이 실시예에서, 제2 타깃 프레임의 잔차 신호 코딩 파라미터가 제2 타깃 프레임의 잔차 신호에 대한 제2 타깃 프레임의 다운믹스 신호의 에너지 비율을 나타내는데 사용되는 경우, 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 초기 제2 타깃 프레임의 다운믹스 신호의 에너지, 초기 제2 타깃 프레임의 잔차 신호의 에너지, 및 제2 타깃 프레임의 서브밴드 사이드 게인에 기초하여 결정될 수 있다.
예를 들어, 제2 타깃 프레임은 서브프레임으로 분할될 수 있고, 각각의 서브프레임의 주파수-도메인 신호는 서브밴드로 분할될 수 있다. 그 다음, 각각의 서브프레임의 초기 잔차 신호에 대한 초기 다운믹스 신호의 에너지 비율은 각각의 서브프레임에서 처음 서브밴드의 다운믹스 신호, 잔차 신호, 및 서브밴드 사이드 게인을 사용하여 계산될 수 있고, 에너지 비율은 제2 타깃 프레임의 잔차 신호 코딩 파라미터로서 사용될 수 있다.
예를 들어, 대역폭 또는 비트율(bitrate)이 26kbps인 경우를 예로 들면, 제2 타깃 프레임은 2개의 () 서브프레임으로 분할되고, 각각의 서브프레임은 10개의 () 서브밴드로 분할되고, 서브밴드 인덱스는 0으로부터 시작한다. 2개의 서브프레임 각각의 초기 잔차 신호에 대한 초기 다운믹스 신호의 에너지 비율은 각각의 서브프레임에서 처음 5개의 () 서브밴드의 다운믹스 신호, 잔차 신호, 및 서브밴드 사이드 게인에 기초하여 계산되어, 를 획득한다. 예시적인 계산 프로세스는 다음과 같다.
, 여기서,
는 제1 서브프레임에서 서브밴드 b의 사이드 게인(side gain)을 나타내고; 는 제2 서브프레임에서 서브밴드 b의 사이드 게인을 나타내고; 가 입력 파라미터로서 사용되어 임의의 직접 비례 관계를 사용하여 를 획득하는 것을 표시하는 함수 관계 표현을 나타내고; 그리고 는 5보다 작은 정수이다.
에 대한 예시적인 계산 방식은 다음과 같다: .
서브밴드 b의 초기 잔차 신호에 대한 초기 다운믹스 신호의 에너지 비율 는 다음과 같다:
, 여기서,
는 서브밴드 b의 다운믹스 신호의 에너지를 나타내고; 는 서브밴드 b의 잔차 신호의 에너지를 나타내며; , , 및 가 입력 파라미터로서 사용되어 를 획득하는 것을 표시하는 함수 표현을 나타낸다.
에 대한 예시적인 계산 방식은 다음과 같다:
.
각각의 서브프레임의 잔차 신호 코딩 파라미터 는 다음 공식을 만족한다:
, 여기서,
는 최대값을 취하는 것을 나타낸다.
본 출원의 이 실시예에서, 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터가 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지에 대한 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지의 비율을 나타내는데 사용되는 경우, 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 다음 공식에 따라 계산될 수 있다:
, 여기서,
는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터를 나타내고, 는 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지를 나타내고, 는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 잔차 신호의 총 에너지를 나타낸다.
대안적으로, 는 다음 공식에 따라 계산될 수 있다.
, 여기서,
는 최소값을 취하는 것을 나타낸다.
본 출원의 이 실시예에서, 제2 타깃 프레임의 다운믹스 신호 및 잔차 신호의 총 에너지 에 대한 예시적인 계산 프로세스는 다음과 같다.
제2 타깃 프레임에서 처음 5개 () 서브밴드의 다운믹스 신호의 총 에너지 는 다음과 같다:
, 여기서,
는 제2 타깃 프레임의 이전 프레임에서 서브밴드 b의 다운믹스 신호의 에너지를 나타내고, 는 평활 팩터(smooth factor)를 나타내고, 여기서, 는 일반적으로 0, 1, 또는 0과 1 사이의 실수일 수 있다. 예를 들어, 는 0.1일 수 있다.
제2 타깃 프레임에서 처음 5개 서브밴드의 잔차 신호의 총 에너지 는 다음과 같다:
, 여기서,
는 제2 타깃 프레임의 이전 프레임에서 서브밴드 b의 잔차 신호의 에너지를 나타내고, 는 평활 팩터(smooth factor)를 나타내고, 여기서 는 일반적으로 0, 1, 또는 0과 1 사이의 실수일 수 있다. 예를 들어, 는 0.1일 수 있다.
제2 타깃 프레임의 처음 5개 서브밴드의 다운믹스 신호 및 잔차 신호의 총 에너지 는 다음과 같다:
, 여기서,
는 제2 타깃 프레임의 다운믹스 신호 및 잔차 신호의 총 에너지로서 사용될 수 있다.
전술한 예시에서 5개의 서브밴드는 단지 예시로서, 다른 수량의 서브밴드의 다운믹스 신호 및 잔차 신호의 총 에너지를 계산하는 프로세스는 유사할 수 있음을 이해해야 한다.
제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 잔차 신호의 총 에너지를 계산하기 위한 방식에 관해, 제2 타깃 프레임의 다운믹스 신호 및 잔차 신호의 총 에너지를 계산하는 방식을 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
본 출원의 이 실시예에서, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터에 기초하여, 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호를 계산하는 가능한 계산 방식은 다음과 같다:
인코딩될 다운믹스 신호는 공식 에 따라 계산되고, 인코딩될 잔차 신호는 공식 에 따라 계산되며; 여기서,
는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 인코딩될 다운믹스 신호를 나타내고; 는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 초기 다운믹스 신호를 나타내고; 는 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 보상된 다운믹스 신호를 나타내고; 는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 초기 잔차 신호를 나타내고; 는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 인코딩될 잔차 신호를 나타내고; 현재 프레임 내의 서브프레임에서 서브밴드 b는 미리 설정된 주파수 대역에 대응하는 적어도 하나의 서브밴드 내의 서브밴드이고; k는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 주파수 빈 인덱스를 나타내고; 그리고 이며, 여기서 는 현재 프레임에 포함된 서브프레임의 수량을 나타낸다.
현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호가 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터에 기초하여 계산되는 경우, 미리 설정된 주파수 대역의 서브밴드 b는 b가 이상 Th1 이상이고 b가 Th2 이하임을 충족할 수 있다. Th1은 미리 설정된 주파수 대역에 대응하는 서브밴드에서 가장 작은 인덱스 값을 가지는 서브밴드의 인덱스 값을 나타낸다. Th2은 미리 설정된 주파수 대역에 대응하는 서브밴드에서 가장 큰 인덱스 값을 가지는 서브밴드의 인덱스 값을 나타낸다. 이며, 여기서, M은 미리 설정된 주파수 대역에 대응하는 서브밴드의 수량을 나타내고, 이다.
선택사항으로서, , , , 또는 이다.
달리 말하면, 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 믹스된 신호 및 인코딩될 잔차 신호가 계산되는 경우, 미리 설정된 주파수 대역에 대응하는 서브밴드의 전부 또는 일부가 사용된다.
예를 들어, 는, 미리 설정된 주파수 대역에 대응하는 모든 서브밴드가 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호를 계산하는데 사용됨을 표시한다.
예를 들어, 는 미리 설정된 주파수 대역에 대응하는 일부 서브밴드가 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호를 계산하는데 사용됨을 표시한다.
미리 설정된 주파수 대역에 대응하는 서브밴드의 범위는, 제2 타깃 프레임의 잔차 신호 코딩 파라미터가 계산될 때 또는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터가 계산될 때 사용되는, 위 주파수 대역에 대응하는 서브밴드의 범위와 일치하거나 일치하지 않을 수 있다.
예를 들어, 본 출원의 이 실시예에서, 위 주파수 대역에 대응하고, 제2 타깃 프레임의 잔차 신호 코딩 파라미터가 계산될 때 또는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터가 계산될 때 사용되는 서브밴드의 범위는 처음 서브밴드를 포함하고, 미리 설정된 주파수 대역에 대응하는 서브밴드의 범위도 처음 서브밴드를 또한 포함한다.
다른 예로, 위 주파수 대역에 대응하고, 제2 타깃 프레임의 잔차 신호 코딩 파라미터가 계산될 때 또는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터가 계산될 때 사용되는 서브밴드의 범위는 처음 서브밴드를 포함하지만, 미리 설정된 주파수 대역에 대응하는 서브밴드의 범위는 0 < b < 이다.
선택사항으로서, 일부 가능한 구현예에서, 에서 는 0.5로 사전 설정될 수 있다.
제1 타깃 프레임이 스위칭 프레임이 아니면, 일부 가능한 구현예에서, 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 초기 다운믹스 신호 및 초기 잔차 신호는 종래의 방법을 사용하여 계산될 수 있고, 초기 다운믹스 신호 및 초기 잔차 신호는 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호로서 각각 사용된다.
도 6에 도시된 다운믹스 신호 및 잔차 신호를 계산하는 방법은 스테레오 인코딩 프로세스에 적용될 수 있다. 다음은 스테레오 인코딩 프로세스에서 도 6에 도시된 다운믹스 신호 및 잔차 신호를 계산하는 방법의 예시적인 실시예를 도 7a 및 도 7b 내지 도 11a 및 도 11b를 참조하여 설명한다.
도 7a 및 도 7b은 다음 예시를 사용하여 본 출원의 실시예에 따른 스테레오 신호 인코딩 방법의 개략적인 흐름도이다. 제1 타깃 프레임 및 제2 타깃 프레임은 모두 현재 프레임이고; 제2 타깃 프레임의 잔차 신호 인코딩 파라미터는 제2 타깃 프레임의 잔차 신호에 대한 제2 타깃 프레임의 다운믹스 신호의 에너지 비율을 나타내는데 사용되고; 그리고 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지에 대한 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지의 비율을 나타내는데 사용된다. 이 방법은 인코더에 의해 수행되거나 스테레오 신호 인코딩 기능을 가지는 디바이스에 의해 수행될 수 있다. 이 방법은 S701 내지 S719를 포함할 수 있다.
S701. 좌측 채널 시간-도메인 신호와 우측 채널 시간-도메인 신호에 대해 시간-도메인 전처리를 수행한다.
스테레오 신호는 일반적으로 프레임별로 인코딩된다. 스테레오 오디오 신호의 샘플링 레이트(sampling rate)가 16 헤르쯔(KHz)인 경우, 신호의 각 프레임은 20 밀리세컨드(ms)이고, 프레임 길이는 N, N = 320으로 표시되며, 즉, 프레임 길이는 320개의 샘플링 포인트를 포함한다.
현재 프레임의 스테레오 신호는 현재 프레임의 좌측 채널 시간-도메인 신호 및 현재 프레임의 우측 채널 시간-도메인 신호를 포함한다. 현재 프레임의 좌측 채널 시간-도메인 신호는 로 표시되고, 현재 프레임의 우측 채널 시간-도메인 신호는 로 표시되며, 여기서, 는 샘플링 포인트 개수를 나타내고, 이다.
현재 프레임의 좌측 채널 시간-도메인 신호 및 우측 채널 시간-도메인 신호에 시간-도메인 전처리를 수행하는 단계는, 현재 프레임의 좌측 채널 시간-도메인 신호 및 우측 채널 시간-도메인 신호 모두에 고역 통과 필터링 처리를 수행하여 현재 프레임의 전처리된 좌측 채널 시간-도메인 신호 및 현재 프레임의 전처리된 우측 채널 시간-도메인 신호를 획득하는 단계를 포함할 수 있다. 현재 프레임의 전처리된 좌측 채널 시간-도메인 신호는 로 표시되고, 현재 프레임의 전처리된 우측 채널 시간-도메인 신호는 로 표시되며, 여기서, 는 샘플링 포인트 개수를 타나내고, 이다. 고역 통과 필터링 처리를 위해, 20 헤르쯔(Hz)의 컷-오프 주파수를 가지는 무한 임펄스 응답(Infinite Impulse Response, IIR) 필터가 사용될 수 있거나, 다른 유형의 필터가 사용될 수 있다.
예를 들어, 스테레오 신호의 샘플링 레이트가 16KHz인 경우, 컷-오프 주파수가 20Hz인 고역-통과 필터의 해당 전달 함수는 다음과 같을 수 있다.
, 여기서,
= 0.994461788958195, =-1.988923577916390, = 0.994461788958195, = 1.988892905899653, = -0.988954249933127, 그리고 z는 Z 변환 팩터(Z transform factor)를 나타낸다. 이에 상응하여, 전처리된 좌측 채널 시간-도메인 신호는 다음과 같다:
.
S702. 전처리된 좌측 채널 신호 및 전처리된 우측 채널 신호에 시간-도메인 분석을 수행한다.
예를 들어, 시간-도메인 분석은 과도 감지(transient detection)를 포함할 수 있다. 과도 감지란, 현재 프레임의 전처리된 좌측 채널 시간-도메인 신호 및 현재 프레임의 전처리된 우측 채널 시간-도메인 신호 모두에 에너지 감지가 수행되어, 현재 프레임에서 에너지 버스트가 발생하는지 여부를 감지하는 것을 의미한다.
예를 들어, 현재 프레임의 전처리된 좌측 채널 시간-도메인 신호의 에너지 가 계산된다. 과도 감지는 이전 프레임의 전처리된 좌측 채널 시간-도메인 신호의 에너지 와 현재 프레임의 전처리된 좌측 채널 시간-도메인 신호의 에너지 사이의 차이의 절대값에 기초하여 수행되어, 현재 프레임의 전처리된 좌측 채널 시간-도메인 신호의 과도 감지 결과를 획득한다. 전처리된 현재 프레임의 우측 채널 시간-도메인 신호에 대해서도 동일한 방법으로 과도 감지가 수행될 수 있다.
시간-도메인 분석은 과도 감지에 더하여 종래 기술에서의 다른 시간-도메인 분석을 포함할 수 있다. 예를 들어, 시간-도메인 분석은, 시간-도메인 채널 간 시간 차이(Inter-channel Time Difference, ITD) 파라미터 결정, 시간-도메인 지연 정렬 처리, 및 밴드 스프레딩(band spreading) 전처리를 포함할 수 있다.
S703. 전처리된 좌측 채널 신호 및 전처리된 우측 채널 신호에 시간-주파수 변환을 수행하여, 좌측 채널 주파수-도메인 신호 및 우측 채널 주파수-도메인 신호를 획득한다.
예를 들어, 전처리된 좌측 채널 신호에 이산 푸리에 변환이 수행되어 좌측 채널 주파수-도메인 신호를 획득할 수 있고, 전처리된 우측 채널 신호에 이산 푸리에 변환이 수행되어 우측 채널 주파수-도메인 신호를 획득할 수 있다.
스펙트럼 앨리어싱(spectral aliasing) 문제를 극복하기 위해, 두 번의 연속적인 이산 푸리에 변환 사이의 처리에 대해 중첩-추가(oeverlap-add) 방법이 사용될 수 있고, 때로는, 이산 푸리에 변환의 입력 신호에 영(0)이 추가될 수 있다.
이산 푸리에 변환은 각각의 프레임에 대해 한 번 수행될 수 있다. 대안적으로, 신호의 각 프레임은 서브프레임으로 분할될 수 있고, 이산 푸리에 변환은 각각의 서브프레임에 대해 한번 수행된다.
이산 푸리에 변환이 각각의 프레임에 대해 한번 수행되는 경우, 변환된 좌측 채널 주파수-도메인 신호는 로 표시될 수 있고, 여기서 이며; 그리고 변환된 우측 채널 주파수-도메인 신호는 로 표시될 수 있으며, 여기서, 이고, 는 주파수 빈 인덱스 값을 나타내고, a는 이산 푸리에 변환이 한번 수행되는 각각의 프레임의 길이를 나타낸다.
이산 푸리에 변환이 각각의 서브프레임에 대해 한번 수행되는 경우, 서브프레임 i의 변환된 좌측 채널 주파수-도메인 신호는 로 표시될 수 있고, 여기서, 이며; 그리고 서브프레임 i의 변환된 우측 채널 주파수-도메인 신호는 로 표시될 수 있으며, 여기서, 이고, 는 주파수 빈 인덱스 값를 나타내고, 는 서브프레임 인덱스 값를 나타내고, 이고, L은 이산 푸리에 변환이 한번 수행되는 각각의 서브프레임의 길이를 나타낸다.
예를 들어, 샘플링 레이트는 16000Hz이고, 코딩 대역폭은 8000Hz이다. 좌측 채널 신호의 각각의 프레임 또는 우측 채널 신호의 각각의 프레임은 20 ms이고, 프레임 길이는 로 표시되고, , 즉, 프레임 길이는 320개의 샘플링 포인트를 포함한다. 신호의 각각의 프레임은 두 개의 서브프레임으로 분할된다, 즉, . 신호의 각각의 서브프레임은 10ms이고, 서브프레임 길이는 160 개의 샘플링 포인트를 포함한다.
이산 푸리에 변환은 각각의 서브프레임에 대해 한번 수행되고, 이산 푸리에 변환이 수행되는 각각의 서브프레임의 길이는 로 표시되며, 여기서 , 즉, 이산 푸리에 변환이 수행되는 각각의 서브프레임의 길이는 400개의 샘플링 포인트를 포함한다. 이 경우, 서브프레임 i의 변환된 좌측 채널 주파수-도메인 신호는 로 표시될 수 있고, 여기서 이며; 그리고 서브프레임 i의 변환된 우측 채널 주파수-도메인 신호는 로 표시될 수 있으며, 여기서, 이고, 는 주파수 빈 인덱스 값를 나타내고, 는 서브프레임 인덱스 값를 나타내고, 이고, L은 이산 푸리에 변환이 수행되는 각각의 서브프레임의 길이를 나타낸다.
선택사항으로서, 고속 푸리에 변환(Fast Fourier Transformation, FFT) 및 수정된 이산 코사인 변환(Modified Discrete Cosine Transform, MDCT)과 같은 시간-주파수 변환 기술이 변환 시간-도메인 신호를 주파수-도메인 신호로 변환하는데 대안적으로 사용될 수 있다. 이는 본 출원의 이 실시예에서 특별히 제한되지 않는다.
S704. ITD 파라미터를 결정하고, ITD 파라미터를 인코딩한다.
ITD 파라미터를 결정하는 방법은 여러 가지가 있다. ITD 파라미터는 주파수 도메인에서만 결정될 수도 있고, 시간 도메인에서만 결정될 수도 있고, 시간-주파수 도메인에서 결정될 수도 있다. 이는 본 출원에 제한되지 않는다.
ITD가 시간 도메인에서 결정되면, 좌측 채널 시간-도메인 신호와 우측 채널 시간-도메인 신호 사이의 ITD가 결정될 수 있다.
예를 들어, 의 범위에서, 가 계산된다. 인 경우, ITD 파라미터 값은 에 대응하는 인덱스 값의 반대 수(opposite number)이고; 그렇지 않은 경우, ITD 파라미터 값은 에 대응하는 인덱스 값이며,여기서 는 상호-상관 관계 계수를 계산하기 위한 인덱스 값을 나타내고, 는 샘플링 포인트의 인덱스 값를 나타내고, 는 상이한 샘플링 레이트에서 ITD 값의 최대값에 대응하고, 는 프레임 길이를 나타낸다. 의 상이한 값은 상이한 값에 대응하고, 에 대응하는 ?@? 에 대응하는 인덱스 값이다.
ITD가 주파수 도메인에서 결정되면, 좌측 채널 주파수-도메인 신호와 우측 채널 주파수-도메인 신호 사이의 ITD가 결정될 수 있다.
예를 들어, 본 출원의 이 실시예에서, 서브프레임 i의 DFT-변환된 좌측 채널 주파수-도메인 신호는 로 표시되고, 여기서 이며; 그리고 서브프레임 i의 변환된 우측 채널 주파수-도메인 신호는 이고, 여기서 이고, 이다.
서브프레임 i의 주파수-도메인 상관 관계 계수가 에 따라서 계산되며, 여기서 는 서브프레임 i의 변환된 우측 채널 주파수-도메인 신호의 공액(conjugation)을 나타낸다. 주파수-도메인 상호-상관 관계 계수는 시간-도메인 상호-상관 관계 계수 로 변환되며, 여기서 이다. 의 최대값이 의 범위에서 검색되어, 서브프레임 i의 ITD 파라미터 값이 임을 획득한다.
다른 예로, 진폭 값은 서브프레임 i에서 DFT-변환된 좌측 채널 주파수-도메인 신호 및 서브프레임 i에서 DFT-변환된 우측 채널 주파수-도메인 신호에 기초하여 의 검색 범위에서 에 따라 계산될 수 있고, ITD 파라미터 값은 이며, 구체적으로, ITD 파라미터 값은 최대 진폭 값에 대응하는 인덱스 값이다.
물론, ITD는 시간-주파수 도메인에서 대안적으로 결정될 수 있다. 간결함을 위해 여기에서는 세부 사항을 설명하지 않는다.
ITD 파라미터가 결정된 후, ITD 파라미터는 인코딩되고 스테레오 인코딩된 비트스트림에 기록될 수 있다. 본 출원의 이 실시예에서, 임의의 기존 양자화 인코딩 기술이 ITD 파라미터를 인코딩하기 위해 사용될 수 있다. 이는 본 출원의 이 실시예에서 특별히 제한되지 않는다.
S705. ITD 파라미터에 기초하여 좌측 채널 주파수-도메인 신호 및 우측 채널 주파수-도메인 신호에 시간-이동 조정을 수행한다.
시간-이동 조정은 임의의 기술을 사용하여 좌측 채널 주파수-도메인 신호 및 우측 채널 주파수-도메인 신호에 대해 수행될 수 있다. 이는 본 출원의 이 실시예에서 제한되지 않는다.
예를 들어, 신호의 각각의 프레임은 서브프레임으로 분할되며, 여기서, 이다. 서브프레임 i의 시간-이동-조정된 좌측 채널 주파수-도메인 신호는 로 표시될 수 있고, 여기서, 이며; 그리고 서브프레임 i의 시간-이동-조정된 우측 채널 주파수-도메인 신호는 로 표시될 수 있으며, 여기서, 이고, 는 주파수 빈 인덱스 값를 나타내고, 이고,
이고, 여기서,
는 서브프레임 i의 ITD 파라미터 값을 나타내고, 는 이산 푸리에 변환의 길이를 나타내고, 는 서브프레임 i의 변환된 좌측 채널 주파수-도메인 신호를 나타내고, 는 서브프레임 i의 변환된 우측 채널 주파수-도메인 신호를 나타내고, 그리고 는 서브프레임 인덱스 값을 나타내고, 여기서 이다.
DFT가 프레임 단위로 수행되지 않는 경우, 시간 이동 조정은 대안 적으로 전체 프레임에서 한 번만 수행될 수 있다.
S706. 시간-이동-조정된 좌측 채널 주파수-도메인 신호 및 시간-이동-조정된 우측 채널 주파수-도메인 신호에 기초하여 주파수-도메인 스테레오 파라미터를 계산하고, 계산을 통해 획득된 주파수-도메인 스테레오 파라미터를 인코딩한다.
계산을 통해 획득된 주파수-도메인 스테레오 파라미터는, 채널 간 위상 차이(Inter-channel Phase Difference, IPD) 파라미터, 채널 간 레벨 차이(Inter-channel Level Difference, ILD) 파라미터, 및 서브밴드 사이드 게인 중 하나 이상을 포함할 수 있다. ILD는 채널 간 진폭 차이라고도 지칭된다.
주파수-도메인 스테레오 파라미터이 계산을 통해 획득된 후, 주파수-도메인 스테레오 파라미터가 인코딩되고 스테레오 인코딩된 비트스트림에 기록될 수 있다. 본 출원의 이 실시예에서, 임의의 기존 양자화 인코딩 기술이 주파수-도메인 스테레오 파라미터를 인코딩하는데 사용될 수 있다. 이는 본 출원의 이 실시예에서 특별히 제한되지 않는다.
S707. 현재 프레임의 주파수-도메인 신호 또는 현재 프레임을 분할하여 얻어지는 각 서브프레임의 각각의 서브밴드 인덱스가 미리 설정된 조건을 충족하는지 여부를 판단한다. 현재 프레임의 주파수-도메인 신호 또는 현재 프레임을 분할하여 얻어지는 각 서브프레임의 각각의 서브밴드 인덱스가 미리 설정된 조건을 충족하면, S708을 수행하거나; 또는 현재 프레임의 주파수-도메인 신호 또는 현재 프레임을 분할하여 얻어지는 각 서브프레임의 각각의 서브밴드 인덱스가 미리 설정된 조건을 충족하지 않으면, S709를 수행한다.
예를 들어, 현재 프레임의 주파수-도메인 신호 또는 현재 프레임을 분할하여 얻어지는 각 서브프레임의 주파수-도메인 신호에 대해 서브밴드 분할이 수행되고, 서브밴드 b에 포함된 주파수 빈은 이며, 여기서, 는 서브밴드 b에 포함된 주파수 빈의 최소 인덱스 값을 나타낸다. 본 출원의 이 실시예에서, 각 서브프레임의 주파수-도메인 신호는 서브밴드로 분할되고, 각각의 서브밴드에 포함된 주파수 빈은 에 기초하여 결정될 수 있다.
미리 설정된 조건은, 서브밴드 인덱스 값이 잔차 코딩 결정을 위한 최대 서브밴드 인덱스 값보다 작을 것, 즉, 일 것일 수 있으며, 여기서, 는 잔차 코딩 결정을 위한 최대 서브밴드 인덱스 값을 나타낸다.
미리 설정된 조건은, 서브밴드 인덱스 값이 잔차 코딩 결정을 위한 최대 서브밴드 인덱스 값 이하일 것, 즉, 일 것일 수 있다.
미리 설정된 조건은, 서브밴드 인덱스 값이 잔차 코딩 결정을 위한 최대 서브밴드 인덱스 값보다 작고 잔차 코딩 결정을 위한 최소 서브밴드 인덱스 값보다 클 것, 즉, 일 것일 수 있으며, 여기서, 는 잔차 코딩 결정을 위한 최대 서브밴드 인덱스 값을 나타내고, 그리고 는 잔차 코딩 결정을 위한 최소 서브밴드 인덱스 값을 나타낸다.
미리 설정된 조건은, 서브밴드 인덱스 값이 잔차 코딩 결정을 위한 최대 서브밴드 인덱스 값 이하이고 잔차 코딩 결정을 위한 최소 서브밴드 인덱스 값 이상일 것, 즉, 일 것일 수 있다.
미리 설정된 조건은, 서브밴드 인덱스 값이 잔차 코딩 결정을 위한 최대 서브밴드 인덱스 값 이하이고 잔차 코딩 결정을 위한 최소 서브밴드 인덱스 값보다 클 것, 즉, 일 것일 수 있다.
미리 설정된 조건은, 서브밴드 인덱스 값이 잔차 코딩 결정을 위한 최대 서브밴드 인덱스 값보다 작고 잔차 코딩 결정을 위한 최소 서브밴드 인덱스 값 이상일 것, 즉, 일 것일 수 있다.
상이한 코딩 속도 및/또는 상이한 코딩 대역폭에 대해 미리 설정된 조건이 상이하게 설정될 수 있다. 예를 들어, 코딩 대역폭이 광대역이고, 코딩 속도가 26 kbps인 경우, 미리 설정된 조건은, 서브밴드 인덱스 값 일 수 있다. 코딩 대역폭이 광대역이고, 코딩 속도가 44 kbps인 경우, 미리 설정된 조건은, 서브밴드 인덱스 값 일 수 있다. 코딩 대역폭이 광대역이고, 코딩 속도가 56 kbps인 경우, 미리 설정된 조건은, 서브밴드 인덱스 값 일 수 있다.
본 출원의 이 실시예에서, 예를 들어, 코딩 대역폭은 광대역이고, 코딩 속도는 26 kbps이다. 신호의 각각의 프레임은 서브프레임으로 분할되고, 여기서, 이며; 그리고 각각의 서브프레임의 주파수-도메인 신호는 서브밴드로 분할되고, 여기서, 이다. 이 경우, 신호의 각각의 프레임에 대해, 각각의 서브밴드 인덱스가 미리 설정된 조건을 충족하는지 여부가 결정되어야 하고, 미리 설정된 조건은 서브밴드 인덱스 값 이고, 여기서, 이다.
S708. 시간-이동-조정된 좌측 채널 주파수-도메인 신호 및 시간-이동-조정된 우측 채널 주파수-도메인 신호에 기초하여 초기 다운믹스 신호 및 초기 잔차 신호를 계산한다.
예를 들어, 서브밴드 인덱스 값 이고, 인 경우, 다운믹스 신호 및 잔차 신호는 시간-이동-조정된 좌측 채널 주파수-도메인 신호 및 시간-이동-조정된 우측 채널 주파수-도메인 신호에 기초하여 계산된다.
서브프레임 i에서 서브밴드 b의 초기 다운믹스 신호가 로 표시될 수 있고, 서브프레임 i에서 서브밴드 b의 초기 잔차 신호가 로 표시될 수 있다면, 는 다음을 충족한다:
, 여기서,
는 서브프레임 i 내의 서브밴드 b의 IPD 파라미터를 나타내고; 는 서브프레임 i의 서브밴드 사이드 게인을 나타내고; 는 서브프레임 i에서 서브밴드 b의 시간-이동-조정된 좌측 채널 주파수-도메인 신호를 나타내고; 는 서브프레임 i 내의 서브밴드 b의 시간-이동-조정된 우측 채널 주파수-도메인 신호를 나타내고; 는 서브프레임 i에서 서브밴드 b의,복수의 스테레오 파라미터가 조정된 후에 획득되는, 좌측 채널 주파수-도메인 신호를 나타내고; 는 서브프레임 i에서 서브밴드 b의, (IC, ILD, ITD, 및 IPD와 같은) 스테레오 파라미터가 조정된 후에 얻어지는, 우측 채널 주파수-도메인 신호를 나타내고; k는 주파수 빈 인덱스 값을 나타내고, 여기서, 이며, 는 서브밴드 b에 포함된 주파수 빈 의 최소 인덱스 값을 나타내고; 그리고 는 서브프레임 인덱스 값을 나타내며, 여기서 이다.
다른 예로, 서브프레임 i에서 서브밴드 b의 초기 다운믹스 신호는 대안적으로 다음 방법을 사용하여 계산될 수 있다:
, 여기서,
는 서브프레임 i에서 서브밴드 b의,복수의 스테레오 파라미터가 조정된 후에 획득되는, 좌측 채널 주파수-도메인 신호를 나타내고; 는 서브프레임 i에서 서브밴드 b의, 상기 복수의 스테레오 파라미터가 조정된 후에 얻어지는, 우측 채널 주파수-도메인 신호를 나타내고; 는 주파수 빈 인덱스 값을 나타내고, 여기서, 이고, 는 서브밴드 b에 포함된 주파수 빈 의 최소 인덱스 값을 나타내고; 그리고 는 서브프레임 인덱스 값을 나타내며, 여기서 이다. 초기 다운믹스 신호 및 초기 잔차 신호를 계산하는 방법은 본 출원의 이 실시예에서 제한되지 않는다.
S709. 시간-이동-조정된 좌측 채널 주파수-도메인 신호 및 시간-이동-조정된 우측 채널 주파수-도메인 신호에 기초하여 초기 다운믹스 신호를 계산한다.
예를 들어, 서브밴드 인덱스 값이 이고, 이면, 초기 다운믹스 신호는 시간-이동-조정된 좌측 채널 주파수-도메인 신호 및 시간-이동-조정된 우측 채널 주파수-도메인 신호에 기초하여 계산될 수 있다. 미리 설정된 조건을 충족하지 않는 서브밴드의 초기 다운믹스 신호는 미리 설정된 조건을 충족하는 서브밴드의 초기 다운믹스 신호를 계산하는 것과 동일한 방식으로 계산될 수 있거나, 다른 다운믹스 신호 계산 방법을 사용하여 계산될 수 있다.
S710. 현재 프레임의 잔차 코딩 플래그 값 및 현재 프레임의 잔차 코딩 스위칭 플래그 값을 결정한다.
현재 프레임의 잔차 코딩 플래그 값 및 현재 프레임의 잔차 코딩 스위칭 플래그 값은 S620에서의 방법을 사용하여 결정될 수 있다.
선택사항으로서, 현재 프레임의 잔차 코딩 스위칭 플래그 값이 결정될 때, 현재 프레임의 스위치 페이드-인/페이드-아웃 팩터가 업데이트 될 수 있다.
현재 프레임의 스위치 페이드-인/페이드-아웃 팩터 S630에서의 방법을 사용하여 결정될 수 있다.
S711. 현재 프레임의 잔차 코딩 스위칭 플래그 값이 현재 프레임이 스위칭 프레임임을 표시하는지 여부를 판단한다. 현재 프레임의 잔차 코딩 스위칭 플래그 값이 현재 프레임이 스위칭 프레임임을 표시하면, S712, S713, 및 S714를 수행하거나; 또는 현재 프레임의 잔차 코딩 스위칭 플래그 값이 현재 프레임이 스위칭 프레임이 아님을 표시하면, S715를 수행한다.
S712. 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호를 계산한다.
인코딩될 잔차 신호를 계산하는 S712는 필수 단계가 아님을 이해해야 한다. 일반적으로, S707의 판단 결과 미리 설정된 조건이 충족되는 경우, 잔차 신호가 인코딩될 수 있다.
예를 들어, 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호가 현재 프레임의 스위치 페이드-인/페이드-아웃 팩터에 기초하여 계산된다.
예를 들어, 미리 설정된 저주파 대역이 0보다 크고 5보다 작은 서브밴드 인덱스를 가지는 서브밴드인 경우, 현재 프레임의 잔차 코딩 스위칭 플래그 값이 0보다 크면, 서브밴드 인덱스가 0보다 크고 5보다 작은 경우, 구체적으로, 서브밴드 인덱스가 1, 2, 3, 또는 4인 경우, 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호는 현재 프레임의 스위치 페이드-인/페이드-아웃 팩터에 기초하여 계산될 수 있다.
예를 들어, 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 인코딩될 다운믹스 신호는 다음을 충족한다:
, 여기서,
는 서브프레임 i에서 서브밴드 b의 보상된 다운믹스 신호를 나타내고; 는 서브프레임 i에서 서브밴드 b의 초기 다운믹스 신호를 나타내고; 는 서브프레임 i에서 서브밴드 b의 스위칭 프레임의 인코딩될 다운믹스 신호를 나타내고; k는 주파수 빈 인덱스 값을 나타내고, 여기서, 이며, 는 서브밴드 b의 최소 주파수 빈 인덱스 값을 나타내고; 그리고 는 현재 프레임의 스위치 페이드-인/페이드-아웃 팩터를 나타낸다.
예를 들어, 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 인코딩될 잔차 신호는 다음을 충족한다:
, 여기서,
는 서브프레임 i 내의 서브밴드 b의 초기 잔차 신호를 나타내고; 는 서브프레임 i 서브밴드 b의 스위칭 프레임의 인코딩될 잔차 신호를 나타내고; k는 주파수 빈 인덱스 값을 나타내고, 여기서, 이고, 는 서브밴드 b의 최소 주파수 빈 인덱스 값을 나타내고; 그리고 는 현재 프레임의 스위치 페이드-인/페이드-아웃 팩터를 타나낸다.
미리 설정된 주파수 대역은 미리 설정된 저주파 대역일 수 있다. 미리 설정된 저주파 대역의 최소 서브밴드 인덱스 값이 로 표시되고, 미리 설정된 저주파 대역의 최대 서브밴드 인덱스 값이 로 표시되면, 미리 설정된 저주파 대역의 서브밴드 인덱스 b는 를 충족하거나, 또는 미리 설정된 저주파 대역의 서브밴드 인덱스 b는 를 충족하거나, 또는 미리 설정된 저주파 대역의 서브밴드 인덱스 b는 를 충족하거나, 또는 미리 설정된 저주파 대역의 서브밴드 인덱스는 를 충족할 수 있다.
미리 설정된 주파수 대역의 범위는 각각의 서브밴드 인덱스가 미리 설정된 조건을 만족하는지 여부를 판단할 때 설정되는 서브밴드 범위와 동일할 수 있거나, 각각의 서브밴드 인덱스가 미리 설정된 조건을 만족하는지 여부를 판단할 때 설정되는 서브밴드 범위와 상이할 수 있다. 예를 들어, 각각의 서브밴드 인덱스가 미리 설정된 조건을 충족하는지 여부가 판단되는 때에 설정되는 서브밴드 범위의 범위가 b < 5이면, 미리 설정된 저주파 대역은 5보다 작은 서브밴드 인덱스를 가지는 모든 서브밴드를 포함할 수 있거나, 0보다 크고 5보다 작은 서브밴드 인덱스를 가지는 모든 서브 밴드를 포함할 수 있거나, 1보다 크고 7보다 작은 서브밴드 인덱스를 가지는 모든 서브밴드를 포함할 수 있다.
S713. 현재 프레임의 초기 다운믹스 신호를 시간 도메인으로 변환하여 시간-도메인 다운믹스 신호를 획득하고, 시간-도메인 다운믹스 신호를 인코딩한다.
구체적으로, 현재 프레임의 초기 다운믹스 신호가 시간 도메인으로 변환되어 시간-도메인 다운믹스 신호를 획득한 후, 변환을 통해 획득된 시간-도메인 다운믹스 신호가 인코딩되어 다운믹스 신호의 인코딩된 비트스트림이 획득되고, 다운믹스 신호의 인코딩된 비트스트림은 스테레오 인코딩된 비트스트림에 기록된다.
프레임 분할 처리가 신호의 현재 프레임 상에 수행되고, 프레임 분할을 통해 얻어진 각각의 서브프레임 상에 밴드 분할 처리가 수행되면, 각각의 서브프레임의 모든 서브밴드의 다운믹스 신호는 결합되어 서브프레임 i의 다운믹스 신호를 구성해야 하고, 이는 로 표시되고, 여기서, 이다. 서브프레임 i의 다운믹스 신호가 시간 도메인으로 변환되어 역 이산 푸리에 변환을 통해 시간-도메인 다운믹스 신호를 획득하고, 서브프레임 사이의 처리를 위해 중첩-추가 방법이 사용되어, 현재 프레임의 시간-도메인 다운믹스 신호가 획득될 수 있다.
S714. 현재 프레임의 초기 잔차 신호를 시간 도메인으로 변환하여 시간-도메인 잔차 신호를 획득하고, 시간-도메인 잔차 신호를 인코딩한다.
S714는 필수 단계가 아님을 이해해야 한다. 일반적으로, S714는 S712에서 인코딩될 잔차 신호를 계산할 때 수행될 수 있다.
구체적으로, 현재 프레임의 잔차 신호가 시간 도메인으로 변환되어 시간-도메인 잔차 신호가 획득된 후, 변환을 통해 획득된 시간-도메인 잔차 신호가 인코딩되어 잔차 신호의 인코딩된 비트스트림이 획득되고, 잔차 신호의 인코딩된 비트스트림은 스테레오 인코딩된 비트스트림에 기록된다.
프레임 분할 처리가 신호의 현재 프레임 상에 수행되고, 프레임 분할을 통해 얻어지는 각각의 서브프레임 상에 밴드 분할 처리가 수행되면, 각각의 서브프레임의 모든 서브밴드의 잔차 신호는 결합되어 서브프레임 i의 잔차 신호를 구성해야 하고, 이는 로 표시되고, 여기서, 이다. 서브프레임 i의 잔차 신호가 시간 도메인으로 변환되어 역 이산 푸리에 변환을 통해 시간-도메인 잔차 신호를 획득하고, 서브프레임 사이의 처리를 위해 중첩-추가 방법이 사용되어, 현재 프레임의 시간-도메인 잔차 신호가 획득될 수 있다.
S715. 현재 프레임의 잔차 코딩 플래그 값이 조건 1을 충족하는지 여부를 판단한다. 현재 프레임의 잔차 코딩 플래그 값이 조건 1을 충족하면, S716 및 S717가 수행되거나; 또는 현재 프레임의 잔차 코딩 플래그 값이 조건 1을 충족하지 않으면, S718 및 S719가 수행된다.
조건 1은, 잔차 신호를 인코딩할 필요가 없음을 포함할 수 있다. 예를 들어, 현재 프레임의 잔차 코딩 플래그 값이 잔차 신호가 인코딩될 필요가 없음을 표시하는 경우, 조건 1이 충족된다.
예를 들어, 조건 1은, 잔차 신호가 인코딩될 필요가 없음을 나타내는, 비트 값 "0"일 수 있다. 현재 프레임의 잔차 코딩 플래그 값이 "0"이면, 이는 현재 프레임의 잔차 코딩 플래그 값이 조건 1을 충족함을 나타낸다.
S716. 현재 프레임의 수정된 다운믹스 신호를 계산하고, 미리 설정된 주파수 대역에서 현재 프레임의 수정된 다운믹스 신호를 미리 설정된 주파수 대역에서 현재 프레임의 인코딩될 다운믹스 신호로서 결정한다.
현재 프레임의 수정된 다운믹스 신호를 계산하는 것은,
현재 프레임의 초기 다운믹스 신호를 획득하는 단계;
현재 프레임의 다운믹스 보상 팩터를 획득하는 단계; 및
현재 프레임의 수정된 다운믹스 신호를 획득하기 위해, 현재 프레임의 초기 다운믹스 신호를 현재 프레임의 다운믹스 보상 팩터에 기초하여 수정하는 단계;를 포함할 수 있다.
전체 스테레오 인코딩의 경우, 초기 다운믹스 신호가 S716 전에 계산되지 않으면, 초기 다운믹스 신호가 먼저 계산되어야 한다.
예를 들어, 현재 프레임의 초기 다운믹스 신호는 현재 프레임의 좌측 채널 주파수-도메인 신호 및 현재 프레임의 우측 채널 주파수-도메인 신호에 기초하여 계산될 수 있다. 대안적으로, 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 각각의 서브밴드의 초기 다운믹스 신호는 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 좌측 채널 주파수-도메인 신호 및 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 우측 채널 주파수-도메인 신호에 기초하여 계산될 수 있다. 대안적으로, 현재 프레임 내의 각각의 서브프레임의 초기 다운믹스 신호는 현재 프레임 내의 서브프레임의 좌측 채널 주파수-도메인 신호 및 현재 프레임 내의 서브프레임의 우측 채널 주파수-도메인 신호에 기초하여 계산될 수 있다. 대안적으로, 현재 프레임 내의 각각의 서브프레임에서 미리 설정된 주파수 대역에 대응하는 각각의 서브밴드의 초기 다운믹스 신호는 현재 프레임에 있는 서브프레임 내의 미리 설정된 주파수 대역에 대응하는 서브밴드의 좌측 채널 주파수-도메인 신호 및 현재 프레임 내의 서브프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 우측 채널 주파수-도메인 신호에 기초하여 계산될 수 있다.
본 출원의 이 실시예에서, 미리 설정된 주파수 대역의 범위 내의 서브프레임 i에서 서브밴드 b의 초기 다운믹스 신호 는 S707에서 계산되었다. 따라서 여기에서는 계산이 필요하지 않는다. 물론, 미리 설정된 주파수 대역의 범위가 각각의 서브밴드 인덱스가 미리 설정된 조건을 만족하는지 여부가 판단될 때 미리 설정된 조건을 충족하는 서브밴드 범위에 속하지 않는 경우, 미리 설정된 주파수 대역의 범위 내에 있으나 각각의 서브밴드 인덱스가 미리 설정된 조건을 만족하는지 여부가 판단될 때 미리 설정된 조건을 충족하는 서브밴드 범위에 속하지 않는 초기 다운믹스 신호가 계산되어야 한다.
다운믹스 보상 팩터가 단계 S716 이전에 계산되지 않은 경우, 다운믹스 보상 팩터가 먼저 계산되어야 한다.
다운믹스 보상 팩터가 계산되는 경우, 현재 프레임의 다운믹스 보상 팩터는 현재 프레임의 좌측 채널 주파수-도메인 신호 및 현재 프레임의 우측 채널 주파수-도메인 신호에 기초하여 계산될 수 있다. 대안적으로, 현재 프레임 내의 각각의 서브밴드의 다운믹스 보상 팩터는 현재 프레임 내의 서브밴드의 좌측 채널 주파수-도메인 신호 및 현재 프레임 내의 서브밴드의 우측 채널 주파수-도메인 신호에 기초하여 계산될 수 있다. 대안적으로, 현재 프레임에서 미리 설정된 저주파 대역에 대응하는 각각의 서브밴드의 다운믹스 보상 팩터는 현재 프레임 에서 미리 설정된 저주파 대역에 대응하는 서브밴드의 좌측 채널 주파수-도메인 신호 및 현재 프레임 에서 미리 설정된 저주파 대역에 대응하는 서브밴드의 우측 채널 주파수-도메인 신호에 기초하여 계산될 수 있다.
신호의 현재 프레임이 처리를 위해 여러 서브프레임으로 분할되는 경우, 현재 프레임 내의 각각의 서브프레임의 다운믹스 보상 팩터는 현재 프레임 내의 서브프레임의 좌측 채널 주파수-도메인 신호 및 현재 프레임 내의 서브프레임의 우측 채널 주파수-도메인 신호에 기초하여 계산될 수 있다. 대안적으로, 현재 프레임 내의 각각의 서브프레임에서 각각의 서브밴드의 다운믹스 보상 팩터는 현재 프레임에 있는 서브프레임 내의 서브밴드의 좌측 채널 주파수-도메인 신호 및 현재 프레임에 있는 서브프레임 내의 서브밴드의 우측 채널 주파수-도메인 신호에 기초하여 계산될 수 있다. 대안적으로, 현재 프레임 내의 각각의 서브프레임에서 미리 설정된 저주파 대역에 대응하는 각각의 서브밴드의 다운믹스 보상 팩터는 현재 프레임에 있는 서브프레임 내의 미리 설정된 저주파 대역에 대응하는 서브밴드의 좌측 채널 주파수-도메인 신호 및 현재 프레임에 있는 서브프레임 내의 미리 설정된 저주파 대역에 대응하는 서브밴드의 우측 채널 주파수-도메인 신호에 기초하여 계산될 수 있다.
좌측 채널 주파수-도메인 신호는 원래의 좌측 채널 주파수-도메인 신호이거나, 시간-이동-조정된 좌측 채널 주파수-도메인 신호이거나, 또는 복수의 스테레오 파라미터가 조정된 후에 획득되는 좌측 채널 주파수-도메인 신호이 일 수 있다. 이와 유사하게, 우측 채널 주파수-도메인 신호는 원래의 우측 채널 주파수-도메인 신호이거나, 시간-이동-조정된 우측 채널 주파수-도메인 신호이거나, 또는 복수의 스테레오 파라미터가 조정된 후에 획득되는 우측 채널 주파수-도메인 신호일 수 있다.
예를 들어, 현재 프레임은 서브프레임으로 분할되며, 여기서 이다. 각각의 서브프레임은 서브밴드로 분할되며, 여기서 이다. 미리 설정된 저주파 대역이 0보다 크고 5보다 작은 서브밴드 인덱스를 가지는 서브밴드인 경우, 다운믹스 보상 팩터는 미리 설정된 주파수 대역의 범위 내에서 계산될 수 있고, 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 다운믹스 보상 팩터는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 좌측 채널 주파수-도메인 신호 및 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 우측 채널 주파수-도메인 신호에 기초하여 계산된다. 서브프레임 i에서 서브밴드 b의 다운믹스 보상 팩터는 로 표시될 수 있고, 다음을 충족할 수 있다:
, 여기서,
는 서브프레임 i에서 서브밴드 b의 좌측 채널 주파수-도메인 신호의 에너지 합을 나타내고; 는 서브프레임 i에서 서브밴드 b의 우측 채널 주파수-도메인 신호의 에너지 합을 나타내고; 는 서브프레임 i에서 서브밴드 b의 좌측 채널 주파수-도메인 신호 및 우측 채널 주파수-도메인 신호의 에너지 합을 나타내고; 는 서브밴드 b의 최소 주파수 빈 인덱스 값을 나타내고; 는 서브프레임 i에서 서브밴드 b의, 스테레오 파라미터 조정 후에 얻어지는, 좌측 채널 주파수-도메인 신호를 나타내고; 는 서브프레임 i에서 서브밴드 b의, 스테레오 파라미터 조정 후에 얻어지는, 우측 채널 주파수-도메인 신호를 나타낸다. 는 주파수 빈 인덱스 값을 나타내고; 그리고 는 서브프레임 인덱스 값을 나타내며, 여기서 이다.
스테레오 파라미터 조정은, ITD 파라미터에 기초하여 수행되는 시간-이동 조정을 포함하여, 복수의 주파수-도메인 스테레오 파라미터에 대해 조정될 수 있다. ITD 파라미터에 추가적으로, 상기 복수의 주파수-도메인 스테레오 파라미터는 IC, ILD, IPD, 및 서브밴드 사이드 게인과 같은 종래 기술에서의 스테레오 파라미터 중 적어도 하나를 포함할 수 있다.
현재 프레임의 초기 다운믹스 신호가 현재 프레임의 다운믹스 보상 팩터에 기초하여 수정되어 현재 프레임의 수정된 다운믹스 신호가 획득되는 경우, 현재 프레임의 보상된 다운믹스 신호는 현재 프레임의 좌측 채널 주파수-도메인 신호 또는 현재 프레임의 우측 채널 주파수-도메인 신호, 그리고 다운믹스 보상 팩터에 기초하여 계산될 수 있다. 현재 프레임의 수정된 다운믹스 신호는 현재 프레임의 초기 다운믹스 신호 및 현재 프레임의 보상된 다운믹스 신호에 기초하여 계산된다.
현재 프레임의 보상된 다운믹스 신호가 현재 프레임의 좌측 채널 주파수-도메인 신호 또는 현재 프레임의 우측 채널 주파수-도메인 신호, 및 다운믹스 보상 팩터에 기초하여 계산된다는 것은, 현재 프레임의 좌측 채널 주파수-도메인 신호와 다운믹스 보상 팩터의 곱이 현재 프레임의 보상된 다운믹스 신호로서 사용된다는 것, 또는 현재 프레임의 우측 채널 주파수-도메인 신호와 다운믹스 보상 팩터의 곱이 현재 프레임의 보상된 다운믹스 신호로서 사용된다는 것일 수 있다.
현재 프레임의 수정된 다운믹스 신호가 현재 프레임의 초기 다운믹스 신호 및 현재 프레임의 보상된 다운믹스 신호에 기초하여 계산된다는 것은 현재 프레임의 보상된 다운믹스 신호와 현재 프레임의 초기 다운믹스 신호의 합이 현재 프레임의 수정된 다운믹스 신호로서 사용된다는 것일 수 있다.
다운믹스 보상 팩터는 프레임에 의해, 프레임 내의 서브밴드에 의해, 또는 프레임 내의 미리 설정된 주파수 대역에 대응하는 서브밴드에 의해 계산될 수 있거나; 또는 서브프레임에 의해, 서브프레임 내의 서브밴드에 의해, 또는 서브프레임 내의 미리 설정된 주파수 대역에 대응하는 서브밴드에 의해 계산될 수 있다. 이와 유사하게, 보상된 다운믹스 신호를 계산하는 프로세스와 수정된 다운믹스 신호를 계산하는 프로세스도 동일한 방식으로 수행되어야 한다.
이 실시예에서, 서브프레임 i에서 서브밴드 b의 다운믹스 보상 팩터에 기초하여 계산된, 서브프레임 I 내의 서브밴드 b의, 보상된 다운믹스 신호, 그리고 서브프레임 i에서 서브밴드 b의 좌측 채널 주파수-도메인 신호는 다음을 충족할 수 있다:
, 여기서,
는 서브프레임 i에서 서브밴드 b의, 스테레오 파라미터 조정 후에 얻어지는, 좌측 채널 주파수-도메인 신호를 나타내고; k는 주파수 빈 인덱스 값을 나타내고, 여기서, 이고, 는 서브밴드 b의 최소 주파수 빈 인덱스 값을 나타내고; 는 서브프레임 i에서 서브밴드 b의 다운믹스 보상 팩터를 나타내고, 는 서브프레임 i에서 서브밴드 b의 보상된 다운믹스 신호를 나타내고; 그리고 는 서브프레임 인덱스 값을 나타내며, 여기서 이다.
서브프레임 i에서 서브밴드 b의 다운믹스 신호에 기초하여 계산된, 서브프레임 i에서 서브밴드 b의, 수정된 다운믹스 신호, 그리고 서브프레임 i에서 서브밴드 b의 보상된 다운믹스 신호는 다음을 충족한다:
, 여기서,
는 서브프레임 i에서 서브밴드 b의 보상된 다운믹스 신호를 나타내고; 는 서브프레임 i에서 서브밴드 b의 초기 다운믹스 신호를 나타내고; 는 서브프레임 i에서 서브밴드 b의 수정된 다운믹스 신호를 나타내고; k는 주파수 빈 인덱스 값을 나타내고, 여기서, 이고, 는 서브밴드 b의 최소 주파수 빈 인덱스 값을 나타내고; 그리고 는 서브프레임 인덱스 값을 나타내며, 여기서 이다.
S717. 현재 프레임의 수정된 다운믹스 신호를 시간 도메인으로 변환하여 시간-도메인 다운믹스 신호를 획득하고, 시간-도메인 다운믹스 신호를 인코딩한다. 이 단계에 관해, S713를 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S718. 현재 프레임의 초기 다운믹스 신호를 시간 도메인으로 변환하여 시간-도메인 다운믹스 신호를 획득하고, 시간-도메인 다운믹스 신호를 인코딩한다. 이 단계에 관해, S713를 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S719. 현재 프레임의 초기 잔차 신호를 시간 도메인으로 변환하여 시간-도메인 잔차 신호를 획득하고, 시간-도메인 잔차 신호를 인코딩한다. 변환 방법에 관해, S714를 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S719는 필수 단계가 아님을 이해해야 한다. 일반적으로, S707의 판단 결과 미리 설정된 조건이 충족되는 경우, S719가 수행된다.
도 8a 및 도 8b는 다음 예를 사용하여 본 출원의 실시예에 따른 스테레오 신호 인코딩 방법의 개략적인 흐름도이다. 제1 타깃 프레임 및 제2 타깃 프레임 모두 현재 프레임의 이전 프레임이고; 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 제2 타깃 프레임의 잔차 신호에 대한 제2 타깃 프레임의 다운믹스 신호의 에너지 비율을 나타내는데 사용되고; 그리고 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지에 대한 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지의 비율을 나타내는데 사용된다. 방법은 인코더에 의해 수행되거나 스테레오 신호 인코딩 기능을 가지는 디바이스에 의해 수행될 수 있다. 방법은 S801 내지 S819를 포함할 수 있다.
S801 내지 S809에 관해, S701 내지 S709를 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S810. 현재 프레임의 잔차 코딩 플래그 값을 결정한다.
현재 프레임의 잔차 코딩 플래그 값을 결정하는 방법에 관해, S710에서 현재 프레임의 잔차 코딩 플래그 값을 결정하는 방법을 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S811. 현재 프레임의 이전 프레임의 잔차 코딩 플래그 값이 이전 프레임의 이전 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같은지 여부를 판단한다. 현재 프레임의 이전 프레임의 잔차 코딩 플래그 값이 이전 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같으면, S812, S813, 및 S814가 수행되거나; 또는 현재 프레임의 이전 프레임의 잔차 코딩 플래그 값이 이전 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않으면, S815가 수행된다.
이전 프레임의 잔차 코딩 플래그 값은 로 표시될 수 있다. 본 출원의 이 실시예에서, 예를 들어, 이 1과 같으면, 이는 이전 프레임의 잔차 신호가 인코딩되어야 함을 표시할 수 있거나; 또는 이 0과 같으면, 이는 이전 프레임의 잔차 신호가 인코딩될 필요가 없음을 표시한다.
이전 프레임의 이전 프레임의 잔차 코딩 플래그 값은 로 표시될 수 있다. 본 출원의 이 실시예에서, 예를 들어, 이 1과 같은 경우, 이는 이전 프레임의 이전 프레임의 잔차 신호가 인코딩되어야 함을 표시할 수 있거나; 또는 이 0과 같으면, 이는 이전 프레임의 이전 프레임의 잔차 신호가 인코딩될 필요가 없음을 표시한다.
S812 내지 S814에 관해, S712 내지 S714를 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S815. 이전 프레임의 잔차 코딩 플래그 값이 조건 1을 충족하는지 여부를 판단한다. 이전 프레임의 잔차 코딩 플래그 값이 조건 1을 충족하면, S816 및 S817가 수행되거나; 또는 이전 프레임의 잔차 코딩 플래그 값이 조건 1을 충족하지 않으면, S818 및 S819가 수행된다.
S816 내지 S819에 관해, S716 내지 S719를 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
잔차 코딩 스위칭 플래그 값 및 잔차 코딩 플래그의 수정 플래그 값과 같은 개념은 도 8a 및 도 8b에 도시된 방법에 사용되지 않을 수 있음을 이해해야 한다. 따라서, 도 8에서의 단계를 참조하면, 이러한 개념에 관련된 계산 과정은 무시될 수 있다.
도 9a 및 도 9b는 다음 예를 사용하여 본 출원의 다른 실시예에 따른 스테레오 신호 인코딩 방법의 개략적인 흐름도이다. 제1 타깃 프레임 및 제2 타깃 프레임은 모두 현재 프레임이고; 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 제2 타깃 프레임의 잔차 신호에 대한 제2 타깃 프레임의 다운믹스 신호의 에너지 비율을 나타내는데 사용되고; 그리고 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지에 대한 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지의 비율을 나타내는데 사용된다. 방법은 인코더에 의해 수행되거나 스테레오 신호 인코딩 기능을 가지는 디바이스에 의해 수행될 수 있다. 이 방법은 S901 내지 S919를 포함할 수 있다.
S901 내지 S910에 관해, S801 내지 S810를 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S911. 현재 프레임의 잔차 코딩 플래그 값이 현재 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같은지 여부를 판단한다. 현재 프레임의 잔차 코딩 플래그 값이 현재 프레임의 잔차 코딩 플래그 값과 같으면, S912, S913, 및 S914가 수행되거나; 또는 현재 프레임의 잔차 코딩 플래그 값이 현재 프레임의 잔차 코딩 플래그 값과 같지 않으면, S915가 수행된다.
이전 프레임의 잔차 코딩 플래그 값은 로 표시될 수 있다. 본 출원의 이 실시예에서, 예를 들어, 이 1과 같으면, 이는 이전 프레임의 잔차 신호가 인코딩되어야 함을 나타낼 수 있거나; 또는 이 0과 같으면, 이는 이전 프레임의 잔차 신호가 인코딩될 필요가 없음을 나타낸다.
현재 프레임의 잔차 코딩 플래그 값은 로 표시될 수 있다. 본 출원의 이 실시예에서, 예를 들어, 이 1과 같으면, 이는 현재 프레임의 잔차 신호가 인코딩되어야 함을 표시할 수 있거나; 또는 이 0과 같으면, 이는 현재 프레임의 잔차 신호가 인코딩될 필요가 없음을 표시한다.
S912 내지 S914에 관해, S712 내지 S714를 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S915. 현재 프레임의 잔차 코딩 플래그 값이 조건 1을 충족하는지 여부를 판단한다. 현재 프레임의 잔차 코딩 플래그 값이 조건 1을 충족하면, S916 및 S917가 수행되거나; 또는 현재 프레임의 잔차 코딩 플래그 값이 조건 1을 충족하지 않으면, S918 및 S919가 수행된다.
S916 내지 S919에 관해, S716 내지 S719를 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
잔차 코딩 스위칭 플래그 값 및 잔차 코딩 플래그의 수정 플래그 값과 같은 개념은 도 9a 및 도 9b에 도시된 방법에 사용되지 않을 수 있음을 이해해야 한다. 따라서, 도 7a 및 도 7b에서의 단계를 참조하면, 이러한 개념에 관련된 계산 과정은 무시될 수 있다.
도 10a 및 도 10b는 다음 예를 사용하여 본 출원의 실시예에 따른 스테레오 신호 인코딩 방법의 개략적인 흐름도이다. 제1 타깃 프레임 및 제2 타깃 프레임은 모두 현재 프레임의 이전 프레임이고; 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 제2 타깃 프레임의 잔차 신호에 대한 제2 타깃 프레임의 다운믹스 신호의 에너지 비율을 나타내는데 사용되고; 그리고 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지에 대한 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지의 비율을 나타내는데 사용된다. 방법은 인코더에 의해 수행되거나 스테레오 신호 인코딩 기능을 가지는 디바이스에 의해 수행될 수 있다. 방법은 S1001 내지 S1016을 포함할 수 있다.
S1001 내지 S1009에 관해, S701 내지 S709를 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S1010. 현재 프레임의 잔차 코딩 플래그 값을 결정한다. 이 단계에 관해, S710에서의 관련 내용을 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S1011. 이전 프레임의 잔차 코딩 스위칭 플래그 값이 이전 프레임이 스위칭 프레임임을 표시하는지 여부를 판단한다. 이전 프레임의 잔차 코딩 스위칭 플래그 값이 이전 프레임이 스위칭 프레임을 표시하면, S1012가 수행되거나; 또는 이전 프레임의 잔차 코딩 스위칭 플래그 값이 이전 프레임이 스위칭 프레임이 아님을 표시하면, S1013가 수행된다.
S1012에 관해, S712를 참조한다. 예를 들어, 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 인코딩될 다운믹스 신호는 다음을 충족한다:
, 여기서,
는 서브프레임 i에서 서브밴드 b의 보상된 다운믹스 신호를 나타내고; 는 서브프레임 i에서 서브밴드 b의 초기 다운믹스 신호를 나타내고; 는 서브프레임 i에서 서브밴드 b의 스위칭 프레임의 인코딩될 다운믹스 신호를 나타내고; k는 주파수 빈 인덱스 값을 나타내고, 여기서, 이며, 여기서, 는 서브밴드 b의 최소 주파수 빈 인덱스 값을 나타내고; 그리고 는 이전 프레임의 스위치 페이드-인/페이드-아웃 팩터를 나타낸다.
예를 들어, 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 인코딩될 잔차 신호는,
를 충족하며, 여기서,
는 서브프레임 i 내의 서브밴드 b의 초기 잔차 신호를 나타내고; 는 서브프레임 i 서브밴드 b의 스위칭 프레임의 인코딩될 잔차 신호를 나타내고; k는 주파수 빈 인덱스 값을 나타내고; 이며, 여기서 는 서브밴드 b의 최소 주파수 빈 인덱스 값을 나타내고; 그리고 는 이전 프레임의 스위치 페이드-인/페이드-아웃 팩터를 나타낸다.
예를 들어, 이고, 이다.
S1013. 이전 프레임의 잔차 코딩 플래그 값이 조건 1을 충족하는 경우, 현재 프레임의 수정된 다운믹스 신호를 계산하고, 수정된 다운믹스 신호를 미리 설정된 저주파 대역에 대응하는 서브밴드의 다운믹스 신호로서 사용한다.
조건 1은 이전 프레임의 잔차 코딩 플래그 값이 이전 프레임의 잔차 신호가 인코딩될 필요가 없음을 표시하는 것을 포함할 수 있다.
예를 들어, 이전 프레임의 잔차 코딩 플래그이 인 경우, 이전 프레임의 잔차 코딩 플래그 값이 조건 1을 충족한다는 것은 이 0과 같다는 것과 동등할 수 있다.
미리 설정된 주파수 대역에 대응하는 서브밴드 및 현재 프레임의 수정된 다운믹스 신호를 계산하는 관련 내용은, S713를 참조하고, 세부 사항은 여기에 다시 설명하지 않는다.
S1014. 현재 프레임의 잔차 코딩 스위칭 플래그 값을 결정한다. 이 단계에 관해, S710에서의 관련 내용을 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S1015에 관해, S713를 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S1016. 이전 프레임의 잔차 코딩 플래그 값이 조건 2을 충족하면, 현재 프레임의 잔차 신호를 시간 도메인으로 변환하여 시간-도메인 잔차 신호를 획득하고, 시간-도메인 잔차 신호를 대응하는 인코딩 방법을 사용하여 인코딩한다.
예를 들어, 조건 2는 잔차 신호를 인코딩하는 것이다. 이전 프레임의 잔차 코딩 플래그 값이 잔차 신호가 인코딩될 것임을 표시하면, 현재 프레임의 잔차 신호를 시간 도메인으로 변환하여 시간-도메인 잔차 신호를 획득하고, 시간-도메인 잔차 신호는 대응하는 인코딩 방법을 사용하여 인코딩된다.
프레임 분할 처리가 신호의 각각의 프레임 상에 수행되고, 밴드 분할 처리가 각각의 서브프레임 상에 수행되면, 각각의 서브프레임의 모든 서브밴드의 잔차 신호가 결합되어 서브프레임 i의 잔차 신호를 구성할 수 있다.
서브프레임 i의 잔차 신호가 시간 도메인으로 변환되어 역 이산 푸리에 변환을 통해 시간-도메인 잔차 신호를 획득 하고, 서브프레임 사이의 처리를 위해 중첩-추가 방법이 사용되어, 현재 프레임의 시간-도메인 잔차 신호가 획득된다.
현재 프레임의 시간-도메인 잔차 신호는 종래 기술을 사용하여 인코딩되어 잔차 신호 인코딩된 비트스트림을 획득할 수 있고, 잔차 신호 인코딩된 비트스트림은 스테레오 인코딩된 비트스트림에 기록된다.
도 11a 및 도 11b는 다음 예를 사용하여 본 출원의 다른 실시예에 따른 스테레오 신호 인코딩 방법의 개략적인 흐름도이다. 제1 타깃 프레임 및 제2 타깃 프레임은 모두 현재 프레임의 이전 프레임이고; 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 제2 타깃 프레임의 잔차 신호에 대한 제2 타깃 프레임의 다운믹스 신호의 에너지 비율을 나타내는데 사용되고; 그리고 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지에 대한 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지의 비율을 나타내는데 사용된다. 방법은 인코더에 의해 수행되거나 스테레오 신호 인코딩 기능을 가지는 디바이스에 의해 수행될 수 있다. 방법은 S1101 내지 S1116을 포함할 수 있다.
S1101 내지 S1109에 관해, S1001 내지 S1009를 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S1110. 현재 프레임의 잔차 신호 코딩 파라미터 및 현재 프레임의 프레임 간 에너지 변동 파라미터를 계산한다.
현재 프레임의 잔차 신호 코딩 파라미터 및 현재 프레임의 프레임 간 에너지 변동 파라미터를 계산하는 방법에 관해, S620를 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S1111. 이전 프레임의 잔차 코딩 스위칭 플래그 값이 이전 프레임이 스위칭 프레임임을 표시하는지 여부를 판단한다. 이전 프레임의 잔차 코딩 스위칭 플래그 값이 이전 프레임이 스위칭 프레임을 표시하면, S1112가 수행되거나; 또는 이전 프레임의 잔차 코딩 스위칭 플래그 값이 이전 프레임이 스위칭 프레임이 아님을 표시하면, S1113가 수행된다.
S1112 및 S1113에 관해 S1012 및 S1013을 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
S1114 내지 S1116에 관해, S1014 내지 S1016을 참조한다. 세부 사항은 여기에 다시 설명하지 않는다.
도 12는 본 출원의 실시예에 따른 다운믹스 신호 및 잔차 신호를 계산하는 장치의 개략적인 구조도이다. 도 12에 도시된 장치(1200)는 예시일 뿐이라는 점을 이해해야 한다.
다운믹스 신호 및 잔차 신호를 계산하는 장치(1200)는 획득 모듈(1210), 결정 모듈(1220), 및 계산 모듈(1230)을 포함할 수 있다.
일부 구현예에서, 획득 모듈(1210), 결정 모듈(1220), 및 계산 모듈(1230)은 모두 모바일 단말(130)의 인코딩 콤포넌트(110) 내에 포함될 수 있다.
일부 다른 구현예로서, 획득 모듈(1210)은 모바일 단말(130)의 수집 콤포넌트(131)일 수 있고, 결정 모듈(1220) 및 계산 모듈(1230)은 모바일 단말(130)의 인코딩 콤포넌트(110)에 포함될 수 있다.
획득 모듈(1210)는 오디오 신호의 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 초기 다운믹스 신호 및 초기 잔차 신호를 획득하도록 구성되며, 여기서, 오디오 신호는 스테레오 신호이다.
결정 모듈(1220)는 오디오 신호의 제1 타깃 프레임이 스위칭 프레임인지 여부를 판단하도록 구성되며, 여기서, 제1 타깃 프레임은 현재 프레임 또는 현재 프레임의 이전 프레임이다.
계산 모듈(1230)은, 제1 타깃 프레임이 스위칭 프레임인 경우, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터, 초기 다운믹스 신호, 및 초기 잔차 신호에 기초하여, 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호를 계산하도록 구성되며, 여기서, 제2 타깃 프레임은 현재 프레임 또는 현재 프레임의 이전 프레임이고, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 제2 타깃 프레임의 잔차 신호 코딩 파라미터 및 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터 중 적어도 하나에 기초하여 결정되고; 그리고 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 제2 타깃 프레임의 다운믹스 신호와 잔차 신호 사이의 에너지 관계를 나타내는데 사용되고, 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 신호와 제2 타깃 프레임 이전 M 프레임의 신호 사이의 에너지 또는 진폭 관계를 나타내는데 사용되고, 여기서 M은 양의 정수이다.
가능한 일부 구현예로서, 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 제2 타깃 프레임의 다운믹스 신호와 제2 타깃 프레임의 잔차 신호 사이의 에너지 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 잔차 신호 코딩 파라미터는 제2 타깃 프레임의 다운믹스 신호와 제2 타깃 프레임의 잔차 신호 사이의 에너지 차이를 나타내는데 사용되거나; 또는
제2 타깃 프레임의 잔차 신호 코딩 파라미터는 제2 타깃 프레임의 다운믹스 신호와 제2 타깃 프레임의 잔차 신호 사이의 로그 에너지 차이를 나타내는데 사용된다.
가능한 일부 구현예로서, 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지에 대한 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지의 비율을 나타내는데 사용되거나, 또는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지의 로그와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지의 로그 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지에 대한 제2 타깃 프레임의 다운믹스 신호의 에너지의 비율을 나타내는데 사용되거나, 또는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 에너지와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 에너지의 로그와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지의 로그 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지에 대한 제2 타깃 프레임의 잔차 신호의 에너지의 비율을 나타내는데 사용되거나, 또는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 잔차 신호의 에너지와 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지 사이의 차이를 나타내는데 사용되거나; 또는
제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 잔차 신호의 에너지의 로그와 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지의 로그 사이의 차이를 나타내는데 사용된다.
가능한 일부 구현예로서, 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합에 대한 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 잔차 신호의 진폭 합의 합의 비율을 나타내는데 사용되거나, 또는 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 잔차 신호의 진폭 합의 합과 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 잔차 신호의 진폭 합의 합의 로그 및 제2 타깃 프레임의 잔차 신호 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합의 로그 및 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합의 로그 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합에 대한 제2 타깃 프레임의 다운믹스 신호의 진폭 합의 비율을 나타내는데 사용되거나, 또는 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 진폭 합과 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 진폭 합의 로그와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합의 로그 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합에 대한 제2 타깃 프레임의 잔차 신호의 진폭 합의 비율을 나타내는데 사용되거나, 또는 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 잔차 신호의 진폭 합과 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합 사이의 차이를 나타내는데 사용되거나; 또는
제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 잔차 신호의 진폭 합의 로그와 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 로그 사이의 차이를 나타내는데 사용된다.
가능한 일부 구현예로서, 계산 모듈은 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터를 다음 방식으로 계산하도록 구성된다:
인 경우, ;
인 경우, ; 또는
다른 경우, ; 여기서,
는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터를 나타내고; 는 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터의 미리 설정된 제1 임계를 나타내고; 는 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터의 미리 설정된 제2 임계를 나타내고; 는 제2 타깃 프레임의 잔차 신호 코딩 파라미터를 나타내고; 는 잔차 신호 코딩 파라미터의 미리 설정된 제1 임계를 나타내고; 는 잔차 신호 코딩 파라미터의 미리 설정된 제2 임계를 나타내고; 는 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 그리고 , , 및 는 미리 설정된 값을 나타내고; 그리고
, , 및 이다.
선택사항으로서, 이다.
선택사항으로서, = 0.75이다.
선택사항으로서, = 0.25이다.
가능한 일부 구현예로서, 계산 모듈은 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터를 다음 방식으로 계산하도록 구성된다:
인 경우, ;
인 경우, ; 또는
다른 경우, ; 여기서,
는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터를 나타내고; 는 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터의 제1 임계를 나타내고; 는 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터의 미리 설정된 제2 임계를 나타내고; 는 제2 타깃 프레임의 잔차 신호 코딩 파라미터를 나타내고; 는 잔차 신호 코딩 파라미터의 미리 설정된 제1 임계를 나타내고; 는 잔차 신호 코딩 파라미터의 미리 설정된 제2 임계를 나타내고; 는 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 그리고 , , 및 는 미리 설정된 값을 나타내고; 그리고
, , 및 이다.
선택사항으로서, 이다.
선택사항으로서, = 0.75이다.
선택사항으로서, = 0.25이다.
가능한 일부 구현예로서, 계산 모듈은,
공식 에 따라서, 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호를 계산하도록; 그리고
공식 에 따라서, 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 잔차 신호를 계산하도록; 구체적으로 구성되고, 여기서,
는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 인코딩될 다운믹스 신호를 나타내고; 는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 초기 다운믹스 신호를 나타내고; 는 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 보상된 다운믹스 신호를 나타내고; 는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 초기 잔차 신호를 나타내고; 는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 인코딩될 잔차 신호를 나타내고; 현재 프레임 내의 서브프레임에서 서브밴드 b는 미리 설정된 주파수 대역에 대응하는 적어도 하나의 서브밴드 내의 서브밴드이고; k는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 주파수 빈 인덱스를 나타내고; 그리고 이며, 여기서 는 현재 프레임에 포함된 서브프레임의 수량을 나타낸다.
선택사항으로서, , , , 또는 이며, 여기서, Th1은 미리 설정된 주파수 대역에 대응하는 서브밴드에서 가장 작은 인덱스 값을 가지는 서브밴드의 인덱스 값을 나타내고, Th2는 미리 설정된 주파수 대역에 대응하는 서브밴드에서 가장 큰 인덱스 값을 가지는 서브밴드의 인덱스 값을 나타내고, 이며, 여기서, M은 미리 설정된 주파수 대역에 대응하는 서브밴드의 수량을 나타내고, 이다.
가능한 일부 구현예로서, 결정 모듈은,
제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값, 제1 타깃 프레임이 스위칭 프레임인지 여부를 판단하도록, 구체적으로 구성된다.
선택사항으로서, 제1 타깃 프레임의 잔차 코딩 플래그 값이 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않은 경우, 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임이 스위칭 프레임을 표시하거나;
제1 타깃 프레임의 잔차 코딩 플래그 값이 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않고, 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그의 수정 플래그 값이 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값이 수정되지 않았음을 표시하는 경우, 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임이 스위칭 프레임을 표시하거나; 또는
제1 타깃 프레임의 잔차 코딩 플래그 값이 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않고, 제1 타깃 프레임의 이전 프레임의 잔차 코딩 스위칭 플래그가 제1 타깃 프레임의 이전 프레임이 스위칭 프레임임을 표시하는 경우, 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임이 스위칭 프레임을 표시하며; 여기서,
제1 타깃 프레임의 잔차 코딩 플래그 값은 제1 타깃 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용되고, 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값은 제1 타깃 프레임의 이전 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용된다.
가능한 일부 구현예로서, 결정 모듈은,
제1 타깃 프레임의 잔차 코딩 플래그 값이 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않은 경우, 제1 타깃 프레임이 스위칭 프레임임을 결정하도록 구체적으로 구성되며, 여기서,
제1 타깃 프레임의 잔차 코딩 플래그 값은 제1 타깃 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용되고, 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값은 제1 타깃 프레임의 이전 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용된다.
도 13은 본 출원의 실시예에 따른 다운믹스 신호 및 잔차 신호를 계산하는 장치의 개략적인 구조도이다. 도 13 도시된 장치(1300)는 단지 예시일뿐이라는 것을 이해해야 한다.
메모리(1310)는 프로그램을 저장하도록 구성된다.
프로세서(1320)는 메모리(1310)에 저장된 프로그램을 실행하도록 구성되며, 여기서 메모리에 저장된 프로그램을 실행하는 경우, 프로세서(1320)는,
오디오 신호의 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 초기 다운믹스 신호 및 초기 잔차 신호를 획득하도록-여기서, 오디오 신호는 스테레오 신호임-;
오디오 신호의 제1 타깃 프레임이 스위칭 프레임인지 여부를 판단하도록-여기서, 제1 타깃 프레임은 현재 프레임 또는 현재 프레임의 이전 프레임임-; 그리고
제1 타깃 프레임이 스위칭 프레임인 경우, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터, 초기 다운믹스 신호 및 초기 잔차 신호에 기초하여, 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호를 계산하도록-여기서, 제2 타깃 프레임은 제1 타깃 프레임의 이전 프레임 또는 현재 프레임이고, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 제2 타깃 프레임의 잔차 신호 코딩 파라미터 및 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터 중 적어도 하나에 기초하여 결정되고; 그리고 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 제2 타깃 프레임의 다운믹스 신호와 잔차 신호 사이의 에너지 관계를 나타내는데 사용되고, 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 신호와 제2 타깃 프레임 이전 M 프레임의 신호 사이의 에너지 또는 진폭 관계를 나타내는데 사용되고, 여기서 M은 양의 정수임-; 구체적으로 구성된다.
선택사항으로서, 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 제2 타깃 프레임의 잔차 신호에 대한 제2 타깃 프레임의 다운믹스 신호의 에너지 비율을 나타내는데 사용되거나;
제2 타깃 프레임의 잔차 신호 코딩 파라미터는 제2 타깃 프레임의 다운믹스 신호와 제2 타깃 프레임의 잔차 신호 사이의 에너지 차이를 나타내는데 사용되거나; 또는
제2 타깃 프레임의 잔차 신호 코딩 파라미터는 제2 타깃 프레임의 다운믹스 신호와 제2 타깃 프레임의 잔차 신호 사이의 로그 에너지 차이를 나타내는데 사용된다.
제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지에 대한 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지의 비율을 나타내는데 사용되거나, 또는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호 및 제2 타깃 프레임의 잔차 신호의 총 에너지의 로그와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지의 로그 사이의 차이를 나타내는데 사용될 수 있거나;
제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지에 대한 제2 타깃 프레임의 다운믹스 신호의 에너지의 비율을 나타내는데 사용되거나, 또는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 에너지와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 에너지의 로그와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지의 로그 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지에 대한 제2 타깃 프레임의 잔차 신호의 에너지의 비율을 나타내는데 사용되거나, 또는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 잔차 신호의 에너지와 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지 사이의 차이를 나타내는데 사용되거나; 또는
제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 제2 타깃 프레임의 잔차 신호의 에너지의 로그와 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지의 로그 사이의 차이를 나타내는데 사용된다.
선택사항으로서, 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합에 대한 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 잔차 신호의 진폭 합의 합의 비율을 나타내는데 사용되거나, 또는 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 잔차 신호의 진폭 합의 합과 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 잔차 신호의 진폭 합의 합의 로그와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합의 로그 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합에 대한 제2 타깃 프레임의 다운믹스 신호의 진폭 합의 비율을 나타내는데 사용되거나, 또는 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 진폭 합과 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 다운믹스 신호의 진폭 합의 로그와 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합의 로그 사이의 차이를 나타내는데 사용되거나;
제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합에 대한 제2 타깃 프레임의 잔차 신호의 진폭 합의 비율을 나타내는데 사용되거나, 또는 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 잔차 신호의 진폭 합과 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합 사이의 차이를 나타내는데 사용되거나; 또는
제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 제2 타깃 프레임의 잔차 신호의 진폭 합의 로그와 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 로그 사이의 차이를 나타내는데 사용된다.
선택사항으로서, 프로세서는 스위치 페이드-인/페이드-아웃 팩터를 다음 방식으로 결정하도록 구성된다:
인 경우, ;
인 경우, ; 또는
다른 경우, ; 여기서,
는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터를 나타내고; 는 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터의 미리 설정된 제1 임계를 나타내고; 는 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터의 제2 임계를 나타내고; 는 제2 타깃 프레임의 잔차 신호 코딩 파라미터를 나타내고; 는 잔차 신호 코딩 파라미터의 미리 설정된 제1 임계를 나타내고; 는 잔차 신호 코딩 파라미터의 미리 설정된 제2 임계를 나타내고; 는 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 그리고 , , 및 는 미리 설정된 값을 나타내고; 그리고
, , 및 이다.
선택사항으로서, 프로세서는 스위치 페이드-인/페이드-아웃 팩터를 다음 방식으로 결정하도록 구성된다:
인 경우, ;
인 경우, ; 또는
다른 경우, ; 여기서,
는 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터를 나타내고; 는 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터의 미리 설정된 제1 임계를 나타내고; 는 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터의 미리 설정된 제2 임계를 나타내고; 는 제2 타깃 프레임의 잔차 신호 코딩 파라미터를 나타내고; 는 잔차 신호 코딩 파라미터의 미리 설정된 제1 임계를 나타내고; 는 잔차 신호 코딩 파라미터의 미리 설정된 제2 임계를 나타내고; 는 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 그리고 , , 및 는 스위치 페이드-인/페이드-아웃 팩터의 미리 설정된 값을 나타내고; 그리고
, , 및 이다.
선택사항으로서, 이다.
선택사항으로서, = 0.75이다.
선택사항으로서, = 0.25이다.
선택사항으로서, 프로세서는,
인코딩될 다운믹스 신호를 공식 에 따라 계산하도록; 그리고
인코딩될 잔차 신호를 공식 에 따라 계산하도록; 구성되며, 여기서,
는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 인코딩될 다운믹스 신호를 나타내고; 는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 초기 다운믹스 신호를 나타내고; 는 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 보상된 다운믹스 신호를 나타내고; 는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 초기 잔차 신호를 나타내고; 는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 인코딩될 잔차 신호를 나타내고; 현재 프레임 내의 서브프레임에서 서브밴드 b는 미리 설정된 주파수 대역에 대응하는 적어도 하나의 서브밴드 내의 서브밴드이고; k는 현재 프레임 내의 서브프레임 i에서 서브밴드 b의 주파수 빈 인덱스를 나타내고; 그리고 이며, 여기서 는 현재 프레임에 포함된 서브프레임의 수량을 나타낸다.
선택사항으로서, , , , 또는 이며, 여기서, Th1은 미리 설정된 주파수 대역에 대응하는 서브밴드에서 가장 작은 인덱스 값을 가지는 서브밴드의 인덱스 값을 나타내고, Th2는 미리 설정된 주파수 대역에 대응하는 서브밴드에서 가장 큰 인덱스 값을 가지는 서브밴드의 인덱스 값을 나타내고, 이고, 여기서, M은 미리 설정된 주파수 대역에 대응하는 서브밴드의 수량을 나타내고, 이다.
선택사항으로서, 프로세서는, 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값에 기초하여, 제1 타깃 프레임이 스위칭 프레임인지 여부를 판단하도록 구성된다.
선택사항으로서, 제1 타깃 프레임의 잔차 코딩 플래그 값이 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않은 경우, 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임이 스위칭 프레임을 표시하거나;
제1 타깃 프레임의 잔차 코딩 플래그 값이 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않고, 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그의 수정 플래그 값이 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값이 수정되지 않았음을 표시하는 경우, 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임이 스위칭 프레임을 표시하거나; 또는
제1 타깃 프레임의 잔차 코딩 플래그 값이 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않고, 제1 타깃 프레임의 이전 프레임의 잔차 코딩 스위칭 플래그가 제1 타깃 프레임의 이전 프레임이 스위칭 프레임임을 표시하는 경우, 제1 타깃 프레임의 잔차 코딩 스위칭 플래그 값은 제1 타깃 프레임이 스위칭 프레임을 표시하며; 여기서,
제1 타깃 프레임의 잔차 코딩 플래그 값은 제1 타깃 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용되고, 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값은 제1 타깃 프레임의 이전 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용된다.
선택사항으로서, 프로세서는, 제1 타깃 프레임의 잔차 코딩 플래그 값이 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값과 같지 않은 경우, 제1 타깃 프레임이 스위칭 프레임임을 결정하도록 구성되며, 여기서,
제1 타깃 프레임의 잔차 코딩 플래그 값은 제1 타깃 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용되고, 제1 타깃 프레임의 이전 프레임의 잔차 코딩 플래그 값은 제1 타깃 프레임의 이전 프레임의 잔차 신호가 인코딩되어야 하는지 여부를 표시하는데 사용된다.
다운믹스 신호 및 잔차 신호를 계산하는 장치(1300)는 도 6에 도시된 방법에서의 단계를 수행하도록 구성될 수 있다. 간결함을 위해 세부 사항은 여기에 다시 설명하지 않는다.
통상의 기술자는, 본 명세서에 개시된 실시예들에서 설명되는 예들과 조합하여, 유닛 및 알고리즘 단계가 전자 하드웨어 또는 컴퓨터 소프트웨어와 전자 하드웨어의 조합에 의해 구현될 수 있음을 인식할 수 있다. 기능이 하드웨어 또는 소프트웨어에 의해 수행되는지 여부는, 기술적 해결 수단에 대한 특정 응용 및 설계 제약 조건에 따라 다르다. 통상의 기술자는 각각의 특정 애플리케이션에 대해 설명된 기능을 구현하기 위해 상이한 방식을 사용할 수 있지만, 이러한 구현이 본 출원의 범위를 넘어서는 것으로 간주되어서는 안된다.
설명의 용이함 및 간결함을 위해, 전술한 시스템, 장치 및 유닛에 대한 상세한 작업 프로세스에 대해서는, 전술한 방법 실시 예들에서 대응하는 프로세스를 참조할 수 있음은, 통상의 기술자자에 의해 명확하게 이해될 수 있으며, 세부 내용에 대해서는 여기에서 다시 설명되지 않는다.
본 출원에서 제공되는 여러 실시 예들에서, 개시된 시스템, 장치 및 방법은 다른 방식으로 구현될 수 있음을 이해해야 한다. 예를 들어, 설명된 장치 실시예는 단지 예시일 뿐이다. 예를 들어, 유닛 분할은 단지 논리적 기능 분할일 뿐이며 실제 구현에서는 다른 분할일 수 있다. 예를 들어, 복수의 유닛 또는 구성 요소가 다른 시스템에 결합되거나 통합될 수 있거나, 일부 특징이 생략되거나 수행되지 않을 수 있다. 또한, 디스플레이되거나 논의되는 상호 결합 또는 직접 결합 또는 통신 연결은 일부 인터페이스를 통해 구현될 수 있다. 장치 또는 유닛 사이의 간접 결합 또는 통신 연결은 전자적, 기계적 또는 다른 형태로 구현될 수 있다.
별도의 부분으로 기술되는 유닛은 물리적으로 분리될 수 있거나 물리적으로 분리되지 않을 수 있고, 유닛으로서 디스플레이되는 부분은 물리적 유닛일 수 있거나 아닐 수 있거나, 한 지점에 위치할 수 있거나, 복수의 네트워크 유닛 상에 분산될 수 있다. 유닛들의 일부 또는 전부는 실시 예들의 해결 방안들의 목적을 달성하기 위해 실제 요구 사항에 따라 선택될 수 있다.
또한, 본 출원의 실시예에서 기능 유닛은 하나의 프로세싱 유닛으로 통합될 수 있거나, 각각의 유닛은 물리적으로 단독으로 존재할 수 있거나, 둘 이상의 유닛이 하나의 유닛으로 통합될 수 있다.
기능이 소프트웨어 기능 유닛의 형태로 구현되어 독립적인 제품으로서 판매 또는 사용되는 경우, 기능들은 컴퓨터로 판독 가능한 저장 매체에 저장될 수 있다. 이러한 이해에 기초하여, 본 출원의 본질적인 기술적 해결 방안들, 종래 기술에 기여하는 부분, 또는 기술적 해결 방안들의 일부는 소프트웨어 제품의 형태로 구현될 수 있다. 소프트웨어 제품은 저장 매체에 저장되며, 컴퓨터 디바이스(개인용 컴퓨터, 서버 또는 네트워크 디바이스일 수 있음)가 본 출원의 실시 예들에서 설명되는 방법의 단계들 전부 또는 일부를 수행하도록 지시하기 위한 몇 가지 명령을 포함한다. 전술한 저장 매체는: USB 플래시 드라이브, 이동식 하드 디스크, 읽기 전용 메모리(Read-Only Memory, ROM), 랜덤 액세스 메모리(Random Access Memory, RAM), 자기 디스크 또는 광 디스크와 같은 프로그램 코드를 저장할 수 있는 임의의 매체를 포함한다.
전술한 설명은 본 출원에 대한 특정 구현일 뿐이며, 본 출원의 보호 범위를 제한하려는 것은 아니다. 본 출원에 개시된 기술 범위 내에서 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 용이하게 파악되는 임의의 변형 또는 대체는 본 출원의 보호 범위 내에 속한다. 따라서 본 출원의 보호 범위는 청구 범위의 보호 범위에 따른다.

Claims (7)

  1. 다운믹스 신호 및 잔차 신호를 계산하는 방법으로서,
    오디오 신호의 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 초기 다운믹스 신호 및 초기 잔차 신호를 획득하는 단계-여기서, 상기 오디오 신호는 스테레오 신호임-;
    상기 오디오 신호의 제1 타깃 프레임이 스위칭 프레임인지 여부를 판단하는 단계-여기서, 상기 제1 타깃 프레임은 상기 현재 프레임 또는 상기 현재 프레임의 이전 프레임임-; 및
    상기 제1 타깃 프레임이 스위칭 프레임인 경우, 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터, 상기 초기 다운믹스 신호, 및 상기 초기 잔차 신호에 기초하여, 상기 현재 프레임에서 미리 설정된 주파수 대역에 대응하는 서브밴드의 인코딩될 다운믹스 신호 및 인코딩될 잔차 신호를 계산하는 단계-여기서, 상기 제2 타깃 프레임은 상기 현재 프레임 또는 상기 현재 프레임의 상기 이전 프레임이고, 상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터 및 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터 중 적어도 하나에 기초하여 결정되며; 그리고 상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호와 잔차 신호 사이의 에너지 관계를 나타내는데 사용되고, 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임과 상기 제2 타깃 프레임 이전 M 프레임 사이의 에너지 또는 진폭 관계를 나타내는데 사용되며, 여기서 M은 양의 정수임-;를 포함하는,
    다운믹스 신호 및 잔차 신호를 계산하는 방법.
  2. 제1항에 있어서,
    상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지에 대한 상기 제2 타깃 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 잔차 신호의 총 에너지의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 잔차 신호의 총 에너지와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지 사이의 차이를 나타내는데 사용되거나;
    상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 잔차 신호의 총 에너지의 로그와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 총 에너지의 로그 사이의 차이를 나타내는데 사용되거나;
    상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지에 대한 상기 제2 타깃 프레임의 다운믹스 신호의 에너지의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 에너지와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지 사이의 차이를 나타내는데 사용되거나;
    상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 에너지의 로그와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 에너지의 로그 사이의 차이를 나타내는데 사용되거나;
    상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지에 대한 상기 제2 타깃 프레임의 잔차 신호의 에너지의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 잔차 신호의 에너지상기 제2 타깃 프레임의 잔차 신호의 에너지와 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지 사이의 차이를 나타내는데 사용되거나; 또는
    상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터는 상기 제2 타깃 프레임의 잔차 신호의 에너지의 로그와 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 에너지의 로그 사이의 차이를 나타내는데 사용되는,
    다운믹스 신호 및 잔차 신호를 계산하는 방법.
  3. 제1항에 있어서,
    상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합에 대한 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 합의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 합과 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합 사이의 차이를 나타내는데 사용되거나;
    상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 합의 로그와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 및 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 합의 로그 사이의 차이를 나타내는데 사용되거나;
    상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합에 대한 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합과 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합 사이의 차이를 나타내는데 사용되거나;
    상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 다운믹스 신호의 진폭 합의 로그와 상기 제2 타깃 프레임의 이전 프레임의 다운믹스 신호의 진폭 합의 로그 사이의 차이를 나타내는데 사용되거나;
    상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합에 대한 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 비율을 나타내는데 사용되거나, 또는 상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 잔차 신호의 진폭 합과 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합 사이의 차이를 나타내는데 사용되거나; 또는
    상기 제2 타깃 프레임의 프레임 간 진폭 변동 파라미터는 상기 제2 타깃 프레임의 잔차 신호의 진폭 합의 로그와 상기 제2 타깃 프레임의 이전 프레임의 잔차 신호의 진폭 합의 로그 사이의 차이를 나타내는데 사용되는,
    다운믹스 신호 및 잔차 신호를 계산하는 방법.
  4. 제1항에 있어서,
    상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 다음 방식으로 결정되는:
    인 경우, ;
    인 경우, ; 또는
    다른 경우, ; 여기서,
    는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터를 나타내고; 는 상기 프레임 간 에너지 변동 파라미터 또는 상기 프레임 간 진폭 변동 파라미터의 미리 설정된 제1 임계를 나타내고; 는 상기 프레임 간 에너지 변동 파라미터 또는 상기 프레임 간 진폭 변동 파라미터의 미리 설정된 제2 임계를 나타내고; 는 상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터를 나타내고; 는 상기 잔차 신호 코딩 파라미터의 미리 설정된 제1 임계를 나타내고; 는 상기 잔차 신호 코딩 파라미터의 미리 설정된 제2 임계를 나타내고; 는 상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 그리고 , , 및 는 미리 설정된 값을 나타내고; 그리고
    , , 및 인,
    다운믹스 신호 및 잔차 신호를 계산하는 방법.
  5. 제1항에 있어서,
    상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터는 다음 방식으로 결정되는:
    인 경우, ;
    인 경우, ; 또는
    다른 경우, ; 여기서,
    는 상기 제2 타깃 프레임의 프레임 간 에너지 변동 파라미터 또는 프레임 간 진폭 변동 파라미터를 나타내고; 는 상기 프레임 간 에너지 변동 파라미터 또는 상기 프레임 간 진폭 변동 파라미터의 미리 설정된 제1 임계를 나타내고; 는 상기 프레임 간 에너지 변동 파라미터 또는 상기 프레임 간 진폭 변동 파라미터의 미리 설정된 제2 임계를 나타내고; 는 상기 제2 타깃 프레임의 잔차 신호 코딩 파라미터를 나타내고; 는 상기 잔차 신호 코딩 파라미터의 미리 설정된 제1 임계를 나타내고; 는 상기 잔차 신호 코딩 파라미터의 미리 설정된 제2 임계를 나타내고; 는 상기 제2 타깃 프레임의 스위치 페이드-인/페이드-아웃 팩터를 나타내고; 그리고 , , 및 는 미리 설정된 값을 나타내고; 그리고
    , , 및 인,
    다운믹스 신호 및 잔차 신호를 계산하는 방법.
  6. 다운믹스 신호 및 잔차 신호를 계산하는 장치로서,
    메모리 및 프로세서를 포함하되, 상기 메모리는 프로그램을 저장하도록 구성되고, 상기 프로세서는 상기 메모리에 저장된 프로그램을 실행하도록 구성되며; 그리고
    상기 프로그램을 실행하는 경우, 상기 프로세서는 제1항 내지 제5항 중 어느 한 항에 따른 방법을 수행하도록 구성되는, 다운믹스 신호 및 잔차 신호를 계산하는 장치.
  7. 컴퓨터로 하여금 제1항 내지 제5항 중 어느 한 항에 따른 방법을 실행하도록 야기하게끔 구성된, 매체에 저장되어 있는 컴퓨터 프로그램.
KR1020237044298A 2018-05-31 2019-05-30 다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치 KR20240005152A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201810548874.9 2018-05-31
CN201810548874.9A CN110556116B (zh) 2018-05-31 2018-05-31 计算下混信号和残差信号的方法和装置
PCT/CN2019/089232 WO2019228447A1 (zh) 2018-05-31 2019-05-30 计算下混信号和残差信号的方法和装置
KR1020207035748A KR102618380B1 (ko) 2018-05-31 2019-05-30 다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020207035748A Division KR102618380B1 (ko) 2018-05-31 2019-05-30 다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20240005152A true KR20240005152A (ko) 2024-01-11

Family

ID=68698766

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020237044298A KR20240005152A (ko) 2018-05-31 2019-05-30 다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치
KR1020207035748A KR102618380B1 (ko) 2018-05-31 2019-05-30 다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020207035748A KR102618380B1 (ko) 2018-05-31 2019-05-30 다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치

Country Status (8)

Country Link
US (1) US11961526B2 (ko)
EP (1) EP3786946A4 (ko)
JP (1) JP2021525391A (ko)
KR (2) KR20240005152A (ko)
CN (1) CN110556116B (ko)
BR (1) BR112020024140A2 (ko)
SG (1) SG11202011333WA (ko)
WO (1) WO2019228447A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112015031180B1 (pt) * 2013-06-21 2022-04-05 Fraunhofer- Gesellschaft Zur Förderung Der Angewandten Forschung E.V Aparelho e método para gerar um formato espectral adaptativo de ruído de conforto
CN113129910A (zh) * 2019-12-31 2021-07-16 华为技术有限公司 音频信号的编解码方法和编解码装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0423289A (ja) * 1990-05-18 1992-01-27 Sony Corp ディジタルオーディオ信号の編集機
EP1735778A1 (en) * 2004-04-05 2006-12-27 Koninklijke Philips Electronics N.V. Stereo coding and decoding methods and apparatuses thereof
JP5238256B2 (ja) * 2004-11-04 2013-07-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 多チャンネル音声信号の符号化及び復号化
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
CN101197134A (zh) * 2006-12-05 2008-06-11 华为技术有限公司 消除编码模式切换影响的方法和装置以及解码方法和装置
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
TR201901336T4 (tr) * 2010-04-09 2019-02-21 Dolby Int Ab Mdct-tabanlı karmaşık tahmin stereo kodlama.
CN101964189B (zh) * 2010-04-28 2012-08-08 华为技术有限公司 语音频信号切换方法及装置
CN102280107B (zh) * 2010-06-10 2013-01-23 华为技术有限公司 边带残差信号生成方法及装置
ES2526320T3 (es) * 2010-08-24 2015-01-09 Dolby International Ab Ocultamiento de la recepción mono intermitente de receptores de radio estéreo de FM
EP2523472A1 (en) * 2011-05-13 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
CN102446507B (zh) * 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置
RU2584009C2 (ru) * 2011-09-29 2016-05-20 Долби Интернешнл Аб Обнаружение высокого качества в стереофонических радиосигналах с частотной модуляцией
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830051A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2854133A1 (en) * 2013-09-27 2015-04-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generation of a downmix signal
MX2018008886A (es) * 2016-01-22 2018-11-09 Fraunhofer Ges Zur Foerderung Der Angewandten Forscng E V Aparato y metodo para estereo mdct m/s con ild global con decision medio/lado mejorada.
MY196436A (en) * 2016-01-22 2023-04-11 Fraunhofer Ges Forschung Apparatus and Method for Encoding or Decoding a Multi-Channel Signal Using Frame Control Synchronization
CN107452387B (zh) * 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN107742521B (zh) * 2016-08-10 2021-08-13 华为技术有限公司 多声道信号的编码方法和编码器
CN107731238B (zh) * 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
CN110556118B (zh) * 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置

Also Published As

Publication number Publication date
JP2021525391A (ja) 2021-09-24
EP3786946A1 (en) 2021-03-03
CN110556116A (zh) 2019-12-10
KR20210010510A (ko) 2021-01-27
CN110556116B (zh) 2021-10-22
BR112020024140A2 (pt) 2021-02-17
WO2019228447A1 (zh) 2019-12-05
KR102618380B1 (ko) 2023-12-27
US11961526B2 (en) 2024-04-16
SG11202011333WA (en) 2020-12-30
EP3786946A4 (en) 2021-06-16
US20210082442A1 (en) 2021-03-18

Similar Documents

Publication Publication Date Title
AU2018368588B2 (en) Apparatus and method for encoding or decoding directional audio coding parameters using different time/frequency resolutions
EP2476113B1 (en) Method, apparatus and computer program product for audio coding
EP2291841B1 (en) Method, apparatus and computer program product for providing improved audio processing
US8060042B2 (en) Method and an apparatus for processing an audio signal
US20150371643A1 (en) Stereo audio signal encoder
KR102380431B1 (ko) 시간-도메인 스테레오 코딩 및 디코딩 방법, 및 관련 제품
KR101662682B1 (ko) 채널간 차이 추정 방법 및 공간적 오디오 코딩 장치
CN108885876A (zh) 用于对多声道音频信号的参数编码和解码的空间化信息进行的优化编码和解码
KR20140139586A (ko) 파라미터 공간 오디오 코딩 및 디코딩을 위한 방법, 파라미터 공간 오디오 코더 및 파라미터 공간 오디오 디코더
KR102618380B1 (ko) 다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치
KR20230137473A (ko) 스테레오 신호 인코딩 방법 및 장치
JP2022163058A (ja) ステレオ信号符号化方法およびステレオ信号符号化装置
KR102288111B1 (ko) 스테레오 신호의 인코딩 및 디코딩 방법과, 인코딩 및 디코딩 장치
RU2769789C2 (ru) Способ и устройство кодирования параметра межканальной разности фаз
KR102628755B1 (ko) 다운믹스된 신호 계산 방법 및 장치
KR102380454B1 (ko) 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
KR102377434B1 (ko) 시간-도메인 스테레오 파라미터에 대한 코딩 방법, 및 관련 제품
KR20230059178A (ko) 스테레오 신호를 처리하기 위한 방법 및 디바이스
RU2798759C2 (ru) Параметрическое кодирование и декодирование многоканальных аудиосигналов

Legal Events

Date Code Title Description
A107 Divisional application of patent