KR101837191B1 - 고주파수 대역 신호에 대한 예측 방법 및 코딩/디코딩 디바이스 - Google Patents
고주파수 대역 신호에 대한 예측 방법 및 코딩/디코딩 디바이스 Download PDFInfo
- Publication number
- KR101837191B1 KR101837191B1 KR1020177009587A KR20177009587A KR101837191B1 KR 101837191 B1 KR101837191 B1 KR 101837191B1 KR 1020177009587 A KR1020177009587 A KR 1020177009587A KR 20177009587 A KR20177009587 A KR 20177009587A KR 101837191 B1 KR101837191 B1 KR 101837191B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- frequency band
- band signal
- high frequency
- frequency
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 110
- 230000005284 excitation Effects 0.000 claims abstract description 234
- 230000005236 sound signal Effects 0.000 claims abstract description 116
- 238000012545 processing Methods 0.000 claims description 58
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000013139 quantization Methods 0.000 description 30
- 238000010586 diagram Methods 0.000 description 27
- 230000003595 spectral effect Effects 0.000 description 23
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 10
- 238000000605 extraction Methods 0.000 description 9
- 230000010076 replication Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000012937 correction Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000003362 replicative effect Effects 0.000 description 3
- 238000010420 art technique Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
고주파수 대역 신호에 대한 예측 방법 및 코딩/디코딩 디바이스가 개시된다. 방법은: 오디오 신호의 신호 타입 및 저주파수 대역 신호를 획득하는 단계(100) ― 오디오 신호는 저주파수 대역 신호 및 고주파수 대역 신호를 포함함 ― ; 신호 타입에 기반하여 고주파수 대역 신호의 주파수 도메인 포락선을 획득하는 단계(101); 저주파수 대역 신호에 기반하여 고주파수 대역 신호의 여기 신호를 예측하는 단계(102); 및 고주파수 대역 신호의 주파수 도메인 포락선 및 고주파수 대역 신호의 여기 신호에 기반하여 고주파수 대역 신호를 복원시키는 단계를 포함한다. 방법 및 디바이스는 예측에 의해 획득된 고주파수 대역 신호와 실제 고주파수 대역 신호 사이에 발견된 에러들의 효과적인 감소를 허용하고, 예측된 고주파수 대역 신호의 정확도를 증가시킨다.
Description
본 발명의 실시예는 통신 기술 분야에 관한 것이고, 특히 고주파수 대역 신호를 예측하기 위한 방법, 인코딩 디바이스, 및 디코딩 디바이스에 관한 것이다.
디지털 통신 분야에서, 전화 호출, 오디오 및 비디오 회의, 방송 텔레비전, 및 멀티미디어 엔터테인먼트와 같은, 음성, 사진, 오디오 및 비디오 전송에 대한 극도로 광범위한 응용 요건들이 존재한다. 오디오 또는 비디오 신호를 저장하거나 전송하는 프로세스에서 점유되는 리소스를 감소시키기 위해, 오디오 및 비디오 압축 및 인코딩 기술이 존재하게 되었다. 많은 상이한 기술적 가지들이 오디오 및 비디오 압축 및 인코딩 기술의 개발에서 출현하고 있으며, 여기서, 신호가 시간 도메인에서 주파수 도메인으로 변환된 이후 인코딩 처리되는 기술이 좋은 압축 특성으로 인해 널리 응용되고 있으며, 그 기술은 또한 도메인 변환 인코딩 기술이라고 지칭된다.
통신 전송에서의 오디오 품질이 점점 더 많이 강조되고 있으며, 따라서, 비디오 품질이 보장된다는 전제 하에 가능한 많은 음악 신호의 품질을 개선시킬 필요성이 존재한다. 반면, 오디오 신호의 정보의 양은 극도로 풍부하며, 따라서, 종래의 음성의 코드 여기식 선형 예측(Code Excited Linear Prediction, 줄여서 CELP) 인코딩 모드가 채택될 수 없으며, 대신 일반적으로, 오디오 신호를 프로세싱하기 위해, 시간 도메인 신호가 도메인 변환 인코딩의 오디오 인코딩 기술을 사용함으로써 주파수 도메인 신호로 변환되며, 이에 의해 오디오 신호의 인코딩 품질을 향상시킨다.
기존의 오디오 인코딩 기술에 있어서, 일반적으로, 고속 푸리에 변환(Fast Fourier Transform, 줄여서 FFT) 또는 수정된 이산 코사인 변환(Modified Discrete Cosine Transform, 줄여서 MDCT) 또는 이산 코사인 변환((Discrete Cosine Transform, 줄여서 DCT)과 같은 변환 기술을 채택함으로써, 오디오 신호에서의 고주파수 대역 신호는 시간 도메인 신호에서 주파수 도메인 신호로 변환되고, 이후 주파수 도메인 신호가 인코딩된다.
낮은 비트 레이트의 경우, 제한된 양자화 비트들은 모든 양자화될 오디오 신호들을 양자화시킬 수 없고, 따라서, 인코딩 디바이스는 오디오 신호들 내의 상대적으로 중요한 저주파수 대역 신호들을 정교하게 양자화시키기 위해 대부분의 비트들을 사용하는데, 즉, 저주파수 대역 신호들의 양자화 파라미터들이 대부분의 비트들을 점유하고, 오직 몇몇 비트들만이 오디오 신호들 내의 고주파수 대역 신호들을 대강(roughly) 양자화하고 인코딩하여 고주파수 대역 신호들의 주파수 포락선들을 획득하기 위해 사용된다. 이후, 고주파수 대역 신호들의 주파수 포락선들 및 저주파수 대역 신호들의 양자화 파라미터들은 비트스트림의 형태로 디코딩 디바이스에 송신된다. 저주파수 대역 신호들의 양자화 파라미터들은 여기 신호들 및 주파수 포락선들을 포함할 수 있다. 양자화될 때, 먼저 저주파수 대역 신호들이 또한 시간 도메인 신호들에서 주파수 도메인 신호들로 변환될 수 있고, 이후 주파수 도메인 신호들이 양자화되어 여기 신호들로 인코딩된다.
일반적으로, 디코딩 디바이스는 저주파수 대역 신호들인 그리고 수신된 비트스트림 내에 있는 양자화 파라미터들에 따라 저주파수 대역 신호들을 복원시키고, 이후 저주파수 대역 신호들에 따라 저주파수 대역 신호들의 여기 신호들을 획득하고, 대역폭 확장(bandwidth extension, 줄여서 BWE) 기술 및 스펙트럼 채움(spectrum filling) 기술을 사용함으로써 그리고 저주파수 대역 신호들의 여기 신호들에 따라 고주파수 대역 신호들의 여기 신호들을 예측하고, 고주파수 대역 신호들인 그리고 비트스트림 내에 있는 주파수 포락선들에 따라 고주파수 대역 신호들의 예측된 여기 신호들을 수정하여, 예측된 고주파수 대역 신호들을 획득할 수 있다. 여기서, 획득된 고주파수 대역 신호들은 주파수 도메인 신호들이다.
BWE 기술에서, 비트가 할당되는, 가장 높은 주파수 빈은 여기 신호가 디코딩될 가장 높은 주파수 빈일 수 있는데, 즉, 어떠한 여기 신호도 가장 높은 주파수 빈보다 더 큰 주파수 빈 상에서 디코딩되지 않는다. 비트가 할당되는, 가장 높은 주파수 빈보다 더 큰 주파수 대역은 고주파수 대역으로서 지칭될 수 있고, 비트가 할당되는, 가장 높은 주파수 빈보다 더 작은 주파수 대역은 저주파수 대역으로서 지칭될 수 있다. 고주파수 대역 신호의 여기 신호가 저주파수 대역 신호의 여기 신호에 따라 예측된다는 것은 구체적으로 다음과 같을 수 있다: 비트가 할당되는, 가장 높은 주파수 빈은 중심으로서 간주되고, 비트가 할당되는, 가장 높은 주파수 빈보다 더 작은 저주파수 대역 신호의 여기 신호는, 비트가 할당되고 그 대역폭이 저주파수 대역 신호의 대역폭과 같은 고주파수 대역 신호로 복제되고, 여기 신호는 고주파수 대역 신호의 여기 신호로서 사용된다.
종래 기술은 다음의 단점들을 갖는다: 고주파수 대역 신호를 예측하기 위해 이전의 종래 기술을 사용함으로써, 예측된 고주파수 대역 신호의 품질은 상대적으로 열악하고, 이에 의해 오디오 신호의 청각적 품질을 감소시킨다.
본 발명의 실시예들은, 예측된 고주파수 대역 신호의 품질을 개선하고, 이에 의해 오디오 신호의 청각적 품질을 향상시키기 위해, 고주파수 대역 신호를 예측하기 위한 방법, 인코딩 디바이스, 및 디코딩 디바이스를 제공한다.
제1 양상에 따르면, 본 발명의 실시예는:
디코딩될 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하는 단계;
신호 타입에 따라 오디오 신호의 고주파수 대역 신호의 주파수 포락선을 획득하는 단계;
오디오 신호의 저주파수 대역 신호에 따라 오디오 신호의 고주파수 대역 신호의 여기 신호를 예측하는 단계; 및
고주파수 대역 신호의 주파수 포락선 및 고주파수 대역 신호의 여기 신호에 따라 오디오 신호의 고주파수 대역 신호를 복원시키는 단계
를 포함하는, 고주파수 대역 신호를 예측하기 위한 방법을 제공한다.
제1 양상에 관련하여, 제1 양상의 제1 구현 방식에 있어서, 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 신호 타입에 따라 오디오 신호의 고주파수 대역 신호의 주파수 포락선을 획득하는 것은:
신호 타입이 비-고조파 신호일 때, 오디오 신호의 수신된 비트스트림을 디코딩하여 오디오 신호의 고주파수 대역 신호의 주파수 포락선을 획득하는 것; 또는
신호 타입이 고조파 신호일 때, 오디오 신호의 수신된 비트스트림을 디코딩하여 오디오 신호의 고주파수 대역 신호의 초기 주파수 포락선을 획득하는 것, 및 고주파수 대역 신호의 주파수 포락선으로서 초기 주파수 포락선 및 N개의 인접한 초기 주파수 포락선들에 대해 가중 계산을 수행함으로써 획득된 값을 사용하는 것을 포함하고, N은 1보다 더 크거나 같다.
제1 양상과 관련하여, 제1 양상의 제2 구현 방식에 있어서, 신호 타입은 고조파 신호이거나 비-고조파 신호이고, 신호 타입에 따라 오디오 신호의 고주파수 대역 신호의 주파수 포락선을 획득하는 것은:
신호 타입에 따라 오디오 신호의 수신된 비트스트림을 디코딩하여 고주파수 대역 신호의 대응하는 주파수 포락선을 획득하는 것을 포함하고, 오디오 신호의 비트스트림은 신호 타입 및 고주파수 대역 신호의 주파수 포락선의 인코딩 인덱스를 반송한다.
제1 양상 및 제1 양상의 이전 구현 방식들에 관련하여, 제1 양상의 제3 구현 방식에 있어서, 디코딩될 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하는 것은:
오디오 신호의 수신된 비트스트림을 디코딩하여 신호 타입 및 저주파수 대역 신호를 획득하는 것을 포함하고, 신호 타입은 고조파 신호 또는 비-고조파 신호이다.
제1 양상 및 제1 양상의 이전 구현 방식들에 관련하여, 제1 양상의 제4 구현 방식에 있어서, 디코딩될 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하는 것은:
오디오 신호의 수신된 비트스트림을 디코딩하여 오디오 신호의 저주파수 대역 신호를 획득하는 것; 및
저주파수 대역 신호에 따라 신호 타입을 결정하는 것을 포함하고, 신호 타입은 고조파 신호 또는 비-고조파 신호이다.
제1 양상 및 제1 양상의 이전 구현 방식들과 관련하여, 제1 양상의 제5 구현 방식에 있어서, 오디오 신호의 저주파수 대역 신호에 따라 오디오 신호의 고주파수 대역 신호의 여기 신호를 예측하는 것은:
비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈을 결정하는 것;
비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 작은지를 결정하는 것; 및
비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 작을 때, 미리 결정된 주파수 대역 범위 내에 있고 저주파수 대역 신호 내에 있는 여기 신호, 및 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈에 따라 고주파수 대역 신호의 여기 신호를 예측하는 것; 또는
비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 크거나 같을 때, 미리 결정된 주파수 대역 범위 내에 있고 저주파수 대역 신호 내에 있는 여기 신호, 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈, 및 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈에 따라 고주파수 대역 신호의 여기 신호를 예측하는 것을 포함한다.
제1 양상 및 제1 양상의 이전 구현 방식들과 관련하여, 제1 양상의 제6 구현 방식에 있어서, 미리 결정된 주파수 대역 범위 내에 있고 저주파수 대역 신호 내에 있는 여기 신호, 및 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈에 따라 고주파수 대역 신호의 여기 신호를 예측하는 것은:
미리 결정된 주파수 대역 범위 내에서 여기 신호의 n개 복제본을 만들고, 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈과 대역폭 확장 주파수 대역의 가장 높은 주파수 빈 사이의 여기 신호로서 여기 신호의 n개 복제본들을 사용하는 것을 포함하고, n은 양의 정수 또는 양의 소수(decimal)이고, n은 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈과 대역폭 확장 주파수 대역의 가장 높은 주파수 빈 사이의 주파수 빈들의 수량 대 미리 결정된 주파수 대역 범위 내의 주파수 빈들의 수량의 비와 같다.
제1 양상 및 제1 양상의 이전 구현 방식들과 관련하여, 제1 양상의 제7 구현 방식에서, 미리 결정된 주파수 대역 범위 내에 있고 저주파수 대역 신호 내에 있는 여기 신호, 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈, 및 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈에 따라 고주파수 대역 신호의 여기 신호를 예측하는 것은:
미리 결정된 주파수 대역 범위의 시작 주파수 빈 fexc _start 위의 m번째 주파수 빈으로부터 미리 결정된 주파수 대역 범위의 종료 주파수 빈 fexc _end으로 여기 신호를 복제하여, 미리 결정된 주파수 대역 범위 내에서 여기 신호의 n개 복제본을 만드는 것, 및 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈과 대역폭 확장 주파수 대역의 가장 높은 주파수 빈 사이의 여기 신호로서 여기 신호들의 2개 부분들을 사용하는 것을 포함하고, n은 0, 양의 정수 또는 양의 소수이고, m은 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈과 확장 주파수 대역의 미리 설정된 시작 주파수 빈 사이의 주파수 빈들의 수량이다.
제2 양상에 따르면, 본 발명의 실시예는:
오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하는 단계;
신호 타입에 따라 오디오 신호의 고주파수 대역 신호의 주파수 포락선을 인코딩하여 고주파수 대역 신호의 주파수 포락선을 획득하는 단계; 및
신호 타입, 및 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 인코딩 인덱스들을 반송하는 비트스트림을 송신하는 단계를 포함하는, 고주파수 대역 신호를 예측하기 위한 방법을 추가로 제공한다.
제2 양상과 관련하여, 제2 양상의 구현 방식에서, 신호 타입은 고조파 신호 또는 비고조파 신호이며, 신호 타입에 따라 오디오 신호의 고주파수 대역 신호의 주파수 포락선을 인코딩하여 고주파수 대역 신호의 주파수 포락선을 획득하는 것은:
신호 타입이 비-고조파 신호일 때, 제1 수량의 스펙트럼 계수들을 사용함으로써 고주파수 대역 신호의 주파수 포락선을 계산하는 것; 및
신호 타입이 고조파 신호일 때, 제2 수량의 스펙트럼 계수들을 사용함으로써 고주파수 대역 신호의 주파수 포락선을 계산하는 것을 포함하고, 제2 수량은 제1 수량보다 더 크다.
제3 양상에 따르면, 본 발명의 실시예는:
오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하는 단계 ― 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 오디오 신호는 저주파수 대역 신호 및 고주파수 대역 신호를 포함함 ― ;
오디오 신호의 고주파수 대역 신호의 주파수 포락선을 계산하는 단계 ― 동일한 수량의 스펙트럼 계수들이 고조파 신호 및 비-고조파 신호의 고주파수 대역 신호들의 주파수 포락선들을 계산하기 위해 사용됨 ― ; 및
신호 타입, 및 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 인코딩 인덱스들을 반송하는 비트스트림을 디코딩 디바이스에 송신하는 단계를 포함하는, 고주파수 대역 신호를 예측하기 위한 방법을 추가로 제공한다.
제4 양상에 따르면, 본 발명의 실시예는:
디코딩될 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하도록 구성된 제1 획득 모듈;
신호 타입에 따라 오디오 신호의 고주파수 대역 신호의 주파수 포락선을 획득하도록 구성된 제2 획득 모듈;
오디오 신호의 저주파수 대역 신호에 따라 오디오 신호의 고주파수 대역 신호의 여기 신호를 예측하도록 구성된 예측 모듈; 및
고주파수 대역 신호의 여기 신호 및 고주파수 대역 신호의 주파수 포락선에 따라 오디오 신호의 고주파수 대역 신호를 복원시키도록 구성된 복원 모듈
을 포함하는, 디코딩 디바이스를 추가로 제공한다.
제4 양상에 관련하여, 제4 양상의 제1 구현 방식에 있어서, 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 제2 획득 모듈은 구체적으로: 신호 타입이 비-고조파 신호일 때, 오디오 신호의 수신된 비트스트림을 디코딩하여 고주파수 대역 신호의 주파수 포락선을 획득하도록 구성되거나; 또는 제2 획득 모듈은 구체적으로, 신호 타입이 고조파 신호일 때, 오디오 신호의 수신된 비트스트림을 디코딩하여 고주파수 대역 신호의 초기 주파수 포락선을 획득하고, 고주파수 대역 신호의 주파수 포락선으로서 초기 주파수 포락선 및 N개의 인접한 초기 주파수 포락선들에 대해 가중 계산을 수행함으로써 획득된 값을 사용하도록 구성되고, N은 1보다 더 크거나 같다.
제4 양상과 관련하여, 제4 양상의 제2 구현 방식에 있어서, 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 제2 획득 모듈은 구체적으로 신호 타입에 따라 오디오 신호의 수신된 비트스트림을 디코딩하여 고주파수 대역 신호의 대응하는 주파수 포락선을 획득하도록 구성되고, 오디오 신호의 비트스트림은 신호 타입 및 고주파수 대역 신호의 주파수 포락선의 인코딩 인덱스를 반송한다.
제4 양상 및 제4 양상의 이전 구현 방식들과 관련하여, 제4 양상의 제3 구현 방식에 있어서, 제1 획득 모듈은 구체적으로 오디오 신호의 수신된 비트스트림을 디코딩하여 신호 타입 및 저주파수 대역 신호를 획득하도록 구성되고, 신호 타입은 고조파 신호 또는 비-고조파 신호이다.
제4 양상 및 제4 양상의 이전 구현 방식들과 관련하여, 제4 양상의 제4 구현 방식에 있어서, 제1 획득 모듈은 구체적으로, 오디오 신호의 수신된 비트스트림을 디코딩하여 오디오 신호의 저주파수 대역 신호를 획득하고, 저주파수 대역 신호에 따라 신호 타입을 결정하도록 구성되고, 신호 타입은 고조파 신호 또는 비-고조파 신호이다.
제4 양상 및 제4 양상의 이전 구현 방식들과 관련하여, 제4 양상의 제5 구현 방식에 있어서, 예측 모듈은:
비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈을 결정하도록 구성된 결정 유닛;
비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 작은지를 결정하도록 구성된 판단 유닛; 및
판단 유닛이, 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 작다고 결정할 때, 미리 결정된 주파수 대역 범위 내에 있고 저주파수 대역 신호 내에 있는 여기 신호, 및 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈에 따라 고주파수 대역 신호의 여기 신호를 예측하도록 구성된 제1 프로세싱 유닛; 또는
판단 유닛이, 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 크거나 같을 때, 미리 결정된 주파수 대역 범위 내에 있고 저주파수 대역 신호 내에 있는 여기 신호, 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈, 및 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈에 따라 고주파수 대역 신호의 여기 신호를 예측하도록 구성된 제2 프로세싱 유닛을 포함한다.
제4 양상 및 제4 양상의 이전 구현 방식들과 관련하여, 제4 양상의 제6 구현 방식에 있어서, 제1 프로세싱 유닛은 구체적으로: 판단 유닛이, 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 작을 때, 미리 결정된 주파수 대역 범위 내에서 여기 신호의 n개 복제본을 만들고, 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈과 대역폭 확장 주파수 대역의 가장 높은 주파수 빈 사이의 여기 신호로서 여기 신호의 n개 복제본들을 사용하도록 구성되고, n은 양의 정수 또는 양의 소수이고, n은 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈과 대역폭 확장 주파수 대역의 가장 높은 주파수 빈 사이의 주파수 빈들의 수량 대 미리 결정된 주파수 대역 범위 내의 주파수 빈들의 수량의 비와 같다.
제4 양상 및 제4 양상의 이전 구현 방식들과 관련하여, 제4 양상의 제7 구현 방식에 있어서, 제2 프로세싱 유닛은 구체적으로: 판단 유닛이 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 크거나 같다고 결정할 때, 미리 결정된 주파수 대역 범위의 시작 주파수 빈 fexc _start 위의 m번째 주파수 빈으로부터 미리 결정된 주파수 대역 범위의 종료 주파수 빈 fexc _end으로 여기 신호를 복제하여, 미리 결정된 주파수 대역 범위 내에서 여기 신호의 n개 복제본들을 만들고, 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈과 대역폭 확장 주파수 대역의 가장 높은 주파수 빈 사이의 여기 신호로서 여기 신호들의 2개 부분들을 사용하도록 구성되고, n은 0, 양의 정수 또는 양의 소수이고, m은 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈과 확장 주파수 대역의 미리 설정된 시작 주파수 빈 사이의 주파수 빈들의 수량이다.
제5 양상에 따르면, 본 발명의 실시예는:
오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하도록 구성된 획득 모듈;
신호 타입에 따라 오디오 신호의 고주파수 대역 신호의 주파수 포락선을 인코딩하여 고주파수 대역 신호의 주파수 포락선을 획득하도록 구성된 인코딩 모듈; 및
신호 타입, 및 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호 의 인코딩 인덱스들을 반송하는 비트스트림을 송신하도록 구성된 송신 모듈
을 포함하는 인코딩 디바이스를 추가로 제공한다.
제5 양상에 관련하여, 제5 양상의 구현 방식에 있어서, 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 인코딩 모듈은 구체적으로: 신호 타입이 비-고조파 신호일 때, 제1 수량의 스펙트럼 계수들을 사용함으로써 고주파수 대역 신호의 주파수 포락선을 계산하도록 구성되거나; 또는
인코딩 모듈은 구체적으로: 신호 타입이 고조파 신호일 때, 제2 수량의 스펙트럼 계수들을 사용함으로써 고주파수 대역 신호의 주파수 포락선을 계산하도록 구성되고, 제2 수량은 제1 수량보다 더 크다.
제6 양상에 따르면, 본 발명의 실시예는:
오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하도록 구성된 획득 모듈 ― 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 오디오 신호는 저주파수 대역 신호 및 고주파수 대역 신호를 포함함 ― ;
오디오 신호의 고주파수 대역 신호의 주파수 포락선을 계산하도록 구성된 계산 모듈 ― 동일한 수량의 스펙트럼 계수들이 고조파 신호 및 비-고조파 신호의 고주파수 대역 신호들의 주파수 포락선들을 계산하기 위해 사용됨 ― ; 및
신호 타입, 및 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 인코딩 인덱스들을 반송하는 비트스트림을 디코딩 디바이스에 송신하도록 구성된 송신 모듈
을 포함하는 인코딩 디바이스를 추가로 제공한다.
본 발명의 실시예들에서의 고주파수 대역 신호를 예측하기 위한 방법 및 시스템, 인코딩 디바이스, 및 디코딩 디바이스에 따르면, 상이한 타입의 신호에 대해, 상이한 스펙트럼 계수가 포락선을 디코딩하기 위해 사용되고, 따라서, 저주파수 대역 신호에 따라 예측된 고주파수 대역 고조파 신호의 여기 신호가 원래 고조파 특성을 유지할 수 있고, 이에 의해 예측된 고주파수 대역 신호의 품질을 개선시키고 오디오 신호의 청각적 품질을 향상시킬 수 있다.
본 발명의 실시예들에서의 또는 종래 기술에서의 기술적 해법들을 더욱 명료하게 기재하기 위해, 다음은 실시예들 또는 종래 기술을 기재하기 위해 요구되는 첨부 도면들을 간략하게 소개한다. 명백하게, 후속하는 기재에서의 첨부 도면들은 본 발명의 일부 실시예들을 도시하며, 통상의 기술자는 창조적 노력 없이도 이들 첨부 도면들로부터 다른 도면들을 여전히 유도할 수 있다.
도 1은 종래 기술에서의 인코딩 디바이스의 개략적 구조도이다.
도 2는 종래 기술에서의 디코딩 디바이스의 개략적 구조도이다.
도 3은 본 발명의 실시예에 따라 고주파수 대역 신호를 예측하기 위한 방법의 흐름도이다.
도 4는 본 발명의 또다른 실시예에 따라 고주파수 대역 신호를 예측하기 위한 방법의 흐름도이다.
도 5는 본 발명의 또다른 실시예에 따라 고주파수 대역 신호를 예측하기 위한 방법의 흐름도이다.
도 6은 본 발명의 실시예에 따른 디코딩 디바이스의 개략적 구조도이다.
도 7은 본 발명의 또다른 실시예에 따른 디코딩 디바이스의 개략적 구조도이다.
도 8은 본 발명의 실시예에 따른 인코딩 디바이스의 개략적 구조도이다.
도 9는 본 발명의 또다른 실시예에 따른 인코딩 디바이스의 개략적 구조도이다.
도 10은 본 발명의 실시예에 따른 인코딩 디바이스의 예시적인 다이어그램이다.
도 11은 본 발명의 실시예에 따른 디코딩 디바이스의 예시적인 다이어그램이다.
도 12는 본 발명의 실시예에 따라 고주파수 대역 신호를 예측하기 위한 시스템의 개략적 구조도이다.
도 13은 본 발명의 실시예에 따른 디코딩 디바이스의 또다른 예시적인 다이어그램이다.
도 14는 본 발명의 실시예에 따른 인코딩 디바이스의 또다른 예시적인 다이어그램이다.
도 1은 종래 기술에서의 인코딩 디바이스의 개략적 구조도이다.
도 2는 종래 기술에서의 디코딩 디바이스의 개략적 구조도이다.
도 3은 본 발명의 실시예에 따라 고주파수 대역 신호를 예측하기 위한 방법의 흐름도이다.
도 4는 본 발명의 또다른 실시예에 따라 고주파수 대역 신호를 예측하기 위한 방법의 흐름도이다.
도 5는 본 발명의 또다른 실시예에 따라 고주파수 대역 신호를 예측하기 위한 방법의 흐름도이다.
도 6은 본 발명의 실시예에 따른 디코딩 디바이스의 개략적 구조도이다.
도 7은 본 발명의 또다른 실시예에 따른 디코딩 디바이스의 개략적 구조도이다.
도 8은 본 발명의 실시예에 따른 인코딩 디바이스의 개략적 구조도이다.
도 9는 본 발명의 또다른 실시예에 따른 인코딩 디바이스의 개략적 구조도이다.
도 10은 본 발명의 실시예에 따른 인코딩 디바이스의 예시적인 다이어그램이다.
도 11은 본 발명의 실시예에 따른 디코딩 디바이스의 예시적인 다이어그램이다.
도 12는 본 발명의 실시예에 따라 고주파수 대역 신호를 예측하기 위한 시스템의 개략적 구조도이다.
도 13은 본 발명의 실시예에 따른 디코딩 디바이스의 또다른 예시적인 다이어그램이다.
도 14는 본 발명의 실시예에 따른 인코딩 디바이스의 또다른 예시적인 다이어그램이다.
본 발명의 실시예들의 목적, 기술적 해법 및 장점들을 더욱 명료하게 하기 위해, 다음은 본 발명의 실시예들에서의 첨부 도면들과 관련하여 본 발명의 실시예들에서의 기술적 해법들을 명료하고 완전하게 기재한다. 명백하게, 기술된 실시예들은 본 발명의 실시예들의 전부가 아닌 일부이다. 창조적 노력 없이 본 발명의 실시예들에 기초하여 통상의 기술자에 의해 획득된 모든 다른 실시예들은 본 발명의 보호 범위 내에 들 것이다.
디지털 신호 프로세싱 분야에서, 오디오 코덱들 및 비디오 코덱들은 다양한 전자 디바이스들, 예를 들어, 모바일 폰, 무선 장치, 개인용 데이터 보조 단말(PDA; personal data assistant), 핸드헬드 또는 휴대용 컴퓨터, GPS 수신기/내비게이터, 카메라, 오디오/비디오 플레이어, 캠코더, 비디오 레코더, 및 모니터링 디바이스에 널리 응용된다. 일반적으로, 이러한 타입의 전자 디바이스는 오디오 인코더 또는 오디오 디코더를 포함하는데, 오디오 인코더 또는 디코더는 디지털 회로 또는 칩, 예를 들어, DSP(디지털 신호 프로세서)에 의해 직접 구현될 수 있거나, 또는 소프트웨어 코드로 프로세스를 실행하도록 프로세서를 구동하는 소프트웨어 코드에 의해 구현될 수 있다.
예를 들어, 오디오 인코더는 먼저 20ms인 하나의 프레임을 가지는 시간 도메인 데이터를 획득하기 위해 입력 신호에 대해 프레이밍(framing) 프로세싱을 수행하고, 이후, 시간 도메인 데이터에 대해 윈도우잉(windowing) 프로세싱을 수행하여 윈도우잉 이후의 신호를 획득하고, 윈도우잉 이후의 시간 도메인 신호에 대해 주파수 도메인 변환을 수행하여 시간 도메인 신호를 주파수 도메인 신호로 변환하고, 주파수 도메인 신호를 인코딩하고, 인코딩된 주파수 도메인 신호를 디코더 측에 전송한다. 인코더 측에 의해 전송된 압축된 비트스트림을 수신한 이후, 디코더 측은 신호에 대해 대응하는 디코딩 동작을 수행하고, 디코딩에 의해 획득된 주파수 도메인 신호에 대해, 인코더 측에 의해 사용된 변환에 대응하는 역변환을 수행하여, 주파수 도메인 신호를 시간 도메인 신호로 변환하고, 시간 도메인 신호에 대해 후처리를 수행하여 합성된 신호, 즉, 디코더측에 의해 출력된 신호를 획득한다.
도 1은 종래 기술에서의 인코딩 디바이스의 개략적 구조도이다. 도 1에 도시된 바와 같이, 종래 기술의 인코딩 디바이스는 시간-주파수 변환 모듈(10), 포락선 추출 모듈(11), 포락선 양자화 및 인코딩 모듈(12), 비트 할당 모듈(13), 여기 생성 모듈(14), 여기 양자화 및 인코딩 모듈(15), 및 멀티플렉싱 모듈(16)을 포함한다.
도 1에 도시된 바와 같이, 시간-주파수 변환 모듈(10)은: 입력 오디오 신호를 수신하고, 이후 오디오 신호를 시간 도메인 신호에서 주파수 도메인 신호로 변환하도록 구성된다. 이후, 포락선 추출 모듈(11)은 시간-주파수 변환 모듈(10)에 의한 변환에 의해 획득된 주파수 도메인 신호로부터 주파수 포락선을 추출하고, 주파수 포락선은 또한 서브대역 정규화 인자(subband normalization factor)라고 지칭될 수 있다. 여기서, 주파수 포락선은 저주파수 대역 신호의 주파수 포락선 및 고주파수 대역 신호의 주파수 포락선을 포함하고, 저주파수 대역 신호 및 고주파수 대역 신호는 주파수 도메인 신호 내에 있다. 포락선 양자화 및 인코딩 모듈(12)은 포락선 추출 모듈(11)에 의해 획득된 주파수 포락선에 대해 양자화 및 인코딩 프로세싱을 수행하여 양자화되고 인코딩된 주파수 포락선을 획득한다. 비트 할당 모듈(13)은 양자화된 주파수 포락선에 따라 각각의 서브대역의 비트 할당을 결정한다. 여기 생성 모듈(14)은, 포락선 양자화 및 인코딩 모듈(12)에 의한 양자화 및 인코딩 이후에 획득된 포락선 정보를 사용함으로써, 시간-주파수 변환 모듈(10)에 의해 획득된 주파수 도메인 신호에 대한 정규화 프로세싱을 수행하여, 여기 신호, 즉, 정규화된 주파수 도메인 신호를 획득하고, 여기 신호는 또한 고주파수 대역 신호의 여기 신호 및 저주파수 대역 신호의 여기 신호를 포함한다. 여기 양자화 및 인코딩 모듈(15)은, 비트 할당 모듈(13)에 의해 할당되는, 각각의 서브대역의 비트 할당에 따라, 여기 생성 모듈(14)에 의해 생성된 여기 신호에 대한 양자화 및 인코딩 프로세싱을 수행하여, 양자화된 여기 신호를 획득한다. 멀티플렉싱 모듈(16)은 별도로 포락선 양자화 및 인코딩 모듈(12)에 의해 양자화된 주파수 포락선 및 여기 양자화 및 인코딩 모듈(15)에 의해 양자화된 여기 신호를 비트스트림으로 멀티플렉싱하고, 비트스트림을 디코딩 디바이스에 출력한다.
도 2는 종래 기술의 디코딩 디바이스의 개략적 구조도이다. 도 2에 도시된 바와 같이, 종래 기술의 디코딩 디바이스는 디멀티플렉싱 모듈(20), 주파수 포락선 디코딩 모듈(21), 비트 할당 획득 모듈(22), 여기 신호 디코딩 모듈(23), 대역폭 확장 모듈(24), 주파수 도메인 신호 복원 모듈(25), 및 주파수-시간 변환 모듈(26)을 포함한다.
도 2에 도시된 바와 같이, 디멀티플렉싱 모듈(20)은 인코딩 디바이스 측으로부터 송신된 비트스트림을 수신하고, 비트스트림을 디멀티플렉싱하여(디코딩 포함) 양자화된 주파수 포락선 및 양자화된 여기 신호를 별도로 획득한다. 주파수 포락선 디코딩 모듈(21)은 디멀티플렉싱 모듈(20)에 의한 디멀티플렉싱에 의해 획득된 신호로부터 양자화된 주파수 포락선을 획득하고, 양자화된 주파수 포락선을 양자화하고 디코딩하여 주파수 포락선을 획득한다. 비트 할당 획득 모듈(22)은 주파수 포락선 디코딩 모듈(21)에 의해 획득된 주파수 포락선에 따라 각각의 서브대역의 비트 할당을 결정한다. 여기 신호 디코딩 모듈(23)은 디멀티플렉싱 모듈(20)에 의한 디멀티플렉싱에 의해 획득된 신호로부터 양자화된 여기 신호를 획득하고, 비트 할당 획득 모듈(22)에 의해 획득된 각각의 서브대역의 비트 할당에 따라, 양자화 및 디코딩을 수행하여 여기 신호를 획득한다. 대역폭 확장 모듈(24)은 여기 신호 디코딩 모듈(23)에 의해 획득된 여기 신호에 따라 전체 대역폭에 대한 확장을 수행한다. 구체적으로, 대역폭 확장 모듈(24)은 저주파수 대역 신호의 여기 신호를 사용함으로써 고주파수 대역 신호의 여기 신호를 확장시킨다. 여기 신호 및 포락선 신호를 양자화시키고 인코딩시킬 때, 여기 양자화 및 인코딩 모듈(15) 및 포락선 양자화 및 인코딩 모듈(12)은 상대적으로 중요한 저주파수 대역 신호의 신호를 양자화시키기 위해 대부분의 비트들을 사용하고, 심지어 고주파수 대역 신호의 여기 신호를 배제할 수 있는 고주파수 대역 신호의 신호를 양자화시키기 위해 단지 몇몇 비트만을 사용한다. 따라서, 대역폭 확장 모듈(24)은 전체 주파수 대역의 여기 신호를 획득하기 위해, 저주파수 대역 신호의 여기 신호를 사용하여 고주파수 대역 신호의 여기 신호를 확장할 필요가 있다. 주파수 도메인 신호 복원 모듈(25)은 주파수 포락선 디코딩 모듈(21) 및 대역폭 확장 모듈(24)에 별도로 접속되고, 주파수 도메인 신호 복원 모듈(25)은 주파수 포락선 디코딩 모듈(21)에 의해 획득된 주파수 포락선, 및 전체 주파수 대역에 있으며 대역폭 확장 모듈(24)에 의해 획득된 여기 신호에 따라 주파수 도메인 신호를 복원시킨다. 주파수-시간 변환 모듈(26)은 주파수 도메인 신호 복원 모듈(25)에 의해 복원된 주파수 도메인 신호를 시간 도메인 신호로 변환시키고, 이에 의해 원래의 입력 오디오 신호를 획득한다.
도 1 및 도 2는 종래 기술에서의 인코딩 디바이스 및 대응하는 디코딩 디바이스의 구조도들이다. 도 1 및 도 2에 도시된 종래 기술의 인코딩 디바이스 및 디코딩 디바이스의 프로세싱 프로세스들에 따르면, 종래 기술에서, 저주파수 대역 신호이며 디코딩 디바이스가 저주파수 대역 신호의 주파수 도메인 신호를 복원시킬 때 사용되는 여기 신호 및 포락선 정보가 인코딩 디바이스 측으로부터 송신된다는 점이 학습될 수 있다. 따라서, 저주파수 대역 신호의 주파수 도메인 신호의 복원은 상대적으로 정확하다. 고주파수 대역 신호의 주파수 도메인 신호에 대해, 고주파수 대역 신호의 주파수 도메인 신호를 획득하기 위해, 먼저 저주파수 대역 신호의 여기 신호를 사용하여 고주파수 대역 신호의 여기 신호를 예측하고, 다음으로 고주파수 대역 신호이며 인코딩 디바이스 측으로부터 송신된 포락선 정보를 사용하여 고주파수 대역 신호의 예측된 여기 신호를 수정할 필요성이 있다. 고주파수 대역 신호의 주파수 도메인 신호를 예측할 때, 인코딩 디바이스는 신호 타입을 고려하지 않고 동일한 주파수 포락선을 사용한다. 예를 들어, 신호 타입이 고조파 신호일 때, 사용된 주파수 포락선에 의해 커버되는 서브대역 범위는 상대적으로 좁다(하나의 고조파의 마루에서 골까지 커버되는 서브대역 범위보다 더 작다). 주파수 포락선이 고주파수 대역 신호의 예측된 여기 신호를 수정하기 위해 사용될 때, 더 많은 잡음이 유입되고, 따라서, 수정에 의해 획득된 고주파수 대역 신호와 실제 고주파수 대역 신호 사이에 상대적으로 큰 에러가 존재하여, 고주파수 대역 신호를 예측하는 정확도 레이트(accuracy rate)에 심각하게 영향을 주고, 예측된 고주파수 대역 신호의 품질을 감소시키고 오디오 신호의 청각적 품질을 감소시킨다. 추가로, 고주파수 대역 신호의 여기 신호가 저주파수 대역 신호의 여기 신호에 따라 예측되는 이전의 종래 기술을 사용함으로써, 상이한 저주파수 대역 신호들의 여기 신호들이 상이한 프레임들의 동일한 고주파수 대역 신호로 복제되고, 여기 신호의 불연속성을 야기하고, 예측된 고주파수 대역 신호의 품질을 감소시키고, 이에 의해 오디오 신호의 청각적 품질을 감소시킬 수 있다. 따라서, 본 발명의 실시예들의 후속하는 기술적 해법들이 이전의 기술적 문제를 해결하기 위해 사용될 수 있다.
도 3은 본 발명의 실시예에 따라 고주파수 대역 신호를 예측하기 위한 방법의 흐름도이다. 이 실시예에서, 고주파수 대역 신호를 예측하기 위한 방법은 디코딩 디바이스에 의해 실행될 수 있다. 도 3에 도시된 바와 같이, 이 실시예에서, 고주파수 대역 신호를 예측하기 위한 방법은 구체적으로 다음 단계들을 포함할 수 있다:
100. 디코딩 디바이스가 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득한다.
이 실시예에서, 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 오디오 신호는 저주파수 대역 신호 및 고주파수 대역 신호를 포함한다. 실시예에서, 오디오 신호의 신호 타입은 오디오 신호의 고주파수 대역 신호의 신호 타입인데, 즉, 고주파수 대역 신호가 고조파 신호인지 비-고조파 신호인지이다.
101. 디코딩 디바이스는 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 획득한다.
102. 디코딩 디바이스는 저주파수 대역 신호에 따라 고주파수 대역 신호의 여기 신호를 예측한다.
103. 디코딩 디바이스는 고주파수 대역 신호의 주파수 포락선 및 고주파수 대역 신호의 여기 신호에 따라 고주파수 대역 신호를 복원시킨다.
이 실시예에서, 예측에 의해 획득된 고주파수 대역 신호는 주파수 도메인 신호이다.
이 실시예에서 고주파수 대역 신호를 예측하기 위한 방법에 따르면, 고주파수 대역 신호의 주파수 포락선은 신호 타입에 따라 획득되고, 상이한 타입의 신호에 대해, 상이한 스펙트럼 계수가 포락선을 디코딩하기 위해 사용되고, 따라서, 고주파수 대역 고조파 신호이며 저주파수 대역 신호에 따라 예측된 여기는 원래 고조파 특성을 유지할 수 있고, 이에 의해 예측 프로세스에서 과도한 잡음의 유입을 회피하고, 예측에 의해 획득된 고주파수 대역 신호와 실제 고주파수 대역 신호 사이에 존재하는 에러를 효과적으로 감소시키고, 예측된 고주파수 대역 신호의 정확도 레이트를 증가시킬 수 있다.
선택적으로, 전술한 실시예의 기술적 해법에 기반하여, 도 3에 도시된 실시예이면서 후속하는 확장 기술 해법에 의해 형성되는 확장 실시예가 또한 포함될 수 있다. 이러한 확장 실시예에서, 단계(101)에서, "디코딩 디바이스가 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 획득한다"는 것은 구체적으로 후속하는 2가지 경우들을 포함할 수 있다:
제1 경우에서, 신호 타입이 비-고조파 신호일 때, 디코딩 디바이스는 수신된 비트스트림을 디코딩하여 고주파수 대역 신호의 주파수 포락선을 획득하고; 신호 타입이 고조파 신호일 때, 디코딩 디바이스는 수신된 비트스트림을 디코딩하여 고주파수 대역 신호의 초기 주파수 포락선을 획득하고, 고주파수 대역 신호의 주파수 포락선으로서 초기 주파수 포락선 및 N개의 인접한 초기 주파수 포락선들에 대한 가중 계산을 수행함으로써 획득된 값을 사용하고, N은 1보다 더 크거나 같다.
이 경우, 고조파 신호 또는 비-고조파 신호와는 무관하게, 고주파수 대역 신호이며 디코딩 디바이스에 의해 수신된 비트스트림을 디코딩함으로써 획득된 주파수 포락선은 동일하다. 비-고조파 신호에 대해, 고주파수 대역 신호이며 디코딩에 의해 획득된 주파수 포락선은 고주파수 대역 신호이며, 획득될 필요가 있는 주파수 포락선이다. 고조파 신호에 대해, 고주파수 대역 신호이며 디코딩 디바이스에 의한 디코딩에 의해 획득된 주파수 포락선은 고주파수 대역 신호의 초기 주파수 포락선이고, 고주파수 대역 신호의 주파수 포락선으로서 초기 주파수 포락선 및 N개의 인접한 초기 주파수 포락선들에 대해 가중 계산을 수행함으로써 획득된 값을 추가로 사용할 필요성이 존재하며, N은 1보다 더 크거나 같다. 이러한 방식으로, 고주파수 대역 신호이며 고조파 신호에 대응하는 주파수 포락선에 의해 커버되는 서브대역의 폭이, 고주파수 대역 신호이며 비-고조파 신호에 대응하는 주파수 포락선에 의해 커버되는 폭보다 더 넓다는 점이 학습될 수 있다.
N의 값은 고조파 신호의 고주파수 대역 신호의 주파수 포락선에 의해 커버되는 서브대역의 폭 및 비-고조파 신호의 고주파수 대역 신호의 주파수 포락선에 의해 커버되는 서브대역의 폭에 따라 결정될 수 있다. 예를 들어, 이전의 실시예에서, 신호 타입이 고조파 신호일 때, 각각의 서브대역 내에 40개의 스펙트럼 계수들이 존재하고, 신호 타입이 비-고조파 신호일 때, 각각의 서브대역에 24개의 스펙트럼 계수들이 존재한다. 디코딩 디바이스가 신호 타입이 고조파 신호라고 결정하고, 고주파수 대역 신호이며 비트스트림 내에 반송되는 주파수 포락선이 비-고조파 신호에 대응하는 주파수 포락선이면, 이 경우, 비트스트림 내의 2개의 인접하는 주파수 포락선들이 평균화되어 고조파 신호에 대응하는 주파수 포락선을 획득할 수 있다.
예를 들어, 초-광대역 신호에 대해, 8 kHz - 14 kHz 범위 내에 240개의 스펙트럼 계수들이 존재한다. 신호 타입이 고조파 신호일 때, 240개의 스펙트럼 계수들은 균등하게 6개의 서브대역들로 분류될 수 있고, 각각의 서브대역 내에 40개의 스펙트럼 계수들이 존재하며, 하나의 주파수 포락선이 각각의 서브대역에 대해 계산되고, 총 6개의 주파수 포락선들이 계산된다. 그러나, 신호 타입이 비-고조파 신호일 때, 240개의 스펙트럼 계수들은 균등하게 10개의 서브대역들로 분류되고, 각각의 서브대역 내에 24개의 스펙트럼 계수들이 존재하며, 하나의 주파수 포락선이 각각의 서브대역에 대해 계산되고, 총 10개의 주파수 포락선들이 계산된다.
제2의 경우, 비트스트림이 신호 타입에 따라 디코딩되어 고주파수 대역 신호의 대응하는 주파수 포락선을 획득하고, 비트스트림은 신호 타입, 및 고주파수 대역 신호의 주파수 포락선이며 신호 타입에 대응하는 인코딩 인덱스를 포함한다.
단계(101)의 이전의 제1 구현 경우에서, 디코딩 디바이스는 오디오 신호의 신호 타입, 즉, 고조파 신호 또는 비-고조파 신호에 관한 정보를 획득할 필요가 있다. 상이한 구현 방식들이 존재할 수 있다. 하나의 구현 방식에서, 인코딩 디바이스는 오디오 신호의 신호 타입을 결정하고, 신호 타입을 인코딩하고, 인코딩된 신호 타입을 디코딩 디바이스에 전송한다. 또다른 구현 방식에서, 디코딩 디바이스는 디코딩에 의해 획득된 저주파수 대역 신호에 따라 오디오 신호의 타입을 결정한다. 여기서, 오디오 신호의 신호 타입은 구체적으로 오디오 신호의 고주파수 대역 신호의 신호 타입, 즉, 고주파수 대역 신호가 고조파 신호인지 또는 비-고조파 신호인지를 지칭할 수 있다.
고조파 신호는 프로세싱될 주파수 대역에서 주파수 스펙트럼 진폭이 급격하게 변동하는 신호를 지시하며, 특정량의 진폭 피크들이 특정 주파수 대역에 존재함을 나타낼 수 있다. 기존의 방법은 오디오 신호가 고조파 신호인지 또는 비-고조파 신호인지를 결정하기 위해 인코더 측 또는 디코더 측에 의해 사용될 수 있다. 예를 들어, 방법에서, 주파수 도메인 신호는 N개의 서브대역들로 분할되고, 각각의 서브대역의 피크-대-평균비(피크-대-평균비는 그 진폭이 서브대역 내에서 가장 큰 스펙트럼 계수 대 서브대역 내의 진폭들의 평균값의 비임)가 계산되고, 피크-대-평균비가 서브대역들의 수량에 의해 주어진 임계값보다 더 크고, 서브대역들의 수량이 주어진 값보다 더 클 때, 이 경우 신호는 고조파 신호이고, 그렇지 않은 경우 신호는 비-고조파 신호이다.
"디코딩 디바이스가 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득한다"라는 단계(100)는 구체적으로 후속하는 두 방식들을 포함할 수 있다:
제1 방식에서, 디코딩 디바이스는 수신된 비트스트림을 디코딩하여 신호 타입 및 저주파수 대역 신호를 획득한다. 저주파수 대역 신호의 양자화 파라미터가 구체적으로 저주파수 대역 신호를 고유하게 식별하기 위해 사용될 수 있다는 점에 유의해야 한다. 따라서, 수신된 비트스트림을 디코딩하여 저주파수 대역 신호를 획득하는 것은 또한 구체적으로 저주파수 대역 신호의 양자화 파라미터를 획득하는 것일 수 있다.
이 경우, 인코딩 디바이스에 의해 송신되고 디코딩 디바이스에 의해 수신된 비트스트림은 신호 타입, 저주파수 대역 신호의 양자화 파라미터 및 고주파수 대역 신호의 주파수 포락선을 반송한다. 이 경우, 고조파 신호 또는 비-고조파 신호와는 무관하게, 고주파수 대역 신호의 신호 포락선은 동일하다. 대응적으로, 신호 타입이 고조파 신호 또는 비-고조파 신호인지의 여부는 인코딩 디바이스 측에 의해 결정된다. 그러나, 인코딩 디바이스는 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 조정하지 않으며; 대신, 인코딩 디바이스는 원래 오디오 신호에 따라 고주파수 대역 신호의 주파수 포락선을 결정한다. 반면, 인코딩 디바이스는 추가로 저주파수 대역 신호를 결정할 필요가 있다. 이후, 인코딩 디바이스는 신호 타입, 및 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 인코딩 인덱스들을 반송하는 비트스트림을 디코딩 디바이스에 송신한다. 일반적으로, 고주파수 대역 신호의 고조파 속성은 저주파수 대역 신호의 고조파 속성과 일치하지만, 저주파수 대역 신호의 고조파 속성이 강하며 고주파수 대역 신호가 가능하게는 고조파를 가지지 않는 특별한 경우가 또한 존재한다. 따라서, 이 실시예에서, 오디오 신호이며 인코딩 디바이스에 의해 획득되는 신호 타입은 고주파수 대역 신호의 신호 타입일 수 있거나, 또는 저주파수 대역 신호의 신호 타입일 수 있다. 전자의 방식은 후자의 경우에 비해 더 정확하다.
제2 방식에서, 디코딩 디바이스는 비트스트림을 디멀티플렉싱하여 저주파수 대역 신호를 획득하고, 저주파수 대역 신호에 따라 신호 타입을 결정한다.
이전의 제1 방식에 비해, 이 방식에서, 신호 타입은 인코딩 디바이스에 의해 송신되고 디코딩 디바이스에 의해 수신되는 비트스트림에서 반송되지 않으며; 대신, 신호 타입은 디멀티플렉싱에 의해 획득된 저주파수 대역 신호에 따라 디코딩 디바이스에 의해 결정된다. 유사하게, 저주파수 대역 신호의 양자화 파라미터는 저주파수 대역 신호를 고유하게 식별하기 위해 사용될 수 있다. 선택적으로, 이 방식에서, 인코딩 디바이스에 의해 송신된 비트스트림은 또한 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 인코딩 인덱스들만을 반송할 수 있다. 비트스트림을 수신한 이후, 디코딩 디바이스는 비트스트림을 디멀티플렉싱하여 저주파수 대역 신호를 획득하고, 저주파수 대역 신호에 따라 신호 타입을 결정한다. 이 방식이 인코딩 디바이스 측에 적용될 때, 종래 기술이 사용될 수 있다. 즉, 신호 타입을 결정할 필요가 없으며, 디코딩 디바이스에 송신된 비트스트림은 신호 타입을 반송하지 않는다. 인코딩 디바이스 측에서의 프로세싱에 대한 상세내용들에 대해서는, 관련 종래 기술을 참조한다. 상세내용들은 본원에 다시 기재되지 않는다. 전자의 방식에 비해, 이 구현 방식은 추가로 인코딩 비트들을 감소시킬 수 있다.
단계(101)의 이전의 제2 구현 경우에 대해, 디코딩 디바이스는 신호 타입에 따라 비트스트림을 디코딩하여 고주파수 대역 신호의 대응하는 주파수 포락선을 획득할 필요가 있는데, 즉, 고주파수 대역 신호의 주파수 포락선이 대응하는 인코딩 디바이스 측에서 신호 타입에 따라 비트스트림으로 인코딩될 필요가 있다. 예를 들어, 신호 타입이 고조파 신호일 때, 인코딩 디바이스는 고주파수 대역 신호의 주파수 포락선을 인코딩하기 위해 4개 비트를 사용할 수 있고, 신호 타입이 비-고조파 신호일 때, 인코딩 디바이스는 고주파수 대역 신호의 주파수 포락선을 인코딩하기 위해 5개 비트를 사용할 수 있다. 따라서, 이 경우, 디코딩 디바이스에 의해 수신된 비트스트림은 신호 타입을 반송할 필요가 있다. 따라서, 단계(101)의 제2 경우에서, 이전의 제2 방식은 단계(100)를 구현하기 위해 사용될 수 없다.
선택적으로, 도 3에 도시된 실시예의 확장 실시예에서, "디코딩 디바이스가 저주파수 대역 신호에 따라 고주파수 대역 신호의 여기 신호를 예측한다"라는 단계(102)는 구체적으로 관련된 통상의 기술을 사용함으로써 구현될 수 있거나, 또는 바람직하게는, 구체적으로, 후속하는 단계들을 사용함으로써 구현될 수 있다:
(1) 디코딩 디바이스는 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈을 결정한다.
예를 들어, 디코딩 디바이스는 인코딩 디바이스에 의해 송신된 수신된 비트스트림 내의 저주파수 대역 신호에 따라 비트가 할당되는, 가장 높은 주파수 빈을 결정할 수 있다. 저주파수 대역 신호의 양자화 파라미터가 저주파수 대역 신호를 고유하게 식별하기 위해 사용될 때, 비트가 할당되는, 가장 높은 주파수 빈은 저주파수 대역 신호의 양자화 파라미터에 따라 결정될 수 있다. 예를 들어, 이 실시예에서, flast _ sfm은 비트가 할당되는, 가장 높은 주파수 빈을 지시하기 위해 사용된다.
(2) 디코딩 디바이스는 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 작은지를 결정하고; 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 작을 때 단계 (3)을 수행하고; 그렇지 않은 경우, 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 크거나 같을 때, 단계 (4)를 수행한다.
(3) 디코딩 디바이스는 미리 결정된 주파수 대역 범위 내에 있고 저주파수 대역 신호 내에 있는 여기 신호, 및 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈에 따라 고주파수 대역 신호의 여기 신호를 예측한다.
(4) 디코딩 디바이스는 미리 결정된 주파수 대역 범위 내에 있고 저주파수 대역 신호 내에 있는 여기 신호, 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈, 및 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈에 따라 고주파수 대역 신호의 여기 신호를 예측한다.
또한 선택적으로, 디코딩 디바이스가 미리 결정된 주파수 대역 범위 내에 있고 저주파수 대역 신호 내에 있는 여기 신호, 및 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈에 따라 고주파수 대역 신호의 여기 신호를 예측하는 단계 (3)은:
미리 결정된 주파수 대역 범위 내에서 여기 신호의 n개 복제본들을 만들고, 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈과 대역폭 확장 주파수 대역의 가장 높은 주파수 빈 사이의 여기 신호로서 여기 신호의 n개 복제본들을 사용하는 것을 포함한다.
이 실시예에서, n은 양의 정수 또는 양의 소수(decimal)이고, n은 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈과 대역폭 확장 주파수 대역의 가장 높은 주파수 빈 사이의 주파수 빈들의 수량 대 미리 결정된 주파수 대역 범위 내의 주파수 빈들의 수량의 비와 같다.
예를 들어, 이 실시예에서, fbwe _start는 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈을 표시하기 위해 사용될 수 있다. fbwe _start의 선택은 인코딩 레이트(즉, 비트들의 전체 수량)에 관한 것이다. 더 높은 인코딩 레이트는 고주파수 대역 신호의 대역폭 확장의 더 높은 미리 설정된 시작 주파수 빈 fbwe _start이 선택될 수 있음을 나타낸다. 예를 들어, 초-광대역 신호에 대해, 인코딩 레이트가 24 kbps일 때, 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈 fbwe _start은 6.4 kHz와 같고, 인코딩 레이트가 32 kbps일 때, 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈 fbwe _ start은 8 kHz와 같다.
예를 들어, 이 실시예에서, 미리 결정된 주파수 대역 범위 내에서 저주파수 대역 신호에 있는 여기 신호는 fexc _start 내지 fexc _end의 주파수 대역 범위 내에서 저주파수 대역 신호에 있는 여기 신호로서 표시될 수 있고, 여기서 fexc _start는 미리 결정된 주파수 대역 범위에 있으며 저주파수 대역 신호에 있는 시작 주파수 빈이고, fexc_end는 미리 결정된 주파수 대역 범위에 있고 저주파수 대역 신호에 있는 종료 주파수이고, fexc _end는 fexc _start보다 더 크다. fexc _start 내지 fexc _end의 미리 결정된 주파수 대역 범위의 선택은 신호 타입 및 인코딩 레이트에 관련된다. 예를 들어, 상대적으로 낮은 레이트의 경우, 고조파 신호에 대해, 저주파수 대역 신호들에서의 상대적으로 양호한 인코딩을 이용하여 상대적으로 저주파수 대역 신호가 선택되고, 비-고조파 신호에 대해, 저주파수 대역 신호들에서 상대적으로 열악한 인코딩을 이용하여 상대적으로 고주파수 대역 신호가 선택된다. 상대적으로 높은 레이트의 경우, 고조파 신호에 대해, 저주파수 대역 신호들에서의 상대적으로 고주파수 대역 신호가 선택될 수 있다.
예를 들어, 이 실시예에서, 대역폭 확장 주파수 대역의 가장 높은 주파수 빈은 ftop _ sfm로서 표시될 수 있다.
이 경우, fexc _start 내지 fexc _end의 주파수 대역 범위 내의 여기 신호의 n개 복제본들은 fbwe _start와 ftop _ sfm 사이의 여기 신호로서 사용되고, n은 fbwe _start와 ftop _ sfm 사이의 주파수 빈들의 수량 대 fexc _start 내지 fexc _end의 범위 내의 주파수 빈들의 수량의 비와 같으며, 구체적으로 양의 정수 또는 양의 소수일 수 있다.
이 실시예에서, 디코딩 디바이스가, fbwe _start에서 시작하여 fexc _start 내지 fexc_end의 주파수 대역 범위 내에서 여기 신호의 n개 복제본들을 만들고, 고주파수 대역 신호이며 fbwe _start와 ftop _ sfm 사이에 있는 여기 신호로서 여기 신호의 n개 복제본들을 사용하는 것은, 구체적으로 후속하는 방식으로 구현될 수 있다: 디코딩 디바이스는, fbwe _start에서 시작하여, fexc _start 내지 fexc _end의 주파수 대역 범위 내에서 n의 정수 부분의 수량 내에 있는 여기 신호를 연속적으로 복제하고, fexc _start 내지 fexc_end의 주파수 대역 범위 내에서 n의 비-정수 부분의 수량 내에 있는 여기 신호를 복제하고; 그리고 fbwe _start와 ftop _ sfm 사이의 고주파수 대역 여기 신호로서 여기 신호들의 2개 부분들을 사용하며, 여기서 n의 비-정수 부분은 1보다 더 작다.
이 실시예에서, fexc _start 내지 fexc _end의 주파수 대역 범위 내에서 n의 정수 부분의 수량에 있는 저주파수 대역 여기 신호가 복제될 때, 여기 신호는 연속적으로 복제될 수 있는데, 즉, fexc _start 내지 fexc _end의 주파수 대역 범위 내의 여기 신호의 하나의 복제본은 fexc _start 내지 fexc _end의 주파수 대역 범위 내에서 여기 신호의 n개 복제본들이 만들어질 때까지 매번 만들어지고; 또는 거울 복제(또는 폴드 복제(fold copying)로서 지칭됨)가 수행될 수 있는데, 즉, fexc _start 내지 fexc _end의 주파수 대역 범위 내의 여기 신호의 정수 복제본들이 만들어질 때, 순방향 복제(즉, fexc_start에서 fexc _end로) 및 역방향 복제(즉, fexc _end에서 fexc _start로)의 스태거형 복제(staggered copying)가 n개 복제본들이 완료될 때까지 연속적으로 수행된다.
대안적으로, 디코딩 디바이스는, ftop _ sfm에서 시작하여, fexc _start 내지 fexc _end의 주파수 대역 범위 내에서 여기 신호의 n개 복제본들을 만들고, fbwe _start와 ftop _ sfm 사이의 고주파수 대역 여기 신호로서 여기 신호의 n개 복제본들을 사용하는데, 이는 구체적으로, 후속하는 방식으로 구현될 수 있다: 디코딩 디바이스는, ftop _ sfm에서 시작하여, 연속적으로 fexc _start 내지 fexc _end의 주파수 대역 범위 내에서 n의 비-정수 부분의 수량 내에 있는 여기 신호를 복제하고, fexc _start 내지 fexc _end의 주파수 대역 범위 내에서 n의 정수 부분의 수량 내에 있는 여기 신호를 복제하고, fbwe _start와 ftop_sfm 사이의 고주파수 대역 여기 신호로서 여기 신호들의 2개 부분들을 사용하고, n의 비-정수 부분은 1보다 더 작다.
구체적으로, ftop _ sfm에서 시작하여, fexc _start 내지 fexc _end의 주파수 대역 범위 내에서 n의 비-정수 부분의 수량 내에 있는 여기 신호를 복제하는 것은 블록에 의한 복제에 속한다. 예를 들어, 고주파수 대역 신호의 가장 높은 주파수 빈은 14 kHz이고, fexc _start 내지 fexc _end는 1.6 kHz 내지 4 kHz이다. fexc _start 내지 fexc _end, 즉, 1.6 kHz 내지 2.8 kHz의 0.5개 복제본들의 여기 신호가 선택될 때, 이 단계의 해법을 사용함으로써, 1.6 kHz 내지 2.8 kHz의 여기 신호는 (14-1.2) kHz와 14 kHz 사이의 대역폭 확장 주파수 대역으로 복제되고, 이 고주파수 대역 신호의 여기 신호로서 사용될 수 있다. 이 경우, 1.6 kHz는 대응적으로 (14-1.2) kHz로 복제되고, 2.8 kHz는 대응적으로 14 kHz로 복제된다.
이전의 두 방식들에서, fbwe _start 또는 ftop _ sfm로부터 복제를 수행하기 시작하는 것과는 무관하게, fbwe _start와 ftop _ sfm 사이에 있는 그리고 예측에 의해 최종적으로 획득되는 고주파수 대역 여기 신호의 결과들은 동일하다.
이전 해법의 구현 프로세스에서, 비(ratio) n은 먼저 fbwe _start와 ftop _ sfm 사이의 주파수 빈들의 수량을 fexc _start와 fexc _end 사이의 주파수 빈들의 수량으로 나눔으로써 계산될 수 있다.
또한 선택적으로, 디코딩 디바이스가 미리 결정된 주파수 대역 범위 내에 있고 저주파수 대역 신호 내에 있는 여기 신호, 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈, 및 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈에 따라 고주파수 대역 신호의 여기 신호를 예측한다는 단계 (4)는:
미리 결정된 주파수 대역 범위의 시작 주파수 빈 fexc _start 위의 m번째 주파수 빈으로부터 미리 결정된 주파수 대역 범위의 종료 주파수 빈 fexc _end으로 여기 신호를 복제하고 미리 결정된 주파수 대역 범위 내에서 여기 신호의 n개 복제본들을 만드는 것, 및 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈과 대역폭 확장 주파수 대역의 가장 높은 주파수 빈 사이의 여기 신호로서 여기 신호들의 2개 부분들을 사용하는 것을 포함한다.
이 실시예에서, n은 0, 양의 정수 또는 양의 소수이고, m은 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈과 확장 주파수 대역의 미리 설정된 시작 주파수 빈 사이의 주파수 빈들의 수량이며, (flast _ sfm - fbwe _start)로서 표시될 수 있다.
이 경우, fexc _start보다 더 큰 (flast _ sfm - fbwe _start)번째 주파수로부터 fexc _end로 여기 신호가 복제되고, fexc _start 내지 fexc _end의 주파수 대역 범위 내에서 여기 신호의 n개 복제본들이 만들어지고, 여기 신호들의 2개 부분들이 flast _ sfm와 ftop _ sfm 사이의 여기 신호로서 사용되고, n은 0, 양의 정수, 또는 양의 소수일 수 있다.
특정 구현 동안, 디코딩 디바이스는, flast _ sfm에서 시작하여, (fexc_start+(flast_sfm-fbwe_start)) 내지 fexc _end의 주파수 대역 범위 내의 여기 신호, fexc_start 내지 fexc _end에 그리고 n의 정수 부분의 수량 내에 있는 여기 신호, 및 fexc_start 내지 fexc _end의 주파수 대역 범위 내에서 n의 비-정수 부분의 수량 내에 있는 여기 신호를 연속적으로 복제하고; flast _ sfm와 ftop _ sfm 사이의 고주파수 대역 여기 신호로서 여기 신호들의 3개 부분들을 사용할 수 있고, n의 비-정수 부분은 1보다 더 작다.
대안적으로, 디코딩 디바이스는, ftop _ sfm에서 시작하여, 연속적으로 fexc _start 내지 fexc _end까지의 여기 신호의 n개 복제본들을 만들고 (fexc _start+(flast _ sfm- fbwe _start)) 내지 fexc _end의 주파수 대역 범위 내의 여기 신호를 복제하고, flast _ sfm와 ftop _ sfm 사이의 고주파수 대역 여기 신호로서 여기 신호들의 2개 부분들을 사용할 수 있고, 여기서, 유사하게, n은 0, 양의 정수 또는 양의 소수이다.
특정 구현 동안, 디코딩 디바이스는, ftop _ sfm에서 시작하여, fexc _start 내지 fexc_end의 주파수 대역 범위 내에서 n의 비-정수 부분의 수량 내에 있는 여기 신호, fexc_start 내지 fexc _end의 주파수 대역 범위 내에서 n의 정수 부분의 수량에 있는 여기 신호, 및 (fexc _start+(flast _ sfm - fbwe _start)) 내지 fexc _end의 주파수 대역 범위 내의 여기 신호를 연속적으로 복제하고; flast _ sfm와 ftop _ sfm 사이의 고주파수 대역 여기 신호로서 여기 신호들의 3개 부분들을 사용할 수 있고, n의 비-정수 부분은 1보다 더 작다.
디코딩 디바이스가 ftop _ sfm로부터 예측을 수행하기 시작할 때, fexc _start 내지 fexc_end의 주파수 대역 범위 내에서 n의 비-정수 부분의 수량 내에 있는 여기 신호를 복제하는 것은 또한 블록에 의한 복제에 속한다. 저주파수 대역 범위 내의 저주파수 빈에 대응하는 여기 신호는 고주파수 대역 내의 대응하는 저주파수 빈에 위치되고, 저주파수 대역 범위 내의 고주파수 빈에 대응하는 여기 신호는 고주파수 대역 내의 대응하는 고주파수 빈에 위치된다. 상세 내용에 대해서는, 이전의 관련된 기록들을 참조한다. 유사하게, fexc _start 내지 fexc _end의 주파수 대역 범위 내에서 n의 정수 부분의 수량 내에 있는 저주파수 대역 여기 신호의 복제는 또한 연속적 복제 또는 미러 복제일 수 있다. 상세 내용에 대해서는, 이전의 관련된 기록들을 참조한다. 상세 내용은 여기서 다시 기술되지 않는다.
이전의 두 방식들에서, flast _ sfm 또는 ftop _ sfm로부터 flast _ sfm와 ftop _ sfm 사이의 고주파수 대역 여기 신호를 예측하기 시작하는 것과는 무관하게, flast _ sfm와 ftop _ sfm 사이에 있으며 예측에 의해 최종적으로 획득되는 고주파수 대역 여기 신호의 결과들은 동일하다.
추가로, 이전의 해법에서, (fexc _start+(flast _ sfm - fbwe _start)) 내지 fexc _end의 대역폭이 flast _ sfm와 ftop _ sfm 사이의 주파수 빈들의 수량보다 더 크거나 같을 때, (fexc_start+(flast_sfm - fbwe _start)) 내지 fexc _end의 대역폭에서 (fexc _start+(flast _ sfm - fbwe_start))로부터 시작하여, 그 주파수 빈 범위가 flast _ sfm 내지 ftop _ sfm인 여기 신호를 획득하고 flast _ sfm와 ftop _ sfm 사이의 여기 신호로서 여기 신호를 사용할 필요성만이 존재한다.
이전 해법의 구현 프로세스에서, 비, 즉 n은 먼저 (fexc _start+(flast _ sfm - fbwe_start))와 flast _ sfm와 ftop _ sfm 사이의 주파수 빈들의 수량 사이의 차이를 fexc _start와 fexc_end 사이의 주파수 빈들의 수량으로 나눔으로써 획득하도록 계산될 수 있고, n은 0, 양의 정수, 또는 양의 소수일 수 있다.
예를 들어, 인코딩 레이트가 24 kbps일 때, fbwe _start는 6.4 kHz와 같고, ftop_sfm는 14 kHz이다. 고주파수 대역 신호의 여기 신호는 후속하는 방식으로 예측된다: 미리 선택된 저주파수 대역 신호의 확장 범위가 0 kHz-4 kHz이고, N번째 프레임에서 비트가 할당되는, 가장 높은 주파수 flast _ sfm가 8 kHz라고 가정되며; 이 경우, flast _ sfm는 fbwe _start보다 더 크다. 따라서, 제1 자가-적응형 정규화 프로세싱(self-adaptive normalization processing)이 그것의 확장 범위가 0 kHz-4 kHz인 저주파수 대역 신호의 선택된 여기 신호에 대해 수행되고(자가-적응형 정규화 프로세싱의 특정 프로세스에 대해서는, 전술한 실시예에서의 기록들을 참조한다; 상세내용은 여기서 다시 기술되지 않는다), 이후, 8 kHz보다 더 큰 고주파수 대역 신호의 여기 신호는 저주파수 대역 신호의 정규화된 여기 신호에 따라 예측된다. 전술한 실시예에서의 방식에 따르면, 저주파수 대역 신호의 선택된 정규화된 여기 신호를 복제하기 위한 순서는 다음과 같다: 먼저, (8 kHz - 6.4 kHz) 내지 4 kHz의 저주파수 대역 범위 내의 여기 신호가 복제되고, 이후, fexc _start 내지 fexc _end (0 kHz - 4 kHz)의 저주파수 대역 범위의 0.9개 복제본들 내의 여기 신호가 복제되는데, 즉, 0 kHz 내지 3.6 kHz의 저주파수 대역 범위 내의 여기 신호가 복제되고; 여기 신호들의 2개 부분들은 비트가 할당되는, 가장 높은 주파수(flast _ sfm=8 kHz)와 고주파수 대역 신호의 가장 높은 주파수 ftop _ sfm (ftop _ sfm=14 kHz) 사이의 고주파수 대역 여기 신호로서 사용된다. (N+1)번째 프레임에서 비트가 할당되는, 가장 높은 주파수 flast_sfm가 6.4 kHz보다 더 작거나 같은 경우(고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈 fbwe _start은 6.4 kHz와 같다), 자가-적응형 정규화 프로세싱이 저주파수 대역 신호이며 0 kHz - 4 kHz의 주파수 대역 범위 내에 있는 선택된 여기 신호에 대해 수행되고, 이후, 6.4 kHz보다 더 큰 고주파수 대역 신호의 여기 신호가 저주파수 대역 신호의 정규화된 여기 신호에 따라 예측된다. 전술한 실시예에서의 방식에 따르면, 저주파수 대역 신호의 선택된 정규화된 여기 신호를 복제하기 위한 순서는 다음과 같다: 먼저, fexc _start 내지 fexc _end (0 kHz - 4 kHz)의 저주파수 대역 범위 내의 여기 신호의 하나의 복제본이 만들어지고, 이후 fexc _start 내지 fexc _end (0 kHz - 4 kHz)의 저주파수 대역 범위의 0.9개 복제본들 내의 여기 신호가 복제되고, 여기 신호들의 2개 부분들은 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈(fbwe _start=6.4 kHz)과 고주파수 대역 신호의 가장 높은 주파수 ftop _ sfm (ftop _ sfm=14 kHz) 사이의 고주파수 대역 여기 신호로서 사용된다.
고주파수 대역 신호의 가장 높은 주파수 빈은 주파수 도메인 신호의 타입에 따라 결정된다. 예를 들어, 주파수 도메인 신호의 타입이 초-광대역 신호일 때, 고주파수 대역 신호의 가장 높은 주파수 ftop _ sfm는 14kHz이다. 서로 통신하기 이전에, 일반적으로, 인코딩 디바이스 및 디코딩 디바이스는 전송될 주파수 도메인 신호의 타입을 결정하고; 따라서, 주파수 도메인 신호의 가장 높은 주파수 빈이 결정된 것으로 간주될 수 있다.
전술한 실시예에서의 고주파수 대역 신호를 예측하기 위한 방법에 따르면, 전술한 기술적 해법을 사용함으로써, 고조파 신호 및 비-고조파 신호에 대해, 상이한 포락선 정보를 이용하여, 고주파수 대역 신호를 예측하고, 이에 의해 예측 프로세스에서의 과도한 잡음의 유입을 회피하고, 수정에 의해 획득된 고주파수 대역 신호와 실제 고주파수 대역 신호 사이에 존재하는 에러를 효과적으로 감소시키고, 예측된 고주파수 대역 신호의 정확도 레이트를 증가시킨다.
추가로, 고주파수 대역 신호의 여기 신호의 이전 예측으로부터, N번째 프레임과 (N+1)번째 프레임에서의 대역폭 확장의 시작 주파수 빈들이 상이하더라도, 8 kHz보다 더 큰 동일한 주파수 대역의 여기 신호가 저주파수 대역 신호의 동일한 주파수 대역의 여기 신호로부터의 예측에 의해 획득된다는 점이 발견될 수 있고; 따라서 프레임들의 연속성이 보장될 수 있다.
전술한 실시예의 기술적 해법을 사용함으로써, 고주파수 대역 신호들이며 전 프레임 및 후 프레임에서 예측되는 여기 신호들의 연속성이 효과적으로 보장될 수 있고, 이에 의해 복원된 고주파수 대역 신호의 청각적 품질을 보장하고, 오디오 신호의 청각적 품질을 향상시킨다.
도 4는 본 발명의 또다른 실시예에 따라 고주파수 대역 신호를 예측하기 위한 방법의 흐름도이다. 이 실시예에서, 고주파수 대역 신호를 예측하기 위한 방법이 인코딩 디바이스에 의해 실행될 수 있다. 도 4에 도시된 바와 같이, 이 실시예에서, 고주파수 대역 신호를 예측하기 위한 방법은 구체적으로 후속하는 단계들을 포함할 수 있다:
200. 인코딩 디바이스는 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하고, 이 실시예에서의 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 이 실시예에서의 오디오 신호는 저주파수 대역 신호 및 고주파수 대역 신호를 포함한다.
201. 인코딩 디바이스는 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 인코딩하여 고주파수 대역 신호의 주파수 포락선을 획득한다.
202. 인코딩 디바이스는 신호 타입, 저주파수 대역 신호 및 고주파수 대역 신호의 주파수 포락선을 반송하는 비트스트림을 디코딩 디바이스에 송신한다.
이 실시예에서, 본 발명의 실시예들에서의 기술적 해법들은 인코딩 디바이스 측에서 기술되고, 이 실시예에서, 비트스트림은 신호 타입, 및 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 인코딩 인덱스들을 반송한다.
대응적으로, 디코딩 디바이스 측에서, 디코딩 디바이스는 비트스트림을 수신하고, 수신된 비트스트림을 디멀티플렉싱하여 신호 타입 및 저주파수 대역 신호를 획득하고, 이후 신호 타입에 따라 수신된 비트스트림을 디코딩하여 고주파수 대역 신호의 대응하는 주파수 포락선을 획득한다. 이후, 디코딩 디바이스는 저주파수 대역 신호에 따라 고주파수 대역 신호의 여기 신호를 예측하고, 고주파수 대역 신호의 주파수 포락선 및 고주파수 대역 신호의 여기 신호에 따라 고주파수 대역 신호를 복원시킨다. 구체적으로, 이 실시예는 디코딩 디바이스에 의해 수신된 비트스트림이 신호 타입, 및 도 3에 도시된 실시예의 이전 확장 실시예에서, 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 양자화 파라미터의 인코딩 인덱스들을 반송하는 것에 대응한다. 특정 구현 프로세스의 상세내용에 대해, 도 3에 도시된 실시예의 이전 확장 실시예에서의 관련 기록들을 참조한다. 상세내용들은 여기서 다시 기술되지 않는다.
이 실시예에서의 고주파수 대역 신호를 예측하기 위한 방법에 따르면, 인코딩 디바이스는 신호 타입 및 저주파수 대역 신호를 획득하고, 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 인코딩하여 고주파수 대역 신호의 주파수 포락선을 획득하고, 신호 타입, 저주파수 대역 신호, 및 고주파수 대역 신호의 주파수 포락선을 반송하는 비트스트림을 디코딩 디바이스에 송신하고, 따라서, 디코딩 디바이스는 비트스트림을 디코딩하여 저주파수 대역 신호 및 신호 타입의 양자화 파라미터를 획득하고, 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 획득하고, 저주파수 대역 신호의 양자화 파라미터에 따라 고주파수 대역 신호의 여기 신호를 예측하고, 이후 고주파수 대역 신호의 주파수 포락선 및 고주파수 대역 신호의 여기 신호에 따라 고주파수 대역 신호를 예측한다. 이 실시예에서의 기술적 해법을 사용함으로써, 예측 프로세스에서 과도한 잡음들의 유입이 회피될 수 있고, 예측에 의해 획득된 고주파수 대역 신호와 실제 고주파수 대역 신호 사이에 존재하는 에러가 효과적으로 감소될 수 있고, 예측된 고주파수 대역 신호의 정확도 레이트가 증가할 수 있다.
유사하게 그리고 선택적으로, 전술한 실시예의 기술적 해법에서, 201에서, 인코딩 디바이스는 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 인코딩하여 고주파수 대역 신호의 주파수 포락선을 획득한다. 예를 들어, 신호 타입이 비-고조파 신호일 때, 제1 수량의 스펙트럼 계수들이 고주파수 대역 신호의 주파수 포락선을 계산하기 위해 사용되고, 신호 타입이 고조파 신호일 때, 제2 수량의 스펙트럼 계수들이 고주파수 대역 신호의 주파수 포락선을 계산하기 위해 사용되고, 제2 수량은 제1 수량보다 더 크다. 이러한 방식으로, 고주파수 대역 신호이며 신호 타입이 고조파 신호일 때 인코딩 디바이스에 의한 인코딩에 의해 획득되는 주파수 포락선에 의해 커버되는 서브대역의 폭은, 고주파수 대역 신호이며 신호 타입이 비-고조파 신호일 때 인코딩 디바이스에 의한 인코딩에 의해 획득되는 주파수 포락선에 의해 커버되는 서브대역의 폭보다 더 크다. 특정 구현 프로세스의 상세 내용에 대해서는, 도 3 및 도 3에 도시된 실시예의 이전 확장 실시예에서의 기록들을 참조한다. 상세 내용은 여기서 다시 기술되지 않는다.
도 5는 본 발명의 또다른 실시예에 따른 고주파수 대역 신호를 예측하기 위한 방법의 흐름도이다. 이 실시예에서, 고주파수 대역 신호를 예측하기 위한 방법은 인코딩 디바이스에 의해 실행될 수 있다. 도 5에 도시된 바와 같이, 이 실시예에서, 고주파수 대역 신호를 예측하기 위한 방법은 구체적으로 후속하는 단계들을 포함할 수 있다:
300. 인코딩 디바이스는 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득한다.
이 실시예에서, 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 오디오 신호는 저주파수 대역 신호 및 고주파수 대역 신호를 포함한다.
301. 인코딩 디바이스는 고주파수 대역 신호의 주파수 포락선을 계산한다.
이 실시예에서, 고조파 신호의 고주파수 대역 신호의 주파수 포락선을 계산하기 위한 방법은 비-고조파 신호의 방법과 동일하다.
302. 인코딩 디바이스는 신호 타입, 및 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 인코딩 인덱스들을 반송하는 비트스트림을 디코딩 디바이스에 송신한다.
유사하게, 이 실시예에서, 본 발명의 실시예들에서의 기술적 해법들은 인코딩 디바이스 측에서 기술되고, 이 실시예에서, 비트스트림은 신호 타입, 및 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 인코딩 인덱스들을 반송한다.
대응적으로, 디코딩 디바이스 측에서, 디코딩 디바이스는 비트스트림을 수신하고, 수신된 비트스트림을 디멀티플렉싱하여 신호 타입 및 저주파수 대역 신호를 획득하고, 이후 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 획득한다. 예를 들어, 신호 타입이 비-고조파 신호일 때, 디코딩 디바이스는 수신된 비트스트림을 디멀티플렉싱하고, 수신된 비트스트림을 디코딩하여 고주파수 대역 신호의 주파수 포락선을 획득하고, 신호 타입이 고조파 신호일 때, 디코딩 디바이스는 수신된 비트스트림을 디멀티플렉싱하고, 수신된 비트스트림을 디코딩하여 고주파수 대역 신호의 초기 주파수 포락선을 획득하고, 고주파수 대역 신호의 주파수 포락선으로서 초기 주파수 포락선 및 N개의 인접한 초기 주파수 포락선들에 대해 가중 계산을 수행함으로써 획득된 값을 사용하고, N은 1보다 더 크거나 같다. 이후, 디코딩 디바이스는 저주파수 대역 신호에 따라 고주파수 대역 신호의 여기 신호를 예측하고, 고주파수 대역 신호의 주파수 포락선 및 고주파수 대역 신호의 여기 신호에 따라 고주파수 대역 신호를 복원시킨다. 구체적으로, 이 실시예는 도 3에 도시된 실시예의 이전 확장 실시예에서의 다른 경우에 대응한다. 특정 구현 프로세스의 상세 내용에 대해서는, 도 3 및 도 3에 도시된 실시예의 이전 확장 실시예에서의 관련 기록들을 참조한다. 상세 내용은 여기서 다시 기술되지 않는다.
이 실시예에서 고주파수 대역 신호를 예측하는 방법에 따르면, 인코딩 디바이스는 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하고, 고주파수 대역 신호의 주파수 포락선을 계산하고, 신호 타입, 및 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 인코딩 인덱스들을 반송하는 비트스트림을 디코딩 디바이스에 송신하고, 따라서, 디코딩 디바이스는 비트스트림을 디멀티플렉싱하여 신호 타입 및 저주파수 대역 신호를 획득하고, 이후 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 획득하고, 이후 저주파수 대역 신호에 따라 고주파수 대역 신호의 여기 신호를 예측하고, 고주파수 대역 신호의 주파수 포락선 및 고주파수 대역 신호의 여기 신호에 따라 고주파수 대역 신호를 복원시킨다. 이 실시예에서의 기술적 해법을 사용함으로써, 예측 프로세스에서 과도한 잡음들의 유입이 회피될 수 있고, 예측에 의해 획득된 고주파수 대역 신호와 실제 고주파수 대역 신호 사이에 존재하는 에러가 효과적으로 감소될 수 있고, 예측된 고주파수 대역 신호의 정확도 레이트가 증가할 수 있다.
통상의 기술자는 전술한 방법 실시예들의 단계들의 전부 또는 일부가 관련 하드웨어에 명령하는 프로그램에 의해 구현될 수 있다. 프로그램은 컴퓨터 판독가능한 저장 매체에 저장될 수 있다. 프로그램이 실행할 때, 방법 실시예들의 단계들이 수행된다. 전술한 저장 매체는 ROM, RAM, 자기 디스크 또는 광학 디스크와 같이, 프로그램 코드를 저장할 수 있는 임의의 매체를 포함한다.
도 6은 본 발명의 실시예에 따른 디코딩 디바이스의 개략적 구조도이다. 도 6에 도시된 바와 같이, 이 실시예에서, 디코딩 디바이스는 제1 획득 모듈(30), 제2 획득 모듈(31), 예측 모듈(32) 및 복원 모듈(33)을 포함한다.
제1 획득 모듈(30)은 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하도록 구성되고, 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 오디오 신호는 저주파수 대역 신호 및 고주파수 대역 신호를 포함한다. 제2 획득 모듈(31)은 제1 획득 모듈(30)에 접속되고, 제2 획득 모듈(31)은 제1 획득 모듈(30)에 의해 획득된 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 획득하도록 구성된다. 예측 모듈(32)은 제1 획득 모듈(30)에 접속되고, 예측 모듈(32)은 제1 획득 모듈(30)에 의해 획득된 저주파수 대역 신호에 따라 고주파수 대역 신호의 여기 신호를 예측하도록 구성된다. 복원 모듈(33)은 제2 획득 모듈(31) 및 예측 모듈(32)에 별도로 접속되고, 복원 모듈(33)은 고주파수 대역 신호이며 제2 획득 모듈(31)에 의해 획득된 주파수 포락선, 및 고주파수 대역 신호이며 예측 모듈(32)에 의한 예측에 의해 획득된 여기 신호에 따라 고주파수 대역 신호를 복원시키도록 구성된다.
이 실시예에서의 디코딩 디바이스는 고주파수 대역 신호의 예측을 구현하기 위해 전술한 모듈들을 사용하며, 이는 전술한 관련 방법 실시예들의 구현 프로세스와 동일하다. 상세 내용에 대해서는 전술한 관련 방법 실시예들에서의 기록들을 참조한다. 상세 내용은 여기서 다시 기술되지 않는다.
이 실시예에서의 디코딩 디바이스는, 상이한 타입의 신호에 대해 상이한 스펙트럼 계수가 포락선을 디코딩하기 위해 사용되고, 따라서 저주파수 대역 신호에 따라 예측된 고주파수 대역 고조파 신호의 여기 신호는 원래 고조파 특성을 유지할 수 있고, 이에 의해 예측 프로세스에서 과도한 잡음들의 유입을 회피하고, 예측에 의해 획득된 고주파수 대역 신호와 실제 고주파수 대역 신호 사이에 존재하는 에러를 효과적으로 감소시키고, 예측된 고주파수 대역 신호의 정확도 레이트를 증가시키는 것을 구현하기 위해 전술한 모듈들을 사용한다.
도 7은 본 발명의 또다른 실시예에 따른 디코딩 디바이스의 개략적 구조도이다. 이 실시예에서, 도 6에 도시된 전술한 실시예에 기반하여, 디코딩 디바이스는 후속하는 확장 기술 해법을 더 포함할 수 있다.
이 실시예에서의 디코딩 디바이스에서, 제2 획득 모듈(31)은 구체적으로: 제1 획득 모듈(30)에 의해 획득된 신호 타입이 비-고조파 신호일 때, 수신된 비트스트림을 디멀티플렉싱하고, 수신된 비트스트림을 디코딩하여 고주파수 대역 신호의 주파수 포락선을 획득하도록 구성되거나; 또는 제2 획득 모듈(31)은 구체적으로: 제1 획득 모듈(30)에 의해 획득된 신호 타입이 고조파 신호일 때, 수신된 비트스트림을 디멀티플렉싱하고, 수신된 비트스트림을 디코딩하여 고주파수 대역 신호의 초기 주파수 포락선을 획득하고, 고주파수 대역 신호의 주파수 포락선으로서 초기 주파수 포락선 및 N개의 인접한 초기 주파수 포락선들에 대해 가중 계산을 수행함으로써 획득된 값을 사용하도록 구성되고, N은 1보다 더 크거나 같다.
선택적으로, 이 실시예에서의 디코딩 디바이스에서, 제2 획득 모듈(31)은 구체적으로 제1 획득 모듈(30)에 의해 획득된 신호 타입에 따라 수신된 비트스트림을 디코딩하여, 고주파수 대역 신호의 대응하는 주파수 포락선을 획득하도록 구성된다.
선택적으로, 이 실시예에서의 디코딩 디바이스에서, 제1 획득 모듈(30)은 구체적으로, 비트스트림을 디멀티플렉싱하여 신호 타입 및 저주파수 대역 신호를 획득하도록 구성된다. 이 경우, 대응적으로, 인코딩 디바이스에 의해 송신되고 디코딩 디바이스에 의해 수신된 비트스트림은 신호 타입, 및 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 인코딩 인덱스들을 반송한다.
선택적으로, 이 실시예에서의 디코딩 디바이스에서, 제1 획득 모듈(30)은 구체적으로 비트스트림을 디멀티플렉싱하여 저주파수 대역 신호를 획득하고, 저주파수 대역 신호에 따라 신호 타입을 결정하도록 구성된다.
선택적으로, 이 실시예에서의 디코딩 디바이스에서, 예측 모듈(32)은 구체적으로, 결정 유닛(321), 판단 유닛(322), 제1 프로세싱 유닛(323), 및 제2 프로세싱 유닛(324)을 포함할 수 있다.
결정 유닛(321)은 제1 획득 모듈(30)에 접속되고, 결정 유닛(321)은 제1 획득 모듈(30)에 의해 획득된, 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈을 결정하도록 구성된다. 판단 유닛(322)은 결정 유닛(321)에 접속되고, 판단 유닛(322)은 비트가 할당되었으며 결정 유닛(321)에 의해 결정된 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 작은지를 결정하도록 구성된다. 제1 프로세싱 유닛(323)은 판단 유닛(322)에 접속되고, 제1 프로세싱 유닛(323)은: 판단 유닛(322)이 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 작을 때, 미리 결정된 주파수 대역 범위 내에 있고 저주파수 대역 신호 내에 있는 여기 신호 및 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈에 따라 고주파수 대역 신호의 여기 신호를 예측하도록 구성된다. 제2 프로세싱 유닛(324)은 또한 판단 유닛(322)에 접속되고, 제2 프로세싱 유닛(324)은: 판단 유닛(322)이, 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 크거나 같다고 결정할 때, 미리 결정된 주파수 대역 범위 내에 있고 저주파수 대역 신호 내에 있는 여기 신호, 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈, 및 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈에 따라 고주파수 대역 신호의 여기 신호를 예측하도록 구성된다. 이 경우, 대응적으로, 복원 모듈(33)은 제2 획득 모듈(31), 제1 프로세싱 유닛(323), 및 제2 프로세싱 유닛(324)에 별도로 접속된다. 그러나, 동시에, 복원 모듈(33)은 제1 프로세싱 유닛(323) 및 제2 프로세싱 유닛(324) 중 어느 하나에만 접속될 수도 있다. 판단 유닛(322)이, 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 작다고 결정할 때, 복원 모듈(33)은 제1 프로세싱 유닛(323)에 접속된다. 판단 유닛(322)이, 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 크거나 같다고 결정할 때, 복원 모듈(33)은 제2 프로세싱 유닛(324)에 접속된다. 복원 모듈(33)은 구체적으로, 고주파수 대역 신호이며 제2 획득 모듈(31)에 의해 획득되는 주파수 포락선 및 고주파수 대역 신호이며 제1 프로세싱 유닛(323) 또는 제2 프로세싱 유닛(324)에 의한 예측에 의해 획득된 여기 신호에 따라 고주파수 대역 신호를 복원시키도록 구성된다.
또한 선택적으로, 이 실시예에서의 디코딩 디바이스에서, 제1 프로세싱 유닛(323)은 구체적으로: 판단 유닛(322)이 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 작다고 결정할 때, 미리 결정된 주파수 대역 범위 내에서 여기 신호의 n개 복제본들을 만들고, 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈과 대역폭 확장 주파수 대역의 가장 높은 주파수 빈 사이의 여기 신호로서 여기 신호의 n개 복제본을 사용하도록 구성되고, n은 양의 정수 또는 양의 소수이고, n은 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈과 대역폭 확장 주파수 대역의 가장 높은 주파수 빈 사이의 주파수 빈들의 수량 대 미리 결정된 주파수 대역 범위 내의 주파수 빈들의 수량의 비와 같다. 제1 프로세싱 유닛(323)의 특정 구현에 대해, 도 3에 도시된 실시예의 이전 확장 실시예에서 기록된 기술적 해법이 사용될 수 있다. 상세 내용은 여기서 다시 기술되지 않는다.
또한 선택적으로, 이 실시예에서의 디코딩 디바이스에서, 제2 프로세싱 유닛(324)은 구체적으로: 판단 유닛(322)이, 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈이 고주파수 대역 신호의 대역폭 확장의 미리 설정된 시작 주파수 빈보다 더 크거나 같다고 결정할 때, 미리 결정된 주파수 대역 범위의 시작 주파수 빈 fexc _start 위의 m번째 주파수 빈으로부터 미리 결정된 주파수 대역 범위의 종료 주파수 빈 fexc _end으로 여기 신호를 복제하여 미리 결정된 주파수 대역 범위 내에서 여기 신호의 n개 복제본들을 만들고, 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈과 대역폭 확장 주파수 대역의 가장 높은 주파수 빈 사이의 여기 신호로서 여기 신호들의 2개 부분들을 사용하도록 구성되고, n은 0, 양의 정수 또는 양의 소수이고, m은 비트가 할당되는, 저주파수 대역 신호의 가장 높은 주파수 빈과 확장 주파수 대역의 미리 설정된 시작 주파수 빈 사이의 주파수 빈들의 수량이다. 제2 프로세싱 유닛(324)의 특정 구현에 대해, 도 3에 도시된 실시예의 이전 확장 실시예에 기록된 기술적 해법이 사용될 수 있다. 상세 내용은 여기서 다시 기술되지 않는다.
이 실시예의 디코딩 디바이스에 따르면, 이전의 다수의 선택적 실시예들이 공존하는 방식이 본 발명에서의 기술적 해법들을 도입하기 위해 사용된다. 실제적인 참고에서, 이전의 다수의 선택적 실시예들이 임의로 결합되어 본 발명의 실시예들을 형성할 수 있다. 상세 내용은 여기서 다시 기술되지 않는다.
이 실시예에서의 디코딩 디바이스는, 전술한 관련 방법 실시예들의 구현 프로세스와 동일한, 고주파수 대역 신호의 예측을 구현하기 위해 전술한 모듈들을 사용한다. 상세 내용에 대해서는, 전술한 관련 방법 실시예들에서의 기록들을 참조한다. 상세 내용은 여기서 다시 기술되지 않는다.
이 실시예의 디코딩 디바이스는 상이한 타입의 신호에 대해 상이한 스펙트럼 계수를 사용하여 포락선을 디코딩하기 위해 전술한 모듈들을 사용하며, 따라서, 저주파수 대역 신호에 따라 예측된 고주파수 대역 고조파 신호의 여기 신호는 원래 고조파 특성을 유지할 수 있고, 이에 의해 예측 프로세스에서 과도한 잡음들의 유입을 회피하고, 예측에 의해 획득된 고주파수 대역 신호와 실제 고주파수 대역 신호 사이에 존재하는 에러를 효과적으로 감소시키고, 예측된 고주파수 대역 신호의 정확도 레이트를 증가시킬 수 있다.
도 8은 본 발명의 실시예에 따른 인코딩 디바이스의 개략적 구조도이다. 도 8에 도시된 바와 같이, 이 실시예에서, 인코딩 디바이스는 구체적으로 획득 모듈(40), 인코딩 모듈(41) 및 송신 모듈(42)을 포함할 수 있다.
획득 모듈(40)은 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하도록 구성되고, 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 오디오 신호는 저주파수 대역 신호 및 고주파수 대역 신호를 포함한다. 인코딩 모듈(41)은 획득 모듈(40)에 접속되고, 인코딩 모듈(41)은 획득 모듈(40)에 의해 획득된 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 인코딩하여 고주파수 대역 신호의 주파수 포락선을 획득하도록 구성된다. 송신 모듈(42)은 획득 모듈(40) 및 인코딩 모듈(41)에 별도로 접속되고, 송신 모듈(42)은 획득 모듈(40)에 의해 획득된 신호 타입, 및 인코딩 모듈(41)에 의한 인코딩에 의해 획득된 고주파수 대역 신호의 주파수 포락선 및 획득 모듈(40)에 의해 획득된 저주파수 대역 신호의 인코딩 인덱스들을 반송하는 비트스트림을 디코딩 디바이스에 송신하도록 구성된다.
예를 들어, 전술한 모듈들을 사용함으로써, 인코딩 디바이스는, 신호 타입, 및 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 인코딩 인덱스들을 반송하는 비트스트림을 디코딩 디바이스에 전송할 수 있고, 따라서, 디코딩 디바이스는 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하고 ― 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 오디오 신호는 저주파수 대역 신호 및 고주파수 대역 신호를 포함함 ― ; 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 획득하고; 저주파수 대역 신호에 따라 고주파수 대역 신호의 여기 신호를 예측하고; 그리고 고주파수 대역 신호의 주파수 포락선 및 고주파수 대역 신호의 여기 신호에 따라 고주파수 대역 신호를 복원시킨다. 상세 내용에 대해서는, 이전 관련 실시예들에서의 기록들을 참조한다. 상세 내용은 여기서 다시 기술되지 않는다.
이 실시예에서의 인코딩 디바이스는 전술한 관련 방법 실시예들의 구현 프로세스와 동일한, 고주파수 대역 신호의 예측을 구현하기 위해 전술한 모듈들을 사용한다. 상세 내용에 대해서는, 전술한 관련 방법 실시예들에서의 기록들을 참조한다. 상세 내용은 여기서 다시 기술되지 않는다.
전술한 모듈들을 사용함으로써, 이 실시예에서의 인코딩 디바이스는, 상이한 타입의 신호에 대해, 상이한 스펙트럼 계수가 포락선을 디코딩하기 위해 사용되고, 따라서, 저주파수 대역 신호에 따라 예측된 고주파수 대역 고조파 신호의 여기 신호가 원래 고조파 특성을 유지할 수 있고, 이에 의해 예측 프로세스에서 과도한 잡음들의 유입을 회피하고, 예측에 의해 획득된 고주파수 대역 신호와 실제 고주파수 대역 신호 사이에 존재하는 에러를 효과적으로 감소시키고, 예측된 고주파수 대역 신호의 정확도 레이트를 증가시키는 것을 편리하게 구현할 수 있다.
선택적으로, 도 8에 도시된 전술한 실시예에 기반하여, 인코딩 모듈(41)은 구체적으로: 획득 모듈(40)에 의해 획득된 신호 타입이 비-고조파 신호일 때, 제1 수량의 스펙트럼 계수들이 고주파수 대역 신호의 주파수 포락선을 계산하기 위해 사용되거나; 또는 인코딩 모듈(41)은 구체적으로: 획득 모듈(40)에 의해 획득된 신호 타입이 고조파 신호일 때, 제2 수량의 스펙트럼 계수들이 고주파수 대역 신호의 주파수 포락선을 계산하기 위해 사용되고, 여기서 제2 수량은 제1 수량보다 더 크다.
도 9는 본 발명의 또다른 실시예에 따른 인코딩 디바이스의 개략적 구조도이다. 도 9에 도시된 바와 같이, 이 실시예에서, 인코딩 디바이스는 구체적으로, 획득 모듈(50), 계산 모듈(51) 및 송신 모듈(52)을 포함할 수 있다.
획득 모듈(50)은 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하도록 구성되고, 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 오디오 신호는 저주파수 대역 신호 및 고주파수 대역 신호를 포함한다. 계산 모듈(51)은 고주파수 대역 신호의 주파수 포락선을 계산하도록 구성되고, 고조파 신호의 고주파수 대역 신호의 주파수 포락선을 계산하기 위한 방법은 비-고조파 신호의 방법과 동일하다. 송신 모듈(52)은 획득 모듈(50) 및 계산 모듈(51)에 별도로 접속되고, 송신 모듈(52)은, 획득 모듈(50)에 의해 획득된 신호 타입, 및 고주파수 대역 신호이며 계산 모듈(51)에 의한 계산에 의해 획득된 주파수 포락선 및 획득 모듈(50)에 의해 획득된 저주파수 대역 신호의 인코딩 인덱스들을 반송하는 비트스트림을 디코딩 디바이스에 송신하도록 구성된다.
예를 들어, 전술한 모듈들을 사용함으로써, 인코딩 디바이스는, 신호 타입, 및 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 인코딩 인덱스들을 반송하는 비트스트림을 디코딩 디바이스에 송신할 수 있고, 따라서, 디코딩 디바이스가 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하고 ― 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 오디오 신호는 저주파수 대역 신호 및 고주파수 대역 신호를 포함함 ― ; 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 획득하고; 저주파수 대역 신호에 따라 고주파수 대역 신호의 여기 신호를 예측하고; 그리고 고주파수 대역 신호의 주파수 포락선 및 고주파수 대역 신호의 여기 신호에 따라 고주파수 대역 신호를 복원시킨다. 상세 내용에 대해, 전술한 관련 실시예들에서의 기록들을 참조한다. 상세 내용은 여기서 다시 기술되지 않는다.
이 실시예에서의 인코딩 디바이스는, 전술한 관련 방법 실시예들의 구현 프로세스와 동일한, 고주파수 대역 신호의 예측을 구현하기 위해 전술한 모듈들을 사용한다. 상세 내용에 대해서는, 전술한 관련 방법 실시예들에서의 기록들을 참조한다. 상세 내용은 여기서 다시 기술되지 않는다.
전술한 모듈들을 사용함으로써, 이 실시예에서의 인코딩 디바이스는, 상이한 타입의 신호에 대해, 상이한 스펙트럼 계수가 포락선을 디코딩하기 위해 사용되고, 따라서, 저주파수 대역 신호에 따라 예측된 고주파수 대역 고조파 신호의 여기 신호가 원래 고조파 특성을 유지할 수 있고, 이에 의해 예측 프로세스에서 과도한 잡음들의 유입을 회피하고, 예측에 의해 획득된 고주파수 대역 신호와 실제 고주파수 대역 신호 사이에 존재하는 에러를 효과적으로 감소시키고, 예측된 고주파수 대역 신호의 정확도 레이트를 증가시키는 것을 편리하게 구현할 수 있다.
도 10은 본 발명의 실시예에 따른 인코딩 디바이스의 예시적인 다이어그램이다. 도 10에 도시된 바와 같이, 이 실시예에서, 인코딩 디바이스는 본 발명의 실시예들에서의 기술적 해법들을 도 1에 도시된 전술한 기존의 인코딩 디바이스에 추가함으로써 형성된 인코딩 디바이스의 예시적인 다이어그램이다. 도 10에 도시된 바와 같이, 종래 기술에서 도 1에 도시된 인코딩 디바이스에 기반하여, 이 실시예에서, 분류 추출 및 인코딩 모듈(17)이 인코딩 디바이스에 추가된다.
분류 추출 및 인코딩 모듈(17)은 시간-주파수 변환 모듈(10)에 접속되고, 분류 추출 및 인코딩 모듈(17)은: 시간-주파수 변환 모듈(10)에 의한 전환 이후 획득된 신호 타입을 획득하고; 고주파수 대역 신호이며 포락선 양자화 및 인코딩 모듈(12)에 의해 양자화된 주파수 포락선을 인코딩하도록 구성된다. 여기서, 신호 타입은 고조파 신호 또는 비-고조파 신호일 수 있다. 분류 추출 및 인코딩 모듈(17)은 추가로 멀티플렉싱 모듈(16)에 접속되며, 이 경우, 멀티플렉싱 모듈(16)은: 분류 추출 및 인코딩 모듈(17)에 의해 획득된 신호 타입, 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 인코딩함으로써 획득된 인코딩 인덱스, 및 여기 양자화 및 인코딩 모듈(15)에 의해 양자화된 여기 신호를 비트스트림으로 별도로 멀티플렉싱하고, 비트스트림을 디코딩 디바이스에 출력하도록 구성된다. 나머지는 도 1에 도시된 전술한 실시예에서와 동일하다. 상세 내용에 대해서는, 전술한 관련 실시예에서의 기록들을 참조한다. 상세 내용은 여기서 다시 기술되지 않는다.
이 실시예에서 인코딩 디바이스의 기술적 해법의 특정 구현에 대해, 도 1, 도 4 및 도 6에 도시된 전술한 실시예들에서의 기록들을 참조한다. 상세 내용은 여기서 다시 기술되지 않는다.
이 실시예에서의 인코딩 디바이스는 전술한 기술적 해법을 사용하여 고조파 신호 및 비-고조파 신호에 대한 상이한 포락선 정보를 획득하고, 포락선 정보를 디코딩 디바이스에 송신하고, 따라서 디코딩 디바이스는 고조파 신호 및 비-고조파 신호에 대해 상이한 포락선 정보를 사용하여 고주파수 대역 신호의 예측된 여기 신호를 수정하고, 이에 의해 수정 프로세스에서 과도한 잡음들의 유입을 회피하고, 수정에 의해 획득된 고주파수 대역 신호와 실제 고주파수 대역 신호 사이에 존재하는 에러를 효과적으로 감소시키고, 예측된 고주파수 대역 신호의 정확도 레이트를 감소시킨다.
선택적으로, 도 10에 도시된 전술한 실시예에서, 계산 모듈이 더 추가될 수 있다. 계산 모듈은 고주파수 대역 신호의 주파수 포락선을 계산하도록 구성되고, 고조파 신호의 고주파수 대역 신호의 주파수 포락선을 계산하기 위한 방법은 비-고조파 신호의 방법과 동일하다. 이 경우, 분류 추출 및 인코딩 모듈(17)은 신호 타입에 따라, 고주파수 대역 신호이며 포락선 양자화 및 인코딩 모듈(12)에 의해 양자화되는 주파수 포락선을 인코딩하지 않는다. 포락선 양자화 및 인코딩의 구현은 도 10에 도시된 전술한 실시예의 구현과 동일하다. 이 실시예에서 인코딩 디바이스의 기술적 해법의 특정 구현에 대해서는, 도 1, 도 5 및 도 7에 도시된 전술한 실시예들에서의 기록들을 참조한다. 상세 내용은 여기서 다시 기술되지 않는다.
도 11은 본 발명의 실시예에 따른 디코딩 디바이스의 예시적인 다이어그램이다. 도 11에 도시된 바와 같이, 이 실시예에서, 디코딩 디바이스는 본 발명의 실시예들에서의 기술적 해법들을 도 2에 도시된 전술한 기존의 디코딩 디바이스에 더함으로써 형성된 디코딩 디바이스의 예시적인 다이어그램이다. 도 11에 도시된 바와 같이, 종래 기술의 도 2에 도시된 디코딩 디바이스에 기반하여, 이 실시예에서는, 분류 정보 디코딩 모듈(27)이 디코딩 디바이스에 추가된다.
분류 정보 디코딩 모듈(27)은 수신된 비트스트림으로부터 신호 타입을 획득하도록 구성된다. 주파수 도메인 신호 복원 모듈(25)은 분류 정보 디코딩 모듈(27)에 추가로 접속되고, 주파수 도메인 신호 복원 모듈(25)은 분류 정보 디코딩 모듈(27)에 의해 획득된 신호 타입, 주파수 포락선 디코딩 모듈(21)에 의해 획득된 주파수 포락선, 및 전체 주파수 대역에 있으며 대역폭 확장 모듈(24)에 의해 획득된 여기 신호에 따라 주파수 도메인 신호를 복원시킨다.
한편, 이 실시예에서, 여기 신호 디코딩 모듈(23)에 의해 획득된 여기 신호에 따라 대역폭 확장 모듈(24)에 의해 전체 대역폭을 확장하기 위해, 즉, 저주파수 대역 신호의 여기 신호를 사용함으로써 고주파수 대역 신호의 여기 신호를 확장하기 위해, 저주파수 대역 신호에 따라 고주파수 대역 신호의 여기 신호를 예측하기 위한 것이며 도 3에 도시된 실시예의 전술한 확장 실시예에 기록된 방법이 사용될 수 있다. 상세 내용에 대해서는, 전술한 관련 실시예들에서의 기록들을 참조한다. 상세 내용은 여기서 다시 기술되지 않는다.
전술한 해법을 사용함으로써, 이 실시예에서의 디코딩 디바이스는, 고주파수 대역 신호들이면서 전 프레임과 후프레임에서 예측되는 여기 신호들의 연속성을 효과적으로 보장할 수 있고; 반면, 고조파 신호 및 비-고조파 신호에 대해, 상이한 포락선 정보를 사용하여 고주파수 대역 신호의 예측된 여기 신호를 수정하고, 이에 의해 수정 프로세스에서 과도한 잡음의 유입을 회피하고, 수정에 의해 획득된 고주파수 대역 신호와 실제 고주파수 대역 신호 사이에 존재하는 에러를 효과적으로 감소시키고, 예측된 고주파수 대역 신호의 정확도 레이트를 증가시킨다.
도 10에 도시된 전술한 실시예에서의 인코딩 디바이스 및 도 11에 도시된 전술한 실시예에서의 디코딩 디바이스는 본 발명의 단지 선택적인 실시예 구조들이다. 실제 응용에서, 본 발명의 더 많은 선택적인 실시예 구조들이 도 3 내지 도 9에 도시된 전술한 실시예들의 기술적 해법들에 따라 추가로 추론될 수 있다. 상세 내용에 대해서는, 전술한 실시예들에서의 기록들을 참조한다. 상세 내용은 여기서 다시 기술되지 않는다.
도 12는 본 발명의 실시예에 따라 고주파수 대역 신호를 예측하기 위한 시스템의 개략적 구조도이다. 이 실시예에서, 고주파수 대역 신호를 예측하기 위한 시스템은 인코딩 디바이스(70) 및 디코딩 디바이스(80)를 포함한다.
이 실시예에서, 디코딩 디바이스(80)는 도 6 또는 도 7에 도시된 전술한 실시예에서의 디코딩 디바이스일 수 있다. 인코딩 디바이스(70)는 종래 기술에서의 인코딩 디바이스일 수 있거나 도 8 또는 도 9에 도시된 전술한 실시예에서의 인코딩 디바이스일 수 있다.
이 실시예에서 고주파수 대역 신호를 예측하기 위한 시스템에서, 인코딩 디바이스(70) 및 디코딩 디바이스(80)를 사용함으로써 고주파수 대역 신호를 예측하기 위한 특정 구현 프로세스의 상세 내용에 대해서는, 도 6, 도 7, 도 8 또는 도 9에 도시된 전술한 실시예 및 관련된 방법 실시예들에서의 기록들을 참조하고, 상세 내용은 여기서 다시 기술되지 않는다.
이 실시예에서 고주파수 대역 신호를 예측하기 위한 시스템에 따르면, 전술한 기술적 해법을 사용함으로써, 고조파 신호 및 비-고조파 신호에 대해, 상이한 포락선 정보를 이용하여 고주파수 대역 신호의 여기 신호를 예측하고, 이에 의해 수정 프로세스에서 과도한 잡음들의 유입을 회피하고, 수정에 의해 획득된 고주파수 대역 신호와 실제 고주파수 대역 신호 사이에 존재하는 에러를 효과적으로 감소시키고, 예측된 고주파수 대역 신호의 정확도 레이트를 증가시킨다. 추가로, 도 7에 도시된 실시예에서의 디코딩 디바이스가 고주파수 대역 신호를 예측하기 위한 시스템에서 사용될 때, 고주파수 대역 신호들이며 전 프레임 및 후 프레임에서 예측되는 여기 신호들의 연속성이 추가로 효과적으로 보장될 수 있고, 이에 의해, 복원된 고주파수 대역 신호의 청각적 품질을 보장하고, 오디오 신호의 청각적 품질을 향상시킨다.
도 13은 본 발명의 또다른 실시예에 따른 장치(90)의 블록도이다. 도 13의 장치(90)는 전술한 방법 실시예들에서의 단계들 및 방법들을 구현하기 위해 사용될 수 있다. 장치(90)는 다양한 통신 시스템들에서 기지국 또는 단말에 적용될 수 있다. 도 13의 실시예에서, 장치(90)는 수신 회로(902), 디코딩 프로세서(903), 프로세싱 유닛(904), 메모리(905) 및 안테나(901)를 포함한다. 프로세싱 유닛(904)은 장치(90)의 동작을 제어하고, 프로세싱 유닛(904)은 또한 CPU(Central Processing Unit, 중앙 처리 장치)라고 지칭될 수 있다. 메모리(905)는 판독 전용 메모리 및 랜덤 액세스 메모리를 포함할 수 있고, 프로세싱 유닛(904)에 명령 및 데이터를 제공한다. 메모리(905)의 일부분은 비휘발성 랜덤 액세스 메모리(NVRAM)를 더 포함할 수 있다. 특정 응용예에서, 모바일 폰과 같은 무선 통신 디바이스가 장치(90)에 내장될 수 있거나, 또는 장치(90)는 무선 통신 디바이스일 수 있고, 장치(90)는 장치(90)가 원격 위치로부터 데이터를 수신할 수 있게 하기 위해, 수신 회로(902)를 수용하는 캐리어를 더 포함할 수 있다. 수신 회로(902)는 안테나(901)에 커플링될 수 있다. 장치(90)의 모든 컴포넌트들은 버스 시스템(906)을 사용하여 함께 커플링되고, 여기서 데이터 버스에 더하여, 버스 시스템(906)은 전력 버스, 제어 버스 및 상태 신호 버스를 더 포함한다. 그러나, 기재의 명료성을 위해, 다양한 버스들이 도 13에서 버스 시스템(906)으로서 표기된다. 장치(90)는 신호를 프로세싱하도록 구성된 프로세싱 유닛(904)을 더 포함할 수 있고, 추가로, 디코딩 프로세서(903)를 더 포함한다.
본 발명의 전술한 실시예들에 개시된 방법들은 디코딩 프로세서(903)에 적용되거나, 또는 디코딩 프로세서(903)에 의해 구현될 수 있다. 디코딩 프로세서(903)는 집적 회로 칩일 수 있고, 신호 처리 능력을 가진다. 구현 프로세스에서, 전술한 방법 실시예들(예를 들어, 도 3에 대응하는 방법 실시예)에서의 단계들은 디코딩 프로세서(903) 내의 하드웨어의 집적 논리 회로 또는 소프트웨어 형태의 명령들을 사용함으로써 완료될 수 있다. 이들 명령들은 프로세싱 유닛(904)과 협력함으로써 구현되고 제어될 수 있다. 전술한 디코딩 프로세서는 범용 프로세서, 디지털 신호 프로세서(DSP), 주문형 집적 회로(ASIC), 필드 프로그래밍가능한 게이트 어레이(FPGA; field programmable gate array) 또는 또다른 프로그래밍가능한 논리 컴포넌트, 이산 게이트 또는 트랜지스터 논리 컴포넌트, 또는 이산 하드웨어 컴포넌트일 수 있다. 본 발명의 실시예들에서 개시된 방법들, 단계들 및 논리적 블록도들이 구현되거나 수행될 수 있다. 범용 프로세서는 마이크로프로세서일 수 있거나, 또는 프로세서는 임의의 종래의 프로세서, 번역기 등일 수 있다. 본 발명의 실시예들과 관련하여 개시된 방법들의 단계들은 하드웨어로서 구현된 디코딩 프로세서에 의해 직접 실행되고 완료될 수 있거나, 또는 디코딩 프로세서에서 하드웨어 및 소프트웨어 모듈들의 조합을 사용함으로써 실행되고 완료될 수 있다. 소프트웨어 모듈은 랜덤 액세스 메모리, 플래시 메모리, 판독-전용 메모리, 프로그래밍가능한 판독-전용 메모리, 전기적 소거가능한 프로그래밍가능한 판독-전용 메모리, 또는 레지스터와 같은, 당해 기술분야의 기성 저장 매체에 위치될 수 있다. 저장 매체는 메모리(905)에 위치된다. 디코딩 프로세서(903)는 메모리(905)로부터 정보를 판독하고, 하드웨어와 함께 이전 방법들의 단계들을 완료시킨다.
예를 들어, 도 6 또는 도 7의 신호 디코딩 디바이스는 디코딩 프로세서(903)에 의해 구현될 수 있다. 추가로, 도 6에서, 제1 획득 모듈(30), 제2 획득 모듈(31), 예측 모듈(32), 및 복원 모듈(33)은 프로세싱 유닛(904)에 의해 구현될 수 있거나, 또는 디코딩 프로세서(903)에 의해 구현될 수 있다. 유사하게, 도 7의 각각의 모듈은 프로세싱 유닛(904)에 의해 구현될 수 있고, 디코딩 프로세서(903)에 의해 구현될 수 있다. 그러나, 전술한 예들은 단지 예시적이며, 본 발명의 실시예들을 이러한 특정 구현 방식으로 제한하도록 의도되지 않는다.
구체적으로, 메모리(905)는 프로세싱 유닛(904) 또는 디코딩 프로세서(903)가 후속하는 동작들: 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하는 것 ― 오디오 신호는 저주파수 대역 신호 및 고주파수 대역 신호를 포함함 ― ; 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 획득하는 것; 저주파수 대역 신호에 따라 고주파수 대역 신호의 여기 신호를 예측하는 것; 및 고주파수 대역 신호의 주파수 포락선 및 고주파수 대역 신호의 여기 신호에 따라 고주파수 대역 신호를 복원시키는 것을 구현할 수 있게 하는 명령들을 저장한다.
도 14는 본 발명의 또다른 실시예에 따른 장치(100)의 블록도이다. 도 14의 장치(100)는 이전의 방법 실시예들에서의 단계들 및 방법들을 구현하기 위해 사용될 수 있다. 장치(100)는 다양한 통신 시스템들에서 기지국 또는 단말에 적용될 수 있다. 도 14의 실시예에서, 장치(100)는 수신 회로(1002), 인코딩 프로세서(1003), 프로세싱 유닛(1004), 메모리(1005), 및 안테나(1001)를 포함한다. 프로세싱 유닛(1004)은 장치(100)의 동작을 제어하고, 프로세싱 유닛(1004)은 또한 CPU(Central Processing Unit, 중앙 처리 장치)라고 지칭될 수 있다. 메모리(1005)는 판독-전용 메모리 및 랜덤 액세스 메모리를 포함할 수 있고, 프로세싱 유닛(1004)에 명령 및 데이터를 제공한다. 메모리(1005)의 일부분은 비휘발성 랜덤 액세스 메모리(NVRAM)를 더 포함할 수 있다. 특정 응용예에서, 모바일 폰과 같은 무선 통신 디바이스는 장치(100)에 내장될 수 있거나, 또는 장치(100)는 무선 통신 디바이스일 수 있고, 장치(100)는, 장치(100)가 원격 위치로부터 데이터를 수신할 수 있게 하기 위해, 수신 회로(1002)를 수용하는 캐리어를 더 포함할 수 있다. 수신 회로(1002)는 안테나(1001)에 커플링될 수 있다. 장치(100)의 모든 컴포넌트들은 버스 시스템(1006)을 사용함으로써 함께 커플링되며, 여기서, 데이터 버스에 더하여, 버스 시스템(1006)은 전력 버스, 제어 버스, 및 상태 신호 버스를 더 포함한다. 그러나, 기재의 명료함을 위해, 다양한 버스들이 도 14에서 버스 시스템(1006)으로서 마킹된다. 장치(100)는 신호를 프로세싱하도록 구성된 프로세싱 유닛(1004)을 더 포함할 수 있고, 추가로, 인코딩 프로세서(1003)를 더 포함한다.
본 발명의 전술한 실시예들에 개시된 방법들은 인코딩 프로세서(1003)에 적용되거나, 인코딩 프로세서(1003)에 의해 구현될 수 있다. 인코딩 프로세서(1003)는 집적 회로 칩일 수 있고, 신호 프로세싱 능력을 가진다. 구현 프로세스에서, 전술한 방법 실시예들(예를 들어, 도 4 또는 도 5에 대응하는 방법 실시예)에서의 단계들은 인코딩 프로세서(1003) 내의 하드웨어의 집적 논리 회로 또는 소프트웨어 형태인 명령들을 사용함으로써 완료될 수 있다. 이들 명령들은 프로세싱 유닛(1004)과 협력함으로써 구현되고 제어될 수 있다. 전술한 인코딩 프로세서는 범용 프로세서, 디지털 신호 프로세서(DSP), 주문형 집적 회로(ASIC), 필드 프로그래밍가능한 게이트 어레이(FPGA) 또는 또다른 프로그래밍가능한 논리 컴포넌트, 이산 게이트 또는 트랜지스터 논리 컴포넌트, 또는 이산 하드웨어 컴포넌트일 수 있다. 본 발명의 실시예들에 개시된 방법들, 단계들 및 논리 블록도들이 구현되거나 수행될 수 있다. 범용 프로세서는 마이크로프로세서일 수 있거나, 또는 프로세서는 또한 임의의 종래의 프로세서, 번역기 등일 수 있다. 본 발명의 실시예들에 관련하여 개시된 방법들의 단계들은 하드웨어로서 구현된 디코딩 프로세서에 의해 직접 실행되고 완료될 수 있거나, 또는 디코딩 프로세서에서 하드웨어 및 소프트웨어 모듈들의 조합을 사용함으로써 실행되고 완료될 수 있다. 소프트웨어 모듈은 랜덤 액세스 메모리, 플래시 메모리, 판독-전용 메모리, 프로그래밍가능한 판독-전용 메모리, 전기적 소거가능한 프로그래밍가능한 판독-전용 메모리, 또는 레지스터와 같은, 당해 기술분야의 기성 저장 매체에 저장될 수 있다. 저장 매체는 메모리(1005)에 위치된다. 인코딩 프로세서(1003)는 메모리(1005)로부터 정보를 판독하고, 하드웨어와 함께 전술한 방법들의 단계들을 완료한다.
예를 들어, 도 8 또는 도 9의 신호 인코딩 디바이스는 인코딩 프로세서(1003)에 의해 구현될 수 있다. 추가로, 도 8에서, 획득 모듈(40), 인코딩 모듈(41), 및 송신 모듈(42)은 프로세싱 유닛(1004)에 의해 구현될 수 있거나, 또는 인코딩 프로세서(1003)에 의해 구현될 수 있다. 유사하게, 도 9의 각각의 모듈은 프로세싱 유닛(1004)에 의해 구현될 수 있거나, 또는 인코딩 프로세서(1003)에 의해 구현될 수 있다. 그러나, 전술한 예들은 단지 예시적이며, 본 발명의 실시예들을 이러한 특정 구현 방식으로 제한하도록 의도되지 않는다.
구체적으로, 메모리(1005)의 저장은 프로세싱 유닛(1004) 또는 인코딩 프로세서(1003)가 후속하는 동작들: 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하는 것 ― 오디오 신호는 저주파수 대역 신호 및 고주파수 대역 신호를 포함함 ― ; 신호 타입에 따라 고주파수 대역 신호의 주파수 포락선을 인코딩하여 고주파수 대역 신호의 주파수 포락선을 획득하는 것; 및 신호 타입, 및 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 인코딩 인덱스들을 반송하는 비트스트림을 디코딩 디바이스에 송신하는 것을 위한 명령들을 구현할 수 있게 한다.
구체적으로, 메모리(1005)의 저장은 프로세싱 유닛(1004) 또는 인코딩 프로세서(1003)가 후속하는 동작들: 오디오 신호의 신호 타입 및 오디오 신호의 저주파수 대역 신호를 획득하는 것 ― 신호 타입은 고조파 신호 또는 비-고조파 신호이고, 오디오 신호는 저주파수 대역 신호 및 고주파수 대역 신호를 포함함 ― ; 고주파수 대역 신호의 주파수 포락선을 계산하는 것 ― 고조파 신호의 고주파수 대역 신호의 주파수 포락선을 계산하기 위한 방법은 비-고조파 신호의 방법과 동일함 ― ; 및 신호 타입, 및 고주파수 대역 신호의 주파수 포락선 및 저주파수 대역 신호의 인코딩 인덱스들을 반송하는 비트스트림을 디코딩 디바이스에 송신하는 것을 위한 명령들을 구현할 수 있게 한다.
기술된 장치 실시예는 단지 예시적이다. 별도의 부분들로서 기술된 유닛들은 물리적으로 분리되거나 분리되지 않을 수 있고, 유닛들로서 디스플레이된 부분들은 물리적 부분일 수 있거나 아닐 수 있고, 하나의 위치에 위치될 수 있거나, 또는 적어도 2개의 네트워크 유닛들 상에 분산될 수 있다. 모듈들 중 일부 또는 전부는 실시예들의 해법들의 목적들을 달성하기 위한 실제 필요성에 따라 선택될 수 있다. 통상의 기술자는 창조적 노력 없이도 본 발명의 실시예들을 이해하고 구현할 수 있다.
마지막으로, 전술한 실시예들이 본 발명을 제한하기 위해서가 아니라 단지 본 발명의 기술적 해법들을 기술하도록 의도된다는 점에 유의해야 한다. 본 발명이 전술한 실시예들에 관해 상세하게 기술되었지만, 통상의 기술자는, 이들이 여전히 전술한 실시예들에 기술된 기술적 해법들을 수정할 수 있거나, 또는 이들의 일부 기술적 특징들에 대한 등가적 치환을 수행할 수 있다는 점을 이해해야 한다.
Claims (20)
- 고주파수 대역 신호를 예측하기 위한 방법으로서,
오디오 신호의 현재 프레임의 신호 타입 및 상기 현재 프레임의 저주파수 대역 신호를 획득하는 단계 - 상기 현재 프레임의 상기 신호 타입은 고조파 타입 또는 비-고조파(non-harmonic) 타입임 -;
상기 현재 프레임의 신호 타입에 따라 상기 현재 프레임의 고주파수 대역 신호의 주파수 포락선(frequency envelope)을 획득하는 단계;
상기 현재 프레임의 신호 타입이 상기 고조파 타입일 때 상기 저주파수 대역 신호의 가장 높은 주파수 빈이 대역폭 확장을 위한 미리 설정된 시작 주파수 빈(preset start frequency bin)보다 더 작은지를 결정하는 단계;
상기 저주파수 대역 신호의 상기 가장 높은 주파수 빈이 상기 미리 설정된 시작 주파수 빈보다 더 작을 때, 상기 저주파수 대역 신호에 위치된 여기 신호 및 상기 미리 설정된 시작 주파수 빈에 따라 상기 고주파수 대역 신호의 여기 신호를 예측하는 단계 - 상기 저주파수 대역 신호에 위치된 상기 여기 신호는 fexc_start 내지 fexc_end의 주파수 범위 내에 있고, fexc_start는 상기 주파수 범위의 시작 주파수이고, fexc_end는 상기 주파수 범위의 종료 주파수이고, fexc_end는 fexc_start보다 더 큼 -; 또는
상기 저주파수 대역 신호의 가장 높은 주파수 빈이 상기 미리 설정된 시작 주파수 빈보다 작지 않을 때, 상기 저주파수 대역 신호에 위치된 여기 신호, 상기 미리 설정된 시작 주파수 빈, 및 상기 저주파수 대역 신호의 가장 높은 주파수 빈에 따라 상기 고주파수 대역 신호의 여기 신호를 예측하는 단계; 및
상기 고주파수 대역 신호의 상기 주파수 포락선 및 상기 고주파수 대역 신호의 상기 여기 신호에 따라 상기 현재 프레임의 상기 고주파수 대역 신호를 복원시키는 단계
를 포함하는 방법. - 제1항에 있어서,
상기 신호 타입에 따라 상기 현재 프레임의 고주파수 대역 신호의 주파수 포락선을 획득하는 단계는:
상기 현재 프레임의 상기 신호 타입이 상기 비-고조파 타입일 때 수신된 비트스트림을 디코딩하여 상기 현재 프레임의 상기 고주파수 대역 신호의 상기 주파수 포락선을 획득하는 단계; 또는
상기 현재 프레임의 상기 신호 타입이 상기 고조파 타입일 때 수신된 비트스트림을 디코딩하여 상기 현재 프레임의 상기 고주파수 대역 신호의 초기 주파수 포락선을 획득하고, 상기 현재 프레임의 상기 초기 주파수 포락선 및 상기 현재 프레임의 N개의 인접한 프레임들의 N개의 초기 주파수 포락선들에 대해 가중 계산(weighting calculation)을 수행하는 단계 - 상기 가중 계산에 의해 획득된 값은 상기 고주파수 대역 신호의 상기 주파수 포락선이고, N은 1보다 작지 않음 -를 포함하는, 방법. - 제1항에 있어서,
상기 신호 타입에 따라 상기 현재 프레임의 고주파수 대역 신호의 주파수 포락선을 획득하는 단계는:
상기 신호 타입에 따라 수신된 비트스트림을 디코딩하여 상기 고주파수 대역 신호의 주파수 포락선을 획득하는 단계를 포함하고, 상기 비트스트림은 상기 신호 타입 및 상기 고주파수 대역 신호의 상기 주파수 포락선의 인코딩 인덱스(encoding index)를 반송(carry)하는 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
오디오 신호의 현재 프레임의 신호 타입 및 상기 현재 프레임의 저주파수 대역 신호를 획득하는 단계는:
수신된 비트스트림을 디코딩하여 상기 신호 타입 및 상기 저주파수 대역 신호를 획득하는 단계를 포함하는, 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
오디오 신호의 현재 프레임의 신호 타입 및 상기 현재 프레임의 저주파수 대역 신호를 획득하는 단계는:
수신된 비트스트림을 디코딩하여 상기 현재 프레임의 저주파수 대역 신호를 획득하는 단계; 및
상기 저주파수 대역 신호에 따라 상기 현재 프레임의 상기 신호 타입을 결정하는 단계를 포함하는, 방법. - 제1항에 있어서,
상기 저주파수 대역 신호에 위치된 여기 신호 및 상기 미리 설정된 시작 주파수 빈에 따라 상기 고주파수 대역 신호의 여기 신호를 예측하는 단계는:
상기 저주파수 대역 신호에 위치된 상기 여기 신호의 n개 복제본(copy)들을 만들고, 상기 미리 설정된 시작 주파수 빈과 상기 고주파수 대역 신호의 가장 높은 주파수 빈 사이의 여기 신호로서 상기 여기 신호의 n개 복제본들을 사용하는 단계를 포함하고, n은 양의 정수 또는 양의 소수(decimal)이고, n은 상기 미리 설정된 시작 주파수 빈과 상기 고주파수 대역 신호의 상기 가장 높은 주파수 빈 사이의 주파수 빈들의 수량(quantity) 대 상기 주파수 범위 내의 주파수 빈들의 수량의 비와 같은 방법. - 제1항에 있어서,
상기 저주파수 대역 신호에 위치된 여기 신호, 상기 미리 설정된 시작 주파수 빈, 및 상기 저주파수 대역 신호의 가장 높은 주파수 빈에 따라 상기 고주파수 대역 신호의 여기 신호를 예측하는 단계는:
상기 fexc_start 위의 m번째 주파수 빈으로부터 상기 fexc_end으로 여기 신호를 복제하여, 상기 주파수 범위 내에서 상기 여기 신호의 n개 복제본을 만들고, 상기 저주파수 대역 신호의 상기 가장 높은 주파수 빈과 상기 고주파수 대역 신호의 가장 높은 주파수 빈 사이의 여기 신호로서 상기 여기 신호들의 2개 부분들을 사용하는 단계를 포함하고, n은 0, 양의 정수 또는 양의 소수이고, m은 상기 저주파수 대역 신호의 상기 가장 높은 주파수 빈과 상기 미리 설정된 시작 주파수 빈 사이의 주파수 빈들의 수량인 방법. - 디코딩 디바이스로서,
오디오 신호의 현재 프레임의 신호 타입 및 상기 현재 프레임의 저주파수 대역 신호를 획득하도록 구성된 제1 획득 모듈 - 상기 현재 프레임의 상기 신호 타입은 고조파 타입 또는 비-고조파(non-harmonic) 타입임 -;
상기 현재 프레임의 상기 신호 타입에 따라 상기 현재 프레임의 고주파수 대역 신호의 주파수 포락선을 획득하도록 구성되는 제2 획득 모듈;
상기 현재 프레임의 신호 타입이 상기 고조파 타입일 때, 상기 저주파수 대역 신호의 가장 높은 주파수 빈이 대역폭 확장을 위한 미리 설정된 시작 주파수 빈보다 더 작은지를 결정하도록 구성된 판단 유닛;
상기 판단 유닛이 상기 저주파수 대역 신호의 가장 높은 주파수 빈이 상기 미리 설정된 시작 주파수 빈보다 더 작다고 결정할 때, 상기 저주파수 대역 신호에 위치된 여기 신호 및 상기 미리 설정된 시작 주파수 빈에 따라 상기 고주파수 대역 신호의 여기 신호를 예측하도록 구성된 제1 프로세싱 유닛 - 상기 저주파수 대역 신호에 위치된 상기 여기 신호는 fexc_start 내지 fexc_end의 주파수 범위 내에 있고, fexc_start는 상기 주파수 범위의 시작 주파수이고, fexc_end는 상기 주파수 범위의 종료 주파수이고, fexc_end는 fexc_start보다 더 큼 -; 및
상기 판단 유닛이 상기 저주파수 대역 신호의 가장 높은 주파수 빈이 상기 미리 설정된 시작 주파수 빈보다 작지 않다고 결정할 때, 상기 저주파수 대역 신호에 위치된 여기 신호, 상기 미리 설정된 시작 주파수 빈, 및 상기 저주파수 대역 신호의 가장 높은 주파수 빈에 따라 상기 고주파수 대역 신호의 여기 신호를 예측하도록 구성된 제2 프로세싱 유닛; 및
상기 고주파수 대역 신호의 상기 주파수 포락선 및 상기 고주파수 대역 신호의 상기 여기 신호에 따라 상기 현재 프레임의 상기 고주파수 대역 신호를 복원시키도록 구성된 복원 모듈
을 포함하는 디바이스. - 제8항에 있어서,
상기 제2 획득 모듈은 구체적으로, 상기 현재 프레임의 상기 신호 타입이 상기 비-고조파 타입일 때 수신된 비트스트림을 디코딩하여 상기 고주파수 대역 신호의 주파수 포락선을 획득하도록 구성되거나; 또는 상기 제2 획득 모듈은 구체적으로, 상기 현재 프레임의 상기 신호 타입이 상기 고조파 타입일 때 수신된 비트스트림을 디코딩하여 상기 고주파수 대역 신호의 초기 주파수 포락선을 획득하고, 상기 현재 프레임의 N개의 인접한 프레임들의 N개의 초기 주파수 포락선들 및 상기 초기 주파수 포락선에 대해 가중 계산을 수행하도록 구성되고, 상기 가중 계산에 의해 획득된 값은 상기 고주파수 대역 신호의 상기 주파수 포락선이고, N은 1보다 작지 않은, 디바이스. - 제8항에 있어서,
상기 제2 획득 모듈은 구체적으로, 상기 신호 타입에 따라 수신된 비트스트림을 디코딩하여 상기 고주파수 대역 신호의 주파수 포락선을 획득하도록 구성되고, 상기 비트스트림은 상기 신호 타입 및 상기 고주파수 대역 신호의 상기 주파수 포락선의 인코딩 인덱스를 반송하는, 디바이스. - 제8항 내지 제10항 중 어느 한 항에 있어서,
상기 제1 획득 모듈은 구체적으로 수신된 비트스트림을 디코딩하여 상기 신호 타입 및 상기 저주파수 대역 신호를 획득하도록 구성되는, 디바이스. - 제8항 내지 제10항 중 어느 한 항에 있어서,
상기 제1 획득 모듈은 구체적으로: 수신된 비트스트림을 디코딩하여 상기 현재 프레임의 상기 저주파수 대역 신호를 획득하고, 상기 저주파수 대역 신호에 따라 상기 신호 타입을 결정하도록 구성되는, 디바이스. - 제8항에 있어서,
상기 제1 프로세싱 유닛은 구체적으로: 상기 판단 유닛이 상기 저주파수 대역 신호의 가장 높은 주파수 빈이 상기 미리 설정된 시작 주파수 빈보다 더 작다고 결정할 때, 상기 저주파수 대역 신호에 위치된 여기 신호의 n개 복제본들을 만들고, 상기 미리 설정된 시작 주파수 빈과 상기 고주파수 대역 신호의 가장 높은 주파수 빈 사이의 여기 신호로서 상기 여기 신호의 n개 복제본들을 사용하도록 구성되고, n은 양의 정수 또는 양의 소수이고, n은 상기 미리 설정된 시작 주파수 빈과 상기 고주파수 대역 신호의 가장 높은 주파수 빈 사이의 주파수 빈들의 수량 대 상기 주파수 범위 내의 주파수 빈들의 수량의 비와 같은 디바이스. - 제8항에 있어서,
상기 제2 프로세싱 유닛은 구체적으로: 상기 판단 유닛이 상기 저주파수 대역 신호의 가장 높은 주파수 빈이 상기 미리 설정된 시작 주파수 빈보다 작지 않다고 결정할 때, 상기 fexc_start 위의 m번째 주파수 빈으로부터 상기 fexc_end으로 여기 신호를 복제하여, 상기 주파수 범위 내에서 여기 신호의 n개 복제본을 만들고, 상기 저주파수 대역 신호의 가장 높은 주파수 빈과 상기 고주파수 대역 신호의 가장 높은 주파수 빈 사이의 여기 신호로서 상기 여기 신호들의 2개 부분들을 사용하도록 구성되고, n은 0, 양의 정수 또는 양의 소수이고, m은 상기 저주파수 대역 신호의 가장 높은 주파수 빈과 상기 미리 설정된 시작 주파수 빈 사이의 주파수 빈들의 수량인 디바이스. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310033625.3A CN103971693B (zh) | 2013-01-29 | 2013-01-29 | 高频带信号的预测方法、编/解码设备 |
CN201310033625.3 | 2013-01-29 | ||
PCT/CN2013/076408 WO2014117458A1 (zh) | 2013-01-29 | 2013-05-29 | 高频带信号的预测方法、编/解码设备 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157022814A Division KR20150108421A (ko) | 2013-01-29 | 2013-05-29 | 고주파수 대역 신호에 대한 예측 방법 및 코딩/디코딩 디바이스 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187006404A Division KR101980057B1 (ko) | 2013-01-29 | 2013-05-29 | 고주파수 대역 신호에 대한 예측 방법 및 코딩/디코딩 디바이스 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170043665A KR20170043665A (ko) | 2017-04-21 |
KR101837191B1 true KR101837191B1 (ko) | 2018-03-09 |
Family
ID=51241109
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157022814A KR20150108421A (ko) | 2013-01-29 | 2013-05-29 | 고주파수 대역 신호에 대한 예측 방법 및 코딩/디코딩 디바이스 |
KR1020187006404A KR101980057B1 (ko) | 2013-01-29 | 2013-05-29 | 고주파수 대역 신호에 대한 예측 방법 및 코딩/디코딩 디바이스 |
KR1020177009587A KR101837191B1 (ko) | 2013-01-29 | 2013-05-29 | 고주파수 대역 신호에 대한 예측 방법 및 코딩/디코딩 디바이스 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157022814A KR20150108421A (ko) | 2013-01-29 | 2013-05-29 | 고주파수 대역 신호에 대한 예측 방법 및 코딩/디코딩 디바이스 |
KR1020187006404A KR101980057B1 (ko) | 2013-01-29 | 2013-05-29 | 고주파수 대역 신호에 대한 예측 방법 및 코딩/디코딩 디바이스 |
Country Status (10)
Country | Link |
---|---|
US (3) | US9704500B2 (ko) |
EP (2) | EP3779980A3 (ko) |
JP (2) | JP6204501B2 (ko) |
KR (3) | KR20150108421A (ko) |
CN (2) | CN103971693B (ko) |
BR (1) | BR112015018064B1 (ko) |
ES (1) | ES2822607T3 (ko) |
HK (1) | HK1199540A1 (ko) |
SG (1) | SG11201505885YA (ko) |
WO (1) | WO2014117458A1 (ko) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103971693B (zh) * | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
EP4407609A3 (en) * | 2013-12-02 | 2024-08-21 | Top Quality Telephony, Llc | A computer-readable storage medium and a computer software product |
KR20240046298A (ko) * | 2014-03-24 | 2024-04-08 | 삼성전자주식회사 | 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치 |
US10839814B2 (en) * | 2017-10-05 | 2020-11-17 | Qualcomm Incorporated | Encoding or decoding of audio signals |
JP7077139B2 (ja) | 2018-05-23 | 2022-05-30 | 株式会社豊田中央研究所 | 歪ゲージの製造方法および歪ゲージ |
JP7061587B2 (ja) | 2019-04-05 | 2022-04-28 | Ckd株式会社 | 流体制御弁 |
US10978083B1 (en) * | 2019-11-13 | 2021-04-13 | Shure Acquisition Holdings, Inc. | Time domain spectral bandwidth replication |
CN113192521B (zh) * | 2020-01-13 | 2024-07-05 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
CN112767954B (zh) * | 2020-06-24 | 2024-06-14 | 腾讯科技(深圳)有限公司 | 音频编解码方法、装置、介质及电子设备 |
CN114582361B (zh) * | 2022-04-29 | 2022-07-08 | 北京百瑞互联技术有限公司 | 基于生成对抗网络的高解析度音频编解码方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009078681A1 (en) | 2007-12-18 | 2009-06-25 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
WO2010091013A1 (en) | 2009-02-04 | 2010-08-12 | Motorola, Inc. | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3751225B2 (ja) * | 2001-06-14 | 2006-03-01 | 松下電器産業株式会社 | オーディオ帯域拡張装置 |
JP2003044098A (ja) | 2001-07-26 | 2003-02-14 | Nec Corp | 音声帯域拡張装置及び音声帯域拡張方法 |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
CN101180676B (zh) * | 2005-04-01 | 2011-12-14 | 高通股份有限公司 | 用于谱包络表示的向量量化的方法和设备 |
JP5129117B2 (ja) | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符号化及び復号する方法及び装置 |
KR100770839B1 (ko) * | 2006-04-04 | 2007-10-26 | 삼성전자주식회사 | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 |
KR20070115637A (ko) | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
US20080109215A1 (en) * | 2006-06-26 | 2008-05-08 | Chi-Min Liu | High frequency reconstruction by linear extrapolation |
CN101140759B (zh) | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
DK2571024T3 (en) * | 2007-08-27 | 2015-01-05 | Ericsson Telefon Ab L M | Adaptive transition frequency between the noise filling and bandwidth extension |
JP4529092B2 (ja) * | 2007-09-25 | 2010-08-25 | ソニー株式会社 | チューナ装置 |
KR100970446B1 (ko) | 2007-11-21 | 2010-07-16 | 한국전자통신연구원 | 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법 |
EP3261090A1 (en) | 2007-12-21 | 2017-12-27 | III Holdings 12, LLC | Encoder, decoder, and encoding method |
DE102008015702B4 (de) * | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
CN101751926B (zh) * | 2008-12-10 | 2012-07-04 | 华为技术有限公司 | 信号编码、解码方法及装置、编解码系统 |
CN101763856B (zh) * | 2008-12-23 | 2011-11-02 | 华为技术有限公司 | 信号分类处理方法、分类处理装置及编码系统 |
CN101770775B (zh) * | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
CN101521014B (zh) * | 2009-04-08 | 2011-09-14 | 武汉大学 | 音频带宽扩展编解码装置 |
CN102044250B (zh) * | 2009-10-23 | 2012-06-27 | 华为技术有限公司 | 频带扩展方法及装置 |
WO2011048820A1 (ja) | 2009-10-23 | 2011-04-28 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
KR102020334B1 (ko) | 2010-01-19 | 2019-09-10 | 돌비 인터네셔널 에이비 | 고조파 전위에 기초하여 개선된 서브밴드 블록 |
CN101964189B (zh) | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
CN102436820B (zh) * | 2010-09-29 | 2013-08-28 | 华为技术有限公司 | 高频带信号编码方法及装置、高频带信号解码方法及装置 |
EP3373296A1 (en) * | 2011-02-14 | 2018-09-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise generation in audio codecs |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
CN103971694B (zh) * | 2013-01-29 | 2016-12-28 | 华为技术有限公司 | 带宽扩展频带信号的预测方法、解码设备 |
CN103971693B (zh) * | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
MX353240B (es) * | 2013-06-11 | 2018-01-05 | Fraunhofer Ges Forschung | Dispositivo y método para extensión de ancho de banda para señales acústicas. |
-
2013
- 2013-01-29 CN CN201310033625.3A patent/CN103971693B/zh active Active
- 2013-01-29 CN CN201710076995.3A patent/CN106847297B/zh active Active
- 2013-05-29 BR BR112015018064-7A patent/BR112015018064B1/pt active IP Right Grant
- 2013-05-29 KR KR1020157022814A patent/KR20150108421A/ko not_active Application Discontinuation
- 2013-05-29 KR KR1020187006404A patent/KR101980057B1/ko active IP Right Grant
- 2013-05-29 EP EP20179865.9A patent/EP3779980A3/en active Pending
- 2013-05-29 ES ES13873224T patent/ES2822607T3/es active Active
- 2013-05-29 SG SG11201505885YA patent/SG11201505885YA/en unknown
- 2013-05-29 JP JP2015555543A patent/JP6204501B2/ja active Active
- 2013-05-29 KR KR1020177009587A patent/KR101837191B1/ko active IP Right Grant
- 2013-05-29 WO PCT/CN2013/076408 patent/WO2014117458A1/zh active Application Filing
- 2013-05-29 EP EP13873224.3A patent/EP2937861B1/en active Active
-
2014
- 2014-12-30 HK HK14113071.9A patent/HK1199540A1/xx unknown
-
2015
- 2015-07-24 US US14/808,145 patent/US9704500B2/en active Active
-
2017
- 2017-06-06 US US15/615,810 patent/US10089997B2/en active Active
- 2017-08-30 JP JP2017165309A patent/JP6574820B2/ja active Active
-
2018
- 2018-08-21 US US16/106,700 patent/US10636432B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009078681A1 (en) | 2007-12-18 | 2009-06-25 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
WO2010091013A1 (en) | 2009-02-04 | 2010-08-12 | Motorola, Inc. | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
Non-Patent Citations (2)
Title |
---|
ISO/IEC FDIS 23003-3:2011(E), Information technology - MPEG audio technologies - Part 3: Unified speech and audio coding. ISO/IEC JTC 1/SC 29/WG 11. 2011.09.20.* |
Ulrich Kornagel. Techniques for artificial bandwidth extension of telephone speech. Signal Processing, 2006.06.01, Vol.86, no.6, pages 1296-1306.* |
Also Published As
Publication number | Publication date |
---|---|
KR20170043665A (ko) | 2017-04-21 |
KR20150108421A (ko) | 2015-09-25 |
KR101980057B1 (ko) | 2019-05-17 |
EP2937861A4 (en) | 2016-08-03 |
CN106847297B (zh) | 2020-07-07 |
CN103971693A (zh) | 2014-08-06 |
JP6574820B2 (ja) | 2019-09-11 |
CN103971693B (zh) | 2017-02-22 |
EP2937861A1 (en) | 2015-10-28 |
EP3779980A2 (en) | 2021-02-17 |
BR112015018064A2 (pt) | 2017-07-18 |
KR20180026812A (ko) | 2018-03-13 |
US10089997B2 (en) | 2018-10-02 |
US20150332699A1 (en) | 2015-11-19 |
EP3779980A3 (en) | 2021-07-07 |
SG11201505885YA (en) | 2015-09-29 |
JP6204501B2 (ja) | 2017-09-27 |
JP2017223987A (ja) | 2017-12-21 |
BR112015018064B1 (pt) | 2020-12-01 |
US20180366134A1 (en) | 2018-12-20 |
ES2822607T3 (es) | 2021-05-04 |
US20170270944A1 (en) | 2017-09-21 |
WO2014117458A1 (zh) | 2014-08-07 |
US9704500B2 (en) | 2017-07-11 |
HK1199540A1 (en) | 2015-07-03 |
JP2016509256A (ja) | 2016-03-24 |
EP2937861B1 (en) | 2020-08-12 |
US10636432B2 (en) | 2020-04-28 |
CN106847297A (zh) | 2017-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101837191B1 (ko) | 고주파수 대역 신호에 대한 예측 방법 및 코딩/디코딩 디바이스 | |
US10607621B2 (en) | Method for predicting bandwidth extension frequency band signal, and decoding device | |
JP6364518B2 (ja) | オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置 | |
KR101251813B1 (ko) | 넓은-뜻의 지각적 유사성을 이용하는 디지털 미디어 스펙트럼 데이터의 효과적인 코딩 | |
JP6141443B2 (ja) | 符号化方法、復号化方法、符号化装置及び復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
A107 | Divisional application of patent | ||
GRNT | Written decision to grant |