KR101890346B1 - 신호 처리 방법 및 디바이스 - Google Patents

신호 처리 방법 및 디바이스 Download PDF

Info

Publication number
KR101890346B1
KR101890346B1 KR1020187004298A KR20187004298A KR101890346B1 KR 101890346 B1 KR101890346 B1 KR 101890346B1 KR 1020187004298 A KR1020187004298 A KR 1020187004298A KR 20187004298 A KR20187004298 A KR 20187004298A KR 101890346 B1 KR101890346 B1 KR 101890346B1
Authority
KR
South Korea
Prior art keywords
sub
bands
subset
band
energy
Prior art date
Application number
KR1020187004298A
Other languages
English (en)
Other versions
KR20180019761A (ko
Inventor
빈 왕
레이 미아오
제신 리우
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20180019761A publication Critical patent/KR20180019761A/ko
Application granted granted Critical
Publication of KR101890346B1 publication Critical patent/KR101890346B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

본원의 실시태양은 신호 처리 방법 및 디바이스를 제공한다. 이 방법은: N개의 서브-대역으로부터 M개의 서브-대역을 선택하는 단계 - 상기 N개의 서브-대역이 신호의 현재 프레임의 스펙트럼 계수를 분할함으로써 획득되고, 상기 M개의 서브-대역의 주파수 대역이 상기 N개의 서브-대역에서 상기 M개의 서브-대역을 제외한 K개의 서브-대역의 주파수 대역보다 낮음 -; 상기 M개의 서브-대역의 성능 정보에 따라, 상기 M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것을 결정하는 단계 - 상기 성능 정보는 상기 M개의 서브-대역의 에너지 특성과 스펙트럼 특성을 나타내도록 사용됨 -; 상기 M개의 서브-대역의 수정된 엔벨로프 값을 획득하도록, 상기 M개의 서브-대역의 초기 엔벨로프 값에 대해 개별적으로 수정을 수행하는 단계; 및 상기 M개의 서브-대역의 수정된 엔벨로프 값과 상기 K개의 서브-대역의 초기 엔벨로프 값에 따라 상기 N개의 서브-대역에서 제1 비트 할당을 수행하는 단계를 포함한다. 본원의 이 실시태양에서, 비트 할당이 각 서브-대역의 비트 요건에 더 잘 부합하고, 따라서 신호 인코딩 및 디코딩 성능이 개선될 수 있다.

Description

신호 처리 방법 및 디바이스{SIGNAL PROCESSING METHOD AND DEVICE}
본원은 신호 처리 분야에 관한 것이며, 구체적으로 신호 처리 방법 및 디바이스에 관한 것이다.
현재 통신 송신에서, 주목되고 있는 것은 음성 신호나 오디오 신호의 품질이며, 따라서, 신호 인코딩 및 디코딩에 대한 요구가 크게 증가된다. 현존하는 주파수 도메인 인코딩 알고리즘에서, 비트 할당이 주파수 엔벨로프(frequency envelope)의 크기에 따라 바로 신호의 각 서브-대역 상에서 일반적으로 수행되고, 그 후 각 서브-대역이 할당된 비트의 양을 사용하여 인코딩된다. 그러나, 실제로, 이 현존하는 인코딩 알고리즘에서, 저 주파수 대역의 서브-대역이 신호 인코딩 품질에 대해 비교적 큰 충격을 가지며, 따라서, 저주파 대역의 서브-대역이 일반적으로 신호 인코딩 성능의 장애물이 될 수 있다. 게다가, 전술한 비트 할당 방식이 각 서브-대역의 비트 요구에 양호하게 적응될 수 없을 것이며, 특히 저주파 대역의 서브-대역은 비교적 저하된 신호 인코딩 성능을 나타낸다. 따라서, 신호 디코딩 성능도 역시 비교적 저하된다.
본원의 실시태양은 신호 처리 방법 및 장치를 제공하며, 이 방법 및 장치는 신호 인코딩 및 디코딩 성능을 개선할 수 있다.
제1 측면에 따르면, 신호 처리 방법이 제공되며, 이 방법은:
N개의 서브-대역으로부터 M개의 서브-대역을 선택하는 단계 - N개의 서브-대역이 신호의 현재 프레임의 스펙트럼 계수를 분할함으로써 획득되고, M개의 서브-대역의 주파수 대역이 N개의 서브-대역 내에서 M개의 서브-대역을 제외한 K개의 서브-대역의 주파수 대역보다 낮고, N은 1보다 큰 양의 정수이고, M과 K 둘 다 양의 정수이고, M과 K의 합계가 N임 -;
M개의 서브-대역의 성능 정보에 따라, M개의 서브-대역의 초기(original) 엔벨로프 값(envelope value)에 대한 수정 동작을 수행하는 것을 결정하는 단계 - 상기 성능 정보는 M개의 서브-대역의 에너지 특성과 스펙트럼 특성을 나타내도록 사용됨 -;
M개의 서브-대역의 수정된 엔벨로프 값을 획득하도록, M개의 서브-대역의 초기 엔벨로프 값에 대해 개별적으로 수정을 수행하는 단계; 및
M개의 서브-대역의 수정된 엔벨로프 값과 K개의 서브-대역의 초기 엔벨로프 값에 따라 N개의 서브-대역에 대한 제1 비트 할당을 수행하는 단계
를 포함한다.
제1 측면에 대하여, 제1 가능 구현 방법에서, M개의 서브-대역의 성능 정보에 따라, M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것을 결정하는 단계는:
N개의 서브-대역의 초기 엔벨로프 값에 따라 제1 파라미터를 결정하는 단계 - 제1 파라미터는 M개의 서브-대역 상에서 신호의 스펙트럼 에너지에 대한 집중도를 나타냄 -;
M개의 서브-대역의 초기 엔벨로프 값에 따라 제2 파라미터를 결정하는 단계 - 제2 파라미터는 M개의 서브-대역의 스펙트럼 변동도(degree of spectral fluctuation)를 나타냄 -; 및
제1 파라미터가 제1 범위 내에 있고, 제2 파라미터가 제2 범위 내에 있는 경우에, M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것을 결정하는 단계를 포함한다.
제1 측면의 제1 가능 구현 방법에 대하여, 제2 가능 구현 방법에서, N개의 서브-대역의 초기 엔벨로프 값에 따라 제1 파라미터를 결정하는 단계는:
M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 총 에너지를 결정하는 단계; K개의 서브-대역의 초기 엔벨로프 값에 따라 K개의 서브-대역의 총 에너지를 결정하는 단계; 및 K개의 서브-대역의 총 에너지에 대한 M개의 서브-대역의 총 에너지의 비율을 제1 파라미터로서 결정하는 단계를 포함한다.
제1 측면의 제1 가능 구현 방법 또는 제2 가능 구현 방법에 대하여, 제3 가능 구현 방법에서, M개의 서브-대역의 초기 엔벨로프 값에 따라 제2 파라미터를 결정하는 단계는: M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 총 에너지와 제1 서브-대역의 에너지를 결정하는 단계 - 제1 서브-대역의 에너지는 M개의 서브-대역의 에너지에서 최대임 -; 및 M개의 서브-대역의 총 에너지에 대한 제1 서브-대역의 에너지의 비율을 제2 파라미터로서 결정하는 단계를 포함한다.
제1 측면 또는 임의의 전술한 구현 방법에 대하여, 제4 가능 구현 방법에서, M개의 서브-대역의 수정된 엔벨로프 값을 획득하도록, M개의 서브-대역의 초기 엔벨로프 값에 대해 개별적으로 수정을 수행하는 단계는: M개의 서브-대역의 초기 엔벨로프 값에 따라서 M개의 서브-대역의 총 에너지와 제1 서브-대역의 에너지를 결정하는 단계 - 제1 서브-대역의 에너지가 M개의 서브-대역의 에너지에서 최대임 -; M개의 서브-대역의 총 에너지와 제1 서브-대역의 에너지에 따라 수정 인자를 결정하는 단계; 및 M개의 서브-대역의 수정된 엔벨로프 값을 획득하도록, 수정 인자를 사용하여 M개의 서브-대역의 초기 엔벨로프 값에 대해 개별적으로 수정을 수행하는 단계를 포함한다.
제1 측면 또는 임의의 하나의 전술한 구현 방식에 대하여, 제5 가능 구현 방법에서, M개의 서브-대역에서 각 서브-대역의 수정된 엔벨로프 값이 동일한 서브-대역의 초기 엔벨로프 값보다 크다.
제1 측면 또는 임의의 하나의 전술한 구현 방법에 대하여, 제6 가능 구현 방법에서:
제1 비트 할당 동안 N개의 서브-대역에 각각 할당되는 비트의 양에 따라 N개의 서브-대역의 각 서브-대역의 여분 비트(redundant bit)의 양을 결정하는 단계 - N개의 서브-대역의 각 서브-대역의 여분 비트의 양이 동일한 서브-대역 내의 단일 정보를 인코딩하기 위해 요구되는 비트의 양보다 작음 -; N개의 서브-대역의 각 서브-대역의 여분 비트의 양에 따라 여분 비트의 총량을 결정하는 단계; 및 M개의 서브-대역의 수정된 엔벨로프 값, K개의 서브-대역의 초기 엔벨로프 값, 및 여분 비트의 총량에 따라 N개의 서브-대역 상에서의 제2 비트 할당을 수행하는 단계를 더 포함한다.
제2 측면에 따라서, 신호 처리 디바이스가 제공되며, 이 디바이스는:
N개의 서브-대역으로부터 M개의 서브-대역을 선택하도록 구성된 선택 유닛 - N개의 서브-대역이 신호의 현재 프레임의 스펙트럼 계수를 분할함으로써 획득되고, M개의 서브-대역의 주파수 대역이 N개의 서브-대역 내에서 M개의 서브-대역을 제외한 K개의 서브-대역의 주파수 대역보다 낮고, N은 1보다 큰 양의 정수이고, M과 K 둘 다 양의 정수이고, M과 K의 합계가 N임 -; M개의 서브-대역의 성능 정보에 따라, M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것을 결정하도록 구성된 결정 유닛 - 상기 성능 정보는 M개의 서브-대역의 에너지 특성과 스펙트럼 특성을 나타내도록 사용됨 -; M개의 서브-대역의 수정된 엔벨로프 값을 획득하도록, M개의 서브-대역의 초기 엔벨로프 값에 대해 개별적으로 수정을 수행하도록 구성된 수정 유닛; 및 M개의 서브-대역의 수정된 엔벨로프 값과 K개의 서브-대역의 초기 엔벨로프 값에 따라 N개의 서브-대역에 대한 제1 비트 할당을 수행하도록 구성된 할당 유닛을 포함한다.
제2 측면에 대하여, 제1 가능 구현 방법에서, 결정 유닛은 구체적으로:
N개의 서브-대역의 초기 엔벨로프 값에 따라 제1 파라미터를 결정하고 - 제1 파라미터는 M개의 서브-대역 상에서 신호의 스펙트럼 에너지에 대한 집중도를 나타냄 -;
M개의 서브-대역의 초기 엔벨로프 값에 따라 제2 파라미터를 결정하고 - 제2 파라미터는 M개의 서브-대역의 스펙트럼 변동도를 나타냄 -;
제1 파라미터가 제1 범위 내에 있고, 제2 파라미터가 제2 범위 내에 있는 경우에, M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것을 결정하도록 구성된다.
제2 측면의 제1 가능 구현 방법에 대하여, 제2 가능 구현 방법에서, 결정 유닛은 구체적으로:
M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 총 에너지를 결정하고; K개의 서브-대역의 초기 엔벨로프 값에 따라 K개의 서브-대역의 총 에너지를 결정하고; K개의 서브-대역의 총 에너지에 대한 M개의 서브-대역의 총 에너지의 비율을 제1 파라미터로서 결정하도록 구성된다.
제2 측면의 제1 가능 구현 방법 또는 제2 가능 구현 방법에 대하여, 제3 가능 구현 방법에서, 결정 유닛은 구체적으로:
M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 총 에너지와 제1 서브-대역의 에너지를 결정하고 - 제1 서브-대역의 에너지는 M개의 서브-대역의 에너지에서 최대임 -; M개의 서브-대역의 총 에너지에 대한 제1 서브-대역의 에너지의 비율을 제2 파라미터로서 결정하도록 구성된다.
제2 측면 또는 임의의 하나의 전술한 가능 구현 방법에 대하여, 제4 가능 구현 방법에서, 수정 유닛은 구체적으로:
M개의 서브-대역의 초기 엔벨로프 값에 따라서 M개의 서브-대역의 총 에너지와 제1 서브-대역의 에너지를 결정하고 - 제1 서브-대역의 에너지가 M개의 서브-대역의 에너지에서 최대임 -; M개의 서브-대역의 총 에너지와 제1 서브-대역의 에너지에 따라 수정 인자를 결정하고; M개의 서브-대역의 수정된 엔벨로프 값을 획득하도록, 수정 인자를 사용하여 M개의 서브-대역의 초기 엔벨로프 값에 대해 개별적으로 수정을 수행하도록 구성된다.
제2 측면 또는 임의의 하나의 전술한 가능 구현 방법에 대하여, 제5 가능 구현 방법에서, M개의 서브-대역에서 각 서브-대역의 수정된 엔벨로프 값이 동일한 서브-대역의 초기 엔벨로프 값보다 크다.
제2 측면 또는 임의의 하나의 전술한 구현 방법에 대하여, 제6 가능 구현 방법에서,
결정 유닛은 제1 비트 할당 동안 N개의 서브-대역에 각각 할당되는 비트의 양에 따라 N개의 서브-대역의 각 서브-대역의 여분 비트의 양을 결정하도록 추가적으로 구성되고, N개의 서브-대역의 각 서브-대역의 여분 비트의 양이 동일한 서브-대역 내의 단일 정보를 인코딩하기 위해 요구되는 비트의 양보다 작으며,
결정 유닛은 N개의 서브-대역의 각 서브-대역의 여분 비트의 양에 따라 여분 비트의 총량을 결정하도록 추가적으로 구성되고,
할당 유닛은 M개의 서브-대역의 수정된 엔벨로프 값, K개의 서브-대역의 초기 엔벨로프 값, 및 여분 비트의 총량에 따라 N개의 서브-대역 상에서의 제2 비트 할당을 수행하도록 추가적으로 구성된다.
본원의 실시태양에서, 비트 할당이 N개의 서브-대역의 초기 엔벨로프 값에 따라 바로 수행되지 않으며, 대신에 저주파 대역의 M개의 서브-대역이 N개의 서브-대역으로부터 선택되고, M개의 서브-대역의 에너지 특성과 스펙트럼 특성에 따라, M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것이 결정되고, 수정은 M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 초기 엔벨로프 값에 대해 개별적으로 수행되고, 제1 비트 할당이 M개의 서브-대역의 수정된 엔벨로프 값과 K개의 서브-대역의 초기 엔벨로프 값에 따라 N개의 서브-대역에서 수행되어서, 비트 할당이 각 서브-대역의 비트 요구에 더 양호하게 부합되며, 따라서, 신호 인코딩 및 디코딩 성능이 개선될 수 있다.
본원의 실시태양의 기술적 해결책을 더욱 명확히 기재하기 위하여, 본원의 실시태양을 설명하는데 요구되는 수반되는 도면에 대해 이하 간략히 설명한다. 명백히, 다음의 상세한 설명의 수반되는 도면이 단지 본원의 일부 실시태양이며, 통상의 기술자는 창작적 노력 없이 수반되는 도면으로부터 다른 도면을 도출할 수 있다.
도 1은 본원의 실시태양에 따른 신호 처리 방법의 개략적 흐름도이다.
도 2는 본원의 실시태양에 따른 신호 처리 방법의 과정의 개략적 흐름도이다.
도 3은 본원의 실시태양에 따른 신호 처리 디바이스의 개략적 블록도이다.
도 4는 본원의 또 다른 실시태양에 따른 신호 처리 디바이스의 개략적 블록도이다.
본원의 실시태양의 수반되는 도면을 참조하여 본원의 실시태양의 기술적 해결책을 이하 자세히 기재한다. 명백히, 기재된 실시태양은 일부이며 본원의 모든 실시태양은 아니다. 본원의 실시태양에 기초하여 창적적 노력 없이 이 분야의 통상의 기술자에 의해 획득되는 모든 다른 실시태양이 본원의 보호 범위 내에 있을 것이다.
신호 인코딩 기술 및 신호 디코딩 기술은 다양한 전자 디바이스, 예컨대 휴대 전화, 무선 장치, 개인 데이터 단말기(Personal Data Assistant, PDA), 포켓용 또는 휴대형 컴퓨터, 위성 위치 확인 시스템(Global Positioning System, GPS) 수신기/항법 보조기, 카메라, 오디오/비디오 플레이어, 비디오 카메라, 비디오 레코더, 및 모니터링 디바이스에 널리 적용된다. 일반적으로, 이러한 전자 디바이스는 음성 인코더 또는 오디오 인코더를 포함하고, 음성 디코더나 오디오 디코더를 더 포함할 수 있다. 음성 인코더나 오디오 인코더 및 음성 디코더나 오디오 디코더는 디지털 회로 또는 칩, 예컨대 디지털 신호 처리기(Digital Signal Processor, DSP) 칩에 의해 직접 구현될 수 있고, 또는 소프트웨어 코드에서 절차를 실행하여 소프트웨어 코드-구동 프로세서에 의해 구현될 수 있다.
도 1은 본원의 실시태양에 따른 신호 처리 방법의 개략적 흐름도이다. 도 1의 방법은 전술한 음성 인코더 또는 전술한 오디오 인코더와 같은 인코더 측에 의해 실행된다. 도 1의 방법은 또한 전술한 음성 디코더 또는 전술한 오디오 디코더와 같은 디코더 측에 의해 실행될 수 있다.
인코딩 과정에서, 인코더 측이 시간-도메인 신호를 주파수-도메인 신호로 먼저 변환될 수 있다. 예를 들어, 시간-주파수 변환이 알고리즘 예컨대 고속 퓨리에 변환(Fast Fourier Transform, FFT) 또는 수정 이산 코사인 변환(Modified Discrete Cosine Transform, MDCT)을 사용함으로써 수행될 수 있다. 그 후, 글로벌 이득(global gain)이 주파수-도메인 신호의 스펙트럼 계수에 대한 표준화를 수행하도록 사용될 수 있고, 다수의 서브-대역을 획득하도록 표준화된 스펙트럼 계수에서 분할이 수행된다.
디코딩 과정에서, 디코더 측이 엔코더 측으로부터 수신된 비트스트림을 디코딩하여 표준화된 스펙트럼 계수를 획득하고, 표준화된 스펙트럼 계수에 대해 분할이 수행되어서 다수의 서브-대역이 획득된다.
110. N개의 서브-대역으로부터 M개의 서브-대역을 선택하고, N개의 서브-대역이 신호의 현재 프레임의 스펙트럼 계수를 분할함으로써 획득되고, M개의 서브-대역의 주파수 대역이 N개의 서브-대역에서 M개의 서브-대역을 제외한 K개의 서브-대역의 주파수 대역보다 낮고, N은 1보다 큰 양의 정수이고, M과 K 둘 다 양의 정수이고, M과 K의 합계가 N임.
본원의 이 실시태양에서, 신호는 음성 신호일 수 있고, 오디오 신호일 수 있다. 전술한 K개의 서브-대역이 N개의 서브-대역에서 M개의 서브-대역을 제외한 모든 서브-대역이다.
120. M개의 서브-대역의 성능 정보에 따라, M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것을 결정하며, 상기 성능 정보는 M개의 서브-대역의 에너지 특성과 스펙트럼 특성을 나타내도록 사용됨.
130. M개의 서브-대역의 수정된 엔벨로프 값을 획득하도록, M개의 서브-대역의 초기 엔벨로프 값에 대해 개별적으로 수정을 수행함.
140. M개의 서브-대역의 수정된 엔벨로프 값과 K개의 서브-대역의 초기 엔벨로프 값에 따라 N개의 서브-대역에 대한 제1 비트 할당을 수행함.
본원의 이 실시태양에서, 비트 할당이 N개의 서브-대역의 초기 엔벨로프 값에 따라 바로 수행되지 않으며, 대신에 저주파 대역의 M개의 서브-대역이 N개의 서브-대역으로부터 선택되고, M개의 서브-대역의 에너지 특성과 스펙트럼 특성에 따라, M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것이 결정되고, 수정은 M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 초기 엔벨로프 값에 대해 개별적으로 수행되고, 제1 비트 할당이 M개의 서브-대역의 수정된 엔벨로프 값과 K개의 서브-대역의 초기 엔벨로프 값에 따라 N개의 서브-대역에서 수행되어서, 비트 할당이 각 서브-대역의 비트 요구에 더 양호하게 부합되며, 따라서, 신호 인코딩 및 디코딩 성능이 개선될 수 있다.
구체적으로, 현존하는 주파수 도메인 인코딩 알고리즘에서, 비트 할당이 주파수 엔벨로프의 크기에 따라 바로 신호의 각 서브-대역에서 수행된다. 그 결과로, 할당된 비트의 양이 저주파 대역의 일부 서브-대역의 비트 요구에 잘 부합할 수 없다. 그러나, 본원의 이 실시태양에서, 저주파 대역의 M개의 서브-대역이 N개의 서브-대역으로부터 먼저 선택되고, M개의 서브-대역의 에너지 특성과 스펙트럼 특성에 따라, M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것이 결정되고, 수정은 M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 초기 엔벨로프 값에서 수행되고, 그 후 제1 비트 할당이 M개의 서브-대역의 수정된 엔벨로프 값 및 K개의 서브-대역의 초기 엔벨로프 값에 따라 N개의 서브-대역에서 수행된다. 본원의 이 실시태양에서, N개의 서브-대역의 초기 엔벨로프 값에 따라 N개의 서브-대역에서 비트 할당이 바로 수행되지 않음을 알 수 있다. 대신에, M개의 서브-대역의 에너지 특성과 스펙트럼 특성은 수정이 M개의 서브-대역에서 수행될 필요가 있음을 결정하는 고려사항(consideration)으로 사용되어서, M개의 서브-대역의 각각의 수정된 엔벨로프 값을 획득하고, 비트 할당이 저주파 대역의 서브-대역의 수정된 엔벨로프 값과 다른 서브-대역의 초기 엔벨로프 값에 따라 수행되어서, 각 서브-대역에서 수행되는 비트 할당이 더욱 적절하고, 특히 저주파 대역의 M개의 서브-대역에서 수행되는 비트 할당이 그러하며, 따라서, 신호 인코딩 및 디코딩 성능이 개선될 수 있다.
스펙트럼 계수가 N개의 서브-대역을 획득하도록 분할된 이후에, 각 서브-대역의 엔벨로프이 계산되고 양자화될 수 있다. 그러므로, 각 서브-대역이 양자화 엔벨로프 값을 가진다. 초기 엔벨로프 값이 수정된 엔벨로프 값에 대해 상대적인 것임을 이해해야 하며, 초기 엔벨로프 값이 서브-대역의 초기 엔벨로프 값, 즉 서브-대역 분할 이후에 계산에 의해 획득된 양자화 엔벨로프 값으로 지칭될 수 있다. 서브-대역의 초기 엔벨로프 값이 수정된 후에 획득된 엔벨로프 값이 수정된 엔벨로프 값으로 지칭된다. 따라서, 본원의 이 실시태양에서, 언급한 초기 엔벨로프 값과 수정된 엔벨로프 값 둘 다 양자화 엔벨로프 값으로 지칭된다.
선택적으로, 실시태양으로서, 단계 110에서, M개의 서브-대역이 서브-대역의 고조파 특성(harmonic characteristic)과 서브-대역의 에너지에 따라 N개의 서브-대역으로부터 선택될 수 있다. 예를 들어, M개의 서브-대역에 대하여, 각 서브-대역의 고조파 강도는 미리설정된 강도 임계치보다 클 것이며, N개의 서브-대역의 총 에너지에 대한 서브-대역의 에너지의 비율이 미리설정된 에너지 임계치보다 크다. 언급한 것처럼, 저주파 대역의 서브-대역이 일반적으로는 신호 인코딩 성능에 방해가 된다. 이러한 서브-대역에서, 비교적 강한 고조파 특성을 갖고, 에너지가 모든 서브-대역의 총 에너지의 특정 비율을 차지하는 서브-대역이 특히 인코딩 성능의 방해가 된다. 그러므로, M개의 서브-대역이 서브-대역의 고조파 특성과 서브-대역의 에너지에 따라 N개의 서브-대역으로부터 선택되고, M개의 서브-대역의 초기 엔벨로프 값이 수정된 후에, M개의 서브-대역에서 수행되는 비트 할당이 더 적절하며, 따라서 신호 인코딩 및 디코딩 성능이 효율적으로 개선된다.
선택적으로, 또 다른 실시태양으로서, N개의 서브-대역이 주파수 대역의 오름차순으로 배열될 수 있다. 이 경우에, 단계 110에서, 제1 M개의 서브-대역이 N개의 서브-대역으로부터 선택될 수 있다. 이 실시태양에서, M개의 서브-대역이 주파수 대역의 오름차순으로 선택될 수 있으며, 이것은 동작을 단순화하고 신호 처리 효율성을 개선한다.
선택적으로, 또 다른 실시태양으로서, 단계 120에서, 제1 파라미터가 N개의 서브-대역의 초기 엔벨로프 값에 따라 결정될 수 있고, 제1 파라미터는 M개의 서브-대역에 대하여 신호의 스펙트럼 에너지의 집중도를 나타낼 수 있다. 제2 파라미터가 M개의 서브-대역의 초기 엔벨로프 값에 따라 결정될 수 있고, 제2 파라미터는 M개의 서브-대역의 스펙트럼 변동도를 나타낸다. 제1 파라미터가 제1 범위 내에 있고, 제2 파라미터가 제2 범위 내에 있는 경우에, M개의 서브-대역의 초기 엔벨로프 값에 대해 수정 동작을 수행하는 것이 결정될 수 있다.
구체적으로, M개의 서브-대역의 에너지 특성이 M개의 서브-대역에 대하여 신호의 스펙트럼 에너지의 집중도일 수 있고, M개의 서브-대역의 스펙트럼 특성이 M개의 서브-대역의 스펙트럼 변동도일 수 있다.
제1 범위는 서브-대역의 에너지와 관련되고, 미리설정될 수 있다. M개의 서브-대역에 대하여 신호의 스펙트럼 에너지의 집중도가 비교적 낮은 경우에, N개의 서브-대역에 대한 M개의 서브-대역의 비율이 작다는 것을 나타낼 것이며, 인코딩 성능에 크게 영향을 미치지 않는다. 그러므로, M개의 서브-대역의 초기 엔벨로프 값을 수정할 필요가 없다. M개의 서브-대역에 대하여 신호의 스펙트럼 에너지의 집중도가 비교적 높은 경우에, M개의 서브-대역의 초기 엔벨로프 값이 또한 비교적 크다는 것을 나타낸다. 그러므로, M개의 서브-대역에 할당된 비트의 양이 인코딩에 충분하며, 또한 M개의 서브-대역의 초기 엔벨로프 값을 수정할 필요가 없다. 제1 범위는 실험적 시뮬레이션을 통하여 미리결정될 수 있다. 예를 들어, 제1 범위가 [1/6, 2/3]로 미리설정될 수 있다.
제2 범위가 서브-대역의 스펙트럼 변동도와 관련이 있고, 미리설정될 수 있다. M개의 서브-대역의 스펙트럼 변동도가 낮으면, M개의 서브-대역에 할당된 비트의 양이 작다 할지라도 인코딩 성능에 크게 영향을 미친다. 이 방법으로, M개의 서브-대역의 초기 엔벨로프 값을 수정할 필요가 없다. 그러므로, 제2 범위가 서브-대역의 스펙트럼 변동도가 비교적 높다는 것을 나타낸다. 제2 범위가 실험적인 시뮬레이션을 통하여 미리결정될 수 있다. 예를 들어, 제2 범위가
Figure 112018015216097-pat00001
또는
Figure 112018015216097-pat00002
로 미리설정될 수 있다. 일반적으로, 신호에서, 인코딩을 위해 사용될 수 있는 대역폭이 0 내지 4 KHz라면, 제2 범위는
Figure 112018015216097-pat00003
로 미리설정될 수 있고; 신호에서, 인코딩을 위해 사용될 수 있는 대역폭이 0 내지 8 KHz라면, 제2 범위가
Figure 112018015216097-pat00004
로 미리설정될 수 있다.
제1 파라미터가 제1 범위 내에 있고, 제2 파라미터가 제2 범위 내에 있다면, M개의 서브-대역에 대하여 신호의 스펙트럼 에너지의 집중도가 극히 높지도 극히 낮지도 않으며, M개의 서브-대역의 스펙트럼 변동도가 비교적 높다는 것을 의미하고, M개의 서브-대역의 초기 엔벨로프 값에서 수정이 수행될 수 있어서, M개의 서브-대역의 제1 비트 할당 동안 M개의 서브-대역에 할당되는 비트가 M개의 서브-대역의 비트 요건에 부합한다. 예를 들어, M개의 서브-대역의 각 서브-대역에 대하여, 수정된 엔벨로프 값이 초기 엔벨로프 값보다 크다. 그 후, M개의 서브-대역의 초기 엔벨로프 값에 따른 제1 비트 할당의 수행과 비교하여, M개의 서브-대역의 수정된 엔벨로프 값에 따른 제1 비트 할당의 수행은 M개의 서브-대역에 할당된 비트의 양을 더 크게 하고, 따라서, M개의 서브-대역의 인코딩 성능이 개선될 수 있다.
N개의 서브-대역의 초기 엔벨로프 값에 따라 결정된 제1 파라미터와 제2 파라미터가 각 주파수 대역의 특성을 반영할 수 있음을 알 수 있을 것이다. 그러므로, 제1 파라미터가 제1 범위 내에 있고, 제2 파라미터가 제2 범위 내에 있는 경우에, M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것이 결정되어서, M개의 서브-대역의 수정된 엔벨로프 값에 따라 비트 할당이 후속하여 수행되는 경우에, M개의 서브-대역에 할당되는 비트의 양이 M개의 서브-대역의 비트 요건에 더 잘 부합하며, 따라서, 신호 인코딩 및 디코딩 성능이 개선될 수 있다.
선택적으로, 또 다른 실시태양으로서, 단계 120에서, M개의 서브-대역의 총 에너지가 M개의 서브-대역의 초기 엔벨로프 값에 따라 결정될 수 있다. K개의 서브-대역의 총 에너지가 K개의 서브-대역의 초기 엔벨로프 값에 따라 결정될 수 있다. K개의 서브-대역의 총 에너지에 대한 M개의 서브-대역의 총 에너지의 비율이 제1 파라미터로서 결정될 수 있다.
구체적으로, K개의 서브-대역의 총 에너지에 대한 M개의 서브-대역의 총 에너지의 비율이 제1 파라미터로서 결정될 수 있다.
예를 들어, 제1 파라미터가 다음의 함수에 따라 계산하여 획득될 수 있고, 여기서 제1 파라미터는 α로 나타낸다:
Figure 112018015216097-pat00005
여기서,
Figure 112018015216097-pat00006
은 M개의 서브-대역의 총 에너지를 나타내고,
Figure 112018015216097-pat00007
는 K개의 서브-대역의 총 에너지를 나타내고, band_ width i 는 i번째 서브-대역의 대역폭을 나타내고, band_ energy i 는 i번째 서브-대역의 에너지를 나타내고, band_ energy i 는 i번째 서브-대역의의 초기 엔벨로프 값을 나타낸다. 예를 들어, i번째 서브-대역의 초기 엔벨로프 값 band_ energy i 이 i번째 서브-대역의 스펙트럼 계수에 따라 획득될 수 있다. 예를 들어, band_energy i 가 다음의 함수에 따라 획득될 수 있다:
Figure 112018015216097-pat00008
Figure 112018015216097-pat00009
이 분야의 통상의 기술자는 전술한 함수에 따라 다양한 등가의 수정 또는 변경을 하여, 제1 파라미터를 획득하고, 이러한 수정이나 변경이 본원의 이 실시태양의 범위 내에 있음이 명백하다.
선택적으로, 또 다른 실시태양으로서, 단계 120에서, M개의 서브-대역의 초기 엔벨로프 값에 따라, M개의 서브-대역의 총 에너지가 결정될 수 있고, 제1 서브-대역의 에너지가 결정될 수 있고, 제1 서브-대역의 에너지가 M개의 서브-대역의 에너지에서 최대이다. M개의 서브-대역의 총 에너지에 대한 제1 서브-대역의 에너지의 비율이 제2 파라미터로서 결정될 수 있다.
구체적으로, M개의 서브-대역의 스펙트럼 변동도가 M개의 서브-대역의 초기 엔벨로프 값의 변동도를 사용함으로써 나타낼 수 있다. 예를 들어, 제2 파라미터가 다음의 함수에 따른 계산으로 획득될 수 있고, 제2 파라미터는 β로 표현된다:
Figure 112018015216097-pat00010
여기서,
Figure 112018015216097-pat00011
Figure 112018015216097-pat00012
의 계산 방식에 대하여, 다음의 함수를 참조할 수 있다.
통상의 기술자는, 제2 파라미터를 획득하도록, 전술한 함수에 따른 다양한 등가의 수정 또는 변경을 할 수 있음이 명백하며, 이러한 수정 또는 변경은 또한 본원의 실시태양의 범위 내에 있을 것임을 이해해야 할 것이다.
선택적으로, 또 다른 실시태양으로서, 단계 130에서, M개의 서브-대역의 총 에너지 및 제1 서브-대역의 에너지가 M개의 서브-대역의 초기 엔벨로프 값에 따라 결정될 수 있고, 제1 서브-대역의 에너지가 M개의 서브-대역의 에너지에서 최대이다. 수정 인자가 M개의 서브-대역의 총 에너지와 제1 서브-대역의 에너지에 따라 결정될 수 있다. 그 후, M개의 서브-대역의 수정된 엔벨로프 값을 획득하도록, 수정 인자를 사용함으로써 M개의 서브-대역의 초기 엔벨로프 값에 대하여 수정이 개별적으로 수행될 수 있다.
예를 들어, 수정 인자가 다음의 함수에 따라 결정될 수 있고, 수정 인자는 γ로 표현될 수 있다:
Figure 112018015216097-pat00013
, 및
Figure 112018015216097-pat00014
여기서,
Figure 112018015216097-pat00015
Figure 112018015216097-pat00016
의 계산 방식에 대하여, 전술한 함수를 참조할 수 있다.
수정 인자
Figure 112018015216097-pat00017
에 따라 M개의 서브-대역 내의 각 서브-대역의 초기 엔벨로프 값에 대한 수정이 수행될 수 있다. 예를 들어, 각 서브-대역의 초기 엔벨로프 값이 수정 인자로 곱해서, 서브-대역의 수정된 엔벨로프 값을 획득할 수 있다.
통상의 기술자는 수정 인자를 획득하기 위하여, 전술한 함수에 따른 다양한 등가의 수정 또는 변경을 할 수 있음이 명백하고, 그러한 수정 또는 변경이 또한 본원의 실시태양의 범위 내에 있을 것임을 이해해야 할 것이다.
선택적으로, 또 다른 실시태양으로서, 단계 130에서, M개의 서브-대역 내의 각 서브-대역의 수정된 엔벨로프 값이 서브-대역의 초기 엔벨로프 값보다 클 수 있다.
구체적으로, M개의 서브-대역 내의 각 서브-대역의 수정된 엔벨로프 값이 M개의 서브-대역 내의 각 서브-대역의 초기 엔벨로프 값에 대한 수정을 수행함으로써 획득된다. 각 서브-대역의 수정된 엔벨로프 값은 서브-대역의 초기 엔벨로프 값보다 클 수 있다. M개의 서브-대역 내의 각 서브-대역의 수정된 엔벨로프 값이 서브-대역의 초기 엔벨로프 값보다 크면, 단계 140에서, 비트 할당이 M개의 서브-대역의 수정된 엔벨로프 값에 따라 수행된다. 이 방법으로, M개의 서브-대역 내의 각 서브-대역에 할당된 비트의 양이 증가하여, 비트 할당이 각 서브-대역의 비트 요건에 더 잘 부합하고, 따라서, 신호 인코딩 및 디코딩 성능이 개선될 수 있다.
선택적으로, 또 다른 실시태양으로서, 단계 130에서, M개의 서브-대역 내의 각 서브-대역의 수정된 엔벨로프 값이 서브-대역의 초기 엔벨로프 값보다 작을 수 있다.
구체적으로, M개의 서브-대역의 각 서브-대역의 수정된 엔벨로프 값이 서브-대역의 초기 엔벨로프 값보다 작다면, 단계 140에서, M개의 서브-대역의 수정된 엔벨로프 값과 K개의 서브-대역의 초기 엔벨로프 값에 따라 비트 할당이 수행된다. 이 방법으로, M개의 서브-대역의 각 서브-대역에 할당된 비트의 양이 비교적 작고, 따라서 K개의 서브-대역에 각각 할당된 비트의 양이 증가하여, 비트 할당이 각 서브-대역의 비트 요건에 더 잘 부합하게 되고, 따라서, 신호 인코딩 및 디코딩 성능이 개선될 수 있다.
선택적으로, 또 다른 실시태양으로서, 단계 130에서, 제1 비트 할당이 엔벨로프 값의 내림차순으로 N개의 서브-대역에서 수행될 수 있다.
선택적으로, 또 다른 실시태양으로서, 단계 130에서, 수정 인자가 제2 파라미터에 따라 결정될 수 있다. 그 후, 수정 인자를 사용함으로써 M개의 서브-대역의 초기 엔벨로프 값에 대해 개별적으로 수정이 수행될 수 있어서, M개의 서브-대역의 수정된 엔벨로프 값을 획득할 수 있다.
구체적으로, 수정 인자가 제2 파라미터에 따라 결정될 수 있다. 수정 인자에 따라 M개의 서브-대역의 각 서브-대역의 초기 엔벨로프 값에 대한 수정이 수행될 수 있다. 예를 들어, 각 서브-대역의 초기 엔벨로프 값이 서브-대역의 수정된 엔벨로프 값을 획득하도록 수정 인자로 곱해질 수 있고, 따라서, M개의 서브-대역에 할당된 비트의 양이 M개의 서브-대역의 비트 요건에 더 잘 부합하며, 이로써, 신호 인코딩 및 디코딩 성능이 개선될 수 있다.
제1 비트 할당이 수행된 후에, 일반적으로, 각 서브-대역에 할당된 비트에서 여분 비트가 존재한다. 각 서브-대역의 여분 비트는 서브-대역의 하나의 정보 유닛을 인코딩하기 위해 충분하지 않다 그러므로, 여분 비트의 총량을 획득하도록 모든 서브-대역의 여분 비트의 양이 계산될 수 있고, 그 후 제2 비트 할당이 수행된다.
선택적으로, 또 다른 실시태양으로서, 단계 140 이후에, N개의 서브-대역의 각 서브-대역의 여분 비트의 양이 제1 비트 할당 동안 N개의 서브-대역에 각각 할당된 배트의 양에 따라 결정될 수 있고, N개의 서브-대역의 각 서브-대역의 여분 비트의 양이 동일한 서브-대역에서의 인코딩을 위해 요구되는 비트의 양보다 작다. 여분 비트의 총량이 N개의 서브-대역의 각 서브-대역의 여분 비트의 양에 따라 결정될 수 있다. 그 후, 제2 비트 할당이 여분 비트의 총량에 따라 N개의 서브-대역에서 수행될 수 있다.
구체적으로, 총 여분 비트가 N개의 서브-대역에 동등하게 할당될 수 있다. 이 방법으로, 여분 비트가 재사용되어서, 비트의 소비를 방지하고, 신호 인코딩 및 디코딩 성능을 더 개선시킨다.
제1 비트 할당과 제2 비트 할당의 과정을 기재한다. 전술한 도 1의 방법이 인코더 측에서 실행된다면, 제2 비트 할당 이후에, 인코더 측이 2회의 비트 할당의 과정에서 각 서브-대역에 할당된 비트의 양을 이용함으로써 각 서브-대역의 스펙트럼 계수를 양자화하고, 각 서브-대역의 초기 엔벨로프 값의 인덱스 및 양자화 스펙트럼 계수의 인덱스를 비트스트림에 기록하고, 그 후 비트스트림을 디코더 측에 전송한다.
도 1의 전술한 방법이 디코더 측에 의해 실행된다면, 제2 비트 할당 이후에, 디코더 측이 2회 비트 할당의 과정에서 각 서브-대역에 할당된 비트의 양을 사용함으로써 양자화 스펙트럼 계수를 디코딩할 수 있으며, 이로써 회복된 신호를 획득한다.
특정 실시예를 참조하여 본원의 실시태양을 이하 자세히 기재한다. 이 실시예는 통상의 기술자가 본원의 실시태양을 더 잘 이해하도록 하려는 의도일 뿐이고, 본원의 실시태양의 범위를 제한하려는 의도는 아님을 이해해야 한다.
다음의 실시예에서, 인코더 측이 실시예로서 사용된다.
도 2는 본원의 실시태양에 따른 신호 처리 방법의 과정의 개략적 흐름도이다.
201. 인코더 측이 시간-도메인 신호에 대한 시간-주파수 변환을 수행함.
202. 인코더 측이 주파수-도메인 신호의 스펙트럼 계수를 N개의 서브-대역으로 분할하며, N은 1보다 큰 양의 정수임.
구체적으로, 인코더 측이 글로벌 이득을 계산할 수 있고, 글로벌 이득이 초기 스펙트럼 계수에 대한 표준화를 수행하도록 사용되고; 그 후, 모든 서브-대역을 획득하도록 표준화된 스펙트럼 계수에 대한 분할이 수행된다.
203. 인코더 측이 계산 동작 및 양자화 동작을 통하여 각 서브-대역의 초기 엔벨로프 값을 획득함.
204. 인코더 측이 개 서브-대역으로부터 M개의 서브-대역을 선택하며, M이 양이 정수임.
M개의 서브-대역의 주파수 대역이 N개의 서브-대역에서 M개의 서브-대역을 제외한 K개의 서브-대역의 주파수 대역보다 낮고, K는 양의 정수이고, K와 M의 합계는 N이다.
205. 인코더 측이 M개의 서브-대역의 초기 엔벨로프 값과 K개의 서브-대역의 초기 엔벨로프 값에 따라 제1 파라미터를 결정함.
제1 파라미터가 M개의 서브-대역에 대하여 신호의 스펙트럼 에너지의 집중도를 나타낼 수 있다. 예를 들어, K개의 서브-대역의 총 에너지에 대한 M개의 서브-대역의 총 에너지의 비율이 제1 파라미터를 나타내도록 사용될 수 있다. 제1 파라미터의 계산 방식에 대하여, 도 1의 실시태양의 제1 파라미터의 계산 방식이 참조될 수 있고, 자세한 사항은 여기에 다시 기재하지는 않는다.
206. 인코더 측이 M개의 서브-대역의 초기 엔벨로프 값에 따라 제2 파라미터를 결정함.
제2 파라미터가 M개의 서브-대역의 스펙트럼 변동도를 나타낼 수 있다. 예를 들어, M개의 서브-대역의 총 에너지에 대한 제1 서브-대역의 에너지의 비율이 제2 파라미터를 나타내도록 사용될 수 있고, 제1 서브-대역의 에너지는 M개의 서브-대역의 에너지에서 최대이다. 제2 파라미터의 계산 방식에 대하여, 도 1의 실시태양의 제2 파라미터의 계산 방식을 침조할 수 있고, 자세한 사항을 다시 기재하지는 않는다.
207. 인코더 측이 제1 파라미터가 제1 범위 내에 있고, 제2 파라미터가 제2 범위 내에 있는지 여부를 결정함.
제1 범위 및 제2 범위가 미리설정될 수 있다. 예를 들어, 제1 범위는 [1/6, 2/3]로 미리설정될 수 있다. 제2 범위는
Figure 112018015216097-pat00018
또는
Figure 112018015216097-pat00019
로 미리 설정될 수 있다.
208. 인코더 측이 제1 파라미터가 제1 범위 내에 있고, 제2 파라미터가 제2 범위 내에 있다고 결정하면, 단계 207에서, M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 초기 엔벨로프 값을 수정하여, M개의 서브-대역의 수정된 엔벨로프 값을 획득할 수 있다.
구체적으로, 인코더 측이 M개의 서브-대역의 초기 엔벨로프 값에 따라 수정 인자를 결정할 수 있다. 수정 인자의 계산 방식에 대하여, 도 1의 실시태양의 과정을 참조할 수 있고, 자세한 사항은 다시 기재하지는 않는다. 인코더 측이 수정 인자를 사용하여 M개의 서브-대역의 각 서브-대역의 초기 엔벨로프 값에 대한 수정을 수행할 수 있어서, M개의 서브-대역의 수정된 엔벨로프 값을 획득한다. 예를 들어, 각 서브-대역의 수정된 엔벨로프 값이 서브-대역의 초기 엔벨로프 값보다 클 수 있다.
209. 인코더 측이 M개의 서브-대역의 수정된 엔벨로프 값과 K개의 서브-대역의 초기 엔벨로프 값에 따라 N개의 서브-대역에 대한 제1 비트 할당을 수행함.
예를 들어, 인코더 측이 엔벨로프 값의 내림차순으로 N개의 서브-대역에서 제1 비트 할당을 수행할 수 있다. M개의 서브-대역에 대하여, 각 서브-대역의 수정된 엔벨로프 값이 서브-대역의 초기 엔벨로프 값보다 더 크기 때문에, 수정 전에 할당된 비트의 양과 비교하여, M개의 서브-대역의 각 서브-대역에 할당된 비트의 양이 증가하며, 이로써 비트 할당이 각 서브-대역의 비트 요건에 더 잘 부합하여서, 신호 인코딩 및 디코딩 성능을 개선한다.
210. 인코더 측이 N개의 서브-대역에 대해 제2 비트 할당을 수행함.
구체적으로, 제1 비트 할당 후의 N개의 서브-대역의 각 서브-대역에 할당된 비트의 양과 각 서브-대역의 대역폭에 따라 각 서브-대역의 여분 비트의 양을 결정하여서, N개의 서브-대역의 여분 비트의 총량을 결정할 수 있다. 그 후, 총 여분 비트가 여분 비트의 총량에 따라 N개의 서브-대역에 동등하게 할당된다.
211. 인코더 측이 N개의 서브-대역의 각 서브-대역에 할당된 비트의 양에 따라 각 서브-대역의 스펙트럼 계수를 양자화함.
212. 인코더 측이 단계 211에서 획득된 양자화 스펙트럼 계수와 각 서브-대역의 초기 엔벨로프 값에 따라 비트스트림을 기록함.
구체적으로, 인코더 측이 양자화 스펙트럼 계수의 인덱스, 각 서브-대역의 초기 엔벨로프 값, 및 이와 유사한 것을 비트스트림에 기록할 수 있다. 특정 과정에서, 종래 기술이 참조되며, 여기에 다시 기재하지는 않는다.
213. 인코더 측이 제1 파라미터가 제1 범위 밖에 있거나 제2 파라미터가 제2 범위 밖에 있다고 결정되면, 단계 207에서, 인코더 측이 N개의 서브-대역의 초기 엔벨로프 값에 따라 N개의 서브-대역에 대한 제1 비트 할당을 수행함.
예를 들어, 인코더 측이 엔벨로프 값의 내림차순으로 N개의 서브-대역에 대해 제1 비트 할당을 수행할 수 있다.
214. 인코더 측이 N개의 서브-대역에 대한 제2 비트 할당을 수행함.
구체적으로, 인코더 측이 제1 비트 할당 후의 N개의 서브-대역의 각 서브-대역에 할당된 비트의 양과 각 서브-대역의 대역폭에 따라 각 서브-대역의 여분 비트의 양을 결정하여서, N개의 서브-대역의 여분 비트의 총량을 결정한다. 그 후, 총 여분 비트가 여분 비트의 총량에 따라 N개의 서브-대역에 동등하게 할당된다.
215. 인코더 측이 N개의 서브-대역 내의 각 서브-대역에 할당된 비트의 양에 따라 각 서브-대역의 스펙트럼 계수를 양자화함.
216. 인코더 측이 단계 215에서 획득된 양자화된 스펙트럼 계수 및 각 서브-대역의 초기 엔벨로프 값에 따라 비트스트림을 기록한다.
구체적으로, 인코더 측이 각 서브-대역의 초기 엔벨로프 값, 양자화 스펙트럼 계수의 인덱스 등을 비트스트림에 기록할 수 있다. 특정 과정에서, 종래 기술이 참조되고, 여기에 다시 자세한 사항을 기재하지는 않는다.
본원의 실시태양에서, 제1 파라미터가 제1 범위 내에 있고, 제2 파라미터가 제2 범위 내에 있는 경우에, M개의 서브-대역의 초기 엔벨로프 값에 따라 저주파 대역의 M개의 서브-대역의 초기 엔벨로프 값에 대한 수정이 수행되고, 제1 비트 할당이 M개의 서브-대역의 수정된 엔벨로프 값과 K개의 서브-대역의 초기 엔벨로프 값에 따라 N개의 서브-대역에서 수행되어서, 할당이 각 서브-대역의 비트 요건에 더 잘 부합하고, 따라서, 신호 인코딩 및 디코딩 성능이 개선될 수 있다.
도 3은 본원의 실시태양에 따른 신호 처리 디바이스의 개략적 블록도이다. 도 3의 디바이스(300)는 인코더 측 디바이스 또는 디코더 측 디바이스일 수 있다. 도 3의 디바이스(300)는 선택 유닛(310), 결정 유닛(320), 수정 유닛(330), 및 할당 유닛(340)을 포함한다.
선택 유닛(310)이 N개의 서브-대역으로부터 M개의 서브-대역을 선택하고, N개의 서브-대역이 신호의 현재 프레임의 스펙트럼 계수를 분할함으로써 획득되며, M개의 서브-대역의 주파수 대역이 N개의 서브-대역에서 M개의 서브-대역을 제외한 K개의 서브-대역의 주파수 대역보다 낮고, N이 1보다 큰 양의 정수이며, M와 K 둘 다 양의 정수이며, M과 K의 합계가 N이다. 결정 유닛(320)이 M개의 서브-대역의 성능 정보에 따라, M개의 서브-대역의 초기 엔벨로프 값에서 수정 동작을 수행하는 것을 결정하고, 성능 정보는 M개의 서브-대역의 에너지 특성과 스펙트럼 특성을 나타내도록 사용된다. 수정 유닛(330)은 M개의 서브-대역의 초기 엔벨로프 값에 대한 수정을 개별적으로 수행하여, M개의 서브-대역의 수정된 엔벨로프 값을 획득한다. 할당 유닛(340)이 M개의 서브-대역의 수정된 엔벨로프 값과 K개의 서브-대역의 초기 엔벨로프 값에 따라 N개의 서브-대역에 제1 비트 할당을 수행한다.
본원의 이 실시태양에서, 비트 할당이 N개의 서브-대역의 초기 엔벨로프 값에 따라 바로 수행되지 않고, 대신에 저주파 대역의 M개의 서브-대역이 N개의 서브-대역으로부터 선택되고, M개의 서브-대역의 에너지 특성과 스펙트럼 특성에 따라, M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것이 결정되고, 수정이 M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 초기 엔벨로프 값에서 개별적으로 수행되고, 제1 비트 할당이 M개의 서브-대역의 수정된 엔벨로프 값과 K개의 서브-대역의 초기 엔벨로프 값에 따라 N개의 서브-대역에서 수행되어서, 비트 할당이 각 서브-대역의 비트 요건에 더 잘 부합하며, 따라서, 신호 인코딩 및 디코딩 성능이 개선될 수 있다.
선택적으로, 실시태양으로서, 결정 유닛(320)이 N개의 서브-대역의 초기 엔벨로프 값에 따라 제1 파라미터를 결정할 수 있고, 제1 파라미터가 M개의 서브-대역에 대하여 신호의 스펙트럼 에너지의 집중도를 나타낸다. 결정 유닛(320)이 M개의 서브-대역의 초기 엔벨로프 값에 따라 제2 파라미터를 결정할 수 있고, 제2 파라미터가 M개의 서브-대역의 스펙트럼 변동도를 나타낸다. 결정 유닛(320)은 제1 파라미터가 제1 범위 내에 있고, 제2 파라미터가 제2 범위 내에 있는 경우에, M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것을 결정할 수 있다.
선택적으로, 또 다른 실시태양으로서, 결정 유닛(320)이 M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 총 에너지를 결정할 수 있고, K개의 서브-대역의 초기 엔벨로프 값에 따라 K개의 서브-대역의 총 에너지를 결정할 수 있고, K개의 서브-대역의 총 에너지에 대한 M개의 서브-대역의 총 에너지의 비율을 제1 파라미터로서 결정할 수 있다.
선택적으로, 또 다른 실시태양으로서, 결정 유닛(320)이 M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 총 에너지와 제1 서브-대역의 에너지를 결정할 수 있고, 제1 서브-대역의 에너지가 M개의 서브-대역의 에너지에서 최대이다. 결정 유닛(320)이 M개의 서브-대역의 총 에너지에 대한 제1 서브-대역의 에너지의 비율을 제2 파라미터로서 결정할 수 있다.
선택적으로, 또 다른 실시태양으로서, 수정 유닛(330)이 M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 총 에너지와 제1 서브-대역의 에너지를 결정할 수 있고, 제1 서브-대역의 에너지가 M개의 서브-대역의 에너지에서 최대이다. 수정 유닛(330)이 M개의 서브-대역의 총 에너지와 제1 서브-대역의 에너지에 따라 수정 인자를 결정할 수 있고, 수정 인자를 사용함으로써 M개의 서브-대역의 초기 엔벨로프 값에 대한 수정을 개별적으로 수행할 수 있어서, M개의 서브-대역의 수정된 엔벨로프 값을 획득한다.
선택적으로, 또 다른 실시태양으로서, M개의 서브-대역의 각 서브-대역의 수정된 엔벨로프 값이 동일한 서브-대역의 초기 엔벨로프 값 보다 클 수 있다.
선택적으로, 또 다른 실시태양으로서, 결정 유닛(320)이 제1 비트 할당 동안 N개의 서브-대역에 각각 할당된 비트의 양에 따라 N개의 서브-대역의 각 서브-대역의 여분 비트의 양을 추가적으로 결정할 수 있고, N개의 서브-대역의 각 서브-대역의 여분 비트의 양이 동일한 서브-대역 내의 단일 정보 유닛을 인코딩하기 위해 요구되는 비트의 양보다 작다. 결정 유닛(320)이 N개의 서브-대역의 각 서브-대역의 여분 비트의 양에 따라 여분 비트의 총량을 추가로 결정할 수 있다. 할당 유닛(340)이 M개의 서브-대역의 수정된 엔벨로프 값, K개의 서브-대역의 초기 엔벨로프 값, 및 여분 비트의 총량에 따라 N개의 서브-대역에 대한 제2 비트 할당을 추가로 수행할 수 있다.
디바이스(300)의 다른 기능 및 동작에 대하여, 도 1 및 도 2의 방법 실시태양의 과정을 참조할 수 있다. 반복을 피하기 위하여, 자세한 사항을 다시 기재하지는 않는다.
도 4는 본원의 또 다른 실시태양에 따른 신호 처리 디바이스의 개략적 블록도이다. 도 4의 디바이스(400)는 인코더 측 디바이스 또는 디코더 측 디바이스일 수 있다. 도 4의 디바이스(400)는 메모리(410)와 프로세서(420)를 포함한다.
메모리(410)는 랜덤 액세스 메모리, 플래시 메모리, 판독-전용 메모리, 프로그래머블 판독-전용 메모리, 비휘발성 메모리, 레지스터 또는 이와 유사한 것을 포함할 수 있다. 프로세서(420)는 중앙 처리 장치(Central Processing Unit, CPU)일 수 있다.
메모리(410)가 실행가능 명령어를 저장하도록 구성된다. 프로세서(420)는 메모리(410) 내에 저장된 실행가능 명령어를 실행할 수 있어서, N개의 서브-대역으로부터 M개의 서브-대역을 선택하고 - N개의 서브-대역은 신호의 현재 프레임의 스펙트럼 계수를 분할함으로써 획득되며, M개의 서브-대역의 주파수 대역이 N개의 서브-대역에서 M개의 서브-대역을 제외한 K개의 서브-대역의 주파수 대역보다 낮고, N은 1보다 큰 양의 정수이고, M와 K 둘다 양의 정수이며, M과 K의 함계가 N임 -; M개의 서브-대역의 성능 정보에 따라 M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것을 결정하고 - 성능 정보가 M개의 서브-대역의 에너지 특성과 스펙트럼 특성을 나타내도록 사용됨 -; M개의 서브-대역의 수정된 엔벨로프 값을 획득하도록, M개의 서브-대역의 초기 엔벨로프 값에 대한 수정을 개별적으로 수행하고; M개의 서브-대역의 수정된 엔벨로프 값과 K개의 서브-대역의 초기 엔벨로프 값에 따라 N개의 서브-대역에 대한 제1 비트 할당을 수행한다.
본원의 이 실시태양에서, 비트 할당이 N개의 서브-대역의 초기 엔벨로프 값에 따라 바로 수행되지 않으며, 대신에 저주파 대역의 M개의 서브-대역이 N개의 서브-대역으로부터 선택되고, M개의 서브-대역의 에너지 특성과 스펙트럼 특성에 따라 M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것이 결정되며, 수정이 M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 초기 엔벨로프 값에 대해 개별적으로 수행되고, 제1 비트 할당이 M개의 서브-대역의 수정된 엔벨로프 값 및 K개의 서브-대역의 초기 엔벨로프 값에 따라 N개의 서브-대역에서 수행하여, 비트 할당이 각 서브-대역의 비트 요건에 더 잘 부합하게 되고, 따라서 신호 인코딩 및 디코딩 성능이 개선될 수 있다.
선택적으로, 실시태양으로서, 프로세서(420)가 N개의 서브-대역의 초기 엔벨로프 값에 따라 제1 파라미터를 결정하고, 제1 파라미터는 M개의 서브-대역에 대하여 신호의 스펙트럼 에너지의 집중도를 나타낸다. 프로세서(420)는 M개의 서브-대역의 초기 엔벨로프 값에 따라 제2 파라미터를 결정할 수 있고, 제2 파라미터가 M개의 서브-대역의 스펙트럼 변동도를 나타낸다. 프로세서(420)가 제1 파라미터가 제1 범위 내에 있고, 제2 파라미터가 제2 범위 내에 있는 경우에, M개의 서브-대역의 초기 엔벨로프 값에 대한 수정 동작을 수행하는 것을 결정할 수 있다.
선택적으로, 또 다른 실시태양으로서, 프로세서(420)가 M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 총 에너지를 결정할 수 있고, K개의 서브-대역의 초기 엔벨로프 값에 따라 K개의 서브-대역의 총 에너지를 결정할 수 있고, K개의 서브-대역의 총 에너지에 대한 M개의 서브-대역의 총 에너지의 비율을 제1 파라미터로서 결정할 수 있다.
선택적으로, 또 다른 실시태양으로서, 프로세서(420)가 M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 총 에너지와 제1 서브-대역의 에너지를 결정할 수 있고, 제1 서브-대역의 에너지는 M개의 서브-대역의 에너지에서 최대이다. 프로세서(420)는 M개의 서브-대역의 총 에너지에 대한 제1 서브-대역의 에너지의 비율을 제2 파라미터로서 결정할 수 있다.
선택적으로, 또 다른 실시태양으로서, 프로세서(420)가 M개의 서브-대역의 초기 엔벨로프 값에 따라 M개의 서브-대역의 총 에너지와 제1 서브-대역의 에너지를 결정할 수 있고, 제1 서브-대역의 에너지는 M개의 서브-대역의 에너지에서 최대이다. 프로세서(420)가 M개의 서브-대역의 총 에너지와 제1 서브-대역의 에너지에 따라 수정 인자를 결정할 수 있고, 수정 인자를 사용함으로써 M개의 서브-대역의 초기 엔벨로프 값에 대한 수정을 개별적으로 수행할 수 있어서, M개의 서브-대역의 수정된 엔벨로프 값을 획득할 수 있다.
선택적으로, 또 다른 실시태양으로서, M개의 서브-대역의 각 서브-대역의 수정된 엔벨로프 값이 동일한 서브-대역의 초기 엔벨로프 값보다 클 수 있다.
선택적으로, 또 다른 실시태양으로서, 프로세서(420)가 제1 비트 할당 동안 N개의 서브-대역에 각각 할당된 비트의 양에 따라 N개의 서브-대역의 각 서브-대역의 여분 비트의 양을 추가적으로 결정할 수 있고, N개의 서브-대역의 각 서브-대역의 여분 비트의 양이 동일한 서브-대역에 있는 단일 정보 유닛을 인코딩하기 위해 요구되는 양보다 작다. 프로세서(420)가 N개의 서브-대역의 각 서브-대역의 여분 비트의 양에 따라 여분 비트의 총량을 추가적으로 결정할 수 있다. 프로세서(420)는 M개의 서브-대역의 수정된 엔벨로프 값, K개의 서브-대역의 초기 엔벨로프 값, 및 여분 비트의 총량에 따라 N개의 서브-대역에 대한 제2 비트 할당을 추가로 수행할 수 있다.
디바이스(400)의 다른 기능 및 동작에 대하여, 도 1 및 2의 방법 실시태양의 과정을 참조할 수 있다. 반복을 피하기 위하여, 자세한 사항을 다시 기재하지는 않는다.
이 분야의 통상의 기술자는, 본 명세서에 기재된 실시태양에 기술된 실시예들의 조합으로, 유닛 및 알고리즘 단계가 컴퓨터 소프트웨어 및 전자적 하드웨어의 조합 또는 전자적 하드웨어에 의해 구현될 수 있다는 것을 알 것이다. 하드웨어나 소프트웨어에 의해 기능이 수행되는지 여부가 특정 애플리케이션 및 기술적 해결책의 설계 제한 조건에 좌우된다. 이 분야의 통상의 기술자는 각 특정 애플리케이션에 대한 기재된 기능을 구현하기 위해 상이한 방법을 사용할 수 있으며, 본원의 범위를 벗어나는 것으로 여겨지지 않는다.
통상의 기술자는, 편의성 및 간략한 기재의 목적으로, 전술한 시스템, 장치 및 유닛의 자세한 동작 과정에 대하여, 전술한 방법 실시태양의 대응하는 과정을 참조할 수 있음이 명백하며, 자세한 사항을 다시 기재하지는 않는다.
본원에 제공된 몇몇 실시태양에서, 개시된 시스템, 장치 및 방법이 다른 방식으로 구현될 수 있음을 이해해야 할 것이다. 예를 들어, 기재된 장치 실시태양은 단순히 일례이다. 예를 들어, 유닛 분할은 단지 기능 분할이며, 실제 구현에서 다른 분할일 수도 있다. 예를 들어, 복수의 유닛이나 부품이 다른 시스템에 조합되거나 집적될 수 있고, 또는 일부 특징이 무시되거나 수행되지 않을 수도 있다. 게다가, 디스플레이되거나 논의된 상호 커플링 또는 직접 커플링 또는 통신 접속이 일부 인터페이스를 사용함으로써 구현될 수 있다. 장치들이나 유닛들 간의 간접 커플링 또는 통신 접속이 전자적, 기계적 또는 다른 형태로 구현될 수 있다.
분리된 부분으로서 기재된 유닛들이 물리적으로 분리되거나 아닐 수도 있으며, 유닛으로서 디스플레이된 부분들이 물리적 유닛이거나 아닐 수도 있고, 하나의 위치에 위치되거나 복수의 네트워크 유닛에 분산될 수도 있다. 실시태양의 해결책의 목적을 달성하기 위해 실제 필요성에 따라 일부 또는 전부의 유닛이 선택될 수 있다.
게다가, 본원의 실시태양에서의 기능적 유닛이 하나의 처리 유닛에 통합되거나 각각의 유닛이 물리적으로 독립하여 존재하거나 둘 이상의 유닛이 하나의 유닛에 통합될 수 있다.
기능이 소프트웨어 기능적 유닛의 형태로 구현되고, 독립적 제품으로 팔거나 사용되는 경우에, 기능이 컴퓨터-판독가능 저장 매체에 저장될 수 있다. 이러한 이해에 기초하여, 본원의 기술적 해결책은 필수적으로, 또는 종래 기술에 기여하는 부분, 또는 기술적 해결책의 일부가 소프트웨어 제품의 형태로 구현될 수 있다. 컴퓨터 소프트웨어 제품이 저장 매체에 저장되고, 컴퓨터 디바이스(퍼스널 컴퓨터, 서버, 네트워크 디바이스 또는 이와 유사한 것일 수 있음)를 명령하기 위한 다수의 명령어를 포함하여 본원의 실시태양에 기재된 방법의 전부 또는 일부의 단계를 수행한다. 전술한 저장 매체는 USB 플래시 드라이브, 제거 가능 하드 디스크, 판독-전용 메모리(ROM, Read-Only Memory), 랜덤 액세스 메모리(RAM, Random Access Memory), 자기 디스크, 또는 이와 유사한 것과 같은 프로그램 인코드를 저장할 수 있는 임의의 매체를 포함한다.
전술한 상세한 설명은 단지 본원의 특정 구현 방식이며, 본원의 보호 범위가 이에 제한되지는 않는다. 통상의 기술자에 의해 본원에 기재된 기술적 범위 내에서 용이하게 이해되는 임의의 변형 또는 대체가 본원의 보고 범위 내에 있을 것이다. 그러므로, 본원의 보호 범위는 특허청구범위의 보호 범위의 대상일 것이다.

Claims (24)

  1. 오디오 신호 처리 방법으로서,
    오디오 신호의 프레임은 N개의 주파수 서브-대역을 포함하고,
    상기 방법은,
    상기 오디오 신호의 현재 프레임의 N개의 서브-대역 중 제1 서브세트의 에너지 속성 값 및 스펙트럼 속성 값에 따라서, 상기 제1 서브세트의 서브-대역의 양자화된 에너지 엔벨로프를 조정할지 여부를 결정하는 단계 - 상기 제1 서브세트는 M개의 서브-대역을 갖고, 제2 서브세트는 K개의 서브-대역을 갖고, 상기 제1 서브세트와 상기 제2 서브세트는 주파수에서 서로 겹쳐지지(overlap) 않고, M과 K는 양의 정수이고, N=M+K임 - ;
    상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프가 조정되어야할 필요가 있다는 결정에 기초하여, 상기 M개의 서브-대역의 조정된 에너지 엔벨로프를 얻기 위해 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프를 개별적으로 조정하는 단계;
    상기 제1 서브세트의 M개의 서브-대역의 조정된 에너지 엔벨로프 및 상기 제2 서브세트의 K개의 서브-대역의 에너지 엔벨로프 정보에 기초하여, 상기 현재 프레임의 N개의 서브-대역에 대해 인코딩 비트를 할당하는 단계 - 상기 N개의 서브-대역의 각각은 할당된 인코딩 비트를 갖거나 또는 할당된 인코딩 비트를 갖지 않음 - ;
    할당된 인코딩 비트를 갖는 각각의 서브-대역의 스펙트럼 계수를 양자화하는 단계; 및
    할당된 인코딩 비트를 갖는 서브-대역의 양자화된 스펙트럼 계수를 비트스트림에 기록하는 단계
    를 포함하고,
    상기 제1 서브세트의 에너지 속성 값은,
    상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합을 획득하고;
    상기 제2 서브세트의 K개의 서브-대역의 양자화된 에너지 엔벨로프의 총합을 획득하고; 그리고
    상기 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합 대 상기 K개의 서브-대역의 양자화된 에너지 엔벨로프의 총합의 비율을 계산하는 것에 의해 결정되고,
    상기 비율이 상기 제1 서브세트의 에너지 속성 값을 나타내는,
    오디오 신호 처리 방법.
  2. 제1항에 있어서,
    상기 제1 서브세트의 스펙트럼 속성 값은, 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프에 따라서 결정되는, 오디오 신호 처리 방법.
  3. 제2항에 있어서,
    상기 제1 서브세트의 스펙트럼 속성 값은,
    상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합을 획득하고; 그리고
    상기 제1 서브세트의 제1 서브-대역의 양자화된 에너지 엔벨로프 대 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합의 비율을 계산하는 것에 의해 결정되고,
    상기 비율이 상기 제1 서브세트의 스펙트럼 속성 값을 나타내고,
    상기 제1 서브-대역의 양자화된 에너지 엔벨로프는 상기 제1 서브세트의 M개의 서브-대역 중 가장 큰 것인,
    오디오 신호 처리 방법.
  4. 제1항에 있어서,
    상기 제1 서브세트의 에너지 속성 값이 제1 범위 내이고, 상기 제1 서브세트의 스펙트럼 속성 값이 제2 범위 내이면, 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프를 조정하도록 결정하는,
    오디오 신호 처리 방법.
  5. 제4항에 있어서,
    상기 제1 서브세트의 에너지 속성 값은, 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합 대 상기 제2 서브세트의 K개의 서브-대역의 양자화된 에너지 엔벨로프의 총합의 비율로 나타내지고,
    상기 제1 범위가 [1/6, 2/3]인, 오디오 신호 처리 방법.
  6. 제4항에 있어서,
    상기 오디오 신호의 인코딩된 대역이 0 내지 4KHz이면, 상기 제1 서브세트의 스펙트럼 속성 값이, 상기 제1 서브세트의 제1 서브-대역의 양자화된 에너지 엔벨로프 대 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합의 비율로 나타내지고,
    상기 제1 서브-대역의 양자화된 에너지 엔벨로프는 상기 제1 서브세트의 M개의 서브-대역 중 가장 큰 것이고, 상기 제2 범위가
    Figure 112018052139564-pat00020
    인, 오디오 신호 처리 방법.
  7. 제4항에 있어서,
    상기 오디오 신호의 인코딩된 대역이 0 내지 8KHz이면, 상기 제1 서브세트의 스펙트럼 속성 값이, 상기 제1 서브세트의 제1 서브-대역의 양자화된 에너지 엔벨로프 대 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합의 비율로 나타내지고,
    상기 제1 서브-대역의 양자화된 에너지 엔벨로프는 상기 제1 서브세트의 M개의 서브-대역 중 가장 큰 것이고, 상기 제2 범위가
    Figure 112018052139564-pat00021
    인, 오디오 신호 처리 방법.
  8. 제1항에 있어서,
    상기 M개의 서브-대역의 조정된 에너지 엔벨로프를 얻기 위해 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프를 개별적으로 조정하는 단계는.
    상기 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합과 상기 제1 서브세트의 제1 서브-대역의 양자화된 에너지 엔벨로프에 따라서 상기 제1 서브세트의 M개의 서브-대역 각각에 대한 조정 인자(adjustment factor)를 결정하는 단계 - 상기 제1 서브-대역의 양자화된 에너지 엔벨로프는 상기 제1 서브세트의 M개의 서브-대역 중 가장 큰 것임 -; 및
    상기 제1 서브세트의 M개의 서브-대역의 조정된 엔벨로프 값을 획득하도록, 상기 조정 인자를 사용하여 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프를 조정하는 단계를 포함하는,
    오디오 신호 처리 방법.
  9. 제1항에 있어서,
    상기 제1 서브세트의 각 서브-대역의 조정된 에너지 엔벨로프는 동일한 서브-대역의 양자화된 에너지 엔벨로프 보다 큰, 오디오 신호 처리 방법.
  10. 제1항에 있어서,
    상기 제2 서브세트의 K개의 서브-대역의 에너지 엔벨로프 정보는 상기 제2 서브세트의 K개의 서브-대역의 에너지 엔벨로프를 포함하고,
    상기 제2 서브세트의 서브-대역의 에너지 엔벨로프는, 양자화된 에너지 엔벨로프이거나 또는 양자화된 에너지 엔벨로프를 조정해서 획득된 에너지 엔벨로프인,
    오디오 신호 처리 방법.
  11. 오디오 신호 처리 디바이스로서,
    오디오 신호의 프레임은 N개의 주파수 서브-대역을 포함하고,
    상기 디바이스는
    프로그램 명령을 저장하는 메모리; 및
    상기 메모리에 동작적으로 연결된 프로세서
    를 포함하고,
    상기 프로그램 명령의 실행시, 상기 프로세서는
    상기 오디오 신호의 현재 프레임의 N개의 서브-대역 중 제1 서브세트의 에너지 속성 값 및 스펙트럼 속성 값에 따라서, 상기 제1 서브세트의 서브-대역의 양자화된 에너지 엔벨로프를 조정할지 여부를 결정하고 - 상기 제1 서브세트는 M개의 서브-대역을 갖고, 제2 서브세트는 K개의 서브-대역을 갖고, 상기 제1 서브세트와 상기 제2 서브세트는 주파수에서 서로 겹쳐지지(overlap) 않고, M과 K는 양의 정수이고, N=M+K임 - ;
    상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프가 조정되어야할 필요가 있다는 결정에 기초하여, 상기 M개의 서브-대역의 조정된 에너지 엔벨로프를 얻기 위해 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프를 개별적으로 조정하고;
    상기 제1 서브세트의 M개의 서브-대역의 조정된 에너지 엔벨로프 및 상기 제2 서브세트의 K개의 서브-대역의 에너지 엔벨로프 정보에 기초하여, 상기 현재 프레임의 N개의 서브-대역에 대해 인코딩 비트를 할당하고 - 상기 N개의 서브-대역의 각각은 할당된 인코딩 비트를 갖거나 또는 할당된 인코딩 비트를 갖지 않음 - ;
    할당된 인코딩 비트를 갖는 각각의 서브-대역의 스펙트럼 계수를 양자화하고; 그리고
    할당된 인코딩 비트를 갖는 서브-대역의 양자화된 스펙트럼 계수를 비트스트림에 기록하도록 구성되고,
    상기 제1 서브세트의 에너지 속성 값을 결정시, 상기 프로세서는, 상기 프로그램 명령을 실행하는 것에 의해,
    상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합을 획득하고;
    상기 제2 서브세트의 K개의 서브-대역의 양자화된 에너지 엔벨로프의 총합을 획득하고; 그리고
    상기 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합 대 상기 K개의 서브-대역의 양자화된 에너지 엔벨로프의 총합의 비율을 계산하도록 구성되며,
    상기 비율이 상기 제1 서브세트의 에너지 속성 값을 나타내는,
    오디오 신호 처리 디바이스.
  12. 제11항에 있어서,
    상기 제1 서브세트의 스펙트럼 속성 값은, 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프에 따라서 결정되는, 오디오 신호 처리 디바이스.
  13. 제12항에 있어서,
    상기 제1 서브세트의 스펙트럼 속성 값의 결정시, 상기 프로세서는, 상기 프로그램 명령을 실행하는 것에 의해,
    상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합을 획득하고; 그리고
    상기 제1 서브세트의 제1 서브-대역의 양자화된 에너지 엔벨로프 대 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합의 비율을 계산하도록 구성되고,
    상기 비율이 상기 제1 서브세트의 스펙트럼 속성 값을 나타내고,
    상기 제1 서브-대역의 양자화된 에너지 엔벨로프는 상기 제1 서브세트의 M개의 서브-대역 중 가장 큰 것인,
    오디오 신호 처리 디바이스.
  14. 제11항에 있어서,
    상기 제1 서브세트의 에너지 속성 값이 제1 범위 내이고, 상기 제1 서브세트의 스펙트럼 속성 값이 제2 범위 내이면, 상기 프로세서는 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프를 조정하도록 결정하는,
    오디오 신호 처리 디바이스.
  15. 제14항에 있어서,
    상기 제1 서브세트의 에너지 속성 값은, 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합 대 상기 제2 서브세트의 K개의 서브-대역의 양자화된 에너지 엔벨로프의 총합의 비율로 나타내지고,
    상기 제1 범위가 [1/6, 2/3]인, 오디오 신호 처리 디바이스.
  16. 제14항에 있어서,
    상기 오디오 신호의 인코딩된 대역이 0 내지 4KHz이면, 상기 제1 서브세트의 스펙트럼 속성 값이, 상기 제1 서브세트의 제1 서브-대역의 양자화된 에너지 엔벨로프 대 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합의 비율로 나타내지고,
    상기 제1 서브-대역의 양자화된 에너지 엔벨로프는 상기 제1 서브세트의 M개의 서브-대역 중 가장 큰 것이고, 상기 제2 범위가
    Figure 112018052139564-pat00022
    인, 오디오 신호 처리 디바이스.
  17. 제14항에 있어서,
    상기 오디오 신호의 인코딩된 대역이 0 내지 8KHz이면, 상기 제1 서브세트의 스펙트럼 속성 값이, 상기 제1 서브세트의 제1 서브-대역의 양자화된 에너지 엔벨로프 대 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합의 비율로 나타내지고,
    상기 제1 서브-대역의 양자화된 에너지 엔벨로프는 상기 제1 서브세트의 M개의 서브-대역 중 가장 큰 것이고, 상기 제2 범위가
    Figure 112018052139564-pat00023
    인, 오디오 신호 처리 디바이스.
  18. 제11항에 있어서,
    상기 M개의 서브-대역의 조정된 에너지 엔벨로프를 얻기 위해 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프를 개별적으로 조정시에, 상기 프로세서는, 상기 프로그램 명령을 실행하는 것에 의해,
    상기 M개의 서브-대역의 양자화된 에너지 엔벨로프의 총합과 상기 제1 서브세트의 제1 서브-대역의 양자화된 에너지 엔벨로프에 따라서 상기 제1 서브세트의 M개의 서브-대역 각각에 대한 조정 인자(adjustment factor)를 결정하고 - 상기 제1 서브-대역의 양자화된 에너지 엔벨로프는 상기 제1 서브세트의 M개의 서브-대역 중 가장 큰 것임 -; 그리고
    상기 제1 서브세트의 M개의 서브-대역의 조정된 엔벨로프 값을 획득하도록, 상기 조정 인자를 사용하여 상기 제1 서브세트의 M개의 서브-대역의 양자화된 에너지 엔벨로프를 조정하도록 구성되는,
    오디오 신호 처리 디바이스.
  19. 제11항에 있어서,
    상기 제1 서브세트의 각 서브-대역의 조정된 에너지 엔벨로프는 동일한 서브-대역의 양자화된 에너지 엔벨로프 보다 큰, 오디오 신호 처리 디바이스.
  20. 제11항에 있어서,
    상기 제2 서브세트의 K개의 서브-대역의 에너지 엔벨로프 정보는 상기 제2 서브세트의 K개의 서브-대역의 에너지 엔벨로프를 포함하고,
    상기 제2 서브세트의 서브-대역의 에너지 엔벨로프는, 양자화된 에너지 엔벨로프이거나 또는 양자화된 에너지 엔벨로프를 조정해서 획득된 에너지 엔벨로프인,
    오디오 신호 처리 디바이스.
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
KR1020187004298A 2014-04-29 2014-12-01 신호 처리 방법 및 디바이스 KR101890346B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410177234.3A CN105096957B (zh) 2014-04-29 2014-04-29 处理信号的方法及设备
CN201410177234.3 2014-04-29
PCT/CN2014/092695 WO2015165264A1 (zh) 2014-04-29 2014-12-01 处理信号的方法及设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020167019856A Division KR101830855B1 (ko) 2014-04-29 2014-12-01 신호 처리 방법 및 디바이스

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020187023421A Division KR101977383B1 (ko) 2014-04-29 2014-12-01 신호 처리 방법 및 디바이스

Publications (2)

Publication Number Publication Date
KR20180019761A KR20180019761A (ko) 2018-02-26
KR101890346B1 true KR101890346B1 (ko) 2018-08-21

Family

ID=54358124

Family Applications (4)

Application Number Title Priority Date Filing Date
KR1020187004298A KR101890346B1 (ko) 2014-04-29 2014-12-01 신호 처리 방법 및 디바이스
KR1020187023421A KR101977383B1 (ko) 2014-04-29 2014-12-01 신호 처리 방법 및 디바이스
KR1020167019856A KR101830855B1 (ko) 2014-04-29 2014-12-01 신호 처리 방법 및 디바이스
KR1020197013008A KR102052487B1 (ko) 2014-04-29 2014-12-01 신호 처리 방법 및 디바이스

Family Applications After (3)

Application Number Title Priority Date Filing Date
KR1020187023421A KR101977383B1 (ko) 2014-04-29 2014-12-01 신호 처리 방법 및 디바이스
KR1020167019856A KR101830855B1 (ko) 2014-04-29 2014-12-01 신호 처리 방법 및 디바이스
KR1020197013008A KR102052487B1 (ko) 2014-04-29 2014-12-01 신호 처리 방법 및 디바이스

Country Status (20)

Country Link
US (7) US9837088B2 (ko)
EP (3) EP3637417B1 (ko)
JP (4) JP6231699B2 (ko)
KR (4) KR101890346B1 (ko)
CN (2) CN105096957B (ko)
AU (2) AU2014392351B2 (ko)
BR (1) BR112016015855B1 (ko)
CA (1) CA2935084C (ko)
CL (1) CL2016002106A1 (ko)
ES (1) ES2755152T3 (ko)
HK (1) HK1212501A1 (ko)
IL (2) IL246427B (ko)
MX (2) MX2018009564A (ko)
NZ (1) NZ721875A (ko)
PT (1) PT3079150T (ko)
RU (3) RU2688259C2 (ko)
SG (2) SG11201605353YA (ko)
UA (1) UA117395C2 (ko)
WO (1) WO2015165264A1 (ko)
ZA (1) ZA201604465B (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096957B (zh) * 2014-04-29 2016-09-14 华为技术有限公司 处理信号的方法及设备
CN107452391B (zh) 2014-04-29 2020-08-25 华为技术有限公司 音频编码方法及相关装置
RU2763480C1 (ru) * 2021-06-16 2021-12-29 Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-Морского Флота "Военно-морская академия имени Адмирала флота Советского Союза Н.Г. Кузнецова" Устройство для восстановления речевого сигнала
CN117476013A (zh) * 2022-07-27 2024-01-30 华为技术有限公司 音频信号的处理方法、装置、存储介质及计算机程序产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005258478A (ja) * 2005-06-06 2005-09-22 Matsushita Electric Ind Co Ltd 符号化装置
US20110251846A1 (en) 2008-12-29 2011-10-13 Huawei Technologies Co., Ltd. Transient Signal Encoding Method and Device, Decoding Method and Device, and Processing System
US20110320211A1 (en) * 2008-12-31 2011-12-29 Liu Zexin Method and apparatus for processing signal

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100188912B1 (ko) * 1992-09-21 1999-06-01 윤종용 서브밴드코딩의 비트재할당 방법
JP3283413B2 (ja) * 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
JP2003280698A (ja) * 2002-03-22 2003-10-02 Sanyo Electric Co Ltd 音声圧縮方法および音声圧縮装置
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
WO2007041789A1 (en) * 2005-10-11 2007-04-19 National Ict Australia Limited Front-end processing of speech signals
US7590523B2 (en) 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US8392198B1 (en) * 2007-04-03 2013-03-05 Arizona Board Of Regents For And On Behalf Of Arizona State University Split-band speech compression based on loudness estimation
JP2008309955A (ja) * 2007-06-13 2008-12-25 Toshiba Corp ノイズサプレス装置
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR20090110244A (ko) 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
JP2009288560A (ja) * 2008-05-29 2009-12-10 Sanyo Electric Co Ltd 音声符号化装置、音声復号装置、及びプログラム
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
CN101727906B (zh) * 2008-10-29 2012-02-01 华为技术有限公司 高频带信号的编解码方法及装置
JP5520967B2 (ja) 2009-02-16 2014-06-11 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 適応的正弦波コーディングを用いるオーディオ信号の符号化及び復号化方法及び装置
ES2374486T3 (es) * 2009-03-26 2012-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dispositivo y método para manipular una señal de audio.
CN101853663B (zh) * 2009-03-30 2012-05-23 华为技术有限公司 比特分配方法、编码装置及解码装置
US8498874B2 (en) 2009-09-11 2013-07-30 Sling Media Pvt Ltd Audio signal encoding employing interchannel and temporal redundancy reduction
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
CN102081926B (zh) * 2009-11-27 2013-06-05 中兴通讯股份有限公司 格型矢量量化音频编解码方法和系统
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
SG10201505469SA (en) 2010-07-19 2015-08-28 Dolby Int Ab Processing of audio signals during high frequency reconstruction
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CN102436820B (zh) 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
WO2012065081A1 (en) * 2010-11-12 2012-05-18 Polycom, Inc. Scalable audio in a multi-point environment
RU2505921C2 (ru) * 2012-02-02 2014-01-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ и устройство кодирования и декодирования аудиосигналов (варианты)
CN103366750B (zh) * 2012-03-28 2015-10-21 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN103544957B (zh) 2012-07-13 2017-04-12 华为技术有限公司 音频信号的比特分配的方法和装置
EP2717262A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
CN108198564B (zh) * 2013-07-01 2021-02-26 华为技术有限公司 信号编码和解码方法以及设备
CN105096957B (zh) 2014-04-29 2016-09-14 华为技术有限公司 处理信号的方法及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005258478A (ja) * 2005-06-06 2005-09-22 Matsushita Electric Ind Co Ltd 符号化装置
US20110251846A1 (en) 2008-12-29 2011-10-13 Huawei Technologies Co., Ltd. Transient Signal Encoding Method and Device, Decoding Method and Device, and Processing System
US20110320211A1 (en) * 2008-12-31 2011-12-29 Liu Zexin Method and apparatus for processing signal

Also Published As

Publication number Publication date
MX358255B (es) 2018-08-09
RU2656812C2 (ru) 2018-06-06
JP2019152871A (ja) 2019-09-12
US20230238010A1 (en) 2023-07-27
RU2702265C1 (ru) 2019-10-07
US20190267015A1 (en) 2019-08-29
CA2935084C (en) 2019-03-12
RU2016134014A (ru) 2018-02-22
RU2688259C2 (ru) 2019-05-21
CN106409303B (zh) 2019-09-20
US11881226B2 (en) 2024-01-23
US9837088B2 (en) 2017-12-05
CN105096957B (zh) 2016-09-14
EP3079150B1 (en) 2019-09-11
NZ721875A (en) 2018-03-23
CL2016002106A1 (es) 2016-12-16
AU2014392351B2 (en) 2017-09-14
JP6231699B2 (ja) 2017-11-15
US10347264B2 (en) 2019-07-09
EP3637417A1 (en) 2020-04-15
MX2018009564A (es) 2022-01-14
EP3079150A1 (en) 2016-10-12
JP7144499B2 (ja) 2022-09-29
HK1212501A1 (en) 2016-06-10
US20170047074A1 (en) 2017-02-16
ES2755152T3 (es) 2020-04-21
CN105096957A (zh) 2015-11-25
RU2018118576A (ru) 2018-10-31
UA117395C2 (uk) 2018-07-25
JP2017507366A (ja) 2017-03-16
AU2014392351A1 (en) 2016-07-21
SG11201605353YA (en) 2016-08-30
IL248575B (en) 2022-02-01
JP6790166B2 (ja) 2020-11-25
KR102052487B1 (ko) 2019-12-05
US20190108848A1 (en) 2019-04-11
PT3079150T (pt) 2019-10-29
KR20180095120A (ko) 2018-08-24
EP4372738A2 (en) 2024-05-22
KR20160099714A (ko) 2016-08-22
ZA201604465B (en) 2017-09-27
US20210343298A1 (en) 2021-11-04
EP3079150A4 (en) 2016-12-07
US20200135218A1 (en) 2020-04-30
US11081121B2 (en) 2021-08-03
IL246427B (en) 2019-03-31
CA2935084A1 (en) 2015-11-05
JP6517300B2 (ja) 2019-05-22
KR20180019761A (ko) 2018-02-26
US10546591B2 (en) 2020-01-28
EP3637417B1 (en) 2024-02-07
AU2017272204A1 (en) 2018-01-04
US11580996B2 (en) 2023-02-14
RU2018118576A3 (ko) 2019-03-05
KR101830855B1 (ko) 2018-02-21
BR112016015855B1 (pt) 2019-09-10
MX2016010690A (es) 2016-11-23
KR20190049954A (ko) 2019-05-09
SG10201801095QA (en) 2018-03-28
JP2021043453A (ja) 2021-03-18
US20170352358A1 (en) 2017-12-07
JP2018041091A (ja) 2018-03-15
CN106409303A (zh) 2017-02-15
AU2017272204B2 (en) 2019-09-12
IL248575A0 (en) 2016-12-29
US10186271B2 (en) 2019-01-22
KR101977383B1 (ko) 2019-05-10
WO2015165264A1 (zh) 2015-11-05

Similar Documents

Publication Publication Date Title
EP2613315B1 (en) Method and device for coding an audio signal
JP7144499B2 (ja) 信号処理方法及び装置
US20180166085A1 (en) Bandwidth Extension Audio Decoding Method and Device for Predicting Spectral Envelope
US10789964B2 (en) Dynamic bit allocation methods and devices for audio signal
JP6141443B2 (ja) 符号化方法、復号化方法、符号化装置及び復号化装置
US9354957B2 (en) Method and apparatus for concealing error in communication system

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant