KR102099752B1 - 신호 인코딩 방법 및 장치 - Google Patents

신호 인코딩 방법 및 장치 Download PDF

Info

Publication number
KR102099752B1
KR102099752B1 KR1020157034027A KR20157034027A KR102099752B1 KR 102099752 B1 KR102099752 B1 KR 102099752B1 KR 1020157034027 A KR1020157034027 A KR 1020157034027A KR 20157034027 A KR20157034027 A KR 20157034027A KR 102099752 B1 KR102099752 B1 KR 102099752B1
Authority
KR
South Korea
Prior art keywords
silent
frame
parameter
current
comfort noise
Prior art date
Application number
KR1020157034027A
Other languages
English (en)
Other versions
KR20160003192A (ko
Inventor
제 왕
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20160003192A publication Critical patent/KR20160003192A/ko
Application granted granted Critical
Publication of KR102099752B1 publication Critical patent/KR102099752B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)

Abstract

신호 인코딩 방법 및 장치가 개시된다. 이 방법은: 현재-입력 프레임의 이전 프레임의 인코딩 방식이 연속 인코딩 방식일 경우에는, 현재-입력 프레임이 무음 기술(SID) 프레임으로 인코딩되는 때에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈를 예측하고, 실제 무음 신호를 결정하는 단계(210) ― 상기 현재-입력 프레임은 무음 프레임임 ―; 상기 컴포트 노이즈와 실제 상기 무음 신호(220) 사이의 편차도를 결정하는 단계; 상기 편차도에 따라 현재-입력 프레임의 인코딩 방식을 결정하는 단계(230) ― 상기 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식 또는 SID 프레임 인코딩 방식을 포함함 ―; 및 상기 현재-입력 프레임의 인코딩 방식에 따라 현재-입력 프레임을 인코딩하는 단계(240)를 포함한다. 상기 컴포트 노이즈와 실제 무음 신호 사이의 편차도에 따라, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식 또는 SID 프레임 인코딩 방식인지 결정되고, 이로써 통신 대역폭이 절약된다.

Description

신호 인코딩 방법 및 장치
본원은 신호 처리의 분야, 특히 신호 인코딩 방법 및 장치에 관한 것이다.
불연속 전송(Discontinuous Transmission, DTX) 시스템은 널리 적용되는 음성 통신 시스템이며, 음성 통신의 무음 구간에서, 음성 프레임의 불연속적인 인코딩 및 전송 방법이 채널 대역폭의 점유를 줄이도록 사용될 수 있고, 한편으로는, 적절한 주관적 통화 품질도 보장될 수 있다.
음성 신호는 일반적으로 두 가지 형태, 즉 유음 신호(active voice signal) 및 무음 신호(silence signal)로 분류된다. 유음 신호는 호출 음성(call bovice)을 포함하는 신호를 지칭하고, 무음 신호는 호출 음성을 포함하지 않는 신호를 지칭한다. DTX 시스템에서, 유음 신호는 연속 전송 방법을 사용하여 전송되며, 무음 신호는 불연속 전송 방법을 사용하여 전송된다. 무음 신호의 불연속 전송은 다음의 방식으로 구현된다: 인코더가 간헐적으로 인코딩하고, 특정 인코딩 프레임, 즉 무음 기술(Silence Descriptor, SID) 프레임을 전달하고, DTX 시스템에서, 임의이 다른 신호 프레임의 어느 것도 두 개의 인접한 SID 프레임 사이에서 인코딩되지 않는다. 디코더는, 불연속적으로 수신된 SID 프레임에 따라, 사용자의 편안하고(comfortable) 주관적인 청취를 가능하게 하는 노이즈를 재량으로 생성한다. 컴포트 노이즈(Comfort Noise, CN)는 원래의 무음 신호를 정확히 복원하는데 목적이 있진 않지만, 주관적 청취 품질에 대한 디코더 사용자의 요구를 만족시키고, 사용자가 불편함을 느끼지 않도록 하는데 목적이 있다.
디코더에서 더 양호한 주관적 청취 품질을 획득하기 위하여, 유음으로부터 CN 대역으로의 변환의 품질이 중요하다. 더 매끄러운 변환을 획득하기 위하여, 하나의 효과적인 방법은 다음과 같다: 유음 대역으로부터 무음 대역으로의 변환 동안, 디코더는 즉각 불연속 전송 상태로 수송되지 않지만, 추가적으로 시간의 기간 동안 연기된다. 이 시간의 기간 동안, 무음 대역의 개시시 몇몇 무음 프레임이 여전히 유음 프레임으로 여겨지고 연속적으로 인코딩되고 전달되며, 즉, 연속 전송의 행오버 간격(hangover interval)이 설정된다. 이 측정의 장점은 다음과 같다: 디코더가 행오버 간격 내의 무음 신호를 완전히 사용할 수 있어서, 더 양호한 CN을 생성하도록 더 양호하게 무음 신호의 특징을 추정하고 추출한다.
그러나, 종래 발명에서, 행오버 메커니즘이 효과적으로 제어되지 않는다. 행오버 메커니즘을 트리거링하기 위한 조건이 비교적 간단하며, 즉, 행오버 메커니즘을 트리거링할지 여부가 연속적으로 인코딩되고 음성 활동의 종료시 전달되기에 충분한 유음 프레임이 존재하는지 여부를 간단히 검사하여 결정된다. 행오버 메커니즘이 트리거링된 후에, 고정 길이로 행오버 간격이 강제적으로 실행될 수 있다. 그러나, 연속적으로 인코딩되고 전달되기에 충분한 유음 프레임이 존재하는 경우에 고정 길이인 행오버 간격이 실행되는 것은 불필요하다. 예컨대, 통신 환경의 배경 노이즈가 안정적일 때에, 행오버 간격이 설정되지 않거나 짧은 행오버 간격이 설정된다 할지라도, 디코더가 더 양호한 품질을 갖는 CN을 획득할 수 있다. 그러므로, 행오버 메커니즘을 간단히 제어하는 이러한 모드는 통신 대역폭의 낭비를 유발한다.
본원의 실시태양은 통신 대역폭을 절약하는 신호 인코딩 방법 및 장치를 제공한다.
제1 측면에 따라, 신호 인코딩 방법이 제공되며, 이 방법은 다음을 포함한다: 현재-입력 프레임의 이전 프레임의 인코딩 방식이 연속 인코딩 방식일 경우에는, 현재-입력 프레임이 무음 기술(SID) 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈를 예측하고, 실제 무음 신호를 결정하는 단계로서, 상기 현재-입력 프레임은 무음 프레임인, 단계; 컴포트 노이즈와 실제 무음 신호 사이의 편차도를 결정하는 단계; 편차도에 따라 현재-입력 프레임의 인코딩 방식을 결정하는 단계로서, 상기 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식 또는 SID 프레임 인코딩 방식을 포함하는, 단계; 및 현재-입력 프레임의 인코딩 방식에 따라 현재-입력 프레임을 인코딩하는 단계.
제1 측면에 대하여, 제1 가능 구현 방법에서, 현재-입력 프레임이 SID 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈를 예측하고, 실제 무음 신호를 결정하는 단계는: 컴포트 노이즈의 특징 파라미터를 예측하고, 실제 무음 신호의 특징 파라미터를 결정하는 단계를 포함하며, 상기 컴포트 노이즈의 특징 파라미터는 실제 무음 신호의 특징 파라미터에 1 대 1 대응관계에 있는, 단계를 포함하고,
상기 컴포트 노이즈와 실제 무음 신호 사이의 편차도를 결정하는 단계는: 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리를 결정하는 단계를 포함한다.
제1 측면의 제1 가능 구현 방법에 대하여, 제2 가능 구현 방법에서, 편차도에 따라 현재-입력 프레임의 인코딩 방식을 결정하는 단계는: 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 미만인 경우에, 현재-입력 프레임의 인코딩 방식이 SID 프레임 인코딩 방식이라고 결정하는 단계로서, 상기 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리는 임계 설정에서의 임계값과 1 대 1 대응관계에 있는, 단계; 및 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 이상인 경우에, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정하는 단계를 포함한다.
제1 측면의 제1 가능 구현 방법 또는 제2 가능 구현 방법에 대하여, 제3 가능 구현 방법에서, 컴포트 노이즈의 특징 파라미터는 다음의 정보 중 적어도 하나를 나타내기 위해 사용된다: 에너지 정보 및 스펙트럼 정보.
제1 측면의 제3 가능 구현 방법에 대하여, 제4 가능 구현 방법에서, 에너지 정보는 코드 여기된 선형 예측(code excited linear prediction, CELP) 여기 에너지를 포함하며,
스펙트럼 정보는 다음 중 적어도 하나를 포함한다: 선형 예측 필터 계수(linear predictive filter coefficient), 고속 퓨리에 변환(fast Fourier transform, FFT) 계수, 및 수정 이산 코사인 변환(modified discrete cosine transform, MDCT) 계수, 그리고
선형 예측 필터 계수 다음 중 적어도 하나를 포함한다: 선 스펙트럼 주파수(line spectral frequency, LSF) 계수, 선 스펙트럼 쌍(line spectrum pair, LSP) 계수, 이미턴스 스펙트럼 주파수(immittance spectral frequency, ISF) 계수, 이미턴스 스펙트럼 쌍(immittance spectral pair, ISP) 계수, 반사 계수, 선형 예측 코딩(linear predictive coding, LPC) 계수.
제1 측면의 제1 가능 구현 방법 내지 제4 가능 구현 방법 중 임의의 구현 방법에 대하여, 제5 가능 구현 방법에서, 컴포트 노이즈의 특징 파라미터를 예측하는 단계는: 현재-입력 프레임의 이전 프레임의 컴포트 노이즈 파라미터 및 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측하는 단계; 또는 현재-입력 프레임 이전의 L개의 행오버 프레임의 특징 파라미터 및 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측하는 단계로서, L은 양의 정수인, 단계를 포함한다.
제1 측면의 제1 가능 구현 방법 내지 제5 가능 구현 방법 중 임의의 구현 방법에 대하여, 제6 가능 구현 방법에서, 실제 무음 신호의 특징 파라미터를 결정하는 단계는: 현재-입력 프레임의 특징 파라미터가 실제 무음 신호의 특징 파라미터라는 것을 결정하는 단계; 또는 실제 무음 신호의 특징 파라미터를 결정하기 위해, M개의 무음 프레임의 특징 파라미터에 대한 통계를 수집하는 단계를 포함한다.
제1 측면의 제6 가능 구현 방법에 대하여, 제7 가능 구현 방법에서, M개의 무음 프레임은 현재-입력 프레임 및 상기 현재-입력 프레임 이전의 (M-1)개의 무음 프레임을 포함하고, M은 양의 정수이다.
제1 측면의 제2 가능 구현 방법에 대하여, 제8 가능 구현 방법에서, 컴포트 노이즈의 특징 파라미터는 컴포트 노이즈의 코드 여기된 선형 예측(CELP) 여기 에너지 및 컴포트 노이즈의 선 스펙트럼 주파수(LSF) 계수를 포함하고, 실제 무음 신호의 특징 파라미터는 실제 무음 신호의 CELP 여기 에너지 및 실제 무음 신호의 LSF 계수를 포함한다.
컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리를 결정하는 단계는: 컴포트 노이즈의 CELP 여기 에너지와 실제 무음 신호의 CELP 여기 에너지 사이의 거리 De를 결정하고, 컴포트 노이즈의 LSF 계수와 실제 무음 신호의 LSF 계수 사이의 거리 Dlsf를 결정하는 단계를 포함한다.
제1 측면의 제8 가능 구현 방법에 대하여, 제9 가능 구현 방법에서, 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 미만인 경우에, 현재-입력 프레임의 인코딩 방식이 SID 프레임 인코딩 방식이라고 결정하는 단계는: 거리 De가 제1 임계값 미만이고, 거리 Dlsf가 제2 임계값 미만인 경우에, 현재-입력 프레임의 인코딩 방식이 SID 프레임 인코딩 방식이라고 결정하는 단계를 포함하고,
컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 이상인 경우에, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정하는 단계는: 거리 De가 제1 임계값 이상이고, 거리 Dlsf가 제2 임계값 이상인 경우에, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정하는 단계를 포함한다.
측면의 제9 가능 구현 방법에 대하여, 제10 가능 구현 방법에서, 이 방법은: 미리설정된 제1 임계값과 미리설정된 제2 임계값을 획득하는 단계; 또는 현재-입력 프레임 이전의 N개의 무음 프레임의 CELP 여기 에너지에 따라 제1 임계값을 결정하고, N개의 무음 프레임의 LSF 계수에 따라 제2 임계값을 결정하는 단계를 더 포함하며, 이 때 N은 양의 정수이다.
제1 측면 또는 제1 측면의 제1 가능 구현 방법 내지 제10 가능 구현 방법 중 임의의 구현 방법에 대하여, 제11 가능 구현 방법에서, 현재-입력 프레임이 SID 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈를 예측하는 단계는: 제1 예측 방식으로 컴포트 노이즈를 예측하는 단계를 포함하며, 제1 예측 방식은 디코더가 컴포트 노이즈를 생성하는 방식과 동일하다.
제1 측면에 따라, 신호 처리 방법이 제공되며, 이 방법은: P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리를 결정하는 단계로서, P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리는 P개의 무음 프레임 내의 각 무음 프레임과 다른 (P-1)개의 무음 프레임 사이의 가중화 스펙트럼 거리의 합계이고, P는 양의 정수인, 단계; 및 P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리에 따라 제1 스펙트럼 파라미터를 결정하는 단계로서, 제1 스펙트럼 파라미터가 컴포트 노이즈를 생성하기 위해 사용되는, 단계를 포함한다.
제2 측면에 대하여, 제1 가능 구현 방법에서, 각 무음 프레임은 가중 계수의 하나의 그룹에 대응하고, 가중 계수의 하나의 그룹에서, 서브대역 중 제1 그룹에 대응하는 가중 계수가 서브대역 중 제2 그룹에 대응하는 가중 계수보다 크고, 서브대역 중 제1 그룹의 지각적 중요도(perceptual importance)는 서브대역 중 제2 그룹의 지각적 중요도보다 크다.
제2 측면 또는 제2 측면의 제1 가능 구현 방법에 대하여, 제2 가능 구현 방법에서, P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리에 따라 제1 스펙트럼 파라미터를 결정하는 단계는: P개의 무음 프레임에서의 제1 무음 프레임의 그룹 가중화 스펙트럼 거리가 최소가 되도록, P개의 무음 프레임으로부터 제1 무음 프레임을 선택하는 단계; 및 제1 무음 프레임의 스펙트럼 파라미터가 제1 스펙트럼 파라미터라고 결정하는 단계를 포함한다.
제2 측면 또는 제2 측면의 제1 가능 구현 방법에 대하여, 제3 가능 구현 방법에서, P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리에 따라 제1 스펙트럼 파라미터를 결정하는 단계는: P개의 무음 프레임에서의 적어도 하나의 무음 프레임의 그룹 가중화 스펙트럼 거리가 제3 임계값 미만이 되도록, P개의 무음 프레임으로부터 적어도 하나의 무음 프레임을 선택하는 단계; 및 적어도 하나의 무음 프레임의 스펙트럼 파라미터에 따라 제1 스펙트럼 파라미터를 결정하는 단계를 포함한다.
제2 측면 또는 제2 측면의 제1 가능 구현 방법 내지 제3 가능 구현 방법 중 임의의 구현 방법에 대하여, 제4 가능 구현 방법에서, P개의 무음 프레임은 현재-입력 무음 프레임 및 상기 현재-입력 무음 프레임 이전의 (P-1)개의 무음 프레임을 포함한다.
제2 측면의 제4 가능 구현 방법에 대하여, 제5 가능 구현 방법에서, 이 방법은: 현재-입력 무음 프레임을 무음 기술(SID) 프레임으로 인코딩하는 단계로서, SID 프레임은 제1 스펙트럼 파라미터를 포함하는, 단계를 더 포함한다.
제3 측면에 따라, 신호 처리 방법이 제공되며, 이 방법은: 입력 신호의 주파수 대역을 R개의 서브대역으로 분할하는 단계로서, R이 양의 정수인, 단계; R개의 서브대역의 각 서브대역에서, S개의 무음 프레임에서의 각 무음 프레임의 서브대역 그룹 스펙트럼 거리를 결정하는 단계로서, S개의 무음 프레임에서의 각 서브대역 그룹 스펙트럼 거리는 각 서브대역 상의 S개의 무음 프레임에서의 각 무음 프레임과 다른 (S-1)개의 무음 프레임 사이의 스펙트럼 거리의 합계이고, S가 양의 정수인, 단계; 및 각 서브대역 상에서, S개의 무음 프레임에서의 각 무음 프레임의 서브대역 그룹 스펙트럼 거리에 따라 각 서브대역의 제1 스펙트럼 파라미터를 결정하는 단계로서, 각 서브대역의 제1 스펙트럼 파라미터가 컴포트 노이즈를 생성하기 위해 사용되는, 단계를 포함한다.
제3 측면에 대하여,제1 가능 구현 방법에서, 각 서브대역 상에서, S개의 무음 프레임에서의 각 무음 프레임의 서브대역 그룹 스펙트럼 거리에 따라 각 서브대역의 제1 스펙트럼 파라미터를 결정하는 단계는: 각 서브대역 상의 S개의 무음 프레임에서의 제1 무음 프레임의 서브대역 그룹 스펙트럼 거리가 최소가 되도록, 각 서브대역 상에서 S개의 무음 프레임으로부터 제1 무음 프레임을 선택하는 단계; 및 각 서브대역 상에서, 제1 무음 프레임의 스펙트럼 파라미터가 각 서브대역의 제1 스펙트럼 파라미터라고 결정하는 단계를 포함한다.
제3 측면에 대하여, 제2 가능 구현 방법에서, 각 서브대역 상에서, S개의 무음 프레임에서의 각 무음 프레임의 서브대역 그룹 스펙트럼 거리에 따라 각 서브대역의 제1 스펙트럼 파라미터를 결정하는 단계는: 적어도 하나의 무음 프레임의 서브대역 그룹 스펙트럼 거리가 제4 임계값 미만이 되도록, 각 서브대역 상에서 S개의 무음 프레임으로부터 적어도 하나의 무음 프레임을 선택하는 단계; 및 각 서브대역 상에서, 적어도 하나의 무음 프레임의 스펙트럼 파라미터에 따라, 각 서브대역의 제1 스펙트럼 파라미터를 결정하는 단계를 포함한다.
제3 측면 또는 제3 측면의 제1 가능 구현 방법 또는 제2 가능 구현 방법에 대하여, 제3 가능 구현 방법에서, S개의 무음 프레임이 현재-입력 무음 프레임 및 현재-입력 무음 프레임 이전의 (S-1)개의 무음 프레임을 포함한다.
제3 측면의 제3 가능 구현 방법에 대하여, 제4 가능 구현 방법에서, 이 방법은: 현재-입력 무음 프레임을 무음 기술(SID) 프레임으로 인코딩하는 단계를 더 포함하고, SID 프레임은 각 서브대역의 제1 스펙트럼 파라미터를 포함한다.
제4 측면에 따라, 신호 처리 방법이 제공되며, 이 방법은: T개의 무음 프레임 내의 각 무음 프레임의 제1 파라미터를 결정하는 단계로서, 제1 파라미터는 스펙트럼 엔트로피를 나타내기 위해 사용되고 T는 양의 정수인, 단계; 및 T개의 무음 프레임 내의 각 무음 프레임의 제1 파라미터에 따라 제1 스펙트럼 파라미터를 결정하는 단계로서, 제1 스펙트럼 파라미터가 컴포트 노이즈를 생성하기 위해 사용되는, 단계를 포함한다.
제4 측면에 대하여, 제1 가능 구현 방법에서, T개의 무음 프레임 내의 각 무음 프레임의 제1 파라미터를 결정하는 단계는: T개의 무음 프레임이 클러스터링 기준에 따라 제1 그룹의 무음 프레임과 제2 그룹의 무음 프레임으로 분류될 수 있다고 결정되는 경우에, 제1 그룹의 무음 프레임의 스펙트럼 파라미터에 따라 제1 스펙트럼 파라미터를 결정하는 단계로서, 제1 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피가 제2 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피보다 큰, 단계; 및 T개의 무음 프레임이 클러스터링 기준에 따라 제1 그룹의 무음 프레임과 제2 그룹의 무음 프레임으로 분류될 수 없다고 결정되는 경우에, 제1 스펙트럼 파라미터를 결정하도록, T개의 무음 프레임의 스펙트럼 파라미터에 대한 가중화된 평균화를 수행하는 단계로서, 제1 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피가 제2 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피보다 큰, 단계를 포함한다.
제4 측면의 제1 가능 구현 방법에 대하여, 제2 가능 구현 방법에서, 클러스터링 기준은, 제1 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제1 평균값 사이의 거리가 제1 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제2 평균값 사이의 거리 이하이고; 제2 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제2 평균값 사이의 거리가 제2 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제1 평균값 사이의 거리 이하이고; 제1 평균값과 제2 평균값 사이의 거리가 제1 그룹의 무음 프레임의 제1 파라미터와 제1 평균값 사이의 평균 거리를 초과하고; 제1 평균값과 제2 평균값 사이의 거리가 제2 그룹의 무음 프레임의 제1 파라미터와 제2 평균값 사이의 평균 거리를 초과하는 것을 포함하며, 이때 제1 평균값은 제1 그룹의 무음 프레임의 제1 파라미터의 평균값이고, 제2 평균값은 제2 그룹의 무음 프레임의 제1 파라미터의 평균값이다.
제4 측면에 대하여, 제3 가능 구현 방법에서, T개의 무음 프레임 내의 각 무음 프레임의 제1 파라미터에 따라 제1 스펙트럼 파라미터를 결정하는 단계는:
제1 스펙트럼 파라미터를 결정하도록, T개의 무음 프레임의 스펙트럼 파라미터에 대한 가중화된 평균화를 수행하는 단계로서, T개의 무음 프레임 내에서, 상이한 i번째 무음 프레임과 j번째 무음 프레임에 대하여, i번째 무음 프레임에 대응하는 가중 계수는 j번째 무음 프레임에 대응하는 가중 계수 이상이며, 제1 파라미터가 스펙트럼 엔트로피와 양으로 상관될(positively correlated) 때, i번째 무음 프레임의 제1 파라미터가 j번째 무음 프레임의 제1 파라미터를 초과하고, 제1 파라미터가 스펙트럼 엔트로피와 음으로 상관될(negatively correlated) 때, i번째 무음 프레임의 제1 파라미터가 j번째 무음 프레임의 제1 파라미터 미만이고, i와 j 둘 다 양의 정수이며, 1≤i≤T이고, 1≤j≤T인, 단계를 포함한다.
제4 측면 또는 제4 측면의 제1 가능 구현 방법 내지 제3 가능 구현 방법에 대하여, 제4 가능 구현 방법에서, T개의 무음 프레임은 현재-입력 무음 프레임 및 현재-입력 무음 프레임 이전의 (T-1)개의 무음 프레임을 포함한다.
제4 측면의 제4 가능 구현 방법에 대하여, 제5 가능 구현 방법에서, 이 방법은: 현재-입력 무음 프레임을 무음 기술(SID) 프레임으로 인코딩하는 단계를 더 포함하며, SID 프레임은 제1 스펙트럼 파라미터를 포함한다.
제5 측면에 따르면, 신호 인코딩 장치가 제공되며, 이 장치는: 현재-입력 프레임의 이전 프레임의 인코딩 방식이 연속 인코딩 방식인 경우에, 현재-입력 프레임이 무음 기술(SID) 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈를 예측하고, 실제 무음 신호를 결정하도록 구성된 제1 결정 유닛으로서, 상기 현재-입력 프레임은 무음 프레임인, 제1 결정 유닛; 제1 결정 유닛에 의해 결정된 컴포트 노이즈와 제1 결정 유닛에 의해 결정된 실제 무음 신호 사이의 편차도를 결정하도록 구성된 제2 결정 유닛; 제2 결정 유닛에 의해 결정된 편차도에 따라 현재-입력 프레임의 인코딩 방식을 결정하도록 구성된 제3 결정 유닛으로서, 상기 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식 또는 SID 프레임 인코딩 방식을 포함하는, 제3 결정 유닛; 및 제3 결정 유닛에 의해 결정된 현재-입력 프레임의 인코딩 방식에 따라 현재-입력 프레임을 인코딩하도록 구성된 인코딩 유닛을 포함한다.
제5 측면에 대하여, 제1 가능 구현 방법에서, 제1 결정 유닛은 구체적으로 컴포트 노이즈의 특징 파라미터를 예측하고, 실제 무음 신호의 특징 파라미터를 결정하도록 구성되고, 컴포트 노이즈의 특징 파라미터는 실제 무음 신호의 특징 파라미터와 1 대 1 대응관계에 있고; 제2 결정 유닛은 구체적으로 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리를 결정하도록 구성된다.
제5 측면의 제1 가능 구현 방법에 대하여, 제2 가능 구현 방법에서, 제3 결정 유닛은 구체적으로 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 미만인 경우에, 현재-입력 프레임의 인코딩 방식이 SID 프레임 인코딩 방식이라고 결정하도록 구성되고, 상기 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리는 임계 설정에서의 임계값과 1 대 1 대응관계에 있고; 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 이상인 경우에, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정하도록 구성된다.
제5 측면의 제1 가능 구현 방법 또는 제2 가능 구현 방법에 대하여, 제3 가능 구현 방법에서, 제1 결정 유닛은 구체적으로: 현재-입력 프레임의 이전 프레임의 컴포트 노이즈 파라미터 및 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측하거나; 현재-입력 프레임 이전의 L개의 행오버 프레임의 특징 파라미터 및 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측하도록 구성되며, L은 양의 정수이다.
제5 측면의 제1 가능 구현 방법, 제2 가능 구현 방법 또는 제3 가능 구현 방법에 대하여, 제4 가능 구현 방법에서, 제1 결정 유닛은 구체적으로: 현재-입력 프레임의 특징 파라미터가 실제 무음 신호의 파라미터라는 것을 결정하거나; 실제 무음 신호의 파라미터를 결정하기 위해, M개의 무음 프레임의 특징 파라미터에 대한 통계를 수집하도록 구성된다.
제5 측면의 제2 가능 구현 방법에 대하여, 제5 가능 구현 방법에서, 컴포트 노이즈의 특징 파라미터는 컴포트 노이즈의 CELP 여기 에너지 및 컴포트 노이즈의 LSF 계수를 포함하고, 실제 무음 신호의 특징 파라미터는 실제 무음 신호의 CELP 여기 에너지 및 실제 무음 신호의 LSF 계수를 포함하며; 제2 결정 유닛은 구체적으로 컴포트 노이즈의 CELP 여기 에너지와 실제 무음 신호의 CELP 여기 에너지 사이의 거리 De를 결정하고, 컴포트 노이즈의 LSF 계수와 실제 무음 신호의 LSF 계수 사이의 거리 Dlsf를 결정하도록 구성된다.
제5 측면의 제5 가능 구현 방법에 대하여, 제6 가능 구현 방법에서, 제3 결정 유닛은 구체적으로: 거리 De가 제1 임계값 미만이고, 거리 Dlsf가 제2 임계값 미만인 경우에, 현재-입력 프레임의 인코딩 방식이 SID 프레임 인코딩 방식이라고 결정하도록 구성되고; 제3 결정 유닛은 구체적으로: 거리 De가 제1 임계값 이상이고, 거리 Dlsf가 제2 임계값 이상인 경우에, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정하도록 구성된다.
제5 측면의 제6 가능 구현 방법에 대하여, 제7 가능 구현 방법에서, 이 장치는: 미리설정된 제1 임계값과 미리설정된 제2 임계값을 획득하거나; 현재-입력 프레임 이전의 N개의 무음 프레임의 CELP 여기 에너지에 따라 제1 임계값을 결정하고, N개의 무음 프레임의 LSF 계수에 따라 제2 임계값을 결정하도록 구성되며, 이 때 N은 양의 정수이다.
제5 측면 또는 제5 측면의 제1 가능 구현 방법 내지 제7 가능 구현 방법 중 임의의 구현 방법에 대하여, 제8 가능 구현 방법에서, 제1 결정 유닛은 구체적으로 제1 예측 방식으로 컴포트 노이즈를 예측하도록 구성되며, 제1 예측 방식은 디코더가 컴포트 노이즈를 생성하는 방식과 동일하다.
제6 측면에 따라, 신호 처리 장치가 제공되며, 이 장치는: P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리를 결정하도록 구성되는 제1 결정 유닛으로서, P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리는 P개의 무음 프레임 내의 각 무음 프레임과 다른 (P-1)개의 무음 프레임 사이의 가중화 스펙트럼 거리의 합계이고, P는 양의 정수인, 제1 결정 유닛; 및 P개의 무음 프레임 내의 각 무음 프레임의, 제1 결정 유닛에 의해 결정된 그룹 가중화 스펙트럼 거리에 따라 제1 스펙트럼 파라미터를 결정하도록 구성된 제2 결정 유닛으로서, 제1 스펙트럼 파라미터가 컴포트 노이즈를 생성하기 위해 사용되는, 제2 결정 유닛을 포함한다.
제6 측면에 대하여, 제1 가능 구현 방법에서, 제2 결정 유닛은 구체적으로: P개의 무음 프레임 내의 제1 무음 프레임의 그룹 가중화 스펙트럼 거리가 최소가 되도록, P개의 무음 프레임으로부터 제1 무음 프레임을 선택하고; 제1 무음 프레임의 스펙트럼 파라미터가 제1 스펙트럼 파라미터라고 결정하도록 구성된다.
제6 측면에 대하여, 제2 가능 구현 방법에서, 제2 결정 유닛은 구체적으로: P개의 무음 프레임 내의 적어도 하나의 무음 프레임의 그룹 가중화 스펙트럼 거리가 제3 임계값 미만이 되도록, P개의 무음 프레임으로부터 적어도 하나의 무음 프레임을 선택하고; 적어도 하나의 무음 프레임의 스펙트럼 파라미터에 따라 제1 스펙트럼 파라미터를 결정하도록 구성된다.
제6 측면, 또는 제6 측면의 제1 가능 구현 방법 또는 제2 가능 구현 방법에 대하여, 제3 가능 구현 방법에서, P개의 무음 프레임은 현재-입력 무음 프레임 및 상기 현재-입력 무음 프레임 이전의 (P-1)개의 무음 프레임을 포함하고;
상기 장치는: 현재-입력 무음 프레임을 무음 기술(SID) 프레임으로 인코딩하도록 구성된 인코딩 유닛으로서, SID 프레임은 제2 결정 유닛에 의해 결정된 제1 스펙트럼 파라미터를 포함하는, 인코딩 유닛을 더 포함한다.
제7 측면에 따라, 신호 처리 장치가 제공되며, 이 장치는: 입력 신호의 주파수 대역을 R개의 서브대역으로 분할하도록 구성된 분할 유닛으로서, R이 양의 정수인, 분할 유닛; 상기 분할 유닛이 분할을 수행한 후에 획득되는 R개의 서브대역의 각 서브대역에서, S개의 무음 프레임 내의 각 무음 프레임의 서브대역 그룹 스펙트럼 거리를 결정하도록 구성되는 제1 결정 유닛으로서, S개의 무음 프레임 내의 각 서브대역 그룹 스펙트럼 거리는 각 서브대역 상의 S개의 무음 프레임 내의 각 무음 프레임과 다른 (S-1)개의 무음 프레임 사이의 스펙트럼 거리의 합계이고, S가 양의 정수인, 제1 결정 유닛; 및 상기 분할 유닛이 분할을 수행한 후에 획득되는 각 서브대역 상에서, S개의 무음 프레임 내의 각 무음 프레임의, 제1 결정 유닛에 의해 결정된 서브대역 그룹 스펙트럼 거리에 따라 각 서브대역의 제1 스펙트럼 파라미터를 결정하도록 구성된 제2 결정 유닛으로서, 각 서브대역의 제1 스펙트럼 파라미터가 컴포트 노이즈를 생성하기 위해 사용되는, 제2 결정 유닛을 포함한다.
제7 측면에 대하여, 제1 가능 구현 방법에서, 제2 결정 유닛은 구체적으로: 각 서브대역 상의 S개의 무음 프레임 내의 제1 무음 프레임의 서브대역 그룹 스펙트럼 거리가 최소가 되도록, 각 서브대역 상에서 S개의 무음 프레임으로부터 제1 무음 프레임을 선택하고; 각 서브대역 상에서, 제1 무음 프레임의 스펙트럼 파라미터가 각 서브대역의 제1 스펙트럼 파라미터라고 결정하도록 구성된다.
제7 측면에 대하여, 제2 가능 구현 방법에서, 제2 결정 유닛은 구체적으로: 각 서브대역 상에서, 적어도 하나의 무음 프레임의 서브대역 그룹 스펙트럼 거리가 제4 임계값 미만이 되도록, 각 서브대역 상에서 S개의 무음 프레임으로부터 적어도 하나의 무음 프레임을 선택하고; 및 각 서브대역 상에서, 적어도 하나의 무음 프레임의 스펙트럼 파라미터에 따라, 각 서브대역의 제1 스펙트럼 파라미터를 결정하도록 구성된다.
제7 측면 또는 제7 측면의 제1 가능 구현 방법 또는 제2 가능 구현 방법에 대하여, 제3 가능 구현 방법에서, S개의 무음 프레임이 현재-입력 무음 프레임 및 현재-입력 무음 프레임 이전의 (S-1)개의 무음 프레임을 포함하고;
이 장치는 현재-입력 무음 프레임을 무음 기술(SID) 프레임으로 인코딩하도록 구성되는 인코딩 유닛을 더 포함하고, 이때 SID 프레임은 각 서브대역의 제1 스펙트럼 파라미터를 포함한다.
제8 측면에 따라, 신호 처리 장치가 제공되며, 이 장치는: T개의 무음 프레임 내의 각 무음 프레임의 제1 파라미터를 결정하도록 구성된 제1 결정 유닛으로서, 제1 파라미터는 스펙트럼 엔트로피를 나타내기 위해 사용되고 T는 양의 정수인, 제1 결정 유닛; 및 T개의 무음 프레임 내의 각 무음 프레임의, 제1 결정 유닛에 의해 결정된 제1 파라미터에 따라 제1 스펙트럼 파라미터를 결정하도록 구성된 제2 결정 유닛으로서, 제1 스펙트럼 파라미터가 컴포트 노이즈를 생성하기 위해 사용되는, 제2 결정 유닛을 포함한다.
제8 측면에 대하여, 제1 가능 구현 방법에서, 제2 결정 유닛은 구체적으로: T개의 무음 프레임이 클러스터링 기준에 따라 제1 그룹의 무음 프레임과 제2 그룹의 무음 프레임으로 분류될 수 있다고 결정되는 경우에, 제1 그룹의 무음 프레임의 스펙트럼 파라미터에 따라 제1 스펙트럼 파라미터를 결정하도록 구성되고, 제1 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피가 제2 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피를 초과하며; T개의 무음 프레임이 클러스터링 기준에 따라 제1 그룹의 무음 프레임과 제2 그룹의 무음 프레임으로 분류될 수 없다고 결정되는 경우에, 제1 스펙트럼 파라미터를 결정하도록, T개의 무음 프레임의 스펙트럼 파라미터에 대한 가중화된 평균화를 수행하도록 구성되고, 제1 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피가 제2 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피를 초과한다.
제8 측면에 대하여, 제2 가능 구현 방법에서, 제2 결정 유닛은 구체적으로, T개의 무음 프레임의 스펙트럼 파라미터에 대한 가중화된 평균화를 수행하여, 제1 스펙트럼 파라미터를 결정하고,
이때, T개의 무음 프레임에서 상이한 i번째 무음 프레임과 j번째 무음 프레임에 대하여, i번째 무음 프레임에 대응하는 가중 계수는 j번째 무음 프레임에 대응하는 가중 계수 이상이며, 제1 파라미터가 스펙트럼 엔트로피와 양으로 상관될 때, i번째 무음 프레임의 제1 파라미터가 j번째 무음 프레임의 제1 파라미터를 초과하고, 제1 파라미터가 스펙트럼 엔트로피와 음으로 상관될 때, i번째 무음 프레임의 제1 파라미터가 j번째 무음 프레임의 제1 파라미터 미만이고, i와 j 둘 다 양의 정수이며, 1≤i≤T이고, 1≤j≤T이다.
제8 측면 또는 제8 측면의 제1 가능 구현 방법 또는 제2 가능 구현 방법에 대하여, 제3 가능 구현 방법에서, T개의 무음 프레임은 현재-입력 무음 프레임 및 현재-입력 무음 프레임 이전의 (T-1)개의 무음 프레임을 포함하며;
이 장치는, 현재-입력 무음 프레임을 무음 기술(SID) 프레임으로 인코딩하도록 구성된 인코딩 유닛을 더 포함하며, 이때 SID 프레임은 제1 스펙트럼 파라미터를 포함한다.
본원의 실시태양에서, 현재-입력 프레임의 이전 프레임의 인코딩 방식이 연속 인코딩 방식일 경우에는, 현재-입력 프레임이 SID 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈가 예측되고, 컴포트 노이즈와 실제 무음 신호 사이의 편차도가 결정되고, 유음 프레임의, 통계 수집을 통해 획득된 양에 따라 단순히 현재-입력 프레임이 행오버 프레임으로 인코딩되지 않고, 편차도에 따라 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식 또는 SID 프레임 인코딩 방식이라고 결정되며, 이로써, 통신 대역폭이 절약된다.
본원의 실시태양에서 기술적 해결책을 좀 더 정확히 기술하기 위하여, 본원의 실시태양을 설명하기 위해 요구되는 수반되는 도면을 간략히 소개한다. 명백히, 다음의 발명의 상세한 설명의 수반되는 도면은 본원의 일부 실시태양을 단지 도시하며, 이 분야의 통상의 기술자는 창작적 노력 없이 수반되는 도면으로부터 다른 도면을 도출해낼 수도 있다.
도 1은 본원의 실시태양에 따른 음성 통신 시스템의 간략한 블록도이다.
도 2는 본원의 실시태양에 따른 신호 인코딩 방법의 간략한 흐름도이다.
도 3a는 본원의 실시태양에 따른 신호 인코딩 방법의 간략한 흐름도이다.
도 3b는 본원의 또 다른 실시태양에 따른 신호 인코딩 방법의 처리의 간략한 흐름도이다.
도 4 는 본원의 실시태양에 따른 신호 처리 방법의 간략한 흐름도이다.
도 5 는 본원의 또 다른 실시태양에 따른 신호 처리 방법의 간략한 흐름도이다.
도 6 은 본원의 또 다른 실시태양에 따른 신호 처리 방법의 간략한 흐름도이다.
도 7은 본원의 실시태양에 따른 신호 인코딩 디바이스의 간략한 블록도이다.
도 8은 본원의 또 다른 실시태양에 따른 신호 처리 디바이스의 간략한 블록도이다.
도 9는 본원의 또 다른 실시태양에 따른 신호 처리 디바이스의 간략한 블록도이다.
도 10는 본원의 또 다른 실시태양에 따른 신호 처리 디바이스의 간략한 블록도이다.
도 11는 본원의 또 다른 실시태양에 따른 신호 인코딩 디바이스의 간략한 블록도이다.
도 12는 본원의 또 다른 실시태양에 따른 신호 처리 디바이스의 간략한 블록도이다.
도 13는 본원의 또 다른 실시태양에 따른 신호 처리 디바이스의 간략한 블록도이다.
도 14는 본원의 또 다른 실시태양에 따른 신호 처리 디바이스의 간략한 블록도이다.
이하 본원의 실시태양에서 수반되는 도면에 대하여 본원의 실시태양에서의 기술적 해결책을 정확하고 완전하게 기재한다. 명백히, 상세한 설명의 실시태양은 본원의 실시태양의 일부이며, 전부가 아니다. 창작적 노력 없이 본원의 실시태양에 기초하여 이 분야의 통상의 기술자에 의해 획득되는 모든 다른 실시태양이 본원의 보호 범위 내에 있다.
도 1은 본원의 실시태양에 따른 음성 통신 시스템의 간략한 블록도이다.
도 1의 시스템(100)은 DTX 시스템일 수 있다. 시스템(100)은 인코더(110) 및 디코더(120)를 포함할 수 있다.
인코더(110)는 입력 시간-도메인 음성 신호를 음성 프레임으로 절단하고, 음성 프레임을 인코딩하고, 인코딩된 음성 프레임을 디코더(120)에 전달한다. 디코더(120)는 인코더(110)로부터의 인코딩된 음성 프레임을 수신하고, 인코딩된 음성 프레임을 디코딩하고, 디코딩된 시간-도메인 음성 신호를 출력할 수 있다.
인코더(110)는 음성 활동 검출기(Voice Activity Detector, VAD)(110a)를 더 포함할 수 있다. VAD(110a)는 현재-입력 음성 프레임이 유음 프레임인지 무음 프레임인지 여부를 검출 할 수 있다. 유음 프레임은 호출 음성 신호를 포함하는 프레임을 나타낼 수 있고, 무음 프레임은 호출 음성 신호를 포함하지 않는 프레임을 나타낸다. 따라서, 무음 프레임은 에너지가 무음 임계값 미만인 뮤트 프레임(mute frame)을 포함하거나, 배경 노이즈 프레임을 또한 포함할 수 있다. 인코더(110)는 두 동작 상황, 즉 연속 전송 상태 및 불연속 전송 상태를 가질 수 있다. 인코더(110)가 연속 전송 상태에서 동작할 때, 인코더(110)는 각각의 입력 음성 프레임을 인코딩하고, 인코딩된 프레임을 전달할 수 있다. 인코더(110)가 불연속 전송 상태에서 동작할 때, 인코더(110)는 입력 음성 프레임을 인코딩하지 않거나, 음성 프레임을 SID 프레임으로 인코딩할 수 있다. 일반적으로, 입력 음성 프레임이 무음 프레임일 때만, 인코더(110)는 불연속 전송 상태에서 동작한다.
현재-입력 무음 프레임이, 존재할 수 있는 행오버 간격을 포함하는 유음 대역의 마지막 이후의 제1 프레임일 때에, 인코더(110)는 무음 프레임을 SID 프레임으로 인코딩할 할 수 있다, 이때, SID_FIRST가 SID 프레임을 나타내기 위해 사용될 수 있다. 현재-입력 무음 프레임이 이전 SID 프레임 이후의 n번째 프레임이고(n은 양의 정수임), 현재-입력 무음 프레임과 이전 SID 프레임 사이에 유음 프레임이 없을 때에, 인코더(110)가 무음 프레임을 SID 프레임으로 인코딩할 수 있고, SID_UPDATE가 SID 프레임을 나타내기 위해 사용될 수 있다.
SID 프레임은 무음 신호의 특징을 기술하는 몇몇 정보를 포함할 수 있다. 디코더는 특징 정보에 따라 컴포트 노이즈를 생성할 수 있다. 예를 들어, SID 프레임은 무음 신호의 에너지 정보 및 스펙트럼 정보를 포함할 수 있다. 또한, 예컨대, 무음 신호의 에너지 정보는 코드 여기된 선형 예측(CELP) 모델에서의 여기 신호의 에너지, 또는 무음 신호의 시간-도메인 에너지를 포함할 수 있다. 스펙트럼 정보는 선 스펙트럼 주파수(LSF) 계수, 선 스펙트럼 쌍(LSP) 계수, 이미턴스 스펙트럼 주파수(ISF) 계수, 이미턴스 스펙트럼 쌍(ISP) 계수, 선형 예측 코딩(LPC) 계수, 고속 퓨리에 변환(FFT) 계수, 또는 수정 이산 코사인 변환(MDCT) 계수, 또는 이와 유사한 것을 포함할 수 있다.
인코딩된 음성 프레임은 3개의 유형: 인코딩된 음성 프레임, SID 프레임, 및 NO_DATA 프레임을 포함할 수 있다. 인코딩된 음성 프레임은 연속 전송 상태에서 인코더(110)에 의해 인코딩된 프레임이고, NO_DATA 프레임은 인코딩된 비트를 갖지 않는 프레임, 즉 SID 프레임들 사이에 있는 인코딩되지 않은 무음 프레임과 같이 물리적으로 존재하지 않는 프레임을 나타낼 수 있다.
디코더(120)는 인코더(110)로부터 인보딩된 음성 프레임을 수신하고, 인코딩된 음성 프레임을 디코딩할 수 있다. 인코딩된 음성 프레임이 수신될 때, 디코더가 바로 프레임을 디코딩하고 시간-도메인 음성 프레임을 출력할 수 있다. SID 프레임이 수신될 때, 디코더가 SID 프레임를 디코딩하고, SID 프레임 내의 행오버 길이 정보, 에너지 정보, 및 스펙트럼 정보를 획득할 수 있다. 특히, SID 프레임이 SID_UPDATE일 때, 디코더가 무음 신호의 스펙트럼 정보 및 에너지 정보를 획득할 수 있고, 즉, 현재 SID 프레임 내의 정보에 따라, 또는 현재 SID 프레임 내의 정보에 따라 다른 정보와 관련하여, CN 파라미터를 획득하여, CN 파라미터에 따라 시간-도메인 CN 프레임을 생성한다. SID 프레임이 SID_FIRST일 때, 디코더는, SID 프레임 내의 행오버 길이 정보에 따라, 프레임 이전의 m개의 프레임의 에너지와 스펙트라에 대한 통계 정보를 획득하고, SID 프레임 내에 있고 디코딩을 통해 획득되는 정보와 관련하여 CN 파라미터를 획득하여, 시간-도메인 CN 프레임을 생성한다. 이 때, m은 양의 정수이다. NO_DATA 프레임이 디코더에 입력될 때, 디코더는 최근-수신된 SID 프레임에 따라, 그리고 다른 정보에 관련하여 CN 파라미터를 획득하여, 시간-도메인 CN 프레임을 생성한다.
도 2는 본원의 실시태양에 따른 신호 인코딩 방법의 간략한 흐름도이다. 도 2의 방법은 인코더, 예컨대 도 1의 인코더(110)에 의해 실행될 수 있다.
210: 현재-입력 프레임의 이전 프레임의 인코딩 방식이 연속 인코딩 방식인 경우에는, 현재-입력 프레임이 SID 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈를 예측하고, 실제 무음 신호를 결정하며, 상기 현재-입력 프레임은 무음 프레임이다.
본원의 이 실시태양에서, 실제 무음 신호는 인코더에 입력되는 실제 무음 신호를 지칭한다.
220: 컴포트 노이즈와 실제 무음 신호 사이의 편차도를 결정한다.
230: 편차도에 따라 현재-입력 프레임의 인코딩 방식을 결정하며, 상기 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식 또는 SID 프레임 인코딩 방식을 포함한다.
특히, 행오버 프레임 인코딩 방식은 연속 인코딩 방식을 지칭할 수 있다. 인코더는 연속 인코더 방식에서 행오버 간격 내의 무음 프레임을 인코딩할 수 있고 인코딩을 통해 획득된 프레임은 행오버 프레임으로 지칭될 수 있다.
240: 현재-입력 프레임의 인코딩 방식에 따라 현재-입력 프레임을 인코딩한다.
단계 210에서, 인코더는, 다른 인자에 따라, 연속 인코딩 방식으로 현재-입력 프레임의 이전 프레임의 인코딩을 결정할 수 있으며, 예컨대 인코더 내의 VAD가 이전 프레임이 유음 대역 내에 있다고 결정하거나, 인코더가 이전 프레임이 행오버 간격 내에 있다고 결정한다면, 인코더는 연속 인코딩 방식으로 이전 프레임을 인코딩할 수 있다.
입력 음성 신호가 무음 대역에 들어간 후에, 인코더는, 실제 상황에 따라, 연속 전송 상태 또는 불연속 전송 상태로 동작할지 여부를 결정할 수 있다. 그러므로, 무음 프레임으로 사용되는 현재-입력 프레임에 대하여, 인코더가 현재-입력 프레임을 어떻게 인코딩할지 결정할 필요가 있다.
현재-입력 프레임은, 입력 음성 신호가 무음 대역에 들어간 후에 제1 무음 프레임일 수 있고, 또는 입력 음성 신호가 무음 대역에 들어간 후에 n번째 프레임일 수도 있다.
현재-입력 프레임이 제1 무음 프레임이면, 단계 230에서, 인코더가 현재-입력 프레임의 인코딩 방식을 결정하는 것은: 행오버 간격이 설정될 필요가 있는지 여부를 결정하는 것이며, 이 때 행오버 간격이 설정될 필요가 있으면, 인코더는 현재-입력 프레임을 행오버 프레임으로 인코딩할 수 있고, 행오버 간격이 설정될 필요가 없으면, 인코더가 현재-입력 프레임을 SID 프레임으로 인코딩한다.
현재-입력 프레임이 n번째 무음 프레임이고, 인코더가 현재-입력 프레임이 행오버 간격 내에 있다고 결정할 수 있으며, 즉, 현재-입력 프레임 이전의 무음 프레임이 연속하여 인코딩되면, 단계 230에서, 인코더가 현재-입력 프레임의 인코딩 방식을 결정하는 것은: 행오버 간격을 종료할지 여부를 결정하는 것이며, 이 때 행오버 간격이 종료될 필요가 있으면, 인코더는 현재-입력 프레임을 SID 프레임으로 인코딩하고, 행오버 간격이 연장될 필요가 있으면, 인코더는 현재-입력 프레임을 행오버 프레임으로 인코딩한다.
현재-입력 프레임이 n 번째 무음 프레임이고, 행오버 메커니즘이 없으면, 단계 230에서, 인코더가 현재-입력 프레임의 인코딩 방식을 결정할 필요가 있어서, 디코더가 인코딩된 현재-입력 프레임을 디코딩한 이후에 더 양호한 컴포트 노이즈를 획득할 수 있다.
이와 같이, 본원의 실시태양은 행오버 메커니즘의 트리거링 시나리오에 적용될 수 있을 뿐만 아니라, 행오버 메커니즘의 실행 시나리오에 적용될 수도 있고, 또한 행오버 메커니즘이 없는 시나리오에 적용될 수도 있다. 특히, 본원의 실시태양에서, 행오버 메커니즘을 트리거링할지 여부가 결정될 수 있고, 행오버 메커니즘을 종료할지 여부를 미리 결정할 수도 있다. 대안으로, 행오버 메커니즘이 없는 시나리오에 대하여, 본원의 실시태양에서, 무음 프레임의 인코딩 방식이 결정되어서, 더 나은 인코딩 활동과 디코딩 활동을 달성할 수 있다.
특히, 인코더가 현재-입력 프레임을 SID 프레임으로 인코딩한다고 보는 것이 타당할 것이며, 디코더가 SID 프레임을 수신한다면, 디코더가 SID 프레임에 따라 컴포트 노이즈를 생성하고, 인코더는 컴포트 노이즈를 예측할 수 있다. 그 후, 인코더는 컴포트 노이즈와 인코더에 입력되는 실제 무음 신호 사이의 편차도를 예측할 수 있다. 본 명세서에서 편차도는 유사도로 이해될 수 있다. 예측된 컴포트 노이즈가 실제 무음 신호에 충분히 근접하면, 인코더는 행오버 간격이 설정될 필요가 없거나 행오버 간격이 연장될 필요가 없다고 여길 수 있다.
종래 기술에서는, 고정 길이인 행오버 간격을 실행할지 여부가 유음 프레임의 양에 대한 통계를 단순히 수집하여 결정한다. 즉, 연속하여 인코딩될 충분한 유음 프레임이 존재한다면, 고정 길이로 행오버 간격이 설정된다. 현재-입력 프레임이 제1 무음 프레임인지, 또는 행오버 간격 내에 있는 n번째 무음 프레임인지 간에, 현재-입력 프레임이 행오버 프레임으로 인코딩된다. 그러나, 불필요한 행오버 프레임은 통신 대역폭의 낭비를 초래할 수 있다. 그러나, 본원의 실시태양에서, 현재-입력 프레임이 단순히 유음 프레임의 양에 따라 행오버 프레임으로 인코딩되지 않고, 현재-입력 프레임의 인코딩 방식은 예측된 컴포트 노이즈와 실제 무음 신호 사이의 편차도에 따라 결정된다. 이로써, 통신 대역폭이 절약된다.
본원의 실시태양에서, 현재-입력 프레임의 이전 프레임의 인코딩 방식이 연속 인코딩 방식일 경우에는, 현재-입력 프레임이 SID 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈가 예측되고, 컴포트 노이즈와 실제 무음 신호 사이의 편차도가 결정되고, 유음 프레임의, 통계 수집을 통해 획득된 양에 따라 단순히 현재-입력 프레임이 행오버 프레임으로 인코딩되지 않고, 편차도에 따라 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식 또는 SID 프레임 인코딩 방식이라고 결정되며, 이로써, 통신 대역폭이 절약된다.
선택적으로, 실시태양으로서, 단계 210에서, 인코더는 제1 예측 방식으로 컴포트 노이즈를 예측할 수 있고, 제1 예측 방식은 디코더가 컴포트 노이즈를 생성하는 방식과 동일하다.
특히, 인코더와 디코더는 동일한 방식으로 컴포트 노이즈를 결정할 수 있고, 또는 인코더와 디코더는 본원의 실시태양에 제한되지 않는 한 상이한 방식으로 컴포트 노이즈를 결정할 수도 있다.
선택적으로, 실시태양으로서, 단계 210에서, 인코더는 컴포트 노이즈의 특징 파라미터를 예측하고, 실제 무음 신호의 특징 파라미터를 결정할 수 있고, 컴포트 노이즈의 특징 파라미터는 실제 무음 신호의 특징 파라미터에 1 대 1 대응관계에 있다. 단계 220에서, 인코더는 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리를 결정할 수 있다.
특히, 인코더는 컴포트 노이즈의 특징 파라미터를 실제 무음 신호의 특징 파라미터와 비교하여, 특징 파라미터들 사이의 거리를 획득하고, 따라서, 컴포트 노이즈와 실제 무음 신호 사이의 편차도를 결정할 수 있다. 컴포트 노이즈의 특징 파라미터는 실제 무음 신호의 특징 파라미터와 1 대 1 대응관계에 있어야 한다. 즉, 컴포트 노이즈의 특징 파라미터의 유형은 실제 무음 신호의 특징 파라미터의 유형과 동일한다. 예컨대 인코더는 컴포트 노이즈의 에너지 파라미터를 실제 무음 신호의 에너지 파라미터와 비교하고, 또는 컴포트 노이즈의 스펙트럼 파라미터를 실제 무음 신호의 스펙트럼 파라미터와 비교할 수도 있다.
본원의 이 실시태양에서, 특징 파라미터가 스칼라일 ?, 특징 파라미터들 사이의 거리는 특징 파라미터들 사이의 차의 절대값, 즉 스칼라 거리로 지칭될 수 있다. 특징 파라미터가 벡터일 때, 특징 파라미터들 사이의 거리는 특징 파라미터들 사이의 대응하는 요소들의 스칼라 거리의 합계로 지칭될 수 있다.
선택적으로, 또 다른 실시태양으로서, 단계 230에서, 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 미만인 경우에, 현재-입력 프레임의 인코딩 방식이 SID 프레임 인코딩 방식이라고 결정하고, 상기 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리는 임계 설정에서의 임계값과 1 대 1 대응관계에 있다. 인코더는, 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 이상인 경우에, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 또한 결정한다.
구체적으로, 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터는 각각 적어도 하나의 파라미터를 포함할 수 있으며, 따라서 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리는 적어도 하나의 유형의 파라미터들 사이의 거리를 또한 포함할 수 있다. 또한, 임계 설정은 적어도 하나의 임계값을 포함할 수 있다. 각 유형의 파라미터들 간의 거리는 하나의 임계값에 대응할 수 있다. 현재-입력 프레임의 인코딩방식을 결정할 때, 인코더는 적어도 하나의 유형의 파라미터들 간의 거리를 임계 설정에서의 대응하는 임계값과 별도로 비교할 수 있다. 임계 설정에서의 적어도 하나의 임계값은 미리설정되거나, 현재-입력 프레임 이전의 다수의 무음 프레임의 특징 파라미터들에 따라 인코더에 의해 결정될 수도 있다.
컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 미만이면, 인코더는 컴포트 노이즈가 실제 무음 신호에 충분히 가깝다고 여길 수 있고, 따라서 현재-입력 프레임을 SID 프레임으로 인코딩할 수 있다. 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 이상이면, 인코더는 컴포트 노이즈와 실제 무음 신호 사이의 편차도가 비교적 크다고 여길 수 있고, 따라서 현재-입력 프레임을 행오버 프레임으로 인코딩할 수 있다.
선택적으로, 또 다른 실시태양으로서, 컴포트 노이즈의 특징 파라미터는 다음의 정보 중 적어도 하나를 나타내기 위해 사용될 수 있다: 에너지 정보 및 스펙트럼 정보
선택적으로, 또 다른 실시태양으로서, 에너지 정보는 CELP 여기 에너지를 포함할 수 있다. 스펙트럼 정보는 선형 예측 필터 계수, FFT 계수, 및 MDCT 계수 중 적어도 하나를 포함할 수 있다. 선형 예측 필터 계수는 LSF 계수, LSP 계수, ISF 계수, ISP 계수, 반사 계수, 및 LPC 계수 중 적어도 하나를 포함할 수 있다.
선택적으로, 또 다른 실시태양으로서, 단계 210에서, 인코더는 현재-입력 프레임의 특징 파라미터가 실제 무음 신호의 특징 파라미터라고 결정할 수 있다. 대안으로, 인코더는 M개의 무음 프레임의 특징 파라미터에 대한 통계를 수집하여, 실제 무음 신호의 특징 파라미터를 결정한다.
선택적으로, 또 다른 실시태양에서, M개의 무음 프레임은 현재-입력 프레임 및 현재-입력 프레임 이전의 (M-1)개의 무음 프레임을 포함할 수 있고, M은 양의 정수이다.
예를 들어, 현재-입력 프레임이 제1 무음 프레임이면, 실제 무음 신호의 특징 파라미터는 현재-입력 프레임의 특징 파라미터일 수 있고; 현재-입력 프레임이 n 번째 무음 프레임이면, 실제 신호의 특징 파라미터가 현재-입력 프레임을 포함하는 M개의 무음 프레임의 특징 파라미터에 대한 통계를 수집하여 인코더에 의해 획득될 수 있다. M개의 무음 프레임은 연속적이거나, 불연속적일 수 있고, 본원의 이러한 실시태양에 제한되지 않는다.
선택적으로, 또 다른 실시태양으로서, 단계 210에서, 인코더는 현재-입력 프레임의 이전 프레임의 컴포트 노이즈 파라미터 및 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측할 수 있다. 대안으로, 인코더는 현재-입력 프레임 이전의 L개의 행오버 프레임의 특징 파라미터 및 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측할 수 있고, L은 양의 정수이다.
예를 들어, 현재-입력 프레임이 제1 무음 프레임이면, 인코더는 이전 프레임의 컴포트 노이즈 파라미터 및 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측할 수 있다. 각 프레임을 인코딩할 때, 인코더가 인코더 내의 각 프레임의 컴포트 노이즈 파라미터를 저장할 수 있다. 일반적으로, 입력 프레임이 무음 프레임일 때에만, 저장된 컴포트 노이즈 파라미터가 이전 프레임의 파라미터와 비교하여 변경될 수 있으며, 이는 인코더가 현재-입력 무음 프레임의 특징 파라미터에 따라 저장된 컴포트 노이즈 파라미터를 업데이트할 수 있기 때문이며, 일반적으로 현재-입력 프레임이 유음 프레임일 때는 컴포트 노이즈 파라미터를 업데이트하지 않는다. 따라서, 인코더는, 이전 프레임의, 인코더에 저장된 컴포트 노이즈 파라미터를 획득할 수 있다. 예를 들어, 컴포트 노이즈 파라미터는 무음 신호의 에너지 파라미터 및 스펙트럼 파라미터를 포함할 수 있다.
추가로, 현재-입력 프레임이 현재 행오버 간격 내에 있으면, 인코더는 현재-입력 프레임 이전의 L개의 행오버 프레임의 파라미터들에 대한 통계를 수집하고, 현재-입력 프레임의 특징 파라미터 및 통계 수집을 통해 획득된 결과에 따라 컴포트 노이즈의 특징 파라미터를 획득한다.
선택적으로, 또 다른 실시태양으로서, 컴포트 노이즈의 특징 파라미터는 컴포트 노이즈의 CELP 여기 에너지 및 컴포트 노이즈의 LSF 계수를 포함할 수 있고, 실제 무음 신호의 특징 파라미터는 실제 무음 신호의 CELP 여기 에너지 및 실제 무음 신호의 LSF 계수를 포함할 수 있다. 단계 220에서, 인코더는 컴포트 노이즈의 CELP 여기 에너지와 실제 무음 신호의 CELP 여기 에너지 사이의 거리 De를 결정하고, 컴포트 노이즈의 LSF 계수와 실제 무음 신호의 LSF 계수 사이의 거리 Dlsf를 결정할 수 있다.
거리 De와 거리 Dlsf는 하나의 변이(variation)를 포함하거나, 변이의 그룹을 또한 포함할 수 있음을 알아야 한다 . 예를 들어, 거리 Dlsf는 두 변이를 포함할 수 있는데, 하나의 변이는 LSF 계수들 사이의 평균 거리, 즉 LSF 계수들 사이의 거리들의 편균 값일 수 있고, 다른 변이는 LSF 계수들 사이의 최대 거리, 즉 최대 거리를 포함하는 한 쌍의 LSF 계수 사이의 거리일 수 있다.
선택적으로, 또 다른 실시태양으로서, 단계 230에서, 거리 De가 제1 임계값 미만이고, 거리 Dlsf가 제2 임계값 미만인 경우에, 인코더는 현재-입력 프레임의 인코딩 방식이 SID 프레임 인코딩 방식이라고 결정할 수 있다. 거리 De가 제1 임계값 이상이고, 거리 Dlsf가 제2 임계값 이상인 경우에, 인코더가 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정할 수 있다. 제1 임계값 및 제2 임계값은 둘 다 임계 설정에 속한다.
선택적으로, 또 다른 실시태양으로서, De 또는 Dlsf가 변이의 그룹을 포함할 때, 인코더는 변이의 그룹 내의 각 변이를 대응하는 임계값과 비교하여, 현재-입력 프레임을 인코딩하기 위한 방식을 결정한다.
구체적으로, 인코더는 거리 De와 거리 Dlsf에 따라 현재-입력 프레임의 인코딩 방식을 결정할 수 있다. 거리 De < 제1 임계값이고 거리 Dlsf < 제2 임계값이면, 예측된 컴포트 노이즈의 CELP 여기 에너지와 LSF 계수가 실제 무음 신호의 CELP 여기 에너지와 LSF 계수와 미세하게 상이하다고 지시할 수 있고, 인코더는 컴포트 노이즈가 실제 무음 신호에 충분히 가깝다고 여길 수 있으며, 현재-입력 프레임을 SID 프레임으로 인코딩할 수 있다. 그렇지 않으면, 인코더는 현재-입력 프레임을 행오버 프레임으로 인코딩할 수 있다.
선택적으로, 또 다른 실시태양으로서, 단계 230에서, 인코더는 미리설정된 제1 임계값와 미리설정된 제2 임계값을 획득할 수 있다. 대안으로, 인코더는 현재-입력 프레임 이전의 N개의 무음 프레임의 CELP 여기 에너지에 따라 제1 임계값을 결정하고, N개의 무음 프레임의 LSF 계수에 따라 제2 임계값을 결정할 수 있고, N은 양의 정수이다.
특히, 제1 임계값 및 제2 임계값 둘다 고정 값으로 미리 설정될 수 있다. 대안으로, 제1 임계값 및 제2 임계값 둘 다 자기-적응형 변이일 수 있다. 예를 들어, 제1 임계값이 현재-입력 프레임 이전의 N개의 무음 프레임의 CELP 여기 에너지에 대한 통계를 수집하여 인코더에 의해 획득될 수 있고, 제2 임계값이 현재-입력 프레임 이전의 N개의 무음 프레임의 LSF 계수에 대한 통계를 수집하여 인코더에 의해 획득될 수 있으며, 이때 N개의 무음 프레임은 연속적이거나 불연속적일 수도 있다.
도 2의 특정 프로세스를 특정 실시예를 사용하여 이하 자세히 기술한다. 도 3a과 도 3b의 실시예에서, 본원의 이 실시태양이 적용되는 두 가지 시나리오가 기술을 위해 사용된다. 이 실시예는, 본원의 이러한 실시태양의 범위를 제한하는 것이 아니라, 이 분야의 통상의 기술자가 본원의 실시태양을 더 잘 이해하도록 돕는 의도일 뿐임을 이해해야 한다.
도 3a은 본원의 실시태양에 따른 신호 인코딩 방법의 프로세스의 간략한 흐름도이다. 도 3a에서, 현재-입력 프레임의 이전 프레임의 인코딩 방식이 연속 인코딩 방식이고, 인코더 내의 VAD가 현재-입력 프레임이 입력 음성 신호가 무음 대역에 들어간 이후에 제1 무음 프레임이라고 결정하고, 그 후에 인코더는 행오버 간격을 설정할지 여부를 결정할 필요가 있다. 즉, 현재-입력 프레임을 행오버 프레임 또는 SID 프레임으로 인코딩할지 여부를 결정할 필요가 있다. 이 프로세스를 이하 자세히 기술한다.
301a: 실제 무음 신호의 CELP 여기 에너지 및 LSF 계수를 결정한다.
특히, 인코더는 실제 무음 신호의 CELP 여기 에너지(eSI)로서 현재-입력 프레임의 CELP 여기 에너지를 사용할 수 있고, 현재-입력 프레임의 LSF 계수(lsfSI(i))로서 현재-입력 프레임의 LSF 계수(lsf(i))를 사용할 수 있고, 이때 i = 0, 1, ..., K-1이며, K는 필터 차수이다. 인코더는 종래 기술에 관련하여, 현재-입력 프레임의 CELP 여기 에너지 및 LSF 계수 를 결정할 수 있다.
302a: 현재-입력 프레임이 SID 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈의 CELP 여기 에너지 및 LSF 계수를 예측한다.
인코더는 현재-입력 프레임을 SID 프레임으로 인코딩하고, 디코더는 SID 프레임에 따라 컴포트 노이즈를 생성한다는 것을 알 수 있다. 인코더는 컴포트 노이즈의 여기 에너지(eCN) 및 LSF 계수(lsfCN(i))를 예측할 수 있고, 이때, i = 0,1, ..., K-1이며, K는 필터 차수이다. 인코더는 현재-입력 프레임의 CELP 여기 에너지와 LSF 계수 및 이전 프레임의, 인코더 내에 저장된, 컴포트 노이즈 파라미터에 따라, 컴포트 노이즈의 CELP 여기 에너지와 LSF 계수 를 별도로 결정할 수 있다.
예를 들어, 인코더는 다음 식 (1)에 따라 컴포트 노이즈의 CELP 여기 에너지(eCN)를 예측할 수 있다:
Figure 112015116335223-pct00001
(1)
이때, eCN [-1]는 이전 프레임의 CELP 여기 에너지를 나타내고, 현재-입력 프레임의 CELP 여기 에너지를 나타낸다.
인코더는 다음 식 (2)에 따라 컴포트 노이즈의 LSF 계수(lsfCN(i))를 예측할 수 있으며, 이때 i = 0, 1, ..., K-1이며, K 필터 차수이다:
Figure 112015116335223-pct00002
(2)
이때 lsfCN [-1] (i)는 이전 프레임의 LSF 계수를 나타내고, lsf(i)는 현재-입력 프레임의 i차 LSF 계수를 나타낸다.
303a: 컴포트 노이즈의 CELP 여기 에너지와 실제 무음 신호의 CELP 여기 에너지 사이의 거리 De를 결정하고, 컴포트 노이즈의 LSF 계수와 실제 무음 신호의 LSF 계수 사이의 거리 Dlsf를 결정한다.
특히, 인코더는 다음의 식 (3)에 따라, 컴포트 노이즈의 CELP 여기 에너지와 실제 무음 신호의 CELP 여기 에너지 사이의 거리 De를 결정한다:
Figure 112015116335223-pct00003
(3)
인코더는 다음의 식 (4)에 따라, 컴포트 노이즈의 LSF 계수와 실제 무음 신호의 LSF 계수 사이의 거리 Dlsf를 결정할 수 있다:
Figure 112015116335223-pct00004
(4)
304a: 거리 De가 제1 임계값 미만인지 여부, 및 거리 Dlsf 가 제2 임계값 미만인지 여부를 결정한다.
특히, 제1 임계값과 제2 임계값 둘다 고정 값으로 미리 설정될 수 있다.
대안으로, 제1 임계값과 제2 임계값 둘다 자기-적응형 변이일 수 있다. 인코더는 현재-입력 프레임 이전의 N개의 무음 프레임의 CELP 여기 에너지에 따라 제1 임계값을 결정할 수 있고, 예컨대 인코더는 다음의 식 (5)에 따라 제1 임계값(thr1)을 결정할 수 있다:
Figure 112015116335223-pct00005
(5)
인코더는 N개의 무음 프레임의 LSF 계수에 따라 제2 임계값을 결정할 수 있고, 예컨대 인코더는 다음의 식 (6)에 따라 제2 임계값(thr2)을 결정할 수 있다:
Figure 112015116335223-pct00006
(6)
식 (5) 및 식 (6)에서, [x]는 x번째 프레임을 나타낼 수 있고, x는 n, m, 또는 p일 수 있다. 예를 들어, e [m]는 m번째 프레임의 CELP 여기 에너지를 나타낼 수 있다. lsf[n](i)는 n번째 프레임의 i차 LSF 계수를 나타낼 수 있고, lsf[p](i)는 p번째 프레임의 i차 LSF 계수를 나타낼 수 있다.
305a: 거리 De가 제1 임계값 미만이고, 거리 Dlsf가 제2 임계값 미만이면, 행오버 간격을 설정하지 않는 것으로 결정하고, 현재-입력 프레임을 SID 프레임으로 인코딩한다.
거리 De가 제1 임계값 미만이고, 거리 Dlsf가 제2 임계값 미만인 경우에, 인코더는 디코더에 의해 생성될 수 있는 컴포트 노이즈가 실제 무음 신호와 충분히 가깝다고 여길 수 있고, 행오버 간격이 설정되지 않으며, 현재-입력 프레임이 SID 프레임으로 인코딩된다.
306a: 거리 De가 제1 임계값 이상이거나 거리 Dlsf가 제2 임계값 이상이면, 행오버 간격을 설정하도록 결정하고, 현재-입력 프레임을 행오버 프레임으로 인코딩한다.
본원의 이 실시태양에서, 현재-입력 프레임이 SID 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈 및 실제 무음 신호 사이의 편차도에 따라, 현재-입력 프레임이 유음 프레임들 중, 통계 수집을 통해 획득되는, 단순히 양에 따른 행오버 프레임으로 인코딩되지 않고, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코더 방식 또는 SID 프레임 인코딩 방식으로 결정된다.
도 3b는 본원의 또 다른 실시태양에 따른 신호 인코딩 방법의 프로세스의 간략한 흐름도이다. 도 3b에서, 현재-입력 프레임이 이미 행오버 간격 내에 있음을 추정할 수 있다. 인코더는 행오버 간격을 종료할지 여부를 결정할 필요가 있다. 즉, 인코더는 현재-입력 프레임을 행오버 프레임으로 연속하여 인코딩할지 여부 또는 현재-입력 프레임을 SID 프레임으로 인코딩할지 여부를 결정할 필요가 있다. 이하 그 프로세스를 자세히 기술한다.
301b: 실제 무음 신호의 CELP 여기 에너지 및 LSF 계수를 결정한다.
선택적으로, 단계 301a와 유사하게, 디코더는 실제 무음 신호의 CELP 여기 에너지 및 LSF 계수 로서 현재-입력 프레임의 CELP 여기 에너지 및 LSF 계수를 사용할 수 있다.
선택적으로, 인코더는 현재-입력 프레임을 포함하는 M개의 무음 프레임의 CELP 여기 에너지에 대한 통계를 수집하여, 실제 무음 신호의 CELP 여기 에너지를 획득하며, 이때 M ≤ 행오버 간격 내의, 현재-입력 프레임 이전의 행오버 프레임의 양이다.
예를 들어, 인코더는 식 (7)에 따라 실제 무음 신호의 CELP 여기 에너지(eSI)를 결정한다:
Figure 112015116335223-pct00007
(7)
또 다른 예로, 인코더는 다음의 식 (8)에 따라 실제 무음 신호의 LSF 계수(lsfSI(i))를 예측하며, 이때 i = 0, 1, ..., K-1이고, K는 필터 차수이다:
Figure 112015116335223-pct00008
(8)
전술한 식 (7) 및 식 (8)에서, w(j)가 가중 계수를 나타내고, e [-j]가 현재-입력 프레임 이전의 j번째 무음 프레임의 CELP 여기 에너지를 나타낸다.
302b: 현재-입력 프레임이 SID 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈의 CELP 여기 에너지 및 LSF 계수를 예측한다.
특히, 인코더는 현재-입력 프레임 이전의 L개의 행오버 프레임의 CELP 여기 에너지 및 LSF 계수에 따라 컴포트 노이즈의 CELP 여기 에너지(eCN) 및 LSF 계수(lsfCN(i))를 별도로 결정할 수 있고, i = 0, 1, ..., K-1이며, K는 필터 차수이다.
예를 들어, 인코더는 다음의 식 (9)에 따라 컴포트 노이즈의 CELP 여기 에너지(eCN)를 결정한다:
Figure 112015116335223-pct00009
(9)
이때 eHO [-j]는 현재-입력 프레임 이전의 j번째 행오버 프레임의 여기 에너지를 나타낸다.
또 다른 예에서, 인코더는 다음의 식 (10)에 따라 컴포트 노이즈의 LSF 계수(lsfCN(i))를 결정하고, i = 0, 1, ..., K-1이며, K는 필터 차수이다:
Figure 112015116335223-pct00010
(10)
이때 lsfHO(i) [-j]는 현재-입력 프레임 이전의 j번째 행오버 프레임의 i차 LSF 계수를 나타낸다.
식 (9) 및 식 (10)에서, w(j)는 가중 계수를 나타낼 수 있다.
303b: 컴포트 노이즈의 CELP 여기 에너지와 실제 무음 신호의 CELP 여기 에너지 사이의 거리 De를 결정하고, 컴포트 노이즈의 LSF 계수와 실제 무음 신호의 LSF 계수 사이의 거리 Dlsf를 결정한다.
예를 들어, 인코더는 식 (3)에 따라 컴포트 노이즈의 CELP 여기 에너지와 실제 무음 신호의 CELP 여기 에너지 사이의 거리 De를 결정할 수 있다. 인코더는 식 (4)에 따라 컴포트 노이즈의 LSF 계수와 실제 무음 신호의 LSF 계수 사이의 거리 Dlsf를 결정할 수 있다.
304b: 거리 De가 제1 임계값 미만인지 여부, 및 거리 Dlsf가 제2 임계값 미만인지 여부를 결정한다.
구체적으로는, 제1 임계값 및 제2 임계값 둘 다 고정 값으로 미리설정될 수 있다.
대안으로, 제1 임계값 및 제2 임계값 둘 다 자기-적응형 변이(self-adaptive variation)일 수 있다. 예를 들어, 인코더는 식 (5)에 따라 제1 임계값(thr1)을 결정할 수 있고, 식 (6)에 따라 제2 임계값(thr2)을 결정할 수 있다.
305b: 거리 De가 제1 임계값 미만이고, 거리 Dlsf가 제2 임계값 미만이면, 행오버 간격을 종료하도록 결정하고, 현재-입력 프레임을 SID 프레임으로 인코딩한다.
306b: 거리 De가 제1 임계값 이상이고, 거리 Dlsf가 제2 임계값 이상이면, 계속하여 행오버 간격을 연장하도록 결정하고, 현재-입력 프레임을 행오버 프레임으로 인코딩한다.
본원의 이 실시태양에서,
현재-입력 프레임이 SID 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈와, 실제 무음 신호 사이의 편차도에 따라, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식 또는 SID 프레임 인코딩 방식이라고 결정되며, 현재-입력 프레임이 단순히 유음 프레임의, 통계 수집을 통해 획득되는 양에 따라 행오버 프레임으로 인코딩되지 않는다. 이로써, 통신 대역폭이 절약된다.
위에서 설명한 바와 같이, 불연속 전송 상태에 들어간 후에, 인코더는 SID 프레임을 간헐적으로 인코딩할 수 있다. SID 프레임은 일반적으로 무음 신호의 에너지와 스펙트럼을 기술하는 일부 정보를 포함한다. 인코더로부터 SID 프레임을 수신한 후에, 디코더는 SID 프레임 내의 정보에 따라 컴포트 노이즈를 생성할 수 있다. 현재, 일단 모든 다수의 프레임에서 SID 프레임이 인코딩되고 전달되기 때문에 SID 프레임을 인코딩할 경우, 디코더는 일반적으로 현재-입력 무음 프레임 및 현재-입력 무음 프레임 이전의 다수의 무음 프레임에 대한 통계를 수집하여 SID 프레임의 정보를 획득한다. 예를 들어, 연속 무음 간격 내에서, 현재-인코딩된 SID 프레임의 정보는 일반적으로 현재 SID 프레임 및 현재 SID 프레임과 이전 SID 프레임 사이의 다수의 무음 프레임에 대한 통계를 수집하여 획득된다. 또 다른 실시예에서, 유음 대역 이후의 첫번째 SID 프레임의 정보의 인코딩은 일반적으로 현재-입력 무음 프레임 및 유음 대역의 마지막에 있는 다수의 인접한 행오버 프레임에 대한 통계를 수집함으로써 인코더에 의해 획득되고, 즉, 행오버 간격 내의 N개의 무음 프레임에 대한 통계를 수집하여 획득된다. 기술의 편의를 위해, SID 프레임 인코딩 파라미터에 대한 통계를 수집하기 위해 사용되는 다수의 무음 프레임은 분석 간격으로 지칭된다. 구체적으로, SID 프레임이 인코딩될 때, SID 프레임의 파라미터는 분석 간격 내의 다수의 무음 프레임의 파라미터의 중간값(median value) 또는 평균값을 획득함으로써 획득된다. 그러나, 실제 배경 노이즈 스펙트럼이 다양한 예측불가한 단기 스펙트럼 컴포넌트(transient spectral component)를 포함할 수 있다. 분석 간격이 그러한 스펙트럼 컴포넌트를 포함하면, 이 컴포넌트는 평균값을 획득하기 위한 방법으로 SID 프레임에 추가될 수 있고, 그러한 스펙트럼 컴포넌트를 포하하는 무음 스펙트럼은 중간값을 획득하기 위한 방법으로 SID 프레임 내에 심지어 부정확하게 인코딩될 수도 있고, SID 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈의 품질이 감소되는 것을 유발한다.
도 4는 본원의 실시태양에 따른 신호 처리방법의 간략한 흐름도이다. 도 4의 방법은 인코더 또는 디코더에 의해 실행되고, 예컨대 도 1의 인코더(110) 또는 디코더(120)에 의해 실행될 수 있다.
410: P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리를 결정하고, P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리는 P개의 무음 프레임의 각 무음 프레임과 다른 (P-1)개의 무음 프레임 사이의 가중화 스펙트럼 거리의 합계이고, P는 양의 정수이다.
예를 들어, 인코더 또는 디코더는 현재-입력 무음 프레임 이전의 다수의 무음 프레임의 파라미터는 버퍼로 저장할 수 있다. 버퍼의 길이는 고정되거나 변경될 수 있다. P개의 무음 프레임은 버퍼로부터 인코더 또는 디코더에 의해 선택될 수 있다.
420: P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리에 따라 제1 스펙트럼 파라미터를 결정하고, 제1 스펙트럼 파라미터는 컴포트 노이즈를 생성하기 위해 사용된다.
본원의 이 실시태양에서, 컴포트 노이즈를 생성하기 위해 사용되는 제1 스펙트럼 파라미터는 P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리에 따라 결정되고, 컴포트 노이즈를 생성하기 위해 사용되는 스펙트럼 파라미터가 다수의 무음 프레임의 스펙트럼 파라미터의 평균값 또는 중간값을 획득함으로써 단순히 획득되는 것이 아니다. 따라서, 컴포트 노이즈의 품질을 개선할 수 있다.
선택적으로, 실시태양으로서, 단계 410에서, 각 무음 프레임의 그룹 가중화 스펙트럼 거리가 P개의 무음 프레임 내의 각 무음 프레임의 스펙트럼 파라미터에 따라 결정될 수 있다. 예를 들어, P개의 무음 프레임 내의 x번째 프레임의 그룹 가중화 스펙트럼 거리
Figure 112015116335223-pct00011
가 다음의 식 (11)에 따라 결정될 수 있다:
Figure 112015116335223-pct00012
(11)
이때 U[x](i)가 x번째 프레임의 i번째 스펙트럼 파라미터를 나타내고, U[j](i)가 j번째 프레임의 i번째 스펙트럼 파라미터를 나타내고, w(i)가 가중 계수이고, K가 스펙트럼 파라미터의 계수의 양이다.
예를 들어, 각 무음 프레임의 스펙트럼 파라미터는 LSF 계수, LSP 계수, ISF 계수, ISP 계수, LPC 계수, 반사 계수, FFT 계수, 또는 MDCT 계수 등을 포함할 수 있다. 그러므로, 대응하여, 단계 420에서, 제1 스펙트럼 파라미터는 LSF 계수, LSP 계수, ISF 계수, ISP 계수, LPC 계수, 반사 계수, FFT 계수, 또는 MDCT 계수 등을 포함할 수 있다.
이하 스펙트럼 파라미터가 LSF 계수인 실시예를 사용하여 단계 420의 프로세스를 기술한다. 예를 들어, 무음 프레임의 LSF 계수와 다른 (P-1)개의 무음 프레임의 LSF 계수 사이의 가중화 스펙트럼 거리의 합계, 즉, 각 무음 프레임의 LSF 계수의 그룹 가중화 스펙트럼 거리(swd)가 결정될 수 있으며, 예컨대 P개의 무음 프레임 내의 x번째 프레임의 LSF 계수의 그룹 가중화 스펙트럼 거리(swd'[ x])가 다음의 식 (12)에 따라 결정될 수 있고, x = 0, 1, 2, ..., P-1이다:
Figure 112015116335223-pct00013
(12)
이때 w'(i)는 가중 계수이고, K'는 필터 차수이다.
선택적으로, 일 실시태양으로서, 각 무음 프레임은 하나의 그룹의 가중 계수에 대응할 수 있고, 하나의 그룹의 가중 계수에서, 제1 그룹의 서브대역에 대응하는 가중 계수는 제2 그룹의 서브대역에 대응하는 가중 계수보다 크며, 제1 그룹의 서브대역의 지각적 중요도는 제2 그룹의 서브대역의 지각적 중요도보다 크다.
서브대역은 스펙트럼 계수를 분할함으로써 획득될 수 있고, 특정 프로세스에 대하여, 선행 기술이 참조될 수 있다. 서브대역의 지각적 중요도가 선행 기술에 따라 결정될 수 있다. 일반적으로, 저주파 서브대역의 지각적 중요도는 고주파 서브대역의 지각적 중요도보다 높다. 따라서, 간단한 실시태양에서, 저주파 서브대역의 가중 계수가 고주파 서브대역의 가중 계수보다 클 수 있다.
예를 들어, 식 (12)에서, w'(i)는 가중 계수이고, i = 0, 1, ..., K'-1이다. 각 무음 프레임은 하나의 그룹의 가중 계수, 즉 w'(0) 내지 w'(K'-1)에 대응한다. 하나의 그룹의 가중 계수에서, 저주파 서브대역의 LSF 계수의 가중 계수는 고주파 서브대역의 LSF 계수의 가중 계수보다 크다. 그라운드 노이즈의 에너지가 저주파 대역에서 거의 집중되기 때문에, 디코더에 의해 생성되는 컴포트 노이즈의 양은 저주파 대역 신호의 양에 의해 주로 결정되고, 최종 가중화 스펙트럼 거리 상에서 고주파 대역의 LSF 계수의 스펙트럼 거리에 의해 부과되는 영향으로 적당히 감소되어야 한다.
선택적으로, 또 다른 실시태양으로서, 단계 420에서, 제1 무음 프레임이 P개의 무음 프레임으로부터 선택되어서, P개의 무음 프레임의 제1 무음 프레임의 그룹 가중화 스펙트럼 거리는 최소이며, 제1 무음 프레임의 스펙트럼 파라미터가 제1 스펙트럼 파라미터라고 결정될 수 있다.
구체적으로, 그룹 가중화 스펙트럼 거리가 최소인 것은 제1 무음 프레임의 스펙트럼 파라미터가 P개의 무음 프레임의 스펙트럼 파라미터들 사이의 일반성(generality)을 가장 잘 나타낼 수 있음을 지시할 것이다. 따라서, 제1 무음 프레임의 스펙트럼 파라미터는 SID 프레임로 인코딩될 수 있다. 예를 들어, 각 무음 프레임의 LSF 계수의 그룹 가중화 스펙트럼 거리에 대하여, 제1 무음 프레임의 LSF 계수의 그룹 가중화 스펙트럼 거리는 최소이고; 그 후, 제1 무음 프레임의 LSF 스펙트럼이 P개의 무음 프레임의 LSF 스펙트럼들 사이의 일반성을 가장 잘 나타낼 수 있다고 지시할 것이다.
선택적으로, 또 다른 실시태양으로서, 단계 420에서, 적어도 하나의 무음 프레임이 P개의 무음 프레임으로부터 선택되어서, P개의 무음 프레임 내의 하나 이상의 무음 프레임의 그룹 가중화 스펙트럼 거리가 제3 임계값 미만이고, 제1 스펙트럼 파라미터는 적어도 하나의 무음 프레임의 스펙트럼 파라미터에 따라 결정될 수 있다.
예를 들어, 실시태양에서, 적어도 하나의 무음 프레임의 스펙트럼 파라미터의 평균값이 제1 스펙트럼 파라미터라고 결정될 수 있다. 또 다른 실시태양에서, 적어도 하나의 무음 프레임의 스펙트럼 파라미터의 중간값이 제1 스펙트럼 파라미터라고 결정될 수 있다. 또 다른 실시태양에서, 제1 스펙트럼 파라미터가 본원의 이 실시태양의 또 다른 방법을 사용하여 적어도 하나의 무음 프레임의 스펙트럼 파라미터에 따라 결정될 수도 있다.
스펙트럼 파라미터가 LSF 계수이고, 그 후 제1 스펙트럼 파라미터가 제1 LSF 계수일 수 있는 실시예를 사용하여 이하 기술한다. 예를 들어, P개의 무음 프레임에서 각 무음 프레임의 LSF 계수의 그룹 가중화 스펙트럼 거리는 식 (12)에 따라 획득될 수 있다. LSF 계수의 그룹 가중화 스펙트럼 거리가 제3 임계값 미만인 적어도 하나의 무음 프레임이 P개의 무음 프레임으로부터 선택된다. 그 후, 적어도 하나의 무음 프레임의 의 평균값이 제1 LSF 계수로서 사용될 수 있다. 예를 들어, 제1 LSF 계수(lsfSID(i))가 다음의 식 (13)에 따라 결정될 수 있고, i = 0, 1, ..., K'-1, 및 K'는 필터 차수이다:
Figure 112015116335223-pct00014
(13)
{A}는 적어도 하나의 무음 프레임을 제외하고 P개의 무음 프레임 내의 무음 프레임을 나타낼 수 있고, lsf[j](i)는 j번째 프레임의 1차 LSF 계수를 나타낼 수 있다.
게다가, 제3 임계값이 미리설정될 수 있다.
선택적으로, 또 다른 실시태양으로서, 도 4의 방법이 인코더에 의해 실행되는 때에, P개의 무음 프레임은 현재-입력 무음 프레임 및 현재-입력 무음 프레임 이전의 (P-1)개의 무음 프레임을 포함할 수 있다.
도 4의 방법이 디코더에 의해 실행되는 때에, P개의 무음 프레임은 P개의 행오버 프레임일 수 있다.
선택적으로, 또 다른 실시태양으로서, 도 4의 방법이 인코더에 의해 실행되는 때에, 인코더는 현재-입력 무음 프레임을 SID 프레임으로 인코딩할 수 있고, SID 프레임은 제1 스펙트럼 파라미터를 포함한다.
본원의 이 실시태양에서, 인코더는 현재-입력 프레임를 SID 프레임으로 인코딩하여, SID 프레임의 스펙트럼 파라미터가 다수의 무음 프레임의 스펙트럼 파라미터의 평균값이나 중간값을 획득함으로써 단순히 획득되는 것이 아니라, SID 프레임은 제1 스펙트럼 파라미터를 포함할 수 있으며, 이로써 SID 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈의 품질이 개선된다.
도 5는 본원의 또 다른 실시태양에 따른 신호 처리 방법의 간략한 흐름도이다. 도 5의 방법은 인코더나 디코더에 의해 실행될 수 있고, 예컨대 도 1의 인코더(110) 또는 디코더(120)에 의해 실행될 수 있다.
510: 입력 신호의 주파수 밴드를 R개의 서브대역으로 분할하고, R은 양의 정수이다.
520: R개의 서브대역의 각 서브대역 상에서, S개의 무음 프레임 내의 각 무음 프레임의 서브대역 그룹 스펙트럼 거리를 결정하고, S개의 무음 프레임 내의 각 무음 프레임의 서브대역 그룹 스펙트럼 거리는 각 서브대역 상에서의 S개의 무음 프레임 내의 각 무음 프레임과 다른 (S-1)개의 무음 프레임 사이의 스펙트럼 거리의 합계이며, S는 양의 정수이다.
530: 각 서브대역 상에서, S개의 무음 프레임 내의 각 무음 프레임의 서브대역 그룹 스펙트럼 거리에 따라 각 서브대역의 제1 스펙트럼 파라미터를 결정하고, 각 서브대역의 제1 스펙트럼 파라미터는 컴포트 노이즈를 생성하기 위해 사용된다.
본원의 이 실시태양에서, 각 서브대역의 그리고 컴포트 노이즈를 생성하기 위해 사용되는 제1 스펙트럼 파라미터가 S개의 무음 프레임 내의 각 무음 프레임의 서브대역 그룹 스펙트럼 거리에 따라 R개의 서브대역의 각 서브대역 상에서 결정된다. 컴포트 노이즈를 생성하기 위해 사용되는 스펙트럼 파라미터가 다수의 무음 프레임의 스펙트럼 파라미터의 평균값이나 중간값을 사용함으로써 단순히 획득되는 것이 아니다. 따라서, 컴포트 노이즈의 품질이 개선된다.
단계 530에서, 각 서브대역에 대하여, 각 서브대역의 각 무음 프레임의 서브대역 그룹 스펙트럼 거리는 S개의 무음 프레임 내의 각 무음 프레임의 스펙트럼 파라미터에 따라 결정될 수 있다. 선택적으로, 실시태양으로서, k번째 서브대역의 y번째 무음 프레임의 서브대역 그룹 스펙트럼 거리(ssdk [y])는 다음의 식 (14)에 따라 결정될 수 있고, k = 1, 2, ..., R이고, y = 0, 1, ..., S-1이다:
Figure 112015116335223-pct00015
(14)
L(k)는 k번째 서브대역에 포함되는 스펙트럼 파라미터의 계수의 양을 나타낼 수 있고, UK [y](i)는 k번째 서브대역 상의 y번째 무음 프레임의 스펙트럼의 i번째 계수를 나타낼 수 있고, UK [j](i)는 k번째 서브대역 상의 j번째 무음 프레임의 스펙트럼의 i번째 계수를 나타낼 수 있다.
예를 들어, 각 무음 프레임의 스펙트럼 파라미터는 LSF 계수, LSP 계수, ISF 계수, ISP 계수, LPC 계수, 반사 계수, FFT 계수, 또는 MDCT 계수, 또는 이와 유사한 것을 포함할 수 있다.
스펙트럼 파라미터가 LSF 계수인 실시예를 사용하여 이하 기술한다. 예를 들어, 각 무음 프레임의 LSF 계수의 서브대역 그룹 스펙트럼 거리가 결정될 수 있다. 각 서브대역은 하나의 LSF 계수를 포함하거나, 다수의 LSF 계수를 포함할 수도 있다. 예를 들어, k번째 서브대역 상의 y번째 무음 프레임의 LSF 계수의 서브대역 그룹 스펙트럼 거리(ssdk [y])는 다음의 식 (15)에 따라 결정될 수 있고, k = 1, 2, ..., R이고, y = 0, 1, ..., S-1이다:
Figure 112015116335223-pct00016
(15)
L(k)는 k번째 서브대역에 포함되는 LSF 계수의 양을 나타낼 수 있고, lsfK [y](i)는 k번째 서브대역 상의 y번째 무음 프레임의 i차 LSF 계수를 나타낼 수 있고, lsfK [j](i)는 k번째 서브대역 상의 j번째 무음 프레임의 i차 LSF 계수를 나타낼 수 있다.
대응적으로, 각 서브대역의 제1 스펙트럼 파라미터는 LSF 계수, LSP 계수, ISF 계수, ISP 계수, LPC 계수, 반사 계수, FFT 계수, 또는 MDCT 계수, 또는 이와 유사한 것을 포함할 수 있다.
선택적으로, 또 다른 실시태양으로서, 단계 530에서, 제1 무음 프레임이 S개의 무음 프레임으로부터 각 서브대역 상에서, 각 서브대역 상에서 S개의 무음 프레임내의 제1 무음 프레임의 서브대역 그룹 스펙트럼 거리가 최소가 되도록, 선택된다. 그 후, 각 서브대역 상의 제1 무음 프레임의 스펙트럼 파라미터가 각 서브대역의 제1 스펙트럼 파라미터로서 사용될 수 있다.
구체적으로, 인코더는 각 서브대역 상의 제1 무음 프레임을 결정할 수 있고, 서브대역의 제1 스펙트럼 파라미터로서 제1 무음 프레임의 스펙트럼 파라미터를 사용할 수 있다.
스펙트럼 파라미터가 LSF 계수인 실시예를 사용하여 이하 기술한다. 대응적으로, 각 서브대역의 제1 스펙트럼 파라미터는 각 서브대역의 제1 LSF 계수이다. 예를 들어, 각 서브대역 상의 각 무음 프레임의 LSF 계수의 서브대역 그룹 스펙트럼 거리가 식 (15)에 따라 결정될 수 있다. 각 서브대역에 대하여, 최소의 서브대역 그룹 스펙트럼 거리를 갖는 프레임의 LSF 계수가 서브대역의 제1 LSF 계수로서 선택될 수 있다.
선택적으로, 단계 530에서, 적어도 하나의 무음 프레임이 S개의 무음 프레임으로부터 각 서브대역 상에서, 적어도 하나의 무음 프레임의 서브대역 그룹 스펙트럼 거리가 제4 임계값 미만이 되도록 선택될 수 있다. 그 후, 각 서브대역의 제1 스펙트럼 파라미터가 적어도 하나의 무음 프레임의 스펙트럼 파라미터에 따라 각 서브대역 상에서 결정될 수 있다.
예를 들어, 실시태양에서, 각 서브대역 상의 S개의 무음 프레임 내의 적어도 하나의 무음 프레임의 스펙트럼 파라미터의 평균값이 각 서브대역의 제1 스펙트럼 파라미터라고 결정될 수 있다. 또 다른 실시태양에서, 각 서브대역의 S개의 무음 프레임 내의 적어도 하나의 무음 프레임의 스펙트럼 파라미터의 중간값이 각 서브대역의 제1 스펙트럼 파라미터라고 결정될 수 있다. 또 다른 실시태양에서, 각 서브대역의 제1 스펙트럼 파라미터가 본원의 또 다른 방법을 사용하여 적어도 하나의 무음 프레임의 스펙트럼 파라미터에 따라 결정될 수도 있다.
실시예로서, LSF 계수를 사용하여, 각 서브대역의 각 무음 프레임의 LSF 계의 LSF 계수의 서브대역 그룹 스펙트럼 거리가 식 (15)에 따라 결정될 수 있다. 각 서브대역에 대하여, 제4 임계값 미만인 적어도 하나의 무음 프레임이 결정될 수 있고, 적어도 하나의 무음 프레임의 LSF 계수의 평균값이 서브대역의 제1 LSF 계수라고결정될 수 있다. 제4 임계값이 미리설정된다.
선택적으로, 또 다른 실시태양으로서, 도 5의 방법이 인코더에 의해 실행될 때, S개의 무음 프레임은 현재-입력 무음 프레임 및 현재-입력 무음 프레임 이전의 (S-1)개의 무음 프레임을 포함한다.
도 5의 방법이 디코더에 의해 실행될 때, S개의 무음 프레임이 S개의 행오버 프레임일 수 있다.
선택적으로, 또 다른 실시태양으로서, 도 5의 방법이 인코더에 의해 실행될 때, 인코더는 현재-입력 무음 프레임을 SID 프레임으로 인코딩할 수 있고, SID 프레임은 각 서브대역의 제1 스펙트럼 파라미터를 포함한다.
본원의 이 실시태양에서, SID 프레임으로 인코딩 시에, 인코더는 SID 프레임이 각 서브대역의 제1 스펙트럼 파라미터를 포함하는 것을 가능하게 하고, 다수의 무음 프레임의 스펙트럼 파라미터의 평균값이나 중간값을 단순히 획득함으로서 SID 프레임의 스펙트럼 파라미터가 획득되는 것이 아니다. 따라서, SID 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈의 품질을 개선할 수 있다.
도 6은 본원의 또 다른 실시태양에 따른 신호 처리 방법의 간략적 흐름도이다. 도 6의 방법은 인코더나 디코더에 의해 실행되고, 예컨대 도 1의 인코더(110)나 디코더(120)에 의해 실행된다.
610: T개의 무음 프레임 내의 각 무음 프레임의 제1 파라미터를 결정하고, 제1 파라미터는 스펙트럼 엔트로피를 나타내기 위해 사용되고, T는 양의 정수이다.
예를 들어, 모음 프레임의 스펙트럼 엔트로피가 직접 결정되는 경우에, 제1 파라미터는 스펙트럼 엔트로피일 수 있다. 일부 경우에, 엄격한 정의에 따르는 스펙트럼 엔트로피는 바로 결정될 수 없고, 이 경우에, 제1 파라미터가 스펙트럼 엔트로피를 나타낼 수 있는 또 다른 파라미터, 예컨대 스펙트럼의 구조적 강도를 반영할 수 있는 파라미터 또는 이와 유사한 것일 수 있다.
예를 들어, 각 무음 프레임의 제1 파라미터가 각 무음 프레임의 LSF 계수에 따라 결정될 수 있다. 예를 들어, z번째 무음 프레임의 제1 파라미터는 다음의 식 (16)에 따라 결정될 수 있고, z = 1, 2, ..., T이다:
Figure 112015116335223-pct00017
(16)
K는 필터 차수이다.
여기서, C는 스펙트럼의 구조적 강도를 반영할 수 있는 파라미터이고, 스펙트럼 엔트로피의 정의에 엄격하게 부합하지는 않는다. 더 큰 C는 더 작은 스펙트럼 엔트로피를 지시할 수 있다.
620: T개의 무음 프레임 내의 각 무음 프레임의 제1 파라미터에 따라 제1 스펙트럼 파라미터를 결정하고, 제1 스펙트럼 파라미터는 컴포트 노이즈를 생성하기 위해 사용된다.
본원의 이 실시태양에서, 컴포트 노이즈를 생성하기 위해 사용되는 제1 스펙트럼 파라미터는 T개의 무음 프레임의 그리고 스펙트럼 엔트로피를 나타내기 위해 사용되는 제1 파라미터에 따라 결정되고, 컴포트 노이즈를 생성하기 위해 사용되는 스펙트럼 파라미터가 다수의 무음 프레임의 스펙트럼 파라미터의 평균값 또는 중간값을 획득함으로써 단순히 획득되는 것이 아니다. 따라서, 컴포트 노이즈의 품질을 개선할 수 있다.
선택적으로, 일 실시태양으로서, T개의 무음 프레임이 클러스터링 기준에 따라 제1 그룹의 무음 프레임과 제2 그룹의 무음 프레임으로 분류될 수 있다고 결정되는 경우에, 제1 그룹의 무음 프레임의 스펙트럼 파라미터에 따라 제1 스펙트럼 파라미터를 결정하며, 제1 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피가 제2 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피보다 크며; T개의 무음 프레임이 클러스터링 기준에 따라 제1 그룹의 무음 프레임과 제2 그룹의 무음 프레임으로 분류될 수 없다고 결정되는 경우에, 제1 스펙트럼 파라미터를 결정하도록, T개의 무음 프레임의 스펙트럼 파라미터에 대한 가중화된 평균화를 수행하고, 제1 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피가 제2 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피보다 크다.
일반적으로, 공통 노이즈 스펙트럼은 비교적 빈약한 구조적 강도를 가지고, 반면에, 비-노이즈 신호 스펙트럼, 또는 단기 컴포넌트를 포함하는 노이즈 스펙트럼은 비교적 강한 구조적 강도를 가진다. 스펙트럼의 구조적 강도는 스펙트럼 엔트로피의 크기와 바로 대응된다. 상대적으로, 공통 노이즈의 스펙트럼 엔트로피는 비교적 클 수 있지만, 비-노이즈 신호, 또는 단기 컴포넌트를 포함하는 노이즈의 스펙트럼 엔트로피가 비교적 작을 수 있다. 그러므로, T개의 무음 프레임이 제1 그룹의 무음 프레임과 제2 그룹의 무음 프레임으로 분류될 수 있는 경우에, 인코더는 무음 프레임의 스펙트럼 엔트로피에 따라, 단기 컴포넌트를 포함하지 않는 제1 그룹의 무음 프레임의 스펙트럼 파라미터를 선택하여, 제1 스펙트럼 파라미터를 결정할 수 있다.
예를 들어, 이 실시태양에서, 제1 그룹의 무음 프레임의 스펙트럼 파라미터의 평균값이 제1 스펙트럼 파라미터라고 결정될 수 있다. 또 다른 실시태양에서, 제1 그룹의 무음 프레임의 스펙트럼 파라미터의 중간값이 제1 스펙트럼 파라미터라고 결정될 수 있다. 또 다른 실시태양에서, 제1 스펙트럼 파라미터는 본원의 또 다른 방법을 사용하여 제1 그룹의 무음 프레임의 스펙트럼 파라미터에 따라 결정될 수도 있다.
T개의 무음 프레임이 클러스터링 기준에 따라 제1 그룹의 무음 프레임과 제2 그룹의 무음 프레임으로 분류될 수 있다고 결정되면, 제1 스펙트럼 파라미터를 획득하기 위해 T개의 무음 프레임의 스펙트럼 파라미터에 대하여 가중화된 평균화가 수행된다.
선택적으로, 또 다른 실시태양으로서, 클러스터링 기준은 제1 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제1 평균값 사이의 거리가 제1 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제2 평균값 사이의 거리 이하이고; 제2 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제2 평균값 사이의 거리가 제2 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제1 평균값 사이의 거리 이하이고; 제1 평균값과 제2 평균값 사이의 거리가 제1 그룹의 무음 프레임의 제1 파라미터와 제1 평균값 사이의 평균 거리를 초과하고; 제1 평균값과 제2 평균값 사이의 거리가 제2 그룹의 무음 프레임의 제1 파라미터와 제2 평균값 사이의 평균 거리를 초과하는 것을 포함하며,
삭제
이때 제1 평균값은 제1 그룹의 무음 프레임의 제1 파라미터의 평균값이고, 제2 평균값은 제2 그룹의 무음 프레임의 제1 파라미터의 평균값이다.
선택적으로, 또 다른 실시태양으로서, 인코더는 제1 스펙트럼 파라미터를 결정하도록, T개의 무음 프레임의 스펙트럼 파라미터에 대한 가중화된 평균화를 수행하며, T개의 무음 프레임 내에서, 상이한 i번째 무음 프레임과 j번째 무음 프레임에 대하여, i번째 무음 프레임에 대응하는 가중 계수는 j번째 무음 프레임에 대응하는 가중 계수 이상이며, 제1 파라미터가 스펙트럼 엔트로피와 양으로 상관될 때, i번째 무음 프레임의 제1 파라미터가 j번째 무음 프레임의 제1 파라미터를 초과하고, 제1 파라미터가 스펙트럼 엔트로피와 음으로 상관될 때, i번째 무음 프레임의 제1 파라미터가 j번째 무음 프레임의 제1 파라미터 미만이고, i와 j 둘 다 양의 정수이며, 1≤i≤T이고, 1≤j≤T인, 단계를 포함한다.
구체적으로, 인코더는 제1 스펙트럼 파라미터를 획득하도록 T개의 무음 프레임의 스펙트럼 파라미터에 대하여 가중화된 평균화를 수행할 수 있다. 전술한 바와 같이,
공통 노이즈의 스펙트럼 엔트로피는 비교적 클 수 있지만, 비-노이즈 신호, 또는 단기 컴포넌트를 포함하는 노이즈의 스펙트럼 엔트로피가 비교적 작을 수 있다. 그러므로, T개의 무음 프레임에서,비교적 큰 스펙트럼 엔트로피를 갖는 무음 프레임에 대응하는 가중 계수는 비교적 작은 스펙트럼 엔트로피를 갖는 무음 프레임에 대응하는 가중 계수 이상일 수 있다.
선택적으로, 또 다른 실시태양으로서, 도 6의 방법은 인코더에 의해 실행되고, T개의 무음 프레임은 현재-입력 무음 프레임 및 현재-입력 무음 프레임 이전의 (T-1)개의 무음 프레임을 포함한다.
도 6의 방법이 디코더에 의해 실행될 때, T개의 무음 프레임은 T개의 행오버 프레임일 수 있다.
선택적으로, 도 6의 방법이 인코더에 의해 실행될 때, 인코더는 현재-입력 무음 프레임을 SID 프레임으로 인코딩할 수 있고, SID 프레임은 각 서브대역의 제1 스펙트럼 파라미터를 포함한다.
본원의 이 실시태양에서, SID 프레임으로 인코딩 시에, 인코더는 SID 프레임이 각 서브대역의 제1 스펙트럼 파라미터를 포함하는 것을 가능하게 하나, 다수의 무음 프레임의 스펙트럼 파라미터의 평균값이나 중간값을 단순히 획득함으로서 SID 프레임의 스펙트럼 파라미터가 획득되는 것이 아니다. 따라서, SID 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈의 품질을 개선할 수 있다.
도 7은 본원의 본원의 실시태양에 따른 신호 인코딩 디바이스의 간략한 블록도이다. 도 7의 장치(700)의 실시예는 인코더, 예컨대 도 1의 인코더(110)이다. 장치(700)은 제1 결정 유닛(710), 제2 결정 유닛(720), 제3 결정 유닛(730) 및 인코딩 유닛(740)을 포함한다.
제1 결정 유닛(710)은 현재-입력 프레임의 이전 프레임의 인코딩 방식이 연속 인코딩 방식일 경우에는, 현재-입력 프레임이 SID 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈를 예측하고, 현재-입력 프레임은 무음 프레임이다.
제2 결정 유닛(720)은 제1 결정 유닛(710)에 의해 결정된 컴포트 노이즈와 제1 결정 유닛(710)에 의해 결정된 실제 무음 신호 사이의 편차도를 결정한다. 제3 결정 유닛(730)은 제2 결정 유닛에 의해 결정된 편차도에 따라 현재-입력 프레임의 인코딩 방식을 결정하며, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식 또는 SID 프레임 인코딩 방식을 포함한다. 인코딩 유닛(740)은 제3 결정 유닛(730)에 의해 결정된 현재-입력 프레임의 인코딩 방식에 따라 현재-입력 프레임을 인코딩한다.
본원의 실시태양에서, 현재-입력 프레임의 이전 프레임의 인코딩 방식이 불연속 인코딩 방식일 경우에는, 현재-입력 프레임이 SID 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈를 예측하고, 컴포트 노이즈와 실제 무음 신호 사이의 편차도가 결정되며, 편차도에 따라, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식 또는 SID 프레임 인코딩 방식이라고 결정한다. 현재-입력 프레임이 유음 프레임의, 통계 수집을 통해 획득되는 양에 따라 단순히 행오버 프레임으로 인코딩되는 것이 아니다. 따라서, 통신 대역폭을 절약한다.
선택적으로, 일 실시태양으로서, 제1 결정 유닛(710)은 컴포트 노이즈의 특징 파라미터를 예측하고, 실제 무음 신호의 특징 파라미터를 결정하며, 상기 컴포트 노이즈의 특징 파라미터는 실제 무음 신호의 특징 파라미터에 1 대 1 대응관계에 있다. 제2 결정 유닛(720)은 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리를 결정할 수 있다.
선택적으로, 또 다른 실시태양으로서, 제3 결정 유닛(730)가 결정되며,
컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 미만인 경우에, 현재-입력 프레임의 인코딩 방식이 SID 프레임 인코딩 방식이라고 결정하며, 상기 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리는 임계 설정에서의 임계값과 1 대 1 대응관계에 있다. 제3 결정 유닛(730)는, 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 이상인 경우에, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정할 수 있다.
선택적으로, 또 다른 실시태양으로서, 컴포트 노이즈의 특징 파라미터는 다음의 정보 중 적어도 하나를 나타내기 위해 사용된다: 에너지 정보 및 스펙트럼 정보.
선택적으로, 또 다른 실시태양으로서, 에너지 정보는 CELP 여기 에너지를 포함한다. 스펙트럼 정보는 다음 중 적어도 하나를 포함한다: 선형 예측 필터 계수, FFT 계수, 및 MDCT 계수.
선형 예측 필터 계수 다음 중 적어도 하나를 포함한다: LSF 계수, LSP 계수, ISF 계수, ISP 계수, 반사 계수, LPC 계수.
선택적으로, 또 다른 실시태양으로서, 제1 결정 유닛(710)은, 현재-입력 프레임의 이전 프레임의 컴포트 노이즈 파라미터 및 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측한다. 대안으로, 제1 결정 유닛(710)는 현재-입력 프레임 이전의 L개의 행오버 프레임의 특징 파라미터 및 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측하며, L은 양의 정수이다.
선택적으로, 또 다른 실시태양으로서, 제1 결정 유닛(710)은 현재-입력 프레임의 특징 파라미터가 실제 무음 신호의 특징 파라미터라는 것을 결정할 수 있다. 대안으로, 제1 결정 유닛(710)은 실제 무음 신호의 특징 파라미터를 결정하기 위해, M개의 무음 프레임의 특징 파라미터에 대한 통계를 수집할 수 있다.
선택적으로, 또 다른 실시태양으로서, M개의 무음 프레임은 현재-입력 프레임 및 상기 현재-입력 프레임 이전의 (M-1)개의 무음 프레임을 포함하고, M은 양의 정수이다.
선택적으로, 또 다른 실시태양으로서, 컴포트 노이즈의 특징 파라미터는 컴포트 노이즈의 코드 여기된 선형 예측(CELP) 여기 에너지 및 컴포트 노이즈의 선 스펙트럼 주파수(LSF) 계수를 포함하고, 실제 무음 신호의 특징 파라미터는 실제 무음 신호의 CELP 여기 에너지 및 실제 무음 신호의 LSF 계수를 포함한다. 제2 결정 유닛(720)은 컴포트 노이즈의 CELP 여기 에너지와 실제 무음 신호의 CELP 여기 에너지 사이의 거리 De를 결정하고, 컴포트 노이즈의 LSF 계수와 실제 무음 신호의 LSF 계수 사이의 거리 Dlsf를 결정한다.
선택적으로, 또 다른 실시태양으로서, 거리 De가 제1 임계값 미만이고, 거리 Dlsf가 제2 임계값 미만인 경우에, 제3 결정 유닛(730)은 현재-입력 프레임의 인코딩 방식이 SID 프레임 인코딩 방식이라고 결정할 수 있다. 거리 De가 제1 임계값 이상이고, 거리 Dlsf가 제2 임계값 이상인 경우에, 제3 결정 유닛(730)은 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정하는 단계를 포함한다.
선택적으로, 또 다른 실시태양으로서, 장치(700)가 제4 결정 유닛(750)을 더 포함할 수 있다. 제4 결정 유닛(750)은 미리설정된 제1 임계값과 미리설정된 제2 임계값을 획득할 수 있다. 대안으로, 제4 결정 유닛(750)은 현재-입력 프레임 이전의 N개의 무음 프레임의 CELP 여기 에너지에 따라 제1 임계값을 결정하고, N개의 무음 프레임의 LSF 계수에 따라 제2 임계값을 결정할 수 있고, 이 때 N은 양의 정수이다.
선택적으로, 또 다른 실시태양으로서, 제1 결정 유닛(710)은 제1 예측 방식으로 컴포트 노이즈를 예측할 수 있고, 제1 예측 방식은 디코더가 컴포트 노이즈를 생성하는 방식과 동일하다.
장치(700)의 다른 기능 및 동작에 대하여, 전술한 도 1 내지 도 3b의 방법 실시태양의 프로세스를 참조할 수 있다. 반복을 피하기 위하여 여기에 상세히 기술하지는 않는다.
도 8은 본원의 또 다른 실시태양에 따른 신호 처리 장치의 간략한 블록도이다. 도 8의 장치(800)의 실시예는 인코더나 디코더이며, 예컨대 도 1의 인코더(110)나 디코더(120)이다. 장치(800)는 제1 결정 유닛(810) 및 제2 결정 유닛(820)을 포함한다.
제1 결정 유닛(810)은 P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리를 결정하며, P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리는 P개의 무음 프레임 내의 각 무음 프레임과 다른 (P-1)개의 무음 프레임 사이의 가중화 스펙트럼 거리의 합계이고, P는 양의 정수이다. 제2 결정 유닛(820)은 P개의 무음 프레임 내의 각 무음 프레임의, 제1 결정 유닛(810)에 의해 결정된, 그룹 가중화 스펙트럼 거리에 따라 제1 스펙트럼 파라미터를 결정하며, 제1 스펙트럼 파라미터가 컴포트 노이즈를 생성하기 위해 사용된다.
본원의 이 실시태양에서, 컴포트 노이즈를 생성하기 위해 사용되는 제1 스펙트럼 파라미트가 P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리에 따라 결정된다. 컴포트 노이즈를 생성하기 위해 사용되는 스펙트럼 파라미터가 단순히 다수의 무음 프레임의 스펙트럼 파라미터의 평균값 또는 중간값을 획득함으로써 획득되는 것이 아니다. 따라서, 컴포트 노이즈의 품질을 개선할 수 있다.
선택적으로, 일 실시태양으로서, 각 무음 프레임은 가중 계수의 하나의 그룹에 대응하고, 가중 계수의 하나의 그룹에서, 서브대역 중 제1 그룹에 대응하는 가중 계수가 서브대역 중 제2 그룹에 대응하는 가중 계수보다 크고, 서브대역 중 제1 그룹의 지각적 중요도는 서브대역 중 제2 그룹의 지각적 중요도보다 크다.
선택적으로, 또 다른 실시태양으로서, 제2 결정 유닛(820)은 P개의 무음 프레임에서의 제1 무음 프레임의 그룹 가중화 스펙트럼 거리가 최소가 되도록, P개의 무음 프레임으로부터 제1 무음 프레임을 선택하고, 제1 무음 프레임의 스펙트럼 파라미터가 제1 스펙트럼 파라미터라고 결정한다.
선택적으로, 또 다른 실시태양으로서, 제2 결정 유닛(820)은 P개의 무음 프레임에서의 적어도 하나의 무음 프레임의 그룹 가중화 스펙트럼 거리가 제3 임계값 미만이 되도록, P개의 무음 프레임으로부터 적어도 하나의 무음 프레임을 선택하고, 적어도 하나의 무음 프레임의 스펙트럼 파라미터에 따라 제1 스펙트럼 파라미터를 결정한다.
선택적으로, 또 다른 실시태양으로서, 장치(800)가 인코더이고, 장치(800)는 인코딩 유닛(830)을 더 포함한다.
P개의 무음 프레임은 현재-입력 무음 프레임 및 상기 현재-입력 무음 프레임 이전의 (P-1)개의 무음 프레임을 포함한다. 인코딩 유닛(830)은 현재-입력 무음 프레임을 SID 프레임으로 인코딩하며, SID 프레임은 제2 결정 유닛(820)에 의해 결정되는 제1 스펙트럼 파라미터를 포함한다.
장치(800)의 다른 기능과 동작에 대하여, 전술한 도 4의 방법 실시태양의 프로세스를 참조할 수 있고, 중복을 피하기 위해 여기에 추가의 기술은 하지 않는다.
도 9는 본원의 또 다른 실시태양에 따른 신호 처리 장치의 간략한 블록도이다. 도 9의 장치(900)의 실시예는 인코더나 디코더이며, 즉, 도 1의 인코더(110) 또는 디코더(120)이다. 장치(900)는 분할 유닛(910), 제1 결정 유닛(920) 및 제2 결정 유닛(930)을 포함한다.
분할 유닛(910)은 입력 신호의 주파수 대역을 R개의 서브대역으로 분할하며, R이 양의 정수이다. 제1 결정 유닛(920)은, 분할 유닛(910)이 분할을 수행한 후에 획득되는 R개의 서브대역의 각 서브대역 상에서, S개의 무음 프레임에서의 각 무음 프레임의 서브대역 그룹 스펙트럼 거리를 결정하며, S개의 무음 프레임에서의 각 서브대역 그룹 스펙트럼 거리는 각 서브대역 상의 S개의 무음 프레임 내의 각 무음 프레임과 다른 (S-1)개의 무음 프레임 사이의 스펙트럼 거리의 합계이고, S가 양의 정수이다. 제2 결정 유닛(930)은 각 서브대역 상에서, S개의 무음 프레임에서의 각 무음 프레임의, 제1 결정 유닛(920)에 의해 결정된 스펙트럼 거리에 따라 각 서브대역의 제1 스펙트럼 파라미터를 결정하며, 각 서브대역의 제1 스펙트럼 파라미터가 컴포트 노이즈를 생성하기 위해 사용된다.
본원의 이 실시태양에서, 각 서브대역의 그리고 컴포트 노이즈를 생성하기 위해 사용되는 스펙트럼 파라미터가 S개의 무음 프레임 내의 각 무음 프레임의 스펙트럼 거리에 따라 R개의 서브대역의 각 서브대역 상에서 결정된다. 단순히 컴포트 노이즈를 생성하기 위해 사용되는 스펙트럼 파라미터가 다수의 무음 프레임의 스펙트럼 파라미터의 평균값이나 중간값을 사용함으로써 획득되는 것이 아니다. 따라서, 컴포트 노이즈의 품질이 개선된다.
선택적으로, 일 실시태양으로서, 제2 결정 유닛(930)은 각 서브대역 상의 S개의 무음 프레임에서의 제1 무음 프레임의 서브대역 그룹 스펙트럼 거리가 최소가 되도록, 각 서브대역 상에서, S개의 무음 프레임으로부터 제1 무음 프레임을 선택하고, 각 서브대역 상에서, 제1 무음 프레임의 스펙트럼 파라미터가 각 서브대역의 제1 스펙트럼 파라미터라고 결정할 수 있다.
선택적으로, 또 다른 실시태양으로서, 제2 결정 유닛(930)이, 적어도 하나의 무음 프레임의 서브대역 그룹 스펙트럼 거리가 제4 임계값 미만이 되도록, 각 서브대역 상에서 S개의 무음 프레임으로부터 적어도 하나의 무음 프레임을 선택하고, 각 서브대역 상에서, 적어도 하나의 무음 프레임의 스펙트럼 파라미터에 따라, 각 서브대역의 제1 스펙트럼 파라미터를 결정할 수 있다.
선택적으로, 또 다른 실시태양으로서, 장치(900)가 인코더인 경우에 장치(900)가 인코딩 유닛(940)을 더 포함할 수 있다.
S개의 무음 프레임이 현재-입력 무음 프레임 및 현재-입력 무음 프레임 이전의 (S-1)개의 무음 프레임을 포함한다. 인코딩 유닛(940)이 현재-입력 무음 프레임을 SID 프레임으로 인코딩하고, SID 프레임은 각 서브대역의 제1 스펙트럼 파라미터를 포함한다.
장치(900)의 다른 기능 및 동작에 대하여, 전술한 도 5의 방법 실시태양의 프로세스를 참조할 수 있다. 반복을 피하기 위하여, 여기에 추가의 기재는 하지 않는다.
도 10는 본원의 또 다른 실시태양에 따른 신호 처리 장치의 간략한 블록도이다. 도 10의 장치(1000)의 실시예는 인코더나 디코더이며, 예를 들어, 도 1의 인코더(110)나 디코더(120)이다. 장치(1000)은 제1 결정 유닛(1010) 및 제2 결정 유닛(1020)을 포함한다.
제1 결정 유닛(1010)은 T개의 무음 프레임 내의 각 무음 프레임의 제1 파라미터를 결정하며, 제1 파라미터는 스펙트럼 엔트로피를 나타내기 위해 사용되고 T는 양의 정수이다. 제2 결정 유닛(1020)은 T개의 무음 프레임 내의 각 무음 프레임의, 제1 결정 유닛(1010)에 의해 결정된 제1 파라미터에 따라 제1 스펙트럼 파라미터를 결정하며, 제1 스펙트럼 파라미터가 컴포트 노이즈를 생성하기 위해 사용된다.
본원의 이 실시태양에서, 컴포트 노이즈를 생성하기 위해 사용되는 제1 스펙트럼 파라미터가 T개의 무음 프레임의 그리고 스펙트럼 엔트로피를 나타내기 위해 사용되는 제1 파라미터에 따라 결정된다. 컴포트 노이즈를 생성하기 위해 사용되는 스펙트럼 파라미터가 다수의 무음 프레임의 스펙트럼 파라미터의 평균값이나 중간값을 획득함으로써 단순히 획득되는 것이 아니다. 따라서, 컴포트 노이즈의 품질이 개선된다.
선택적으로, 일 실시태양으로서, 제2 결정 유닛(1020)이, T개의 무음 프레임이 클러스터링 기준에 따라 제1 그룹의 무음 프레임과 제2 그룹의 무음 프레임으로 분류될 수 있다고 결정되는 경우에, 제1 그룹의 무음 프레임의 스펙트럼 파라미터에 따라 제1 스펙트럼 파라미터를 결정하며, 제1 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피가 제2 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피보다 크고; T개의 무음 프레임이 클러스터링 기준에 따라 제1 그룹의 무음 프레임과 제2 그룹의 무음 프레임으로 분류될 수 없다고 결정되는 경우에, 제1 스펙트럼 파라미터를 결정하도록, T개의 무음 프레임의 스펙트럼 파라미터에 대한 가중화된 평균화를 수행하며, 제1 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피가 제2 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피보다 크다.
선택적으로, 또 다른 실시태양으로서, 클러스터링 기준은, 제1 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제1 평균값 사이의 거리가 제1 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제2 평균값 사이의 거리 이하이고; 제2 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제2 평균값 사이의 거리가 제2 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제1 평균값 사이의 거리 이하이고; 제1 평균값과 제2 평균값 사이의 거리가 제1 그룹의 무음 프레임의 제1 파라미터와 제1 평균값 사이의 평균 거리를 초과하고; 제1 평균값과 제2 평균값 사이의 거리가 제2 그룹의 무음 프레임의 제1 파라미터와 제2 평균값 사이의 평균 거리를 초과하는 것을 포함하며,
이때 제1 평균값은 제1 그룹의 무음 프레임의 제1 파라미터의 평균값이고, 제2 평균값은 제2 그룹의 무음 프레임의 제1 파라미터의 평균값이다.
선택적으로, 또 다른 실시태양으로서, 제2 결정 유닛(1020)은,
제1 스펙트럼 파라미터를 결정하도록, T개의 무음 프레임의 스펙트럼 파라미터에 대한 가중화된 평균화를 수행하며, T개의 무음 프레임 내에서, 상이한 i번째 무음 프레임과 j번째 무음 프레임에 대하여, i번째 무음 프레임에 대응하는 가중 계수는 j번째 무음 프레임에 대응하는 가중 계수 이상이며, 제1 파라미터가 스펙트럼 엔트로피와 양으로 상관될 때, i번째 무음 프레임의 제1 파라미터가 j번째 무음 프레임의 제1 파라미터를 초과하고, 제1 파라미터가 스펙트럼 엔트로피와 음으로 상관될 때, i번째 무음 프레임의 제1 파라미터가 j번째 무음 프레임의 제1 파라미터 미만이고, i와 j 둘 다 양의 정수이며, 1≤i≤T이고, 1≤j≤T이다.
선택적으로, 또 다른 실시태양으로서, 장치(1000)가 인코더이며, 장치(1000)는 인코딩 유닛(1030)을 더 포함한다.
T개의 무음 프레임은 현재-입력 무음 프레임 및 현재-입력 무음 프레임 이전의 (T-1)개의 무음 프레임을 포함한다. 인코딩 유닛(1030)은 현재-입력 무음 프레임을 무음 기술(SID) 프레임으로 인코딩할 수 있고, SID 프레임 제1 스펙트럼 파라미터를 포함한다.
장치(1000)의 다른 기능 및 동작에 대하여, 전술한 도 6의 방법 실시태양의 프로세스를 참조할 수 있다. 반복을 방지하기 위하여, 여기서 추가로 기재하지는 않는다.
도 11은 본원의 또 다른 실시태양에 따른 신호 인코딩 장치의 간략한 블록도이다. 도 11의 장치(1100)의 예는 인코더이다. 장치(1100)는 메모리(1110)와 프로세서(1120)를 포함한다.
메모리(1110)는 랜덤 액세스 메모리, 플래시 메모리, 판독 전용 메모리, 프로그램형 판독 전용 메모리, 비휘발성 메모리, 또는 레지스터를 포함할 수 있다. 프로세서(1120)는 중앙 처리 장치(Central Processing Unit, CPU)일 수 있다.
메모리(1110)는 실행가능 명령어를 저장하도록 구성된다. 프로세서(1120)는: 현재-입력 프레임의 이전 프레임의 인코딩 방식이 연속 인코딩 방식인 경우에, 현재-입력 프레임이 SID 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈를 예측하고, 실제 무음 신호를 결정하도록 하고 - 현재-입력 프레임은 무음 프레임임 -; 컴포트 노이즈와 실제 무음 신호 사이의 편차도를 결정하도록 하고; 편차도에 따라 현재-입력 프레임의 인코딩 방식을 결정하도록 하고 - 상기 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식 또는 SID 프레임 인코딩 방식을 포함함 -; 현재-입력 프레임의 인코딩 방식에 따라 현재-입력 프레임을 인코딩하도록 하는, 메모리(1110) 내에 저장되는 실행가능 명령어를 실행할 수 있다.
본원의 이 실시태양에서, 현재-입력 프레임의 이전 프레임의 인코딩 방식이 연속 인코딩 방식인 경우에, 현재-입력 프레임이 SID 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈가 예측되고,
실제 무음 신호를 결정하는 단계는: 컴포트 노이즈의 특징 파라미터를 예측하고, 실제 무음 신호의 특징 파라미터를 결정하는 단계를 포함하며, 컴포트 노이즈와 실제 무음 신호 사이의 편차도가 결정되고, 현재-입력 프레임이, 유음 프레임의, 통계 수집을 통해 획득되는 양에 따라 단순히 행오버 프레임으로 인코딩된다는 것이 아니라, 편차도에 따라, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식 또는 SID 프레임 인코딩 방식이라고 결정된다. 따라서, 통신 대역폭이 절약된다.
선택적으로, 일 실시태양으로서, 프로세서(1120)는, 컴포트 노이즈의 특징 파라미터를 예측하고, 실제 무음 신호의 특징 파라미터를 결정하며, 컴포트 노이즈의 특징 파라미터는 실제 무음 신호의 특징 파라미터와 1 대 1 대응관계에 있다. 프로세서(1120) 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리를 결정한다.
선택적으로, 또 다른 실시태양으로서, 프로세서(1120)는
컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 미만인 경우에, 현재-입력 프레임의 인코딩 방식이 SID 프레임 인코딩 방식이라고 결정하고, 상기 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리는 임계 설정에서의 임계값과 1 대 1 대응관계에 있다. 프로세서(1120)는 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 이상인 경우에, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정할 수 있다.
선택적으로, 또 다른 실시태양으로서, 컴포트 노이즈의 특징 파라미터는 다음의 정보 중 적어도 하나를 나타내기 위해 사용된다: 에너지 정보 및 스펙트럼 정보.
선택적으로, 또 다른 실시태양으로서, 에너지 정보는 CELP 여기 에너지를 포함할 수 있다. 스펙트럼 정보는 선형 예측 필터 계수, FFT 계수, 및 MDCT 계수 중 적어도 하나를 포함할 수 있다. 선형 예측 필터 계수는 LSF 계수, LSP 계수, ISF 계수, ISP 계수, 반사 계수, 및 LPC 계수 중 적어도 하나를 포함할 수 있다.
선택적으로, 또 다른 실시태양으로서, 프로세서(1120)는 현재-입력 프레임의 이전 프레임의 컴포트 노이즈 파라미터와 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측할 수 있다. 대안으로, 프로세서(1120)는 현재-입력 프레임의 이전의 L개의 행오버 프레임의 특징 파라미터와 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측할 수 있다.
선택적으로, 또 다른 실시태양으로서, 프로세서(1120)가 현재-입력 프레임의 특징 파라미터가 실제 무음 신호의 파라미터라는 것을 결정할 수 있다. 대안으로, 프로세서(1120)는 실제 무음 신호의 특징 파라미터를 결정하기 위해, M개의 무음 프레임의 특징 파라미터에 대한 통계를 수집할 수 있다.
선택적으로, 또 다른 실시태양으로서, M개의 무음 프레임은 현재-입력 프레임 및 상기 현재-입력 프레임 이전의 (M-1)개의 무음 프레임을 포함하고, M은 양의 정수이다.
선택적으로, 또 다른 실시태양으로서, 컴포트 노이즈의 특징 파라미터는 컴포트 노이즈의 코드 여기된 선형 예측(CELP) 여기 에너지 및 컴포트 노이즈의 선 스펙트럼 주파수(LSF) 계수를 포함하고, 실제 무음 신호의 특징 파라미터는 실제 무음 신호의 CELP 여기 에너지 및 실제 무음 신호의 LSF 계수를 포함한다. 프로세서(1120)는 컴포트 노이즈의 CELP 여기 에너지와 실제 무음 신호의 CELP 여기 에너지 사이의 거리 De를 결정하고, 컴포트 노이즈의 LSF 계수와 실제 무음 신호의 LSF 계수 사이의 거리 Dlsf를 결정한다.
선택적으로, 또 다른 실시태양으로서, 거리 De가 제1 임계값 미만이고, 거리 Dlsf가 제2 임계값 미만인 경우에, 프로세서(1120)는 현재-입력 프레임의 인코딩 방식이 SID 프레임 인코딩 방식이라고 결정할 수 있다. 거리 De가 제1 임계값 이상이고, 거리 Dlsf가 제2 임계값 이상인 경우에, 프로세서(1120)는 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정하는 단계를 포함한다.
선택적으로, 또 다른 실시태양으로서, 프로세서(1120)가 미리설정된 제1 임계값과 미리설정된 제2 임계값을 더 획득할 수 있다. 대안으로, 프로세서(1120)는 현재-입력 프레임 이전의 N개의 무음 프레임의 CELP 여기 에너지에 따라 제1 임계값을 더 결정하고, N개의 무음 프레임의 LSF 계수에 따라 제2 임계값을 더 결정할 수 있고, 이 때 N은 양의 정수이다.
선택적으로, 또 다른 실시태양으로서, 제1 프로세서(1120)는 제1 예측 방식으로 컴포트 노이즈를 예측할 수 있고, 제1 예측 방식은 디코더가 컴포트 노이즈를 생성하는 방식과 동일하다.
장치(1000)의 다른 기능과 동작에 대하여, 전술한 도 1 내지 도 3b의 방법 실시태양의 프로세스를 참조할 수 있다. 반복을 피하기 위하여 여기에 상세히 기술하지는 않는다.
도 12는 본원의 또 다른 실시태양에 따른 신호 처리 장치의 간략한 블록도이다. 도 12의 장치(1200)의 실시예는 인코더나 디코더이며, 예컨대 도 1의 인코더(110)나 디코더(120)이다. 장치(1200)는 메모리(1210) 및 프로세서(1220)를 포함한다.
메모리(1210)은 랜덤 액세스 메모리, 플래시 메모리, 판독 전용 메모리, 프로그램형 판독 전용 메모리, 비휘발성 메모리, 또는 레지스터를 포함할 수 있다. 프로세서(1220)는 CPU일 수 있다.
메모리(1210)는 실행가능한 명령어를 저장하도록 구성된다. 프로세서(1220)는, P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리를 결정하도록 하고 - P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리는 P개의 무음 프레임 내의 각 무음 프레임과 다른 (P-1)개의 무음 프레임 사이의 가중화 스펙트럼 거리의 합계이고, P는 양의 정수임 -; P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리에 따라 제1 스펙트럼 파라미터를 결정하도록 하는 - 제1 스펙트럼 파라미터가 컴포트 노이즈를 생성하기 위해 사용됨 - 메모리(1210)에 저장되는 실행가능한 명령어를 실행할 수 있다.
본원의 이 실시태양에서, 컴포트 노이즈를 생성하기 위해 사용되는 제1 스펙트럼 파라미터가 P개의 무음 프레임 내의 각 무음 프레임의 그룹 가중화 스펙트럼 거리에 따라 결정된다. 컴포트 노이즈를 생성하기 위해 사용되는 스펙트럼 파라미터가 단순히 다수의 무음 프레임의 스펙트럼 파라미터의 평균값 또는 중간값을 획득함으로써 획득되는 것이 아니다. 따라서, 컴포트 노이즈의 품질을 개선할 수 있다.
선택적으로, 일 실시태양으로서, 각 무음 프레임은 가중 계수의 하나의 그룹에 대응하고, 가중 계수의 하나의 그룹에서, 서브대역의 제1 그룹에 대응하는 가중 계수가 서브대역의 제2 그룹에 대응하는 가중 계수보다 크고, 서브대역의 제1 그룹의 지각적 중요도는 서브대역의 제2 그룹의 지각적 중요도보다 크다.
선택적으로, 또 다른 실시태양으로서, 프로세서(1220)는 P개의 무음 프레임에서의 제1 무음 프레임의 그룹 가중화 스펙트럼 거리가 최소가 되도록, P개의 무음 프레임으로부터 제1 무음 프레임을 선택하고, 제1 무음 프레임의 스펙트럼 파라미터가 제1 스펙트럼 파라미터라고 결정한다.
선택적으로, 또 다른 실시태양으로서, 프로세서(1220)는 P개의 무음 프레임에서의 적어도 하나의 무음 프레임의 그룹 가중화 스펙트럼 거리가 제3 임계값 미만이 되도록, P개의 무음 프레임으로부터 적어도 하나의 무음 프레임을 선택하고, 적어도 하나의 무음 프레임의 스펙트럼 파라미터에 따라 제1 스펙트럼 파라미터를 결정한다.
선택적으로, 또 다른 실시태양으로서, 장치(1200)가 인코더인 경우에, P개의 무음 프레임은 현재-입력 무음 프레임 및 상기 현재-입력 무음 프레임 이전의 (P-1)개의 무음 프레임을 포함한다. 프로세서(1220)는 현재-입력 무음 프레임을 SID 프레임으로 인코딩하며, SID 프레임은 제1 스펙트럼 파라미터를 포함한다.
장치(1200)의 다른 기능과 동작에 대하여, 전술한 도 4의 방법 실시태양의 프로세스를 참조할 수 있고, 중복을 피하기 위해 여기에 추가의 기술은 하지 않는다.
도 13는 본원의 또 다른 실시태양에 따른 신호 처리 장치의 간략한 블록도이다. 도 13의 장치(1300)의 실시예는 인코더나 디코더이며, 즉, 도 1의 인코더(110) 또는 디코더(120)이다. 장치(1300)는 메모리(1310) 및 프로세서(1320)를 포함한다.
메모리(1310)는 랜덤 액세스 메모리, 플래시 메모리, 판독 전용 메모리, 프로그램형 판독 전용 메모리, 비휘발성 메모리, 또는 레지스터를 포함할 수 있다. 프로세서(1320)는 중앙 처리 장치 CPU일 수 있다.
메모리(1310)는 실행가능 명령어를 저장하도록 구성된다. 프로세서(1320)는: 입력 신호의 주파수 대역을 R개의 서브대역으로 분할하도록 하고 - R이 양의 정수임 -; R개의 서브대역의 각 서브대역 상에서, S개의 무음 프레임에서의 각 무음 프레임의 서브대역 그룹 스펙트럼 거리를 결정하도록 하고 - S개의 무음 프레임에서의 각 서브대역 그룹 스펙트럼 거리는 각 서브대역 상의 S개의 무음 프레임 내의 각 무음 프레임과 다른 (S-1)개의 무음 프레임 사이의 스펙트럼 거리의 합계이고, S가 양의 정수임 -; 각 서브대역 상에서, S개의 무음 프레임에서의 각 무음 프레임의 서브대역 그룹 스펙트럼 거리에 따라 각 서브대역의 제1 스펙트럼 파라미터를 결정하도록 하는 - 각 서브대역의 제1 스펙트럼 파라미터가 컴포트 노이즈를 생성하기 위해 사용됨 -, 메모리(1310)에 저장된 실행가능 명령어를 실행할 수 있다.
본원의 이 실시태양에서, 각 서브대역의 그리고 컴포트 노이즈를 생성하기 위해 사용되는 스펙트럼 파라미터가 S개의 무음 프레임 내의 각 무음 프레임의 스펙트럼 거리에 따라 R개의 서브대역의 각 서브대역 상에서 결정된다. 단순히 컴포트 노이즈를 생성하기 위해 사용되는 스펙트럼 파라미터가 다수의 무음 프레임의 스펙트럼 파라미터의 평균값이나 중간값을 사용함으로써 획득되는 것이 아니다. 따라서, 컴포트 노이즈의 품질이 개선된다.
선택적으로, 일 실시태양으로서, 프로세서(1320)는 각 서브대역 상의 S개의 무음 프레임에서의 제1 무음 프레임의 서브대역 그룹 스펙트럼 거리가 최소가 되도록, 각 서브대역 상에서, S개의 무음 프레임으로부터 제1 무음 프레임을 선택하고, 각 서브대역 상에서, 제1 무음 프레임의 스펙트럼 파라미터가 각 서브대역의 제1 스펙트럼 파라미터라고 결정할 수 있다.
선택적으로, 또 다른 실시태양으로서, 프로세서(1320)는, 적어도 하나의 무음 프레임의 서브대역 그룹 스펙트럼 거리가 제4 임계값 미만이 되도록, 각 서브대역 상에서 S개의 무음 프레임으로부터 적어도 하나의 무음 프레임을 선택하고, 각 서브대역 상에서, 적어도 하나의 무음 프레임의 스펙트럼 파라미터에 따라, 각 서브대역의 제1 스펙트럼 파라미터를 결정할 수 있다.
선택적으로, 또 다른 실시태양으로서, 장치(1300)가 인코더인 경우에, S개의 무음 프레임이 현재-입력 무음 프레임 및 현재-입력 무음 프레임 이전의 (S-1)개의 무음 프레임을 포함한다. 프로세서(1320)는 현재-입력 무음 프레임을 SID 프레임으로 인코딩하고, SID 프레임은 각 서브대역의 제1 스펙트럼 파라미터를 포함한다.
장치(1300)의 다른 기능 및 동작에 대하여, 전술한 도 5의 방법 실시태양의 프로세스를 참조할 수 있다. 반복을 피하기 위하여, 여기에 추가의 기재는 하지 않는다.
도 14는 본원의 또 다른 실시태양에 따른 신호 처리 장치의 간략한 블록도이다. 도 14의 장치(1400)의 실시예는 인코더나 디코더이며, 예를 들어, 도 1의 인코더(110)나 디코더(120)이다. 장치(1400)은 메모리(1410) 및 프로세서(1420)을 포함한다.
메모리(1410)은 랜덤 액세스 메모리, 플래시 메모리, 판독 전용 메모리, 프로그램형 판독 전용 메모리, 비휘발성 메모리, 또는 레지스터를 포함할 수 있다. 프로세서(1420)는 CPU일 수 있다.
메모리(1410)는 실행가능한 명령어를 저장하도록 구성된다. 프로세서(1420)는, T개의 무음 프레임 내의 각 무음 프레임의 제1 파라미터를 결정하도록 하고 - 제1 파라미터는 스펙트럼 엔트로피를 나타내기 위해 사용되고 T는 양의 정수임 -; T개의 무음 프레임 내의 각 무음 프레임의 제1 파라미터에 따라 제1 스펙트럼 파라미터를 결정하도록 하는 - 제1 스펙트럼 파라미터가 컴포트 노이즈를 생성하기 위해 사용됨 -, 메모리(1410)에 저장된 실행가능 명령어를 실행할 수 있다.
본원의 이 실시태양에서, 컴포트 노이즈를 생성하기 위해 사용되는 제1 스펙트럼 파라미터가 T개의 무음 프레임의 그리고 스펙트럼 엔트로피를 나타내기 위해 사용되는 제1 파라미터에 따라 결정된다. 컴포트 노이즈를 생성하기 위해 사용되는 스펙트럼 파라미터가 다수의 무음 프레임의 스펙트럼 파라미터의 평균값이나 중간값을 획득함으로써 단순히 획득되는 것이 아니다. 따라서, 컴포트 노이즈의 품질이 개선된다.
선택적으로, 일 실시태양으로서, 프로세서(1420)가, T개의 무음 프레임이 클러스터링 기준에 따라 제1 그룹의 무음 프레임과 제2 그룹의 무음 프레임으로 분류될 수 있다고 결정되는 경우에, 제1 그룹의 무음 프레임의 스펙트럼 파라미터에 따라 제1 스펙트럼 파라미터를 결정하며, 제1 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피가 제2 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피보다 크고; T개의 무음 프레임이 클러스터링 기준에 따라 제1 그룹의 무음 프레임과 제2 그룹의 무음 프레임으로 분류될 수 없다고 결정되는 경우에, 제1 스펙트럼 파라미터를 결정하도록, T개의 무음 프레임의 스펙트럼 파라미터에 대한 가중화된 평균화를 수행하며, 제1 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피가 제2 그룹의 무음 프레임의 제1 파라미터로 나타낸 스펙트럼 엔트로피보다 크다.
선택적으로, 또 다른 실시태양으로서, 클러스터링 기준은, 제1 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제1 평균값 사이의 거리가 제1 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제2 평균값 사이의 거리 이하이고; 제2 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제2 평균값 사이의 거리가 제2 그룹의 무음 프레임의 각 무음 프레임의 제1 파라미터와 제1 평균값 사이의 거리 이하이고; 제1 평균값과 제2 평균값 사이의 거리가 제1 그룹의 무음 프레임의 제1 파라미터와 제1 평균값 사이의 평균 거리를 초과하고; 제1 평균값과 제2 평균값 사이의 거리가 제2 그룹의 무음 프레임의 제1 파라미터와 제2 평균값 사이의 평균 거리를 초과하는 것을 포함하며,
이때 제1 평균값은 제1 그룹의 무음 프레임의 제1 파라미터의 평균값이고, 제2 평균값은 제2 그룹의 무음 프레임의 제1 파라미터의 평균값이다.
선택적으로, 또 다른 실시태양으로서, 프로세서(1420)는, 제1 스펙트럼 파라미터를 결정하도록, T개의 무음 프레임의 스펙트럼 파라미터에 대한 가중화된 평균화를 수행하며, T개의 무음 프레임 내에서, 상이한 i번째 무음 프레임과 j번째 무음 프레임에 대하여, i번째 무음 프레임에 대응하는 가중 계수는 j번째 무음 프레임에 대응하는 가중 계수 이상이며, 제1 파라미터가 스펙트럼 엔트로피와 양으로 상관될 때, i번째 무음 프레임의 제1 파라미터가 j번째 무음 프레임의 제1 파라미터를 초과하고, 제1 파라미터가 스펙트럼 엔트로피와 음으로 상관될 때, i번째 무음 프레임의 제1 파라미터가 j번째 무음 프레임의 제1 파라미터 미만이고, i와 j 둘 다 양의 정수이며, 1≤i≤T이고, 1≤j≤T이다.
선택적으로, 또 다른 실시태양으로서, 장치(1400)가 인코더인 경우에, T개의 무음 프레임은 현재-입력 무음 프레임 및 현재-입력 무음 프레임 이전의 (T-1)개의 무음 프레임을 포함한다. 프로세서(1420)는 현재-입력 무음 프레임을 무음 기술(SID) 프레임으로 인코딩할 수 있고, SID 프레임 제1 스펙트럼 파라미터를 포함한다.
장치(1400)의 다른 기능 및 동작에 대하여, 전술한 도 6의 방법 실시태양의 프로세스를 참조할 수 있다. 반복을 방지하기 위하여, 여기서 추가로 기재하지는 않는다.
본 명세서에 개시된 실시예에서 설명된 예시들과 조합하여, 유닛과 알고리즘 단계가 전자 하드웨어 또는 컴퓨터 소프트웨어와 전자 하드웨어의 조합에 의해 구현될 수 있다는 것을 통상의 기술자는 알 것이다. 기능이 하드웨어에 의해 수행될 지 또는 소프트웨어에 의해 수행될 지는 구체적 적용예와 기술적 해결책의 제한 조건에 달려있다. 통상의 기술자는 각각의 구체적 적용예에 대하여 설명된 기능을 구현하도록 다른 방법을 사용할 수도 있지만, 이러한 구현이 본 발명의 범위를 벗어나는 것으로 간주되어서는 안 된다.
전술한 시스템, 장치, 및 유닛의 구체적 작동 프로세스에 대하여 편리하고 간결한 설명을 위해 전술한 방법 실시예에서 대응하는 프로세스를 참조할 수 있고, 여기에서 다시 설명하지 않는다는 것을 통상의 기술자는 명백히 이해할 것이다.
본 출원에 제공된 몇 가지 실시예에서, 개시된 시스템, 장치, 및 방법은 다른 방식으로 구현될 수 있다는 것을 이해해야 한다. 예컨대, 설명된 장치 실시예는 단지 예시적인 것이다. 예컨대, 유닛 분할은 단지 논리적 기능 분할이고, 실제 구현에서 다른 분할일 수 있다. 예컨대, 복수의 유닛 또는 구성은 다른 시스템으로 조합되거나 통합될 수 있고, 어떤 특징은 무시되거나 수행되지 않을 수 있다. 또한, 표시되거나 논의된 상호 커플링 또는 직접적 커플링 또는 통신 연결은 다른 인터페이스를 이용하여 구현될 수 있다. 장치 또는 유닛 사이의 간접적 커플링 또는 통신 연결은 전자적, 기계적, 또는 다른 형태로 구현될 수 있다.
분리된 부분으로 기재된 유닛들은 물리적으로 분리되거나 분리되지 않을 수 있고, 유닛으로서 디스플레이되는 부분들이 물리적 유닛들이거나 아닐 수 있고, 하나의 장소에 위치되거나, 복수의 네트워크 유닛에 분배될 수 있다. 일부 또는 전부의 유닛이 실시태양의 해결의 목적을 달성하기 위한 실제적인 필요에 따라 선택될 수 있다.
추가로, 본원의 실시태양에서의 기능적 유닛이 하나의 처리 유닛으로 집적거나, 각각의 유닛이 물리적으로 단독으로 존재하거나 둘 이상의 유닛이 하나의 유닛으로 집적될 수 있다.
기능이 소프트웨어 기능적 유닛의 형태로 구현되고, 독립적인 제품으로 판매되거나 사용되는 경우에, 기능은 컴퓨터로 판독 가능한 저장 매체에 저장될 수 있다. 이러한 이해를 기초로 하여, 본 발명의 기술적 해결책은 본질적으로, 또는 종래기술에 기여하는 부분, 또는 기술적 해결책의 일부는 소프트웨어 제품의 형태로 구현될 수 있다. 컴퓨터 소프트웨어 제품은 저장 매체에 저장되고, 컴퓨터 디바이스(개인용 컴퓨터, 서버, 또는 네트워크 디바이스일 수 있음)를 명령하기 위한 수 개의 명령을 포함하여, 본 발명의 실시예에 설명된 방법의 단계의 전부 또는 일부를 수행된다. 전술한 저장 매체는, USB 플래시 메모리, 외장형 하드디스크, 읽기 전용 메모리(ROM; Read-Only Memory), 랜덤 액세스 메모리(RAM; Random Acess Memory), 자기디스크, 또는 광학디스크와 같은 프로그램 코드를 저장할 수 있는 임의의 매체를 포함한다.
전술한 상세한 설명은 단지 본원의 특정 구현 방법이며, 본원의 보호 범위를 제한하려는 의도가 아니다. 본원에 개시된 기술적 범위 내에서 통상의 기술자에 의해 쉽게 이해되는 임의의 변형이나 대체가 본원의 보호 범위 내에 있을 것이다. 그러므로, 본원의 보호 범위는 특허청구범위의 보호 범위의 대상일 것이다.

Claims (52)

  1. 신호 인코딩 방법으로서,
    현재-입력 프레임의 이전 프레임의 인코딩 방식이 연속 인코딩 방식일 경우에는, 현재-입력 프레임이 무음 기술(SID) 프레임으로 인코딩되는 때에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈를 예측하고, 실제 무음 신호를 결정하는 단계 ― 상기 현재-입력 프레임은 무음 프레임임 ―;
    상기 컴포트 노이즈와 상기 실제 무음 신호 사이의 편차도를 결정하는 단계;
    상기 편차도에 따라 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식인 것으로 결정하는 단계; 및
    상기 행오버 프레임 인코딩 방식에 따라 현재-입력 프레임을 인코딩하는 단계
    를 포함하는 신호 인코딩 방법.
  2. 제1항에 있어서,
    상기 현재-입력 프레임이 SID 프레임으로 인코딩되는 때에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈를 예측하고, 실제 무음 신호를 결정하는 단계는,
    상기 컴포트 노이즈의 특징 파라미터를 예측하고, 상기 실제 무음 신호의 특징 파라미터를 결정하는 단계를 포함하며, 상기 컴포트 노이즈의 특징 파라미터는 상기 실제 무음 신호의 특징 파라미터에 1 대 1 대응관계에 있으며,
    상기 컴포트 노이즈와 상기 실제 무음 신호 사이의 편차도를 결정하는 단계는,
    상기 컴포트 노이즈의 특징 파라미터와 상기 실제 무음 신호의 특징 파라미터 사이의 거리를 결정하는 단계를 포함하는, 신호 인코딩 방법.
  3. 제2항에 있어서,
    상기 편차도에 따라 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식인 것으로 결정하는 단계는,
    상기 컴포트 노이즈의 특징 파라미터와 상기 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 이상인 경우에, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정하는 단계를 포함하고,
    상기 컴포트 노이즈의 특징 파라미터와 상기 실제 무음 신호의 특징 파라미터 사이의 거리는 상기 임계 설정에서의 임계값과 1 대 1 대응관계에 있는, 신호 인코딩 방법.
  4. 제2항에 있어서,
    상기 컴포트 노이즈의 특징 파라미터는 에너지 정보 및 스펙트럼 정보 중 적어도 하나를 나타내기 위해 사용되는, 신호 인코딩 방법.
  5. 제4항에 있어서,
    상기 에너지 정보는 코드 여기된 선형 예측(code excited linear prediction, CELP) 여기 에너지를 포함하고,
    상기 스펙트럼 정보는 선형 예측 필터 계수(linear predictive filter coefficient), 고속 퓨리에 변환(fast Fourier transform, FFT) 계수, 및 수정 이산 코사인 변환(modified discrete cosine transform, MDCT) 계수 중 적어도 하나를 포함하고,
    상기 선형 예측 필터 계수는 선 스펙트럼 주파수(line spectral frequency, LSF) 계수, 선 스펙트럼 쌍(line spectrum pair, LSP) 계수, 이미턴스 스펙트럼 주파수(immittance spectral frequency, ISF) 계수, 이미턴스 스펙트럼 쌍(immittance spectral pair, ISP) 계수, 반사 계수, 선형 예측 코딩(linear predictive coding, LPC) 계수 중 중 적어도 하나를 포함하는, 신호 인코딩 방법.
  6. 제2항 내지 제5항 중 어느 한 항에 있어서,
    상기 컴포트 노이즈의 특징 파라미터를 예측하는 것은,
    현재-입력 프레임의 이전 프레임의 컴포트 노이즈 파라미터 및 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측하는 것; 또는
    현재-입력 프레임 이전의 L개의 행오버 프레임의 특징 파라미터 및 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측하는 것 ― L은 양의 정수임 ―
    을 포함하는, 신호 인코딩 방법.
  7. 제2항 내지 제5항 중 어느 한 항에 있어서,
    상기 실제 무음 신호의 특징 파라미터를 결정하는 것은,
    현재-입력 프레임의 특징 파라미터를 상기 실제 무음 신호의 특징 파라미터로서 사용하는 것; 또는
    상기 실제 무음 신호의 특징 파라미터를 결정하기 위해, M개의 무음 프레임의 특징 파라미터에 대한 통계를 수집하는 것
    을 포함하는, 신호 인코딩 방법.
  8. 제7항에 있어서,
    상기 M개의 무음 프레임은 현재-입력 프레임 및 상기 현재-입력 프레임 이전의 (M-1)개의 무음 프레임을 포함하고, M은 양의 정수인, 신호 인코딩 방법.
  9. 제3항에 있어서,
    상기 컴포트 노이즈의 특징 파라미터는 컴포트 노이즈의 코드 여기된 선형 예측(CELP) 여기 에너지 및 컴포트 노이즈의 선 스펙트럼 주파수(LSF) 계수를 포함하고, 상기 실제 무음 신호의 특징 파라미터는 실제 무음 신호의 CELP 여기 에너지 및 실제 무음 신호의 LSF 계수를 포함하고,
    상기 컴포트 노이즈의 특징 파라미터와 상기 실제 무음 신호의 특징 파라미터 사이의 거리를 결정하는 것은,
    상기 컴포트 노이즈의 CELP 여기 에너지와 상기 실제 무음 신호의 CELP 여기 에너지 사이의 거리 De를 결정하고, 상기 컴포트 노이즈의 LSF 계수와 상기 실제 무음 신호의 LSF 계수 사이의 거리 Dlsf를 결정하는 것을 포함하는, 신호 인코딩 방법.
  10. 제9항에 있어서,
    상기 컴포트 노이즈의 특징 파라미터와 상기 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 미만인 경우에, 현재-입력 프레임의 인코딩 방식이 SID 프레임 인코딩 방식이라고 결정하는 단계는,
    거리 De가 제1 임계값 미만이고, 거리 Dlsf가 제2 임계값 미만인 경우에, 현재-입력 프레임의 인코딩 방식이 SID 프레임 인코딩 방식이라고 결정하는 단계를 포함하고,
    상기 컴포트 노이즈의 특징 파라미터와 상기 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 이상인 경우에, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정하는 단계는,
    거리 De가 제1 임계값 이상이고, 거리 Dlsf가 제2 임계값 이상인 경우에, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정하는 단계를 포함하는, 신호 인코딩 방법.
  11. 제10항에 있어서,
    미리설정된 제1 임계값과 미리설정된 제2 임계값을 획득하는 단계; 또는
    현재-입력 프레임 이전의 N개의 무음 프레임의 CELP 여기 에너지에 따라 제1 임계값을 결정하고, N개의 무음 프레임의 LSF 계수에 따라 제2 임계값을 결정하는 단계 ― N은 양의 정수 ―를 더 포함하는, 신호 인코딩 방법.
  12. 제1항 내지 제5항 중 어느 한 항에 있어서,
    상기 현재-입력 프레임이 SID 프레임으로 인코딩되는 경우에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈를 예측하는 것은,
    제1 예측 방식으로 컴포트 노이즈를 예측하는 것을 포함하며, 상기 제1 예측 방식은 디코더가 컴포트 노이즈를 생성하는 방식과 동일한 것인, 신호 인코딩 방법.
  13. 삭제
  14. 신호 처리 방법으로서,
    T개의 무음 프레임 내의 각 무음 프레임의 제1 파라미터를 결정하는 단계 ― 상기 제1 파라미터는 스펙트럼 엔트로피를 나타내기 위해 사용되고, T는 양의 정수임 ―;
    상기 T개의 무음 프레임이 제1 그룹의 무음 프레임 및 제2 그룹의 무음 프레임으로 분류되는 것으로 결정하는 단계 - 여기서 상기 제1 그룹의 무음 프레임의 제1 파라미터에 의해 표현되는 스펙트럼 엔트로피는 상기 제2 그룹의 무음 프레임의 제1 파라미터에 의해 표현되는 스펙트럼 엔트로피보다 큼 - ; 및
    상기 제1 그룹의 무음 프레임의 스펙트럼 파라미터에 따라 제1 스펙트럼 파라미터를 결정하는 단계 ― 상기 제1 스펙트럼 파라미터가 컴포트 노이즈를 생성하기 위해 사용됨 ―
    를 포함하고,
    상기 T개의 무음 프레임 내의 각 무음 프레임의 제1 파라미터에 따라 제1 스펙트럼 파라미터를 결정하는 단계는,
    상기 제1 스펙트럼 파라미터를 결정하도록, 상기 T개의 무음 프레임의 스펙트럼 파라미터에 대한 가중화된 평균화를 수행하는 단계를 포함하며,
    상기 T개의 무음 프레임 내에서, 상이한 i번째 무음 프레임과 j번째 무음 프레임에 대하여, i번째 무음 프레임에 대응하는 가중 계수는 j번째 무음 프레임에 대응하는 가중 계수 이상이며,
    상기 제1 파라미터가 스펙트럼 엔트로피와 양으로 상관될(positively correlated) 때, i번째 무음 프레임의 제1 파라미터가 j번째 무음 프레임의 제1 파라미터를 초과하고, 상기 제1 파라미터가 스펙트럼 엔트로피와 음으로 상관될(negatively correlated) 때, i번째 무음 프레임의 제1 파라미터가 j번째 무음 프레임의 제1 파라미터 미만이고, i와 j 둘 다 양의 정수이며, 1≤i≤T이고, 1≤j≤T인 것인, 신호 처리 방법.
  15. 삭제
  16. 삭제
  17. 신호 인코딩 장치로서,
    제1 결정 유닛;
    제2 결정 유닛;
    제3 결정 유닛; 및
    인코딩 유닛
    을 포함하며,
    상기 제1 결정 유닛은, 현재-입력 프레임의 이전 프레임의 인코딩 방식이 연속 인코딩 방식인 경우에, 현재-입력 프레임이 무음 기술SID 프레임으로 인코딩되는 때에 현재-입력 프레임에 따라 디코더에 의해 생성되는 컴포트 노이즈를 예측하고, 실제 무음 신호를 결정하도록 구성되고, 상기 현재-입력 프레임은 무음 프레임이고,
    상기 제2 결정 유닛은, 상기 제1 결정 유닛에 의해 결정된 컴포트 노이즈와 제1 결정 유닛에 의해 결정된 실제 무음 신호 사이의 편차도를 결정하도록 구성되고,
    상기 제3 결정 유닛은, 상기 제2 결정 유닛에 의해 결정된 편차도에 따라 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식인 것으로 결정하도록 구성되고,
    상기 인코딩 유닛은, 상기 제3 결정 유닛에 의해 결정된 행오버 프레임 인코딩 방식에 따라 현재-입력 프레임을 인코딩하도록 구성되는,
    신호 인코딩 장치.
  18. 제17항에 있어서,
    상기 제1 결정 유닛은 구체적으로 상기 컴포트 노이즈의 특징 파라미터를 예측하고, 상기 실제 무음 신호의 특징 파라미터를 결정하도록 구성되고, 상기 컴포트 노이즈의 특징 파라미터는 상기 실제 무음 신호의 특징 파라미터와 1 대 1 대응관계에 있고,
    상기 제2 결정 유닛은 구체적으로 상기 컴포트 노이즈의 특징 파라미터와 상기 실제 무음 신호의 특징 파라미터 사이의 거리를 결정하도록 구성되는, 신호 인코딩 장치.
  19. 제18항에 있어서,
    상기 제3 결정 유닛은 구체적으로:
    상기 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리가 임계 설정에서의 대응하는 임계값 이상인 경우에, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정하도록 구성되고,
    상기 컴포트 노이즈의 특징 파라미터와 실제 무음 신호의 특징 파라미터 사이의 거리는 임계 설정에서의 임계값과 1 대 1 대응관계에 있는, 신호 인코딩 장치.
  20. 제18항 또는 제19항에 있어서,
    상기 제1 결정 유닛은 구체적으로:
    현재-입력 프레임의 이전 프레임의 컴포트 노이즈 파라미터 및 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측하거나,
    현재-입력 프레임 이전의 L개의 행오버 프레임의 특징 파라미터 및 현재-입력 프레임의 특징 파라미터에 따라 컴포트 노이즈의 특징 파라미터를 예측하도록 구성되며, L은 양의 정수인 것인, 신호 인코딩 장치.
  21. 제18항 또는 제19항에 있어서,
    상기 제1 결정 유닛은 구체적으로:
    현재-입력 프레임의 특징 파라미터가 실제 무음 신호의 파라미터라는 것을 결정하거나,
    실제 무음 신호의 파라미터를 결정하기 위해, M개의 무음 프레임의 특징 파라미터에 대한 통계를 수집하도록 구성되는, 신호 인코딩 장치.
  22. 제19항에 있어서,
    상기 컴포트 노이즈의 특징 파라미터는 컴포트 노이즈의 CELP 여기 에너지 및 컴포트 노이즈의 LSF 계수를 포함하고, 상기 실제 무음 신호의 특징 파라미터는 실제 무음 신호의 CELP 여기 에너지 및 실제 무음 신호의 LSF 계수를 포함하며,
    상기 제2 결정 유닛은 구체적으로 상기 컴포트 노이즈의 CELP 여기 에너지와 상기 실제 무음 신호의 CELP 여기 에너지 사이의 거리 De를 결정하고, 상기 컴포트 노이즈의 LSF 계수와 상기 실제 무음 신호의 LSF 계수 사이의 거리 Dlsf를 결정하도록 구성되는, 신호 인코딩 장치.
  23. 제22항에 있어서,
    상기 제3 결정 유닛은 구체적으로: 거리 De가 제1 임계값 미만이고, 거리 Dlsf가 제2 임계값 미만인 경우에, 현재-입력 프레임의 인코딩 방식이 SID 프레임 인코딩 방식이라고 결정하도록 구성되고,
    상기 제3 결정 유닛은 구체적으로: 거리 De가 제1 임계값 이상이고, 거리 Dlsf가 제2 임계값 이상인 경우에, 현재-입력 프레임의 인코딩 방식이 행오버 프레임 인코딩 방식이라고 결정하도록 구성되는, 신호 인코딩 장치.
  24. 제23항에 있어서,
    제4 결정 유닛을 더 포함하며,
    상기 제4 결정 유닛은,
    미리설정된 제1 임계값과 미리설정된 제2 임계값을 획득하거나,
    현재-입력 프레임 이전의 N개의 무음 프레임의 CELP 여기 에너지에 따라 제1 임계값을 결정하고, N개의 무음 프레임의 LSF 계수에 따라 제2 임계값을 결정하도록 구성되며, N은 양의 정수인 것인, 신호 인코딩 장치.
  25. 제17항 내지 제19항 및 제22항 내지 제24항 중 어느 한 항에 있어서,
    상기 제1 결정 유닛은 구체적으로 제1 예측 방식으로 컴포트 노이즈를 예측하도록 구성되며, 상기 제1 예측 방식은 디코더가 컴포트 노이즈를 생성하는 방식과 동일한 것인, 신호 인코딩 장치.
  26. 삭제
  27. 신호 처리 장치로서,
    제1 결정 유닛; 및
    제2 결정 유닛
    을 포함하며,
    상기 제1 결정 유닛은, T개의 무음 프레임 내의 각 무음 프레임의 제1 파라미터를 결정하도록 구성되고, 상기 제1 파라미터는 스펙트럼 엔트로피를 나타내기 위해 사용되고 T는 양의 정수이고,
    상기 제2 결정 유닛은, 상기 T개의 무음 프레임이 제1 그룹의 무음 프레임 및 제2 그룹의 무음 프레임으로 분류되는 것으로 결정하고 - 여기서 상기 제1 그룹의 무음 프레임의 제1 파라미터에 의해 표현되는 스펙트럼 엔트로피는 상기 제2 그룹의 무음 프레임의 제1 파라미터에 의해 표현되는 스펙트럼 엔트로피보다 큼 - , 상기 제1 그룹의 무음 프레임의 스펙트럼 파라미터에 따라 제1 스펙트럼 파라미터를 결정하도록 구성되고, 상기 제1 스펙트럼 파라미터가 컴포트 노이즈를 생성하기 위해 사용되며,
    상기 제2 결정 유닛은 구체적으로, 상기 T개의 무음 프레임의 스펙트럼 파라미터에 대한 가중화된 평균화를 수행하여, 제1 스펙트럼 파라미터를 결정하도록 구성되고,
    상기 T개의 무음 프레임에서 상이한 i번째 무음 프레임과 j번째 무음 프레임에 대하여, i번째 무음 프레임에 대응하는 가중 계수는 j번째 무음 프레임에 대응하는 가중 계수 이상이며,
    제1 파라미터가 스펙트럼 엔트로피와 양으로 상관될 때, i번째 무음 프레임의 제1 파라미터가 j번째 무음 프레임의 제1 파라미터를 초과하고, 제1 파라미터가 스펙트럼 엔트로피와 음으로 상관될 때, i번째 무음 프레임의 제1 파라미터가 j번째 무음 프레임의 제1 파라미터 미만이고, i와 j 둘 다 양의 정수이며, 1≤i≤T이고, 1≤j≤T인 것인, 신호 처리 장치.
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
KR1020157034027A 2013-05-30 2013-09-25 신호 인코딩 방법 및 장치 KR102099752B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310209760.9A CN104217723B (zh) 2013-05-30 2013-05-30 信号编码方法及设备
CN201310209760.9 2013-05-30
PCT/CN2013/084141 WO2014190641A1 (zh) 2013-05-30 2013-09-25 一种媒体数据的传输方法、装置和系统

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020177026815A Division KR20170110737A (ko) 2013-05-30 2013-09-25 신호 인코딩 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20160003192A KR20160003192A (ko) 2016-01-08
KR102099752B1 true KR102099752B1 (ko) 2020-04-10

Family

ID=51987922

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020177026815A KR20170110737A (ko) 2013-05-30 2013-09-25 신호 인코딩 방법 및 장치
KR1020157034027A KR102099752B1 (ko) 2013-05-30 2013-09-25 신호 인코딩 방법 및 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020177026815A KR20170110737A (ko) 2013-05-30 2013-09-25 신호 인코딩 방법 및 장치

Country Status (17)

Country Link
US (2) US9886960B2 (ko)
EP (3) EP4235661A3 (ko)
JP (3) JP6291038B2 (ko)
KR (2) KR20170110737A (ko)
CN (3) CN104217723B (ko)
AU (2) AU2013391207B2 (ko)
BR (1) BR112015029310B1 (ko)
CA (2) CA2911439C (ko)
ES (2) ES2812553T3 (ko)
HK (1) HK1203685A1 (ko)
MX (1) MX355032B (ko)
MY (1) MY161735A (ko)
PH (2) PH12015502663B1 (ko)
RU (2) RU2638752C2 (ko)
SG (3) SG10201607798VA (ko)
WO (1) WO2014190641A1 (ko)
ZA (1) ZA201706413B (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104217723B (zh) * 2013-05-30 2016-11-09 华为技术有限公司 信号编码方法及设备
US10049684B2 (en) * 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection
CN107731223B (zh) * 2017-11-22 2022-07-26 腾讯科技(深圳)有限公司 语音活性检测方法、相关装置和设备
CN110660402B (zh) 2018-06-29 2022-03-29 华为技术有限公司 立体声信号编码过程中确定加权系数的方法和装置
CN111918196B (zh) * 2019-05-08 2022-04-19 腾讯科技(深圳)有限公司 一种音频采集器录音异常的诊断方法、装置、设备及存储介质
US11460927B2 (en) * 2020-03-19 2022-10-04 DTEN, Inc. Auto-framing through speech and video localizations
CN114495951A (zh) * 2020-11-11 2022-05-13 华为技术有限公司 音频编解码方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008121035A1 (en) 2007-03-29 2008-10-09 Telefonaktiebolaget Lm Ericsson (Publ) Method and speech encoder with length adjustment of dtx hangover period
WO2011049514A1 (en) 2009-10-19 2011-04-28 Telefonaktiebolaget Lm Ericsson (Publ) Method and background estimator for voice activity detection

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2110090C (en) 1992-11-27 1998-09-15 Toshihiro Hayata Voice encoder
JP2541484B2 (ja) * 1992-11-27 1996-10-09 日本電気株式会社 音声符号化装置
FR2739995B1 (fr) 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JP3464371B2 (ja) * 1996-11-15 2003-11-10 ノキア モービル フォーンズ リミテッド 不連続伝送中に快適雑音を発生させる改善された方法
US7124079B1 (en) * 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
US6381568B1 (en) * 1999-05-05 2002-04-30 The United States Of America As Represented By The National Security Agency Method of transmitting speech using discontinuous transmission and comfort noise
US6662155B2 (en) * 2000-11-27 2003-12-09 Nokia Corporation Method and system for comfort noise generation in speech communication
US6889187B2 (en) * 2000-12-28 2005-05-03 Nortel Networks Limited Method and apparatus for improved voice activity detection in a packet voice network
US20030120484A1 (en) * 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US7454010B1 (en) * 2004-11-03 2008-11-18 Acoustic Technologies, Inc. Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation
US20060149536A1 (en) * 2004-12-30 2006-07-06 Dunling Li SID frame update using SID prediction error
US7346502B2 (en) * 2005-03-24 2008-03-18 Mindspeed Technologies, Inc. Adaptive noise state update for a voice activity detector
WO2006136901A2 (en) * 2005-06-18 2006-12-28 Nokia Corporation System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
US20070294087A1 (en) * 2006-05-05 2007-12-20 Nokia Corporation Synthesizing comfort noise
CN101496095B (zh) * 2006-07-31 2012-11-21 高通股份有限公司 用于信号变化检测的系统、方法及设备
US8725499B2 (en) 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
RU2319222C1 (ru) * 2006-08-30 2008-03-10 Валерий Юрьевич Тарасов Способ кодирования и декодирования речевого сигнала методом линейного предсказания
WO2008090564A2 (en) * 2007-01-24 2008-07-31 P.E.S Institute Of Technology Speech activity detection
CN101303855B (zh) * 2007-05-11 2011-06-22 华为技术有限公司 一种舒适噪声参数产生方法和装置
CN101320563B (zh) 2007-06-05 2012-06-27 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
CN101335003B (zh) 2007-09-28 2010-07-07 华为技术有限公司 噪声生成装置、及方法
CN101430880A (zh) * 2007-11-07 2009-05-13 华为技术有限公司 一种背景噪声的编解码方法和装置
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN101483042B (zh) * 2008-03-20 2011-03-30 华为技术有限公司 一种噪声生成方法以及噪声生成装置
CN101335000B (zh) 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
JP4950930B2 (ja) * 2008-04-03 2012-06-13 株式会社東芝 音声/非音声を判定する装置、方法およびプログラム
CN102044243B (zh) * 2009-10-15 2012-08-29 华为技术有限公司 语音激活检测方法与装置、编码器
US20110228946A1 (en) * 2010-03-22 2011-09-22 Dsp Group Ltd. Comfort noise generation method and system
CN102741918B (zh) 2010-12-24 2014-11-19 华为技术有限公司 用于话音活动检测的方法和设备
AR085224A1 (es) 2011-02-14 2013-09-18 Fraunhofer Ges Forschung Codec de audio utilizando sintesis de ruido durante fases inactivas
JP5934259B2 (ja) * 2011-02-14 2016-06-15 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオコーデックにおけるノイズ生成
JP5732976B2 (ja) * 2011-03-31 2015-06-10 沖電気工業株式会社 音声区間判定装置、音声区間判定方法、及びプログラム
CN102903364B (zh) * 2011-07-29 2017-04-12 中兴通讯股份有限公司 一种进行语音自适应非连续传输的方法及装置
CN103137133B (zh) * 2011-11-29 2017-06-06 南京中兴软件有限责任公司 非激活音信号参数估计方法及舒适噪声产生方法及系统
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
AU2013314636B2 (en) * 2012-09-11 2016-02-25 Telefonaktiebolaget L M Ericsson (Publ) Generation of comfort noise
WO2014129949A1 (en) * 2013-02-22 2014-08-28 Telefonaktiebolaget L M Ericsson (Publ) Methods and apparatuses for dtx hangover in audio coding
CN104217723B (zh) * 2013-05-30 2016-11-09 华为技术有限公司 信号编码方法及设备
CN104978970B (zh) * 2014-04-08 2019-02-12 华为技术有限公司 一种噪声信号的处理和生成方法、编解码器和编解码系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008121035A1 (en) 2007-03-29 2008-10-09 Telefonaktiebolaget Lm Ericsson (Publ) Method and speech encoder with length adjustment of dtx hangover period
WO2011049514A1 (en) 2009-10-19 2011-04-28 Telefonaktiebolaget Lm Ericsson (Publ) Method and background estimator for voice activity detection

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Adaptive Multi-Rate - Wideband (AMR-WB) speech codec Comfort noise aspects(3GPP TS 26.192 version 11.0.0 Release 11). 2012.10.
Adaptive Multi-Rate - Wideband (AMR-WB) speech codec Source controlled rate operation(3GPP TS 26.193 version 11.0.0 Release 11). 2012.10.
Adit Benyassine, et al. ITU-T Recommendation G. 729 Annex B: a silence compression scheme for use with G. 729 optimized for V. 70 digital simultaneous voice and data applications. IEEE Communications*
Bruno Bessette, et al. The adaptive multirate wideband speech codec (AMR-WB). IEEE transactions on speech and audio processing, 2002.11. Vol.10,No.8, pp.620-636.*

Also Published As

Publication number Publication date
MY161735A (en) 2017-05-15
JP2017199025A (ja) 2017-11-02
SG11201509143PA (en) 2015-12-30
JP2018092182A (ja) 2018-06-14
KR20160003192A (ko) 2016-01-08
MX2015016375A (es) 2016-04-13
EP3745396A1 (en) 2020-12-02
AU2017204235A1 (en) 2017-07-13
KR20170110737A (ko) 2017-10-11
BR112015029310B1 (pt) 2021-11-30
WO2014190641A1 (zh) 2014-12-04
RU2665236C1 (ru) 2018-08-28
US10692509B2 (en) 2020-06-23
RU2015155951A (ru) 2017-06-30
SG10201810567PA (en) 2019-01-30
ZA201706413B (en) 2019-04-24
AU2013391207A1 (en) 2015-11-26
CN106169297B (zh) 2019-04-19
EP3007169A4 (en) 2017-06-14
JP6517276B2 (ja) 2019-05-22
EP4235661A2 (en) 2023-08-30
EP3007169A1 (en) 2016-04-13
PH12015502663A1 (en) 2016-03-07
EP3745396B1 (en) 2023-04-19
JP6680816B2 (ja) 2020-04-15
JP6291038B2 (ja) 2018-03-14
CA2911439A1 (en) 2014-12-04
JP2016526188A (ja) 2016-09-01
AU2013391207B2 (en) 2017-03-23
CN105225668A (zh) 2016-01-06
HK1203685A1 (en) 2015-10-30
ES2951107T3 (es) 2023-10-18
CN104217723B (zh) 2016-11-09
BR112015029310A2 (pt) 2017-07-25
CA3016741C (en) 2020-10-27
CA3016741A1 (en) 2014-12-04
EP4235661A3 (en) 2023-11-15
MX355032B (es) 2018-04-02
RU2638752C2 (ru) 2017-12-15
CN106169297A (zh) 2016-11-30
CN105225668B (zh) 2017-05-10
AU2017204235B2 (en) 2018-07-26
US20160078873A1 (en) 2016-03-17
CN104217723A (zh) 2014-12-17
CA2911439C (en) 2018-11-06
US20180122389A1 (en) 2018-05-03
SG10201607798VA (en) 2016-11-29
EP3007169B1 (en) 2020-06-24
PH12015502663B1 (en) 2016-03-07
US9886960B2 (en) 2018-02-06
ES2812553T3 (es) 2021-03-17
PH12018501871A1 (en) 2019-06-10

Similar Documents

Publication Publication Date Title
KR102099752B1 (ko) 신호 인코딩 방법 및 장치
EP2272062B1 (en) An audio signal classifier
US10490199B2 (en) Bandwidth extension audio decoding method and device for predicting spectral envelope
JP6616470B2 (ja) 符号化方法、復号化方法、符号化装置及び復号化装置
US10984811B2 (en) Audio coding method and related apparatus

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
A107 Divisional application of patent
J201 Request for trial against refusal decision
J301 Trial decision

Free format text: TRIAL NUMBER: 2017101005747; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20171128

Effective date: 20190917

S901 Examination by remand of revocation
E902 Notification of reason for refusal
GRNO Decision to grant (after opposition)
GRNT Written decision to grant