KR20190071834A - 오디오 코딩 방법 및 장치 - Google Patents

오디오 코딩 방법 및 장치 Download PDF

Info

Publication number
KR20190071834A
KR20190071834A KR1020197016886A KR20197016886A KR20190071834A KR 20190071834 A KR20190071834 A KR 20190071834A KR 1020197016886 A KR1020197016886 A KR 1020197016886A KR 20197016886 A KR20197016886 A KR 20197016886A KR 20190071834 A KR20190071834 A KR 20190071834A
Authority
KR
South Korea
Prior art keywords
audio frame
spectral tilt
determining
tilt frequency
frame
Prior art date
Application number
KR1020197016886A
Other languages
English (en)
Other versions
KR102130363B1 (ko
Inventor
저신 류
빈 왕
레이 먀오
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20190071834A publication Critical patent/KR20190071834A/ko
Application granted granted Critical
Publication of KR102130363B1 publication Critical patent/KR102130363B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명의 실시예는 오디오 코딩 방법 및 장치를 개시하고, 여기서 방법은 오디오의 각 오디오 프레임에 대해, 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는 것으로 결정하는 때, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하는 단계, 또는 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하지 않는 것으로 결정하는 때, 제2 수정 가중치를 결정하는 단계, 결정된 제1 수정 가중치 또는 결정된 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하는 단계, 및 오디오 프레임의 수정된 선형 예측 파라미터에 따라 오디오 프레임을 코딩하는 단계를 포함하고, 여기서 미리 설정된 수정 조건은 오디오 프레임의 신호 특성이 이전 오디오 프레임의 신호 특성과 유사한 것으로 결정하는 데 사용된다. 본 발명에 따르면, 보다 넓은 대역폭을 갖는 오디오는 비트 레잇이 변하지 않거나 비트 레잇이 약간 변화하면서 코딩될 수 있고, 오디오 프레임 사이의 스펙트럼은 보다 안정적이다.

Description

오디오 코딩 방법 및 장치{AUDIO CODING METHOD AND APPARATUS}
본 발명은 통신 분야에 관한 것으로, 특히 오디오 코딩 방법 및 장치에 관한 것이다.
기술의 끊임없는 개발로, 사용자는 전자 장치의 오디오 품질에 대한 요구가 점점 커지고 있다. 오디오 품질을 향상시키는 주요 방법은 오디오의 대역폭을 향상시키는 것이다. 전자 장치가 오디오의 대역폭을 증가시키기 위해 종래의 코딩 방식으로 오디오를 코딩하면, 오디오의 코딩된 정보의 비트 레잇이 크게 증가한다. 따라서, 오디오의 코딩 정보가 2 개의 전자 장치 사이에서 전송되는 때, 비교적 넓은 네트워크 송신 대역폭이 점유된다. 따라서, 해결되어야 할 문제는 오디오의 코딩 정보의 비트 레잇이 변하지 않거나 또는 비트 레잇이 약간 변화하면서 보다 넓은 대역폭을 갖는 오디오를 코딩하는 것이다. 이 문제에 대해, 제안된 해결책은 대역폭 확장 기술을 사용하는 것이다. 대역폭 확장 기술은 시간 도메인 대역폭 확장 기술과 주파수 도메인 대역폭 확장 기술로 구분된다. 본 발명은 시간 도메인 대역폭 확장 기술에 관한 것이다.
시간 영역 대역폭 확장 기술에서, 선형 예측 코딩(LPC, 선형 예측 코딩) 계수, 선형 스펙트럼 쌍(LSP, 선형 스펙트럼 쌍) 계수, 이미트 스펙트럼 쌍(ISP, Immittance Spectral Pair) 계수 또는 선형 스펙트럼 주파수(LSF, Linear Spectral Frequency) 계수는 일반적으로 선형 예측 알고리즘을 사용하여 계산된다. 오디오에 대한 코딩 전송이 수행되는 때, 오디오는 오디오 내의 각 오디오 프레임의 선형 예측 파라미터(linear predictive parameter)에 따라 코딩된다. 그러나, 코덱 에러 정밀도 요구사항이 비교적 높은 경우, 이 코딩 방식은 오디오 프레임들 사이의 스펙트럼의 불연속성을 야기한다.
본 발명의 실시예는 오디오 코딩 방법 및 장치를 제공한다. 비트 레잇이 변하지 않거나, 비트 레잇이 약간 변하고, 오디오 프레임들 사이의 스펙트럼이 보다 안정적인 동안 더 넓은 대역폭을 갖는 오디오가 코딩될 수 있다.
제1 측면에 따르면, 본 발명의 실시예는 각 오디오 프레임에 대해, 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는 것으로 결정하는 때, 오디오 프레임의 선형 스펙트럼 주파수 (LSF: linear spectral frequency) 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하거나, 또는 오디오 프레임의 신호 특성 및 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하지 않는 것으로 결정하는 때, 제2 수정 가중치를 결정하는 단계, 결정된 제1 수정 가중치 또는 결정된 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하는 단계, 그리고 오디오 프레임의 수정된 선형 예측 파라미터에 따라 오디오 프레임을 코딩하는 단계를 포함하고, 미리 설정된 수정 조건은 오디오 프레임의 신호 특성이 이전 오디오 프레임의 신호 특성과 유사한 것으로 결정하는 데 사용되는, 오디오 코딩 방법을 제공한다.
제1 측면을 참조하여, 제1 측면의 제1 가능한 구현 방식으로, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하는 것은, 다음의 수식을 사용하여 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하는 것을 포함하고,
Figure pat00001
, w[i]는 제1 수정 가중치이고, lsf_new_diff[i]는 오디오 프레임의 LSF 차이이며, lsf_old_diff[i]는 이전 오디오 프레임의 LSF 차이이고, i는 LSF 차이의 차수이며, i의 값은 0 내지 M-1이고, M은 선형 예측 파라미터의 차수이다.
제1 측면 또는 제1 측면의 제1 가능한 구현 방식을 참조하여, 제1 측면의 제2 가능한 구현 방식으로, 제2 수정 가중치를 결정하는 것은, 제2 수정 가중치를 0보다 크고, 1 이하인 미리 설정된 수정 가중치 값으로서 결정하는 것을 포함한다.
제1 측면, 제1 측면의 제1 가능한 구현 방식 또는 제1 측면의 제2 가능한 구현 방식을 참조하여, 제1 측면의 제3 가능한 구현 방식으로, 결정된 제1 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하는 것은, 다음의 수식을 사용하여 제1 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하는 것을 포함하고,
Figure pat00002
, w[i]는 제1 수정 가중치이고, L[i]는 오디오 프레임의 수정된 선형 예측 파라미터이며, L_new[i]는 오디오 프레임의 선형 예측 파라미터이고, L_old[i]는 이전 오디오 프레임의 선형 예측 파라미터이며, i는 선형 예측 파라미터의 차수이고, i의 값은 0 내지 M-1이고, M은 선형 예측 파라미터의 차수이다.
제1 측면, 제1 측면의 제1 가능한 구현 방식, 제1 측면의 제2 가능한 구현 방식, 또는 제1 측면의 제3 가능한 구현 방식을 참조하여, 제1 측면의 제4 가능한 구현 방식으로, 결정된 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하는 것은, 다음의 수식을 사용하여 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하는 것을 포함하고,
Figure pat00003
, y는 제2 수정 가중치이고, L[i]는 오디오 프레임의 수정된 선형 예측 파라미터이며, L_new[i]는 오디오 프레임의 선형 예측 파라미터이고, L_old[i]는 이전 오디오 프레임의 선형 예측 파라미터이며, i는 선형 예측 파라미터의 차수이고, i의 값은 0 내지 M-1이고, M은 선형 예측 파라미터의 차수이다.
제1 측면, 제1 측면의 제1 가능한 구현 방식, 제1 측면의 제2 가능한 구현 방식, 제1 측면의 제3 가능한 구현 방식, 또는 제1 측면의 제4 가능한 구현 방식을 참조하여, 제1 측면의 제5 가능한 구현 방식으로, 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는 것으로 결정하는 것은 오디오 프레임이 전이 프레임(transition frame)이 아닌 것으로 결정하는 것을 포함하고, 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하지 않는 것으로 결정하는 것은 오디오 프레임이 전이 프레임인 것으로 결정하는 것을 포함하며, 전이 프레임은 비-마찰음(non-fricative)에서 마찰음(fricative)으로의 전이 프레임 또는 마찰음에서 비-마찰음으로의 전이 프레임을 포함한다.
제1 측면의 제5 가능한 구현 방식을 참조하여, 제1 측면의 제6 가능한 구현 방식으로, 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임인 것으로 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고, 오디오 프레임의 코딩 유형이 과도 상태(transient)인 것으로 결정하는 것을 포함하고, 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임이 아닌 것으로 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크지 않은 것, 및/또는 오디오 프레임의 코딩 유형이 과도 상태가 아닌 것으로 결정하는 것을 포함한다.
제1 측면의 제5 가능한 구현 방식을 참조하여, 제1 측면의 제7 가능한 구현 방식으로, 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임인 것으로 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고, 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작은 것으로 결정하는 것을 포함하고, 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임이 아닌 것으로 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크지 않은 것, 및/또는 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작지 않은 것으로 결정하는 것을 포함한다.
제1 측면의 제5 가능한 구현 방식을 참조하여, 제1 측면의 제8 가능한 구현 방식으로, 오디오 프레임이 비-마찰음에서 마찰음으로의 전이 프레임인 것으로 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작고, 이전 오디오 프레임의 코딩 유형이, 유성음(voiced), 일반(generic), 과도 상태(transient), 및 오디오(audio)의 네 가지 유형 중 하나이고, 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 큰 것으로 결정하는 것을 포함하고, 오디오 프레임이 비-마찰음에서 마찰음으로의 전이 프레임이 아닌 것으로 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작지 않은 것, 및/또는 이전 오디오 프레임의 코딩 유형이, 유성음, 일반, 과도 상태, 및 오디오의 네 가지 유형 중 하나가 아닌 것, 및/또는 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 크지 않은 것으로 결정하는 것을 포함한다.
제1 측면의 제5 가능한 구현 방식을 참조하여, 제1 측면의 제9 가능한 구현 방식으로, 오디오 프레임이 비-마찰음에서 마찰음으로의 전이 프레임인 것으로 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고, 오디오 프레임의 코딩 유형이 과도 상태(transient)인 것으로 결정하는 것을 포함한다.
제1 측면의 제5 가능한 구현 방식을 참조하여, 제1 측면의 제10 가능한 구현 방식으로, 오디오 프레임이 비-마찰음에서 마찰음으로의 전이 프레임인 것으로 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고, 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작은 것으로 결정하는 것을 포함한다.
제1 측면의 제5 가능한 구현 방식을 참조하여, 제1 측면의 제11 가능한 구현 방식으로, 오디오 프레임이 비-마찰음에서 마찰음으로의 전이 프레임인 것으로 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작고, 이전 오디오 프레임의 코딩 유형이, 유성음(voiced), 일반(generic), 과도 상태(transient), 및 오디오(audio)의 네 가지 유형 중 하나이며, 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 큰 것으로 결정하는 것을 포함한다.
제2 측면에 따르면, 본 발명의 실시예는 각 오디오 프레임에 대해, 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는 것으로 결정하는 때, 오디오 프레임의 선형 스펙트럼 주파수 (LSF: linear spectral frequency) 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하거나, 또는 오디오 프레임의 신호 특성 및 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하지 않는 것으로 결정하는 때, 제2 수정 가중치를 결정하도록 구성된 결정 유닛, 결정 유닛에 의해 결정된 제1 수정 가중치 또는 결정 유닛에 의해 결정된 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하도록 구성된 수정 유닛, 그리고 오디오 프레임의 수정된 선형 예측 파라미터에 따라 오디오 프레임을 코딩하도록 구성된 코딩 유닛을 포함하고, 미리 설정된 수정 조건은 오디오 프레임의 신호 특성이 이전 오디오 프레임의 신호 특성과 유사한 것으로 결정하는 데 사용되고, 수정된 선형 예측 파라미터는 수정 유닛에 의한 수정 후에 획득되는, 오디오 코딩 장치를 제공한다.
제2 측면을 참조하여, 제2 측면의 제1 가능한 구현 방식으로, 결정 유닛은 구체적으로, 다음의 수식을 사용하여 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하도록 구성되고,
Figure pat00004
, w[i]는 제1 수정 가중치이고, lsf_new_diff[i]는 오디오 프레임의 LSF 차이이며, lsf_old_diff[i]는 이전 오디오 프레임의 LSF 차이이고, i는 LSF 차이의 차수이며, i의 값은 0 내지 M-1이고, M은 선형 예측 파라미터의 차수이다.
제2 측면 또는 제2 측면의 제1 가능한 구현 방식을 참조하여, 제2 측면의 제2 가능한 구현 방식으로, 결정 유닛은 구체적으로, 제2 수정 가중치를 0보다 크고, 1 이하인 미리 설정된 수정 가중치 값으로서 결정하도록 구성된다.
제2 측면, 제2 측면의 제1 가능한 구현 방식 또는 제2 측면의 제2 가능한 구현 방식을 참조하여, 제2 측면의 제3 가능한 구현 방식으로, 수정 유닛은 구체적으로, 다음의 수식을 사용하여 제1 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하도록 구성되고,
Figure pat00005
, w[i]는 제1 수정 가중치이고, L[i]는 오디오 프레임의 수정된 선형 예측 파라미터이며, L_new[i]는 오디오 프레임의 선형 예측 파라미터이고, L_old[i]는 이전 오디오 프레임의 선형 예측 파라미터이며, i는 선형 예측 파라미터의 차수이고, i의 값은 0 내지 M-1이고, M은 선형 예측 파라미터의 차수이다.
제2 측면, 제2 측면의 제1 가능한 구현 방식, 제2 측면의 제2 가능한 구현 방식, 또는 제2 측면의 제3 가능한 구현 방식을 참조하여, 제2 측면의 제4 가능한 구현 방식으로, 수정 유닛은 구체적으로, 다음의 수식을 사용하여 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하도록 구성되고,
Figure pat00006
, y는 제2 수정 가중치이고, L[i]는 오디오 프레임의 수정된 선형 예측 파라미터이며, L_new[i]는 오디오 프레임의 선형 예측 파라미터이고, L_old[i]는 이전 오디오 프레임의 선형 예측 파라미터이며, i는 선형 예측 파라미터의 차수이고, i의 값은 0 내지 M-1이고, M은 선형 예측 파라미터의 차수이다.
제2 측면, 제2 측면의 제1 가능한 구현 방식, 제2 측면의 제2 가능한 구현 방식, 제2 측면의 제3 가능한 구현 방식, 또는 제2 측면의 제4 가능한 구현 방식을 참조하여, 제2 측면의 제5 가능한 구현 방식으로, 결정 유닛은 구체적으로, 각 오디오 프레임에 대해, 오디오 프레임이 전이 프레임이 아닌 것으로 결정하는 때, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하고, 오디오 프레임이 전이 프레임인 것으로 결정하는 때, 제2 수정 가중치를 결정하도록 구성되고, 전이 프레임은 전이 프레임은 비-마찰음(non-fricative)에서 마찰음(fricative)으로의 전이 프레임, 또는 마찰음에서 비-마찰음으로의 전이 프레임을 포함한다.
제2 측면의 제5 가능한 구현 방식을 참조하여, 제2 측면의 제6 가능한 구현 방식으로, 결정 유닛은 구체적으로, 각 오디오 프레임에 대해, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크지 않은 것 및/또는 오디오 프레임의 코딩 유형이 과도 상태(transient)가 아닌 것으로 결정하는 때, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하고, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고 오디오 프레임의 코딩 유형이 과도 상태인 것으로 결정하는 때, 제2 수정 가중치를 결정하도록 구성된다.
제2 측면의 제5 가능한 구현 방식을 참조하여, 제2 측면의 제7 가능한 구현 방식으로, 결정 유닛은 구체적으로, 각 오디오 프레임에 대해, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크지 않은 것 및/또는 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작지 않은 것으로 결정하는 때, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하고, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작은 것으로 결정하는 때, 제2 수정 가중치를 결정하도록 구성된다.
제2 측면의 제5 가능한 구현 방식을 참조하여, 제2 측면의 제8 가능한 구현 방식으로, 결정 유닛은 구체적으로, 각 오디오 프레임에 대해, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작은 것, 및/또는 이전 오디오 프레임의 코딩 유형이, 유성음(voiced), 일반(generic), 과도 상태(transient), 및 오디오(audio)의 네 가지 유형 중 하나가 아닌 것, 및/또는 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 크지 않은 것으로 결정하는 때, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하고, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작고, 이전 오디오 프레임의 코딩 유형이 유성음, 일반, 과도 상태, 및 오디오의 네 가지 유형 중 하나이며, 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 큰 것으로 결정하는 때, 제2 수정 가중치를 결정하도록 구성된다.
본 발명의 실시예에서, 오디오의 각 오디오 프레임에 대해, 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는 것으로 결정되는 때, 오디오 프레임의 선형 스펙트럼 주파수 (LSF: linear spectral frequency) 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치가 결정되거나, 오디오 프레임의 신호 특성 및 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하지 않는 것으로 결정되는 때, 제2 수정 가중치가 결정되며, 여기서 미리 설정된 수정 조건은 오디오 프레임의 신호 특성이 이전 오디오 프레임의 신호 특성과 유사한 것으로 결정하는 데 사용되고, 결정된 제1 수정 가중치 또는 결정된 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터가 수정되며, 오디오 프레임의 수정된 선형 예측 파라미터에 따라 오디오 프레임이 코딩된다. 이 방식으로, 오디오 프레임의 신호 특성이 오디오 프레임의 이전 오디오 프레임의 신호 특성과 유사한지 여부에 따라, 상이한 수정 가중치가 결정되고, 오디오 프레임의 선형 예측 파라미터가 수정되어, 오디오 프레임들 사이의 스펙트럼이 보다 안정적이다. 게다가, 오디오 프레임은 오디오 프레임의 수정된 선형 예측 파라미터에 따라 코딩되어, 비트 레잇이 변하지 않음이 보장되면서 디코딩에 의해 복원된 스펙트럼의 인터-프레임 연속성이 향상되므로, 디코딩에 의해 복원된 스펙트럼이 원본 스펙트럼에 더 가깝고, 코딩 성능이 개선된다.
본 발명의 실시예의 기술적 해결책을 보다 명확하게 설명하기 위해, 이하에서는 실시예를 설명하기 위해 요구되는 첨부 도면을 간단히 소개한다. 명백하게, 다음의 설명에서의 첨부된 도면은 본 발명의 단지 일부 실시예를 도시하고, 당업자는 창조적인 노력 없이도 이들 도면으로부터 다른 도면을 유도할 수 있다.
도 1은 본 발명의 실시예에 따른 오디오 코딩 방법의 개략적인 순서도다.
도 1a는 실제 스펙트럼과 LSF 차이를 비교한 도면이다.
도 2는 본 발명의 실시예에 따른 오디오 코딩 방법의 응용 시나리오 예이다.
도 3은 본 발명의 실시예에 따른 오디오 코딩 장치의 개략적인 구조도이다.
도 4는 본 발명의 실시예에 따른 전자 장치의 개략적인 구조도이다.
이하, 본 발명의 실시예의 기술적 해결책을, 본 발명의 실시예의 첨부 도면을 참조하여 명확하게 설명한다. 명백하게, 설명된 실시예는 본 발명의 실시예의 전부가 아니라 일부에 불과하다. 창의적인 노력 없이 본 발명의 실시예에 기초하여 당업자에 의해 획득된 다른 모든 실시예는 본 발명의 보호 범위 내에 있다.
본 발명의 실시예에 따른 오디오 디코딩 방법의 순서도인 도 1을 참조하면, 방법은 다음을 포함한다.
단계(101): 각 오디오 프레임에 대해, 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는 것으로 결정하는 때, 전자 장치는 오디오 프레임의 선형 스펙트럼 주파수 (LSF: linear spectral frequency) 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하거나, 또는 오디오 프레임의 신호 특성 및 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하지 않는 것으로 결정하는 때, 전자 장치는 제2 수정 가중치를 결정하며, 여기서 미리 설정된 수정 조건은 오디오 프레임의 신호 특성이 이전 오디오 프레임의 신호 특성과 유사한 것으로 결정하는 데 사용된다.
단계(102): 전자 장치는 결정된 제1 수정 가중치 또는 결정된 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정한다.
선형 예측 파라미터는 LPC, LSP, ISP, LSF 등을 포함할 수 있다.
단계(103): 전자 장치는 오디오 프레임의 수정된 선형 예측 파라미터에 따라 오디오 프레임을 코딩한다.
본 실시예에서, 오디오의 각 오디오 프레임에 대해, 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는 것으로 결정하는 때, 전자 장치는 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하거나, 또는 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하지 않는 것으로 결정하는 때, 전자 장치는 제2 수정 가중치를 결정하며, 전자 장치는 결정된 제1 수정 가중치 또는 결정된 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하고, 오디오 프레임의 수정된 선형 예측 파라미터에 따라 오디오 프레임을 코딩한다. 이러한 방식으로, 오디오 프레임의 신호 특성이 오디오 프레임의 이전 오디오 프레임의 신호 특성과 유사한지에 따라 상이한 수정 가중치가 결정되고, 오디오 프레임의 선형 예측 파라미터가 수정되어, 오디오 프레임들 사이의 스펙트럼이 보다 안정적이다. 또한, 오디오 프레임의 신호 특성이 오디오 프레임의 이전 오디오 프레임의 신호 특성과 유사한지와 신호 특성이 가능한 한 1에 가까울 때, 결정되는 제2 수정 가중치에 따라 상이한 수정 가중치가 결정되어, 오디오 프레임의 신호 특성이 오디오 프레임의 이전 오디오 프레임의 신호 특성과 유지하지 않은 때, 오디오 프레임의 원본 스펙트럼 특징이 가능한 한 많이 유지되므로, 오디오의 코딩된 정보가 디코딩된 후에 획득된 오디오의 청각 품질이 더 좋다.
전자 장치가 단계(101)에서 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 충족시키는지 여부를 결정하는 특정 구현은 변경 조건의 특정 구현 예와 관련된다. 설명이 예를 사용하여 하기에서 제공된다.
가능한 구현 방식에서, 수정 조건은, 오디오 프레임이 전이 프레임이 아니면, 전자 장치가, 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는 것으로 결정하는 것은, 오디오 프레임이 전이 프레임이 아닌 것으로 결정하는 것을 포함할 수 있고, 여기서 비-마찰음에서 마찰음으로의 전이 프레임 또는 마찰음에서 비-마찰음으로의 전이 프레임을 포함하며, 전자 장치가, 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 충족시키지 않는 것으로 결정하는 것은, 오디오 프레임이 전이 프레임인 것으로 결정하는 것을 포함할 수 있다.
가능한 구현 방식에서, 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임인지 여부를 결정하는 것은 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 큰지, 및 오디오 프레임의 코딩 타입이 일시적인지를 결정하여 구현될 수 있다. 특히, 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임인 것으로 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고 오디오 프레임의 코딩 유형이 과도 상태(transient)인 것으로 결정하는 것을 포함할 수 있고, 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임이 아닌 것으로 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크지 않은 것 및/또는 코딩 유형이 전이가 아닌 것을 결정하는 것을 포함할 수 있다.
다른 가능한 구현 방식에서, 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임인지를 결정하는 것은 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 주파수 임계치보다 큰지를 결정하는 것, 그리고 오디오 프레임의 스펙트럼 틸트 주파수는 제2 주파수 임계치보다 작은지를 결정하는 것에 의해 구현될 수 있다. 특히, 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임인 것으로 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작은 것을 결정하는 것을 포함할 수 있다. 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임이 아닌 것으로 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크지 않은 것 및/또는 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작지 않은 것을 결정하는 것을 포함할 수 있다. 제1 스펙트럼 틸트 주파수 임계치 및 제2 스펙트럼 틸트 주파수 임계치의 구체적인 값은 본 발명의 실시예에 제한되지 않으며, 제1 스펙트럼 틸트 주파수 임계치 및 제2 스펙트럼 틸트 주파수 임계치의 값 사이의 관계는 제한되지 않는다. 선택적으로, 본 발명의 실시예에서, 제1 스펙트럼 틸트 주파수 임계치는 5.0일 수 있고; 본 발명의 다른 실시예에서, 제2 스펙트럼 틸트 주파수 임계치는 1.0일 수 있다.
가능한 구현 방식에서, 오디오 프레임이 비-마찰음에서 마찰음으로의 전이 프레임인지를 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 주파수 임계치보다 작은지를 결정하는 것, 이전 오디오 프레임의 코딩 유형이 유성음(voiced), 일반(generic), 과도 상태(transient), 및 오디오(audio)의 네 가지 유형 중 하나인지를 결정하는 것, 그리고 오디오 프레임의 스펙트럼 틸트 주파수가 제4 주파수 임계치보다 큰지를 결정하는 것에 의해 구현될 수 있다. 특히, 오디오 프레임이 비-마찰음에서 마찰음으로의 전이 프레임인 것으로 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작고, 이전의 오디오 프레임의 코딩 유형이 유성음, 일반, 과도 상태, 및 오디오의 네 가지 유형 중 하나이며, 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 큰 것으로 결정하는 것을 포함할 수 있다. 그리고 오디오 프레임이 비-마찰음에서 마찰음으로의 전이 프레임이 아니라고 결정하는 것은, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작지 않은 것, 및/또는 이전 오디오 프레임의 유형이 유성음, 일반, 과도 상태, 및 오디오의 네 가지 유형 중 하나가 아닌 것, 및/또는 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 크지 않은 것으로 결정하는 것을 포함할 수 있다. 제3 스펙트럼 틸트 주파수 임계치 및 제4 스펙트럼 틸트 주파수 임계치의 구체적인 값은 본 발명의 실시예에 제한되지 않으며, 제3 스펙트럼 틸트 주파수 임계치 및 제4 스펙트럼 틸트 주파수 임계치의 값 사이의 관계는 제한되지 않는다. 본 발명의 실시예에서, 제3 스펙트럼 틸트 주파수 임계치는 3.0일 수 있고, 본 발명의 다른 실시예에서, 제4 스펙트럼 틸트 주파수 임계치는 5.0일 수 있다.
단계(101)에서, 전자 장치가, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하는 단계는, 전자 장치가, 다음의 수학식을 사용하여 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하는 단계를 포함할 수 있다.
Figure pat00007
여기서, w[i]는 제1 수정 가중치이고, lsf_new_diff[i]는 오디오 프레임의 LSF 차이이며, lsf_new_diff[i]=lsf_new[i]-lsf_new[i-1]이고, lsf_new[i]는 오디오 프레임의 i번째 차수의 LSF 파라미터이며, lsf_new[i-1]는 오디오 프레임의 i-1번째 차수의 LSF 파라미터이고, lsf_old_diff[i]는 오디오 프레임의 이전 오디오 프레임의 LSF 차이이며, lsf_old_diff[i]=lsf_old[i]-lsf_old[i-1]이고, lsf_old[i]는 오디오 프레임의 i-1번째 차수의 LSF 파라미터이며, lsf_old[i-1]는 오디오 프레임의 이전 오디오 프레임의 i-1번째 차수의 LSF 파라미터이고, i는 LSF 파라미터의 차수 및 LSF 차이의 차수이며, i의 값은 0 내지 M-1의 범위이고, M은 선형 예측 파라미터의 차수이다.
수학식의 원리는 다음과 같다.
실제 스펙트럼과 LSF 차이들 사이를 비교한 도면인 도 1a를 참조한다. 도면으로부터 알 수 있는 바와 같이, 오디오 프레임 내의 LSF 차이(lsf_new_diff[i])는 오디오 프레임의 스펙트럼 에너지 추세를 반영한다. 더 작은 lsf_new_diff[i]는 대응하는 주파수 포인트의 더 큰 스펙트럼 에너지를 나타낸다.
더 작은 w[i]=lsf_new_diff[i]/lsf_old_diff[i]는 lsf_new[i]에 대응하는 주파수 포인트에서의 이전 프레임과 현재 프레임 사이의 더 큰 스펙트럼 에너지 차이, 및 오디오 프레임의 스펙트럼 에너지가 이전 오디오 프레임에 대응하는 주파수 포인트의 스펙트럼 에너지보다 훨씬 더 큰 것을 나타낸다.
더 작은 w[i]=lsf_new_diff[i]/lsf_old_diff[i]는 lsf_new[i]에 대응하는 주파수 포인트에서의 이전 프레임과 현재 프레임 사이의 더 작은 스펙트럼 에너지 차이, 및 오디오 프레임의 스펙트럼 에너지가 이전 오디오 프레임에 대응하는 주파수 포인트의 스펙트럼 에너지보다 훨씬 더 작은 것을 나타낸다.
따라서, 이전 프레임과 현재 프레임의 사이의 스펙트럼을 안정하게 하기 위해, w[i]는 오디오 프레임(lsf_new[i])의 가중치로서 사용될 수 있고, 1-w[i]는 이전 오디오 프레임에 대응하는 주파수 포인트의 가중치로서 사용된다. 자세한 내용은 수학식 2에서 나타낸다.
단계(101)에서, 전자 장치가, 제2 수정 가중치를 결정하는 단계는,
전자 장치가, 제2 수정 가중치를 0보다 크고, 1 이하인 미리 설정된 수정 가중치 값으로서 결정하는 것을 포함할 수 있다.
바람직하게는, 미리 설정된 수정 가중치는 1에 가까운 값이다.
단계(102)에서, 전자 장치가, 결정된 제1 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하는 단계는,
다음 수학식을 사용하여 제1 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하는 것을 포함할 수 있다.
Figure pat00008
여기서, w[i]는 제1 수정 가중치이고, L[i]는 오디오 프레임의 수정된 선형 예측 파라미터이며, L_new[i]는 오디오 프레임의 선형 예측 파라미터이고, L_old[i]는 오디오 프레임의 이전 오디오 프레임의 선형 예측 파라미터이며, i는 선형 예측 파라미터의 차수이고, i의 값은 0 내지 M-1이며, M은 선형 예측 파라미터의 차수이다.
단계(102)에서, 전자 장치가, 결정된 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하는 단계는,
다음의 수학식을 사용하여 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하는 것을 포함할 수 있다.
Figure pat00009
여기서, y는 제2 수정 가중치이고, L[i]는 오디오 프레임의 수정된 선형 예측 파라미터이며, L_new[i]는 오디오 프레임의 선형 예측 파라미터이고, L_old[i]는 오디오 프레임의 이전 오디오 프레임의 선형 예측 파라미터이며, i는 선형 예측 파라미터의 차수이고, i의 값은 0 내지 M-1이며, M은 선형 예측 파라미터의 차수이다.
단계(103)에서, 전자 장치가 오디오 프레임의 수정된 선형 예측 파라미터에 따라 오디오 프레임을 구체적으로 코딩하는 방법은 관련된 시간 도메인 대역폭 확장 기술을 참조하며, 본 발명에서 상세한 설명은 생략한다.
본 발명의 실시예에 따른 오디오 코딩 방법은 도 2에 도시된 시간 도메인 대역폭 확장 방법에 적용될 수 있다. 시간 영역 대역폭 확장 방법에서,
원본 오디오 신호는 저-대역 신호와 고-대역 신호로 구분되고,
저-대역 신호에 대해, 저-대역 신호 코딩, 저-대역 여기 신호 전처리, LP 합성, 및 시간-도메인 포락선 계산 및 양자화와 같은 처리가 순차적으로 수행되며,
고-대역 신호에 대해, 고-대역 신호 전처리, LP 분석, 및 LPC 양자화와 같은 처리가 순차적으로 수행되고,
MUX는 저-대역 신호 코딩 결과, LPC 양자화 결과, 및 시간-도메인 포락선 계산 및 양자화 결과에 따라 오디오 신호에 대해 수행된다.
LPC 양자화는 본 발명의 실시예에서 단계(101) 및 단계(102)에 대응하고, 오디오 신호에 대해 수행되는 MUX는 본 발명의 실시예에서 단계(103)에 대응한다.
본 발명의 실시예에 따른 오디오 코딩 장치의 개략적인 구조도인 도 3을 참조한다. 장치는 전자 장치 내에 배치될 수 있다. 장치(300)는 결정 유닛(310), 수정 유닛(320), 및 코딩 유닛(330)을 포함할 수 있다.
결정 유닛(310)은 오디오 내의 각 오디오 프레임에 대해, 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는 것으로 결정하는 때, 오디오 프레임의 선형 스펙트럼 주파수 (LSF: linear spectral frequency) 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하거나, 또는 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하지 않는 것으로 결정하는 때, 제2 수정 가중치를 결정하도록 구성되고, 여기서 미리 설정된 수정 조건은 오디오 프레임의 신호 특성이 오디오 프레임의 이전 오디오 프레임의 신호 특성과 유사한 것으로 결정하는 데 사용된다.
수정 유닛(320)은 결정 유닛(310)에 의해 결정된 제1 수정 가중치 또는 결정 유닛에 의해 결정된 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하도록 구성된다.
코딩 유닛(330)은 오디오 프레임의 수정된 선형 예측 파라미터에 따라 오디오 프레임을 코딩하도록 구성되며, 여기서 수정된 선형 예측 파라미터는 수정 유닛(321)에 의한 수정 후에 획득된다.
선택적으로, 결정 유닛(310)은 다음의 수학식 4를 이용하여 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하도록 구성될 수 있다.
Figure pat00010
여기서 w[i]는 제1 수정 가중치이고, lsf_new_diff[i]는 오디오 프레임의 LSF 차이이며, lsf_old_diff[i]는 오디오 프레임의 이전 오디오 프레임의 LSF 차이이고, i는 LSF 차이의 차수이며, i의 값은 0 내지 M-1이고, M은 선형 예측 파라미터의 차수이다.
선택적으로, 결정 유닛(310)은 구체적으로 제2 수정 가중치를 0보다 크고, 1 이하인 미리 설정된 수정 가중치 값으로서 결정하도록 구성될 수 있다.
선택적으로, 수정 유닛(320)은 다음의 수학식 5를 사용하여 제1 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하도록 구성될 수 있다.
Figure pat00011
w[i]는 제1 수정 가중치이고, L[i]는 오디오 프레임의 수정된 선형 예측 파라미터이며, L_new[i]는 오디오 프레임의 선형 예측 파라미터이고, L_old[i]는 이전 오디오 프레임의 선형 예측 파라미터이며, i는 선형 예측 파라미터의 차수이고, i의 값은 0 내지 M-1이고, M은 선형 예측 파라미터의 차수이다.
선택적으로, 수정 유닛(320)은 다음의 수학식 6을 사용하여 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하도록 구성될 수 있다.
Figure pat00012
y는 제2 수정 가중치이고, L[i]는 오디오 프레임의 수정된 선형 예측 파라미터이며, L_new[i]는 오디오 프레임의 선형 예측 파라미터이고, L_old[i]는 이전 오디오 프레임의 선형 예측 파라미터이며, i는 선형 예측 파라미터의 차수이고, i의 값은 0 내지 M-1이고, M은 선형 예측 파라미터의 차수이다.
선택적으로, 결정 유닛(310)은, 오디오 내의 각 오디오 프레임에 대해, 오디오 프레임이 전이 프레임이 아닌 것으로 결정하는 때, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하고, 오디오 프레임이 전이 프레임인 것으로 결정하는 때, 제2 수정 가중치를 결정하도록 구성될 수 있고, 여기서 전이 프레임은 전이 프레임은 비-마찰음(non-fricative)에서 마찰음(fricative)으로의 전이 프레임, 또는 마찰음에서 비-마찰음으로의 전이 프레임을 포함한다.
선택적으로, 결정 유닛(310)은 오디오 내의 각 오디오 프레임에 대해, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크지 않은 것 및/또는 오디오 프레임의 코딩 유형이 과도 상태(transient)가 아닌 것으로 결정하는 때, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하고, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고 오디오 프레임의 코딩 유형이 과도 상태인 것으로 결정하는 때, 제2 수정 가중치를 결정하도록 구성될 수 있다.
선택적으로, 결정 유닛(310)은 오디오 내의 각 오디오 프레임에 대해, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크지 않은 것 및/또는 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작지 않은 것으로 결정하는 때, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하고, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작은 것으로 결정하는 때, 제2 수정 가중치를 결정하도록 구성될 수 있다.
선택적으로, 결정 유닛(310)은, 각 오디오 프레임에 대해, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작은 것, 및/또는 이전 오디오 프레임의 코딩 유형이, 유성음(voiced), 일반(generic), 과도 상태(transient), 및 오디오(audio)의 네 가지 유형 중 하나가 아닌 것, 및/또는 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 크지 않은 것으로 결정하는 때, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하고, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작고, 이전 오디오 프레임의 코딩 유형이 유성음, 일반, 과도 상태, 및 오디오의 네 가지 유형 중 하나이며, 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 큰 것으로 결정하는 때, 제2 수정 가중치를 결정하도록 구성될 수 있다.
본 실시예에서, 오디오의 각 오디오 프레임에 대해, 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는 것으로 결정하는 때, 전자 장치는 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하거나, 또는 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하지 않는 것으로 결정하는 때, 전자 장치는 제2 수정 가중치를 결정하고, 전자 장치는 결정된 제1 수정 가중치 또는 결정된 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하고, 오디오 프레임의 수정된 선형 예측 파라미터에 따라 오디오 프레임을 코딩한다.
이 방식으로, 오디오 프레임의 신호 특성과 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는지에 따라 상이한 수정 가중치가 결정되고, 오디오 프레임의 선형 예측 파라미터가 수정되어, 오디오 프레임들 사이의 스펙트럼은 보다 안정적이다. 또한, 전자 장치는 오디오 프레임의 수정된 선형 예측 파라미터에 따라 오디오 프레임을 코딩하므로, 비트 레잇이 변하지 않거나 또는 비트 레잇이 약간 변하는 동안 더 넓은 대역폭을 갖는 오디오가 코딩되는 것이 보장될 수 있다.
본 발명의 실시예에 따른 제1 노드의 구조도인 도 4를 참조한다. 제1 노드(400)는 프로세서(410), 메모리(420), 트랜시버(430), 및 버스(440)를 포함한다.
프로세서(410), 메모리(420), 및 송수신기(430)는 버스(440)를 사용하여 서로 연결되고, 버스(440)는 ISA 버스, PCI 버스, 또는 EISA 버스 등일 수 있다. 버스는 어드레스 버스, 데이터 버스, 제어 버스 등으로 분류될 수 있다. 표현의 용이함을 위해, 도 4의 버스는 단 하나의 굵은 선을 사용하여 나타내지만, 버스가 단 하나 있거나 또는 단 하나의 버스 유형만 있음을 나타내지는 않는다.
메모리(420)는 프로그램을 저장하도록 구성된다. 구체적으로, 프로그램은 프로그램 코드를 포함할 수 있고, 프로그램 코드는 컴퓨터 동작 명령을 포함한다. 메모리(420)는 고속 RAM 메모리를 포함할 수 있고, 적어도 하나의 자기 디스크 메모리와 같은 비-휘발성 메모리를 더 포함할 수 있다.
송수신기(430)는 다른 장치들을 연결하고, 다른 장치들과 통신하도록 구성된다.
프로세서(410)는 프로그램 코드를 실행하고, 오디오 내의 각 오디오 프레임에 대해, 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는 것으로 결정하는 때, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하거나, 또는 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하지 않는 것으로 결정하는 때, 제2 수정 가중치를 결정하고, 결정된 제1 수정 가중치 또는 결정 유닛에 의해 결정된 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하며, 오디오 프레임의 수정된 선형 예측 파라미터에 따라 오디오 프레임을 코딩하도록 구성되고, 여기서 미리 설정된 수정 조건은 오디오 프레임의 신호 특성이 이전 오디오 프레임의 신호 특성과 유사한 것으로 결정하는 데 사용된다.
선택적으로, 프로세서(410)는 다음의 수학식 7을 사용하여 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하도록 구성될 수 있다.
Figure pat00013
w[i]는 제1 수정 가중치이고, lsf_new_diff[i]는 오디오 프레임의 LSF 차이이며, lsf_old_diff[i]는 오디오 프레임의 이전 오디오 프레임의 LSF 차이이고, i는 LSF 차이의 차수이며, i의 값은 0 내지 M-1이고, M은 선형 예측 파라미터의 차수이다.
선택적으로, 프로세서(410)는 구체적으로 제2 수정 가중치를 1로 결정하거나, 또는 제2 수정 가중치를 0보다 크고, 1 이하인 미리 설정된 수정 가중치 값으로서 결정하도록 구성될 수 있다.
선택적으로, 프로세서(410)는 구체적으로 다음의 수학식 8을 사용하여 제1 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하도록 구성될 수 있다.
Figure pat00014
여기서, w[i]는 제1 수정 가중치이고, L[i]는 오디오 프레임의 수정된 선형 예측 파라미터이며, L_new[i]는 오디오 프레임의 선형 예측 파라미터이고, L_old[i]는 오디오 프레임의 이전 오디오 프레임의 선형 예측 파라미터이며, i는 선형 예측 파라미터의 차수이고, i의 값은 0 내지 M-1이고, M은 선형 예측 파라미터의 차수이다.
선택적으로, 프로세서(410)는 구체적으로, 다음의 수학식 9를 사용하여 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하도록 구성될 수 있다.
Figure pat00015
여기서, y는 제2 수정 가중치이고, L[i]는 오디오 프레임의 수정된 선형 예측 파라미터이며, L_new[i]는 오디오 프레임의 선형 예측 파라미터이고, L_old[i]는 오디오 프레임의 이전 오디오 프레임의 선형 예측 파라미터이며, i는 선형 예측 파라미터의 차수이고, i의 값은 0 내지 M-1이고, M은 선형 예측 파라미터의 차수이다.
선택적으로, 프로세서(410)는 구체적으로, 오디오의 각 오디오 프레임에 대해, 오디오 프레임이 전이 프레임이 아닌 것으로 결정하는 때, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하고, 오디오 프레임이 전이 프레임인 것으로 결정하는 때, 제2 수정 가중치를 결정하도록 구성될 수 있고, 여기서 전이 프레임은 전이 프레임은 비-마찰음(non-fricative)에서 마찰음(fricative)으로의 전이 프레임, 또는 마찰음에서 비-마찰음으로의 전이 프레임을 포함한다.
선택적으로, 프로세서(410)는 구체적으로, 오디오 내의 각 오디오 프레임에 대해, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크지 않은 것 및/또는 오디오 프레임의 코딩 유형이 과도 상태(transient)가 아닌 것으로 결정하는 때, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하고, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고 오디오 프레임의 코딩 유형이 과도 상태인 것으로 결정하는 때, 제2 수정 가중치를 결정하도록 구성될 수 있거나, 오디오 내의 각 오디오 프레임에 대해, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크지 않은 것 및/또는 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작지 않은 것으로 결정하는 때, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하고, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작은 것으로 결정하는 때, 제2 수정 가중치를 결정하도록 구성될 수 있다.
선택적으로, 프로세서(410)는 구체적으로, 오디오 내의 각 오디오 프레임에 대해, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작은 것, 및/또는 이전 오디오 프레임의 코딩 유형이, 유성음(voiced), 일반(generic), 과도 상태(transient), 및 오디오(audio)의 네 가지 유형 중 하나가 아닌 것, 및/또는 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 크지 않은 것으로 결정하는 때, 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하고, 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작고, 이전 오디오 프레임의 코딩 유형이 유성음, 일반, 과도 상태, 및 오디오의 네 가지 유형 중 하나이며, 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 큰 것으로 결정하는 때, 제2 수정 가중치를 결정하도록 구성될 수 있다.
본 실시예에서, 오디오의 각 오디오 프레임에 대해, 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는 것으로 결정하는 때, 전자 장치는 오디오 프레임의 LSF 차이 및 이전 오디오 프레임의 LSF 차이에 따라 제1 수정 가중치를 결정하거나, 또는 오디오 프레임의 신호 특성 및 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하지 않는 것으로 결정하는 때, 전자 장치는 제2 수정 가중치를 결정하고, 전자 장치는 결정된 제1 수정 가중치 또는 결정된 제2 수정 가중치에 따라 오디오 프레임의 선형 예측 파라미터를 수정하고, 오디오 프레임의 수정된 선형 예측 파라미터에 따라 오디오 프레임을 코딩한다. 이 방식으로, 오디오 프레임의 신호 특성과 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는지에 따라 상이한 수정 가중치가 결정되고, 오디오 프레임의 선형 예측 파라미터가 수정되어, 오디오 프레임들 사이의 스펙트럼은 보다 안정적이다. 또한, 전자 장치는 오디오 프레임의 수정된 선형 예측 파라미터에 따라 오디오 프레임을 코딩하므로, 비트 레잇이 변하지 않거나 또는 비트 레잇이 약간 변하는 동안 더 넓은 대역폭을 갖는 오디오가 코딩되는 것이 보장될 수 있다.
당업자는 필요한 일반적인 하드웨어 플랫폼에 부가하여 소프트웨어에 의해 본 발명의 실시예에서의 기술이 구현될 수 있음을 명확히 이해할 수 있다. 이러한 이해에 기초하여, 본질적으로 본 발명의 기술적 해결책 또는 종래 기술에 기여하는 부분은 소프트웨어 제품의 형태로 구현될 수 있다. 소프트웨어 제품은 ROM/RAM, 하드 디스크, 또는 광 디스크와 같은 저장 매체에 저장되고, 본 발명의 실시예 또는 실시예의 일부에서 설명된 방법을 수행하도록, 컴퓨터 장치(개인용 컴퓨터, 서버, 또는 네트워크 장치일 수 있음)를 지시하기 위한 여러 명령을 포함한다.
본 명세서에서, 실시예들은 점진적으로 설명된다. 실시예들의 동일하거나 유사한 부분에 대해서 서로 참조될 수 있다. 각 실시예는 다른 실시예와의 차이점에 초점을 맞추고 있다. 특히, 시스템 실시예는 기본적으로 방법 실시예와 유사하므로 간략하게 설명된다. 관련된 부분에 대해서는, 방법 실시예의 부분에서의 설명을 참조할 수 있다.
전술한 설명은 본 발명의 구현 방식이지만, 본 발명의 보호 범위를 제한하려는 것은 아니다. 본 발명의 사상 및 원리를 벗어나지 않는 한, 임의의 수정, 동등한 대체, 또는 개선은 본 발명의 보호 범위 내에 있다.

Claims (21)

  1. 매체에 저장된 컴퓨터 프로그램으로서, 상기 프로그램은 실행되면 컴퓨터로 하여금, 다음의 단계들:
    각 오디오 프레임에 대해, 상기 오디오 프레임의 신호 특성 및 상기 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는 것으로 결정하는 때, 상기 오디오 프레임에서 선형 스펙트럼 주파수 (LSF: linear spectral frequency) 간의 차이 및 상기 이전 오디오 프레임에서 LSF 간의 차이에 따라 제1 수정 가중치를 결정하거나, 또는 상기 오디오 프레임의 신호 특성 및 상기 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하지 않는 것으로 결정하는 때, 제2 수정 가중치를 결정하는 단계,
    상기 결정된 제1 수정 가중치 또는 상기 결정된 제2 수정 가중치에 따라 상기 오디오 프레임의 선형 예측 파라미터를 수정하는 단계, 그리고
    상기 오디오 프레임의 수정된 선형 예측 파라미터에 따라 상기 오디오 프레임을 코딩하는 단계
    를 수행하도록 하는 컴퓨터 프로그램.
  2. 제1항에 있어서,
    상기 오디오 프레임의 LSF 간의 차이 및 상기 이전 오디오 프레임의 LSF 간의 차이에 따라 제1 수정 가중치를 결정하는 것은, 다음의 수식을 사용하여 상기 제1 수정 가중치를 결정하는 것을 포함하고,
    Figure pat00016
    ,
    w[i]는 상기 제1 수정 가중치이고, lsf_new_diff[i]는 상기 오디오 프레임의 LSF 간의 차이이며, lsf_old_diff[i]는 상기 이전 오디오 프레임의 LSF 간의 차이이고, i는 LSF 간의 차이의 차수이며, i의 값은 0 내지 M-1이고, M은 상기 선형 예측 파라미터의 차수인,
    컴퓨터 프로그램.
  3. 제1항에 있어서,
    상기 제2 수정 가중치를 결정하는 것은, 상기 제2 수정 가중치를 0보다 크고, 1 이하인 미리 설정된 수정 가중치 값으로서 결정하는 것을 포함하는,
    컴퓨터 프로그램.
  4. 제1항에 있어서,
    상기 결정된 제1 수정 가중치에 따라 상기 오디오 프레임의 선형 예측 파라미터를 수정하는 것은, 다음의 수식을 사용하여 상기 제1 수정 가중치에 따라 상기 오디오 프레임의 선형 예측 파라미터를 수정하는 것을 포함하고,
    L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i],
    w[i]는 상기 제1 수정 가중치이고, L[i]는 상기 오디오 프레임의 수정된 선형 예측 파라미터이며, L_new[i]는 상기 오디오 프레임의 선형 예측 파라미터이고, L_old[i]는 상기 이전 오디오 프레임의 선형 예측 파라미터이며, i는 상기 선형 예측 파라미터의 차수이고, i의 값은 0 내지 M-1이고, M은 상기 선형 예측 파라미터의 차수인,
    컴퓨터 프로그램.
  5. 제1항에 있어서,
    상기 결정된 제2 수정 가중치에 따라 상기 오디오 프레임의 선형 예측 파라미터를 수정하는 것은, 다음의 수식을 사용하여 상기 제2 수정 가중치에 따라 상기 오디오 프레임의 선형 예측 파라미터를 수정하는 것을 포함하고,
    L[i]=(1-y)*L_old[i]+y*L_new[i],
    y는 상기 제2 수정 가중치이고, L[i]는 상기 오디오 프레임의 수정된 선형 예측 파라미터이며, L_new[i]는 상기 오디오 프레임의 선형 예측 파라미터이고, L_old[i]는 상기 이전 오디오 프레임의 선형 예측 파라미터이며, i는 상기 선형 예측 파라미터의 차수이고, i의 값은 0 내지 M-1이고, M은 상기 선형 예측 파라미터의 차수인,
    컴퓨터 프로그램.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    상기 오디오 프레임의 신호 특성 및 상기 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하는 것으로 결정하는 것은 상기 오디오 프레임이 전이 프레임(transition frame)이 아닌 것으로 결정하는 것을 포함하고 - 상기 전이 프레임은 비-마찰음(non-fricative)에서 마찰음(fricative)으로의 전이 프레임 또는 마찰음에서 비-마찰음으로의 전이 프레임을 포함함 -,
    상기 오디오 프레임의 신호 특성 및 상기 오디오 프레임의 이전 오디오 프레임의 신호 특성이 미리 설정된 수정 조건을 만족하지 않는 것으로 결정하는 것은 상기 오디오 프레임이 전이 프레임인 것으로 결정하는 것을 포함하는,
    컴퓨터 프로그램.
  7. 제6항에 있어서,
    상기 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임인 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고, 상기 오디오 프레임의 코딩 유형이 과도 상태(transient)인 것으로 결정하는 것을 포함하고,
    상기 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임이 아닌 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크지 않은 것, 및/또는 상기 오디오 프레임의 코딩 유형이 과도 상태가 아닌 것으로 결정하는 것을 포함하는,
    컴퓨터 프로그램.
  8. 제6항에 있어서,
    상기 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임인 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고, 상기 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작은 것으로 결정하는 것을 포함하고,
    상기 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임이 아닌 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크지 않은 것, 및/또는 상기 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작지 않은 것으로 결정하는 것을 포함하는,
    컴퓨터 프로그램.
  9. 제6항에 있어서,
    상기 오디오 프레임이 비-마찰음에서 마찰음으로의 전이 프레임인 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작고, 상기 이전 오디오 프레임의 코딩 유형이, 유성음(voiced), 일반(generic), 과도 상태(transient), 및 오디오(audio)의 네 가지 유형 중 하나이고, 상기 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 큰 것으로 결정하는 것을 포함하고,
    상기 오디오 프레임이 비-마찰음에서 마찰음으로의 전이 프레임이 아닌 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 상기 제3 스펙트럼 틸트 주파수 임계치보다 작지 않은 것, 및/또는 상기 이전 오디오 프레임의 코딩 유형이, 유성음, 일반, 과도 상태, 및 오디오의 네 가지 유형 중 하나가 아닌 것, 및/또는 상기 오디오 프레임의 스펙트럼 틸트 주파수가 상기 제4 스펙트럼 틸트 주파수 임계치보다 크지 않은 것으로 결정하는 것을 포함하는,
    컴퓨터 프로그램.
  10. 제6항에 있어서,
    상기 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임인 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고, 상기 오디오 프레임의 코딩 유형이 과도 상태(transient)인 것으로 결정하는 것을 포함하는,
    컴퓨터 프로그램.
  11. 제6항에 있어서,
    상기 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임인 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고, 상기 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작은 것으로 결정하는 것을 포함하는,
    컴퓨터 프로그램.
  12. 제6항에 있어서,
    상기 오디오 프레임이 비-마찰음에서 마찰음으로의 전이 프레임인 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작고, 상기 이전 오디오 프레임의 코딩 유형이, 유성음(voiced), 일반(generic), 과도 상태(transient), 및 오디오(audio)의 네 가지 유형 중 하나이며, 상기 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 큰 것으로 결정하는 것을 포함하는,
    컴퓨터 프로그램.
  13. 매체에 저장된 컴퓨터 프로그램으로서, 상기 프로그램은 실행되면 컴퓨터로 하여금, 다음의 단계들:
    각 오디오 프레임에 대해, 상기 오디오 프레임이 전이 프레임이 아닌 것으로 결정하는 때 - 상기 전이 프레임은 비-마찰음(non-fricative)에서 마찰음(fricative)으로의 전이 프레임 또는 마찰음에서 비-마찰음으로의 전이 프레임을 포함함 -, 상기 오디오 프레임에서 선형 스펙트럼 주파수 (LSF: linear spectral frequency) 간의 차이 및 이전 오디오 프레임에서 LSF 간의 차이에 따라 제1 수정 가중치를 결정하는 단계,
    상기 결정된 제1 수정 가중치에 따라 상기 오디오 프레임의 선형 예측 파라미터를 수정하는 단계, 그리고
    상기 오디오 프레임의 수정된 선형 예측 파라미터에 따라 상기 오디오 프레임을 코딩하는 단계
    를 수행하도록 하는 컴퓨터 프로그램.
  14. 제13항에 있어서,
    상기 오디오 프레임의 LSF 간의 차이 및 상기 이전 오디오 프레임의 LSF 간의 차이에 따라 제1 수정 가중치를 결정하는 것은, 다음의 수식을 사용하여 상기 제1 수정 가중치를 결정하는 것을 포함하고,
    Figure pat00017
    ,
    w[i]는 상기 제1 수정 가중치이고, lsf_new_diff[i]는 상기 오디오 프레임의 LSF 간의 차이이며, lsf_old_diff[i]는 상기 이전 오디오 프레임의 LSF 간의 차이이고, i는 LSF 간의 차이의 차수이며, i의 값은 0 내지 M-1이고, M은 상기 선형 예측 파라미터의 차수인,
    컴퓨터 프로그램.
  15. 제13항에 있어서,
    상기 결정된 제1 수정 가중치에 따라 상기 오디오 프레임의 선형 예측 파라미터를 수정하는 것은, 다음의 수식을 사용하여 상기 제1 수정 가중치에 따라 상기 오디오 프레임의 선형 예측 파라미터를 수정하는 것을 포함하고,
    L[i]=(1-w[i])*L_old[i]+w[i]*L_new[i],
    w[i]는 상기 제1 수정 가중치이고, L[i]는 상기 오디오 프레임의 수정된 선형 예측 파라미터이며, L_new[i]는 상기 오디오 프레임의 선형 예측 파라미터이고, L_old[i]는 상기 이전 오디오 프레임의 선형 예측 파라미터이며, i는 상기 선형 예측 파라미터의 차수이고, i의 값은 0 내지 M-1이고, M은 상기 선형 예측 파라미터의 차수인,
    컴퓨터 프로그램.
  16. 제13항에 있어서,
    상기 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임인 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고, 상기 오디오 프레임의 코딩 유형이 과도 상태(transient)인 것으로 결정하는 것을 포함하고,
    상기 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임이 아닌 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크지 않은 것, 및/또는 상기 오디오 프레임의 코딩 유형이 과도 상태가 아닌 것으로 결정하는 것을 포함하는,
    컴퓨터 프로그램.
  17. 제13항에 있어서,
    상기 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임인 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고, 상기 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작은 것으로 결정하는 것을 포함하고,
    상기 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임이 아닌 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크지 않은 것, 및/또는 상기 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작지 않은 것으로 결정하는 것을 포함하는,
    컴퓨터 프로그램.
  18. 제13항에 있어서,
    상기 오디오 프레임이 비-마찰음에서 마찰음으로의 전이 프레임인 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작고, 상기 이전 오디오 프레임의 코딩 유형이, 유성음(voiced), 일반(generic), 과도 상태(transient), 및 오디오(audio)의 네 가지 유형 중 하나이고, 상기 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 큰 것으로 결정하는 것을 포함하고,
    상기 오디오 프레임이 비-마찰음에서 마찰음으로의 전이 프레임이 아닌 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 상기 제3 스펙트럼 틸트 주파수 임계치보다 작지 않은 것, 및/또는 상기 이전 오디오 프레임의 코딩 유형이, 유성음, 일반, 과도 상태, 및 오디오의 네 가지 유형 중 하나가 아닌 것, 및/또는 상기 오디오 프레임의 스펙트럼 틸트 주파수가 상기 제4 스펙트럼 틸트 주파수 임계치보다 크지 않은 것으로 결정하는 것을 포함하는,
    컴퓨터 프로그램.
  19. 제13항에 있어서,
    상기 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임인 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고, 상기 오디오 프레임의 코딩 유형이 과도 상태(transient)인 것으로 결정하는 것을 포함하는,
    컴퓨터 프로그램.
  20. 제13항에 있어서,
    상기 오디오 프레임이 마찰음에서 비-마찰음으로의 전이 프레임인 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제1 스펙트럼 틸트 주파수 임계치보다 크고, 상기 오디오 프레임의 스펙트럼 틸트 주파수가 제2 스펙트럼 틸트 주파수 임계치보다 작은 것으로 결정하는 것을 포함하는,
    컴퓨터 프로그램.
  21. 제13항에 있어서,
    상기 오디오 프레임이 비-마찰음에서 마찰음으로의 전이 프레임인 것으로 결정하는 것은, 상기 이전 오디오 프레임의 스펙트럼 틸트 주파수가 제3 스펙트럼 틸트 주파수 임계치보다 작고, 상기 이전 오디오 프레임의 코딩 유형이, 유성음(voiced), 일반(generic), 과도 상태(transient), 및 오디오(audio)의 네 가지 유형 중 하나이며, 상기 오디오 프레임의 스펙트럼 틸트 주파수가 제4 스펙트럼 틸트 주파수 임계치보다 큰 것으로 결정하는 것을 포함하는,
    컴퓨터 프로그램.
KR1020197016886A 2014-06-27 2015-03-23 오디오 코딩 방법 및 장치 KR102130363B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201410299590.2 2014-06-27
CN201410299590 2014-06-27
CN201410426046.XA CN105225670B (zh) 2014-06-27 2014-08-26 一种音频编码方法和装置
CN201410426046.X 2014-08-26
PCT/CN2015/074850 WO2015196837A1 (zh) 2014-06-27 2015-03-23 一种音频编码方法和装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020187022368A Division KR101990538B1 (ko) 2014-06-27 2015-03-23 오디오 코딩 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20190071834A true KR20190071834A (ko) 2019-06-24
KR102130363B1 KR102130363B1 (ko) 2020-07-06

Family

ID=54936716

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020167034277A KR101888030B1 (ko) 2014-06-27 2015-03-23 오디오 코딩 방법 및 장치
KR1020187022368A KR101990538B1 (ko) 2014-06-27 2015-03-23 오디오 코딩 방법 및 장치
KR1020197016886A KR102130363B1 (ko) 2014-06-27 2015-03-23 오디오 코딩 방법 및 장치

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020167034277A KR101888030B1 (ko) 2014-06-27 2015-03-23 오디오 코딩 방법 및 장치
KR1020187022368A KR101990538B1 (ko) 2014-06-27 2015-03-23 오디오 코딩 방법 및 장치

Country Status (9)

Country Link
US (4) US9812143B2 (ko)
EP (3) EP3937169A3 (ko)
JP (1) JP6414635B2 (ko)
KR (3) KR101888030B1 (ko)
CN (2) CN106486129B (ko)
ES (2) ES2882485T3 (ko)
HU (1) HUE054555T2 (ko)
PL (1) PL3340242T3 (ko)
WO (1) WO2015196837A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6082126B2 (ja) * 2013-01-29 2017-02-15 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 音声信号を合成するための装置及び方法、デコーダ、エンコーダ、システム及びコンピュータプログラム
CN106486129B (zh) * 2014-06-27 2019-10-25 华为技术有限公司 一种音频编码方法和装置
CN114898761A (zh) * 2017-08-10 2022-08-12 华为技术有限公司 立体声信号编解码方法及装置
WO2019142513A1 (ja) * 2018-01-17 2019-07-25 日本電信電話株式会社 符号化装置、復号装置、摩擦音判定装置、これらの方法及びプログラム
CN111602197B (zh) * 2018-01-17 2023-09-05 日本电信电话株式会社 解码装置、编码装置、它们的方法以及计算机可读记录介质
JP7130878B2 (ja) * 2019-01-13 2022-09-05 華為技術有限公司 高分解能オーディオコーディング
CN110390939B (zh) * 2019-07-15 2021-08-20 珠海市杰理科技股份有限公司 音频压缩方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101888030B1 (ko) * 2014-06-27 2018-08-13 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 코딩 방법 및 장치

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW224191B (ko) 1992-01-28 1994-05-21 Qualcomm Inc
JP3270922B2 (ja) * 1996-09-09 2002-04-02 富士通株式会社 符号化,復号化方法及び符号化,復号化装置
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6199040B1 (en) * 1998-07-27 2001-03-06 Motorola, Inc. System and method for communicating a perceptually encoded speech spectrum signal
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US6330533B2 (en) 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
AU4072400A (en) * 1999-04-05 2000-10-23 Hughes Electronics Corporation A voicing measure as an estimate of signal periodicity for frequency domain interpolative speech codec system
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
CN1420487A (zh) * 2002-12-19 2003-05-28 北京工业大学 1kb/s线谱频率参数的一步插值预测矢量量化方法
US7720683B1 (en) * 2003-06-13 2010-05-18 Sensory, Inc. Method and apparatus of specifying and performing speech recognition operations
CN1677491A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
BRPI0510303A (pt) * 2004-04-27 2007-10-02 Matsushita Electric Ind Co Ltd dispositivo de codificação escalável, dispositivo de decodificação escalável, e seu método
US8938390B2 (en) * 2007-01-23 2015-01-20 Lena Foundation System and method for expressive language and developmental disorder assessment
NZ562182A (en) * 2005-04-01 2010-03-26 Qualcomm Inc Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal
DK1875463T3 (en) * 2005-04-22 2019-01-28 Qualcomm Inc SYSTEMS, PROCEDURES AND APPARATUS FOR AMPLIFIER FACTOR GLOSSARY
US8510105B2 (en) * 2005-10-21 2013-08-13 Nokia Corporation Compression and decompression of data vectors
JP4816115B2 (ja) * 2006-02-08 2011-11-16 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
CN1815552B (zh) * 2006-02-28 2010-05-12 安徽中科大讯飞信息科技有限公司 基于线谱频率及其阶间差分参数的频谱建模与语音增强方法
US8532984B2 (en) 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
WO2008032828A1 (fr) * 2006-09-15 2008-03-20 Panasonic Corporation Dispositif de codage audio et procédé de codage audio
KR100862662B1 (ko) 2006-11-28 2008-10-10 삼성전자주식회사 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치
WO2008091947A2 (en) * 2007-01-23 2008-07-31 Infoture, Inc. System and method for detection and analysis of speech
EP2945158B1 (en) 2007-03-05 2019-12-25 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for smoothing of stationary background noise
US8126707B2 (en) * 2007-04-05 2012-02-28 Texas Instruments Incorporated Method and system for speech compression
CN101114450B (zh) * 2007-07-20 2011-07-27 华中科技大学 一种语音编码选择性加密方法
BRPI0904958B1 (pt) * 2008-07-11 2020-03-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Aparelho e método para calcular dados de extensão de largura de banda usando um quadro controlado por inclinação espectral
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
CN102436820B (zh) * 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
KR101747917B1 (ko) 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
CA2833868C (en) 2011-04-21 2019-08-20 Samsung Electronics Co., Ltd. Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefor
CN102664003B (zh) * 2012-04-24 2013-12-04 南京邮电大学 基于谐波加噪声模型的残差激励信号合成及语音转换方法
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101888030B1 (ko) * 2014-06-27 2018-08-13 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 코딩 방법 및 장치
KR101990538B1 (ko) * 2014-06-27 2019-06-18 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 코딩 방법 및 장치

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Chit-Chung Kuo, et al. Low bit-rate quantization of LSP parameters using two-dimensional differential coding. IEEE ICASSP. 1992.03.23. *
Engin Erzin, et al. Interframe Differential coding of line spectrum frequencies. IEEE transactions on speech and audio processing. 1994.04. *

Also Published As

Publication number Publication date
KR20180089576A (ko) 2018-08-08
US20200027468A1 (en) 2020-01-23
US11133016B2 (en) 2021-09-28
EP3136383A1 (en) 2017-03-01
EP3136383B1 (en) 2017-12-27
ES2659068T3 (es) 2018-03-13
CN105225670B (zh) 2016-12-28
CN105225670A (zh) 2016-01-06
PL3340242T3 (pl) 2021-12-06
WO2015196837A1 (zh) 2015-12-30
KR101888030B1 (ko) 2018-08-13
ES2882485T3 (es) 2021-12-02
JP2017524164A (ja) 2017-08-24
US10460741B2 (en) 2019-10-29
EP3937169A2 (en) 2022-01-12
US9812143B2 (en) 2017-11-07
US20170372716A1 (en) 2017-12-28
EP3340242B1 (en) 2021-05-12
US20170076732A1 (en) 2017-03-16
KR20170003969A (ko) 2017-01-10
CN106486129B (zh) 2019-10-25
KR101990538B1 (ko) 2019-06-18
EP3340242A1 (en) 2018-06-27
KR102130363B1 (ko) 2020-07-06
HUE054555T2 (hu) 2021-09-28
EP3937169A3 (en) 2022-04-13
CN106486129A (zh) 2017-03-08
US20210390968A1 (en) 2021-12-16
JP6414635B2 (ja) 2018-10-31
EP3136383A4 (en) 2017-03-08

Similar Documents

Publication Publication Date Title
KR101990538B1 (ko) 오디오 코딩 방법 및 장치
JP6423420B2 (ja) 帯域幅拡張方法および装置
US10490199B2 (en) Bandwidth extension audio decoding method and device for predicting spectral envelope
KR102651379B1 (ko) 시간 지연 추정 방법 및 디바이스
BR122021000241B1 (pt) Aparelho de quantização de coeficientes de codificação preditiva linear
BR112015017753B1 (pt) Codificador de áudio, decodificador de áudio, método para fornecer uma informação de áudio codificado, método para fornecer uma informação de áudio decodificado, programa de computador e representação codificada utilizando uma extensão da largura de banda adaptável ao sinal.
BRPI0718300B1 (pt) Método e dispositivo para codificar quadros de transição em sinais de fala.
TR201802808T4 (tr) Bir zaman alan uyarma sinyalini baz alan bir hata gizleme kullanılarak kodu çözülmüş bir ses bilgisi sağlamak için ses dekoderi ve yöntem.
BR112015014956B1 (pt) Método de codificação de sinal de áudio, método de decodificação de sinal de áudio, aparelho de codificação de sinal de áudio e aparelho de decodificação de sinal de áudio
BR122020017853B1 (pt) Sistema e aparelho para codificar um sinal de voz em um fluxo de bits, e método e aparelho para decodificar sinal de áudio
US10121484B2 (en) Method and apparatus for decoding speech/audio bitstream
BR112013020588B1 (pt) Aparelho e método para codificação de uma parte de um sinal de áudio utilizando uma detecção transiente e um resultado de qualidade
BR112015018057B1 (pt) Sistemas, métodos, aparelho e mídia legível por computador para aperfeiçoamento do formante adaptativo na codificação de predição linear
RU2656812C2 (ru) Способ и устройство обработки сигналов
KR20220045260A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
ES2741009T3 (es) Codificador de audio y método para codificar una señal de audio

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant