KR20210130743A - 위상 ecu f0 보간 분할을 위한 방법 및 관련 제어기 - Google Patents

위상 ecu f0 보간 분할을 위한 방법 및 관련 제어기 Download PDF

Info

Publication number
KR20210130743A
KR20210130743A KR1020217028735A KR20217028735A KR20210130743A KR 20210130743 A KR20210130743 A KR 20210130743A KR 1020217028735 A KR1020217028735 A KR 1020217028735A KR 20217028735 A KR20217028735 A KR 20217028735A KR 20210130743 A KR20210130743 A KR 20210130743A
Authority
KR
South Korea
Prior art keywords
bin
tone
consecutive
fractional
values
Prior art date
Application number
KR1020217028735A
Other languages
English (en)
Inventor
마틴 셀스테트
Original Assignee
텔레폰악티에볼라겟엘엠에릭슨(펍)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 텔레폰악티에볼라겟엘엠에릭슨(펍) filed Critical 텔레폰악티에볼라겟엘엠에릭슨(펍)
Publication of KR20210130743A publication Critical patent/KR20210130743A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • G06F17/142Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Communication Control (AREA)

Abstract

수신된 오디오 신호와 연관된 손실된 오디오 프레임에 대한 은닉 방법을 제어하는 것이 제공된다. 적어도 하나의 톤에 대한 스펙트럼 표현의 적어도 하나의 빈 벡터가 획득되고, 여기서 상기 적어도 하나의 빈 벡터는 적어도 하나의 톤에 대한 3개의 연속적인 빈 값을 포함한다. 상기 3개의 연속적인 빈 값의 각각이 복소수 값 또는 실수 값인지의 여부가 결정된다. 상기 결정에 응답하여, 상기 3개의 연속적인 빈 값은 각각의 빈 값이 복소수 값 또는 실수 값을 갖는지에 기초하여 적어도 하나의 톤의 주파수를 추정하도록 처리된다.

Description

위상 ECU F0 보간 분할을 위한 방법 및 관련 제어기
본 개시는 일반적으로 손실된 오디오 프레임에 대한 은닉 방법을 제어하는 방법에 관한 것이다. 본 개시는 또한 수신된 오디오 신호의 손실된 오디오 프레임에 대한 은닉 방법을 제어하도록 구성된 제어기에 관한 것이다.
최신 통신 채널/네트워크를 통한 음성/오디오 전송은 주로 음성/오디오 코덱을 사용하여 디지털 영역에서 수행된다. 여기에는 아날로그 신호를 획득하고 샘플링 및 아날로그-디지털 변환기(ADC)를 사용하여 디지털화하여 디지털 샘플을 얻는 것이 포함될 수 있다. 이들 디지털 샘플은 애플리케이션에 따라 10-40 ms의 연속 기간의 샘플을 포함하는 프레임으로 더 그룹화될 수 있다. 다음에, 이들 프레임은 압축 알고리즘을 사용하여 처리될 수 있는 데, 이는 전송해야 하는 비트 수를 감소시키고 여전히 가능한 한 높은 품질을 달성할 수 있다. 그런 다음, 인코딩된 비트 스트림은 디지털 네트워크를 통해 수신기로 데이터 패킷으로 전송된다. 수신기에서는 프로세스가 반대이다. 상기 데이터 패킷들은 디지털 샘플로 프레임을 재생성하기 위해 먼저 디코딩될 수 있으며, 그 다음 수신기에서 입력 아날로그 신호의 근사치를 재생성하기 위해 디지털-아날로그 변환기(DAC)에 입력될 수 있다. 도 1은 상술한 접근 방식을 사용하여 디지털 네트워크와 같은 네트워크를 통해 오디오 인코더 및 디코더를 사용하는 오디오 전송의 블록도의 예를 제공한다.
데이터 패킷이 네트워크를 통해 전송될 때, 상기 데이터 패킷이 트래픽 부하로 인해 네트워크에 의해 드롭되거나 디지털 데이터를 디코딩할 수 없게 만드는 비트 에러의 결과로 드롭될 수 있다. 이들 이벤트가 발생하면, 디코더는 실제 디코딩을 수행할 수 없는 기간 동안 출력 신호를 교체해야 한다. 이러한 교체 프로세스를 통상적으로 프레임/패킷 손실 은닉(PLC)이라고 한다. 도 2는 패킷 손실 은닉을 포함하는 디코더(200)의 블록도를 나타낸다. 불량 프레임 표시자(BFI)가 손실 또는 손상된 프레임을 나타낼 때, PLC(202)는 손실/손상된 프레임을 교체하기 위한 신호를 생성할 수 있다. 그렇지 않으면, 즉 BFI가 손실되거나 손상된 프레임을 표시하지 않을 때, 그 수신된 신호는 스트림 디코더(204)에 의해 디코딩된다. 프레임 소거는 현재 프레임 활성에 대한 불량 프레임 표시자 변수, 즉 BFI=1을 설정함으로써 디코더에 시그널링될 수 있다. 다음에, 디코딩되거나 은폐된 프레임은 아날로그 신호를 출력하기 위해 DAC(206)에 입력된다. 프레임/패킷 손실 은닉은 또한 에러 은닉 유닛(ECU)으로 지칭될 수 있다.
디코더에서 패킷 손실 은닉을 수행하는 방법에는 여러 가지가 있다. 몇 가지 예로는 손실된 프레임을 묵음으로 교체하고 마지막 프레임을 반복하는 것이다(또는 마지막 프레임 파라미터의 디코딩). 다른 접근 방식은 프레임을 가능한 연속의 오디오 신호로 교체하는 방식이다. 신호와 같은 노이즈의 경우, 한 가지 접근 방식은 유사한 스펙트럼 구조를 가진 노이즈를 생성할 수 있다. 톤 신호(tonal signal)의 경우, 먼저 현재 톤의 특성(주파수, 진폭 및 위상)을 추정하고, 이들 파라미터를 사용하여 손실된 프레임의 대응하는 시간적 위치에서 연속의 톤을 생성할 수 있다.
ECU에 대한 또 다른 접근 방식은 3GPP TS 26.477 V15.0.0 절 5.4.3.5 및 WO2014/123471A1에 설명된 위상(Phase) ECU이며, 여기서 디코더는 정상 디코딩 동안 디코딩된 신호의 프로토타입을 지속적으로 저장할 수 있다. 이러한 프로토타입은 프레임 손실의 경우 사용될 수 있다. 상기 프로토타입은 스펙트럼적으로 분석되고, 노이즈 및 톤 ECU 기능은 스펙트럼 영역에서 연결된다. 상기 위상 ECU는 스펙트럼의 톤을 식별하고 관련 스펙트럼 빈(spectral bin)의 스펙트럼 시간적 교체를 계산한다. 다른 빈(non-tonal)은 노이즈로 처리될 수 있으며, 이들 스펙트럼 영역에서 톤의 아티팩트(artifact)를 피하기 위해 스크램블링된다. 결과적으로 재생성된 스펙트럼은 시간 영역으로 변환된 역 FFT(고속 푸리에 변환; fast Fourier transform)이며, 그 신호는 손실된 프레임의 교체를 생성하도록 처리된다. 오디오 코덱이 수정된 이산 코사인 변환(MDCT)에 기초한 경우, 그러한 교체의 생성은 이미 디코딩된 신호의 통합 연속을 생성하기 위해 랩핑된 MDCT와 연관된 윈도우잉(windowing), 시간 영역 앨리어싱(TDA) 및 역 TDA(ITDA)를 포함한다. 이러한 방법은 MDCT 메모리의 연속적인 사용과 정상적인 디코딩이 재개될 때 사용될 MDCT 메모리의 생성을 보장할 수 있다. PLC에서 정상 동작으로의 전환에서 올바르게 디코딩된 제1프레임은 양호한 제1프레임이라고도 알려져 있다. 도 3은 위상 ECU의 시간 정렬 및 신호 다이어그램과 PLC 프로토타입로부터의 신호 재생성을 나타낸다. 도 3은 또한 디코더의 손실된 제1프레임의 포인트에서 인코더(인코더 입력 후 상단)와 디코더(디코더 합성 후 제2라인) 사이의 타이밍 관계를 나타낸다. 또한, 위상 ECU 타임 어드밴스드 재생성 신호가 어떻게 배치되고 윈도우잉 TDA, ITDA 및 합성 윈도우잉을 어떻게 계속 사용하여 미스된 프레임 세그먼트를 재생성하고 메모리를 변환하는지를 나타낸다.
본 발명은 손실된 오디오 프레임에 대한 은닉 방법을 제어하는 방법 및 제어기를 제공하기 위한 것이다.
톤(tone) 위치는 PLC 프로토타입 버퍼에 대한 스펙트럼 분석을 사용하여 2개의 동작으로 이루어질 수 있다. 윈도잉 및 FFT 후, 제1동작은 크기 스펙트럼을 사용하여 톤이 위치될 수 있는 빈(bin)을 찾는 것일 수 있다. 제2동작은 이러한 추정을 보간에 의해 정제하여 프랙셔널 오프셋(fractional offset) 값의 형태로 증가된 정확도를 획득할 수 있다. 주파수 추정의 분해능은 두 가지에 달려 있다. 첫째, 변환의 길이-더 긴 변환은 더 높은 분해능을 제공할 수 있다. 둘째, 각기 다른 보간 방법에 따라 각기 다른 정확도를 가질 수 있다. 예를 들어, 더 짧은 프레임(10 ms)에 대해 국제 특허출원 공개번호 WO2014/123469에서 논의된 동작에서는 정확도가 충분히 양호하지 않을 수 있다. 더 높은 품질의 에러 은닉을 위해, 주파수 추정에 높은 정확도가 필요할 수 있다. 버퍼 길이를 증가시키는 것만으로도 하나의 솔루션이 될 수 있지만, 복잡도가 너무 많이 증가한다. 가장 민감한 것은 명확하게 들을 수 있고 재구성된 신호의 품질을 저하시키는 프레임별 불연속성을 보간 에러가 도입하는 깨끗한 사인파 톤(sinus tone)이다. 더 긴 버스트의 경우, 작은 에러라도 디코딩된 콘텐츠로 다시 전환하는 동안 가청 불연속성을 발생시킬 수 있다.
본 발명 개념의 일부 실시예에 따르면, 수신된 오디오 신호와 연관된 손실된 오디오 프레임에 대한 은닉 방법을 제어하기 위한 제어기를 동작시키는 방법들이 제공된다. 그와 같은 방법들에서, 상기 제어기는 적어도 하나의 톤에 대한 스펙트럼 표현의 적어도 하나의 빈 벡터를 획득할 수 있고, 여기서 상기 적어도 하나의 빈 벡터는 적어도 하나의 톤에 대한 3개의 연속적인 빈 값들을 포함한다. 상기 제어기는 상기 3개의 연속적인 빈 값의 각각이 복소수 값 또는 실수 값을 갖는지의 여부를 결정할 수 있다. 상기 결정에 응답하여, 상기 제어기는 각각의 빈 값이 복소수 값 또는 실수 값을 갖는지에 기초하여 적어도 하나의 톤의 주파수를 추정하기 위해 상기 3개의 연속적인 빈 값을 처리할 수 있다.
얻을 수 있는 한 가지 이점은 프레임 경계에서 깨끗한 톤의 클릭의 감소가 발생할 수 있다는 것이다. 에러 버스트 후 디코딩된 콘텐츠로 다시 전환하는 것도 개선될 수 있으며, 크기 근사치로부터 복잡도가 감소될 수 있다.
본 발명 개념의 일부 실시예에 따르면, 적어도 하나의 톤에 대한 3개의 연속적인 빈 값의 각각이 복소수 값을 갖는다는 결정에 응답하여, 상기 제어기는: 3개의 연속적인 빈 값의 각각에 대한 복소수 값 계수를 추출하고; 3개의 연속적인 빈 값의 각각의 복소수 값 계수에 기초하여 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하며; 프랙셔널 빈 오프셋에 기초하여 하나의 톤에 대한 빈 주파수를 계산할 수 있다. 3개의 연속적인 빈 값 중 적어도 하나가 실수 값을 갖는다는 결정에 응답하여, 상기 제어기는 3개의 연속적인 빈 값의 각각에 대한 크기 포인트를 추출하고; 상기 3개의 연속적인 빈 값의 각각의 크기 포인트에 기초하여 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하며; 상기 프랙셔널 빈 오프셋에 기초하여 적어도 하나의 톤에 대한 빈 주파수를 계산할 수 있다.
본 발명 개념의 일부 실시예에 따르면, 수신된 오디오 신호와 연관된 손실된 오디오 프레임에 대한 은닉 방법을 제어하는 장치가 제공된다. 상기 장치는 적어도 하나의 톤에 대한 스펙트럼 표현의 적어도 하나의 빈 벡터를 획득하는 것을 포함하는 동작들을 수행하고, 여기서 상기 적어도 하나의 빈 벡터는 적어도 하나의 톤에 대한 3개의 연속적인 빈 값을 포함한다. 상기 장치는 상기 3개의 연속적인 빈 값의 각각이 복소수 값 또는 실수 값을 갖는지의 여부를 결정하는 것을 포함하는 추가 동작들을 수행한다. 상기 장치는 상기 결정에 응답하여, 각각의 빈 값이 복소수 값 또는 실수 값을 갖는지에 기초하여 적어도 하나의 톤의 주파수를 추정하기 위해 상기 3개의 연속적인 빈 값을 처리하는 것을 포함하는 추가 동작들을 수행한다.
본 발명 개념의 일부 실시예에 따르면, 수신된 오디오 신호와 연관된 손실된 오디오 프레임에 대한 은닉 방법을 제어하기 위한 디코더의 적어도 하나의 프로세서에 의해 실행될 프로그램 코드를 포함하는 컴퓨터 프로그램이 제공된다. 프로그램 코드의 실행은 디코더가 적어도 하나의 톤에 대한 스펙트럼 표현의 적어도 하나의 빈 벡터를 획득하는 것을 포함하는 동작들을 수행하게 하고, 여기서 상기 적어도 하나의 빈 벡터는 적어도 하나의 톤에 대한 3개의 연속적인 빈 값을 포함한다. 상기 프로그램 코드의 실행은 디코더가 3개의 연속적인 빈 값의 각각이 복소수 값 또는 실수 값을 갖는지의 여부를 결정하는 것을 포함하는 추가 동작들을 수행하게 한다. 상기 프로그램 코드의 실행은 디코더가 상기 결정에 응답하여, 각각의 빈 값이 복소수 값 또는 실수 값을 갖는지에 기초하여 적어도 하나의 톤의 주파수를 추정하기 위해 3개의 연속적인 빈 값을 처리하는 것을 포함하는 추가 동작들을 수행하게 한다.
본 발명 개념의 일부 실시예에 따르면, 수신된 오디오 신호와 연관된 손실된 오디오 프레임에 대한 은닉 방법을 제어하기 위한 디코더의 적어도 하나의 프로세서에 의해 실행될 프로그램 코드를 포함하는 비일시적 저장 매체를 포함하는 컴퓨터 프로그램 제품이 제공된다. 상기 프로그램 코드의 실행은 디코더가 적어도 하나의 톤에 대한 스펙트럼 표현의 적어도 하나의 빈 벡터를 획득하는 것을 포함하는 동작들을 수행하게 하고, 여기서 상기 적어도 하나의 빈 벡터는 적어도 하나의 톤에 대한 3개의 연속적인 빈 값을 포함한다. 상기 프로그램 코드의 실행은 디코더가 3개의 연속적인 빈 값의 각각이 복소수 값 또는 실수 값을 갖는지의 여부를 결정하는 것을 포함하는 추가 동작들을 수행하게 한다. 상기 프로그램 코드의 실행은 디코더가 상기 결정에 응답하여, 각각의 빈 값이 복소수 값 또는 실수 값을 갖는지에 기초하여 적어도 하나의 톤의 주파수를 추정하기 위해 3개의 연속적인 빈 값을 처리하는 것을 포함하는 추가 동작들을 수행하게 한다.
본 발명에 의하면, 본 발명은 손실된 오디오 프레임에 대한 은닉 방법을 제어하는 방법 및 제어기를 제공할 수 있다.
본 개시의 추가 이해를 제공하기 위해 포함되고 본 출원에 통합되어 본 출원의 일부를 구성하는 첨부 도면은 본 발명 개념의 특정 비제한적인 실시예들을 나타낸다. 도면에서:
도 1은 네트워크를 통해 오디오 인코더 및 오디오 디코더를 사용하는 블록도를 나타낸다.
도 2는 패킷 손실 은닉을 포함하는 디코더의 블록도이다.
도 3은 위상 ECU의 시간 정렬 및 신호 다이어그램 및 PLC 프로토타입으로부터의 신호의 재생성을 나타낸다.
도 4는 샘플링 크기 스펙트럼을 나타낸다.
도 5는 크기 스펙트럼의 제곱근이 없는 선형 근사의 흐름도이다.
도 6은 프랙셔널 주파수 보간을 위한 흐름도이다.
도 7은 본 발명 개념의 일부 실시예에 따른 프랙셔널 주파수 보간을 위한 흐름도이다.
도 8은 본 발명 개념의 일부 실시예에 따른 페이드 길이 24를 갖는 128 샘플 HammRect 필터의 페이드인(fadein)의 Hamm을 나타낸다.
도 9는 본 발명 개념의 일부 실시예에 따른 페이드 길이 24 샘플을 갖는 128 샘플 HammRect 필터의 Hamm 페이드아웃(fadeout)을 나타낸다.
도 10은 본 발명 개념의 일부 실시예에 따른 카피 부분의 길이가 샘플링 주파수에 의존하는 것을 나타낸다.
도 11은 본 발명 개념의 일부 실시예에 따른 해밍 부분의 길이가 샘플 주파수에 의존하는 것을 나타낸다.
도 12는 본 발명 개념의 실시예에 따른 제어기 동작들을 나타내는 흐름도이다.
도 13 내지 도 15는 본 발명 개념의 일부 실시예에 따른 제어기를 포함하는 디코더의 블록도이다.
이하, 본 발명 개념의 실시예들이 나타나 있는 첨부된 도면들을 참조하여 본 발명 개념을 더욱 상세히 설명한다. 그러나, 본 발명은 많은 상이한 형태로 실시될 수 있으며, 여기에서 설명하는 실시예들로 한정되는 것으로 해석되어서는 안된다. 오히려, 이들 실시예는 본 개시가 완전하고 완벽하며, 본 발명 개념이 속하는 기술 분야에서 통상의 지식을 가진 자에게 본 발명의 범위가 충분히 전달될 수 있도록 제공되는 것이다. 또한, 이들 실시예는 상호 배타적이지 않다는 점에 유의해야 한다. 일 실시예의 구성요소는 다른 실시예에 존재/사용되는 것으로 암묵적으로 가정될 수 있다.
다음 설명은 개시된 대상의 다양한 실시예를 제시한다. 이들 실시예는 교시의 예로서 제시되고 개시된 대상의 범위를 제한하는 것으로 해석되어서는 안된다. 예를 들어, 설명된 실시예들의 특정 세부사항은 설명된 대상의 범위를 벗어나지 않고 수정, 생략 또는 확장될 수 있다.
다양한 실시예가 도 13-15에 나타낸 바와 같이 디코더의 제어기에 적용된다. 도 13은 일부 실시예에 따른 디코더의 개략적인 블록도이다. 그러한 디코더(1300)는 인코딩된 오디오 신호를 수신하도록 구성된 입력 유닛(1302)을 포함한다. 도 13은 본원에 설명된 다양한 실시예에 따른, 디코더가 손실된 오디오 프레임의 은닉을 위한 제어기를 실시하도록 구성되어 있음을 나타내는 논리 프레임 손실 은닉 유닛(1304)에 의한 프레임 손실 은닉을 나타낸다. 또한, 디코더(1300)는 본원에 설명된 다양한 실시예를 실시하기 위한 제어기(1306; 본원에서 프로세서 또는 프로세서 회로로도 지칭됨)를 포함한다. 제어기(1306)는 입력(IN) 및 프로세서(1306)에 연결된 메모리(1308; 본원에서 메모리 회로라고도 함)에 연결된다. 프로세서(1306)로부터 획득된 디코딩 및 재구성된 오디오 신호는 출력(OUT)으로부터 출력된다. 상기 메모리(1308)는, 프로세서(1306)에 의해 실행될 때, 상기 프로세서가 본원에 개시된 실시예들에 따른 동작들을 수행하게 하는 컴퓨터 판독가능 프로그램 코드(1310)를 포함할 수 있다. 다른 실시예들에 따르면, 프로세서(1306)는 별도의 메모리가 필요하지 않도록 메모리를 포함하도록 규정될 수 있다.
프레임 손실 은닉 동작을 수행하기 위한 사인파 모델의 적용은 다음과 같이 설명될 수 있다:
코딩된 신호의 주어진 세그먼트가 대응하는 인코딩된 정보를 사용할 수 없기 때문에, 즉 프레임이 손실되었기 때문에 디코더에 의해 재구성될 수 없는 경우, 이러한 세그먼트 이전의 신호의 사용 가능한 부분이 프로토타입 프레임으로 사용될 수 있으며, 여기서 그러한 프로토타입 프레임은 단일 프레임보다 길 수 있다. n=0...N-1인 y(n)이 교체 프레임 z(n)이 생성되어야 하는 사용 불가능한 세그먼트이고, n<0인 y(n)이 이전에 디코딩된 사용 가능한 신호인 경우, 길이 L 및 시작 인덱스 n-1의 사용 가능한 신호의 프로토타입 프레임은 윈도우 함수 w(n)으로 추출되고 주파수 영역으로 변환된다(예컨대, DFT를 통해):
Figure pct00001
다양한 실시예에서, 디코딩된 신호의 끝은 프로토타입 프레임으로 사용된다. 그와 같은 상황에서, y(n)n=L...N-1y(n)이 된다. 위의 식은 다음과 같이 된다:
Figure pct00002
윈도우 함수는 사인파 분석에서 아래에 더 자세히 설명된 윈도우 함수들 중 하나일 수 있다. 예를 들어, 후술하는 바와 같이, 상기 윈도우 함수는 Hamm 윈도우에 기초하여 직사각형 윈도우를 테이퍼링과 결합할 수 있다. 바람직하게, 수치적 복잡도를 줄이기 위해, 주파수 영역 변환 프레임은 사인파 분석 동안 사용된 프레임과 동일해야 하는 데, 즉 이는 분석 프레임과 프로토타입 프레임이 동일하고 이들 각각의 주파수 영역 변환도 마찬가지로 동일해야 한다는 것을 의미한다.
다음 단계에서, 사인파 모델 가정이 적용된다. 그러한 사인파 모델 가정에 따르면, 프로토타입 프레임의 DFT는 다음과 같이 작성할 수 있다:
Figure pct00003
다음에, 사용된 윈도우 함수의 스펙트럼은 0에 가까운 주파수 범위에서만 상당한 기여를 한다는 것을 알 수 있다. 그러한 윈도우 함수의 크기 스펙트럼은 0에 가까운 주파수에 대해 크고 그렇지 않으면 작다(샘플링 주파수의 절반에 대응하는 -π에서 π까지의 정규화된 주파수 범위 내). 따라서, 근사치로서 윈도우 스펙트럼 W(m)은 간격 M=[-mmin,mmax]에 대해서만 0이 아닌 것으로 가정하고 mmin 및 mmax는 작은 양수가 된다. 특히, 위 식에서 시프트된 윈도우 스펙트럼의 기여가 각각의 k에 대해 엄격하게 겹치지 않도록 윈도우 함수 스펙트럼의 근사치가 사용된다. 따라서, 각각의 주파수 인덱스에 대한 위의 식에서는 항상 하나의 가수(summand)에서, 즉 하나의 시프트된 윈도우 스펙트럼에서 기여도가 최대이다. 즉, 위의 식은 다음과 같은 근사식으로 축소된다는 것을 의미한다:
음이 아닌
Figure pct00004
에 대해 그리고 k에 대해
Figure pct00005
여기서
Figure pct00006
는 정수 구간
Figure pct00007
를 나타내며, 여기서
Figure pct00008
Figure pct00009
는 간격이 겹치지 않도록 위에서 설명한 제약 조건을 충족한다.
Figure pct00010
Figure pct00011
에 대한 적절한 선택은 그것들을 작은 정수 값 δ, 예컨대 δ=3로 설정하는 것이다. 그러나 2개의 인접한 사인파 주파수 f k f k+1 와 관련된 DFT 인덱스가 2δ보다 작은 경우, δ는
Figure pct00012
로 설정되고, 이는 간격이 겹치지 않는 것을 보장한다. 함수
Figure pct00013
는 더 작거나 그와 같은 함수 인수에 가장 가까운 정수이다.
다음에, 위의 식에 따라 사인파 모델이 적용되고 시간에 따라 K 사인파가 진화된다. 프로토타입 프레임의 시간 인덱스와 비교하여 소거된 세그먼트의 시간 인덱스가 n -1 개의 샘플만큼 다르다는 가정은 사인파의 위상이 아래와 같이 진행됨을 의미한다:
Figure pct00014
(여기서
Figure pct00015
)
여기서, time offs 는 시간 오프셋이고, t adv 는 타임 어드밴스(time advance)이며,
Figure pct00016
-1)은 연속 에러의 수에 기초한 타이밍 조정이다. 재생성된 프레임은 미스된 프레임의 중앙에 위치한다(따라서, tadv를 사용하여 재생성된 프레임의 중앙에 위치). 연속 에러의 경우, 디코더는 얼마나 많은 프레임이 손실되었는지 추적하고, 그에 따라 오프셋을 조정해야 한다(따라서 N(burst len -1) 사용). 따라서, 진화된 사인파 모델의 DFT 스펙트럼은 다음과 같이 주어진다:
Figure pct00017
시프트된 윈도우 함수 스펙트럼이 겹치지 않는 근사치를 다시 적용하면 다음이 주어진다:
Figure pct00018
(음이 아닌 m∈M k 및 각 k에 대해)
프로토타입 프레임 Y -1 (m)의 DFT와 진화된 사인파 모델 Y 0 (m)의 DFT를 근사를 사용하여 비교하면, 위상이
Figure pct00019
만큼 시프트하는 동안 크기 스펙트럼이 변하지 않음을 알 수 있다(각 m∈M k 에 대해).
따라서 교체 프레임은 다음의 식으로 계산될 수 있다:
Figure pct00020
Figure pct00021
(음이 아닌 m∈M k 및 각 k에 대해)
신호의 조성(tonality)에 응답하여 간격의 크기(M k )가 조정될 수 있다. 제어기(1306)는 적어도 하나의 톤에 대한 스펙트럼 표현의 복수의 빈 벡터를 수신할 수 있다. 각각의 빈 벡터에는 하나의 톤에 대한 3개의 연속적인 빈 값이 포함된다. 제어기(1306)는 3개의 연속적인 빈들 각각이 복소수 값 또는 실수 값을 갖는지의 여부를 결정할 수 있다. 상기 결정에 응답하여, 제어기(1306)는 적어도 하나의 톤의 주파수를 추정하기 위해 3개의 연속적인 빈 값을 처리할 수 있다. 수신은 수신 유닛(1312)에 의해 수행될 수 있고, 결정은 결정 유닛(1314)에 의해 수행될 수 있으며, 처리는 도 15에 나타낸 바와 같이 처리 유닛(1316)에 의해 수행될 수 있다. 수신 유닛(1312), 결정 유닛(1314) 및 처리 유닛(1316)을 포함하는 프로세서(1306)에 의해 처리될 신호는 도 15에 나타낸 바와 같이 메모리(1308)로부터 제공될 수 있다.
상기 프로세서(1306)를 갖는 디코더는 하드웨어로 실시될 수 있다. 상기 디코더의 유닛들의 기능을 달성하기 위해 사용 및 결합될 수 있는 회로 요소의 다양한 변형이 있다. 그와 같은 변형은 다양한 실시예에 포함된다. 상기 디코더의 하드웨어 실시의 특정 예들은 범용 전자 회로 및 주문형 회로를 모두 포함하는 디지털 신호 프로세서(DSP) 하드웨어 및 집적 회로 기술에서의 실시이다.
톤 위치는 PLC 프로토타입 버퍼에 대한 스펙트럼 분석을 사용하여 2개의 동작으로 이루어어질 수 있다. 윈도잉 및 FFT 이후, 제1동작은 크기 스펙트럼을 사용하여 톤이 위치될 수 있는 빈의 위치를 찾는 것일 수 있다. 제2동작은 이러한 추정을 보간에 의해 정제하여 프랙셔널 오프셋 값의 형태로 정확도를 높이는 것일 수 있다. 그러한 주파수 추정의 분해능은 두 가지에 달려 있다. 첫째, 좀더 긴 변환의 길이가 더 높은 분해능을 제공할 수 있다. 둘째, 각기 다른 보간 방법에 따라 정확도가 다를 수 있다. 예를 들어, 더 짧은 프레임(10 ms)에 대해 국제 특허출원 공개번호 WO2014/123469에서 언급한 동작에서, 정확도가 충분히 양호하지 않을 수 있다. 더 높은 품질의 에러 은닉을 위해서는, 주파수 추정에 높은 정확도가 필요할 수 있다. 버퍼 길이를 증가시키는 것이 하나의 솔루션일 수 있지만, 복잡도가 증가한다. 가장 민감한 것은 깨끗한 사인파 톤이며, 여기서 보간 에러가 명확하게 들을 수 있고 재구성된 신호의 품질을 저하시키는 프레임별 불연속성을 야기한다. 더 긴 버스트의 경우, 작은 에러라도 디코딩된 콘텐츠로 다시 전환하는 동안 가청 불연속성을 야기할 수 있다.
추가적으로, 톤 로케이터와 현재 보간기 모두에 크기 스펙트럼을 사용하는 경우 복소수 함수인 제곱근 함수를 사용한다. 복잡도를 감소시키기 위해, 크기 근사치 함수를 대신 사용하는 것이 좋을 수 있다.
본 발명 개념의 본 개시의 일부 실시예는 사용 가능한 FFT 계수에 따라 다른 보간 방법을 사용할 수 있도록 하는 보간 방법 제어기를 사용할 수 있으며, 이는 제한된 복잡도 증가로 정확도를 증가시킬 수 있다. 일부 실시예는 또한 톤 로케이터에 대한 크기 스펙트럼을 계산하는 복잡도를 낮추고 또 포물선 보간에 의해 사용될 수 있는 크기 근사치를 사용할 수도 있다.
복잡도 감소를 위해, 더 낮은 복잡도 크기 근사치 단위가 사용될 수 있다. 유사한 더 낮은 복잡도 크기 근사치 단위에 대한 연산은 M Allie 및 R Lyons, "A Root of Less Evil", IEEE Signal processing Magazine, pp 93-96, Marsh, 2005("Allie")에서 주파수 분해능 손실 없이 논의되었다.
본 발명 개념의 본 개시의 일부 실시예는 보간 정확도를 개선할 수 있고 위상 ECU로부터 재생성된 신호의 품질을 증가시킬 수 있다. 추가적으로, 개선된 품질로 더 짧은 PLC 버퍼가 사용될 수 있고 복잡도 감소에 사용될 수 있는 품질을 유지할 수 있는 데, 예를 들어, FFT 및 IFFT는 주요 계산이 될 수 있고 긴 버퍼에 대해 비용이 많이 들 수 있다.
증가된 주파수 분해능을 위한 장치는 2개의 추가 유닛을 포함할 수 있다. 제1 유닛은 주파수 보간에 사용되는 방법을 제어할 수 있다: 빈 데이터의 절대값을 사용하는 보간 유닛(예컨대, 국제 특허 공개번호 WO2014/123469A1에서 논의된 유사한 동작 참조)이 사용될 수 있거나, 또는 복소수 빈 값을 사용하여 주파수 보간이 이루어지는 두 번째 유닛이 사용될 수 있다.
NFFT 샘플의 윈도잉 및 FFT를 사용하는 프로토타입 버퍼의 주파수 분석은
Figure pct00022
값으로 스펙트럼 표현을 생성하고,
Figure pct00023
에 대해 W(n)이다. 여기서 n=0은 DC를 나타내고
Figure pct00024
는 샘플링 주파수(fs)의 절반을 나타낸다. 이들 중 두 개를 제외하고 모두 복소수 값이고, 끝점(DC 및 fs/2)만 실수이다. 따라서, 사용 가능한 복소수 계수를 사용하는 다른 보간 방법이 사용될 수 있으면 정확도가 증가할 수 있다.
국제 특허 공개번호 WO2014/123469A1에 기술된 보간 방법은 식별된 톤 위치의 각 사이드에 하나의 빈을 사용한다. 또한, 끝점에서, 국제 특허 공개번호 WO2014/123469A1에서 논의된 보간 방법은 여전히 3개의 빈을 사용하며, 식별된 피크가 중간 위치에 있지 않음을 표시하기 위해 추가적인 플래그가 설정되어 있다. 본 발명 개념의 일부 실시예에서, 추가적인 제어 유닛은 모든 3개의 빈이 복소수 값을 갖는 피크에 대해 개선된 주파수 추정을 위해 빈 데이터의 절대값을 사용하는 보간 유닛 대신에 새로운 보간 유닛을 호출하는 것을 보장할 수 있다. 빈 데이터의 절대값을 사용하는 보간 유닛은 3 포인트 보간 데이터에 빈 0 또는
Figure pct00025
빈이 포함된 경우에 사용할 수 있으며, 또한 여기에서도 피크가 중간 빈에 위치되지 않으면 추가적인 플래그가 설정된다.
보간 유닛에 의한 처리 후, 빈 값들은 발견된 톤 위치에 따라 업데이트될 수 있고(톤 및 주변 빈들의 위상 조정), 비-톤(non-tone) 위치의 스크램블링이 계속된다. 예컨대, 국제 특허 공개번호 WO2014/123469A1에서 논의된 유사한 동작을 참조
본 발명 개념의 일부 실시예에서, MDCT는 10 ms 진행으로 20 ms 윈도우에 걸쳐 수행될 수 있다. 양호한 프레임 이후에 저장되는 PLC 프로토타입 프레임의 길이는 16 ms이다. 관련된 과도 감지기는 길이가 4 ms인 두 개의 짧은 FFT(PLC 프로토타입 프레임의 1/4인)를 사용한다. 이들 아이템의 실제 길이는 사용된 샘플링 주파수에 따라 다르며 8 kHz에서 48 kHz까지일 수 있다. 이들 길이는 각 변환의 스펙트럼 빈의 수에 영향을 준다.
스펙트럼 분석 및 초기 톤 위치는 국제 특허 공개번호 WO2014/123469A1에서 논의된 것과 유사한 동작을 사용하여 이루어진다. 본 발명 개념의 일부 실시예는 더 낮은 복잡도를 위해 크기 근사치를 사용한다. 국제 특허 공개번호 WO2014/123469A1에서 논의된 복잡한 스펙트럼 추정의 크기 스펙트럼의 계산은 제곱근 함수의 사용을 포함한다. 예를 들어, 국제 특허 공개번호 WO2014/123469A1에서, 복소수
Figure pct00026
이고, x의 크기는 다음과 같이 계산될 수 있다:
Figure pct00027
(1)
본 발명 개념의 일부 실시예에서, 선형 근사를 사용하는 더 낮은 복잡도 근사가 사용된다. 더 낮은 복잡도 근사를 위한 유사한 연산은 M. Allie 및 R. Lyons, "A Root of Less Evil", IEEE Signal processing Magazine, pp 93-96, Marsh, 2005(Allie)에서 논의된다. 도 5를 참조하면, FFT W(n)로부터의 스펙트럼 영역에서 첫 번째 빈(0)과 마지막 빈(
Figure pct00028
)은 실수이지만, 블록(501)에서 근사치는 이들 2개의 절대값을 취한다. W(n)=a+ib 형식을 갖는 복소 스펙트럼 계수, 즉 (빈) n=1 ...
Figure pct00029
에 대해, 실수부와 허수부의 절대값은 먼저 블록 503에서 찾아야 한다:
Figure pct00030
다음에, 블록 505에서, 더 크고 더 작은 절대값이 식별될 수 있다:
Figure pct00031
그러한 더 크고 더 작은 값이 알려진 경우, 크기 근사치는 블록 507 및 509에서 둘의 선형 조합으로 계산될 수 있다:
Figure pct00032
도 5는 복소수 입력 X(n)=a+ib를 사용하여, 각 스펙트럼 빈에 대해 한 번 수행될 수 있는 크기 스펙트럼의 제곱근이 없는 선형 근사의 흐름도이다.
국제 특허 공개번호 WO2014/123469A1에서 논의된 주파수 추정을 위한 동작에 따라, 대략적인 주파수 추정은 톤이 위치된 빈이다(예를 들어, 끝점에서 특별한 처리를 제외하고, 빈 k에 위치된 하나의 톤으로). 도 6으로 돌아가면, 스펙트럼 추정은 빈 k-1,k,k+1을 사용할 수 있고, 그들의 스펙트럼 크기는 블록 601에서 추출될 수 있고 블록 603에서 보간(δ)을 계산할 수 있는 보간 유닛에 입력될 수 있으며, 블록 605에서 프랙셔널 빈 오프셋은 일반적으로 입력에 기초하여 δ=[-0.5,0.5] 범위에 있다. 도 6은 톤 로케이터에 의해 발견된 각 톤에 대해 한 번씩 수행될 수 있는 프랙셔널 주파수 보간을 위한 위의 동작들에 대한 이러한 프로세스의 흐름도이다.
본 발명 개념의 일부 실시예에서, 주파수 보간은 제어 유닛을 사용하여 위치된 톤 각각에 대해 어떤 방법이 사용될지를 선택할 수 있다. 도 7은 본 발명 개념의 실시예들에 따른 톤 로케이터에 의해 발견된 각 톤에 대해 한 번씩 수행될 수 있는 프랙셔널 주파수 보간을 위한 흐름도이다. 도 7을 보다 구체적으로 설명하면 다음과 같다.
블록 701에서, 보간이 DC 빈 또는 fs/2 빈을 사용하도록 톤이 위치되면, 보간 제어 유닛은 빈 데이터의 절대값을 사용하는 방법(블록 707, 709, 711)을 사용한다, 예컨대, 국제 특허 공개번호 WO2014/123469A1에서 논의된 유사한 동작 참조. 여기서, k의 톤에 대해 블록 707에서 추출된 3개의 연속 스펙트럼 추정값은 실제 크기 스펙트럼 계수 |X(n)|이고, n=k-1,k,k+1는 |X(k-1)|, |Xk| 및 |X(k+1)|로서 현재 보간 유닛에 입력된다. 프랙셔널 오프셋의 계산은 블록 709에서 국제 특허 공개번호 WO2014/123469A1에서 논의된 동작들과 유사하게 이루어진다:
Figure pct00033
(5)
DC 또는 FS/2에 위치된 톤의 특수 처리에 따라, 톤 로케이터는 위치된 톤이 그 제공된 데이터 포인트의 중앙에 없을 수 있음을 표시할 수 있다.
본 발명 개념의 일부 실시예에서, 보간이 DC 빈 또는 fs/2 빈을 사용하지 않도록 톤이 위치되는 경우, 상기 보간 제어 유닛은 사용된 윈도우 함수 및 FFT 길이에 적응된 방법(블록 703, 705, 711)을 사용하며, 상기 FFT 계수 X(n)는
Figure pct00034
인 경우 추정된 스펙트럼이다. 유사한 동작들이 2007년 5월(Jacobsen)의 E Jacobsen 및 P Kootsooks, "Fast Accurate Frequency Estimation", IEEE Signal processing Magazine, pp123-125에 논의되어 있다. 빈 데이터의 절대값을 이용한 보간이 크기 스펙트럼을 사용하지만, 복소수 스펙트럼은 여전히 저장되어 재구성에 사용할 수 있으므로 복잡도나 메모리 패널티가 없다. 그러한 보간은 중앙 빈이 발견된 톤 위치인 3개의 연속적인 FFT 빈에 대한 복소수 계수를 사용하여 이루어질 수 있다.
스펙트럼의 복소 표현이 사용되기 때문에 톤 로케이터에 대한 크기 스펙트럼을 계산할 때 크기 근사치를 사용하여 정확도 패널티가 없을 수 있다. 끝점만이 이러한 근사치를 사용한다.
k의 톤에서, 복소수 값 계수 X(n)(여기서, n=k-1,k,k+1)은 X(k-1), Xk 및 X(k+1)로 보간 유닛에 입력될 수 있다. 그 보간은 블록 711에서 일반적으로 δ=[-0.5,0.5] 범위에서 아래의 식에 기초하여 프랙셔널 빈 오프셋을 계산할 수 있다:
Figure pct00035
(6)
여기서 Kjacob은 사용된 윈도우의 타입과 샘플링 주파수와 연관된 FFT의 크기에 따라 달라지는 스케일링 계수이다. 반면, 표현식 RE{ }는 괄호 안에 있는 표현식의 실수 부분만 결과로 사용됨을 의미한다. 즉, 입력에 사용된 스펙트럼 계수가 복소수임에도 불구하고 δ는 여전히 실수 값이다. 낮은 복잡도를 위해, RE{ } 안의 표현식의 실수 부분만이 계산될 수 있다.
두 경우 모두, 추정된 주파수를 얻기 위해, 이러한 프랙셔널 오프셋은 피크 위치 k의 코스(coarse) 분해능 및 보간 값 δ와 결합될 수 있다.
Figure pct00036
(7)
여기서 C는 코스 분해능(Hz/bin)이며 FFT의 길이와 샘플링 주파수 fs에 따라 다르다. 코스 분해능, 즉 Hz/bin은 단지 C=fs/NFFT이다.
Jacobsen은 일부 윈도우 타입에 대한 Kjacob(Jacobsen에서 Q로 명명됨) 값들에 대해 논의하지만, Jacobsen은 국제 특허 공개번호 WO2014/123469A1에 사용되는 윈도우를 포함하지 않는다. 일부 실시예들에서, 그 윈도우에 대한 계수를 유도하기 위해, 톤이 2개의 빈들 사이의 중간에 있는 경우가 사용될 수 있으며, 이는 선택된 피크에 따라 δ=±0.5이다(예컨대, 도 4 참조). 도 4는 2개의 스펙트럼 빈 사이의 중간에 하나의 톤이 위치되는 샘플 크기 스펙트럼을 나타낸다. 톤 위치가 대략적인 톤 추정을 kA 또는 kB로 리포트하는지의 여부는 랜덤 이벤트이다. 두 경우 모두, 그러한 프랙셔널 보간은 추정된 동일한 주파수를 나타내야 하는 데, 그 결과는
Figure pct00037
반면
Figure pct00038
이다. kA 및 kB의 크기가 동일하게 높기 때문에, 이를 다르게 만드는 것은 톤의 위상, 노이즈 또는 FFT 정확도일 뿐일 수 있으며, 톤 위치도 마찬가지로 톤에 대한 빈으로서 그들 중 하나를 선택할 가능성이 있다. 따라서, 이것이 최상의 최소 제곱 오차를 제공하지는 않지만, δ=±0.5에서 보간 불연속성을 피할 수 있다.
국제 특허 공개번호 WO2014/123469A1에서 스펙트럼 분석에 사용된 윈도우는 Hamm 윈도우에 기초하여 테이퍼링과 직사각형 윈도우를 결합하여 "HammRect-윈도우"라고 한다. 국제 특허 공개번호 WO2014/123469A1에서 논의된 모든 샘플링 주파수에 대해, 직사각형과 테이퍼링의 비율은 동일할 수 있다. 일부 실시예에서, 윈도우는 3 ms 페이드인 테이퍼링, 10 ms 직사각형, 및 3 ms 페이드아웃으로 정의된다. fs = 8 kHz에 대한 페이드인 및 페이드아웃 테이퍼링은 각각 도 8과 9에서 볼 수 있다. 직사각형 부분은 둘 사이에 위치하며 1.000의 80개 샘플이 있다. 도 10과 11은 다른 샘플링 주파수의 함수로 페이딩(fading)과 직사각형 길이를 보여준다. 도 10은 본 발명 개념의 일부 실시예에 따른 카피 부분의 길이가 샘플링 주파수에 의존하는 것을 나타낸다. 도 11은 본 발명 개념의 일부 실시예에 따른 해밍 부분의 길이가 샘플 주파수에 의존하는 것을 나타낸다.
이러한 타입의 윈도우에서, Kjacob=1.1429의 값은 모든 샘플링 주파수에 대해 동일하다. 테이퍼링을 위해 대칭 Hamm 윈도우를 사용하는 경우, 다른 샘플링 주파수에 대해 다른 값을 사용해야 하며, 그 차이는 작다. 몇 가지 예는 FFT 크기 128->1.1476, 256->1.1452, 512->1.1440 및 768->1.1436이다. 하나의 고정 계수와 주기적 Hamm 윈도우를 사용하면 이를 피할 수 있다. 주기적 Hamm 윈도우에 대한 정의는 다음과 같다:
Figure pct00039
(8)
테이퍼링 섹션을 생성하기 위해, L=2Lfade로 평가되며, 평가 후 이러한 윈도우의 전반부는 페이드인 부분이고 후반부는 페이드아웃 부분이다.
Hamm 윈도우가 대칭인지 주기적인지를 알려주는 한 가지 접근 방식은 윈도우의 첫 번째 및 마지막 샘플이 0.08인 경우 대칭이라는 것이다. 샘플에 0.08이 주기적인 윈도우에 추가되면 대칭이 되지만 길이는 L+1이다. 저장 관점에서, 주기적 정의는 서브 샘플링을 허용한다. 즉, 32 kHz 윈도우에서 16 kHz 및 8 kHz 윈도우를 얻기 위해 서브 샘플링할 수 있다.
국제 특허 공개번호 WO2014/123469A1에서 논의된 포물선 보간의 경우, 상수가 없고 대칭 또는 주기적 Hamm 함수에 의존하지 않는다.
디코더(1300)의 동작들이 이제 본 발명 개념의 일부 실시예에 따른 도 12의 흐름도를 참조하여 논의될 것이다. 예를 들어, 모듈은 도 13-15의 메모리(1308)에 저장될 수 있고, 이들 모듈은 모듈의 명령이 프로세서(1306)에 의해 실행될 때 프로세서(1306)가 각각의 흐름도의 각각의 동작을 수행하도록 명령을 제공할 수 있다.
도 12는 수신된 오디오 신호와 연관된 손실된 오디오 프레임에 대한 은닉 방법을 제어하기 위한 디코더(1300)의 제어기(1306)의 동작들을 나타낸다.
도 12의 블록 1200에서, 디코더(1300)의 프로세서(1306)는 적어도 하나의 톤에 대한 스펙트럼 표현의 적어도 하나의 빈 벡터를 획득하고, 여기서 적어도 하나의 빈 벡터는 적어도 하나의 톤에 대한 3개의 연속적인 빈 값을 포함한다. 블록 1202에서, 디코더(1300)의 프로세서(1306)는 3개의 연속적인 빈 벡터들 각각이 복소수 값 또는 실수 값을 갖는지의 여부를 결정한다. 블록 1204에서, 디코더(1300)의 프로세서(1306)는, 상기 결정에 응답하여, 각각의 빈 값이 복소수 값 또는 실수 값을 갖는지에 기초하여 적어도 하나의 톤의 주파수를 추정하기 위해 3개의 연속적인 빈 값을 처리할 수 있다.
발명 개념의 예시적인 실시예들의 목록:
예시적인 실시예가 아래에서 논의된다. 참조부호/문자들은 참조부호/문자들에 의해 표시된 특정 요소들로 예시적인 실시예들을 제한하지 않고 예/예시로서 괄호 안에 제공된다.
1. 수신된 오디오 신호의 손실된 오디오 프레임에 대한 은닉 방법을 제어하는 방법으로서, 상기 방법은:
적어도 하나의 톤에 대한 스펙트럼 표현의 복수의 빈 벡터를 수신하는 단계(1200, 1312), 여기서 상기 복수의 빈 벡터는 적어도 하나의 톤에 대한 3개의 연속적인 빈 벡터를 포함함;
상기 3개의 연속적인 빈 벡터들 각각이 복소수 값 또는 실수 값을 갖는지의 여부를 결정하는 단계(1202, 1314);
상기 결정에 응답하여, 적어도 하나의 톤의 주파수를 추정하기 위해 상기 3개의 연속적인 빈 값을 처리하는 단계(1204, 1316)를 포함한다.
2. 실시예 1에 있어서, 결정하는 단계는 적어도 하나의 톤에 대한 3개의 연속적인 빈 벡터의 각각이 복소수 값을 갖는다는 것을 결정하는 단계를 포함하고, 여기서 처리는 3개의 연속적인 빈 벡터의 각각에 대한 복소수 값 계수를 추출하는 단계; 상기 3개의 연속적인 빈 벡터의 각각에 대한 복소수 값 계수에 기초하여 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 단계(1204, 1314); 및 상기 프랙셔널 빈 오프셋에 기초하여 적어도 하나의 톤에 대한 빈 주파수를 계산하는 단계(1204, 1314)를 포함한다.
3. 실시예 1 내지 2 중 어느 하나의 방법에 있어서, 상기 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 단계는 스케일링 계수, 스펙트럼 표현에 사용되는 윈도우 함수, 및 적어도 하나의 톤에 대한 3개의 연속적인 빈 벡터의 각각을 포함하는 주파수 스펙트럼에 대한 변환 길이를 포함한다.
4. 실시예 1 내지 3 중 어느 하나의 방법에 있어서, 상기 스케일링 계수는 윈도우 함수의 타입에 의존한다.
5. 실시예 1 내지 4 중 어느 하나의 방법에 있어서, 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 단계는 3개의 연속적인 빈 벡터의 각각을 포함하는 주파수 스펙트럼에 대한 변환 길이 및 윈도우 함수를 포함한다.
6. 실시예 1 내지 5 중 어느 하나의 방법에 있어서, 상기 윈도우 함수는 Hamm 윈도우에 기초하여 테이퍼링과 결합된 직사각형 윈도우를 포함한다.
7. 실시예 1 내지 6 중 어느 하나의 방법에 있어서, 직사각형 윈도우는 직사각형 길이를 포함하고, Hamm 윈도우는 페이딩 길이를 포함한다.
8. 실시예 1 내지 7 중 어느 하나의 방법에 있어서, 직사각형 길이 및 페이딩 길이 각각은 적어도 하나의 샘플링 주파수에 의존한다.
9. 실시예 1 내지 8 중 어느 하나의 방법에 있어서, 상기 스케일링 계수는 상기 윈도우 함수가 Hamm 윈도우에 기초하여 테이퍼링과 결합된 직사각형 윈도우를 포함할 때 상수를 포함한다.
10. 실시예 1 내지 9 중 어느 하나의 방법에 있어서, 상기 윈도우 함수는 주기적 Hamm 윈도우를 포함한다.
11. 실시예 1 내지 10 중 어느 하나의 방법에 있어서, 스케일링 계수는 윈도우 함수가 주기적 Hamm 윈도우를 포함할 때 상수를 포함한다.
12. 실시예 1 내지 11 중 어느 하나의 방법에 있어서, 적어도 하나의 톤에 대한 빈 주파수를 계산하는 단계는 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋, 연속적인 빈의 첫 번째 빈에서의 적어도 하나의 톤의 위치, 및 Hz/bin의 코스 분해능을 포함한다.
13. 실시예 1 내지 12 중 어느 하나의 방법에 있어서, 코스 분해능은 주파수 스펙트럼 및 샘플링 주파수에 대한 변환 길이에 의존한다.
14. 실시예 1 내지 13 중 어느 하나의 방법에 있어서, 스펙트럼 표현의 적어도 하나의 톤의 각각에 대해 결정 및 처리가 수행된다.
15. 실시예 1의 방법에 있어서, 결정하는 단계는 3개의 연속적인 빈 벡터 중 적어도 하나가 실수 값을 갖는다는 것을 결정하는 단계를 포함하고, 여기서 처리는 3개의 연속적인 빈 벡터의 각각에 대한 크기 포인트를 추출하는 단계; 상기 3개의 연속적인 빈 벡터의 각각에 대한 크기 포인트에 기초하여 프랙셔널 빈 오프셋을 계산하는 단계; 및 상기 프랙셔널 빈 오프셋에 기초하여 적어도 하나의 톤에 대한 빈 주파수를 계산하는 단계를 포함한다.
16. 수신된 오디오 신호의 손실된 오디오 프레임에 대한 은닉 방법을 제어하기 위한 디코더(1300)로서, 상기 디코더는:
프로세서(1306); 및
상기 프로세서와 연결된 메모리(1308)를 포함하며,
상기 메모리는 프로세서에 의해 실행될 때, 상기 디코더가 실시예 1 내지 15 중 어느 하나에 따른 동작들을 수행하게 하는 명령을 포함한다.
17. 수신된 오디오 신호의 손실된 오디오 프레임에 대한 은닉 방법을 제어하기 위한 디코더(1300)로서, 상기 디코더는 실시예 1 내지 15 중 어느 하나에 따라 수행하도록 구성된다.
18. 수신된 오디오 신호의 손실된 오디오 프레임에 대한 은닉 방법을 제어하기 위한 디코더(1300)의 적어도 하나의 프로세서(1306)에 의해 실행될 프로그램 코드를 포함하는 컴퓨터 프로그램으로서, 상기 프로그램 코드의 실행에 의해 상기 디코더(1300)가 실시예 1 내지 15 중 어느 하나에 따른 동작들을 수행하게 한다.
19. 수신된 오디오 신호의 손실된 오디오 프레임에 대한 은닉 방법을 제어하기 위한 디코더(1300)의 적어도 하나의 프로세서(1306)에 의해 실행될 프로그램 코드를 포함하는 비일시적 저장 매체를 포함하는 컴퓨터 프로그램 제품으로서, 상기 프로그램 코드의 실행에 의해 상기 디코더(1300)가 실시예 1-15 중 어느 하나에 따른 동작들을 수행하게 한다.
추가적인 설명
일반적으로, 여기에서 사용되는 모든 용어는 문맥상 명백하게 다른 의미가 부여되거나 암시되지 않는 한, 해당 기술 분야에서 통상적인 의미에 따라 해석되어야 한다. 요소, 장치, 구성 요소, 수단, 단계 등에 대한 모든 참조는 명시적으로 언급되지 않는 한 요소, 장치, 구성 요소, 수단, 단계 등의 적어도 하나의 예를 참조하는 것으로 공개적으로 해석되어야 한다. 여기에 개시된 모든 방법의 단계들은 단계가 다른 단계를 따르거나 선행하는 것으로 명시적으로 설명되지 않는 한 및/또는 단계가 다른 단계를 따르거나 선행해야 함을 암시하지 않는 한 개시된 정확한 순서로 수행될 필요는 없다. 본원에 개시된 임의의 실시예의 임의의 특징은 적절한 경우에 임의의 다른 실시예에 적용될 수 있다. 유사하게, 임의의 실시예의 임의의 이점은 임의의 다른 실시예에 적용될 수 있으며, 그 반대도 마찬가지이다. 개시된 실시예들의 다른 목적, 특징 및 이점은 다음의 설명으로부터 명백할 것이다.
여기에 개시된 임의의 적절한 단계, 방법, 특징, 기능 또는 이점들은 하나 이상의 가상 장치의 하나 이상의 기능 유닛 또는 모듈을 통해 수행될 수 있다. 각각의 가상 장치는 다수의 이러한 기능 유닛을 포함할 수 있다. 이러한 기능 유닛은 디지털 신호 프로세서(DSP), 특수 목적 디지털 로직 등을 포함할 수 있는 다른 디지털 하드웨어 뿐만 아니라 하나 이상의 마이크로프로세서 또는 마이크로컨트롤러를 포함할 수 있는 처리 회로를 통해 구현될 수 있다. 상기 처리 회로는 메모리에 저장된 프로그램 코드를 실행하도록 구성될 수 있으며, 이는 읽기 전용 메모리(ROM), 랜덤 액세스 메모리(RAM), 캐시 메모리, 플래시 메모리 장치, 광학 저장 장치와 같은 하나 또는 여러 타입의 메모리를 포함할 수 있다. 메모리에 저장된 프로그램 코드는 하나 이상의 통신 및/또는 데이터 통신 프로토콜을 실행하기 위한 프로그램 명령과 여기에 설명된 하나 이상의 기술을 수행하기 위한 명령을 포함한다. 일부 실시들에서, 상기 처리 회로는 각각의 기능 유닛이 본 개시의 하나 이상의 실시예들에 따라 대응하는 기능들을 수행하게 하는 데 사용될 수 있다.
상기 용어 유닛은 전자, 전기 장치 및/또는 전자 장치 분야에서 일반적인 의미를 가질 수 있으며, 그리고 예를 들어 전기 및/또는 전자 회로, 장치, 모듈, 프로세서, 메모리, 논리 솔리드 스테이트 및/또는 이산 장치, 본원에 개시된 것들과 같은 각각의 동작, 절차, 계산, 출력 및/또는 표시 기능을 수행하기 위한 컴퓨터 프로그램 또는 명령 등을 포함할 수 있다.
이상에서 본 발명 개념의 다양한 실시예를 설명함에 있어서, 본원에서 사용된 용어는 단지 특정 실시예를 설명하기 위해 사용된 것으로, 본 발명 개념을 한정하려는 의도가 아님을 이해해야 한다. 달리 정의되지 않는 한, 여기에서 사용되는 모든 용어(기술 용어 및 과학 용어 포함)는 본 발명 개념이 속하는 기술 분야에서 통상의 지식을 가진 자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 일반적으로 사용되는 사전에 정의된 것과 같은 용어는 본 명세서 및 관련 기술의 맥락에서 그 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 여기에 명시적으로 정의되지 않는 한 이상화되거나 과도하게 해석되어서는 안된다는 것을 이해해야 할 것이다.
요소가 다른 요소에 "연결된", "결합된", "응답하는", 또는 이들의 변형으로 언급되는 경우, 다른 요소에 직접 연결, 결합 또는 응답할 수 있거나 또는 중간 요소가 존재할 수 있다. 대조적으로, 요소가 다른 요소에 대해 "직접 연결된", "직접 결합된", "직접 응답하는", 또는 이들의 변형으로 언급되는 경우에는 중간 요소가 존재하지 않는다. 동일한 번호는 전체에 걸쳐 동일한 요소를 나타낸다. 또한, 본원에서 사용되는 "연결된", "결합된", "응답하는", 또는 이들의 변형은 무선으로 연결된, 결합된, 또는 응답하는 것을 포함할 수 있다. 본원에 사용된 바와 같이, 단수 형태 "하나", "한" 및 "그"는 문맥이 명백하게 달리 나타내지 않는 한 복수 형태도 포함하는 것으로 의도된다. 잘 알려진 기능이나 구성은 간결함 및/또는 명확성을 위해 자세히 설명하지 않을 수 있다. "및/또는"이라는 용어는 하나 이상의 관련된 나열된 항목의 모든 조합을 포함한다.
제1, 제2, 제3 등의 용어가 다양한 요소/동작을 설명하기 위해 본원에서 사용될 수 있지만, 이러한 요소/동작이 이러한 용어에 의해 제한되어서는 안 된다는 것이 이해될 것이다. 이러한 용어는 한 요소/동작을 다른 요소/동작과 구별하는 데만 사용된다. 따라서, 일부 실시예에서 제1 요소/동작은 본 발명 개념의 교시를 벗어나지 않고 다른 실시예에서 제2 요소/동작으로 명명될 수 있다. 명세서 전체에 걸쳐 동일한 참조번호 또는 동일한 참조부호는 동일하거나 유사한 요소를 나타낸다.
본원에 사용된 바와 같이, "구비하다", "구비하는", "포함하다", "포함하는", "포함한다", "갖다", "갖는", "가진다" 또는 이들의 변형은 개방형이며, 하나 이상의 언급된 특징, 정수, 요소, 단계, 구성 요소 또는 기능이지만 하나 이상의 다른 특징, 정수, 요소, 단계, 구성 요소, 기능 또는 이들의 그룹의 존재 또는 추가를 배제하지 않는다. 또한, 본원에 사용된 바와 같이, 표현 "예를 들어"에서 파생된 일반적인 약어 "예컨대"는 이전에 언급된 항목의 일반적인 예 또는 예를 소개하거나 지정하는 데 사용될 수 있으며, 그와 같은 항목을 제한하려는 의도가 아니다. 표현 "다시 말해서"에서 파생된 일반적인 약어 "즉"은 보다 일반적인 인용에서 특정 항목을 지정하는 데 사용할 수 있다.
예시적인 실시예들은 컴퓨터 실행 방법, 장치(시스템 및/또는 장치) 및/또는 컴퓨터 프로그램 제품의 블록도 및/또는 흐름도 예시를 참조하여 여기에 설명된다. 블록도 및/또는 흐름도의 블록, 및 블록도 및/또는 흐름도의 블록들 조합은 하나 이상의 컴퓨터 회로에 의해 수행되는 컴퓨터 프로그램 명령에 의해 실시될 수 있음을 이해해야 한다. 이들 컴퓨터 프로그램 명령은 머신을 생성하기 위해 범용 컴퓨터 회로, 특수 목적 컴퓨터 회로, 및/또는 기타 프로그래밍 가능한 데이터 처리 회로의 프로세서 회로에 제공되며, 따라서 상기 명령은 블록도 및/또는 흐름도 블록 또는 블록들에 지정된 기능/동작을 실시하기 위해 컴퓨터 및/또는 기타 다른 프로그램 가능한 데이터 처리 장치의 프로세서, 변환 및 제어 트랜지스터 및 그와 같은 회로 내의 다른 하드웨어 구성 요소들을 통해, 메모리 위치에 저장된 값들을 실행하고, 이에 의해 블록도 및/또는 흐름도 블록(들)에 지정된 기능/동작을 실시하기 위한 수단((기능) 및/또는 구조를 생성한다.
이러한 컴퓨터 프로그램 명령은 또한 컴퓨터 또는 다른 프로그램 가능한 데이터 처리 장치가 특정 방식으로 기능하도록 지시할 수 있는 유형의 컴퓨터-판독가능한 매체에 저장될 수 있으며, 따라서 상기 컴퓨터-판독가능한 매체에 저장된 명령은 블록도 및/또는 흐름도 블록 또는 블록들에 지정된 기능/동작을 실시하는 명령을 포함하는 제조 물품을 생성한다. 따라서, 본 발명 개념의 실시예들은 하드웨어 및/또는 소프트웨어(펌웨어, 상주 소프트웨어, 마이크로 코드 등을 포함)로 실시될 수 있으며, 이는 "회로", "모듈" 또는 그 변형으로 총칭할 수 있는 디지털 신호 프로세서와 같은 프로세서에서 실행될 수 있다.
또한, 일부의 대안적인 실시에서 블록들에 표시된 기능/동작들이 흐름도에 표시된 순서와 다르게 나타날 수 있다는 점에 유의해야 한다. 예를 들어, 연속적으로 나타낸 2개의 블록은 실제로 실질적으로 동시에 실행될 수 있거나 관련된 기능/동작들에 따라 블록들이 때때로 역순으로 실행될 수 있다. 더욱이, 흐름도 및/또는 블록도의 주어진 블록의 기능은 다수의 블록으로 분리될 수 있고 그리고/또 흐름도 및/또는 블록도의 둘 이상의 블록의 기능은 적어도 부분적으로 통합될 수 있다. 마지막으로, 나타낸된 블록들 사이에 다른 블록이 추가/삽입될 수 있으며, 본 발명 개념의 범위를 벗어나지 않고 블록/동작이 생략될 수 있다. 더욱이, 일부 블록도는 통신의 주요 방향을 나타내기 위해 통신 경로에 화살표를 포함하지만, 통신은 예시된 화살표와 반대 방향으로 나타날 수 있음을 이해해야 한다.
본 발명 개면의 원리를 실질적으로 벗어나지 않고 실시예에 많은 변형 및 수정이 이루어질 수 있다. 이러한 모든 변형 및 수정은 본 발명 개념의 범위 내에 포함되도록 의도된다. 따라서, 상기 개시된 대상은 예시적인 것으로 간주되어야 하며, 제한적이지 않은 것으로 간주되어야 하며, 실시예의 예들은 본 발명 개념의 사상 및 범위 내에 속하는 그러한 모든 수정, 개선, 및 기타 다른 실시예를 포함하도록 의도된다. 따라서, 본 발명의 범위는 법률이 허용하는 최대한의 범위 내에서 실시예 및 그 균등물의 실시예를 포함하여 본 개시 내용에 대한 가장 광범위하게 허용되는 해석에 의해 결정되어야 하며, 상술한 상세한 설명에 의해 제한되거나 제한되어서는 안된다.
다음의 약어 중 적어도 일부가 본 개시에서 사용될 수 있다. 약어들 사이에 불일치가 있는 경우, 위에서 사용된 방식을 우선적으로 고려해야 한다. 본원에서 여러 번 나열되는 경우 첫 번째 목록이 후속 목록보다 우선되어야 한다.
약어 설명
ADC 아날로그-디지털 변환기
BFI 불량 프레임 표시자
DAC 디지털-아날로그 변환기
FFT 고속 푸리에 변환환
IFFT 역 고속 푸리에 변환
ITDA 역 시간 영역 앨리어싱
LA_ZEROS 룩-어헤드 제로
MDCT 수정 이산 코사인 변환
OLA 중첩 및 추가
TDA 시간 영역 앨리어싱
참조:
[1] 국제 특허 공개번호 WO2014/123469A1
[2] M Allie and R Lyons, "A Root of Less Evil", IEEE Signal processing Magazine, pp 93-96, Marsh, 2005
[3] E Jacobsen and P Kootsooks, "Fast Accurate Frequency Estimation", IEEE Signal processing Magazine, pp123-125, May, 2007
[4] 국제 특허 공개번호 WO2014/123471A1
본 발명의 개념에 대한 추가 논의는 국제 특허출원 공개번호 WO2014/123469A1에 제공된다.

Claims (26)

  1. 수신된 오디오 신호와 연관된 손실된 오디오 프레임에 대한 은닉 방법을 제어하는 방법으로서, 상기 방법은:
    적어도 하나의 톤에 대한 스펙트럼 표현의 적어도 하나의 빈 벡터를 획득하는 단계(1200, 1312), 여기서 상기 적어도 하나의 빈 벡터는 상기 적어도 하나의 톤에 대한 3개의 연속적인 빈 값을 포함함;
    상기 3개의 연속적인 빈 값의 각각이 복소수 값 또는 실수 값을 갖는지의 여부를 결정하는 단계(1202, 1314); 및
    상기 결정에 응답하여, 각각의 빈 값이 복소수 값 또는 실수 값을 갖는지에 기초하여 적어도 하나의 톤의 주파수를 추정하기 위해 상기 3개의 연속적인 빈 값을 처리하는 단계(1204, 1316)를 포함하는, 방법.
  2. 제1항에 있어서,
    상기 적어도 하나의 톤에 대한 3개의 연속적인 빈 값의 각각이 복소수 값을 갖는다는 결정에 응답하여,
    상기 3개의 연속적인 빈 값의 각각에 대한 복소수 값 계수를 추출하는 단계;
    상기 3개의 연속적인 빈 값의 각각의 복소수 값 계수에 기초하여 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 단계(1204, 1314); 및
    상기 프랙셔널 빈 오프셋에 기초하여 상기 적어도 하나의 톤에 대한 빈 주파수를 계산하는 단계(1204, 1314)를 포함하는, 방법.
  3. 제2항에 있어서,
    상기 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 단계는 스케일링 계수, 스펙트럼 표현에 사용되는 윈도우 함수, 및 상기 적어도 하나의 톤에 대한 3개의 연속적인 빈 값의 각각을 포함하는 주파수 스펙트럼에 대한 변환 길이에 기초하여 상기 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 단계를 포함하는, 방법.
  4. 제3항에 있어서,
    상기 스케일링 계수는 윈도우 함수의 타입에 의존하는, 방법.
  5. 제2항 내지 제4항 중 어느 한 항에 있어서,
    적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 단계는 3개의 연속적인 빈 값의 각각을 포함하는 주파수 스펙트럼에 대한 변환 길이 및 윈도우 함수에 기초하여 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 단계를 포함하는, 방법.
  6. 제5항에 있어서,
    상기 프랙셔널 빈 오프셋을 계산하는 단계는
    Figure pct00040
    에 따라 프랙셔널 빈 오프셋을 계산하는 단계를 포함하며,
    여기서, 상기 f k 는 피크 위치 k에 대한 프랙셔널 빈 오프셋이고, δ는 보간 값이며, C는 Hz/bin의 코스 분해능인, 방법.
  7. 제6항에 있어서,
    δ
    Figure pct00041
    에 따라 결정되며,
    여기서, 상기
    Figure pct00042
    는 스케일링 계수이고,
    Figure pct00043
    ,
    Figure pct00044
    Figure pct00045
    k에서 적어도 하나의 톤에 대한 복소수 값 계수인, 방법.
  8. 제1항에 있어서,
    3개의 연속적인 빈 값 중 적어도 하나가 실수 값을 갖는다는 결정에 응답하여:
    상기 3개의 연속적인 빈 값의 각각에 대한 크기 포인트를 추출하는 단계;
    상기 3개의 연속적인 빈 값의 각각에 대한 크기 포인트에 기초하여 프랙셔널 빈 오프셋을 계산하는 단계; 및
    상기 프랙셔널 빈 오프셋에 기초하여 적어도 하나의 톤에 대한 빈 주파수를 계산하는 단계를 더 포함하는, 방법.
  9. 제1항에 있어서,
    적어도 하나의 톤에 대한 3개의 연속적인 빈 값의 각각이 복소수 값을 갖는다는 결정에 응답하여:
    상기 3개의 연속적인 빈 값의 각각에 대한 복소수 값 계수를 추출하는 단계;
    상기 3개의 연속적인 빈 값의 각각의 복소수 값 계수에 기초하여 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 단계(1204, 1314); 및
    상기 프랙셔널 빈 오프셋에 기초하여 적어도 하나의 톤에 대한 빈 주파수를 계산하는 단계(1204, 1314); 그리고
    상기 3개의 연속적인 빈 값 중 적어도 하나가 실수 값을 갖는다는 결정에 응답하여:
    상기 3개의 연속적인 빈 값의 각각에 대한 크기 포인트를 추출하는 단계;
    상기 3개의 연속적인 빈 값의 각각의 크기 포인트에 기초하여 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 단계; 및
    상기 프랙셔널 빈 오프셋에 기초하여 적어도 하나의 톤에 대한 빈 주파수를 계산하는 단계를 더 포함하는, 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서,
    스펙트럼 표현의 적어도 하나의 톤의 각각에 대해 결정 및 처리가 수행되는, 방법.
  11. 수신된 오디오 신호와 연관된 손실된 오디오 프레임에 대한 은닉 방법을 제어하기 위한 장치(1304)로서, 상기 장치는 동작들을 수행하며, 상기 동작들은:
    적어도 하나의 톤에 대한 스펙트럼 표현의 적어도 하나의 빈 벡터를 획득하는 동작(1200, 1312), 여기서 상기 적어도 하나의 빈 벡터는 상기 적어도 하나의 톤에 대한 3개의 연속적인 빈 값을 포함함;
    상기 3개의 연속적인 빈 값의 각각이 복소수 값 또는 실수 값을 갖는지의 여부를 결정하는 동작(1202, 1314);
    상기 결정에 응답하여, 각각의 빈 값이 복소수 값 또는 실수 값을 갖는지에 기초하여 적어도 하나의 톤의 주파수를 추정하기 위해 상기 3개의 연속적인 빈 값을 처리하는 동작(1204, 1316)을 포함하는, 장치.
  12. 제11항에 있어서,
    상기 장치는 처리 회로(1306) 및 상기 처리 회로와 연결된 메모리(1308)를 포함하며, 상기 메모리는 상기 처리 회로에 의해 실행될 때 상기 장치가 동작들을 수행하게 하는 명령을 포함하고, 상기 동작들은, 적어도 하나의 톤에 대한 3개의 연속적인 빈 값의 각각이 복소수 값을 갖는다는 결정에 응답하여:
    상기 3개의 연속적인 빈 값의 각각에 대한 복소수 값 계수를 추출하는 동작;
    상기 3개의 연속적인 빈 값의 각각의 복소수 값 계수에 기초하여 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 동작(1204, 1314); 및
    상기 프랙셔널 빈 오프셋에 기초하여 적어도 하나의 톤에 대한 빈 주파수를 계산하는 동작(1204, 1314)을 포함하는, 장치.
  13. 제12항에 있어서,
    적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 동작은 스케일링 계수, 스펙트럼 표현에 사용되는 윈도우 함수, 및 적어도 하나의 톤에 대한 3개의 연속적인 빈 값의 각각을 포함하는 주파수 스펙트럼에 대한 변환 길이에 기초하여 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 동작을 포함하는, 장치.
  14. 제13항에 있어서,
    상기 스케일링 계수는 윈도우 함수의 타입에 의존하는, 장치.
  15. 제12항 내지 제14항 중 어느 한 항에 있어서,
    적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 동작은 3개의 연속적인 빈 값의 각각을 포함하는 주파수 스펙트럼에 대한 변환 길이 및 윈도우 함수에 기초하여 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 동작을 포함하는, 장치.
  16. 제15항에 있어서,
    프랙셔널 빈 오프셋을 계산하는 동작은
    Figure pct00046
    에 따라 프랙셔널 빈 오프셋을 계산하는 동작을 포함하며,
    여기서, 상기 f k 는 피크 위치 k에 대한 프랙셔널 빈 오프셋이고, δ는 보간 값이며, C는 Hz/bin의 코스 분해능인, 장치.
  17. 제16항에 있어서,
    δ
    Figure pct00047
    에 따라 결정되며,
    여기서, 상기
    Figure pct00048
    은 스케일링 계수이고,
    Figure pct00049
    ,
    Figure pct00050
    Figure pct00051
    k에서 적어도 하나의 톤에 대한 복소수 값 계수인, 장치.
  18. 제11항에 있어서,
    상기 장치는 처리 회로(1306) 및 상기 처리 회로와 연결된 메모리(1308)를 포함하며, 상기 메모리는 상기 처리 회로에 의해 실행될 때 상기 장치가 동작들을 수행하게 하는 명령을 포함하고, 상기 동작들은, 3개의 연속적인 빈 값 중 적어도 하나가 실수 값을 갖는다는 결정에 응답하여:
    상기 3개의 연속적인 빈 값의 각각에 대한 크기 포인트를 추출하는 동작;
    상기 3개의 연속적인 빈 값의 각각에 대한 크기 포인트에 기초하여 프랙셔널 빈 오프셋을 계산하는 동작; 및
    상기 프랙셔널 빈 오프셋에 기초하여 적어도 하나의 톤에 대한 빈 주파수를 계산하는 동작을 더 포함하는, 장치.
  19. 제11항에 있어서,
    상기 장치는 처리 회로(1306) 및 상기 처리 회로와 연결된 메모리(1308)를 포함하며, 상기 메모리는 상기 처리 회로에 의해 실행될 때 상기 장치가 동작들을 수행하게 하는 명령을 포함하고, 상기 동작들은, 적어도 하나의 톤에 대한 3개의 연속적인 빈 값의 각각이 복소수 값을 갖는다는 결정에 응답하여:
    상기 3개의 연속적인 빈 값의 각각에 대한 복소수 값 계수를 추출하는 동작;
    상기 3개의 연속적인 빈 값의 각각의 복소수 값 계수에 기초하여 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 동작(1204, 1314); 및
    상기 프랙셔널 빈 오프셋에 기초하여 적어도 하나의 톤에 대한 빈 주파수를 계산하는 동작(1204, 1314); 그리고
    상기 3개의 연속적인 빈 값 중 적어도 하나가 실수 값을 갖는다는 결정에 응답하여:
    상기 3개의 연속적인 빈 값의 각각에 대한 크기 포인트를 추출하는 동작;
    상기 3개의 연속적인 빈 값의 각각의 크기 포인트에 기초하여 적어도 하나의 톤에 대한 프랙셔널 빈 오프셋을 계산하는 동작; 및
    상기 프랙셔널 빈 오프셋에 기초하여 적어도 하나의 톤에 대한 빈 주파수를 계산하는 동작을 더 포함하는, 장치.
  20. 제11항 내지 제19항 중 어느 한 항에 있어서,
    상기 스펙트럼 표현의 적어도 하나의 톤의 각각에 대해 결정 및 처리가 수행되는, 장치.
  21. 수신된 오디오 신호와 연관된 손실된 오디오 프레임에 대한 은닉 방법을 제어하기 위한 디코더(1300)로서, 상기 디코더는 동작들을 수행하도록 구성되며, 상기 동작들은:
    이전에 디코딩된 오디오 프레임의 스펙트럼 표현을 생성하기 위해 윈도잉 및 고속 푸리에 변환(FFT)을 사용하여 이전에 디코딩된 오디오 프레임의 일부 사인파 분석을 수행하는 동작;
    적어도 하나의 톤에 대한 스펙트럼 표현을 식별하기 위해 스펙트럼 표현의 피크를 식별하는 동작;
    상기 적어도 하나의 톤에 대한 스펙트럼 표현의 적어도 하나의 빈 벡터를 획득하는 동작(1200, 1312), 여기서 상기 적어도 하나의 빈 벡터는 적어도 하나의 톤에 대한 3개의 연속적인 빈 값을 포함함;
    상기 3개의 연속적인 빈 값의 각각이 복소수 값 또는 실수 값을 갖는지의 여부를 결정하는 동작(1202, 1314); 및
    상기 결정에 응답하여, 각각의 빈 값이 복소수 값 또는 실수 값을 갖는지에 기초하여 적어도 하나의 톤의 주파수를 추정하기 위해 상기 3개의 연속적인 빈 값을 처리하는 동작(1204, 1316)을 포함하는, 디코더.
  22. 제21항에 있어서,
    상기 디코더는 제2항 내지 제10항 중 어느 한 항에 따른 동작을 수행하도록 더 구성되는, 디코더.
  23. 수신된 오디오 신호와 연관된 손실된 오디오 프레임에 대한 은닉 방법을 제어하기 위한 디코더(1300)의 적어도 하나의 프로세서(1306)에 의해 실행될 프로그램 코드를 포함하는 컴퓨터 프로그램으로서, 상기 프로그램 코드의 실행은 상기 디코더(1300)가 동작들을 수행하게 하며, 상기 동작들은:
    적어도 하나의 톤에 대한 스펙트럼 표현의 적어도 하나의 빈 벡터를 획득하는 동작(1200, 1312), 여기서 상기 적어도 하나의 빈 벡터는 적어도 하나의 톤에 대한 3개의 연속적인 빈 값을 포함함;
    상기 3개의 연속적인 빈 값의 각각이 복소수 값 또는 실수 값을 갖는지의 여부를 결정하는 동작(1202, 1314); 및
    상기 결정에 응답하여, 각각의 빈 값이 복소수 값 또는 실수 값을 갖는지에 기초하여 적어도 하나의 톤의 주파수를 추정하기 위해 상기 3개의 연속적인 빈 값을 처리하는 동작(1204, 1316)을 포함하는, 컴퓨터 프로그램.
  24. 제23항에 있어서,
    상기 컴퓨터 프로그램은 디코더(1300)의 적어도 하나의 프로세서(1306)에 의해 실행될 프로그램 코드를 더 포함하며, 상기 프로그램 코드의 실행은 상기 디코더(1300)가 제2항 내지 제10항 중 어느 한 항에 따른 동작을 수행하게 하는, 컴퓨터 프로그램.
  25. 수신된 오디오 신호와 연관된 손실된 오디오 프레임에 대한 은닉 방법을 제어하기 위한 디코더(1300)의 적어도 하나의 프로세서(1306)에 의해 실행될 프로그램 코드를 포함하는 비일시적 저장 매체를 포함하는 컴퓨터 프로그램 제품으로서, 상기 프로그램 코드의 실행은 상기 디코더(1300)가 동작들을 수행하게 하며, 상기 동작들은:
    적어도 하나의 톤에 대한 스펙트럼 표현의 적어도 하나의 빈 벡터를 획득하는 동작(1200, 1312), 여기서 상기 적어도 하나의 빈 벡터는 적어도 하나의 톤에 대한 3개의 연속적인 빈 값을 포함함;
    상기 3개의 연속적인 빈 값의 각각이 복소수 값 또는 실수 값을 갖는지의 여부를 결정하는 동작(1202, 1314); 및
    상기 결정에 응답하여, 각각의 빈 값이 복소수 값 또는 실수 값을 갖는지에 기초하여 적어도 하나의 톤의 주파수를 추정하기 위해 상기 3개의 연속적인 빈 값을 처리하는 동작(1204, 1316)을 포함하는, 컴퓨터 프로그램 제품.
  26. 제25항에 있어서,
    상기 비일시적 저장 매체는 디코더(1300)의 적어도 하나의 프로세서(1306)에 의해 실행될 프로그램 코드를 더 포함하며, 상기 프로그램 코드의 실행은 상기 디코더(1300)가 제2항 내지 제10항 중 어느 한 항에 따른 동작을 수행하게 하는, 컴퓨터 프로그램 제품.
KR1020217028735A 2019-02-21 2020-02-20 위상 ecu f0 보간 분할을 위한 방법 및 관련 제어기 KR20210130743A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962808610P 2019-02-21 2019-02-21
US201962808587P 2019-02-21 2019-02-21
US201962808600P 2019-02-21 2019-02-21
US62/808,610 2019-02-21
US62/808,600 2019-02-21
US62/808,587 2019-02-21
PCT/EP2020/054520 WO2020169754A1 (en) 2019-02-21 2020-02-20 Methods for phase ecu f0 interpolation split and related controller

Publications (1)

Publication Number Publication Date
KR20210130743A true KR20210130743A (ko) 2021-11-01

Family

ID=69701173

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217028735A KR20210130743A (ko) 2019-02-21 2020-02-20 위상 ecu f0 보간 분할을 위한 방법 및 관련 제어기

Country Status (9)

Country Link
US (4) US11705136B2 (ko)
EP (3) EP3928312A1 (ko)
JP (6) JP7178506B2 (ko)
KR (1) KR20210130743A (ko)
CN (3) CN113439302A (ko)
BR (1) BR112021014477A2 (ko)
CO (2) CO2021010587A2 (ko)
MX (1) MX2021009635A (ko)
WO (3) WO2020169756A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111984920B (zh) * 2020-08-31 2022-03-18 广东电网有限责任公司广州供电局 次/超同步谐波参数识别方法、装置、设备和介质

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5884253A (en) * 1992-04-09 1999-03-16 Lucent Technologies, Inc. Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter
KR970011728B1 (ko) * 1994-12-21 1997-07-14 김광호 음향신호의 에러은닉방법 및 그 장치
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
US7117156B1 (en) * 1999-04-19 2006-10-03 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US6775649B1 (en) * 1999-09-01 2004-08-10 Texas Instruments Incorporated Concealment of frame erasures for speech transmission and storage system and method
WO2001033411A1 (en) * 1999-10-30 2001-05-10 Stmicroelectronics Asia Pacific Pte. Ltd. Fast modified discrete cosine transform method
CN1311424C (zh) 2001-03-06 2007-04-18 株式会社Ntt都科摩 音频数据内插、关联信息制作、内插信息发送装置和方法
US7324444B1 (en) * 2002-03-05 2008-01-29 The Board Of Trustees Of The Leland Stanford Junior University Adaptive playout scheduling for multimedia communication
KR100467617B1 (ko) * 2002-10-30 2005-01-24 삼성전자주식회사 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치
KR100477701B1 (ko) * 2002-11-07 2005-03-18 삼성전자주식회사 Mpeg 오디오 인코딩 방법 및 mpeg 오디오 인코딩장치
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7526351B2 (en) * 2005-06-01 2009-04-28 Microsoft Corporation Variable speed playback of digital audio
US8473298B2 (en) * 2005-11-01 2013-06-25 Apple Inc. Pre-resampling to achieve continuously variable analysis time/frequency resolution
US8798172B2 (en) * 2006-05-16 2014-08-05 Samsung Electronics Co., Ltd. Method and apparatus to conceal error in decoded audio signal
RU2462769C2 (ru) * 2006-10-24 2012-09-27 Войсэйдж Корпорейшн Способ и устройство кодирования кадров перехода в речевых сигналах
JP5103880B2 (ja) 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
KR101292771B1 (ko) * 2006-11-24 2013-08-16 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치
CN101207468B (zh) * 2006-12-19 2010-07-21 华为技术有限公司 丢帧隐藏方法、系统和装置
US8165872B2 (en) * 2007-02-01 2012-04-24 Broadcom Corporation Method and system for improving speech quality
US8468024B2 (en) * 2007-05-14 2013-06-18 Freescale Semiconductor, Inc. Generating a frame of audio data
WO2008151408A1 (en) * 2007-06-14 2008-12-18 Voiceage Corporation Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711
US8185388B2 (en) * 2007-07-30 2012-05-22 Huawei Technologies Co., Ltd. Apparatus for improving packet loss, frame erasure, or jitter concealment
TW200912892A (en) * 2007-09-04 2009-03-16 Univ Nat Central Method and apparatus of low-complexity psychoacoustic model applicable for advanced audio coding encoders
CA2715432C (en) * 2008-03-05 2016-08-16 Voiceage Corporation System and method for enhancing a decoded tonal sound signal
US20100324911A1 (en) * 2008-04-07 2010-12-23 Broadcom Corporation Cvsd decoder state update after packet loss
CN101588341B (zh) * 2008-05-22 2012-07-04 华为技术有限公司 一种丢帧隐藏的方法及装置
US9076439B2 (en) * 2009-10-23 2015-07-07 Broadcom Corporation Bit error management and mitigation for sub-band coding
US20110196673A1 (en) * 2010-02-11 2011-08-11 Qualcomm Incorporated Concealing lost packets in a sub-band coding decoder
EP2770503B1 (en) * 2011-10-21 2019-05-29 Samsung Electronics Co., Ltd. Method and apparatus for concealing frame errors and method and apparatus for audio decoding
CN103714821A (zh) * 2012-09-28 2014-04-09 杜比实验室特许公司 基于位置的混合域数据包丢失隐藏
US9325544B2 (en) * 2012-10-31 2016-04-26 Csr Technology Inc. Packet-loss concealment for a degraded frame using replacement data from a non-degraded frame
FR3001593A1 (fr) * 2013-01-31 2014-08-01 France Telecom Correction perfectionnee de perte de trame au decodage d'un signal.
EP2954516A1 (en) 2013-02-05 2015-12-16 Telefonaktiebolaget LM Ericsson (PUBL) Enhanced audio frame loss concealment
EP3576087B1 (en) 2013-02-05 2021-04-07 Telefonaktiebolaget LM Ericsson (publ) Audio frame loss concealment
MX2021000353A (es) * 2013-02-05 2023-02-24 Ericsson Telefon Ab L M Método y aparato para controlar ocultación de pérdida de trama de audio.
FR3004876A1 (fr) * 2013-04-18 2014-10-24 France Telecom Correction de perte de trame par injection de bruit pondere.
EP3011556B1 (en) 2013-06-21 2017-05-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals
CN104282309A (zh) 2013-07-05 2015-01-14 杜比实验室特许公司 丢包掩蔽装置和方法以及音频处理系统
NO2780522T3 (ko) * 2014-05-15 2018-06-09
WO2016016724A2 (ko) * 2014-07-28 2016-02-04 삼성전자 주식회사 패킷 손실 은닉방법 및 장치와 이를 적용한 복호화방법 및 장치
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US10424305B2 (en) * 2014-12-09 2019-09-24 Dolby International Ab MDCT-domain error concealment
US9978400B2 (en) * 2015-06-11 2018-05-22 Zte Corporation Method and apparatus for frame loss concealment in transform domain
US20170178648A1 (en) * 2015-12-18 2017-06-22 Dolby International Ab Enhanced Block Switching and Bit Allocation for Improved Transform Audio Coding
RU2712093C1 (ru) * 2016-03-07 2020-01-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Блок маскирования ошибок, аудиодекодер и соответствующие способ и компьютерная программа, использующие характеристики декодированного представления надлежащим образом декодированного аудиокадра
ES2874629T3 (es) * 2016-03-07 2021-11-05 Fraunhofer Ges Forschung Unidad de ocultación de error, decodificador de audio y método y programa informático relacionados que desvanecen una trama de audio ocultada según factores de amortiguamiento diferentes para bandas de frecuencia diferentes
MX2018010753A (es) * 2016-03-07 2019-01-14 Fraunhofer Ges Forschung Método de ocultamiento híbrido: combinación de ocultamiento de pérdida paquete de dominio de frecuencia y tiempo en códecs de audio.
JP6976277B2 (ja) * 2016-06-22 2021-12-08 ドルビー・インターナショナル・アーベー 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法
CN110892478A (zh) * 2017-04-28 2020-03-17 Dts公司 音频编解码器窗口和变换实现

Also Published As

Publication number Publication date
CN113454713A (zh) 2021-09-28
CN113454714B (zh) 2024-05-14
US11862180B2 (en) 2024-01-02
CN113454714A (zh) 2021-09-28
US20230298597A1 (en) 2023-09-21
EP3928313A1 (en) 2021-12-29
EP3928312A1 (en) 2021-12-29
MX2021009635A (es) 2021-09-08
JP2023029834A (ja) 2023-03-07
JP7178506B2 (ja) 2022-11-25
CO2021010587A2 (es) 2021-08-30
CN113439302A (zh) 2021-09-24
EP3928314A1 (en) 2021-12-29
JP7471375B2 (ja) 2024-04-19
JP2022521188A (ja) 2022-04-06
US20240135936A1 (en) 2024-04-25
US20220172733A1 (en) 2022-06-02
JP7307805B2 (ja) 2023-07-12
US20220148602A1 (en) 2022-05-12
BR112021014477A2 (pt) 2021-09-28
JP7335968B2 (ja) 2023-08-30
WO2020169756A1 (en) 2020-08-27
US11705136B2 (en) 2023-07-18
JP2022521077A (ja) 2022-04-05
JP2022521494A (ja) 2022-04-08
WO2020169754A1 (en) 2020-08-27
JP2023166423A (ja) 2023-11-21
WO2020169757A1 (en) 2020-08-27
JP2023138988A (ja) 2023-10-03
CO2021012223A2 (es) 2021-09-30
US20220189490A1 (en) 2022-06-16

Similar Documents

Publication Publication Date Title
KR101430332B1 (ko) 일반 오디오 및 음성 프레임들을 포함하는 오디오 신호를 위한 인코더
KR102349025B1 (ko) 오디오 프레임 손실 은폐를 제어하기 위한 방법 및 장치
RU2236046C2 (ru) Эффективное кодирование огибающей спектра с использованием переменного разрешения по времени и по частоте и переключения время/частота
KR101455915B1 (ko) 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더
EP2159789A1 (en) A method and device for lost frame concealment
KR101690899B1 (ko) 오디오 신호의 불연속 전송에서 높은 스펙트럼-시간 해상도를 가진 편안한 잡음의 생성
RU2604994C2 (ru) Оптимизированное по задержке преобразование наложения, взвешивающие окна кодирования/декодирования
KR102037691B1 (ko) 오디오 프레임 손실 은폐
JP4782006B2 (ja) 低ビットレートオーディオ符号化
JP7008756B2 (ja) デジタルオーディオ信号におけるプレエコーを識別し、減衰させる方法及び装置
JP7471375B2 (ja) 位相ecu f0補間スプリットのための方法および関係するコントローラ
CN106463122B (zh) 突发帧错误处理
US20220284908A1 (en) Encoder, decoder, encoding method and decoding method for frequency domain long-term prediction of tonal signals for audio coding
JP2002366195A (ja) 音声符号化パラメータ符号化方法及び装置
US12002477B2 (en) Methods for phase ECU F0 interpolation split and related controller