RU2014104488A - Адаптация взвешивающих окон анализа или синтеза для кодирования или декодирования путем преобразования - Google Patents

Адаптация взвешивающих окон анализа или синтеза для кодирования или декодирования путем преобразования Download PDF

Info

Publication number
RU2014104488A
RU2014104488A RU2014104488/08A RU2014104488A RU2014104488A RU 2014104488 A RU2014104488 A RU 2014104488A RU 2014104488/08 A RU2014104488/08 A RU 2014104488/08A RU 2014104488 A RU2014104488 A RU 2014104488A RU 2014104488 A RU2014104488 A RU 2014104488A
Authority
RU
Russia
Prior art keywords
window
coefficients
size
thinning
initial
Prior art date
Application number
RU2014104488/08A
Other languages
English (en)
Other versions
RU2607230C2 (ru
Inventor
Жюльен ФОР
Пьерик ФИЛИП
Original Assignee
Оранж
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Оранж filed Critical Оранж
Publication of RU2014104488A publication Critical patent/RU2014104488A/ru
Application granted granted Critical
Publication of RU2607230C2 publication Critical patent/RU2607230C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3002Conversion to or from differential modulation
    • H03M7/3044Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

1. Способ кодирования или декодирования путем преобразования цифрового звукового сигнала с использованием взвешивающих окон анализа (h) или синтеза (h), применяемых к фреймам выборок, при этом способ включает в себя этап, на котором осуществляют неравномерную дискретизацию (E10) первоначального окна, предусмотренного для трансформанты заданного первоначального размера N, для применения вторичного преобразования размером M, отличным от N.2. Способ по п.1, в котором на этапе дискретизации выбирают, на основании первого коэффициента d первоначального окна (при 0≤d<N/M), определенную совокупность коэффициентов N-d-1, N+d, 2N-d-1, удовлетворяющую заданному условию идеальной реконструкции.3. Способ по п.2, в котором, если N больше M, выполняют прореживание первоначального окна, сохраняя по меньшей мере коэффициенты из упомянутой определенной совокупности для получения прореженного окна.4. Способ по п.3, дополнительно содержащий этап, на котором выбирают вторую совокупность коэффициентов, отделенных от коэффициентов упомянутой определенной совокупности постоянным промежутком, при этом прореживание выполняют с сохранением дополнительных коэффициентов второй совокупности для получения прореженного окна.5. Способ по п.4, в котором выполняют прореживание окна размером 2N для получения окна размером 2M согласно следующим уравнениям:при k∈[0; M/2-1]где h* - прореженное окно анализа или синтеза, h - первоначальное окно анализа или синтеза,- наиболее близкое целое число ≤X,- наиболее близкое целое число ≥X, a d - значение первого коэффициента упомянутой определенной совокупности.6. Способ по п.2, в котором, если N меньше M, выполняют интерполяцию пут

Claims (16)

1. Способ кодирования или декодирования путем преобразования цифрового звукового сигнала с использованием взвешивающих окон анализа (ha) или синтеза (hs), применяемых к фреймам выборок, при этом способ включает в себя этап, на котором осуществляют неравномерную дискретизацию (E10) первоначального окна, предусмотренного для трансформанты заданного первоначального размера N, для применения вторичного преобразования размером M, отличным от N.
2. Способ по п.1, в котором на этапе дискретизации выбирают, на основании первого коэффициента d первоначального окна (при 0≤d<N/M), определенную совокупность коэффициентов N-d-1, N+d, 2N-d-1, удовлетворяющую заданному условию идеальной реконструкции.
3. Способ по п.2, в котором, если N больше M, выполняют прореживание первоначального окна, сохраняя по меньшей мере коэффициенты из упомянутой определенной совокупности для получения прореженного окна.
4. Способ по п.3, дополнительно содержащий этап, на котором выбирают вторую совокупность коэффициентов, отделенных от коэффициентов упомянутой определенной совокупности постоянным промежутком, при этом прореживание выполняют с сохранением дополнительных коэффициентов второй совокупности для получения прореженного окна.
5. Способ по п.4, в котором выполняют прореживание окна размером 2N для получения окна размером 2M согласно следующим уравнениям:
при k∈[0; M/2-1]
Figure 00000001
где h* - прореженное окно анализа или синтеза, h - первоначальное окно анализа или синтеза, X
Figure 00000002
- наиболее близкое целое число ≤X, X
Figure 00000003
- наиболее близкое целое число ≥X, a d - значение первого коэффициента упомянутой определенной совокупности.
6. Способ по п.2, в котором, если N меньше M, выполняют интерполяцию путем вставки коэффициента между каждым из коэффициентов упомянутой определенной совокупности коэффициентов и каждым из коэффициентов совокупности смежных коэффициентов для получения интерполированного окна.
7. Способ по п.6, дополнительно содержащий этап, на котором выбирают вторую совокупность коэффициентов, отделенных постоянным промежутком от коэффициентов упомянутой определенной совокупности, при этом выполняют интерполяцию путем вставки дополнительно коэффициента между каждым из коэффициентов второй совокупности и каждым из коэффициентов совокупности смежных коэффициентов для получения интерполированного окна.
8. Способ по п.6 или 7, дополнительно содержащий этап, на котором вычисляют дополнительное окно, содержащее коэффициенты, вычисленные на основании коэффициентов упомянутой определенной совокупности и смежных коэффициентов, для интерполяции упомянутого окна.
9. Способ по любому из пп.1-7, в котором этап неравномерной дискретизации и прореживание или интерполяцию первоначального окна осуществляют во время этапа временного свертывания или развертывания, используемого для вычисления вторичной трансформанты.
10. Способ по одному из пп.1-7, отличающийся тем, что одновременно выполняют прореживание и интерполяцию первоначального окна во время этапа временного свертывания или развертывания, используемого для вычисления вторичной трансформанты.
11. Способ по п.9, в котором выполняют прореживание во время временного свертывания в соответствии со следующим уравнением:
Figure 00000004
k∈[0; M/2-1]
где TM - фрейм из M выборок, T2M - фрейм из 2M выборок.
12. Способ по п.9, в котором выполняют прореживание во время временного развертывания в соответствии со следующим уравнением:
Figure 00000005
k∈[0; N/2-1]
где T*M - фрейм из M выборок, T*2M - фрейм из 2M выборок.
13. Способ по п.8, отличающийся тем, что, если вторичная трансформанта имеет размер M=3/2N, децимацию первоначального окна, а затем интерполяцию осуществляют во время временного свертывания согласно следующим уравнениям:
Figure 00000006
k/2∈[0; N/2-1]
где TM - фрейм из M выборок, T2M - фрейм из 2M выборок, hcomp - дополнительное окно.
14. Способ по п.8, в котором, если вторичная трансформанта имеет размер M=3/2N, выполняют прореживание первоначального окна, а затем интерполяцию во время временного развертывания согласно следующим уравнениям:
Figure 00000007
k/2∈[0; N/2-1]
где TM - фрейм из M выборок, T2M - фрейм из 2M выборок, hcomp - дополнительное окно.
15. Устройство кодирования или декодирования путем преобразования цифрового звукового сигнала с использованием взвешивающих окон анализа (ha) или синтеза (hs), применяемых к фреймам выборок, содержащее модуль (102, 112) дискретизации, выполненный с возможностью выполнения неравномерной дискретизации первоначального окна, предусмотренного для трансформанты данного первоначального размера N, для применения вторичного преобразования размером M, отличным от N.
16. Носитель для записи информации, содержащий записанную на нем компьютерную программу, содержащую командные коды для выполнения этапов способа кодирования или декодирования по любому из пп.1-14 при исполнении команд процессором.
RU2014104488A 2011-07-12 2012-07-09 Адаптация взвешивающих окон анализа или синтеза для кодирования или декодирования путем преобразования RU2607230C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR1156356 2011-07-12
FR1156356A FR2977969A1 (fr) 2011-07-12 2011-07-12 Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee
PCT/FR2012/051622 WO2013007943A1 (fr) 2011-07-12 2012-07-09 Adaptations de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee

Publications (2)

Publication Number Publication Date
RU2014104488A true RU2014104488A (ru) 2015-08-20
RU2607230C2 RU2607230C2 (ru) 2017-01-10

Family

ID=46639596

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014104488A RU2607230C2 (ru) 2011-07-12 2012-07-09 Адаптация взвешивающих окон анализа или синтеза для кодирования или декодирования путем преобразования

Country Status (12)

Country Link
US (2) US9368121B2 (ru)
EP (1) EP2732448B1 (ru)
JP (1) JP6177239B2 (ru)
KR (3) KR20140050056A (ru)
CN (1) CN103814406B (ru)
BR (3) BR112014000611B1 (ru)
CA (1) CA2841303C (ru)
ES (1) ES2556268T3 (ru)
FR (1) FR2977969A1 (ru)
MX (1) MX2014000409A (ru)
RU (1) RU2607230C2 (ru)
WO (1) WO2013007943A1 (ru)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2980791A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483879A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5357594A (en) * 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
EP1107231B1 (en) * 1991-06-11 2005-04-27 QUALCOMM Incorporated Variable rate vocoder
US5504833A (en) * 1991-08-22 1996-04-02 George; E. Bryan Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications
JPH06141351A (ja) * 1992-10-26 1994-05-20 Matsushita Electric Ind Co Ltd 信号発生装置
US6269338B1 (en) * 1996-10-10 2001-07-31 U.S. Philips Corporation Data compression and expansion of an audio signal
US6240299B1 (en) * 1998-02-20 2001-05-29 Conexant Systems, Inc. Cellular radiotelephone having answering machine/voice memo capability with parameter-based speech compression and decompression
EP0995190B1 (en) * 1998-05-11 2005-08-03 Koninklijke Philips Electronics N.V. Audio coding based on determining a noise contribution from a phase change
US6430529B1 (en) * 1999-02-26 2002-08-06 Sony Corporation System and method for efficient time-domain aliasing cancellation
US6748363B1 (en) * 2000-06-28 2004-06-08 Texas Instruments Incorporated TI window compression/expansion method
US6707869B1 (en) * 2000-12-28 2004-03-16 Nortel Networks Limited Signal-processing apparatus with a filter of flexible window design
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
FR2870352B1 (fr) * 2004-05-14 2006-06-23 Thales Sa Procede de localisation d'un emetteur avec un reseau synthetique lacunaire d'antennes
WO2006110975A1 (en) * 2005-04-22 2006-10-26 Logovision Wireless Inc. Multimedia system for mobile client platforms
CN1862969B (zh) * 2005-05-11 2010-06-09 尼禄股份公司 自适应块长、常数变换音频解码方法
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
PL2076901T3 (pl) * 2006-10-25 2017-09-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób do generowania wartości podpasm audio i urządzenie i sposób do generowania próbek audio w dziedzinie czasu
US8214200B2 (en) * 2007-03-14 2012-07-03 Xfrm, Inc. Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid
JP5328804B2 (ja) * 2007-12-21 2013-10-30 フランス・テレコム 適応型ウィンドウを有する変換ベースの符号化/復号化
ES2659323T3 (es) 2008-07-29 2018-03-14 Orange Procedimiento de actualización de un codificador por interpolación de filtro
KR101061723B1 (ko) * 2008-09-25 2011-09-02 (주)제너시스템즈 사운드 신호의 실시간 보간 장치 및 방법
CN101694773B (zh) * 2009-10-29 2011-06-22 北京理工大学 一种基于tda域的自适应窗切换方法
US9454511B2 (en) * 2011-05-04 2016-09-27 American University Windowing methods and systems for use in time-frequency analysis

Also Published As

Publication number Publication date
JP6177239B2 (ja) 2017-08-09
CN103814406A (zh) 2014-05-21
CA2841303A1 (fr) 2013-01-17
EP2732448A1 (fr) 2014-05-21
WO2013007943A1 (fr) 2013-01-17
BR122021011683B1 (pt) 2022-03-22
US20170011747A1 (en) 2017-01-12
BR122021011692B1 (pt) 2022-03-22
CA2841303C (fr) 2021-01-19
MX2014000409A (es) 2014-09-15
KR20140050056A (ko) 2014-04-28
JP2014524048A (ja) 2014-09-18
FR2977969A1 (fr) 2013-01-18
US9368121B2 (en) 2016-06-14
KR20190124331A (ko) 2019-11-04
US20140142930A1 (en) 2014-05-22
EP2732448B1 (fr) 2015-09-09
BR112014000611A2 (pt) 2017-02-14
KR20190124332A (ko) 2019-11-04
ES2556268T3 (es) 2016-01-14
US10373622B2 (en) 2019-08-06
CN103814406B (zh) 2016-05-11
BR112014000611B1 (pt) 2021-09-08
RU2607230C2 (ru) 2017-01-10
KR102089273B1 (ko) 2020-03-16
KR102089281B1 (ko) 2020-03-16

Similar Documents

Publication Publication Date Title
RU2014104488A (ru) Адаптация взвешивающих окон анализа или синтеза для кодирования или декодирования путем преобразования
EP2992689B1 (en) Method and apparatus for compressing and decompressing a higher order ambisonics representation
RU2547220C2 (ru) Устройство и способ для генерирования высокочастотного аудиосигнала с применением адаптивной избыточной дискретизации
EP2750134B1 (en) Encoding device and method, decoding device and method, and program
RU2016105613A (ru) Аудиокодер, аудиодекодер и связанные способы с использованием двухканальной обработки в инфраструктуре интеллектуального заполнения интервалов отсутствия сигнала
RU2013119725A (ru) Гармоническое преобразование, усовершенствованное перекрестным произведением
JP2007526691A (ja) 信号解析及び合成のための適応型混合変換
RU2604994C2 (ru) Оптимизированное по задержке преобразование наложения, взвешивающие окна кодирования/декодирования
WO2007088853A1 (ja) 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法
RU2011147676A (ru) Эффективное комбинированное гармоническое преобразование
CN110070876B (zh) 线性预测分析装置、线性预测分析方法以及记录介质
EP2128858B1 (en) Encoding device and encoding method
CN102783034B (zh) 用于提供信号处理系数的方法和设备
JP3541680B2 (ja) 音声音楽信号の符号化装置および復号装置
CN105960676B (zh) 线性预测分析装置、方法以及记录介质
US9269359B2 (en) Coding of multi-channel signals
EP2267699A1 (en) Encoding device and encoding method
EP2467851B1 (en) Multi-channel audio decoding method and apparatus therefore
RU2016113836A (ru) Способ, аппарат, устройство, компьютерно-читаемый носитель для расширения полосы частот аудиосигнала с использованием масштабируемого возбуждения верхней полосы
CN106415718B (zh) 线性预测分析装置、方法以及记录介质
EP4235658B1 (en) Downscaled decoding of audio signals
JP4293005B2 (ja) 音声音楽信号の符号化装置および復号装置
KR20240128016A (ko) Qmf 도메인에서의 ivas spar 필터 뱅크
JP2013101212A (ja) ピッチ分析装置、音声符号化装置、ピッチ分析方法および音声符号化方法
CN102138178A (zh) 有临界点的信号处理系统和信息存储介质