RU2010100875A - Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов - Google Patents

Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов Download PDF

Info

Publication number
RU2010100875A
RU2010100875A RU2010100875/09A RU2010100875A RU2010100875A RU 2010100875 A RU2010100875 A RU 2010100875A RU 2010100875/09 A RU2010100875/09 A RU 2010100875/09A RU 2010100875 A RU2010100875 A RU 2010100875A RU 2010100875 A RU2010100875 A RU 2010100875A
Authority
RU
Russia
Prior art keywords
frame
signal
segment
remainder
temporarily
Prior art date
Application number
RU2010100875/09A
Other languages
English (en)
Inventor
Вивек РАДЖЕНДРАН (US)
Вивек РАДЖЕНДРАН
Анантападманабхан А. КАНДХАДАИ (US)
Анантападманабхан А. КАНДХАДАИ
Венкатеш КРИШНАН (US)
Венкатеш Кришнан
Original Assignee
Квэлкомм Инкорпорейтед (US)
Квэлкомм Инкорпорейтед
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Квэлкомм Инкорпорейтед (US), Квэлкомм Инкорпорейтед filed Critical Квэлкомм Инкорпорейтед (US)
Publication of RU2010100875A publication Critical patent/RU2010100875A/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. Способ обработки кадров аудиосигнала, причем упомянутый способ состоит в том, что: ! кодируют первый кадр аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR); и ! кодируют второй кадр аудиосигнала согласно схеме кодирования без PR, ! при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и ! при этом упомянутое кодирование первого кадра включает в себя временное модифицирование, на основании сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутое временное модифицирование включает в себя одно из (A) временного сдвига сегмента первого кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента первого сигнала на основании упомянутого сдвига во времени, и ! при этом упомянутое временное модифицирование сегмента первого сигнала включает в себя изменение положения импульса основного тона сегмента относительно другого импульса основного тона первого сигнала, и ! при этом упомянутое кодирование второго кадра включает в себя временное модифицирование, на основании сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутое временное модифицирование включает в себя одно из (A) временного сдвига сегмента второго кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента второго сигнала на основании упомянутого сдвига во времени. ! 2. Способ по п.1, в котором упомянутое кодирование первого кадра включает в себя создание первого кодированного кадра, который основан на подвергнутом временному модифицированию сегменте первого сигнала, и ! п

Claims (71)

1. Способ обработки кадров аудиосигнала, причем упомянутый способ состоит в том, что:
кодируют первый кадр аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR); и
кодируют второй кадр аудиосигнала согласно схеме кодирования без PR,
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом упомянутое кодирование первого кадра включает в себя временное модифицирование, на основании сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутое временное модифицирование включает в себя одно из (A) временного сдвига сегмента первого кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента первого сигнала на основании упомянутого сдвига во времени, и
при этом упомянутое временное модифицирование сегмента первого сигнала включает в себя изменение положения импульса основного тона сегмента относительно другого импульса основного тона первого сигнала, и
при этом упомянутое кодирование второго кадра включает в себя временное модифицирование, на основании сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутое временное модифицирование включает в себя одно из (A) временного сдвига сегмента второго кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента второго сигнала на основании упомянутого сдвига во времени.
2. Способ по п.1, в котором упомянутое кодирование первого кадра включает в себя создание первого кодированного кадра, который основан на подвергнутом временному модифицированию сегменте первого сигнала, и
при этом упомянутое кодирование второго кадра включает в себя создание второго кодированного кадра, который основан на подвергнутом временному модифицированию сегменте второго сигнала.
3. Способ по п.1, в котором первый сигнал является остатком первого кадра, и при этом второй сигнал является остатком второго кадра.
4. Способ по п.1, в котором первый и второй сигналы являются взвешенными аудиосигналами.
5. Способ по п.1, в котором упомянутое кодирование первого кадра включает в себя расчет сдвига во времени на основании информации из остатка третьего кадра, который предшествует первому кадру в аудиосигнале.
6. Способ по п.5, в котором упомянутый расчет сдвига во времени включает в себя отображение выборок остатка третьего кадра в профиль задержки аудиосигнала.
7. Способ по п.6, в котором упомянутое кодирование первого кадра включает в себя вычисление профиля задержки на основании информации, относящейся к периоду основного тона аудиосигнала.
8. Способ по п.1, в котором схема кодирования PR является схемой кодирования ослабленного линейного предсказания с кодовым возбуждением, и
при этом схема кодирования без PR является одной из (A) схемы кодирования линейного предсказания с шумовым возбуждением, (B) схемы кодирования с модифицированным дискретным косинусным преобразованием и (C) схемы кодирования с интерполяцией волновым сигналом-прототипом.
9. Способ по п.1, в котором схема кодирования без PR является схемой кодирования с модифицированным дискретным косинусным преобразованием.
10. Способ по п.1, в котором упомянутое кодирование второго кадра заключается в том, что:
выполняют операцию модифицированного дискретного косинусного преобразования (MDCT) над остатком второго кадра, чтобы получить кодированный остаток; и
выполняют операцию обратного MDCT над сигналом, который основан на кодированном остатке, чтобы получить декодированный остаток,
при этом второй сигнал основан на декодированном остатке.
11. Способ по п.1, в котором упомянутое кодирование второго кадра включает в себя:
формируют остаток второго кадра, при этом второй сигнал является сформированным остатком;
вслед за упомянутым временным модифицированием сегмента второго сигнала выполняют операцию модифицированного дискретного косинусного преобразования над сформированным остатком, включающим в себя подвергнутый временному модифицированию сегмент для получения кодированного остатка; и
создают второй кодированный кадр на основании кодированного остатка.
12. Способ по п.1, при этом упомянутый способ содержит осуществление временного сдвига согласно упомянутому сдвигу во времени, сегмента остатка кадра, который следует за вторым кадром в аудиосигнале.
13. Способ по п.1, при этом упомянутый способ включает в себя временное модифицирование на основании упомянутого сдвига во времени сегмента третьего сигнала, который основан на третьем кадре аудиосигнала, который следует за вторым кадром, и
при этом упомянутое кодирование второго кадра включает в себя выполнение операции модифицированного дискретного косинусного преобразования (MDCT) над окном, которое включает в себя выборки подвергнутых временному модифицированию сегментов второго и третьего сигналов.
14. Способ по п.13, в котором второй сигнал имеет длину в M выборок, и третий сигнал имеет длину в M выборок, и
при этом упомянутое выполнение операции MDCT включает в себя создание набора из M коэффициентов MDCT, которые основаны на (A) M выборках второго сигнала, включающего в себя подвергнутый временному модифицированию сегмент, и (B) не более чем 3M/4 выборках третьего сигнала.
15. Способ по п.13, в котором второй сигнал имеет длину в M выборок, и третий сигнал имеет длину в M выборок, и
при этом упомянутое выполнение операции MDCT включает в себя создание набора из M коэффициентов MDCT, которые основаны на последовательности из 2M выборок, которая (A) включает в себя M выборок второго сигнала, включающего в себя подвергнутый временному модифицированию сегмент, (B) начинается с последовательности из по меньшей мере M/8 выборок с нулевым значением и (C) заканчивается последовательностью из по меньшей мере M/8 выборок с нулевым значением.
16. Устройство для обработки кадров аудиосигнала, упомянутое устройство содержит:
средство для кодирования первого кадра аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR); и
средство для кодирования второго кадра аудиосигнала согласно схеме кодирования без PR,
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом упомянутое средство для кодирования первого кадра включает в себя средство для временного модифицирования, на основании сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутое средство для временного модифицирования сконфигурировано для выполнения одного из (A) временного сдвига сегмента первого кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента первого сигнала на основании упомянутого сдвига во времени, и
при этом упомянутое средство для временного модифицирования сегмента первого сигнала сконфигурировано для изменения положения импульса основного тона сегмента относительно другого импульса основного тона первого сигнала, и
при этом упомянутое средство для кодирования первого кадра включает в себя средство для временного модифицирования, на основании сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутое средство для временного модифицирования сконфигурировано для выполнения одного из (A) временного сдвига сегмента второго кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента второго сигнала на основании упомянутого сдвига во времени.
17. Устройство по п.16, при этом первый сигнал является остатком первого кадра, и при этом второй сигнал является остатком второго кадра.
18. Устройство по п.16, при этом первый и второй сигналы являются взвешенными аудиосигналами.
19. Устройство по п.16, в котором упомянутое средство для кодирования первого кадра включает в себя средство для расчета сдвига во времени на основании информации из остатка третьего кадра, который предшествует первому кадру в аудиосигнале.
20. Устройство по п.16, в котором упомянутое средство для кодирования второго кадра включает в себя:
средство для формирования остатка второго кадра, при этом второй сигнал является сформированным остатком; и
средство для выполнения операции модифицированного дискретного косинусного преобразования над сформированным остатком, включающим в себя подвергнутый временному модифицированию сегмент, чтобы получить кодированный остаток,
при этом упомянутое средство для кодирования второго кадра сконфигурировано для создания второго кодированного кадра на основании кодированного остатка.
21. Устройство по п.16, в котором упомянутое средство для временного модифицирования сегмента второго сигнала сконфигурировано для осуществления временного сдвига согласно упомянутому сдвигу во времени сегмента остатка кадра, который следует за вторым кадром в аудиосигнале.
22. Устройство по п.16, в котором упомянутое средство для временного модифицирования сегмента второго сигнала сконфигурировано для временного модифицирования на основании упомянутого сдвига во времени сегмента третьего сигнала, который основан на третьем кадре аудиосигнала, который следует за вторым кадром, и
при этом упомянутое средство для кодирования второго кадра включает в себя средство для выполнения операции модифицированного дискретного косинусного преобразования (MDCT) над окном, которое включает в себя выборки подвергнутых временному модифицированию сегментов второго и третьего сигналов.
23. Устройство по п.22, при этом второй сигнал имеет длину в M выборок, и третий сигнал имеет длину в M выборок, и
при этом упомянутое средство для выполнения операции MDCT сконфигурировано для создания набора из M коэффициентов MDCT, которые основаны на (A) M выборках второго сигнала, включающего в себя подвергнутый временному модифицированию сегмент, и (B) не более чем 3M/4 выборках третьего сигнала.
24. Устройство для обработки кадров аудиосигнала, упомянутое устройство содержит:
кодер первого кадра, сконфигурированный для кодирования первого кадра аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR); и
кодер второго кадра, сконфигурированный для кодирования второго кадра аудиосигнала согласно схеме кодирования без PR,
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом упомянутый кодер первого кадра включает в себя первый временной модификатор, сконфигурированный для временного модифицирования, на основании сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутый первый временной модификатор сконфигурирован для выполнения одного из (A) временного сдвига сегмента первого кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента первого сигнала на основании упомянутого сдвига во времени, и
при этом упомянутый первый временной модификатор сконфигурирован для изменения положения импульса основного тона сегмента относительно другого импульса основного тона первого сигнала, и
при этом упомянутый кодер второго кадра включает в себя второй временной модификатор, сконфигурированный для временного модифицирования, на основании сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутый второй временной модификатор сконфигурирован для выполнения одного из (A) временного сдвига сегмента второго кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента второго сигнала на основании упомянутого сдвига во времени.
25. Устройство по п.24, при этом первый сигнал является остатком первого кадра, и при этом второй сигнал является остатком второго кадра.
26. Устройство по п.24, при этом первый и второй сигналы являются взвешенными аудиосигналами.
27. Устройство по п.24, в котором упомянутый кодер первого кадра включает в себя вычислитель сдвига во времени, сконфигурированный для расчета сдвига во времени на основании информации из остатка третьего кадра, который предшествует первому кадру в аудиосигнале.
28. Устройство по п.24, в котором упомянутый кодер второго кадра включает в себя:
формирователь остатка, сконфигурированный для формирования остатка второго кадра, при этом второй сигнал является сформированным остатком; и
модуль модифицированного дискретного косинусного преобразования (MDCT), сконфигурированный для выполнения операции MDCT над сформированным остатком, включающим в себя подвергнутый временному модифицированию сегмент, чтобы получить кодированный остаток,
при этом упомянутый кодер второго кадра сконфигурирован для создания второго кодированного кадра на основании кодированного остатка.
29. Устройство по п.24, в котором упомянутый второй временной модификатор сконфигурирован для осуществления временного сдвига согласно упомянутому сдвигу во времени сегмента остатка кадра, который следует за вторым кадром в аудиосигнале.
30. Устройство по п.24, в котором упомянутый второй временной модификатор сконфигурирован для временного модифицирования на основании упомянутого сдвига во времени сегмента третьего сигнала, который основан на третьем кадре аудиосигнала, который следует за вторым кадром, и
при этом упомянутый кодер второго кадра включает в себя модуль модифицированного дискретного косинусного преобразования (MDCT), сконфигурированный для выполнения операции MDCT над окном, которое включает в себя выборки подвергнутых временному модифицированию сегментов второго и третьего сигналов.
31. Устройство по п.30, при этом второй сигнал имеет длину в M выборок, и третий сигнал имеет длину в M выборок, и
при этом упомянутый модуль MDCT сконфигурирован для создания набора из M коэффициентов MDCT, которые основаны на (A) M выборках второго сигнала, включающего в себя подвергнутый временному модифицированию сегмент, и (B) не более чем 3M/4 выборках третьего сигнала.
32. Машиночитаемый носитель, содержащий команды, которые при исполнении их процессором побуждают процессор:
кодировать первый кадр аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR); и
кодировать второй кадр аудиосигнала согласно схеме кодирования без PR,
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом упомянутые команды, которые, при их исполнении, побуждают процессор кодировать первый кадр, включают в себя команды для временного модифицирования, на основании сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутые команды для временного модифицирования включают в себя одну из (A) команд для временного сдвига сегмента первого кадра согласно упомянутому сдвигу во времени и (B) команд для изменения шкалы времени сегмента первого сигнала на основании упомянутого сдвига во времени, и
при этом упомянутые команды для временного модифицирования сегмента первого сигнала включают в себя команды для изменения положения импульса основного тона сегмента относительно другого импульса основного тона первого сигнала, и
при этом упомянутые команды, которые, при их исполнении, побуждают процессор кодировать второй кадр, включают в себя команды для временного модифицирования, на основании сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутые команды для временного модифицирования включают в себя одну из (A) команд для временного сдвига сегмента второго кадра согласно упомянутому сдвигу во времени и (B) команд для изменения шкалы времени сегмента второго сигнала на основании упомянутого сдвига во времени.
33. Способ обработки кадров аудиосигнала, причем упомянутый способ состоит в том, что:
кодируют первый кадр аудиосигнала согласно первой схеме кодирования; и
кодируют второй кадр аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR),
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом первая схема кодирования является схемой кодировании без PR, и
при этом упомянутое кодирование первого кадра включает в себя временное модифицирование, на основании первого сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутое временное модифицирование включает в себя один из (A) временного сдвига сегмента первого сигнала согласно первому сдвигу во времени и (B) изменения шкалы времени сегмента первого сигнала на основании первого сдвига во времени; и
при этом упомянутое кодирование второго кадра включает в себя временное модифицирование, на основании второго сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутое временное модифицирование включает в себя один из (A) временного сдвига сегмента второго сигнала согласно второму сдвигу во времени и (B) изменения шкалы времени сегмента второго сигнала на основании второго сдвига во времени,
при этом упомянутое временное модифицирование сегмента второго сигнала включает в себя изменение положения импульса основного тона сегмента относительно другого импульса основного тона второго сигнала, и
при этом второй сдвиг во времени основан на информации из подвергнутого временному модифицированию сегмента первого сигнала.
34. Способ по п.33, в котором упомянутое кодирование первого кадра включает в себя создание первого кодированного кадра, который основан на подвергнутом временному модифицированию сегменте первого сигнала, и
при этом упомянутое кодирование второго кадра включает в себя создание второго кодированного кадра, который основан на подвергнутом временному модифицированию сегменте второго сигнала.
35. Способ по п.33, в котором первый сигнал является остатком первого кадра, и при этом второй сигнал является остатком второго кадра.
36. Способ по п.33, в котором первый и второй сигналы являются взвешенными аудиосигналами.
37. Способ по п.33, в котором упомянутое временное модифицирование сегмента второго сигнала включает в себя расчет второго сдвига во времени на основании информации из подвергнутого временному модифицированию сегмента первого сигнала, и
при этом упомянутый расчет второго сдвига во времени включает в себя отображение подвергнутого временному модифицированию сегмента первого сигнала в профиль задержки, который основан на информации из второго кадра.
38. Способ по п.37, в котором упомянутый второй сдвиг во времени основан на корреляции между выборками отображенного сегмента и выборками подвергнутого временному модифицированию остатка, и
при этом подвергнутый временному модифицированию остаток основан на (A) выборках остатка второго кадра и (B) первом сдвиге во времени.
39. Способ по п.33, в котором второй сигнал является остатком второго кадра, и
при этом упомянутое временное модифицирование сегмента второго сигнала включает в себя временной сдвиг первого сегмента остатка согласно второму сдвигу во времени, и при этом упомянутый способ содержит этапы, на которых:
рассчитывают третий сдвиг во времени, который является иным, чем второй сдвиг во времени, на основании информации из подвергнутого временному модифицированию сегмента первого сигнала; и
осуществляют временной сдвиг второго сегмента остатка согласно третьему сдвигу во времени.
40. Способ по п.33, в котором второй сигнал является остатком второго кадра, и
при этом упомянутое временное модифицирование сегмента второго сигнала включает в себя временной сдвиг первого сегмента остатка согласно второму сдвигу во времени, и при этом упомянутый способ содержит этапы, на которых:
рассчитывают третий сдвиг во времени, который является иным, чем второй сдвиг во времени, на основании информации из подвергнутого временному модифицированию первого сегмента остатка; и
осуществляют временной сдвиг второго сегмента остатка согласно третьему сдвигу во времени.
41. Способ по п.33, в котором упомянутое временное модифицирование сегмента второго сигнала включает в себя отображение выборок подвергнутого временному модифицированию сегмента первого сигнала в профиль задержки, который основан на информации из второго кадра.
42. Способ по п.33, причем упомянутый способ содержит этапы, на которых:
сохраняют последовательность, основанную на подвергнутом временному модифицированию сегменте первого сигнала, в буфер адаптивного словаря кодов; и
вслед за упомянутым сохранением отображают выборки буфера адаптивного словаря кодов в профиль задержки, который основан на информации из второго кадра.
43. Способ по п.33, в котором второй сигнал является остатком второго кадра, и при этом упомянутое временное модифицирование сегмента второго сигнала включает в себя изменение шкалы времени остатка второго кадра, и
при этом упомянутый способ содержит изменение шкалы времени остатка третьего кадра аудиосигнала на основании информации из подвергнутого изменению шкалы времени остатка второго кадра, при этом третий кадр является следующим за вторым кадром в аудиосигнале.
44. Способ по п.33, в котором второй сигнал является остатком второго кадра, и при этом упомянутое временное модифицирование сегмента второго сигнала включает в себя расчет второго сдвига во времени на основании (A) информации из подвергнутого временному модифицированию сегмента первого сигнала и (B) информации из остатка второго кадра.
45. Способ по п.33, в котором схема кодирования с PR является схемой кодирования ослабленного линейного предсказания с кодовым возбуждением, и при этом схема кодирования без PR является одной из (A) схемы кодирования линейного предсказания с шумовым возбуждением, (B) схемы кодирования с модифицированным дискретным косинусным преобразованием и (C) схемы кодирования с интерполяцией волновым сигналом-прототипом.
46. Способ по п.33, в котором схема кодирования без PR является схемой кодирования модифицированного дискретного косинусного преобразования.
47. Способ по п.33, в котором упомянутое кодирование первого кадра включает в себя этапы, на которых:
выполняют операцию модифицированного дискретного косинусного преобразования (MDCT) над остатком первого кадра, чтобы получить кодированный остаток; и
выполняют операцию обратного MDCT над сигналом, который основан на кодированном остатке, чтобы получить декодированный остаток,
при этом первый сигнал основан на декодированном остатке.
48. Способ по п.33, в котором упомянутое кодирование первого кадра включает в себя этапы, на которых:
формируют остаток первого кадра, при этом первый сигнал является сформированным остатком;
вслед за упомянутым временным модифицированием сегмента первого сигнала выполняют операцию модифицированного дискретного косинусного преобразования над сформированным остатком, включающим в себя подвергнутый временному модифицированию сегмент, для получения кодированного остатка; и
создают первый кодированный кадр на основании кодированного остатка.
49. Способ по п.33, в котором первый сигнал имеет длину в M выборок, и второй сигнал имеет длину в M выборок, и
при этом упомянутое кодирование первого кадра включает в себя создание набора из M коэффициентов модифицированного дискретного косинусного преобразования (MDCT), которые основаны на M выборках первого сигнала, включающего в себя подвергнутый временному модифицированию сегмент, и не более чем 3M/4 выборках второго сигнала.
50. Способ по п.33, в котором первый сигнал имеет длину в M выборок, и второй сигнал имеет длину в M выборок, и
при этом упомянутое кодирование первого кадра включает в себя создание набора из M коэффициентов модифицированного дискретного косинусного преобразования (MDCT), которые основаны на последовательности 2M выборок, которая (A) включает в себя M выборок первого сигнала, включающего в себя подвергнутый временному модифицированию сегмент, (B) начинается с последовательности из по меньшей мере M/8 выборок с нулевым значением и (C) заканчивается последовательностью из по меньшей мере M/8 выборок с нулевым значением.
51. Устройство для обработки кадров аудиосигнала, упомянутое устройство содержит:
средство для кодирования первого кадра аудиосигнала согласно первой схеме кодирования; и
средство для кодирования второго кадра аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR),
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом первая схема кодирования является схемой кодировании без PR, и
при этом упомянутое средство для кодирования первого кадра включает в себя средство для временного модифицирования, на основании первого сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутое средство для временного модифицирования сконфигурировано для выполнения одного из (A) временного сдвига сегмента первого сигнала согласно первому сдвигу во времени и (B) изменения шкалы времени сегмента первого сигнала на основании первого сдвига во времени; и
при этом упомянутое средство для кодирования второго кадра включает в себя средство для временного модифицирования, на основании второго сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутое средство для временного модифицирования сконфигурировано для выполнения одного из (A) временного сдвига сегмента второго сигнала согласно второму сдвигу во времени и (B) изменения шкалы времени сегмента второго сигнала на основании второго сдвига во времени,
при этом упомянутое средство для временного модифицирования сегмента второго сигнала сконфигурировано для изменения положения импульса основного тона сегмента относительно другого импульса основного тона второго сигнала, и
при этом второй сдвиг во времени основан на информации из подвергнутого временному модифицированию сегмента первого сигнала.
52. Устройство по п.51, при этом первый сигнал является остатком первого кадра, и при этом второй сигнал является остатком второго кадра.
53. Устройство по п.51, при этом первый и второй сигналы являются взвешенными аудиосигналами.
54. Устройство по п.51, в котором упомянутое средство для временного модифицирования сегмента второго сигнала включает в себя средство для расчета второго сдвига во времени на основании информации из подвергнутого временному модифицированию сегмента первого сигнала, и
при этом упомянутое средство для расчета второго сдвига во времени включает в себя средство для отображения подвергнутого временному модифицированию сегмента первого сигнала в профиль задержки, который основан на информации из второго кадра.
55. Устройство по п.54, при этом упомянутый второй сдвиг во времени основан на корреляции между выборками отображенного сегмента и выборками подвергнутого временному модифицированию остатка, и
при этом подвергнутый временному модифицированию остаток основан на (A) выборках остатка второго кадра и (B) первом сдвиге во времени.
56. Устройство по п.51, в котором второй сигнал является остатком второго кадра, и при этом упомянутое средство для временного модифицирования сегмента второго сигнала сконфигурировано для временного сдвига первого сегмента остатка согласно второму сдвигу во времени, и при этом упомянутый способ содержит:
средство для расчета третьего сдвига во времени, который является иным, чем второй сдвиг во времени, на основании информации из подвергнутого временному модифицированию первого сегмента остатка; и
средство для временного сдвига второго сегмента остатка согласно третьему сдвигу во времени.
57. Устройство по п.51, при этом второй сигнал является остатком второго кадра, и при этом упомянутое средство для временного модифицирования сегмента второго сигнала включает в себя средство для расчета второго сдвига во времени на основании (A) информации из подвергнутого временному модифицированию сегмента первого сигнала и (B) информации из остатка второго кадра.
58. Устройство по п.51, в котором упомянутое средство для кодирования первого кадра включает в себя:
средство для формирования остатка первого кадра, при этом первый сигнал является сформированным остатком; и
средство для выполнения операции модифицированного дискретного косинусного преобразования над сформированным остатком, включающим в себя подвергнутый временному модифицированию сегмент, чтобы получить кодированный остаток, и
при этом упомянутое средство для кодирования первого кадра сконфигурировано для создания первого кодированного кадра на основании кодированного остатка.
59. Устройство по п.51, в котором первый сигнал имеет длину в M выборок, и второй сигнал имеет длину в M выборок, и
при этом упомянутое средство для кодирования первого кадра включает в себя средство для создания набора из M коэффициентов модифицированного дискретного косинусного преобразования (MDCT), которые основаны на M выборках первого сигнала, включающего в себя подвергнутый временному модифицированию сегмент, и не более чем 3M/4 выборках второго сигнала.
60. Устройство по п.51, в котором первый сигнал имеет длину в M выборок, и второй сигнал имеет длину в M выборок, и
при этом упомянутое средство для кодирования первого кадра включает в себя средство для создания набора из M коэффициентов модифицированного дискретного косинусного преобразования (MDCT), которые основаны на последовательности из 2M выборок, которая (A) включает в себя M выборок первого сигнала, включающего в себя подвергнутый временному модифицированию сегмент, (B) начинается с последовательности из по меньшей мере M/8 выборок с нулевым значением и (C) заканчивается последовательностью из по меньшей мере M/8 выборок с нулевым значением.
61. Устройство для обработки кадров аудиосигнала, упомянутое устройство содержит:
кодер первого кадра, сконфигурированный для кодирования первого кадра аудиосигнала согласно первой схеме кодирования; и
кодер второго кадра, сконфигурированный для кодирования второго кадра аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR),
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом первая схема кодирования является схемой кодировании без PR, и
при этом упомянутый кодер первого кадра включает в себя первый временной модификатор, сконфигурированный для временного модифицирования, на основании первого сдвига во времени сегмента первого сигнала, который основан на первом кадре, причем упомянутый первый временной модификатор сконфигурирован для выполнения одного из (A) временного сдвига сегмента первого сигнала согласно первому сдвигу во времени и (B) изменения шкалы времени сегмента первого сигнала на основании первого сдвига во времени; и
при этом упомянутый кодер второго кадра включает в себя второй временной модификатор, сконфигурированный для временного модифицирования, на основании второго сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутый второй временной модификатор сконфигурирован для выполнения одного из (A) временного сдвига сегмента второго сигнала согласно второму сдвигу во времени и (B) изменения шкалы времени сегмента второго сигнала на основании второго сдвига во времени,
при этом упомянутый второй временной модификатор сконфигурирован для изменения положения импульса основного тона сегмента второго сигнала относительно другого импульса основного тона второго сигнала, и
при этом второй сдвиг во времени основан на информации из подвергнутого временному модифицированию сегмента первого сигнала.
62. Устройство по п.61, при этом первый сигнал является остатком первого кадра, и при этом второй сигнал является остатком второго кадра.
63. Устройство по п.61, при этом первый и второй сигналы являются взвешенными аудиосигналами.
64. Устройство по п.61, в котором упомянутый второй временной модификатор включает в себя вычислитель сдвига во времени, сконфигурированный для расчета второго сдвига во времени на основании информации из подвергнутого временному модифицированию сегмента первого сигнала, и
при этом упомянутый вычислитель сдвига во времени включает в себя модуль отображения, сконфигурированный для отображения подвергнутого временному модифицированию сегмента первого сигнала в профиль задержки, который основан на информации из второго кадра.
65. Устройство по п.64, при этом упомянутый второй сдвиг во времени основан на корреляции между выборками отображенного сегмента и выборками подвергнутого временному модифицированию остатка, и
при этом подвергнутый временному модифицированию остаток основан на (A) выборках остатка второго кадра и (B) первом сдвиге во времени.
66. Устройство по п.61, в котором второй сигнал является остатком второго кадра, и
при этом упомянутый второй временной модификатор сконфигурирован для временного сдвига первого сегмента остатка согласно второму сдвигу во времени, и
при этом упомянутый вычислитель сдвига во времени сконфигурирован для расчета третьего сдвига во времени, который является иным, чем второй сдвиг во времени, на основании информации из подвергнутого временному модифицированию первого сегмента остатка, и
при этом упомянутый второй временной преобразователь сконфигурирован для временного сдвига второго сегмента остатка согласно третьему сдвигу во времени.
67. Устройство по п.61, в котором второй сигнал является остатком второго кадра, и при этом упомянутый второй временной модификатор включает в себя вычислитель сдвига во времени, сконфигурированный для расчета второго сдвига во времени на основании (A) информации из подвергнутого временному модифицированию сегмента первого сигнала и (B) информации из остатка второго кадра.
68. Устройство по п.61, в котором упомянутый кодер первого кадра включает в себя:
формирователь остатка, сконфигурированный для формирования остатка первого кадра, при этом первый сигнал является сформированным остатком; и
модуль модифицированного дискретного косинусного преобразования (MDCT), сконфигурированный для выполнения операции MDCT над сформированным остатком, включающим в себя подвергнутый временному модифицированию сегмент, чтобы получить кодированный остаток, и
при этом упомянутый кодер первого кадра сконфигурирован для создания первого кодированного кадра на основании кодированного остатка.
69. Устройство по п.61, в котором первый сигнал имеет длину в M выборок, и второй сигнал имеет длину в M выборок, и
при этом упомянутый кодер первого кадра включает в себя модуль модифицированного дискретного косинусного преобразования (MDCT), сконфигурированный для создания набора из M коэффициентов MDCT, которые основаны на M выборках первого сигнала, включающего в себя подвергнутый временному модифицированию сегмент, и не более чем 3M/4 выборках второго сигнала.
70. Устройство по п.61, в котором первый сигнал имеет длину в M выборок, и второй сигнал имеет длину в M выборок, и
при этом упомянутый кодер первого кадра включает в себя модуль модифицированного дискретного косинусного преобразования (MDCT), сконфигурированный для создания набора из M коэффициентов MDCT, которые основаны на последовательности из 2M выборок, которая (A) включает в себя M выборок первого сигнала, включающего в себя подвергнутый временному модифицированию сегмент, (B) начинается с последовательности из по меньшей мере M/8 выборок с нулевым значением и (C) заканчивается последовательностью из по меньшей мере M/8 выборок с нулевым значением.
71. Машиночитаемый носитель, содержащий команды, которые при исполнении их процессором побуждают процессор:
кодировать первый кадр аудиосигнала согласно первой схеме кодирования; и
кодировать второй кадр аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR),
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом первая схема кодирования является схемой кодировании без PR, и
при этом упомянутые команды, которые при исполнении их процессором побуждают процессор кодировать первый кадр, включают в себя команды для временного модифицирования на основании первого сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутые команды для временного модифицирования включают в себя одну из (A) команд для временного сдвига сегмента первого сигнала согласно первому сдвигу во времени и (B) команд для изменения шкалы времени сегмента первого сигнала на основании первого сдвига во времени; и
при этом упомянутые команды, которые при исполнении их процессором побуждают процессор кодировать второй кадр, включают в себя команды для временного модифицирования на основании второго сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутые команды для временного модифицирования включают в себя одну из (A) команд для временного сдвига сегмента второго сигнала согласно второму сдвигу во времени и (B) команд для изменения шкалы времени сегмента второго сигнала на основании второго сдвига во времени,
при этом упомянутые команды для временного модифицирования сегмента второго сигнала включают в себя команды для изменения положения импульса основного тона сегмента относительно другого импульса основного тона второго сигнала, и
при этом второй сдвиг во времени основан на информации из подвергнутого временному модифицированию сегмента первого сигнала.
RU2010100875/09A 2007-06-13 2008-06-13 Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов RU2010100875A (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US94355807P 2007-06-13 2007-06-13
US60/943,558 2007-06-13
US12/137,700 US9653088B2 (en) 2007-06-13 2008-06-12 Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US12/137,700 2008-06-12

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2011134203/08A Division RU2470384C1 (ru) 2007-06-13 2011-08-15 Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов

Publications (1)

Publication Number Publication Date
RU2010100875A true RU2010100875A (ru) 2011-07-20

Family

ID=40133142

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2010100875/09A RU2010100875A (ru) 2007-06-13 2008-06-13 Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов
RU2011134203/08A RU2470384C1 (ru) 2007-06-13 2011-08-15 Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов

Family Applications After (1)

Application Number Title Priority Date Filing Date
RU2011134203/08A RU2470384C1 (ru) 2007-06-13 2011-08-15 Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов

Country Status (10)

Country Link
US (1) US9653088B2 (ru)
EP (1) EP2176860B1 (ru)
JP (2) JP5405456B2 (ru)
KR (1) KR101092167B1 (ru)
CN (1) CN101681627B (ru)
BR (1) BRPI0812948A2 (ru)
CA (1) CA2687685A1 (ru)
RU (2) RU2010100875A (ru)
TW (1) TWI405186B (ru)
WO (1) WO2008157296A1 (ru)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100788706B1 (ko) * 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
US8254588B2 (en) 2007-11-13 2012-08-28 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for providing step size control for subband affine projection filters for echo cancellation applications
ES2654433T3 (es) 2008-07-11 2018-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de señal de audio, método para codificar una señal de audio y programa informático
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
KR101381513B1 (ko) * 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
KR101170466B1 (ko) 2008-07-29 2012-08-03 한국전자통신연구원 Mdct 영역에서의 후처리 방법, 및 장치
CN104240713A (zh) * 2008-09-18 2014-12-24 韩国电子通信研究院 编码方法和解码方法
WO2010047566A2 (en) * 2008-10-24 2010-04-29 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
WO2010102446A1 (zh) 2009-03-11 2010-09-16 华为技术有限公司 一种线性预测分析方法、装置及系统
US8805680B2 (en) * 2009-05-19 2014-08-12 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding audio signal using layered sinusoidal pulse coding
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
JP5304504B2 (ja) * 2009-07-17 2013-10-02 ソニー株式会社 信号符号化装置、信号復号装置、信号処理システム、これらにおける処理方法およびプログラム
FR2949582B1 (fr) * 2009-09-02 2011-08-26 Alcatel Lucent Procede pour rendre un signal musical compatible avec un codec a transmission discontinue ; et dispositif pour la mise en ?uvre de ce procede
PL4152320T3 (pl) 2009-10-21 2024-02-19 Dolby International Ab Nadpróbkowanie w banku filtrów połączonym z modułem transpozycji
US8682653B2 (en) * 2009-12-15 2014-03-25 Smule, Inc. World stage for pitch-corrected vocal performances
US9147385B2 (en) 2009-12-15 2015-09-29 Smule, Inc. Continuous score-coded pitch correction
CN102884572B (zh) * 2010-03-10 2015-06-17 弗兰霍菲尔运输应用研究公司 音频信号解码器、音频信号编码器、用以将音频信号解码的方法、及用以将音频信号编码的方法
GB2546687B (en) 2010-04-12 2018-03-07 Smule Inc Continuous score-coded pitch correction and harmony generation techniques for geographically distributed glee club
US9601127B2 (en) 2010-04-12 2017-03-21 Smule, Inc. Social music system and method with continuous, real-time pitch correction of vocal performance and dry vocal capture for subsequent re-rendering based on selectively applicable vocal effect(s) schedule(s)
US10930256B2 (en) 2010-04-12 2021-02-23 Smule, Inc. Social music system and method with continuous, real-time pitch correction of vocal performance and dry vocal capture for subsequent re-rendering based on selectively applicable vocal effect(s) schedule(s)
RU2582061C2 (ru) 2010-06-09 2016-04-20 Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка Способ расширения ширины полосы, устройство расширения ширины полосы, программа, интегральная схема и устройство декодирования аудио
US8831933B2 (en) 2010-07-30 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-stage shape vector quantization
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US20120089390A1 (en) * 2010-08-27 2012-04-12 Smule, Inc. Pitch corrected vocal capture for telephony targets
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
US20120143611A1 (en) * 2010-12-07 2012-06-07 Microsoft Corporation Trajectory Tiling Approach for Text-to-Speech
PT2676270T (pt) 2011-02-14 2017-05-02 Fraunhofer Ges Forschung Codificação de uma parte de um sinal de áudio utilizando uma deteção de transiente e um resultado de qualidade
JP5625126B2 (ja) 2011-02-14 2014-11-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム
JP5849106B2 (ja) 2011-02-14 2016-01-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法
RU2560788C2 (ru) 2011-02-14 2015-08-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки декодированного аудиосигнала в спектральной области
JP5800915B2 (ja) 2011-02-14 2015-10-28 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号のトラックのパルス位置の符号化および復号化
SG185519A1 (en) 2011-02-14 2012-12-28 Fraunhofer Ges Forschung Information signal representation using lapped transform
CN105304090B (zh) * 2011-02-14 2019-04-09 弗劳恩霍夫应用研究促进协会 使用对齐的前瞻部分将音频信号编码及解码的装置与方法
TWI591468B (zh) 2011-03-30 2017-07-11 仁寶電腦工業股份有限公司 電子裝置與風扇控制方法
US9866731B2 (en) 2011-04-12 2018-01-09 Smule, Inc. Coordinating and mixing audiovisual content captured from geographically distributed performers
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
WO2013061211A1 (en) * 2011-10-27 2013-05-02 Centre For Development Of Telematics (C-Dot) A communication system for managing leased line network and a method thereof
US20140269259A1 (en) * 2011-10-27 2014-09-18 Centre For Development Of Telematics (C-Dot) Communication system for managing leased line network with wireless fallback
KR101390551B1 (ko) * 2012-09-24 2014-04-30 충북대학교 산학협력단 저 지연 변형된 이산 코사인 변환 방법
EP3933836A1 (en) 2012-11-13 2022-01-05 Samsung Electronics Co., Ltd. Method and apparatus for determining encoding mode, method and apparatus for encoding audio signals, and method and apparatus for decoding audio signals
EP2757558A1 (en) * 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
EP3451334B1 (en) 2013-01-29 2020-04-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Noise filling concept
CN117253497A (zh) * 2013-04-05 2023-12-19 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
CN104301064B (zh) * 2013-07-16 2018-05-04 华为技术有限公司 处理丢失帧的方法和解码器
US9984706B2 (en) * 2013-08-01 2018-05-29 Verint Systems Ltd. Voice activity detection using a soft decision mechanism
CN104681032B (zh) * 2013-11-28 2018-05-11 中国移动通信集团公司 一种语音通信方法和设备
WO2015104065A1 (en) * 2014-01-13 2015-07-16 Nokia Solutions And Networks Oy Method, apparatus and computer program
US9666210B2 (en) * 2014-05-15 2017-05-30 Telefonaktiebolaget Lm Ericsson (Publ) Audio signal classification and coding
CN105225666B (zh) 2014-06-25 2016-12-28 华为技术有限公司 处理丢失帧的方法和装置
CN106228991B (zh) 2014-06-26 2019-08-20 华为技术有限公司 编解码方法、装置及系统
EP3796314B1 (en) * 2014-07-28 2021-12-22 Nippon Telegraph And Telephone Corporation Coding of a sound signal
RU2632151C2 (ru) 2014-07-28 2017-10-02 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ выбора одного из первого алгоритма кодирования и второго алгоритма кодирования с использованием уменьшения гармоник
CN112967727A (zh) * 2014-12-09 2021-06-15 杜比国际公司 Mdct域错误掩盖
CN104616659B (zh) * 2015-02-09 2017-10-27 山东大学 相位对重构语音声调感知影响方法及在人工耳蜗中应用
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US11488569B2 (en) 2015-06-03 2022-11-01 Smule, Inc. Audio-visual effects system for augmentation of captured performance based on content thereof
US10210871B2 (en) * 2016-03-18 2019-02-19 Qualcomm Incorporated Audio processing for temporally mismatched signals
US11310538B2 (en) 2017-04-03 2022-04-19 Smule, Inc. Audiovisual collaboration system and method with latency management for wide-area broadcast and social media-type user interface mechanics
CN110692252B (zh) 2017-04-03 2022-11-01 思妙公司 具有用于广域广播的延迟管理的视听协作方法

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5384891A (en) 1988-09-28 1995-01-24 Hitachi, Ltd. Vector quantizing apparatus and speech analysis-synthesis system using the apparatus
US5357594A (en) 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
JPH0385398A (ja) 1989-08-30 1991-04-10 Omron Corp 扇風機の送風量ファジイ制御装置
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
FR2675969B1 (fr) 1991-04-24 1994-02-11 France Telecom Procede et dispositif de codage-decodage d'un signal numerique.
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3531177B2 (ja) 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
TW271524B (ru) 1994-08-05 1996-03-01 Qualcomm Inc
EP0732687B2 (en) 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
US5704003A (en) 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
KR100389895B1 (ko) * 1996-05-25 2003-11-28 삼성전자주식회사 음성 부호화 및 복호화방법 및 그 장치
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
WO1999010719A1 (en) 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6169970B1 (en) 1998-01-08 2001-01-02 Lucent Technologies Inc. Generalized analysis-by-synthesis speech coding method and apparatus
ES2247741T3 (es) * 1998-01-22 2006-03-01 Deutsche Telekom Ag Metodo para conmutacion controlada por señales entre esquemas de codificacion de audio.
US6449590B1 (en) 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6754630B2 (en) * 1998-11-13 2004-06-22 Qualcomm, Inc. Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6456964B2 (en) * 1998-12-21 2002-09-24 Qualcomm, Incorporated Encoding of periodic speech using prototype waveforms
DE60024963T2 (de) 1999-05-14 2006-09-28 Matsushita Electric Industrial Co., Ltd., Kadoma Verfahren und vorrichtung zur banderweiterung eines audiosignals
US6330532B1 (en) 1999-07-19 2001-12-11 Qualcomm Incorporated Method and apparatus for maintaining a target bit rate in a speech coder
JP4792613B2 (ja) 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
JP4211166B2 (ja) * 1999-12-10 2009-01-21 ソニー株式会社 符号化装置及び方法、記録媒体、並びに復号装置及び方法
US7386444B2 (en) * 2000-09-22 2008-06-10 Texas Instruments Incorporated Hybrid speech coding and system
US6947888B1 (en) * 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
EP1199711A1 (en) 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
US6694293B2 (en) * 2001-02-13 2004-02-17 Mindspeed Technologies, Inc. Speech coding system with a music classifier
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7136418B2 (en) 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US6879955B2 (en) 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
EP1341160A1 (en) 2002-03-01 2003-09-03 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding and for decoding a digital information signal
US7116745B2 (en) 2002-04-17 2006-10-03 Intellon Corporation Block oriented digital communication system and method
BR0305556A (pt) 2002-07-16 2004-09-28 Koninkl Philips Electronics Nv Método e codificador para codificar pelo menos parte de um sinal de áudio a fim de obter um sinal codificado, sinal codificado representando pelo menos parte de um sinal de áudio, meio de armazenamento, método e decodificador para decodificar um sinal codificado, transmissor, receptor, e, sistema
US8090577B2 (en) * 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
JP4178319B2 (ja) * 2002-09-13 2008-11-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声処理におけるフェーズ・アライメント
US20040098255A1 (en) 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
GB0321093D0 (en) 2003-09-09 2003-10-08 Nokia Corp Multi-rate coding
US7412376B2 (en) * 2003-09-10 2008-08-12 Microsoft Corporation System and method for real-time detection and preservation of speech onset in a signal
FR2867649A1 (fr) 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
US7516064B2 (en) 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
FI118834B (fi) * 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
WO2005099243A1 (ja) 2004-04-09 2005-10-20 Nec Corporation 音声通信方法及び装置
US8032360B2 (en) * 2004-05-13 2011-10-04 Broadcom Corporation System and method for high-quality variable speed playback of audio-visual media
MXPA06012617A (es) * 2004-05-17 2006-12-15 Nokia Corp Codificacion de audio con diferentes longitudes de cuadro de codificacion.
US7739120B2 (en) * 2004-05-17 2010-06-15 Nokia Corporation Selection of coding models for encoding an audio signal
JP5100124B2 (ja) 2004-10-26 2012-12-19 パナソニック株式会社 音声符号化装置および音声符号化方法
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
WO2006107838A1 (en) 2005-04-01 2006-10-12 Qualcomm Incorporated Systems, methods, and apparatus for highband time warping
US7991610B2 (en) 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
FR2891100B1 (fr) * 2005-09-22 2008-10-10 Georges Samake Codec audio utilisant la transformation de fourier rapide, le recouvrement partiel et une decomposition en deux plans basee sur l'energie.
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
KR100715949B1 (ko) * 2005-11-11 2007-05-08 삼성전자주식회사 고속 음악 무드 분류 방법 및 그 장치
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
KR100717387B1 (ko) * 2006-01-26 2007-05-11 삼성전자주식회사 유사곡 검색 방법 및 그 장치
KR100774585B1 (ko) * 2006-02-10 2007-11-09 삼성전자주식회사 변조 스펙트럼을 이용한 음악 정보 검색 방법 및 그 장치
US7987089B2 (en) 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8239190B2 (en) 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US8126707B2 (en) * 2007-04-05 2012-02-28 Texas Instruments Incorporated Method and system for speech compression
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding

Also Published As

Publication number Publication date
TW200912897A (en) 2009-03-16
WO2008157296A1 (en) 2008-12-24
US20080312914A1 (en) 2008-12-18
BRPI0812948A2 (pt) 2014-12-09
CN101681627B (zh) 2013-01-02
CA2687685A1 (en) 2008-12-24
JP2010530084A (ja) 2010-09-02
CN101681627A (zh) 2010-03-24
KR20100031742A (ko) 2010-03-24
US9653088B2 (en) 2017-05-16
JP2013242579A (ja) 2013-12-05
JP5571235B2 (ja) 2014-08-13
RU2470384C1 (ru) 2012-12-20
KR101092167B1 (ko) 2011-12-13
JP5405456B2 (ja) 2014-02-05
EP2176860A1 (en) 2010-04-21
TWI405186B (zh) 2013-08-11
EP2176860B1 (en) 2014-12-03

Similar Documents

Publication Publication Date Title
RU2010100875A (ru) Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов
CN102089758B (zh) 用于对采样音频信号的帧进行编码和解码的音频编码器和解码器
KR101831289B1 (ko) 오디오 신호의 스펙트럼의 스펙트럼 계수들의 코딩
KR101441896B1 (ko) 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
TWI449033B (zh) 用以編碼係數節段之音訊編碼器和方法、用以解碼已編碼音訊流之音訊解碼器和方法、及電腦程式
RU2557455C2 (ru) Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
CA2831176C (en) Apparatus and method for audio encoding and decoding employing sinusoidal substitution
US9299363B2 (en) Time warp contour calculator, audio signal encoder, encoded audio signal representation, methods and computer program
CN102770912B (zh) 使用线性预测滤波的前向时域混叠消除
RU2742460C2 (ru) Предсказание на основе модели в наборе фильтров с критической дискретизацией
JP5530454B2 (ja) オーディオ符号化装置、復号装置、方法、回路およびプログラム
JP6086999B2 (ja) ハーモニクス低減を使用して第1符号化アルゴリズムと第2符号化アルゴリズムの一方を選択する装置及び方法
KR20130133848A (ko) 스펙트럼 도메인 잡음 형상화를 사용하는 선형 예측 기반 코딩 방식
RU2016121172A (ru) Аудиодекодер и способ обеспечения декодированной аудиоинформации с использованием маскирования ошибки на основании сигнала возбуждения во временной области
RU2012127132A (ru) Способ кодирования, способ декодирования, устройство кодера, устройство декодера, программа и носитель записи
CN102859588A (zh) 音频信号编码器、音频信号译码器、用以提供音频内容的编码表示型态的方法、用以提供音频内容的译码表示型态的方法及用于低延迟应用的计算机程序
RU2009117569A (ru) Кодер, декодер и методы кодирования и декодирования сегментов данных, представляющих собой поток данных временного интервала
RU2007137643A (ru) Изменение масштаба времени кадров в вокодере посредством изменения остатка
RU2012143340A (ru) Декодер звукового сигнала, кодирующее устройство звукового сигнала, способы и компьютерная программа, использующие зависящее от частоты выборки кодирование контура деформации времени
RU2008148560A (ru) Декодирование кодированных с предсказанием данных с использованием адаптации буфера
JP2019164367A (ja) 低複雑度の調性適応音声信号量子化
JP2956068B2 (ja) 音声符号化復号化方式
JP3166697B2 (ja) 音声符号化・復号装置及びシステム
KR100310930B1 (ko) 음성합성장치및그방법
KR102008488B1 (ko) 편안한 잡음 생성 모드 선택을 위한 장치 및 방법

Legal Events

Date Code Title Description
FA94 Acknowledgement of application withdrawn (non-payment of fees)

Effective date: 20120410