RU2005113876A - Способ осуществления взаимодействия между адаптивным многоскоростным широкополосным кодеком (amr-wb-кодеком) и многорежимным широкополосным кодеком с переменной скоростью в битах (vbr-wb-кодеком) - Google Patents

Способ осуществления взаимодействия между адаптивным многоскоростным широкополосным кодеком (amr-wb-кодеком) и многорежимным широкополосным кодеком с переменной скоростью в битах (vbr-wb-кодеком) Download PDF

Info

Publication number
RU2005113876A
RU2005113876A RU2005113876/09A RU2005113876A RU2005113876A RU 2005113876 A RU2005113876 A RU 2005113876A RU 2005113876/09 A RU2005113876/09 A RU 2005113876/09A RU 2005113876 A RU2005113876 A RU 2005113876A RU 2005113876 A RU2005113876 A RU 2005113876A
Authority
RU
Russia
Prior art keywords
frame
codec
signal
encoded
rate
Prior art date
Application number
RU2005113876/09A
Other languages
English (en)
Other versions
RU2351907C2 (ru
Inventor
Милан ЖЕЛИНЕК (CA)
Милан ЖЕЛИНЕК
Редван САЛАМИ (CA)
Редван САЛАМИ
Original Assignee
Нокиа Корпорейшн (Fi)
Нокиа Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Нокиа Корпорейшн (Fi), Нокиа Корпорейшн filed Critical Нокиа Корпорейшн (Fi)
Publication of RU2005113876A publication Critical patent/RU2005113876A/ru
Application granted granted Critical
Publication of RU2351907C2 publication Critical patent/RU2351907C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Studio Devices (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Claims (27)

1. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек), имеющий режим работы, который обеспечивает возможность взаимодействия с адаптивным многоскоростным широкополосным кодеком (AMR-WB-кодеком), при этом кодек предусматривает, по меньшей мере, один тип кодирования с полной скоростью, обеспечивающей возможность взаимодействия (I-FR-кодирования), при этом упомянутый, по меньшей мере, один тип I-FR-кодирования имеет первую структуру распределения битов, основанную на типах AMR-WB-кодирования, и по меньшей мере, один тип кодирования посредством генерирования комфортного шума (CNG) для кодирования неактивного речевого кадра, имеющий вторую структуру распределения битов, основанную на типе AMR-WB-кодирования кадров обновления дескрипторов пауз (SID_UPDATE-кадров).
2. Кодек по п.1, дополнительно предусматривающий тип кодирования с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кодирования), для использования в одном из таких случаев, как работа на максимуме, равном половинной скорости, и случай кадров с низкой энергией, причем упомянутый тип I-HR-кодирования имеет третью структуру распределения битов, основанную на типе AMR-WB-кодирования, при этом упомянутый тип I-HR-кодирования реализован путем отбрасывания выбранных битов из упомянутой третьей структуры распределения битов
3. Кодек по п.2, в котором упомянутые выбранные биты, отбрасываемые из упомянутой третьей структуры распределения битов, включают в себя биты возбуждения по фиксированной кодовой книге из упомянутого типа AMR-WB-кодирования.
4. Кодек по п.1, являющийся WMR-WB-кодеком, согласованным с кодеком, соответствующим оболочке Rate Set II стандарта CDMA, при этом упомянутый тип AMR-WB-кодирования имеет скорость в битах менее 13,3 кбит/с.
5. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.4, в котором упомянутый, по меньшей мере, один тип I-FR-кодирования включает в себя, по меньшей мере, один из следующих типов I-FR-кодирования: I-FR-12, I-FR-8 и I-FR-6, причем упомянутое I-FR-12-кодирование имеет структуру распределения битов I-FR-12-кодирования, основанную на типе AMR-WB-кодирования, имеющем скорость в битах 12,65 кбит/с, упомянутое I-FR-8-кодирование имеет структуру распределения битов I-FR-8-кодирования, основанную на типе AMR-WB-кодирования, имеющем скорость в битах 8,85 кбит/с, и упомянутое I-FR-6-кодирование имеет структуру распределения битов I-FR-6-кодирования, основанную на типе AMR-WB-кодирования, имеющем скорость в битах 6,6 кбит/с, а каждый из типов кодирования - I-FR-12, I-FR-8 и I-FR-6 включает в себя распределение битов, указывающее на соответствующий тип I-FR-кодирования.
6. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.2, в котором в упомянутую третью структуру распределения битов добавлено распределение битов классификации, причем упомянутое распределение битов классификации обеспечивает отнесение упомянутого речевого кадра к некоторой категории.
7. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.6, в котором упомянутое распределение битов классификации включает в себя, по меньшей мере, один бит, показывающий, является ли упомянутый кадр сигнала I-HR-кадром, или нет.
8. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.1, в котором упомянутый, по меньшей мере, один тип кодирования посредством генерирования комфортного шума (CNG) выбран из группы, состоящей из CNG с четвертной скоростью (QR) (CNG-QR) и CNG с одной восьмой скорости (ER) (CNG-ER).
9. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.1, дополнительно предусматривающий CNG с одной восьмой скорости (ER) (CNG-ER).
10. Кодек по п.1, в котором WMR-WB-кодек согласован с оболочкой Rate Set I стандарта CDMA, причем упомянутый, по меньшей мере, один тип I-FR-кодирования имеет скорость в битах, составляющую 8,55 кбит/с, упомянутый тип AMR-WB-кодирования имеет скорость в битах, выбранную из группы, состоящей из 8,85 и 6,6 кбит/с, при этом упомянутый тип I-FR-кодирования, который имеет скорость в битах, составляющую 8,55 кбит/с, имеет первую структуру распределения битов, основанную на типе AMR-WB-кодирования, имеющем скорость в битах 8,85 кбит/с, в которой выбранные биты отбрасываются.
11. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.10, в котором упомянутые выбранные биты, которые отбрасываются, включают в себя биты квантования параметров линейного предсказания (LP).
12. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.10, в котором упомянутые выбранные биты, которые отбрасываются, включают в себя биты из последнего субвектора второй стадии в квантовании параметров LP.
13. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.10, в котором упомянутые выбранные биты, которые отбрасываются, включают в себя биты из индексов алгебраической кодовой книги.
14. Способ цифрового кодирования звука с использованием управляемого источником многорежимного широкополосного кодека с переменной скоростью в битах (VMR-WB-кодека) для осуществления взаимодействия с адаптивным многоскоростным широкополосным кодеком (AMR-WB-кодеком), заключающийся в том, что обеспечивают кадры сигнала из дискретизированной версии звука, для каждого кадра сигнала
i) определяют, является ли упомянутый кадр сигнала активным речевым кадром или неактивным речевым кадром,
ii) если упомянутый кадр сигнала является неактивным речевым кадром, то проверяют, является ли упомянутый кадр сигнала кадром дескриптора паузы (SID-кадром),
iii) если упомянутый кадр сигнала является SID-кадром, то кодируют упомянутый кадр сигнала с помощью алгоритма кодирования посредством генерирования комфортного шума (CNG) с четвертной скоростью (QR),
iv) если упомянутый кадр сигнала является неактивным речевым кадром, который не является SID-кадром, то кодируют упомянутый кадр сигнала с помощью алгоритма кодирования CNG с одной восьмой скорости (ER), а
v) если упомянутый кадр сигнала является активным речевым кадром, то кодируют упомянутый кадр сигнала с использованием структуры распределения битов, основанной на AMR-WB-кодеке.
15. Способ по п.14, в котором WMR-WB-кодек согласуют с кодеком, соответствующим оболочке Rate Set II стандарта CDMA, а упомянутый тип AMR-WB-кодирования имеет скорость в битах менее 13,3 кбит/с.
16. Способ по п.15, в котором упомянутый алгоритм кодирования с обеспечением возможности взаимодействия работает на 13,3 кбит/с за счет распространения распределения битов упомянутых типов AMR-WB-кодирования на скорости менее 13,3 кбит/с.
17. Способ по п.14, дополнительно предусматривающий, что на этапе iii) а) кодируют упомянутый неактивный кадр сигнала как QR-кадр, б) кодируют два неактивных кадра сигнала, следующие за упомянутым кадром сигнала как ER-кадр, в) кодируют следующий неактивный кадр сигнала как QR-кадр, г) кодируют следующие семь неактивных кадров сигнала как ER-кадр, а следующий неактивный кадр сигнала - как QR-кадр, повторяют этап г) до тех пор, пока не будет обнаружен активный кадр сигнала.
18. Способ по п.14, дополнительно предусматривающий, что на этапе iii) а) кодируют первый упомянутый неактивный кадр сигнала как QR-кадр, затем б) кодируют следующие k неактивных кадров сигнала как ER-кадр, а следующий неактивный кадр - как QR-кадр, где k - целое число, меньшее или равное 1, повторяют этап б) до тех пор, пока не будет обнаружен активный кадр сигнала.
19. Способ по п.18, в котором k=7.
20. Способ по п.14, дополнительно предусматривающий, что на этапе v) определяют, запрашивается один из таких режимов, как работа на максимуме, равном половинной скорости, и размерно-пакетная операция, и если запрашивается работа на максимуме, равном половинной скорости, то кодируют упомянутый кадр сигнала с помощью алгоритма кодирования с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кодирования), имеющего распределение битов, основанное на AMR-WB-кодеке, имеющем скорость в битах, выбранную из группы, состоящей из 12,65, 8,85 и 6,6 кбит/с, при этом отбрасывают биты алгебраической кодовой книги и добавляют биты классификации для обеспечения категоризации упомянутого речевого кадра.
21. Способ преобразования кадра сигнала многорежимного широкополосного кодека с переменной скоростью в битах (VMR-WB-кодека) в кадр сигнала адаптивного многоскоростного широкополосного кодека (AMR-WB-кодека), при этом способ заключается в том, что
i) определяют, является ли упомянутый кадр сигнала одним из кадра, кодируемого с полной скоростью, обеспечивающей возможность взаимодействия (I-FR-кадра), кадра, кодируемого с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кадра), кодируемого с четвертной скоростью кадра генерирования комфортного шума (CNG-QR-кадра) и кодируемого с одной восьмой скорости кадра генерирования комфортного шума (CNG-ER-кадра),
ii) если кадр сигнала является I-FR-кадром, то пересылают этот кадр сигнала как AMR-WB-кадр, отбрасывая первую группу битов кадра,
iii) если кадр сигнала является I-HR-кадром, то пересылают этот кадр сигнала как AMR-WB-кадр путем генерирования опускаемых индексов алгебраической кодовой книги и отбрасывания битов, указывающих тип I-HR-кадра,
iv) если кадр сигнала является кодируемым с четвертной скоростью (QR) кадром генерирования комфортного шума (CNG) (CNG-QR-кадром), то пересылают этот кадр сигнала как кадр обновления дескриптора паузы (SID_UPDATE-кадр), а
v) если кадр сигнала является кадром, кодируемым с одной восьмой скорости (ER) посредством генерирования комфортного шума (CNG) (CNG-ER-кадром), то пересылают этот кадр сигнала как кадр без данных (NO_DATA-кадр).
22. Способ по п.21, в котором на этапе iii) осуществляют генерирование упомянутых опускаемых индексов алгебраической кодовой книги случайным образом.
23. Способ по п.21, дополнительно предусматривающий определение того, является ли упомянутый кадр сигнала недостоверным WMR-WB-кадром в режиме, обеспечивающем возможность взаимодействия, если упомянутый кадр сигнала является недостоверным WMR-WB-кадром в режиме, обеспечивающем возможность взаимодействия, то кодируют упомянутый кадр сигнала как кадр стирания.
24. Способ преобразования кадра сигнала адаптивного многоскоростного широкополосного кодека (AMR-WB-кодека) в кадр сигнала многорежимного широкополосного кодека с переменной скоростью в битах (VMR-WB-кодека), при этом способ заключается в том, что
i) определяют, является ли кадр сигнала одним из кадра обновления дескриптора паузы (SID_UPDATE-кадра), первого кадра дескриптора паузы (SID_FIRST-кадра), кадра без данных (NO_DATA-кадра), стертого кадра и кадра, кодируемого с полной скоростью (FR-кадра),
ii) если кадр сигнала является SID_UPDATE-кадром, то пересылают этот кадр сигнала как кадр, кодируемый с четвертной скоростью (QR) посредством генерирования комфортного шума (CNG) (CNG-QR-кадр),
iii) если кадр сигнала является SID_FIRST-кадром или NO_DATA-кадром, то пересылают этот кадр сигнала как кадр пробела, кодируемый с одной восьмой скорости (ER) (ER-кадр пробела),
iv) если кадр сигнала является стертым кадром, то пересылают этот кадр сигнала как кадр стирания, кодируемый с одной восьмой скорости (ER) (ER-кадр стирания),
v) если кадр сигнала является кадром, кодируемым со скоростью 12,65, 8,85 или 6,6 кбит/с, имеющим флаг принятия решения о речевой активности, заданный равным единице (РРА_флаг=1), то пересылают этот кадр сигнала как кадр, кодируемый с полной скоростью, обеспечивающей возможность взаимодействия (I-FR-кадр),
vi) если кадр сигнала является кадром, кодируемым со скоростью 12,65, 8,85 или 6,6 кбит/с, имеющим флаг принятия решения о речевой активности, заданный равным нулю (РРА_флаг=0), то определяют, является ли этот кадр сигнала первым кадром после активной речи,
vii) если кадр сигнала имеет РРА_флаг=0 и этот кадр сигнала является первым кадром после активной речи, то пересылают этот кадр сигнала как I-FR-кадр, а
viii) если кадр сигнала имеет РРА_флаг=0 и этот кадр сигнала не является первым кадром после активной речи, то пересылают этот кадр сигнала как кадр пробела, кодируемый с одной восьмой скорости (ER-кадр пробела).
25. Способ по п.24, дополнительно предусматривающий, что ix) если кадр сигнала является кадром, кодируемым с полной скоростью, то проверяют, принят ли запрос максимума, равного половинной скорости, и если кадр сигнала является кадром, кодируемым с полной скоростью, и принят запрос максимума, равного половинной скорости, то пересылают этот кадр сигнала как кадр, кодируемый с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кадр), путем отбрасывания битов, соответствующих индексам алгебраической кодовой книги и добавления битов, указывающих тип I-HR-кадра.
26. Способ преобразования кадра сигнала адаптивного многоскоростного широкополосного кодека (AMR-WB-кодека) в кадр сигнала многорежимного широкополосного кодека с переменной скоростью в битах (VMR-WB-кодека), при этом способ заключается в том, что
i) определяют, является ли упомянутый кадр сигнала одним из кадра обновления дескриптора паузы (SID_UPDATE-кадра), первого кадра дескриптора паузы (SID_FIRST-кадра), кадра без данных (NO_DATA-кадра), стертого кадра и кадра, кодируемого со скоростью 12,65, 8,85 и 6,6 кбит/с,
ii) если упомянутый кадр сигнала является SID_UPDATE-кадром, то пересылают упомянутый кадр сигнала как кадр, кодируемый с четвертной скоростью (QR) посредством генерирования комфортного шума (CNG) (CNG-QR-кадр),
iii) если упомянутый кадр сигнала является SID_FIRST-кадром или NO_DATA-кадром, то пересылают упомянутый кадр сигнала как кадр пробела, кодируемый с одной восьмой скорости (ER) (ER-кадр пробела),
iv) если упомянутый кадр сигнала является стертым кадром, то пересылают этот кадр сигнала как кадр стирания, кодируемый с одной восьмой скорости (ER) (ER-кадр стирания),
v) если упомянутый кадр сигнала является кадром, кодируемым со скоростью 12,65, 8,85 или 6,6 кбит/с, имеющим флаг принятия решения о речевой активности, заданный равным единице (РРА_флаг=1), то пересылают этот кадр сигнала как кадр, кодируемый с полной скоростью, обеспечивающей возможность взаимодействия (I-FR-кадр),
vi) если упомянутый кадр сигнала является кадром, кодируемым со скоростью 12,65, 8,85 или 6,6 кбит/с, имеющим флаг принятия решения о речевой активности, заданный равным нулю (РРА_флаг=0), то пересылают этот кадр сигнала как кадр пробела, кодируемый с одной восьмой скорости (ER-кадр пробела).
27. Способ по п.26, дополнительно предусматривающий, что на этапе i) определяют, является ли упомянутый кадр сигнала кадром, кодируемым с полной скоростью, причем упомянутый способ дополнительно предусматривает этап vii), на котором, если упомянутый кадр является кадром, кодируемым с полной скоростью, то проверяют, принят ли запрос максимума, равного половинной скорости, и если кадр сигнала является кадром, кодируемым с полной скоростью, и принят запрос максимума, равного половинной скорости, то пересылают этот кадр сигнала как кадр, кодируемый с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кадр), путем отбрасывания битов, соответствующих индексам алгебраической кодовой книги и добавления битов, указывающих тип I-HR-кадра.
RU2005113876/09A 2002-10-11 2003-10-10 Способ осуществления взаимодействия между адаптивным многоскоростным широкополосным кодеком (amr-wb-кодеком) и многорежимным широкополосным кодеком с переменной скоростью в битах (vbr-wb-кодеком) RU2351907C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US41766702P 2002-10-11 2002-10-11
US60/417,667 2002-10-11

Publications (2)

Publication Number Publication Date
RU2005113876A true RU2005113876A (ru) 2005-10-10
RU2351907C2 RU2351907C2 (ru) 2009-04-10

Family

ID=32094059

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2005113877/09A RU2331933C2 (ru) 2002-10-11 2003-10-09 Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах
RU2005113876/09A RU2351907C2 (ru) 2002-10-11 2003-10-10 Способ осуществления взаимодействия между адаптивным многоскоростным широкополосным кодеком (amr-wb-кодеком) и многорежимным широкополосным кодеком с переменной скоростью в битах (vbr-wb-кодеком)

Family Applications Before (1)

Application Number Title Priority Date Filing Date
RU2005113877/09A RU2331933C2 (ru) 2002-10-11 2003-10-09 Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах

Country Status (15)

Country Link
US (1) US7203638B2 (ru)
EP (2) EP1550108A2 (ru)
JP (2) JP2006502426A (ru)
KR (2) KR100711280B1 (ru)
CN (2) CN1703736A (ru)
AT (1) ATE505786T1 (ru)
AU (2) AU2003278013A1 (ru)
BR (2) BR0315179A (ru)
CA (2) CA2501368C (ru)
DE (1) DE60336744D1 (ru)
EG (1) EG23923A (ru)
ES (1) ES2361154T3 (ru)
MY (2) MY134085A (ru)
RU (2) RU2331933C2 (ru)
WO (2) WO2004034379A2 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames

Families Citing this family (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7023880B2 (en) * 2002-10-28 2006-04-04 Qualcomm Incorporated Re-formatting variable-rate vocoder frames for inter-system transmissions
US7406096B2 (en) * 2002-12-06 2008-07-29 Qualcomm Incorporated Tandem-free intersystem voice communication
WO2004075582A1 (en) 2003-02-21 2004-09-02 Nortel Networks Limited Data communication apparatus and method for establishing a codec-bypass connection
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US20060034481A1 (en) * 2003-11-03 2006-02-16 Farhad Barzegar Systems, methods, and devices for processing audio signals
US7450570B1 (en) 2003-11-03 2008-11-11 At&T Intellectual Property Ii, L.P. System and method of providing a high-quality voice network architecture
US8019449B2 (en) 2003-11-03 2011-09-13 At&T Intellectual Property Ii, Lp Systems, methods, and devices for processing audio signals
FR2867648A1 (fr) * 2003-12-10 2005-09-16 France Telecom Transcodage entre indices de dictionnaires multi-impulsionnels utilises en codage en compression de signaux numeriques
US8027265B2 (en) 2004-03-19 2011-09-27 Genband Us Llc Providing a capability list of a predefined format in a communications network
WO2005089055A2 (en) 2004-03-19 2005-09-29 Nortel Networks Limited Communicating processing capabilites along a communications path
US7830864B2 (en) 2004-09-18 2010-11-09 Genband Us Llc Apparatus and methods for per-session switching for multiple wireline and wireless data types
US7729346B2 (en) 2004-09-18 2010-06-01 Genband Inc. UMTS call handling methods and apparatus
US8102872B2 (en) * 2005-02-01 2012-01-24 Qualcomm Incorporated Method for discontinuous transmission and accurate reproduction of background noise information
EP1861846B1 (en) * 2005-03-24 2011-09-07 Mindspeed Technologies, Inc. Adaptive voice mode extension for a voice activity detector
US20060262851A1 (en) * 2005-05-19 2006-11-23 Celtro Ltd. Method and system for efficient transmission of communication traffic
US8483173B2 (en) 2005-05-31 2013-07-09 Genband Us Llc Methods and systems for unlicensed mobile access realization in a media gateway
EP1887567B1 (en) * 2005-05-31 2010-07-14 Panasonic Corporation Scalable encoding device, and scalable encoding method
EP1897085B1 (en) * 2005-06-18 2017-05-31 Nokia Technologies Oy System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
US8121836B2 (en) * 2005-07-11 2012-02-21 Lg Electronics Inc. Apparatus and method of processing an audio signal
KR101116363B1 (ko) 2005-08-11 2012-03-09 삼성전자주식회사 음성신호 분류방법 및 장치, 및 이를 이용한 음성신호부호화방법 및 장치
US7792150B2 (en) 2005-08-19 2010-09-07 Genband Us Llc Methods, systems, and computer program products for supporting transcoder-free operation in media gateway
US7835346B2 (en) * 2006-01-17 2010-11-16 Genband Us Llc Methods, systems, and computer program products for providing transcoder free operation (TrFO) and interworking between unlicensed mobile access (UMA) and universal mobile telecommunications system (UMTS) call legs using a media gateway
KR100790110B1 (ko) * 2006-03-18 2008-01-02 삼성전자주식회사 모폴로지 기반의 음성 신호 코덱 방법 및 장치
US8032370B2 (en) 2006-05-09 2011-10-04 Nokia Corporation Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8725499B2 (en) 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8848618B2 (en) * 2006-08-22 2014-09-30 Qualcomm Incorporated Semi-persistent scheduling for traffic spurts in wireless communication
US8346239B2 (en) 2006-12-28 2013-01-01 Genband Us Llc Methods, systems, and computer program products for silence insertion descriptor (SID) conversion
US8279889B2 (en) * 2007-01-04 2012-10-02 Qualcomm Incorporated Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate
CN101246688B (zh) * 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
US8195454B2 (en) 2007-02-26 2012-06-05 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
DK2827327T3 (da) 2007-04-29 2020-10-12 Huawei Tech Co Ltd Fremgangsmåde til excitationsimpulskodning
CN101320559B (zh) * 2007-06-07 2011-05-18 华为技术有限公司 一种声音激活检测装置及方法
CA2691993C (en) 2007-06-11 2015-01-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal
US8090588B2 (en) * 2007-08-31 2012-01-03 Nokia Corporation System and method for providing AMR-WB DTX synchronization
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN101527140B (zh) * 2008-03-05 2011-07-20 上海摩波彼克半导体有限公司 第三代移动通信系统amr计算量化平均对数帧能量的方法
EP2269188B1 (en) * 2008-03-14 2014-06-11 Dolby Laboratories Licensing Corporation Multimode coding of speech-like and non-speech-like signals
US9848314B2 (en) 2008-05-19 2017-12-19 Qualcomm Incorporated Managing discovery in a wireless peer-to-peer network
US9198017B2 (en) 2008-05-19 2015-11-24 Qualcomm Incorporated Infrastructure assisted discovery in a wireless peer-to-peer network
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
ES2396927T3 (es) * 2008-07-11 2013-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para decodificar una señal de audio codificada
MX2011000367A (es) 2008-07-11 2011-03-02 Fraunhofer Ges Forschung Un aparato y un metodo para calcular una cantidad de envolventes espectrales.
ES2379761T3 (es) 2008-07-11 2012-05-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Proporcinar una señal de activación de distorsión de tiempo y codificar una señal de audio con la misma
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2380168A1 (en) * 2008-12-19 2011-10-26 Nokia Corporation An apparatus, a method and a computer program for coding
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
EP2237269B1 (en) 2009-04-01 2013-02-20 Motorola Mobility LLC Apparatus and method for processing an encoded audio data signal
CN101931414B (zh) * 2009-06-19 2013-04-24 华为技术有限公司 脉冲编码方法及装置、脉冲解码方法及装置
US8908541B2 (en) 2009-08-04 2014-12-09 Genband Us Llc Methods, systems, and computer readable media for intelligent optimization of digital signal processor (DSP) resource utilization in a media gateway
FR2954640B1 (fr) 2009-12-23 2012-01-20 Arkamys Procede d'optimisation de la reception stereo pour radio analogique et recepteur de radio analogique associe
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
CN102299760B (zh) 2010-06-24 2014-03-12 华为技术有限公司 脉冲编解码方法及脉冲编解码器
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
PL3518234T3 (pl) 2010-11-22 2024-04-08 Ntt Docomo, Inc. Urządzenie i sposób kodowania audio
TR201903388T4 (tr) 2011-02-14 2019-04-22 Fraunhofer Ges Forschung Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi.
EP2676268B1 (en) 2011-02-14 2014-12-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a decoded audio signal in a spectral domain
RU2586838C2 (ru) * 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодек, использующий синтез шума в течение неактивной фазы
TWI483245B (zh) 2011-02-14 2015-05-01 Fraunhofer Ges Forschung 利用重疊變換之資訊信號表示技術
MY165853A (en) 2011-02-14 2018-05-18 Fraunhofer Ges Forschung Linear prediction based coding scheme using spectral domain noise shaping
EP2676270B1 (en) 2011-02-14 2017-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding a portion of an audio signal using a transient detection and a quality result
AU2012217215B2 (en) 2011-02-14 2015-05-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding (USAC)
CN102737636B (zh) * 2011-04-13 2014-06-04 华为技术有限公司 一种音频编码方法及装置
US20140114653A1 (en) * 2011-05-06 2014-04-24 Nokia Corporation Pitch estimator
EP2772909B1 (en) * 2011-10-27 2018-02-21 LG Electronics Inc. Method for encoding voice signal
CN102543090B (zh) * 2011-12-31 2013-12-04 深圳市茂碧信息科技有限公司 一种应用于变速率语音和音频编码的码率自动控制系统
CN103200635B (zh) 2012-01-05 2016-06-29 华为技术有限公司 用户设备在无线网络控制器之间迁移的方法、装置及系统
US9236053B2 (en) * 2012-07-05 2016-01-12 Panasonic Intellectual Property Management Co., Ltd. Encoding and decoding system, decoding apparatus, encoding apparatus, encoding and decoding method
ES2604652T3 (es) 2012-08-31 2017-03-08 Telefonaktiebolaget Lm Ericsson (Publ) Método y dispositivo para detectar la actividad vocal
US8982702B2 (en) 2012-10-30 2015-03-17 Cisco Technology, Inc. Control of rate adaptive endpoints
RU2656681C1 (ru) * 2012-11-13 2018-06-06 Самсунг Электроникс Ко., Лтд. Способ и устройство для определения режима кодирования, способ и устройство для кодирования аудиосигналов и способ, и устройство для декодирования аудиосигналов
AU2013366642B2 (en) * 2012-12-21 2016-09-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
EP2936486B1 (en) 2012-12-21 2018-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Comfort noise addition for modeling background noise at low bit-rates
CN103915097B (zh) * 2013-01-04 2017-03-22 中国移动通信集团公司 一种语音信号处理方法、装置和系统
US9263054B2 (en) * 2013-02-21 2016-02-16 Qualcomm Incorporated Systems and methods for controlling an average encoding rate for speech signal encoding
US9208775B2 (en) * 2013-02-21 2015-12-08 Qualcomm Incorporated Systems and methods for determining pitch pulse period signal boundaries
CA2915805C (en) 2013-06-21 2021-10-19 Jeremie Lecomte Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pitch lag estimation
TR201808890T4 (tr) 2013-06-21 2018-07-23 Fraunhofer Ges Forschung Bir konuşma çerçevesinin yeniden yapılandırılması.
CN104347067B (zh) 2013-08-06 2017-04-12 华为技术有限公司 一种音频信号分类方法和装置
US9570093B2 (en) * 2013-09-09 2017-02-14 Huawei Technologies Co., Ltd. Unvoiced/voiced decision for speech processing
CN104517612B (zh) * 2013-09-30 2018-10-12 上海爱聊信息科技有限公司 基于amr-nb语音信号的可变码率编码器和解码器及其编码和解码方法
US10083708B2 (en) * 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
EP2980790A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for comfort noise generation mode selection
US9953655B2 (en) * 2014-09-29 2018-04-24 Qualcomm Incorporated Optimizing frequent in-band signaling in dual SIM dual active devices by comparing signal level (RxLev) and quality (RxQual) against predetermined thresholds
CN104299384A (zh) * 2014-10-13 2015-01-21 浙江大学 一种基于Zigbee异质传感器网络的环境监控系统
US20160323425A1 (en) * 2015-04-29 2016-11-03 Qualcomm Incorporated Enhanced voice services (evs) in 3gpp2 network
CN106328169B (zh) * 2015-06-26 2018-12-11 中兴通讯股份有限公司 一种激活音修正帧数的获取方法、激活音检测方法和装置
US10568143B2 (en) * 2017-03-28 2020-02-18 Cohere Technologies, Inc. Windowed sequence for random access method and apparatus
CN108737826B (zh) * 2017-04-18 2023-06-30 中兴通讯股份有限公司 一种视频编码的方法和装置
US11276411B2 (en) * 2017-09-20 2022-03-15 Voiceage Corporation Method and device for allocating a bit-budget between sub-frames in a CELP CODEC
RU2670469C1 (ru) * 2017-10-19 2018-10-23 Акционерное общество "ОДК-Авиадвигатель" Способ защиты газотурбинного двигателя от многократных помпажей компрессора
US20220180884A1 (en) * 2019-05-07 2022-06-09 Voiceage Corporation Methods and devices for detecting an attack in a sound signal to be coded and for coding the detected attack
CN110619881B (zh) * 2019-09-20 2022-04-15 北京百瑞互联技术有限公司 一种语音编码方法、装置及设备
CN113519023A (zh) 2019-10-29 2021-10-19 苹果公司 具有压缩环境的音频编码
JP7332518B2 (ja) * 2020-03-30 2023-08-23 本田技研工業株式会社 会話支援装置、会話支援システム、会話支援方法およびプログラム
CN113611325B (zh) * 2021-04-26 2023-07-04 珠海市杰理科技股份有限公司 基于清浊音实现的语音信号变速方法、装置和音频设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW271524B (ru) * 1994-08-05 1996-03-01 Qualcomm Inc
FI991605A (fi) * 1999-07-14 2001-01-15 Nokia Networks Oy Menetelmä puhekodaukseen ja puhekoodaukseen tarvittavan laskentakapasi teetin vähentämiseksi ja verkkoelementti
JP2001067807A (ja) * 1999-08-25 2001-03-16 Sanyo Electric Co Ltd 音声再生装置
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
AU2002226956A1 (en) * 2000-11-22 2002-06-03 Leap Wireless International, Inc. Method and system for providing interactive services over a wireless communications network
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US9324333B2 (en) 2006-07-31 2016-04-26 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames

Also Published As

Publication number Publication date
CN1703737B (zh) 2013-05-15
CN1703737A (zh) 2005-11-30
AU2003278013A1 (en) 2004-05-04
CA2501369A1 (en) 2004-04-22
AU2003278013A8 (en) 2004-05-04
EG23923A (en) 2007-12-30
MY138212A (en) 2009-05-29
BR0315179A (pt) 2005-08-23
CA2501368C (en) 2013-06-25
EP1554718A2 (en) 2005-07-20
DE60336744D1 (de) 2011-05-26
AU2003278014A1 (en) 2004-05-04
RU2331933C2 (ru) 2008-08-20
EP1550108A2 (en) 2005-07-06
KR20050049538A (ko) 2005-05-25
RU2005113877A (ru) 2005-10-10
MY134085A (en) 2007-11-30
WO2004034376A2 (en) 2004-04-22
BR0315216A (pt) 2005-08-16
JP2006502427A (ja) 2006-01-19
WO2004034376A3 (en) 2004-06-10
ATE505786T1 (de) 2011-04-15
AU2003278014A8 (en) 2004-05-04
KR20050049537A (ko) 2005-05-25
WO2004034379A3 (en) 2004-12-23
WO2004034379A2 (en) 2004-04-22
EP1554718B1 (en) 2011-04-13
KR100711280B1 (ko) 2007-04-25
US20050267746A1 (en) 2005-12-01
CN1703736A (zh) 2005-11-30
CA2501368A1 (en) 2004-04-22
ES2361154T3 (es) 2011-06-14
US7203638B2 (en) 2007-04-10
JP2006502426A (ja) 2006-01-19
RU2351907C2 (ru) 2009-04-10

Similar Documents

Publication Publication Date Title
RU2005113876A (ru) Способ осуществления взаимодействия между адаптивным многоскоростным широкополосным кодеком (amr-wb-кодеком) и многорежимным широкополосным кодеком с переменной скоростью в битах (vbr-wb-кодеком)
US7657427B2 (en) Methods and devices for source controlled variable bit-rate wideband speech coding
EP1719120B1 (en) Coding model selection
RU2591663C2 (ru) Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая обнаружение группы ранее декодированных спектральных значений
CN100350453C (zh) 强壮语音分类方法和装置
CN101494055B (zh) 用于码分多址无线系统的方法和装置
JP2006510063A5 (ru)
CN1470051A (zh) 非话音语音的高性能低比特率编码方法和设备
CN104517612A (zh) 基于amr-nb语音信号的可变码率编码器和解码器及其编码和解码方法
ES2255991T3 (es) Metodo y aparato para generacion de numero aleatorios de velocidad un octavo para codificadores de voz.
KR20230149335A (ko) 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
US20010001320A1 (en) Method and device for speech coding
JP2012514225A (ja) 信号を符号化する方法および信号を復号する方法
CN101783142B (zh) 转码方法、装置和通信设备
CN101090312B (zh) 一种改进的语音编码流加密方法
WO2000074036A1 (fr) Dispositif de codage/decodage de la voix et codage des parties non vocales, procede de decodage, et support enregistre d'enregistrement de programme
Kim et al. An efficient transcoding algorithm for G. 723.1 and EVRC speech coders
EP1808852A1 (en) Method of interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs
Garrido et al. On variable rate frame independent predictive speech coding: Re-engineering iLBC
Liu et al. Improving EVRC half rate by the algebraic VQ-CELP

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20160602