RU2005113876A - Способ осуществления взаимодействия между адаптивным многоскоростным широкополосным кодеком (amr-wb-кодеком) и многорежимным широкополосным кодеком с переменной скоростью в битах (vbr-wb-кодеком) - Google Patents

Способ осуществления взаимодействия между адаптивным многоскоростным широкополосным кодеком (amr-wb-кодеком) и многорежимным широкополосным кодеком с переменной скоростью в битах (vbr-wb-кодеком) Download PDF

Info

Publication number
RU2005113876A
RU2005113876A RU2005113876/09A RU2005113876A RU2005113876A RU 2005113876 A RU2005113876 A RU 2005113876A RU 2005113876/09 A RU2005113876/09 A RU 2005113876/09A RU 2005113876 A RU2005113876 A RU 2005113876A RU 2005113876 A RU2005113876 A RU 2005113876A
Authority
RU
Russia
Prior art keywords
frame
codec
signal
encoded
rate
Prior art date
Application number
RU2005113876/09A
Other languages
English (en)
Other versions
RU2351907C2 (ru
Inventor
Милан ЖЕЛИНЕК (CA)
Милан ЖЕЛИНЕК
Редван САЛАМИ (CA)
Редван САЛАМИ
Original Assignee
Нокиа Корпорейшн (Fi)
Нокиа Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Нокиа Корпорейшн (Fi), Нокиа Корпорейшн filed Critical Нокиа Корпорейшн (Fi)
Publication of RU2005113876A publication Critical patent/RU2005113876A/ru
Application granted granted Critical
Publication of RU2351907C2 publication Critical patent/RU2351907C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Studio Devices (AREA)

Claims (27)

1. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек), имеющий режим работы, который обеспечивает возможность взаимодействия с адаптивным многоскоростным широкополосным кодеком (AMR-WB-кодеком), при этом кодек предусматривает, по меньшей мере, один тип кодирования с полной скоростью, обеспечивающей возможность взаимодействия (I-FR-кодирования), при этом упомянутый, по меньшей мере, один тип I-FR-кодирования имеет первую структуру распределения битов, основанную на типах AMR-WB-кодирования, и по меньшей мере, один тип кодирования посредством генерирования комфортного шума (CNG) для кодирования неактивного речевого кадра, имеющий вторую структуру распределения битов, основанную на типе AMR-WB-кодирования кадров обновления дескрипторов пауз (SID_UPDATE-кадров).
2. Кодек по п.1, дополнительно предусматривающий тип кодирования с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кодирования), для использования в одном из таких случаев, как работа на максимуме, равном половинной скорости, и случай кадров с низкой энергией, причем упомянутый тип I-HR-кодирования имеет третью структуру распределения битов, основанную на типе AMR-WB-кодирования, при этом упомянутый тип I-HR-кодирования реализован путем отбрасывания выбранных битов из упомянутой третьей структуры распределения битов
3. Кодек по п.2, в котором упомянутые выбранные биты, отбрасываемые из упомянутой третьей структуры распределения битов, включают в себя биты возбуждения по фиксированной кодовой книге из упомянутого типа AMR-WB-кодирования.
4. Кодек по п.1, являющийся WMR-WB-кодеком, согласованным с кодеком, соответствующим оболочке Rate Set II стандарта CDMA, при этом упомянутый тип AMR-WB-кодирования имеет скорость в битах менее 13,3 кбит/с.
5. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.4, в котором упомянутый, по меньшей мере, один тип I-FR-кодирования включает в себя, по меньшей мере, один из следующих типов I-FR-кодирования: I-FR-12, I-FR-8 и I-FR-6, причем упомянутое I-FR-12-кодирование имеет структуру распределения битов I-FR-12-кодирования, основанную на типе AMR-WB-кодирования, имеющем скорость в битах 12,65 кбит/с, упомянутое I-FR-8-кодирование имеет структуру распределения битов I-FR-8-кодирования, основанную на типе AMR-WB-кодирования, имеющем скорость в битах 8,85 кбит/с, и упомянутое I-FR-6-кодирование имеет структуру распределения битов I-FR-6-кодирования, основанную на типе AMR-WB-кодирования, имеющем скорость в битах 6,6 кбит/с, а каждый из типов кодирования - I-FR-12, I-FR-8 и I-FR-6 включает в себя распределение битов, указывающее на соответствующий тип I-FR-кодирования.
6. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.2, в котором в упомянутую третью структуру распределения битов добавлено распределение битов классификации, причем упомянутое распределение битов классификации обеспечивает отнесение упомянутого речевого кадра к некоторой категории.
7. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.6, в котором упомянутое распределение битов классификации включает в себя, по меньшей мере, один бит, показывающий, является ли упомянутый кадр сигнала I-HR-кадром, или нет.
8. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.1, в котором упомянутый, по меньшей мере, один тип кодирования посредством генерирования комфортного шума (CNG) выбран из группы, состоящей из CNG с четвертной скоростью (QR) (CNG-QR) и CNG с одной восьмой скорости (ER) (CNG-ER).
9. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.1, дополнительно предусматривающий CNG с одной восьмой скорости (ER) (CNG-ER).
10. Кодек по п.1, в котором WMR-WB-кодек согласован с оболочкой Rate Set I стандарта CDMA, причем упомянутый, по меньшей мере, один тип I-FR-кодирования имеет скорость в битах, составляющую 8,55 кбит/с, упомянутый тип AMR-WB-кодирования имеет скорость в битах, выбранную из группы, состоящей из 8,85 и 6,6 кбит/с, при этом упомянутый тип I-FR-кодирования, который имеет скорость в битах, составляющую 8,55 кбит/с, имеет первую структуру распределения битов, основанную на типе AMR-WB-кодирования, имеющем скорость в битах 8,85 кбит/с, в которой выбранные биты отбрасываются.
11. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.10, в котором упомянутые выбранные биты, которые отбрасываются, включают в себя биты квантования параметров линейного предсказания (LP).
12. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.10, в котором упомянутые выбранные биты, которые отбрасываются, включают в себя биты из последнего субвектора второй стадии в квантовании параметров LP.
13. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.10, в котором упомянутые выбранные биты, которые отбрасываются, включают в себя биты из индексов алгебраической кодовой книги.
14. Способ цифрового кодирования звука с использованием управляемого источником многорежимного широкополосного кодека с переменной скоростью в битах (VMR-WB-кодека) для осуществления взаимодействия с адаптивным многоскоростным широкополосным кодеком (AMR-WB-кодеком), заключающийся в том, что обеспечивают кадры сигнала из дискретизированной версии звука, для каждого кадра сигнала
i) определяют, является ли упомянутый кадр сигнала активным речевым кадром или неактивным речевым кадром,
ii) если упомянутый кадр сигнала является неактивным речевым кадром, то проверяют, является ли упомянутый кадр сигнала кадром дескриптора паузы (SID-кадром),
iii) если упомянутый кадр сигнала является SID-кадром, то кодируют упомянутый кадр сигнала с помощью алгоритма кодирования посредством генерирования комфортного шума (CNG) с четвертной скоростью (QR),
iv) если упомянутый кадр сигнала является неактивным речевым кадром, который не является SID-кадром, то кодируют упомянутый кадр сигнала с помощью алгоритма кодирования CNG с одной восьмой скорости (ER), а
v) если упомянутый кадр сигнала является активным речевым кадром, то кодируют упомянутый кадр сигнала с использованием структуры распределения битов, основанной на AMR-WB-кодеке.
15. Способ по п.14, в котором WMR-WB-кодек согласуют с кодеком, соответствующим оболочке Rate Set II стандарта CDMA, а упомянутый тип AMR-WB-кодирования имеет скорость в битах менее 13,3 кбит/с.
16. Способ по п.15, в котором упомянутый алгоритм кодирования с обеспечением возможности взаимодействия работает на 13,3 кбит/с за счет распространения распределения битов упомянутых типов AMR-WB-кодирования на скорости менее 13,3 кбит/с.
17. Способ по п.14, дополнительно предусматривающий, что на этапе iii) а) кодируют упомянутый неактивный кадр сигнала как QR-кадр, б) кодируют два неактивных кадра сигнала, следующие за упомянутым кадром сигнала как ER-кадр, в) кодируют следующий неактивный кадр сигнала как QR-кадр, г) кодируют следующие семь неактивных кадров сигнала как ER-кадр, а следующий неактивный кадр сигнала - как QR-кадр, повторяют этап г) до тех пор, пока не будет обнаружен активный кадр сигнала.
18. Способ по п.14, дополнительно предусматривающий, что на этапе iii) а) кодируют первый упомянутый неактивный кадр сигнала как QR-кадр, затем б) кодируют следующие k неактивных кадров сигнала как ER-кадр, а следующий неактивный кадр - как QR-кадр, где k - целое число, меньшее или равное 1, повторяют этап б) до тех пор, пока не будет обнаружен активный кадр сигнала.
19. Способ по п.18, в котором k=7.
20. Способ по п.14, дополнительно предусматривающий, что на этапе v) определяют, запрашивается один из таких режимов, как работа на максимуме, равном половинной скорости, и размерно-пакетная операция, и если запрашивается работа на максимуме, равном половинной скорости, то кодируют упомянутый кадр сигнала с помощью алгоритма кодирования с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кодирования), имеющего распределение битов, основанное на AMR-WB-кодеке, имеющем скорость в битах, выбранную из группы, состоящей из 12,65, 8,85 и 6,6 кбит/с, при этом отбрасывают биты алгебраической кодовой книги и добавляют биты классификации для обеспечения категоризации упомянутого речевого кадра.
21. Способ преобразования кадра сигнала многорежимного широкополосного кодека с переменной скоростью в битах (VMR-WB-кодека) в кадр сигнала адаптивного многоскоростного широкополосного кодека (AMR-WB-кодека), при этом способ заключается в том, что
i) определяют, является ли упомянутый кадр сигнала одним из кадра, кодируемого с полной скоростью, обеспечивающей возможность взаимодействия (I-FR-кадра), кадра, кодируемого с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кадра), кодируемого с четвертной скоростью кадра генерирования комфортного шума (CNG-QR-кадра) и кодируемого с одной восьмой скорости кадра генерирования комфортного шума (CNG-ER-кадра),
ii) если кадр сигнала является I-FR-кадром, то пересылают этот кадр сигнала как AMR-WB-кадр, отбрасывая первую группу битов кадра,
iii) если кадр сигнала является I-HR-кадром, то пересылают этот кадр сигнала как AMR-WB-кадр путем генерирования опускаемых индексов алгебраической кодовой книги и отбрасывания битов, указывающих тип I-HR-кадра,
iv) если кадр сигнала является кодируемым с четвертной скоростью (QR) кадром генерирования комфортного шума (CNG) (CNG-QR-кадром), то пересылают этот кадр сигнала как кадр обновления дескриптора паузы (SID_UPDATE-кадр), а
v) если кадр сигнала является кадром, кодируемым с одной восьмой скорости (ER) посредством генерирования комфортного шума (CNG) (CNG-ER-кадром), то пересылают этот кадр сигнала как кадр без данных (NO_DATA-кадр).
22. Способ по п.21, в котором на этапе iii) осуществляют генерирование упомянутых опускаемых индексов алгебраической кодовой книги случайным образом.
23. Способ по п.21, дополнительно предусматривающий определение того, является ли упомянутый кадр сигнала недостоверным WMR-WB-кадром в режиме, обеспечивающем возможность взаимодействия, если упомянутый кадр сигнала является недостоверным WMR-WB-кадром в режиме, обеспечивающем возможность взаимодействия, то кодируют упомянутый кадр сигнала как кадр стирания.
24. Способ преобразования кадра сигнала адаптивного многоскоростного широкополосного кодека (AMR-WB-кодека) в кадр сигнала многорежимного широкополосного кодека с переменной скоростью в битах (VMR-WB-кодека), при этом способ заключается в том, что
i) определяют, является ли кадр сигнала одним из кадра обновления дескриптора паузы (SID_UPDATE-кадра), первого кадра дескриптора паузы (SID_FIRST-кадра), кадра без данных (NO_DATA-кадра), стертого кадра и кадра, кодируемого с полной скоростью (FR-кадра),
ii) если кадр сигнала является SID_UPDATE-кадром, то пересылают этот кадр сигнала как кадр, кодируемый с четвертной скоростью (QR) посредством генерирования комфортного шума (CNG) (CNG-QR-кадр),
iii) если кадр сигнала является SID_FIRST-кадром или NO_DATA-кадром, то пересылают этот кадр сигнала как кадр пробела, кодируемый с одной восьмой скорости (ER) (ER-кадр пробела),
iv) если кадр сигнала является стертым кадром, то пересылают этот кадр сигнала как кадр стирания, кодируемый с одной восьмой скорости (ER) (ER-кадр стирания),
v) если кадр сигнала является кадром, кодируемым со скоростью 12,65, 8,85 или 6,6 кбит/с, имеющим флаг принятия решения о речевой активности, заданный равным единице (РРА_флаг=1), то пересылают этот кадр сигнала как кадр, кодируемый с полной скоростью, обеспечивающей возможность взаимодействия (I-FR-кадр),
vi) если кадр сигнала является кадром, кодируемым со скоростью 12,65, 8,85 или 6,6 кбит/с, имеющим флаг принятия решения о речевой активности, заданный равным нулю (РРА_флаг=0), то определяют, является ли этот кадр сигнала первым кадром после активной речи,
vii) если кадр сигнала имеет РРА_флаг=0 и этот кадр сигнала является первым кадром после активной речи, то пересылают этот кадр сигнала как I-FR-кадр, а
viii) если кадр сигнала имеет РРА_флаг=0 и этот кадр сигнала не является первым кадром после активной речи, то пересылают этот кадр сигнала как кадр пробела, кодируемый с одной восьмой скорости (ER-кадр пробела).
25. Способ по п.24, дополнительно предусматривающий, что ix) если кадр сигнала является кадром, кодируемым с полной скоростью, то проверяют, принят ли запрос максимума, равного половинной скорости, и если кадр сигнала является кадром, кодируемым с полной скоростью, и принят запрос максимума, равного половинной скорости, то пересылают этот кадр сигнала как кадр, кодируемый с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кадр), путем отбрасывания битов, соответствующих индексам алгебраической кодовой книги и добавления битов, указывающих тип I-HR-кадра.
26. Способ преобразования кадра сигнала адаптивного многоскоростного широкополосного кодека (AMR-WB-кодека) в кадр сигнала многорежимного широкополосного кодека с переменной скоростью в битах (VMR-WB-кодека), при этом способ заключается в том, что
i) определяют, является ли упомянутый кадр сигнала одним из кадра обновления дескриптора паузы (SID_UPDATE-кадра), первого кадра дескриптора паузы (SID_FIRST-кадра), кадра без данных (NO_DATA-кадра), стертого кадра и кадра, кодируемого со скоростью 12,65, 8,85 и 6,6 кбит/с,
ii) если упомянутый кадр сигнала является SID_UPDATE-кадром, то пересылают упомянутый кадр сигнала как кадр, кодируемый с четвертной скоростью (QR) посредством генерирования комфортного шума (CNG) (CNG-QR-кадр),
iii) если упомянутый кадр сигнала является SID_FIRST-кадром или NO_DATA-кадром, то пересылают упомянутый кадр сигнала как кадр пробела, кодируемый с одной восьмой скорости (ER) (ER-кадр пробела),
iv) если упомянутый кадр сигнала является стертым кадром, то пересылают этот кадр сигнала как кадр стирания, кодируемый с одной восьмой скорости (ER) (ER-кадр стирания),
v) если упомянутый кадр сигнала является кадром, кодируемым со скоростью 12,65, 8,85 или 6,6 кбит/с, имеющим флаг принятия решения о речевой активности, заданный равным единице (РРА_флаг=1), то пересылают этот кадр сигнала как кадр, кодируемый с полной скоростью, обеспечивающей возможность взаимодействия (I-FR-кадр),
vi) если упомянутый кадр сигнала является кадром, кодируемым со скоростью 12,65, 8,85 или 6,6 кбит/с, имеющим флаг принятия решения о речевой активности, заданный равным нулю (РРА_флаг=0), то пересылают этот кадр сигнала как кадр пробела, кодируемый с одной восьмой скорости (ER-кадр пробела).
27. Способ по п.26, дополнительно предусматривающий, что на этапе i) определяют, является ли упомянутый кадр сигнала кадром, кодируемым с полной скоростью, причем упомянутый способ дополнительно предусматривает этап vii), на котором, если упомянутый кадр является кадром, кодируемым с полной скоростью, то проверяют, принят ли запрос максимума, равного половинной скорости, и если кадр сигнала является кадром, кодируемым с полной скоростью, и принят запрос максимума, равного половинной скорости, то пересылают этот кадр сигнала как кадр, кодируемый с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кадр), путем отбрасывания битов, соответствующих индексам алгебраической кодовой книги и добавления битов, указывающих тип I-HR-кадра.
RU2005113876/09A 2002-10-11 2003-10-10 Способ осуществления взаимодействия между адаптивным многоскоростным широкополосным кодеком (amr-wb-кодеком) и многорежимным широкополосным кодеком с переменной скоростью в битах (vbr-wb-кодеком) RU2351907C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US41766702P 2002-10-11 2002-10-11
US60/417,667 2002-10-11

Publications (2)

Publication Number Publication Date
RU2005113876A true RU2005113876A (ru) 2005-10-10
RU2351907C2 RU2351907C2 (ru) 2009-04-10

Family

ID=32094059

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2005113877/09A RU2331933C2 (ru) 2002-10-11 2003-10-09 Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах
RU2005113876/09A RU2351907C2 (ru) 2002-10-11 2003-10-10 Способ осуществления взаимодействия между адаптивным многоскоростным широкополосным кодеком (amr-wb-кодеком) и многорежимным широкополосным кодеком с переменной скоростью в битах (vbr-wb-кодеком)

Family Applications Before (1)

Application Number Title Priority Date Filing Date
RU2005113877/09A RU2331933C2 (ru) 2002-10-11 2003-10-09 Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах

Country Status (15)

Country Link
US (1) US7203638B2 (ru)
EP (2) EP1550108A2 (ru)
JP (2) JP2006502426A (ru)
KR (2) KR100711280B1 (ru)
CN (2) CN1703736A (ru)
AT (1) ATE505786T1 (ru)
AU (2) AU2003278013A1 (ru)
BR (2) BR0315179A (ru)
CA (2) CA2501368C (ru)
DE (1) DE60336744D1 (ru)
EG (1) EG23923A (ru)
ES (1) ES2361154T3 (ru)
MY (2) MY134085A (ru)
RU (2) RU2331933C2 (ru)
WO (2) WO2004034379A2 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames

Families Citing this family (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7023880B2 (en) * 2002-10-28 2006-04-04 Qualcomm Incorporated Re-formatting variable-rate vocoder frames for inter-system transmissions
US7406096B2 (en) * 2002-12-06 2008-07-29 Qualcomm Incorporated Tandem-free intersystem voice communication
US8254372B2 (en) 2003-02-21 2012-08-28 Genband Us Llc Data communication apparatus and method
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US20060034481A1 (en) * 2003-11-03 2006-02-16 Farhad Barzegar Systems, methods, and devices for processing audio signals
US7450570B1 (en) 2003-11-03 2008-11-11 At&T Intellectual Property Ii, L.P. System and method of providing a high-quality voice network architecture
US8019449B2 (en) 2003-11-03 2011-09-13 At&T Intellectual Property Ii, Lp Systems, methods, and devices for processing audio signals
FR2867648A1 (fr) * 2003-12-10 2005-09-16 France Telecom Transcodage entre indices de dictionnaires multi-impulsionnels utilises en codage en compression de signaux numeriques
US8027265B2 (en) 2004-03-19 2011-09-27 Genband Us Llc Providing a capability list of a predefined format in a communications network
WO2005089055A2 (en) 2004-03-19 2005-09-29 Nortel Networks Limited Communicating processing capabilites along a communications path
US7830864B2 (en) 2004-09-18 2010-11-09 Genband Us Llc Apparatus and methods for per-session switching for multiple wireline and wireless data types
US7729346B2 (en) 2004-09-18 2010-06-01 Genband Inc. UMTS call handling methods and apparatus
US8102872B2 (en) 2005-02-01 2012-01-24 Qualcomm Incorporated Method for discontinuous transmission and accurate reproduction of background noise information
US7983906B2 (en) * 2005-03-24 2011-07-19 Mindspeed Technologies, Inc. Adaptive voice mode extension for a voice activity detector
US20060262851A1 (en) * 2005-05-19 2006-11-23 Celtro Ltd. Method and system for efficient transmission of communication traffic
JP4948401B2 (ja) * 2005-05-31 2012-06-06 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
US8483173B2 (en) 2005-05-31 2013-07-09 Genband Us Llc Methods and systems for unlicensed mobile access realization in a media gateway
JP2008546341A (ja) * 2005-06-18 2008-12-18 ノキア コーポレイション 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法
US7991272B2 (en) * 2005-07-11 2011-08-02 Lg Electronics Inc. Apparatus and method of processing an audio signal
KR101116363B1 (ko) 2005-08-11 2012-03-09 삼성전자주식회사 음성신호 분류방법 및 장치, 및 이를 이용한 음성신호부호화방법 및 장치
US7792150B2 (en) 2005-08-19 2010-09-07 Genband Us Llc Methods, systems, and computer program products for supporting transcoder-free operation in media gateway
US7835346B2 (en) * 2006-01-17 2010-11-16 Genband Us Llc Methods, systems, and computer program products for providing transcoder free operation (TrFO) and interworking between unlicensed mobile access (UMA) and universal mobile telecommunications system (UMTS) call legs using a media gateway
KR100790110B1 (ko) * 2006-03-18 2008-01-02 삼성전자주식회사 모폴로지 기반의 음성 신호 코덱 방법 및 장치
US8032370B2 (en) * 2006-05-09 2011-10-04 Nokia Corporation Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8848618B2 (en) * 2006-08-22 2014-09-30 Qualcomm Incorporated Semi-persistent scheduling for traffic spurts in wireless communication
EP2108193B1 (en) 2006-12-28 2018-08-15 Genband US LLC Methods, systems, and computer program products for silence insertion descriptor (sid) conversion
US8279889B2 (en) * 2007-01-04 2012-10-02 Qualcomm Incorporated Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate
CN101246688B (zh) * 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
EP2118885B1 (en) 2007-02-26 2012-07-11 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
ES2529292T3 (es) 2007-04-29 2015-02-18 Huawei Technologies Co., Ltd. Método de codificación y de decodificación
CN101320559B (zh) 2007-06-07 2011-05-18 华为技术有限公司 一种声音激活检测装置及方法
PL2165328T3 (pl) 2007-06-11 2018-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie i dekodowanie sygnału audio zawierającego część impulsową i część stacjonarną
US8090588B2 (en) * 2007-08-31 2012-01-03 Nokia Corporation System and method for providing AMR-WB DTX synchronization
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN101527140B (zh) * 2008-03-05 2011-07-20 上海摩波彼克半导体有限公司 第三代移动通信系统amr计算量化平均对数帧能量的方法
JP2011518345A (ja) * 2008-03-14 2011-06-23 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション スピーチライク信号及びノンスピーチライク信号のマルチモードコーディング
US9198017B2 (en) 2008-05-19 2015-11-24 Qualcomm Incorporated Infrastructure assisted discovery in a wireless peer-to-peer network
US9848314B2 (en) 2008-05-19 2017-12-19 Qualcomm Incorporated Managing discovery in a wireless peer-to-peer network
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
CN102089817B (zh) 2008-07-11 2013-01-09 弗劳恩霍夫应用研究促进协会 用于计算频谱包络数目的装置与方法
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
JP5325293B2 (ja) * 2008-07-11 2013-10-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 符号化されたオーディオ信号を復号化するための装置および方法
CN102150201B (zh) 2008-07-11 2013-04-17 弗劳恩霍夫应用研究促进协会 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
WO2010070187A1 (en) * 2008-12-19 2010-06-24 Nokia Corporation An apparatus, a method and a computer program for coding
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
EP2237269B1 (en) 2009-04-01 2013-02-20 Motorola Mobility LLC Apparatus and method for processing an encoded audio data signal
CN101931414B (zh) 2009-06-19 2013-04-24 华为技术有限公司 脉冲编码方法及装置、脉冲解码方法及装置
US8908541B2 (en) 2009-08-04 2014-12-09 Genband Us Llc Methods, systems, and computer readable media for intelligent optimization of digital signal processor (DSP) resource utilization in a media gateway
FR2954640B1 (fr) 2009-12-23 2012-01-20 Arkamys Procede d'optimisation de la reception stereo pour radio analogique et recepteur de radio analogique associe
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
CN102299760B (zh) 2010-06-24 2014-03-12 华为技术有限公司 脉冲编解码方法及脉冲编解码器
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
EP2645366A4 (en) 2010-11-22 2014-05-07 Ntt Docomo Inc AUDIO CODING DEVICE, METHOD AND PROGRAM, AND AUDIO CODING DEVICE, METHOD AND PROGRAM
CA2827000C (en) 2011-02-14 2016-04-05 Jeremie Lecomte Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
MX2013009304A (es) 2011-02-14 2013-10-03 Fraunhofer Ges Forschung Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad.
TWI488177B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 使用頻譜域雜訊整形之基於線性預測的編碼方案
ES2639646T3 (es) 2011-02-14 2017-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de posiciones de impulso de pistas de una señal de audio
CA2827335C (en) * 2011-02-14 2016-08-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
SG185519A1 (en) 2011-02-14 2012-12-28 Fraunhofer Ges Forschung Information signal representation using lapped transform
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
CN102737636B (zh) * 2011-04-13 2014-06-04 华为技术有限公司 一种音频编码方法及装置
US20140114653A1 (en) * 2011-05-06 2014-04-24 Nokia Corporation Pitch estimator
KR20140085453A (ko) * 2011-10-27 2014-07-07 엘지전자 주식회사 음성 신호 부호화 방법 및 복호화 방법과 이를 이용하는 장치
CN102543090B (zh) * 2011-12-31 2013-12-04 深圳市茂碧信息科技有限公司 一种应用于变速率语音和音频编码的码率自动控制系统
CN103200635B (zh) 2012-01-05 2016-06-29 华为技术有限公司 用户设备在无线网络控制器之间迁移的方法、装置及系统
US9236053B2 (en) * 2012-07-05 2016-01-12 Panasonic Intellectual Property Management Co., Ltd. Encoding and decoding system, decoding apparatus, encoding apparatus, encoding and decoding method
JP6127143B2 (ja) * 2012-08-31 2017-05-10 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 音声アクティビティ検出のための方法及び装置
US8982702B2 (en) 2012-10-30 2015-03-17 Cisco Technology, Inc. Control of rate adaptive endpoints
CN108074579B (zh) * 2012-11-13 2022-06-24 三星电子株式会社 用于确定编码模式的方法以及音频编码方法
CN111145767B (zh) 2012-12-21 2023-07-25 弗劳恩霍夫应用研究促进协会 解码器及用于产生和处理编码频比特流的系统
BR112015014212B1 (pt) * 2012-12-21 2021-10-19 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Geração de um ruído de conforto com alta resolução espectro-temporal em transmissão descontínua de sinais de audio
CN103915097B (zh) * 2013-01-04 2017-03-22 中国移动通信集团公司 一种语音信号处理方法、装置和系统
US9208775B2 (en) * 2013-02-21 2015-12-08 Qualcomm Incorporated Systems and methods for determining pitch pulse period signal boundaries
US9263054B2 (en) 2013-02-21 2016-02-16 Qualcomm Incorporated Systems and methods for controlling an average encoding rate for speech signal encoding
CN105453173B (zh) 2013-06-21 2019-08-06 弗朗霍夫应用科学研究促进协会 利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法
SG11201510463WA (en) 2013-06-21 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pitch lag estimation
CN104347067B (zh) 2013-08-06 2017-04-12 华为技术有限公司 一种音频信号分类方法和装置
US9570093B2 (en) * 2013-09-09 2017-02-14 Huawei Technologies Co., Ltd. Unvoiced/voiced decision for speech processing
CN104517612B (zh) * 2013-09-30 2018-10-12 上海爱聊信息科技有限公司 基于amr-nb语音信号的可变码率编码器和解码器及其编码和解码方法
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
EP2980790A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for comfort noise generation mode selection
US9953655B2 (en) * 2014-09-29 2018-04-24 Qualcomm Incorporated Optimizing frequent in-band signaling in dual SIM dual active devices by comparing signal level (RxLev) and quality (RxQual) against predetermined thresholds
CN104299384A (zh) * 2014-10-13 2015-01-21 浙江大学 一种基于Zigbee异质传感器网络的环境监控系统
US20160323425A1 (en) * 2015-04-29 2016-11-03 Qualcomm Incorporated Enhanced voice services (evs) in 3gpp2 network
CN106328169B (zh) * 2015-06-26 2018-12-11 中兴通讯股份有限公司 一种激活音修正帧数的获取方法、激活音检测方法和装置
US10568143B2 (en) * 2017-03-28 2020-02-18 Cohere Technologies, Inc. Windowed sequence for random access method and apparatus
CN108737826B (zh) * 2017-04-18 2023-06-30 中兴通讯股份有限公司 一种视频编码的方法和装置
BR112020004883A2 (pt) * 2017-09-20 2020-09-15 Voiceage Corporation método e dispositivo para alocar um bit-budget entre subquadros em um codec celp
RU2670469C1 (ru) * 2017-10-19 2018-10-23 Акционерное общество "ОДК-Авиадвигатель" Способ защиты газотурбинного двигателя от многократных помпажей компрессора
CN113826161A (zh) * 2019-05-07 2021-12-21 沃伊斯亚吉公司 用于检测待编解码的声音信号中的起音以及对检测到的起音进行编解码的方法和设备
CN110619881B (zh) * 2019-09-20 2022-04-15 北京百瑞互联技术有限公司 一种语音编码方法、装置及设备
CN113519023A (zh) 2019-10-29 2021-10-19 苹果公司 具有压缩环境的音频编码
JP7332518B2 (ja) * 2020-03-30 2023-08-23 本田技研工業株式会社 会話支援装置、会話支援システム、会話支援方法およびプログラム
CN113611325B (zh) * 2021-04-26 2023-07-04 珠海市杰理科技股份有限公司 基于清浊音实现的语音信号变速方法、装置和音频设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW271524B (ru) * 1994-08-05 1996-03-01 Qualcomm Inc
FI991605A (fi) * 1999-07-14 2001-01-15 Nokia Networks Oy Menetelmä puhekodaukseen ja puhekoodaukseen tarvittavan laskentakapasi teetin vähentämiseksi ja verkkoelementti
JP2001067807A (ja) * 1999-08-25 2001-03-16 Sanyo Electric Co Ltd 音声再生装置
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US20020083461A1 (en) * 2000-11-22 2002-06-27 Hutcheson Stewart Douglas Method and system for providing interactive services over a wireless communications network
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US9324333B2 (en) 2006-07-31 2016-04-26 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames

Also Published As

Publication number Publication date
MY138212A (en) 2009-05-29
AU2003278014A1 (en) 2004-05-04
CA2501369A1 (en) 2004-04-22
RU2005113877A (ru) 2005-10-10
US20050267746A1 (en) 2005-12-01
KR100711280B1 (ko) 2007-04-25
EP1554718A2 (en) 2005-07-20
US7203638B2 (en) 2007-04-10
CN1703737B (zh) 2013-05-15
RU2331933C2 (ru) 2008-08-20
WO2004034376A2 (en) 2004-04-22
JP2006502427A (ja) 2006-01-19
RU2351907C2 (ru) 2009-04-10
AU2003278013A8 (en) 2004-05-04
BR0315216A (pt) 2005-08-16
KR20050049537A (ko) 2005-05-25
DE60336744D1 (de) 2011-05-26
EP1554718B1 (en) 2011-04-13
EG23923A (en) 2007-12-30
MY134085A (en) 2007-11-30
CN1703736A (zh) 2005-11-30
EP1550108A2 (en) 2005-07-06
CN1703737A (zh) 2005-11-30
AU2003278014A8 (en) 2004-05-04
WO2004034379A2 (en) 2004-04-22
CA2501368C (en) 2013-06-25
CA2501368A1 (en) 2004-04-22
WO2004034376A3 (en) 2004-06-10
WO2004034379A3 (en) 2004-12-23
KR20050049538A (ko) 2005-05-25
ATE505786T1 (de) 2011-04-15
JP2006502426A (ja) 2006-01-19
BR0315179A (pt) 2005-08-23
ES2361154T3 (es) 2011-06-14
AU2003278013A1 (en) 2004-05-04

Similar Documents

Publication Publication Date Title
RU2005113876A (ru) Способ осуществления взаимодействия между адаптивным многоскоростным широкополосным кодеком (amr-wb-кодеком) и многорежимным широкополосным кодеком с переменной скоростью в битах (vbr-wb-кодеком)
US7657427B2 (en) Methods and devices for source controlled variable bit-rate wideband speech coding
EP1719120B1 (en) Coding model selection
RU2591663C2 (ru) Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая обнаружение группы ранее декодированных спектральных значений
FI118834B (fi) Audiosignaalien luokittelu
CN101494055B (zh) 用于码分多址无线系统的方法和装置
CA2341712A1 (en) Speech codec employing speech classification for noise compensation
BR112013020239A2 (pt) geração de ruído em codecs de áudio
JP2006510063A5 (ru)
KR102593442B1 (ko) 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
ES2255991T3 (es) Metodo y aparato para generacion de numero aleatorios de velocidad un octavo para codificadores de voz.
JP2012514225A (ja) 信号を符号化する方法および信号を復号する方法
CN1728236A (zh) 语音编码/解码方法及装置
CN101090312A (zh) 一种改进的语音编码流加密方法
WO2000074036A1 (fr) Dispositif de codage/decodage de la voix et codage des parties non vocales, procede de decodage, et support enregistre d'enregistrement de programme
Kim et al. An efficient transcoding algorithm for G. 723.1 and EVRC speech coders
EP1808852A1 (en) Method of interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs
EP1930881A3 (en) Speech decoder employing noise compensation
Zhou et al. Variable-rate enhanced double-band excitation LPC low bit rate speech coding algorithm.
Liu et al. Improving EVRC half rate by the algebraic VQ-CELP

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20160602