RU2005113876A - Способ осуществления взаимодействия между адаптивным многоскоростным широкополосным кодеком (amr-wb-кодеком) и многорежимным широкополосным кодеком с переменной скоростью в битах (vbr-wb-кодеком) - Google Patents
Способ осуществления взаимодействия между адаптивным многоскоростным широкополосным кодеком (amr-wb-кодеком) и многорежимным широкополосным кодеком с переменной скоростью в битах (vbr-wb-кодеком) Download PDFInfo
- Publication number
- RU2005113876A RU2005113876A RU2005113876/09A RU2005113876A RU2005113876A RU 2005113876 A RU2005113876 A RU 2005113876A RU 2005113876/09 A RU2005113876/09 A RU 2005113876/09A RU 2005113876 A RU2005113876 A RU 2005113876A RU 2005113876 A RU2005113876 A RU 2005113876A
- Authority
- RU
- Russia
- Prior art keywords
- frame
- codec
- signal
- encoded
- rate
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract 20
- 230000003044 adaptive effect Effects 0.000 title claims abstract 10
- 230000003993 interaction Effects 0.000 title claims 4
- 230000000694 effects Effects 0.000 claims 4
- 230000005284 excitation Effects 0.000 claims 1
- 238000013139 quantization Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Studio Devices (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Claims (27)
1. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек), имеющий режим работы, который обеспечивает возможность взаимодействия с адаптивным многоскоростным широкополосным кодеком (AMR-WB-кодеком), при этом кодек предусматривает, по меньшей мере, один тип кодирования с полной скоростью, обеспечивающей возможность взаимодействия (I-FR-кодирования), при этом упомянутый, по меньшей мере, один тип I-FR-кодирования имеет первую структуру распределения битов, основанную на типах AMR-WB-кодирования, и по меньшей мере, один тип кодирования посредством генерирования комфортного шума (CNG) для кодирования неактивного речевого кадра, имеющий вторую структуру распределения битов, основанную на типе AMR-WB-кодирования кадров обновления дескрипторов пауз (SID_UPDATE-кадров).
2. Кодек по п.1, дополнительно предусматривающий тип кодирования с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кодирования), для использования в одном из таких случаев, как работа на максимуме, равном половинной скорости, и случай кадров с низкой энергией, причем упомянутый тип I-HR-кодирования имеет третью структуру распределения битов, основанную на типе AMR-WB-кодирования, при этом упомянутый тип I-HR-кодирования реализован путем отбрасывания выбранных битов из упомянутой третьей структуры распределения битов
3. Кодек по п.2, в котором упомянутые выбранные биты, отбрасываемые из упомянутой третьей структуры распределения битов, включают в себя биты возбуждения по фиксированной кодовой книге из упомянутого типа AMR-WB-кодирования.
4. Кодек по п.1, являющийся WMR-WB-кодеком, согласованным с кодеком, соответствующим оболочке Rate Set II стандарта CDMA, при этом упомянутый тип AMR-WB-кодирования имеет скорость в битах менее 13,3 кбит/с.
5. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.4, в котором упомянутый, по меньшей мере, один тип I-FR-кодирования включает в себя, по меньшей мере, один из следующих типов I-FR-кодирования: I-FR-12, I-FR-8 и I-FR-6, причем упомянутое I-FR-12-кодирование имеет структуру распределения битов I-FR-12-кодирования, основанную на типе AMR-WB-кодирования, имеющем скорость в битах 12,65 кбит/с, упомянутое I-FR-8-кодирование имеет структуру распределения битов I-FR-8-кодирования, основанную на типе AMR-WB-кодирования, имеющем скорость в битах 8,85 кбит/с, и упомянутое I-FR-6-кодирование имеет структуру распределения битов I-FR-6-кодирования, основанную на типе AMR-WB-кодирования, имеющем скорость в битах 6,6 кбит/с, а каждый из типов кодирования - I-FR-12, I-FR-8 и I-FR-6 включает в себя распределение битов, указывающее на соответствующий тип I-FR-кодирования.
6. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.2, в котором в упомянутую третью структуру распределения битов добавлено распределение битов классификации, причем упомянутое распределение битов классификации обеспечивает отнесение упомянутого речевого кадра к некоторой категории.
7. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.6, в котором упомянутое распределение битов классификации включает в себя, по меньшей мере, один бит, показывающий, является ли упомянутый кадр сигнала I-HR-кадром, или нет.
8. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.1, в котором упомянутый, по меньшей мере, один тип кодирования посредством генерирования комфортного шума (CNG) выбран из группы, состоящей из CNG с четвертной скоростью (QR) (CNG-QR) и CNG с одной восьмой скорости (ER) (CNG-ER).
9. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.1, дополнительно предусматривающий CNG с одной восьмой скорости (ER) (CNG-ER).
10. Кодек по п.1, в котором WMR-WB-кодек согласован с оболочкой Rate Set I стандарта CDMA, причем упомянутый, по меньшей мере, один тип I-FR-кодирования имеет скорость в битах, составляющую 8,55 кбит/с, упомянутый тип AMR-WB-кодирования имеет скорость в битах, выбранную из группы, состоящей из 8,85 и 6,6 кбит/с, при этом упомянутый тип I-FR-кодирования, который имеет скорость в битах, составляющую 8,55 кбит/с, имеет первую структуру распределения битов, основанную на типе AMR-WB-кодирования, имеющем скорость в битах 8,85 кбит/с, в которой выбранные биты отбрасываются.
11. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.10, в котором упомянутые выбранные биты, которые отбрасываются, включают в себя биты квантования параметров линейного предсказания (LP).
12. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.10, в котором упомянутые выбранные биты, которые отбрасываются, включают в себя биты из последнего субвектора второй стадии в квантовании параметров LP.
13. Управляемый источником многорежимный широкополосный кодек с переменной скоростью в битах (VMR-WB-кодек) по п.10, в котором упомянутые выбранные биты, которые отбрасываются, включают в себя биты из индексов алгебраической кодовой книги.
14. Способ цифрового кодирования звука с использованием управляемого источником многорежимного широкополосного кодека с переменной скоростью в битах (VMR-WB-кодека) для осуществления взаимодействия с адаптивным многоскоростным широкополосным кодеком (AMR-WB-кодеком), заключающийся в том, что обеспечивают кадры сигнала из дискретизированной версии звука, для каждого кадра сигнала
i) определяют, является ли упомянутый кадр сигнала активным речевым кадром или неактивным речевым кадром,
ii) если упомянутый кадр сигнала является неактивным речевым кадром, то проверяют, является ли упомянутый кадр сигнала кадром дескриптора паузы (SID-кадром),
iii) если упомянутый кадр сигнала является SID-кадром, то кодируют упомянутый кадр сигнала с помощью алгоритма кодирования посредством генерирования комфортного шума (CNG) с четвертной скоростью (QR),
iv) если упомянутый кадр сигнала является неактивным речевым кадром, который не является SID-кадром, то кодируют упомянутый кадр сигнала с помощью алгоритма кодирования CNG с одной восьмой скорости (ER), а
v) если упомянутый кадр сигнала является активным речевым кадром, то кодируют упомянутый кадр сигнала с использованием структуры распределения битов, основанной на AMR-WB-кодеке.
15. Способ по п.14, в котором WMR-WB-кодек согласуют с кодеком, соответствующим оболочке Rate Set II стандарта CDMA, а упомянутый тип AMR-WB-кодирования имеет скорость в битах менее 13,3 кбит/с.
16. Способ по п.15, в котором упомянутый алгоритм кодирования с обеспечением возможности взаимодействия работает на 13,3 кбит/с за счет распространения распределения битов упомянутых типов AMR-WB-кодирования на скорости менее 13,3 кбит/с.
17. Способ по п.14, дополнительно предусматривающий, что на этапе iii) а) кодируют упомянутый неактивный кадр сигнала как QR-кадр, б) кодируют два неактивных кадра сигнала, следующие за упомянутым кадром сигнала как ER-кадр, в) кодируют следующий неактивный кадр сигнала как QR-кадр, г) кодируют следующие семь неактивных кадров сигнала как ER-кадр, а следующий неактивный кадр сигнала - как QR-кадр, повторяют этап г) до тех пор, пока не будет обнаружен активный кадр сигнала.
18. Способ по п.14, дополнительно предусматривающий, что на этапе iii) а) кодируют первый упомянутый неактивный кадр сигнала как QR-кадр, затем б) кодируют следующие k неактивных кадров сигнала как ER-кадр, а следующий неактивный кадр - как QR-кадр, где k - целое число, меньшее или равное 1, повторяют этап б) до тех пор, пока не будет обнаружен активный кадр сигнала.
19. Способ по п.18, в котором k=7.
20. Способ по п.14, дополнительно предусматривающий, что на этапе v) определяют, запрашивается один из таких режимов, как работа на максимуме, равном половинной скорости, и размерно-пакетная операция, и если запрашивается работа на максимуме, равном половинной скорости, то кодируют упомянутый кадр сигнала с помощью алгоритма кодирования с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кодирования), имеющего распределение битов, основанное на AMR-WB-кодеке, имеющем скорость в битах, выбранную из группы, состоящей из 12,65, 8,85 и 6,6 кбит/с, при этом отбрасывают биты алгебраической кодовой книги и добавляют биты классификации для обеспечения категоризации упомянутого речевого кадра.
21. Способ преобразования кадра сигнала многорежимного широкополосного кодека с переменной скоростью в битах (VMR-WB-кодека) в кадр сигнала адаптивного многоскоростного широкополосного кодека (AMR-WB-кодека), при этом способ заключается в том, что
i) определяют, является ли упомянутый кадр сигнала одним из кадра, кодируемого с полной скоростью, обеспечивающей возможность взаимодействия (I-FR-кадра), кадра, кодируемого с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кадра), кодируемого с четвертной скоростью кадра генерирования комфортного шума (CNG-QR-кадра) и кодируемого с одной восьмой скорости кадра генерирования комфортного шума (CNG-ER-кадра),
ii) если кадр сигнала является I-FR-кадром, то пересылают этот кадр сигнала как AMR-WB-кадр, отбрасывая первую группу битов кадра,
iii) если кадр сигнала является I-HR-кадром, то пересылают этот кадр сигнала как AMR-WB-кадр путем генерирования опускаемых индексов алгебраической кодовой книги и отбрасывания битов, указывающих тип I-HR-кадра,
iv) если кадр сигнала является кодируемым с четвертной скоростью (QR) кадром генерирования комфортного шума (CNG) (CNG-QR-кадром), то пересылают этот кадр сигнала как кадр обновления дескриптора паузы (SID_UPDATE-кадр), а
v) если кадр сигнала является кадром, кодируемым с одной восьмой скорости (ER) посредством генерирования комфортного шума (CNG) (CNG-ER-кадром), то пересылают этот кадр сигнала как кадр без данных (NO_DATA-кадр).
22. Способ по п.21, в котором на этапе iii) осуществляют генерирование упомянутых опускаемых индексов алгебраической кодовой книги случайным образом.
23. Способ по п.21, дополнительно предусматривающий определение того, является ли упомянутый кадр сигнала недостоверным WMR-WB-кадром в режиме, обеспечивающем возможность взаимодействия, если упомянутый кадр сигнала является недостоверным WMR-WB-кадром в режиме, обеспечивающем возможность взаимодействия, то кодируют упомянутый кадр сигнала как кадр стирания.
24. Способ преобразования кадра сигнала адаптивного многоскоростного широкополосного кодека (AMR-WB-кодека) в кадр сигнала многорежимного широкополосного кодека с переменной скоростью в битах (VMR-WB-кодека), при этом способ заключается в том, что
i) определяют, является ли кадр сигнала одним из кадра обновления дескриптора паузы (SID_UPDATE-кадра), первого кадра дескриптора паузы (SID_FIRST-кадра), кадра без данных (NO_DATA-кадра), стертого кадра и кадра, кодируемого с полной скоростью (FR-кадра),
ii) если кадр сигнала является SID_UPDATE-кадром, то пересылают этот кадр сигнала как кадр, кодируемый с четвертной скоростью (QR) посредством генерирования комфортного шума (CNG) (CNG-QR-кадр),
iii) если кадр сигнала является SID_FIRST-кадром или NO_DATA-кадром, то пересылают этот кадр сигнала как кадр пробела, кодируемый с одной восьмой скорости (ER) (ER-кадр пробела),
iv) если кадр сигнала является стертым кадром, то пересылают этот кадр сигнала как кадр стирания, кодируемый с одной восьмой скорости (ER) (ER-кадр стирания),
v) если кадр сигнала является кадром, кодируемым со скоростью 12,65, 8,85 или 6,6 кбит/с, имеющим флаг принятия решения о речевой активности, заданный равным единице (РРА_флаг=1), то пересылают этот кадр сигнала как кадр, кодируемый с полной скоростью, обеспечивающей возможность взаимодействия (I-FR-кадр),
vi) если кадр сигнала является кадром, кодируемым со скоростью 12,65, 8,85 или 6,6 кбит/с, имеющим флаг принятия решения о речевой активности, заданный равным нулю (РРА_флаг=0), то определяют, является ли этот кадр сигнала первым кадром после активной речи,
vii) если кадр сигнала имеет РРА_флаг=0 и этот кадр сигнала является первым кадром после активной речи, то пересылают этот кадр сигнала как I-FR-кадр, а
viii) если кадр сигнала имеет РРА_флаг=0 и этот кадр сигнала не является первым кадром после активной речи, то пересылают этот кадр сигнала как кадр пробела, кодируемый с одной восьмой скорости (ER-кадр пробела).
25. Способ по п.24, дополнительно предусматривающий, что ix) если кадр сигнала является кадром, кодируемым с полной скоростью, то проверяют, принят ли запрос максимума, равного половинной скорости, и если кадр сигнала является кадром, кодируемым с полной скоростью, и принят запрос максимума, равного половинной скорости, то пересылают этот кадр сигнала как кадр, кодируемый с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кадр), путем отбрасывания битов, соответствующих индексам алгебраической кодовой книги и добавления битов, указывающих тип I-HR-кадра.
26. Способ преобразования кадра сигнала адаптивного многоскоростного широкополосного кодека (AMR-WB-кодека) в кадр сигнала многорежимного широкополосного кодека с переменной скоростью в битах (VMR-WB-кодека), при этом способ заключается в том, что
i) определяют, является ли упомянутый кадр сигнала одним из кадра обновления дескриптора паузы (SID_UPDATE-кадра), первого кадра дескриптора паузы (SID_FIRST-кадра), кадра без данных (NO_DATA-кадра), стертого кадра и кадра, кодируемого со скоростью 12,65, 8,85 и 6,6 кбит/с,
ii) если упомянутый кадр сигнала является SID_UPDATE-кадром, то пересылают упомянутый кадр сигнала как кадр, кодируемый с четвертной скоростью (QR) посредством генерирования комфортного шума (CNG) (CNG-QR-кадр),
iii) если упомянутый кадр сигнала является SID_FIRST-кадром или NO_DATA-кадром, то пересылают упомянутый кадр сигнала как кадр пробела, кодируемый с одной восьмой скорости (ER) (ER-кадр пробела),
iv) если упомянутый кадр сигнала является стертым кадром, то пересылают этот кадр сигнала как кадр стирания, кодируемый с одной восьмой скорости (ER) (ER-кадр стирания),
v) если упомянутый кадр сигнала является кадром, кодируемым со скоростью 12,65, 8,85 или 6,6 кбит/с, имеющим флаг принятия решения о речевой активности, заданный равным единице (РРА_флаг=1), то пересылают этот кадр сигнала как кадр, кодируемый с полной скоростью, обеспечивающей возможность взаимодействия (I-FR-кадр),
vi) если упомянутый кадр сигнала является кадром, кодируемым со скоростью 12,65, 8,85 или 6,6 кбит/с, имеющим флаг принятия решения о речевой активности, заданный равным нулю (РРА_флаг=0), то пересылают этот кадр сигнала как кадр пробела, кодируемый с одной восьмой скорости (ER-кадр пробела).
27. Способ по п.26, дополнительно предусматривающий, что на этапе i) определяют, является ли упомянутый кадр сигнала кадром, кодируемым с полной скоростью, причем упомянутый способ дополнительно предусматривает этап vii), на котором, если упомянутый кадр является кадром, кодируемым с полной скоростью, то проверяют, принят ли запрос максимума, равного половинной скорости, и если кадр сигнала является кадром, кодируемым с полной скоростью, и принят запрос максимума, равного половинной скорости, то пересылают этот кадр сигнала как кадр, кодируемый с половинной скоростью, обеспечивающей возможность взаимодействия (I-HR-кадр), путем отбрасывания битов, соответствующих индексам алгебраической кодовой книги и добавления битов, указывающих тип I-HR-кадра.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US41766702P | 2002-10-11 | 2002-10-11 | |
US60/417,667 | 2002-10-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2005113876A true RU2005113876A (ru) | 2005-10-10 |
RU2351907C2 RU2351907C2 (ru) | 2009-04-10 |
Family
ID=32094059
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2005113877/09A RU2331933C2 (ru) | 2002-10-11 | 2003-10-09 | Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах |
RU2005113876/09A RU2351907C2 (ru) | 2002-10-11 | 2003-10-10 | Способ осуществления взаимодействия между адаптивным многоскоростным широкополосным кодеком (amr-wb-кодеком) и многорежимным широкополосным кодеком с переменной скоростью в битах (vbr-wb-кодеком) |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2005113877/09A RU2331933C2 (ru) | 2002-10-11 | 2003-10-09 | Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах |
Country Status (15)
Country | Link |
---|---|
US (1) | US7203638B2 (ru) |
EP (2) | EP1550108A2 (ru) |
JP (2) | JP2006502426A (ru) |
KR (2) | KR100711280B1 (ru) |
CN (2) | CN1703736A (ru) |
AT (1) | ATE505786T1 (ru) |
AU (2) | AU2003278013A1 (ru) |
BR (2) | BR0315179A (ru) |
CA (2) | CA2501368C (ru) |
DE (1) | DE60336744D1 (ru) |
EG (1) | EG23923A (ru) |
ES (1) | ES2361154T3 (ru) |
MY (2) | MY134085A (ru) |
RU (2) | RU2331933C2 (ru) |
WO (2) | WO2004034379A2 (ru) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
Families Citing this family (98)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7023880B2 (en) * | 2002-10-28 | 2006-04-04 | Qualcomm Incorporated | Re-formatting variable-rate vocoder frames for inter-system transmissions |
US7406096B2 (en) * | 2002-12-06 | 2008-07-29 | Qualcomm Incorporated | Tandem-free intersystem voice communication |
WO2004075582A1 (en) | 2003-02-21 | 2004-09-02 | Nortel Networks Limited | Data communication apparatus and method for establishing a codec-bypass connection |
WO2004090870A1 (ja) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US20060034481A1 (en) * | 2003-11-03 | 2006-02-16 | Farhad Barzegar | Systems, methods, and devices for processing audio signals |
US7450570B1 (en) | 2003-11-03 | 2008-11-11 | At&T Intellectual Property Ii, L.P. | System and method of providing a high-quality voice network architecture |
US8019449B2 (en) | 2003-11-03 | 2011-09-13 | At&T Intellectual Property Ii, Lp | Systems, methods, and devices for processing audio signals |
FR2867648A1 (fr) * | 2003-12-10 | 2005-09-16 | France Telecom | Transcodage entre indices de dictionnaires multi-impulsionnels utilises en codage en compression de signaux numeriques |
US8027265B2 (en) | 2004-03-19 | 2011-09-27 | Genband Us Llc | Providing a capability list of a predefined format in a communications network |
WO2005089055A2 (en) | 2004-03-19 | 2005-09-29 | Nortel Networks Limited | Communicating processing capabilites along a communications path |
US7830864B2 (en) | 2004-09-18 | 2010-11-09 | Genband Us Llc | Apparatus and methods for per-session switching for multiple wireline and wireless data types |
US7729346B2 (en) | 2004-09-18 | 2010-06-01 | Genband Inc. | UMTS call handling methods and apparatus |
US8102872B2 (en) * | 2005-02-01 | 2012-01-24 | Qualcomm Incorporated | Method for discontinuous transmission and accurate reproduction of background noise information |
EP1861846B1 (en) * | 2005-03-24 | 2011-09-07 | Mindspeed Technologies, Inc. | Adaptive voice mode extension for a voice activity detector |
US20060262851A1 (en) * | 2005-05-19 | 2006-11-23 | Celtro Ltd. | Method and system for efficient transmission of communication traffic |
US8483173B2 (en) | 2005-05-31 | 2013-07-09 | Genband Us Llc | Methods and systems for unlicensed mobile access realization in a media gateway |
EP1887567B1 (en) * | 2005-05-31 | 2010-07-14 | Panasonic Corporation | Scalable encoding device, and scalable encoding method |
EP1897085B1 (en) * | 2005-06-18 | 2017-05-31 | Nokia Technologies Oy | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
US8121836B2 (en) * | 2005-07-11 | 2012-02-21 | Lg Electronics Inc. | Apparatus and method of processing an audio signal |
KR101116363B1 (ko) | 2005-08-11 | 2012-03-09 | 삼성전자주식회사 | 음성신호 분류방법 및 장치, 및 이를 이용한 음성신호부호화방법 및 장치 |
US7792150B2 (en) | 2005-08-19 | 2010-09-07 | Genband Us Llc | Methods, systems, and computer program products for supporting transcoder-free operation in media gateway |
US7835346B2 (en) * | 2006-01-17 | 2010-11-16 | Genband Us Llc | Methods, systems, and computer program products for providing transcoder free operation (TrFO) and interworking between unlicensed mobile access (UMA) and universal mobile telecommunications system (UMTS) call legs using a media gateway |
KR100790110B1 (ko) * | 2006-03-18 | 2008-01-02 | 삼성전자주식회사 | 모폴로지 기반의 음성 신호 코덱 방법 및 장치 |
US8032370B2 (en) | 2006-05-09 | 2011-10-04 | Nokia Corporation | Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes |
US8135047B2 (en) * | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
US8725499B2 (en) | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
US8848618B2 (en) * | 2006-08-22 | 2014-09-30 | Qualcomm Incorporated | Semi-persistent scheduling for traffic spurts in wireless communication |
US8346239B2 (en) | 2006-12-28 | 2013-01-01 | Genband Us Llc | Methods, systems, and computer program products for silence insertion descriptor (SID) conversion |
US8279889B2 (en) * | 2007-01-04 | 2012-10-02 | Qualcomm Incorporated | Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate |
CN101246688B (zh) * | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
US8195454B2 (en) | 2007-02-26 | 2012-06-05 | Dolby Laboratories Licensing Corporation | Speech enhancement in entertainment audio |
DK2827327T3 (da) | 2007-04-29 | 2020-10-12 | Huawei Tech Co Ltd | Fremgangsmåde til excitationsimpulskodning |
CN101320559B (zh) * | 2007-06-07 | 2011-05-18 | 华为技术有限公司 | 一种声音激活检测装置及方法 |
CA2691993C (en) | 2007-06-11 | 2015-01-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal |
US8090588B2 (en) * | 2007-08-31 | 2012-01-03 | Nokia Corporation | System and method for providing AMR-WB DTX synchronization |
DE102008009719A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
CN101527140B (zh) * | 2008-03-05 | 2011-07-20 | 上海摩波彼克半导体有限公司 | 第三代移动通信系统amr计算量化平均对数帧能量的方法 |
EP2269188B1 (en) * | 2008-03-14 | 2014-06-11 | Dolby Laboratories Licensing Corporation | Multimode coding of speech-like and non-speech-like signals |
US9848314B2 (en) | 2008-05-19 | 2017-12-19 | Qualcomm Incorporated | Managing discovery in a wireless peer-to-peer network |
US9198017B2 (en) | 2008-05-19 | 2015-11-24 | Qualcomm Incorporated | Infrastructure assisted discovery in a wireless peer-to-peer network |
US20090319263A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
US20090319261A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
ES2396927T3 (es) * | 2008-07-11 | 2013-03-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para decodificar una señal de audio codificada |
MX2011000367A (es) | 2008-07-11 | 2011-03-02 | Fraunhofer Ges Forschung | Un aparato y un metodo para calcular una cantidad de envolventes espectrales. |
ES2379761T3 (es) | 2008-07-11 | 2012-05-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Proporcinar una señal de activación de distorsión de tiempo y codificar una señal de audio con la misma |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
EP2380168A1 (en) * | 2008-12-19 | 2011-10-26 | Nokia Corporation | An apparatus, a method and a computer program for coding |
CN101599272B (zh) * | 2008-12-30 | 2011-06-08 | 华为技术有限公司 | 基音搜索方法及装置 |
EP2237269B1 (en) | 2009-04-01 | 2013-02-20 | Motorola Mobility LLC | Apparatus and method for processing an encoded audio data signal |
CN101931414B (zh) * | 2009-06-19 | 2013-04-24 | 华为技术有限公司 | 脉冲编码方法及装置、脉冲解码方法及装置 |
US8908541B2 (en) | 2009-08-04 | 2014-12-09 | Genband Us Llc | Methods, systems, and computer readable media for intelligent optimization of digital signal processor (DSP) resource utilization in a media gateway |
FR2954640B1 (fr) | 2009-12-23 | 2012-01-20 | Arkamys | Procede d'optimisation de la reception stereo pour radio analogique et recepteur de radio analogique associe |
US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
CN102299760B (zh) | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
PL3518234T3 (pl) | 2010-11-22 | 2024-04-08 | Ntt Docomo, Inc. | Urządzenie i sposób kodowania audio |
TR201903388T4 (tr) | 2011-02-14 | 2019-04-22 | Fraunhofer Ges Forschung | Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi. |
EP2676268B1 (en) | 2011-02-14 | 2014-12-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
RU2586838C2 (ru) * | 2011-02-14 | 2016-06-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодек, использующий синтез шума в течение неактивной фазы |
TWI483245B (zh) | 2011-02-14 | 2015-05-01 | Fraunhofer Ges Forschung | 利用重疊變換之資訊信號表示技術 |
MY165853A (en) | 2011-02-14 | 2018-05-18 | Fraunhofer Ges Forschung | Linear prediction based coding scheme using spectral domain noise shaping |
EP2676270B1 (en) | 2011-02-14 | 2017-02-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Coding a portion of an audio signal using a transient detection and a quality result |
AU2012217215B2 (en) | 2011-02-14 | 2015-05-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding (USAC) |
CN102737636B (zh) * | 2011-04-13 | 2014-06-04 | 华为技术有限公司 | 一种音频编码方法及装置 |
US20140114653A1 (en) * | 2011-05-06 | 2014-04-24 | Nokia Corporation | Pitch estimator |
EP2772909B1 (en) * | 2011-10-27 | 2018-02-21 | LG Electronics Inc. | Method for encoding voice signal |
CN102543090B (zh) * | 2011-12-31 | 2013-12-04 | 深圳市茂碧信息科技有限公司 | 一种应用于变速率语音和音频编码的码率自动控制系统 |
CN103200635B (zh) | 2012-01-05 | 2016-06-29 | 华为技术有限公司 | 用户设备在无线网络控制器之间迁移的方法、装置及系统 |
US9236053B2 (en) * | 2012-07-05 | 2016-01-12 | Panasonic Intellectual Property Management Co., Ltd. | Encoding and decoding system, decoding apparatus, encoding apparatus, encoding and decoding method |
ES2604652T3 (es) | 2012-08-31 | 2017-03-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Método y dispositivo para detectar la actividad vocal |
US8982702B2 (en) | 2012-10-30 | 2015-03-17 | Cisco Technology, Inc. | Control of rate adaptive endpoints |
RU2656681C1 (ru) * | 2012-11-13 | 2018-06-06 | Самсунг Электроникс Ко., Лтд. | Способ и устройство для определения режима кодирования, способ и устройство для кодирования аудиосигналов и способ, и устройство для декодирования аудиосигналов |
AU2013366642B2 (en) * | 2012-12-21 | 2016-09-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals |
EP2936486B1 (en) | 2012-12-21 | 2018-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Comfort noise addition for modeling background noise at low bit-rates |
CN103915097B (zh) * | 2013-01-04 | 2017-03-22 | 中国移动通信集团公司 | 一种语音信号处理方法、装置和系统 |
US9263054B2 (en) * | 2013-02-21 | 2016-02-16 | Qualcomm Incorporated | Systems and methods for controlling an average encoding rate for speech signal encoding |
US9208775B2 (en) * | 2013-02-21 | 2015-12-08 | Qualcomm Incorporated | Systems and methods for determining pitch pulse period signal boundaries |
CA2915805C (en) | 2013-06-21 | 2021-10-19 | Jeremie Lecomte | Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pitch lag estimation |
TR201808890T4 (tr) | 2013-06-21 | 2018-07-23 | Fraunhofer Ges Forschung | Bir konuşma çerçevesinin yeniden yapılandırılması. |
CN104347067B (zh) | 2013-08-06 | 2017-04-12 | 华为技术有限公司 | 一种音频信号分类方法和装置 |
US9570093B2 (en) * | 2013-09-09 | 2017-02-14 | Huawei Technologies Co., Ltd. | Unvoiced/voiced decision for speech processing |
CN104517612B (zh) * | 2013-09-30 | 2018-10-12 | 上海爱聊信息科技有限公司 | 基于amr-nb语音信号的可变码率编码器和解码器及其编码和解码方法 |
US10083708B2 (en) * | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
EP2980790A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for comfort noise generation mode selection |
US9953655B2 (en) * | 2014-09-29 | 2018-04-24 | Qualcomm Incorporated | Optimizing frequent in-band signaling in dual SIM dual active devices by comparing signal level (RxLev) and quality (RxQual) against predetermined thresholds |
CN104299384A (zh) * | 2014-10-13 | 2015-01-21 | 浙江大学 | 一种基于Zigbee异质传感器网络的环境监控系统 |
US20160323425A1 (en) * | 2015-04-29 | 2016-11-03 | Qualcomm Incorporated | Enhanced voice services (evs) in 3gpp2 network |
CN106328169B (zh) * | 2015-06-26 | 2018-12-11 | 中兴通讯股份有限公司 | 一种激活音修正帧数的获取方法、激活音检测方法和装置 |
US10568143B2 (en) * | 2017-03-28 | 2020-02-18 | Cohere Technologies, Inc. | Windowed sequence for random access method and apparatus |
CN108737826B (zh) * | 2017-04-18 | 2023-06-30 | 中兴通讯股份有限公司 | 一种视频编码的方法和装置 |
US11276411B2 (en) * | 2017-09-20 | 2022-03-15 | Voiceage Corporation | Method and device for allocating a bit-budget between sub-frames in a CELP CODEC |
RU2670469C1 (ru) * | 2017-10-19 | 2018-10-23 | Акционерное общество "ОДК-Авиадвигатель" | Способ защиты газотурбинного двигателя от многократных помпажей компрессора |
US20220180884A1 (en) * | 2019-05-07 | 2022-06-09 | Voiceage Corporation | Methods and devices for detecting an attack in a sound signal to be coded and for coding the detected attack |
CN110619881B (zh) * | 2019-09-20 | 2022-04-15 | 北京百瑞互联技术有限公司 | 一种语音编码方法、装置及设备 |
CN113519023A (zh) | 2019-10-29 | 2021-10-19 | 苹果公司 | 具有压缩环境的音频编码 |
JP7332518B2 (ja) * | 2020-03-30 | 2023-08-23 | 本田技研工業株式会社 | 会話支援装置、会話支援システム、会話支援方法およびプログラム |
CN113611325B (zh) * | 2021-04-26 | 2023-07-04 | 珠海市杰理科技股份有限公司 | 基于清浊音实现的语音信号变速方法、装置和音频设备 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW271524B (ru) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
FI991605A (fi) * | 1999-07-14 | 2001-01-15 | Nokia Networks Oy | Menetelmä puhekodaukseen ja puhekoodaukseen tarvittavan laskentakapasi teetin vähentämiseksi ja verkkoelementti |
JP2001067807A (ja) * | 1999-08-25 | 2001-03-16 | Sanyo Electric Co Ltd | 音声再生装置 |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
AU2002226956A1 (en) * | 2000-11-22 | 2002-06-03 | Leap Wireless International, Inc. | Method and system for providing interactive services over a wireless communications network |
US6631139B2 (en) * | 2001-01-31 | 2003-10-07 | Qualcomm Incorporated | Method and apparatus for interoperability between voice transmission systems during speech inactivity |
JP4518714B2 (ja) * | 2001-08-31 | 2010-08-04 | 富士通株式会社 | 音声符号変換方法 |
-
2003
- 2003-10-09 RU RU2005113877/09A patent/RU2331933C2/ru active
- 2003-10-09 AU AU2003278013A patent/AU2003278013A1/en not_active Abandoned
- 2003-10-09 JP JP2004542134A patent/JP2006502426A/ja active Pending
- 2003-10-09 EP EP03769096A patent/EP1550108A2/en not_active Withdrawn
- 2003-10-09 CA CA2501368A patent/CA2501368C/en not_active Expired - Lifetime
- 2003-10-09 CN CNA2003801011412A patent/CN1703736A/zh active Pending
- 2003-10-09 WO PCT/CA2003/001571 patent/WO2004034379A2/en not_active Application Discontinuation
- 2003-10-09 KR KR1020057006204A patent/KR100711280B1/ko not_active IP Right Cessation
- 2003-10-09 BR BR0315179-4A patent/BR0315179A/pt not_active IP Right Cessation
- 2003-10-10 ES ES03769097T patent/ES2361154T3/es not_active Expired - Lifetime
- 2003-10-10 AT AT03769097T patent/ATE505786T1/de not_active IP Right Cessation
- 2003-10-10 JP JP2004542135A patent/JP2006502427A/ja active Pending
- 2003-10-10 KR KR1020057006205A patent/KR20050049538A/ko not_active Application Discontinuation
- 2003-10-10 DE DE60336744T patent/DE60336744D1/de not_active Expired - Lifetime
- 2003-10-10 AU AU2003278014A patent/AU2003278014A1/en not_active Abandoned
- 2003-10-10 BR BR0315216-2A patent/BR0315216A/pt not_active IP Right Cessation
- 2003-10-10 EP EP03769097A patent/EP1554718B1/en not_active Expired - Lifetime
- 2003-10-10 MY MYPI20033873A patent/MY134085A/en unknown
- 2003-10-10 CN CN2003801012805A patent/CN1703737B/zh not_active Expired - Lifetime
- 2003-10-10 RU RU2005113876/09A patent/RU2351907C2/ru active
- 2003-10-10 CA CA002501369A patent/CA2501369A1/en not_active Abandoned
- 2003-10-10 WO PCT/CA2003/001572 patent/WO2004034376A2/en active Application Filing
- 2003-10-11 MY MYPI20033887A patent/MY138212A/en unknown
-
2005
- 2005-01-19 US US11/039,540 patent/US7203638B2/en not_active Expired - Lifetime
- 2005-04-06 EG EGNA2005000110 patent/EG23923A/xx active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US9324333B2 (en) | 2006-07-31 | 2016-04-26 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2005113876A (ru) | Способ осуществления взаимодействия между адаптивным многоскоростным широкополосным кодеком (amr-wb-кодеком) и многорежимным широкополосным кодеком с переменной скоростью в битах (vbr-wb-кодеком) | |
US7657427B2 (en) | Methods and devices for source controlled variable bit-rate wideband speech coding | |
EP1719120B1 (en) | Coding model selection | |
RU2591663C2 (ru) | Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая обнаружение группы ранее декодированных спектральных значений | |
CN100350453C (zh) | 强壮语音分类方法和装置 | |
CN101494055B (zh) | 用于码分多址无线系统的方法和装置 | |
JP2006510063A5 (ru) | ||
CN1470051A (zh) | 非话音语音的高性能低比特率编码方法和设备 | |
CN104517612A (zh) | 基于amr-nb语音信号的可变码率编码器和解码器及其编码和解码方法 | |
ES2255991T3 (es) | Metodo y aparato para generacion de numero aleatorios de velocidad un octavo para codificadores de voz. | |
KR20230149335A (ko) | 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치 | |
US20010001320A1 (en) | Method and device for speech coding | |
JP2012514225A (ja) | 信号を符号化する方法および信号を復号する方法 | |
CN101783142B (zh) | 转码方法、装置和通信设备 | |
CN101090312B (zh) | 一种改进的语音编码流加密方法 | |
WO2000074036A1 (fr) | Dispositif de codage/decodage de la voix et codage des parties non vocales, procede de decodage, et support enregistre d'enregistrement de programme | |
Kim et al. | An efficient transcoding algorithm for G. 723.1 and EVRC speech coders | |
EP1808852A1 (en) | Method of interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs | |
Garrido et al. | On variable rate frame independent predictive speech coding: Re-engineering iLBC | |
Liu et al. | Improving EVRC half rate by the algebraic VQ-CELP |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PC41 | Official registration of the transfer of exclusive right |
Effective date: 20160602 |