RU2007137643A - Изменение масштаба времени кадров в вокодере посредством изменения остатка - Google Patents

Изменение масштаба времени кадров в вокодере посредством изменения остатка Download PDF

Info

Publication number
RU2007137643A
RU2007137643A RU2007137643/09A RU2007137643A RU2007137643A RU 2007137643 A RU2007137643 A RU 2007137643A RU 2007137643/09 A RU2007137643/09 A RU 2007137643/09A RU 2007137643 A RU2007137643 A RU 2007137643A RU 2007137643 A RU2007137643 A RU 2007137643A
Authority
RU
Russia
Prior art keywords
speech
tone
segments
residual
vocoder
Prior art date
Application number
RU2007137643/09A
Other languages
English (en)
Other versions
RU2371784C2 (ru
Inventor
Рохит КАПУР (US)
Рохит КАПУР
СПИНДОЛА Серафин ДИАС (US)
Спиндола Серафин Диас
Original Assignee
Квэлкомм Инкорпорейтед (US)
Квэлкомм Инкорпорейтед
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36575961&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RU2007137643(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Квэлкомм Инкорпорейтед (US), Квэлкомм Инкорпорейтед filed Critical Квэлкомм Инкорпорейтед (US)
Publication of RU2007137643A publication Critical patent/RU2007137643A/ru
Application granted granted Critical
Publication of RU2371784C2 publication Critical patent/RU2371784C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/01Correction of time axis

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electric Clocks (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

1. Способ передачи речи, содержащий этапы, на которых: ! изменяют масштаб времени остаточного речевого сигнала к расширенному или сжатому виду упомянутого остаточного речевого сигнала и ! синтезируют упомянутый остаточный речевой сигнал, подвергшийся изменению масштаба времени. ! 2. Способ передачи речи по п.1, дополнительно содержащий этапы, на которых: ! классифицируют речевые сегменты и ! кодируют упомянутые речевые сегменты. ! 3. Способ передачи речи по п.2, в котором упомянутый этап кодирования речевых сегментов содержит использование периодов тона образца, линейное предсказание с кодовым возбуждением, линейное предсказание с шумовым возбуждением или 1/8 кадрового кодирования. ! 4. Способ передачи речи по п.2, дополнительно содержащий этапы, на которых: ! отправляют упомянутый речевой сигнал через кодирующий фильтр с линейным предсказанием, посредством чего фильтруя кратковременные корреляции в упомянутом речевом сигнале; и ! выдают коэффициенты кодирования с линейным предсказанием и остаточный сигнал. ! 5. Способ передачи речи по п.2, в котором упомянутый этап классифицирования речевых сегментов содержит классификацию речевых кадров на периодические, слабопериодические или шумовые в зависимости от того, представляют ли кадры вокализированную, невокализированную или неустойчивую речь. ! 6. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием с линейным предсказанием с кодовым возбуждением. ! 7. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием периода тона образца. ! 8. Способ передачи речи по п.2, в котором упомянутое кодирование является кодирован

Claims (46)

1. Способ передачи речи, содержащий этапы, на которых:
изменяют масштаб времени остаточного речевого сигнала к расширенному или сжатому виду упомянутого остаточного речевого сигнала и
синтезируют упомянутый остаточный речевой сигнал, подвергшийся изменению масштаба времени.
2. Способ передачи речи по п.1, дополнительно содержащий этапы, на которых:
классифицируют речевые сегменты и
кодируют упомянутые речевые сегменты.
3. Способ передачи речи по п.2, в котором упомянутый этап кодирования речевых сегментов содержит использование периодов тона образца, линейное предсказание с кодовым возбуждением, линейное предсказание с шумовым возбуждением или 1/8 кадрового кодирования.
4. Способ передачи речи по п.2, дополнительно содержащий этапы, на которых:
отправляют упомянутый речевой сигнал через кодирующий фильтр с линейным предсказанием, посредством чего фильтруя кратковременные корреляции в упомянутом речевом сигнале; и
выдают коэффициенты кодирования с линейным предсказанием и остаточный сигнал.
5. Способ передачи речи по п.2, в котором упомянутый этап классифицирования речевых сегментов содержит классификацию речевых кадров на периодические, слабопериодические или шумовые в зависимости от того, представляют ли кадры вокализированную, невокализированную или неустойчивую речь.
6. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием с линейным предсказанием с кодовым возбуждением.
7. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием периода тона образца.
8. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием с линейным предсказанием с шумовым возбуждением.
9. Способ по п.6, в котором упомянутый этап изменения масштаба времени содержит:
оценку периода тона и
добавление или выделение по меньшей мере одного упомянутого периода тона после приема упомянутого остаточного сигнала.
10. Способ по п.6, в котором этап изменения масштаба времени содержит:
оценку задержки тона;
разделение речевого кадра на периоды тона, при этом границы упомянутых периодов тона определяются, используя упомянутую задержку тона в различных точках упомянутого речевого кадра;
совмещение упомянутых периодов тона, если уменьшается упомянутый остаточный речевой сигнал; и
добавление упомянутых периодов тона, если увеличивается упомянутый остаточный речевой сигнал.
11. Способ по п.7, в котором упомянутый этап изменения масштаба времени содержит этапы, на которых:
оценивают по меньшей мере один период тона;
интерполируют упомянутый по меньшей мере один период тона;
добавляют упомянутый по меньшей мере один период тона, когда расширяют упомянутый остаточный речевой сигнал; и
выделяют упомянутый по меньшей мере один период тона, когда сжимают упомянутый остаточный речевой сигнал.
12. Способ по п.8, в котором упомянутый этап кодирования содержит кодирование информации кодирования с линейным предсказанием в качестве коэффициентов усиления разных частей речевого сегмента.
13. Способ по п.10, в котором упомянутый этап совмещения упомянутых периодов тона, если уменьшается упомянутый речевой остаточной сигнал, содержит:
сегментирование входной эталонной последовательности в блоки эталонов;
удаление сегментов упомянутого остаточного сигнала за постоянные интервалы времени;
объединение упомянутых удаленных сегментов и
замену упомянутых удаленных сегментов на объединенный сегмент.
14. Способ по п.10, в котором упомянутый этап оценки задержки тона содержит интерполяцию между задержкой тона конца последнего кадра и конца текущего кадра.
15. Способ по п.10, в котором упомянутый этап добавления упомянутых периодов тона содержит объединение речевых сегментов.
16. Способ по п.10, в котором упомянутый этап добавления упомянутых периодов тона, если увеличивается упомянутый остаточный речевой сигнал, содержит добавление дополнительного периода тона, созданного из первого сегмента периода тона и второго сегмента периода тона.
17. Способ по п.12, в котором упомянутые коэффициенты усиления кодируются для наборов речевых эталонов.
18. Способ по п.13, в котором упомянутый этап объединения упомянутых удаленных сегментов содержит увеличение доли первого сегмента периода тона и уменьшение доли второго сегмента периода тона.
19. Способ по п.15, дополнительно содержащий этап выбора схожих речевых сегментов, при этом объединяют упомянутые схожие речевые сегменты.
20. Способ по п.15, дополнительно содержащий этап корреляции речевых сегментов, посредством чего объединяют схожие речевые сегменты.
21. Способ по п.16, в котором упомянутый этап добавления дополнительного периода тона, созданного из первого сегмента периода тона и второго сегмента периода тона, содержит сложение упомянутого первого и упомянутого второго сегментов тона таким образом, что увеличивается доля упомянутого первого сегмента периода тона и уменьшается доля упомянутого второго сегмента периода тона.
22. Способ по п.17, дополнительно содержащий этап генерирования остаточного сигнала посредством генерирования случайных значений с последующим применением упомянутых коэффициентов усиления к упомянутым случайным значениям.
23. Способ по п.17, дополнительно содержащий этап представления упомянутой информации кодирования с линейным предсказанием в качестве 10 кодированных значений коэффициентов усиления, при этом каждое кодированное значение коэффициента усиления представляет 16 эталонов речи.
24. Вокодер, имеющий по меньшей мере один вход и по меньшей мере один выход, содержащий:
кодер, содержащий фильтр, имеющий по меньшей мере один вход, функционально связанный с входом вокодера, и по меньшей мере один выход; и
декодер, содержащий синтезатор, имеющий по меньшей мере один вход, функционально связанный с упомянутым по меньшей мере одним выходом упомянутого кодера, и по меньшей мере один выход, функционально связанный с упомянутым по меньшей мере одним выходом вокодера.
25. Вокодер по п.24, в котором упомянутый декодер содержит:
память, при этом упомянутый декодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих изменение масштаба времени остаточного речевого сигнала к расширенному или сжатому виду упомянутого остаточного сигнала.
26. Вокодер по п.24, в котором упомянутый кодер содержит:
память и упомянутый кодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих классификацию речевых сегментов по 1/8 кадра, периоды тона образца, линейное предсказание с кодовым возбуждением или линейное предсказание с шумовым возбуждением.
27. Вокодер по п.26, в котором упомянутый декодер содержит:
память и упомянутый декодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих изменение масштаба времени остаточного сигнала к расширенному или сжатому виду упомянутого остаточного речевого сигнала.
28. Вокодер по п.27, в котором упомянутый фильтр является кодирующим фильтром с линейным предсказанием, который выполнен с возможностью:
фильтрации кратковременных корреляций в речевом сигнале и
выдачи коэффициентов кодирования с линейным предсказанием и остаточного сигнала.
29. Вокодер по п.27, в котором упомянутый кодер содержит:
память и упомянутый кодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих кодирование упомянутых речевых сегментов, используя кодирование с линейным предсказанием с кодовым возбуждением.
30. Вокодер по п.27, в котором упомянутый кодер содержит:
память и упомянутый кодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих кодирование упомянутых речевых сегментов, используя кодирование периода тона образца.
31. Вокодер по п.27, в котором упомянутый кодер содержит:
память и упомянутый кодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих кодирование упомянутых речевых сегментов, используя кодирование с линейным предсказанием с шумовым возбуждением.
32. Вокодер по п.29, в котором упомянутая программная команда изменения масштаба времени содержит:
оценку по меньшей мере одного периода тона и
добавление или удаление упомянутого по меньшей мере одного периода тона после приема упомянутого остаточного сигнала.
33. Вокодер по п.29, в котором упомянутая программная команда изменения масштаба времени содержит
оценку задержки тона;
разделение речевого кадра на периоды тона, при этом границы упомянутых периодов тона определяются, используя упомянутую задержку тона в различных точках упомянутого речевого кадра;
совмещение упомянутых периодов тона, если уменьшается упомянутый остаточный речевой сигнал; и
добавление упомянутых периодов тона, если увеличивается остаточный речевой сигнал.
34. Вокодер по п.30, в котором упомянутая программная команда изменения масштаба времени содержит
оценку по меньшей мере одного период тона;
интерполяцию упомянутого по меньшей мере одного периода тона;
добавление упомянутого по меньшей мере одного периода тона, когда расширяют упомянутый остаточный речевой сигнал; и
выделение упомянутого по меньшей мере одного периода тона, когда сжимают упомянутый остаточный речевой сигнал.
35. Вокодер по п.31, в котором упомянутое кодирование упомянутых речевых сегментов, используя программную команду кодирования с линейным предсказанием с шумовым возбуждением, содержит кодирование информации кодирования с линейным предсказанием в качестве коэффициентов усиления различных частей речевых сегментов.
36. Вокодер по п.33, в котором упомянутое совмещение упомянутых периодов тона, если уменьшается упомянутый речевой остаточный сигнал, содержит
сегментацию входной эталонной последовательности на блоки эталонов;
удаление сегментов упомянутого остаточного сигнала в постоянные интервалы времени;
объединение упомянутых объединенных сегментов и
замену упомянутых удаленных сегментов на объединенный сегмент.
37. Вокодер по п.33, в котором упомянутая команда оценки задержки тона содержит интерполяцию между задержкой тона конца последнего кадра и конца текущего кадра.
38. Вокодер по п.33, в котором упомянутая команда суммирования упомянутых периодов тона содержит объединение речевых сегментов.
39. Вокодер по п.33, в котором упомянутая команда добавления упомянутых периодов тона, если увеличивается упомянутый речевой остаточный сигнал, содержит добавление дополнительного периода тона, созданного из первого сегмента периода тона и второго сегмента периода тона.
40. Вокодер по п.35, в котором упомянутые коэффициенты усиления кодируются для наборов речевых эталонов.
41. Вокодер по п.36, в котором упомянутая команда объединения упомянутых удаленных сегментов содержит увеличение доли первого сегмента периода тона и уменьшение доли второго сегмента периода тона.
42. Вокодер по п.38, дополнительно содержащий этап выбора схожих речевых сегментов, при этом объединяются упомянутые схожие речевые сегменты.
43. Вокодер по п.38, в котором упомянутая команда изменения масштаба времени дополнительно содержит корреляцию речевых сегментов, посредством чего выбираются схожие речевые сегменты.
44. Вокодер по п.39, в котором упомянутое дополнение дополнительного периода тона, созданного из первого сегмента периода тона, и команда второго сегмента периода тона содержит добавление упомянутого первого и второго сегментов периода тона таким образом, что увеличивается упомянутая доля первого сегмента периода тона и уменьшается доля второго сегмента периода тона.
45. Вокодер по п.40, в котором упомянутая команда изменения масштаба времени дополнительно содержит генерирование остаточного сигнала посредством генерирования случайных значений с последующим применением упомянутых коэффициентов усиления к упомянутым случайным значениям.
46. Вокодер по п.40, в котором упомянутая команда изменения масштаба времени дополнительно содержит представление упомянутой информации кодирования с линейным предсказанием в качестве 10 кодированных значений коэффициента усиления, при этом каждое кодированное значение коэффициента усиления представляет 16 эталонов речи.
RU2007137643/09A 2005-03-11 2006-03-13 Изменение масштаба времени кадров в вокодере посредством изменения остатка RU2371784C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US66082405P 2005-03-11 2005-03-11
US60/660,824 2005-03-11
US11/123,467 2005-05-05
US11/123,467 US8155965B2 (en) 2005-03-11 2005-05-05 Time warping frames inside the vocoder by modifying the residual

Publications (2)

Publication Number Publication Date
RU2007137643A true RU2007137643A (ru) 2009-04-20
RU2371784C2 RU2371784C2 (ru) 2009-10-27

Family

ID=36575961

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2007137643/09A RU2371784C2 (ru) 2005-03-11 2006-03-13 Изменение масштаба времени кадров в вокодере посредством изменения остатка

Country Status (14)

Country Link
US (1) US8155965B2 (ru)
EP (1) EP1856689A1 (ru)
JP (1) JP5203923B2 (ru)
KR (2) KR100956623B1 (ru)
AU (1) AU2006222963C1 (ru)
BR (1) BRPI0607624B1 (ru)
CA (1) CA2600713C (ru)
IL (1) IL185935A (ru)
MX (1) MX2007011102A (ru)
NO (1) NO20075180L (ru)
RU (1) RU2371784C2 (ru)
SG (1) SG160380A1 (ru)
TW (1) TWI389099B (ru)
WO (1) WO2006099529A1 (ru)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
WO2006026635A2 (en) * 2004-08-30 2006-03-09 Qualcomm Incorporated Adaptive de-jitter buffer for voice over ip
US7674096B2 (en) * 2004-09-22 2010-03-09 Sundheim Gregroy S Portable, rotary vane vacuum pump with removable oil reservoir cartridge
US8085678B2 (en) * 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
CA2603255C (en) * 2005-04-01 2015-06-23 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
EP1875464B9 (en) * 2005-04-22 2020-10-28 Qualcomm Incorporated Method, storage medium and apparatus for gain factor attenuation
US8259840B2 (en) * 2005-10-24 2012-09-04 General Motors Llc Data communication via a voice channel of a wireless communication network using discontinuities
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US8279889B2 (en) * 2007-01-04 2012-10-02 Qualcomm Incorporated Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US8401865B2 (en) 2007-07-18 2013-03-19 Nokia Corporation Flexible parameter update in audio/speech coded signals
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US8768690B2 (en) * 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
KR101400535B1 (ko) 2008-07-11 2014-05-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
US20100191534A1 (en) * 2009-01-23 2010-07-29 Qualcomm Incorporated Method and apparatus for compression or decompression of digital signals
US8428938B2 (en) * 2009-06-04 2013-04-23 Qualcomm Incorporated Systems and methods for reconstructing an erased speech frame
EP2491555B1 (en) 2009-10-20 2014-03-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode audio codec
US8996364B2 (en) * 2010-04-12 2015-03-31 Smule, Inc. Computational techniques for continuous pitch correction and harmony generation
TWI409802B (zh) * 2010-04-14 2013-09-21 Univ Da Yeh 音頻特徵處理方法及其裝置
MY160265A (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Apparatus and Method for Encoding and Decoding an Audio Signal Using an Aligned Look-Ahead Portion
SG185519A1 (en) 2011-02-14 2012-12-28 Fraunhofer Ges Forschung Information signal representation using lapped transform
EP2676264B1 (en) 2011-02-14 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder estimating background noise during active phases
SG192734A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
JP5625126B2 (ja) 2011-02-14 2014-11-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム
JP5800915B2 (ja) 2011-02-14 2015-10-28 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号のトラックのパルス位置の符号化および復号化
BR112013020482B1 (pt) 2011-02-14 2021-02-23 Fraunhofer Ges Forschung aparelho e método para processar um sinal de áudio decodificado em um domínio espectral
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
ES2623291T3 (es) 2011-02-14 2017-07-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación de una porción de una señal de audio utilizando una detección de transitorios y un resultado de calidad
CN103092330B (zh) * 2011-10-27 2015-11-25 宏碁股份有限公司 电子装置及其语音辨识方法
TWI584269B (zh) * 2012-07-11 2017-05-21 Univ Nat Central Unsupervised language conversion detection method
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal

Family Cites Families (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5643800A (en) 1979-09-19 1981-04-22 Fujitsu Ltd Multilayer printed board
JPS57158247A (en) 1981-03-24 1982-09-30 Tokuyama Soda Co Ltd Flame retardant polyolefin composition
JPS59153346A (ja) * 1983-02-21 1984-09-01 Nec Corp 音声符号化・復号化装置
JPS61156949A (ja) 1984-12-27 1986-07-16 Matsushita Electric Ind Co Ltd 音声パケツト通信方式
BE1000415A7 (nl) 1987-03-18 1988-11-22 Bell Telephone Mfg Asynchroon op basis van tijdsverdeling werkend communicatiesysteem.
JPS6429141A (en) 1987-07-24 1989-01-31 Nec Corp Packet exchange system
JP2760810B2 (ja) 1988-09-19 1998-06-04 株式会社日立製作所 音声パケット処理方法
SE462277B (sv) 1988-10-05 1990-05-28 Vme Ind Sweden Ab Hydrauliskt styrsystem
JPH04113744A (ja) 1990-09-04 1992-04-15 Fujitsu Ltd 可変速度パケット伝送方式
AU642540B2 (en) * 1990-09-19 1993-10-21 Philips Electronics N.V. Record carrier on which a main data file and a control file have been recorded, method of and device for recording the main data file and the control file, and device for reading the record carrier
JP2846443B2 (ja) 1990-10-09 1999-01-13 三菱電機株式会社 パケット組立分解装置
US5283811A (en) * 1991-09-03 1994-02-01 General Electric Company Decision feedback equalization for digital cellular radio
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
US5317604A (en) * 1992-12-30 1994-05-31 Gte Government Systems Corporation Isochronous interface method
JP3186315B2 (ja) * 1993-02-27 2001-07-11 ソニー株式会社 信号圧縮装置、信号伸張装置、信号送信装置、信号受信装置及び信号送受信装置
US5490479A (en) * 1993-05-10 1996-02-13 Shalev; Matti Method and a product resulting from the use of the method for elevating feed storage bins
US5440562A (en) * 1993-12-27 1995-08-08 Motorola, Inc. Communication through a channel having a variable propagation delay
WO1996005697A1 (en) * 1994-08-12 1996-02-22 Sony Corporation Video signal editing device
NL9401696A (nl) 1994-10-14 1996-05-01 Nederland Ptt Bufferuitleesbesturing van ATM ontvanger.
US5602959A (en) * 1994-12-05 1997-02-11 Motorola, Inc. Method and apparatus for characterization and reconstruction of speech excitation waveforms
US5699478A (en) 1995-03-10 1997-12-16 Lucent Technologies Inc. Frame erasure compensation technique
US5929921A (en) 1995-03-16 1999-07-27 Matsushita Electric Industrial Co., Ltd. Video and audio signal multiplex sending apparatus, receiving apparatus and transmitting apparatus
JP3286110B2 (ja) 1995-03-16 2002-05-27 松下電器産業株式会社 音声パケット補間装置
KR0164827B1 (ko) * 1995-03-31 1999-03-20 김광호 프로그램 가이드신호 수신기
JPH09127995A (ja) 1995-10-26 1997-05-16 Sony Corp 信号復号化方法及び信号復号化装置
US5640388A (en) * 1995-12-21 1997-06-17 Scientific-Atlanta, Inc. Method and apparatus for removing jitter and correcting timestamps in a packet stream
JPH09261613A (ja) 1996-03-26 1997-10-03 Mitsubishi Electric Corp データ受信再生装置
US5940479A (en) * 1996-10-01 1999-08-17 Northern Telecom Limited System and method for transmitting aural information between a computer and telephone equipment
JPH10190735A (ja) 1996-12-27 1998-07-21 Secom Co Ltd 通話システム
US6073092A (en) * 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6259677B1 (en) * 1998-09-30 2001-07-10 Cisco Technology, Inc. Clock synchronization and dynamic jitter management for voice over IP and real-time data
US6370125B1 (en) * 1998-10-08 2002-04-09 Adtran, Inc. Dynamic delay compensation for packet-based voice network
US6456964B2 (en) * 1998-12-21 2002-09-24 Qualcomm, Incorporated Encoding of periodic speech using prototype waveforms
US6922669B2 (en) * 1998-12-29 2005-07-26 Koninklijke Philips Electronics N.V. Knowledge-based strategies applied to N-best lists in automatic speech recognition systems
EP1088302B1 (en) 1999-04-19 2008-07-23 AT & T Corp. Method for performing packet loss concealment
US7117156B1 (en) * 1999-04-19 2006-10-03 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
GB9911737D0 (en) * 1999-05-21 1999-07-21 Philips Electronics Nv Audio signal time scale modification
US6785230B1 (en) * 1999-05-25 2004-08-31 Matsushita Electric Industrial Co., Ltd. Audio transmission apparatus
JP4218186B2 (ja) 1999-05-25 2009-02-04 パナソニック株式会社 音声伝送装置
JP4895418B2 (ja) 1999-08-24 2012-03-14 ソニー株式会社 音声再生方法および音声再生装置
EP1221694B1 (en) 1999-09-14 2006-07-19 Fujitsu Limited Voice encoder/decoder
US6377931B1 (en) * 1999-09-28 2002-04-23 Mindspeed Technologies Speech manipulation for continuous speech playback over a packet network
US6859460B1 (en) * 1999-10-22 2005-02-22 Cisco Technology, Inc. System and method for providing multimedia jitter buffer adjustment for packet-switched networks
US6665317B1 (en) 1999-10-29 2003-12-16 Array Telecom Corporation Method, system, and computer program product for managing jitter
US6496794B1 (en) * 1999-11-22 2002-12-17 Motorola, Inc. Method and apparatus for seamless multi-rate speech coding
US6366880B1 (en) * 1999-11-30 2002-04-02 Motorola, Inc. Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies
US6693921B1 (en) * 1999-11-30 2004-02-17 Mindspeed Technologies, Inc. System for use of packet statistics in de-jitter delay adaption in a packet network
GB2360178B (en) * 2000-03-06 2004-04-14 Mitel Corp Sub-packet insertion for packet loss compensation in Voice Over IP networks
US6813274B1 (en) * 2000-03-21 2004-11-02 Cisco Technology, Inc. Network switch and method for data switching using a crossbar switch fabric with output port groups operating concurrently and independently
AU2001247578A1 (en) 2000-04-03 2001-10-15 Ericsson Inc. Method and apparatus for efficient handover in packet data communication system
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
EP2040253B1 (en) 2000-04-24 2012-04-11 Qualcomm Incorporated Predictive dequantization of voiced speech
US7246057B1 (en) * 2000-05-31 2007-07-17 Telefonaktiebolaget Lm Ericsson (Publ) System for handling variations in the reception of a speech signal consisting of packets
US7016970B2 (en) * 2000-07-06 2006-03-21 Matsushita Electric Industrial Co., Ltd. System for transmitting stream data from server to client based on buffer and transmission capacities and delay time of the client
US7155518B2 (en) * 2001-01-08 2006-12-26 Interactive People Unplugged Ab Extranet workgroup formation across multiple mobile virtual private networks
US20020133334A1 (en) * 2001-02-02 2002-09-19 Geert Coorman Time scale modification of digitally sampled waveforms in the time domain
US20040204935A1 (en) * 2001-02-21 2004-10-14 Krishnasamy Anandakumar Adaptive voice playout in VOP
US7212517B2 (en) * 2001-04-09 2007-05-01 Lucent Technologies Inc. Method and apparatus for jitter and frame erasure correction in packetized voice communication systems
WO2002087137A2 (en) 2001-04-24 2002-10-31 Nokia Corporation Methods for changing the size of a jitter buffer and for time alignment, communications system, receiving end, and transcoder
US7006511B2 (en) 2001-07-17 2006-02-28 Avaya Technology Corp. Dynamic jitter buffering for voice-over-IP and other packet-based communication systems
US7266127B2 (en) * 2002-02-08 2007-09-04 Lucent Technologies Inc. Method and system to compensate for the effects of packet delays on speech quality in a Voice-over IP system
US7079486B2 (en) * 2002-02-13 2006-07-18 Agere Systems Inc. Adaptive threshold based jitter buffer management for packetized data
US7158572B2 (en) * 2002-02-14 2007-01-02 Tellabs Operations, Inc. Audio enhancement communication techniques
US7126957B1 (en) * 2002-03-07 2006-10-24 Utstarcom, Inc. Media flow method for transferring real-time data between asynchronous and synchronous networks
US7263109B2 (en) * 2002-03-11 2007-08-28 Conexant, Inc. Clock skew compensation for a jitter buffer
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP3761486B2 (ja) * 2002-03-29 2006-03-29 Necインフロンティア株式会社 無線lanシステム、主装置およびプログラム
AU2002307884A1 (en) * 2002-04-22 2003-11-03 Nokia Corporation Method and device for obtaining parameters for parametric speech coding of frames
US7496086B2 (en) * 2002-04-30 2009-02-24 Alcatel-Lucent Usa Inc. Techniques for jitter buffer delay management
US7280510B2 (en) * 2002-05-21 2007-10-09 Nortel Networks Limited Controlling reverse channel activity in a wireless communications system
WO2003107591A1 (en) * 2002-06-14 2003-12-24 Nokia Corporation Enhanced error concealment for spatial audio
US7336678B2 (en) * 2002-07-31 2008-02-26 Intel Corporation State-based jitter buffer and method of operation
US8520519B2 (en) * 2002-09-20 2013-08-27 Broadcom Corporation External jitter buffer in a packet voice system
JP3796240B2 (ja) 2002-09-30 2006-07-12 三洋電機株式会社 ネットワーク電話機および音声復号化装置
JP4146708B2 (ja) 2002-10-31 2008-09-10 京セラ株式会社 通信システム、無線通信端末、データ配信装置及び通信方法
US6996626B1 (en) * 2002-12-03 2006-02-07 Crystalvoice Communications Continuous bandwidth assessment and feedback for voice-over-internet-protocol (VoIP) comparing packet's voice duration and arrival rate
KR100517237B1 (ko) 2002-12-09 2005-09-27 한국전자통신연구원 직교 주파수 분할 다중화 무선 통신 시스템에서의채널품질 추정과 링크적응 방법 및 그 장치
US7525918B2 (en) * 2003-01-21 2009-04-28 Broadcom Corporation Using RTCP statistics for media system control
US7394833B2 (en) * 2003-02-11 2008-07-01 Nokia Corporation Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification
JP2004266724A (ja) 2003-03-04 2004-09-24 Matsushita Electric Ind Co Ltd リアルタイム音声用バッファ制御装置
JP3825007B2 (ja) * 2003-03-11 2006-09-20 沖電気工業株式会社 ジッタバッファの制御方法
US7551671B2 (en) * 2003-04-16 2009-06-23 General Dynamics Decision Systems, Inc. System and method for transmission of video signals using multiple channels
JP2005057504A (ja) 2003-08-05 2005-03-03 Matsushita Electric Ind Co Ltd データ通信装置及びデータ通信方法
CA2446469A1 (en) * 2003-08-15 2005-02-15 M-Stack Limited Apparatus, and an associated method, for preserving communication service quality levels during hand-off of communications in a radio communication system
US7596488B2 (en) 2003-09-15 2009-09-29 Microsoft Corporation System and method for real-time jitter control and packet-loss concealment in an audio signal
US7505764B2 (en) * 2003-10-28 2009-03-17 Motorola, Inc. Method for retransmitting a speech packet
US7272400B1 (en) * 2003-12-19 2007-09-18 Core Mobility, Inc. Load balancing between users of a wireless base station
US7424026B2 (en) * 2004-04-28 2008-09-09 Nokia Corporation Method and apparatus providing continuous adaptive control of voice packet buffer at receiver terminal
JP4076981B2 (ja) 2004-08-09 2008-04-16 Kddi株式会社 通信端末装置およびバッファ制御方法
US8085678B2 (en) * 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
SG124307A1 (en) * 2005-01-20 2006-08-30 St Microelectronics Asia Method and system for lost packet concealment in high quality audio streaming applications
US8102872B2 (en) * 2005-02-01 2012-01-24 Qualcomm Incorporated Method for discontinuous transmission and accurate reproduction of background noise information
US20060187970A1 (en) * 2005-02-22 2006-08-24 Minkyu Lee Method and apparatus for handling network jitter in a Voice-over IP communications network using a virtual jitter buffer and time scale modification
US8355907B2 (en) 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
CA2603255C (en) * 2005-04-01 2015-06-23 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding

Also Published As

Publication number Publication date
AU2006222963B2 (en) 2010-04-08
CA2600713A1 (en) 2006-09-21
JP5203923B2 (ja) 2013-06-05
KR100957265B1 (ko) 2010-05-12
MX2007011102A (es) 2007-11-22
IL185935A (en) 2013-09-30
JP2008533529A (ja) 2008-08-21
US8155965B2 (en) 2012-04-10
NO20075180L (no) 2007-10-31
TWI389099B (zh) 2013-03-11
RU2371784C2 (ru) 2009-10-27
KR100956623B1 (ko) 2010-05-11
BRPI0607624A2 (pt) 2009-09-22
KR20090119936A (ko) 2009-11-20
US20060206334A1 (en) 2006-09-14
AU2006222963A1 (en) 2006-09-21
EP1856689A1 (en) 2007-11-21
TW200638336A (en) 2006-11-01
KR20070112832A (ko) 2007-11-27
BRPI0607624B1 (pt) 2019-03-26
CA2600713C (en) 2012-05-22
SG160380A1 (en) 2010-04-29
AU2006222963C1 (en) 2010-09-16
WO2006099529A1 (en) 2006-09-21
IL185935A0 (en) 2008-01-06

Similar Documents

Publication Publication Date Title
RU2007137643A (ru) Изменение масштаба времени кадров в вокодере посредством изменения остатка
US11705137B2 (en) Apparatus for encoding and decoding of integrated speech and audio
US6427135B1 (en) Method for encoding speech wherein pitch periods are changed based upon input speech signal
RU2009110202A (ru) Трансформация шкалы времени кадров в широкополосном вокодере
US8332213B2 (en) Multi-reference LPC filter quantization and inverse quantization device and method
EP2272062B1 (en) An audio signal classifier
US6732070B1 (en) Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
CN110444219B (zh) 选择第一编码演算法或第二编码演算法的装置与方法
CN103493129B (zh) 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
EP1952400A1 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
JP6113278B2 (ja) 改良された確率分布推定を使用する線形予測に基づくオーディオ符号化
JP2002268690A (ja) 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
CN105359211A (zh) 语音处理的清音/浊音判决
RU2486610C2 (ru) Способ кодирования сигнала и способ декодирования сигнала
JP3628268B2 (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
KR20170003596A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
JP6644848B2 (ja) ベクトル量子化装置、音声符号化装置、ベクトル量子化方法、及び音声符号化方法
JPWO2014034697A1 (ja) 復号方法、復号装置、プログラム、及びその記録媒体
JP2613503B2 (ja) 音声の励振信号符号化・復号化方法
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
CN1327410C (zh) 语音编解码方法之间的代码转换方法及装置
JP2004151424A (ja) トランスコーダ及び符号変換方法
KR101847213B1 (ko) 쉐이핑 함수를 이용한 오디오 신호 디코딩 방법 및 장치
JP3166697B2 (ja) 音声符号化・復号装置及びシステム
JPH0844398A (ja) 音声符号化装置