RU2007137643A - Изменение масштаба времени кадров в вокодере посредством изменения остатка - Google Patents
Изменение масштаба времени кадров в вокодере посредством изменения остатка Download PDFInfo
- Publication number
- RU2007137643A RU2007137643A RU2007137643/09A RU2007137643A RU2007137643A RU 2007137643 A RU2007137643 A RU 2007137643A RU 2007137643/09 A RU2007137643/09 A RU 2007137643/09A RU 2007137643 A RU2007137643 A RU 2007137643A RU 2007137643 A RU2007137643 A RU 2007137643A
- Authority
- RU
- Russia
- Prior art keywords
- speech
- tone
- segments
- residual
- vocoder
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract 31
- 238000001914 filtration Methods 0.000 claims abstract 3
- 230000000737 periodic effect Effects 0.000 claims abstract 3
- 230000002194 synthesizing effect Effects 0.000 claims abstract 2
- 230000007423 decrease Effects 0.000 claims 4
- 230000005284 excitation Effects 0.000 claims 4
- 230000003247 decreasing effect Effects 0.000 claims 2
- 230000011218 segmentation Effects 0.000 claims 2
- 230000005540 biological transmission Effects 0.000 abstract 5
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/01—Correction of time axis
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electric Clocks (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
1. Способ передачи речи, содержащий этапы, на которых: ! изменяют масштаб времени остаточного речевого сигнала к расширенному или сжатому виду упомянутого остаточного речевого сигнала и ! синтезируют упомянутый остаточный речевой сигнал, подвергшийся изменению масштаба времени. ! 2. Способ передачи речи по п.1, дополнительно содержащий этапы, на которых: ! классифицируют речевые сегменты и ! кодируют упомянутые речевые сегменты. ! 3. Способ передачи речи по п.2, в котором упомянутый этап кодирования речевых сегментов содержит использование периодов тона образца, линейное предсказание с кодовым возбуждением, линейное предсказание с шумовым возбуждением или 1/8 кадрового кодирования. ! 4. Способ передачи речи по п.2, дополнительно содержащий этапы, на которых: ! отправляют упомянутый речевой сигнал через кодирующий фильтр с линейным предсказанием, посредством чего фильтруя кратковременные корреляции в упомянутом речевом сигнале; и ! выдают коэффициенты кодирования с линейным предсказанием и остаточный сигнал. ! 5. Способ передачи речи по п.2, в котором упомянутый этап классифицирования речевых сегментов содержит классификацию речевых кадров на периодические, слабопериодические или шумовые в зависимости от того, представляют ли кадры вокализированную, невокализированную или неустойчивую речь. ! 6. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием с линейным предсказанием с кодовым возбуждением. ! 7. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием периода тона образца. ! 8. Способ передачи речи по п.2, в котором упомянутое кодирование является кодирован
Claims (46)
1. Способ передачи речи, содержащий этапы, на которых:
изменяют масштаб времени остаточного речевого сигнала к расширенному или сжатому виду упомянутого остаточного речевого сигнала и
синтезируют упомянутый остаточный речевой сигнал, подвергшийся изменению масштаба времени.
2. Способ передачи речи по п.1, дополнительно содержащий этапы, на которых:
классифицируют речевые сегменты и
кодируют упомянутые речевые сегменты.
3. Способ передачи речи по п.2, в котором упомянутый этап кодирования речевых сегментов содержит использование периодов тона образца, линейное предсказание с кодовым возбуждением, линейное предсказание с шумовым возбуждением или 1/8 кадрового кодирования.
4. Способ передачи речи по п.2, дополнительно содержащий этапы, на которых:
отправляют упомянутый речевой сигнал через кодирующий фильтр с линейным предсказанием, посредством чего фильтруя кратковременные корреляции в упомянутом речевом сигнале; и
выдают коэффициенты кодирования с линейным предсказанием и остаточный сигнал.
5. Способ передачи речи по п.2, в котором упомянутый этап классифицирования речевых сегментов содержит классификацию речевых кадров на периодические, слабопериодические или шумовые в зависимости от того, представляют ли кадры вокализированную, невокализированную или неустойчивую речь.
6. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием с линейным предсказанием с кодовым возбуждением.
7. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием периода тона образца.
8. Способ передачи речи по п.2, в котором упомянутое кодирование является кодированием с линейным предсказанием с шумовым возбуждением.
9. Способ по п.6, в котором упомянутый этап изменения масштаба времени содержит:
оценку периода тона и
добавление или выделение по меньшей мере одного упомянутого периода тона после приема упомянутого остаточного сигнала.
10. Способ по п.6, в котором этап изменения масштаба времени содержит:
оценку задержки тона;
разделение речевого кадра на периоды тона, при этом границы упомянутых периодов тона определяются, используя упомянутую задержку тона в различных точках упомянутого речевого кадра;
совмещение упомянутых периодов тона, если уменьшается упомянутый остаточный речевой сигнал; и
добавление упомянутых периодов тона, если увеличивается упомянутый остаточный речевой сигнал.
11. Способ по п.7, в котором упомянутый этап изменения масштаба времени содержит этапы, на которых:
оценивают по меньшей мере один период тона;
интерполируют упомянутый по меньшей мере один период тона;
добавляют упомянутый по меньшей мере один период тона, когда расширяют упомянутый остаточный речевой сигнал; и
выделяют упомянутый по меньшей мере один период тона, когда сжимают упомянутый остаточный речевой сигнал.
12. Способ по п.8, в котором упомянутый этап кодирования содержит кодирование информации кодирования с линейным предсказанием в качестве коэффициентов усиления разных частей речевого сегмента.
13. Способ по п.10, в котором упомянутый этап совмещения упомянутых периодов тона, если уменьшается упомянутый речевой остаточной сигнал, содержит:
сегментирование входной эталонной последовательности в блоки эталонов;
удаление сегментов упомянутого остаточного сигнала за постоянные интервалы времени;
объединение упомянутых удаленных сегментов и
замену упомянутых удаленных сегментов на объединенный сегмент.
14. Способ по п.10, в котором упомянутый этап оценки задержки тона содержит интерполяцию между задержкой тона конца последнего кадра и конца текущего кадра.
15. Способ по п.10, в котором упомянутый этап добавления упомянутых периодов тона содержит объединение речевых сегментов.
16. Способ по п.10, в котором упомянутый этап добавления упомянутых периодов тона, если увеличивается упомянутый остаточный речевой сигнал, содержит добавление дополнительного периода тона, созданного из первого сегмента периода тона и второго сегмента периода тона.
17. Способ по п.12, в котором упомянутые коэффициенты усиления кодируются для наборов речевых эталонов.
18. Способ по п.13, в котором упомянутый этап объединения упомянутых удаленных сегментов содержит увеличение доли первого сегмента периода тона и уменьшение доли второго сегмента периода тона.
19. Способ по п.15, дополнительно содержащий этап выбора схожих речевых сегментов, при этом объединяют упомянутые схожие речевые сегменты.
20. Способ по п.15, дополнительно содержащий этап корреляции речевых сегментов, посредством чего объединяют схожие речевые сегменты.
21. Способ по п.16, в котором упомянутый этап добавления дополнительного периода тона, созданного из первого сегмента периода тона и второго сегмента периода тона, содержит сложение упомянутого первого и упомянутого второго сегментов тона таким образом, что увеличивается доля упомянутого первого сегмента периода тона и уменьшается доля упомянутого второго сегмента периода тона.
22. Способ по п.17, дополнительно содержащий этап генерирования остаточного сигнала посредством генерирования случайных значений с последующим применением упомянутых коэффициентов усиления к упомянутым случайным значениям.
23. Способ по п.17, дополнительно содержащий этап представления упомянутой информации кодирования с линейным предсказанием в качестве 10 кодированных значений коэффициентов усиления, при этом каждое кодированное значение коэффициента усиления представляет 16 эталонов речи.
24. Вокодер, имеющий по меньшей мере один вход и по меньшей мере один выход, содержащий:
кодер, содержащий фильтр, имеющий по меньшей мере один вход, функционально связанный с входом вокодера, и по меньшей мере один выход; и
декодер, содержащий синтезатор, имеющий по меньшей мере один вход, функционально связанный с упомянутым по меньшей мере одним выходом упомянутого кодера, и по меньшей мере один выход, функционально связанный с упомянутым по меньшей мере одним выходом вокодера.
25. Вокодер по п.24, в котором упомянутый декодер содержит:
память, при этом упомянутый декодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих изменение масштаба времени остаточного речевого сигнала к расширенному или сжатому виду упомянутого остаточного сигнала.
26. Вокодер по п.24, в котором упомянутый кодер содержит:
память и упомянутый кодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих классификацию речевых сегментов по 1/8 кадра, периоды тона образца, линейное предсказание с кодовым возбуждением или линейное предсказание с шумовым возбуждением.
27. Вокодер по п.26, в котором упомянутый декодер содержит:
память и упомянутый декодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих изменение масштаба времени остаточного сигнала к расширенному или сжатому виду упомянутого остаточного речевого сигнала.
28. Вокодер по п.27, в котором упомянутый фильтр является кодирующим фильтром с линейным предсказанием, который выполнен с возможностью:
фильтрации кратковременных корреляций в речевом сигнале и
выдачи коэффициентов кодирования с линейным предсказанием и остаточного сигнала.
29. Вокодер по п.27, в котором упомянутый кодер содержит:
память и упомянутый кодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих кодирование упомянутых речевых сегментов, используя кодирование с линейным предсказанием с кодовым возбуждением.
30. Вокодер по п.27, в котором упомянутый кодер содержит:
память и упомянутый кодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих кодирование упомянутых речевых сегментов, используя кодирование периода тона образца.
31. Вокодер по п.27, в котором упомянутый кодер содержит:
память и упомянутый кодер выполнен с возможностью выполнения программных команд, сохраненных в упомянутой памяти, содержащих кодирование упомянутых речевых сегментов, используя кодирование с линейным предсказанием с шумовым возбуждением.
32. Вокодер по п.29, в котором упомянутая программная команда изменения масштаба времени содержит:
оценку по меньшей мере одного периода тона и
добавление или удаление упомянутого по меньшей мере одного периода тона после приема упомянутого остаточного сигнала.
33. Вокодер по п.29, в котором упомянутая программная команда изменения масштаба времени содержит
оценку задержки тона;
разделение речевого кадра на периоды тона, при этом границы упомянутых периодов тона определяются, используя упомянутую задержку тона в различных точках упомянутого речевого кадра;
совмещение упомянутых периодов тона, если уменьшается упомянутый остаточный речевой сигнал; и
добавление упомянутых периодов тона, если увеличивается остаточный речевой сигнал.
34. Вокодер по п.30, в котором упомянутая программная команда изменения масштаба времени содержит
оценку по меньшей мере одного период тона;
интерполяцию упомянутого по меньшей мере одного периода тона;
добавление упомянутого по меньшей мере одного периода тона, когда расширяют упомянутый остаточный речевой сигнал; и
выделение упомянутого по меньшей мере одного периода тона, когда сжимают упомянутый остаточный речевой сигнал.
35. Вокодер по п.31, в котором упомянутое кодирование упомянутых речевых сегментов, используя программную команду кодирования с линейным предсказанием с шумовым возбуждением, содержит кодирование информации кодирования с линейным предсказанием в качестве коэффициентов усиления различных частей речевых сегментов.
36. Вокодер по п.33, в котором упомянутое совмещение упомянутых периодов тона, если уменьшается упомянутый речевой остаточный сигнал, содержит
сегментацию входной эталонной последовательности на блоки эталонов;
удаление сегментов упомянутого остаточного сигнала в постоянные интервалы времени;
объединение упомянутых объединенных сегментов и
замену упомянутых удаленных сегментов на объединенный сегмент.
37. Вокодер по п.33, в котором упомянутая команда оценки задержки тона содержит интерполяцию между задержкой тона конца последнего кадра и конца текущего кадра.
38. Вокодер по п.33, в котором упомянутая команда суммирования упомянутых периодов тона содержит объединение речевых сегментов.
39. Вокодер по п.33, в котором упомянутая команда добавления упомянутых периодов тона, если увеличивается упомянутый речевой остаточный сигнал, содержит добавление дополнительного периода тона, созданного из первого сегмента периода тона и второго сегмента периода тона.
40. Вокодер по п.35, в котором упомянутые коэффициенты усиления кодируются для наборов речевых эталонов.
41. Вокодер по п.36, в котором упомянутая команда объединения упомянутых удаленных сегментов содержит увеличение доли первого сегмента периода тона и уменьшение доли второго сегмента периода тона.
42. Вокодер по п.38, дополнительно содержащий этап выбора схожих речевых сегментов, при этом объединяются упомянутые схожие речевые сегменты.
43. Вокодер по п.38, в котором упомянутая команда изменения масштаба времени дополнительно содержит корреляцию речевых сегментов, посредством чего выбираются схожие речевые сегменты.
44. Вокодер по п.39, в котором упомянутое дополнение дополнительного периода тона, созданного из первого сегмента периода тона, и команда второго сегмента периода тона содержит добавление упомянутого первого и второго сегментов периода тона таким образом, что увеличивается упомянутая доля первого сегмента периода тона и уменьшается доля второго сегмента периода тона.
45. Вокодер по п.40, в котором упомянутая команда изменения масштаба времени дополнительно содержит генерирование остаточного сигнала посредством генерирования случайных значений с последующим применением упомянутых коэффициентов усиления к упомянутым случайным значениям.
46. Вокодер по п.40, в котором упомянутая команда изменения масштаба времени дополнительно содержит представление упомянутой информации кодирования с линейным предсказанием в качестве 10 кодированных значений коэффициента усиления, при этом каждое кодированное значение коэффициента усиления представляет 16 эталонов речи.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US66082405P | 2005-03-11 | 2005-03-11 | |
US60/660,824 | 2005-03-11 | ||
US11/123,467 | 2005-05-05 | ||
US11/123,467 US8155965B2 (en) | 2005-03-11 | 2005-05-05 | Time warping frames inside the vocoder by modifying the residual |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2007137643A true RU2007137643A (ru) | 2009-04-20 |
RU2371784C2 RU2371784C2 (ru) | 2009-10-27 |
Family
ID=36575961
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007137643/09A RU2371784C2 (ru) | 2005-03-11 | 2006-03-13 | Изменение масштаба времени кадров в вокодере посредством изменения остатка |
Country Status (14)
Country | Link |
---|---|
US (1) | US8155965B2 (ru) |
EP (1) | EP1856689A1 (ru) |
JP (1) | JP5203923B2 (ru) |
KR (2) | KR100956623B1 (ru) |
AU (1) | AU2006222963C1 (ru) |
BR (1) | BRPI0607624B1 (ru) |
CA (1) | CA2600713C (ru) |
IL (1) | IL185935A (ru) |
MX (1) | MX2007011102A (ru) |
NO (1) | NO20075180L (ru) |
RU (1) | RU2371784C2 (ru) |
SG (1) | SG160380A1 (ru) |
TW (1) | TWI389099B (ru) |
WO (1) | WO2006099529A1 (ru) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
WO2006026635A2 (en) * | 2004-08-30 | 2006-03-09 | Qualcomm Incorporated | Adaptive de-jitter buffer for voice over ip |
US7674096B2 (en) * | 2004-09-22 | 2010-03-09 | Sundheim Gregroy S | Portable, rotary vane vacuum pump with removable oil reservoir cartridge |
US8085678B2 (en) * | 2004-10-13 | 2011-12-27 | Qualcomm Incorporated | Media (voice) playback (de-jitter) buffer adjustments based on air interface |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
CA2603255C (en) * | 2005-04-01 | 2015-06-23 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband speech coding |
EP1875464B9 (en) * | 2005-04-22 | 2020-10-28 | Qualcomm Incorporated | Method, storage medium and apparatus for gain factor attenuation |
US8259840B2 (en) * | 2005-10-24 | 2012-09-04 | General Motors Llc | Data communication via a voice channel of a wireless communication network using discontinuities |
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US8279889B2 (en) * | 2007-01-04 | 2012-10-02 | Qualcomm Incorporated | Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US8401865B2 (en) | 2007-07-18 | 2013-03-19 | Nokia Corporation | Flexible parameter update in audio/speech coded signals |
US20090319261A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
US20090319263A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
US8768690B2 (en) * | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
KR101400535B1 (ko) | 2008-07-11 | 2014-05-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩 |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
US20100191534A1 (en) * | 2009-01-23 | 2010-07-29 | Qualcomm Incorporated | Method and apparatus for compression or decompression of digital signals |
US8428938B2 (en) * | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
EP2491555B1 (en) | 2009-10-20 | 2014-03-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio codec |
US8996364B2 (en) * | 2010-04-12 | 2015-03-31 | Smule, Inc. | Computational techniques for continuous pitch correction and harmony generation |
TWI409802B (zh) * | 2010-04-14 | 2013-09-21 | Univ Da Yeh | 音頻特徵處理方法及其裝置 |
MY160265A (en) | 2011-02-14 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Apparatus and Method for Encoding and Decoding an Audio Signal Using an Aligned Look-Ahead Portion |
SG185519A1 (en) | 2011-02-14 | 2012-12-28 | Fraunhofer Ges Forschung | Information signal representation using lapped transform |
EP2676264B1 (en) | 2011-02-14 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder estimating background noise during active phases |
SG192734A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
JP5625126B2 (ja) | 2011-02-14 | 2014-11-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム |
JP5800915B2 (ja) | 2011-02-14 | 2015-10-28 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ信号のトラックのパルス位置の符号化および復号化 |
BR112013020482B1 (pt) | 2011-02-14 | 2021-02-23 | Fraunhofer Ges Forschung | aparelho e método para processar um sinal de áudio decodificado em um domínio espectral |
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
ES2623291T3 (es) | 2011-02-14 | 2017-07-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificación de una porción de una señal de audio utilizando una detección de transitorios y un resultado de calidad |
CN103092330B (zh) * | 2011-10-27 | 2015-11-25 | 宏碁股份有限公司 | 电子装置及其语音辨识方法 |
TWI584269B (zh) * | 2012-07-11 | 2017-05-21 | Univ Nat Central | Unsupervised language conversion detection method |
FR3024582A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
Family Cites Families (96)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5643800A (en) | 1979-09-19 | 1981-04-22 | Fujitsu Ltd | Multilayer printed board |
JPS57158247A (en) | 1981-03-24 | 1982-09-30 | Tokuyama Soda Co Ltd | Flame retardant polyolefin composition |
JPS59153346A (ja) * | 1983-02-21 | 1984-09-01 | Nec Corp | 音声符号化・復号化装置 |
JPS61156949A (ja) | 1984-12-27 | 1986-07-16 | Matsushita Electric Ind Co Ltd | 音声パケツト通信方式 |
BE1000415A7 (nl) | 1987-03-18 | 1988-11-22 | Bell Telephone Mfg | Asynchroon op basis van tijdsverdeling werkend communicatiesysteem. |
JPS6429141A (en) | 1987-07-24 | 1989-01-31 | Nec Corp | Packet exchange system |
JP2760810B2 (ja) | 1988-09-19 | 1998-06-04 | 株式会社日立製作所 | 音声パケット処理方法 |
SE462277B (sv) | 1988-10-05 | 1990-05-28 | Vme Ind Sweden Ab | Hydrauliskt styrsystem |
JPH04113744A (ja) | 1990-09-04 | 1992-04-15 | Fujitsu Ltd | 可変速度パケット伝送方式 |
AU642540B2 (en) * | 1990-09-19 | 1993-10-21 | Philips Electronics N.V. | Record carrier on which a main data file and a control file have been recorded, method of and device for recording the main data file and the control file, and device for reading the record carrier |
JP2846443B2 (ja) | 1990-10-09 | 1999-01-13 | 三菱電機株式会社 | パケット組立分解装置 |
US5283811A (en) * | 1991-09-03 | 1994-02-01 | General Electric Company | Decision feedback equalization for digital cellular radio |
US5371853A (en) * | 1991-10-28 | 1994-12-06 | University Of Maryland At College Park | Method and system for CELP speech coding and codebook for use therewith |
US5317604A (en) * | 1992-12-30 | 1994-05-31 | Gte Government Systems Corporation | Isochronous interface method |
JP3186315B2 (ja) * | 1993-02-27 | 2001-07-11 | ソニー株式会社 | 信号圧縮装置、信号伸張装置、信号送信装置、信号受信装置及び信号送受信装置 |
US5490479A (en) * | 1993-05-10 | 1996-02-13 | Shalev; Matti | Method and a product resulting from the use of the method for elevating feed storage bins |
US5440562A (en) * | 1993-12-27 | 1995-08-08 | Motorola, Inc. | Communication through a channel having a variable propagation delay |
WO1996005697A1 (en) * | 1994-08-12 | 1996-02-22 | Sony Corporation | Video signal editing device |
NL9401696A (nl) | 1994-10-14 | 1996-05-01 | Nederland Ptt | Bufferuitleesbesturing van ATM ontvanger. |
US5602959A (en) * | 1994-12-05 | 1997-02-11 | Motorola, Inc. | Method and apparatus for characterization and reconstruction of speech excitation waveforms |
US5699478A (en) | 1995-03-10 | 1997-12-16 | Lucent Technologies Inc. | Frame erasure compensation technique |
US5929921A (en) | 1995-03-16 | 1999-07-27 | Matsushita Electric Industrial Co., Ltd. | Video and audio signal multiplex sending apparatus, receiving apparatus and transmitting apparatus |
JP3286110B2 (ja) | 1995-03-16 | 2002-05-27 | 松下電器産業株式会社 | 音声パケット補間装置 |
KR0164827B1 (ko) * | 1995-03-31 | 1999-03-20 | 김광호 | 프로그램 가이드신호 수신기 |
JPH09127995A (ja) | 1995-10-26 | 1997-05-16 | Sony Corp | 信号復号化方法及び信号復号化装置 |
US5640388A (en) * | 1995-12-21 | 1997-06-17 | Scientific-Atlanta, Inc. | Method and apparatus for removing jitter and correcting timestamps in a packet stream |
JPH09261613A (ja) | 1996-03-26 | 1997-10-03 | Mitsubishi Electric Corp | データ受信再生装置 |
US5940479A (en) * | 1996-10-01 | 1999-08-17 | Northern Telecom Limited | System and method for transmitting aural information between a computer and telephone equipment |
JPH10190735A (ja) | 1996-12-27 | 1998-07-21 | Secom Co Ltd | 通話システム |
US6073092A (en) * | 1997-06-26 | 2000-06-06 | Telogy Networks, Inc. | Method for speech coding based on a code excited linear prediction (CELP) model |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
US6259677B1 (en) * | 1998-09-30 | 2001-07-10 | Cisco Technology, Inc. | Clock synchronization and dynamic jitter management for voice over IP and real-time data |
US6370125B1 (en) * | 1998-10-08 | 2002-04-09 | Adtran, Inc. | Dynamic delay compensation for packet-based voice network |
US6456964B2 (en) * | 1998-12-21 | 2002-09-24 | Qualcomm, Incorporated | Encoding of periodic speech using prototype waveforms |
US6922669B2 (en) * | 1998-12-29 | 2005-07-26 | Koninklijke Philips Electronics N.V. | Knowledge-based strategies applied to N-best lists in automatic speech recognition systems |
EP1088302B1 (en) | 1999-04-19 | 2008-07-23 | AT & T Corp. | Method for performing packet loss concealment |
US7117156B1 (en) * | 1999-04-19 | 2006-10-03 | At&T Corp. | Method and apparatus for performing packet loss or frame erasure concealment |
GB9911737D0 (en) * | 1999-05-21 | 1999-07-21 | Philips Electronics Nv | Audio signal time scale modification |
US6785230B1 (en) * | 1999-05-25 | 2004-08-31 | Matsushita Electric Industrial Co., Ltd. | Audio transmission apparatus |
JP4218186B2 (ja) | 1999-05-25 | 2009-02-04 | パナソニック株式会社 | 音声伝送装置 |
JP4895418B2 (ja) | 1999-08-24 | 2012-03-14 | ソニー株式会社 | 音声再生方法および音声再生装置 |
EP1221694B1 (en) | 1999-09-14 | 2006-07-19 | Fujitsu Limited | Voice encoder/decoder |
US6377931B1 (en) * | 1999-09-28 | 2002-04-23 | Mindspeed Technologies | Speech manipulation for continuous speech playback over a packet network |
US6859460B1 (en) * | 1999-10-22 | 2005-02-22 | Cisco Technology, Inc. | System and method for providing multimedia jitter buffer adjustment for packet-switched networks |
US6665317B1 (en) | 1999-10-29 | 2003-12-16 | Array Telecom Corporation | Method, system, and computer program product for managing jitter |
US6496794B1 (en) * | 1999-11-22 | 2002-12-17 | Motorola, Inc. | Method and apparatus for seamless multi-rate speech coding |
US6366880B1 (en) * | 1999-11-30 | 2002-04-02 | Motorola, Inc. | Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies |
US6693921B1 (en) * | 1999-11-30 | 2004-02-17 | Mindspeed Technologies, Inc. | System for use of packet statistics in de-jitter delay adaption in a packet network |
GB2360178B (en) * | 2000-03-06 | 2004-04-14 | Mitel Corp | Sub-packet insertion for packet loss compensation in Voice Over IP networks |
US6813274B1 (en) * | 2000-03-21 | 2004-11-02 | Cisco Technology, Inc. | Network switch and method for data switching using a crossbar switch fabric with output port groups operating concurrently and independently |
AU2001247578A1 (en) | 2000-04-03 | 2001-10-15 | Ericsson Inc. | Method and apparatus for efficient handover in packet data communication system |
US6584438B1 (en) * | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
EP2040253B1 (en) | 2000-04-24 | 2012-04-11 | Qualcomm Incorporated | Predictive dequantization of voiced speech |
US7246057B1 (en) * | 2000-05-31 | 2007-07-17 | Telefonaktiebolaget Lm Ericsson (Publ) | System for handling variations in the reception of a speech signal consisting of packets |
US7016970B2 (en) * | 2000-07-06 | 2006-03-21 | Matsushita Electric Industrial Co., Ltd. | System for transmitting stream data from server to client based on buffer and transmission capacities and delay time of the client |
US7155518B2 (en) * | 2001-01-08 | 2006-12-26 | Interactive People Unplugged Ab | Extranet workgroup formation across multiple mobile virtual private networks |
US20020133334A1 (en) * | 2001-02-02 | 2002-09-19 | Geert Coorman | Time scale modification of digitally sampled waveforms in the time domain |
US20040204935A1 (en) * | 2001-02-21 | 2004-10-14 | Krishnasamy Anandakumar | Adaptive voice playout in VOP |
US7212517B2 (en) * | 2001-04-09 | 2007-05-01 | Lucent Technologies Inc. | Method and apparatus for jitter and frame erasure correction in packetized voice communication systems |
WO2002087137A2 (en) | 2001-04-24 | 2002-10-31 | Nokia Corporation | Methods for changing the size of a jitter buffer and for time alignment, communications system, receiving end, and transcoder |
US7006511B2 (en) | 2001-07-17 | 2006-02-28 | Avaya Technology Corp. | Dynamic jitter buffering for voice-over-IP and other packet-based communication systems |
US7266127B2 (en) * | 2002-02-08 | 2007-09-04 | Lucent Technologies Inc. | Method and system to compensate for the effects of packet delays on speech quality in a Voice-over IP system |
US7079486B2 (en) * | 2002-02-13 | 2006-07-18 | Agere Systems Inc. | Adaptive threshold based jitter buffer management for packetized data |
US7158572B2 (en) * | 2002-02-14 | 2007-01-02 | Tellabs Operations, Inc. | Audio enhancement communication techniques |
US7126957B1 (en) * | 2002-03-07 | 2006-10-24 | Utstarcom, Inc. | Media flow method for transferring real-time data between asynchronous and synchronous networks |
US7263109B2 (en) * | 2002-03-11 | 2007-08-28 | Conexant, Inc. | Clock skew compensation for a jitter buffer |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
JP3761486B2 (ja) * | 2002-03-29 | 2006-03-29 | Necインフロンティア株式会社 | 無線lanシステム、主装置およびプログラム |
AU2002307884A1 (en) * | 2002-04-22 | 2003-11-03 | Nokia Corporation | Method and device for obtaining parameters for parametric speech coding of frames |
US7496086B2 (en) * | 2002-04-30 | 2009-02-24 | Alcatel-Lucent Usa Inc. | Techniques for jitter buffer delay management |
US7280510B2 (en) * | 2002-05-21 | 2007-10-09 | Nortel Networks Limited | Controlling reverse channel activity in a wireless communications system |
WO2003107591A1 (en) * | 2002-06-14 | 2003-12-24 | Nokia Corporation | Enhanced error concealment for spatial audio |
US7336678B2 (en) * | 2002-07-31 | 2008-02-26 | Intel Corporation | State-based jitter buffer and method of operation |
US8520519B2 (en) * | 2002-09-20 | 2013-08-27 | Broadcom Corporation | External jitter buffer in a packet voice system |
JP3796240B2 (ja) | 2002-09-30 | 2006-07-12 | 三洋電機株式会社 | ネットワーク電話機および音声復号化装置 |
JP4146708B2 (ja) | 2002-10-31 | 2008-09-10 | 京セラ株式会社 | 通信システム、無線通信端末、データ配信装置及び通信方法 |
US6996626B1 (en) * | 2002-12-03 | 2006-02-07 | Crystalvoice Communications | Continuous bandwidth assessment and feedback for voice-over-internet-protocol (VoIP) comparing packet's voice duration and arrival rate |
KR100517237B1 (ko) | 2002-12-09 | 2005-09-27 | 한국전자통신연구원 | 직교 주파수 분할 다중화 무선 통신 시스템에서의채널품질 추정과 링크적응 방법 및 그 장치 |
US7525918B2 (en) * | 2003-01-21 | 2009-04-28 | Broadcom Corporation | Using RTCP statistics for media system control |
US7394833B2 (en) * | 2003-02-11 | 2008-07-01 | Nokia Corporation | Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification |
JP2004266724A (ja) | 2003-03-04 | 2004-09-24 | Matsushita Electric Ind Co Ltd | リアルタイム音声用バッファ制御装置 |
JP3825007B2 (ja) * | 2003-03-11 | 2006-09-20 | 沖電気工業株式会社 | ジッタバッファの制御方法 |
US7551671B2 (en) * | 2003-04-16 | 2009-06-23 | General Dynamics Decision Systems, Inc. | System and method for transmission of video signals using multiple channels |
JP2005057504A (ja) | 2003-08-05 | 2005-03-03 | Matsushita Electric Ind Co Ltd | データ通信装置及びデータ通信方法 |
CA2446469A1 (en) * | 2003-08-15 | 2005-02-15 | M-Stack Limited | Apparatus, and an associated method, for preserving communication service quality levels during hand-off of communications in a radio communication system |
US7596488B2 (en) | 2003-09-15 | 2009-09-29 | Microsoft Corporation | System and method for real-time jitter control and packet-loss concealment in an audio signal |
US7505764B2 (en) * | 2003-10-28 | 2009-03-17 | Motorola, Inc. | Method for retransmitting a speech packet |
US7272400B1 (en) * | 2003-12-19 | 2007-09-18 | Core Mobility, Inc. | Load balancing between users of a wireless base station |
US7424026B2 (en) * | 2004-04-28 | 2008-09-09 | Nokia Corporation | Method and apparatus providing continuous adaptive control of voice packet buffer at receiver terminal |
JP4076981B2 (ja) | 2004-08-09 | 2008-04-16 | Kddi株式会社 | 通信端末装置およびバッファ制御方法 |
US8085678B2 (en) * | 2004-10-13 | 2011-12-27 | Qualcomm Incorporated | Media (voice) playback (de-jitter) buffer adjustments based on air interface |
SG124307A1 (en) * | 2005-01-20 | 2006-08-30 | St Microelectronics Asia | Method and system for lost packet concealment in high quality audio streaming applications |
US8102872B2 (en) * | 2005-02-01 | 2012-01-24 | Qualcomm Incorporated | Method for discontinuous transmission and accurate reproduction of background noise information |
US20060187970A1 (en) * | 2005-02-22 | 2006-08-24 | Minkyu Lee | Method and apparatus for handling network jitter in a Voice-over IP communications network using a virtual jitter buffer and time scale modification |
US8355907B2 (en) | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
CA2603255C (en) * | 2005-04-01 | 2015-06-23 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband speech coding |
-
2005
- 2005-05-05 US US11/123,467 patent/US8155965B2/en active Active
-
2006
- 2006-03-10 TW TW095108057A patent/TWI389099B/zh active
- 2006-03-13 RU RU2007137643/09A patent/RU2371784C2/ru active
- 2006-03-13 EP EP06738524A patent/EP1856689A1/en not_active Withdrawn
- 2006-03-13 CA CA2600713A patent/CA2600713C/en active Active
- 2006-03-13 BR BRPI0607624-6A patent/BRPI0607624B1/pt active IP Right Grant
- 2006-03-13 WO PCT/US2006/009472 patent/WO2006099529A1/en active Application Filing
- 2006-03-13 SG SG201001616-0A patent/SG160380A1/en unknown
- 2006-03-13 JP JP2008501073A patent/JP5203923B2/ja active Active
- 2006-03-13 KR KR1020077022667A patent/KR100956623B1/ko active IP Right Grant
- 2006-03-13 MX MX2007011102A patent/MX2007011102A/es active IP Right Grant
- 2006-03-13 KR KR1020097022915A patent/KR100957265B1/ko active IP Right Grant
- 2006-03-13 AU AU2006222963A patent/AU2006222963C1/en active Active
-
2007
- 2007-09-11 IL IL185935A patent/IL185935A/en not_active IP Right Cessation
- 2007-10-10 NO NO20075180A patent/NO20075180L/no not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
AU2006222963B2 (en) | 2010-04-08 |
CA2600713A1 (en) | 2006-09-21 |
JP5203923B2 (ja) | 2013-06-05 |
KR100957265B1 (ko) | 2010-05-12 |
MX2007011102A (es) | 2007-11-22 |
IL185935A (en) | 2013-09-30 |
JP2008533529A (ja) | 2008-08-21 |
US8155965B2 (en) | 2012-04-10 |
NO20075180L (no) | 2007-10-31 |
TWI389099B (zh) | 2013-03-11 |
RU2371784C2 (ru) | 2009-10-27 |
KR100956623B1 (ko) | 2010-05-11 |
BRPI0607624A2 (pt) | 2009-09-22 |
KR20090119936A (ko) | 2009-11-20 |
US20060206334A1 (en) | 2006-09-14 |
AU2006222963A1 (en) | 2006-09-21 |
EP1856689A1 (en) | 2007-11-21 |
TW200638336A (en) | 2006-11-01 |
KR20070112832A (ko) | 2007-11-27 |
BRPI0607624B1 (pt) | 2019-03-26 |
CA2600713C (en) | 2012-05-22 |
SG160380A1 (en) | 2010-04-29 |
AU2006222963C1 (en) | 2010-09-16 |
WO2006099529A1 (en) | 2006-09-21 |
IL185935A0 (en) | 2008-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2007137643A (ru) | Изменение масштаба времени кадров в вокодере посредством изменения остатка | |
US11705137B2 (en) | Apparatus for encoding and decoding of integrated speech and audio | |
US6427135B1 (en) | Method for encoding speech wherein pitch periods are changed based upon input speech signal | |
RU2009110202A (ru) | Трансформация шкалы времени кадров в широкополосном вокодере | |
US8332213B2 (en) | Multi-reference LPC filter quantization and inverse quantization device and method | |
EP2272062B1 (en) | An audio signal classifier | |
US6732070B1 (en) | Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching | |
CN110444219B (zh) | 选择第一编码演算法或第二编码演算法的装置与方法 | |
CN103493129B (zh) | 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法 | |
EP1952400A1 (en) | Adaptive time/frequency-based audio encoding and decoding apparatuses and methods | |
JP6113278B2 (ja) | 改良された確率分布推定を使用する線形予測に基づくオーディオ符号化 | |
JP2002268690A (ja) | 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法 | |
CN105359211A (zh) | 语音处理的清音/浊音判决 | |
RU2486610C2 (ru) | Способ кодирования сигнала и способ декодирования сигнала | |
JP3628268B2 (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
KR20170003596A (ko) | 음성 정보를 갖는 개선된 프레임 손실 보정 | |
JP6644848B2 (ja) | ベクトル量子化装置、音声符号化装置、ベクトル量子化方法、及び音声符号化方法 | |
JPWO2014034697A1 (ja) | 復号方法、復号装置、プログラム、及びその記録媒体 | |
JP2613503B2 (ja) | 音声の励振信号符号化・復号化方法 | |
JPH0519795A (ja) | 音声の励振信号符号化・復号化方法 | |
CN1327410C (zh) | 语音编解码方法之间的代码转换方法及装置 | |
JP2004151424A (ja) | トランスコーダ及び符号変換方法 | |
KR101847213B1 (ko) | 쉐이핑 함수를 이용한 오디오 신호 디코딩 방법 및 장치 | |
JP3166697B2 (ja) | 音声符号化・復号装置及びシステム | |
JPH0844398A (ja) | 音声符号化装置 |