RU2010136359A - Устройство и способ определения множества локальных частотных центров тяжести в спектре аудиосигнала - Google Patents

Устройство и способ определения множества локальных частотных центров тяжести в спектре аудиосигнала Download PDF

Info

Publication number
RU2010136359A
RU2010136359A RU2010136359/08A RU2010136359A RU2010136359A RU 2010136359 A RU2010136359 A RU 2010136359A RU 2010136359/08 A RU2010136359/08 A RU 2010136359/08A RU 2010136359 A RU2010136359 A RU 2010136359A RU 2010136359 A RU2010136359 A RU 2010136359A
Authority
RU
Russia
Prior art keywords
iteration
frequency
frequencies
spectrum
audio signal
Prior art date
Application number
RU2010136359/08A
Other languages
English (en)
Other versions
RU2490729C2 (ru
Inventor
Саша ДИШ (DE)
Саша ДИШ
Харальд ПОПП (DE)
Харальд ПОПП
Original Assignee
Фраунхофер-Гезелльшафт цур Фердерунг дер ангевандтен (DE)
Фраунхофер-Гезелльшафт цур Фердерунг дер ангевандтен
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт цур Фердерунг дер ангевандтен (DE), Фраунхофер-Гезелльшафт цур Фердерунг дер ангевандтен filed Critical Фраунхофер-Гезелльшафт цур Фердерунг дер ангевандтен (DE)
Publication of RU2010136359A publication Critical patent/RU2010136359A/ru
Application granted granted Critical
Publication of RU2490729C2 publication Critical patent/RU2490729C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Auxiliary Devices For Music (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Stereophonic System (AREA)
  • Transmitters (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

1. Определитель (100) множества частот локальных центров тяжести (132) спектра (102) аудиосигнала, включающий в себя: определитель (110) частоты смещения (112) для каждой частоты старта итерации из множества стартовых частот итерации на основании спектра (102) звукового сигнала, характеризующийся тем, что число дискретных значений спектра (102) превышает количество частот начала итерации; определитель частоты (120), определяющий новое множество стартовых частот итерации (122), увеличивая или уменьшая каждую частоту старта итерации из множества стартовых частот итерации на соответствующую вычисленную частоту смещения (112); и контроллер итерации (130), пересылающий новое множество стартовых частот итерации (122) на определитель смещения (110) для дальнейшего итерирования или формирующий совокупность частот локального центра тяжести (132), если выполнено заданное условие останова итерации, при этом совокупность частот локального центра тяжести (132) равна новому множеству стартовых частот итерации (122). ! 2. Устройство по п.1, характеризующееся тем, что определитель смещения (110) рассчитывает частоту смещения (112) для частоты старта итерации на основании множества дискретных значений спектра (102), соответствующих значений весового параметра и соответствующих значений параметра расстояния. ! 3. Устройство по п.2, характеризующееся тем, что значения параметра расстояния равномерно распределены на логарифмической шкале, все значения параметра расстояния меньше максимального значения расстояния. ! 4. Устройство по п.2, характеризующееся тем, что все значения весового параметра равны, или значения весового параметра уменьшаются для увеличени�

Claims (22)

1. Определитель (100) множества частот локальных центров тяжести (132) спектра (102) аудиосигнала, включающий в себя: определитель (110) частоты смещения (112) для каждой частоты старта итерации из множества стартовых частот итерации на основании спектра (102) звукового сигнала, характеризующийся тем, что число дискретных значений спектра (102) превышает количество частот начала итерации; определитель частоты (120), определяющий новое множество стартовых частот итерации (122), увеличивая или уменьшая каждую частоту старта итерации из множества стартовых частот итерации на соответствующую вычисленную частоту смещения (112); и контроллер итерации (130), пересылающий новое множество стартовых частот итерации (122) на определитель смещения (110) для дальнейшего итерирования или формирующий совокупность частот локального центра тяжести (132), если выполнено заданное условие останова итерации, при этом совокупность частот локального центра тяжести (132) равна новому множеству стартовых частот итерации (122).
2. Устройство по п.1, характеризующееся тем, что определитель смещения (110) рассчитывает частоту смещения (112) для частоты старта итерации на основании множества дискретных значений спектра (102), соответствующих значений весового параметра и соответствующих значений параметра расстояния.
3. Устройство по п.2, характеризующееся тем, что значения параметра расстояния равномерно распределены на логарифмической шкале, все значения параметра расстояния меньше максимального значения расстояния.
4. Устройство по п.2, характеризующееся тем, что все значения весового параметра равны, или значения весового параметра уменьшаются для увеличения абсолютных величин соответствующего параметра расстояния.
5. Устройство по п.1, характеризующееся тем, что определитель смещения (110) определяет частоту смещения (112) для каждой частоты старта итерации на основании спектра (102), где спектр (102) имеет логарифмическую шкалу.
6. Устройство по п.1, характеризующееся тем, что оно определяет совокупность частот локального центра тяжести (132) для каждого из последовательности временных блоков аудиосигнала.
7. Устройство по п.6, характеризующееся тем, что множество стартовых частот итерации инициализируется при равном удалении друг от друга на логарифмической шкале для пуска первой итерации временного блока из последовательности временных блоков.
8. Устройство по п.6, характеризующееся тем, что множество стартовых частот итерации для первой итерации временного блока основывается на совокупности частот локального центра тяжести (132), определенной для предшествующего временного блока.
9. Устройство по п.1, включающее в себя дополнитель частот (210), предназначенный для введения частоты старта итерации в новое множество стартовых частот итерации (122), если интервал между двумя смежными частотами старта итерации нового множества стартовых частот итерации (122) больше максимального интервала между частотами.
10. Устройство по п.1, включающее в себя совместитель частот (220), предназначенный для объединения двух смежных частот старта итерации из множества стартовых частот итерации (122), если частотный интервал между двумя смежными частотами старта итерации меньше минимального частотного интервала.
11. Устройство по п.10, характеризующееся тем, что совместитель частот (220) совмещает две смежные частоты старта итерации, заменяя их новой частотой старта итерации, расположенной между двумя смежными частотами старта итерации.
12. Устройство по п.1, включающее в себя частотный подавитель (230), предназначенный для удаления частоты старта итерации из нового множества стартовых частот итерации (122), если частота старта итерации выше заданной максимальной частоты спектра (102) аудиосигнала или если частота старта итерации ниже заданной минимальной частоты спектра (102) аудиосигнала.
13. Устройство по п.6, характеризующееся тем, что заданное условие останова итерации выполнено, если абсолютная величина суммы сдвига частоты, определенного для текущего временного блока, и сдвига частоты, определенного для предшествующего временного блока, для каждой частоты старта итерации меньше заданного порогового смещения.
14. Устройство по п.1, включающее в себя препроцессор (310), предназначенный, чтобы генерировать частотный спектр Фурье для временного блока аудиосигнала, генерировать сглаженный спектр на базе частотного спектра Фурье временного блока, генерировать спектр (102) звукового сигнала (302) для передачи на определитель смещения (110), деля частотный спектр Фурье на сглаженный спектр, преобразовывать спектр (102) в логарифмический масштаб и пересылать логарифмический спектр (102) на определитель смещения (110), или предназначенный, чтобы генерировать частотный спектр Фурье для временного блока аудиосигнала, преобразовывать частотный спектр Фурье (102) в логарифмический масштаб, генерировать сглаженный спектр на базе логарифмического частотного спектра Фурье временного блока, генерировать спектр (102) аудиосигнала (302) для передачи на определитель смещения (110), деля логарифмический частотный спектр Фурье на сглаженный спектр, и пересылать спектр (102) на определитель смещения (110).
15. Устройство по п.14, характеризующееся тем, что препроцессор (310) включает в себя фильтр, предназначенный для временного сглаживания частотного спектра Фурье, логарифмический частотный спектр Фурье и/или сглаженный спектр перед делением частотного спектра Фурье или логарифмического частотного спектра Фурье на сглаженный спектр.
16. Адаптивный банк фильтров (800) для фильтрации аудиосигнала (802), включающий в себя: определитель множества частот локального центра тяжести спектра звукового сигнала (802) по одному из пп.1-15; и совокупность полосовых фильтров (810) для фильтрации аудиосигнала (802) с получением отфильтрованного аудиосигнала (812) и для передачи отфильтрованного аудиосигнала (812), где центральная частота и ширина полосы пропускания каждого полосового фильтра из множества полосовых фильтров (810) зависит от множества частот локального центра тяжести (132).
17. Адаптивный банк фильтров сигнала по п.16, характеризующийся тем, что каждый полосовой фильтр из множества полосовых фильтров (810) соответствует определенной частоте локального центра тяжести, при этом центральная частота и ширина полосы пропускания полосового фильтра зависят от соответствующей частоты локального центра тяжести и от частот локальных центров тяжести, смежных с частотой коррелированного центра тяжести.
18. Адаптивный банк фильтров сигнала по п.16, характеризующийся тем, что ширина полосы пропускания совокупности полосовых фильтров (810) рассчитана так, чтобы весь спектр был охвачен без разрывов.
19. Фазовый вокодер, содержащий адаптивный банк фильтров сигнала по одному из пп.15-18.
20. Преобразователь (1100) аудиосигнала (1102) в параметрическое представление (1132), включающий в себя: определитель множества частот локального центра тяжести (132) спектра аудиосигнала (1102) по одному из пп.1-15; оцениватель полосы пропускания (1110) для оценивания информации (1112) о множестве полосовых фильтров (810) на основании множества частот локальных центров тяжести (132), при этом информация о множестве полосовых фильтров (810) состоит из данных о форме фильтра для определенного сегмента аудиосигнала, полоса пропускания каждого полосового фильтра индивидуальна на всем протяжении спектра звуковых частот; оцениватель модуляции (1120) для оценивания амплитудной модуляции (1122), или частотной модуляции (1124), или фазовой модуляции (1124) для каждой полосы множества полосовых фильтров (810) для каждого сегмента аудиосигнала с использованием информации (1112) о множестве полосовых фильтров (810); и выходной интерфейс (1130) для передачи, хранения или редактирования данных по амплитудной модуляции, частотной модуляции или фазовой модуляции или данных о множестве полосовых фильтров (810) для каждого сегмента акустического сигнала.
21. Способ (1400) определения множества частот локального центра тяжести спектра аудиосигнала, состоящий в определении (1410) частоты смещения для каждой частоты старта итерации из множества стартовых частот итерации на основании спектра аудиосигнала, где число дискретных значений спектра больше количества частот старта итерации; определении (1420) нового множества стартовых частот итерации увеличением или уменьшением каждой частоты старта итерации из множества стартовых частот итерации на соответствующую вычисленную частоту смещения; и передаче (1430) нового множества стартовых частот итерации для дальнейшего итерирования или формирования (1440) совокупности частот локального центра тяжести, если достигнут заданный предел итерации, когда множество частот локального центра тяжести равно новому множеству стартовых частот итерации.
22. Компьютерная программа с кодом программы для осуществления способа по п.21, при условии выполнения компьютерной программы на компьютере или микроконтроллере.
RU2010136359/08A 2009-04-03 2010-03-18 Устройство и способ определения множества локальных частотных центров тяжести в спектре аудиосигнала RU2490729C2 (ru)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US16656209P 2009-04-03 2009-04-03
US61/166562 2009-04-03
US61/166,562 2009-04-03
EP09011091A EP2237266A1 (en) 2009-04-03 2009-08-28 Apparatus and method for determining a plurality of local center of gravity frequencies of a spectrum of an audio signal
EP09011091.7 2009-08-28
PCT/EP2010/053574 WO2010112348A1 (en) 2009-04-03 2010-03-18 Apparatus and method for determining a plurality of local center of gravity frequencies of a spectrum of an audio signal

Publications (2)

Publication Number Publication Date
RU2010136359A true RU2010136359A (ru) 2012-03-10
RU2490729C2 RU2490729C2 (ru) 2013-08-20

Family

ID=41328588

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2010136359/08A RU2490729C2 (ru) 2009-04-03 2010-03-18 Устройство и способ определения множества локальных частотных центров тяжести в спектре аудиосигнала

Country Status (12)

Country Link
US (1) US8996363B2 (ru)
EP (2) EP2237266A1 (ru)
JP (1) JP5283757B2 (ru)
KR (1) KR101264486B1 (ru)
CN (1) CN102027533B (ru)
AU (1) AU2010219353B2 (ru)
BR (1) BRPI1001241B1 (ru)
CA (1) CA2721402C (ru)
HK (1) HK1165602A1 (ru)
MX (1) MX2010011863A (ru)
RU (1) RU2490729C2 (ru)
WO (1) WO2010112348A1 (ru)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101701759B1 (ko) 2009-09-18 2017-02-03 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체
FR2956743B1 (fr) * 2010-02-25 2012-10-05 Inst Francais Du Petrole Procede non intrusif de determination de l'impedance electrique d'une batterie
FR2961938B1 (fr) * 2010-06-25 2013-03-01 Inst Nat Rech Inf Automat Synthetiseur numerique audio ameliore
US8855322B2 (en) * 2011-01-12 2014-10-07 Qualcomm Incorporated Loudness maximization with constrained loudspeaker excursion
GB2488768A (en) * 2011-03-07 2012-09-12 Rhodia Operations Treatment of hydrocarbon-containing systems
EP2631906A1 (en) * 2012-02-27 2013-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Phase coherence control for harmonic signals in perceptual audio codecs
EP2720222A1 (en) * 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
EP3171362B1 (en) * 2015-11-19 2019-08-28 Harman Becker Automotive Systems GmbH Bass enhancement and separation of an audio signal into a harmonic and transient signal component
CN109427345B (zh) * 2017-08-29 2022-12-02 杭州海康威视数字技术股份有限公司 一种风噪检测方法、装置及系统
JP2019106575A (ja) * 2017-12-08 2019-06-27 ルネサスエレクトロニクス株式会社 無線受信機、及び中間周波数信号生成方法
KR102277952B1 (ko) * 2019-01-11 2021-07-19 브레인소프트주식회사 디제이 변환에 의한 주파수 추출 방법
WO2020178322A1 (en) * 2019-03-06 2020-09-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for converting a spectral resolution
CN112666547B (zh) * 2020-12-11 2024-03-19 北京理工大学 一种无线电多普勒信号频率提取和脱靶量测量方法
CN114236231A (zh) * 2021-12-08 2022-03-25 湖南艾科诺维科技有限公司 一种载波频率估计方法、系统及介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5633499A (en) * 1995-11-21 1997-05-27 Trionix Research Laboratory, Inc. Scatter elimination technique and apparatus in radionuclide emission and transmission imaging in a nuclear camera
DE69840791D1 (de) * 1997-06-02 2009-06-10 Joseph A Izatt Doppler-abbildung einer strömung mittels optischer kohaerenztomografie
RU2174714C2 (ru) * 1998-05-12 2001-10-10 Научно-технический центр "Вычислительная техника" Способ выделения основного тона
WO2001071366A2 (en) * 2000-03-17 2001-09-27 The Board Of Regents Of The University Of Texas System Power spectral strain estimators in elastography
EP1403783A3 (en) 2002-09-24 2005-01-19 Matsushita Electric Industrial Co., Ltd. Audio signal feature extraction
JP2004334160A (ja) * 2002-09-24 2004-11-25 Matsushita Electric Ind Co Ltd 特徴量抽出装置
US8219392B2 (en) * 2005-12-05 2012-07-10 Qualcomm Incorporated Systems, methods, and apparatus for detection of tonal components employing a coding operation with monotone function
KR100653643B1 (ko) 2006-01-26 2006-12-05 삼성전자주식회사 하모닉과 비하모닉의 비율을 이용한 피치 검출 방법 및피치 검출 장치

Also Published As

Publication number Publication date
US20120008799A1 (en) 2012-01-12
AU2010219353B2 (en) 2011-10-06
RU2490729C2 (ru) 2013-08-20
KR20110002089A (ko) 2011-01-06
AU2010219353A1 (en) 2010-10-21
BRPI1001241A2 (pt) 2017-06-13
EP2401740A1 (en) 2012-01-04
EP2401740B1 (en) 2013-01-16
JP5283757B2 (ja) 2013-09-04
JP2012507055A (ja) 2012-03-22
WO2010112348A1 (en) 2010-10-07
CA2721402A1 (en) 2010-10-07
KR101264486B1 (ko) 2013-05-15
HK1165602A1 (en) 2012-10-05
MX2010011863A (es) 2010-11-30
CN102027533B (zh) 2012-11-07
CN102027533A (zh) 2011-04-20
BRPI1001241B1 (pt) 2021-02-23
US8996363B2 (en) 2015-03-31
CA2721402C (en) 2014-08-26
EP2237266A1 (en) 2010-10-06

Similar Documents

Publication Publication Date Title
RU2010136359A (ru) Устройство и способ определения множества локальных частотных центров тяжести в спектре аудиосигнала
JP6718681B2 (ja) センサ装置、センサネットワークシステム、およびデータ圧縮方法
CN110326308B (zh) 失真感测、防失真、以及失真察觉低音增强
JP4675888B2 (ja) ハウリング検出装置およびその方法
JP2005521361A5 (ru)
EP2337376A1 (en) Loop gain estimating apparatus and howling preventing apparatus
KR20130117750A (ko) 컴퓨테이셔널 청각 장면 분석에 기초한 단청 노이즈 억제
ATE379833T1 (de) Vorrichtungen und verfahren zur bestimmung von leistungswerten für die geräuschunterdrückung für ein sprachkommunikationssystem
CA2990328C (en) Voice activity modification frame acquiring method, and voice activity detection method and apparatus
EP3968322A3 (en) Frequency band extending device and method, encoding device and method, decoding device and method, and program
WO2008041596A1 (en) Audio encoding device5 audio decoding device, audio encoding method, audio decoding method, and information recording
EP3118852B1 (en) Method and device for detecting audio signal
US8744846B2 (en) Procedure for processing noisy speech signals, and apparatus and computer program therefor
RU2018114673A (ru) Обработка аудиосигнала
JP2013500498A (ja) 音声品質の評価のための方法、コンピュータ、コンピュータプログラム、およびコンピュータプログラム製品
CN109195050A (zh) 一种前馈滤波器设计方法及降噪耳机
CN104994249A (zh) 声回波消除方法和装置
US20160217787A1 (en) Speech recognition apparatus and speech recognition method
ATE443976T1 (de) Verfahren zum entwurf eines modalen entzerrers für einen niederfrequenten hörbaren bereich insbesondere für dicht positionierte moden
CN110148421B (zh) 一种残余回声检测方法、终端和装置
WO2013136742A1 (ja) 車載通話装置
CN111796790A (zh) 一种音效调节方法、装置、可读存储介质及终端设备
CN112365900B (zh) 一种语音信号增强方法、装置、介质和设备
JP5774191B2 (ja) オーディオ信号において卓越周波数を減衰させるための方法および装置
EP2230664B1 (en) Method and apparatus for attenuating noise in an input signal