DE60319796T2 - Rauschreduzierung und audiovisuelle Sprachaktivitätsdetektion - Google Patents

Rauschreduzierung und audiovisuelle Sprachaktivitätsdetektion Download PDF

Info

Publication number
DE60319796T2
DE60319796T2 DE2003619796 DE60319796T DE60319796T2 DE 60319796 T2 DE60319796 T2 DE 60319796T2 DE 2003619796 DE2003619796 DE 2003619796 DE 60319796 T DE60319796 T DE 60319796T DE 60319796 T2 DE60319796 T2 DE 60319796T2
Authority
DE
Germany
Prior art keywords
speaker
audio
noise reduction
speech
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE2003619796
Other languages
German (de)
English (en)
Other versions
DE60319796D1 (de
Inventor
Morio Taneda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Mobile Communications AB
Original Assignee
Sony Ericsson Mobile Communications AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Ericsson Mobile Communications AB filed Critical Sony Ericsson Mobile Communications AB
Publication of DE60319796D1 publication Critical patent/DE60319796D1/de
Application granted granted Critical
Publication of DE60319796T2 publication Critical patent/DE60319796T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Circuit For Audible Band Transducer (AREA)
DE2003619796 2003-01-24 2003-10-02 Rauschreduzierung und audiovisuelle Sprachaktivitätsdetektion Expired - Lifetime DE60319796T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03001637 2003-01-24
EP03001637 2003-01-24

Publications (2)

Publication Number Publication Date
DE60319796D1 DE60319796D1 (de) 2008-04-30
DE60319796T2 true DE60319796T2 (de) 2009-05-20

Family

ID=36094003

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2003619796 Expired - Lifetime DE60319796T2 (de) 2003-01-24 2003-10-02 Rauschreduzierung und audiovisuelle Sprachaktivitätsdetektion

Country Status (3)

Country Link
CN (1) CN100356446C (zh)
AT (1) ATE389934T1 (zh)
DE (1) DE60319796T2 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101656070B (zh) * 2008-08-22 2012-01-04 展讯通信(上海)有限公司 一种语音检测方法
CN102682273A (zh) * 2011-03-18 2012-09-19 夏普株式会社 嘴唇运动检测设备和方法
CN103325385B (zh) 2012-03-23 2018-01-26 杜比实验室特许公司 语音通信方法和设备、操作抖动缓冲器的方法和设备
CN102646418B (zh) * 2012-03-29 2014-07-23 北京华夏电通科技股份有限公司 一种远程音频交互的多路声学回音消除方法及系统
ES2790733T3 (es) * 2013-01-29 2020-10-29 Fraunhofer Ges Forschung Codificadores de audio, decodificadores de audio, sistemas, métodos y programas informáticos que utilizan una resolución temporal aumentada en la proximidad temporal de inicios o finales de fricativos o africados
CN103617801B (zh) * 2013-12-18 2017-09-29 联想(北京)有限公司 语音检测方法、装置及电子设备
CN105321523A (zh) * 2014-07-23 2016-02-10 中兴通讯股份有限公司 噪音抑制方法和装置
CN104133404B (zh) * 2014-07-23 2016-09-07 株洲南车时代电气股份有限公司 一种信号处理方法及装置
JP6230726B2 (ja) * 2014-12-18 2017-11-15 三菱電機株式会社 音声認識装置および音声認識方法
CN104537227B (zh) * 2014-12-18 2017-06-30 中国科学院上海高等研究院 变电站噪声分离方法
CN106155707B (zh) * 2015-03-23 2020-02-21 联想(北京)有限公司 信息处理方法及电子设备
CN104991754B (zh) * 2015-06-29 2018-03-16 小米科技有限责任公司 录音方法及装置
KR102209689B1 (ko) * 2015-09-10 2021-01-28 삼성전자주식회사 음향 모델 생성 장치 및 방법, 음성 인식 장치 및 방법
CN106443071B (zh) * 2016-09-20 2019-09-13 中国科学院上海微系统与信息技术研究所 噪声可识别的高量程加速度传感器共振频率的提取方法
US10475465B2 (en) * 2017-07-03 2019-11-12 Yissum Research Development Company, of The Hebrew University of Jerusalem Ltd. Method and system for enhancing a speech signal of a human speaker in a video using visual information
CN108521516A (zh) * 2018-03-30 2018-09-11 百度在线网络技术(北京)有限公司 用于终端设备的控制方法和装置
CN109040641B (zh) * 2018-08-30 2020-10-16 维沃移动通信有限公司 一种视频数据合成方法及装置
CN111768760B (zh) * 2020-05-26 2023-04-18 云知声智能科技股份有限公司 一种多模态语音端点检测方法及装置
CN111899723A (zh) * 2020-08-28 2020-11-06 北京地平线机器人技术研发有限公司 语音激活状态检测方法和装置
CN112289340B (zh) * 2020-11-03 2024-05-07 北京猿力未来科技有限公司 音频检测方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001296459A1 (en) * 2000-10-02 2002-04-15 Clarity, L.L.C. Audio visual speech processing
US6792107B2 (en) * 2001-01-26 2004-09-14 Lucent Technologies Inc. Double-talk detector suitable for a telephone-enabled PC
DE10120168A1 (de) * 2001-04-18 2002-10-24 Deutsche Telekom Ag Verfahren zur Bestimmung von Intensitätskennwerten von Hintergrundgeräuschen in Sprachpausen von Sprachsignalen

Also Published As

Publication number Publication date
DE60319796D1 (de) 2008-04-30
CN1742322A (zh) 2006-03-01
ATE389934T1 (de) 2008-04-15
CN100356446C (zh) 2007-12-19

Similar Documents

Publication Publication Date Title
DE60319796T2 (de) Rauschreduzierung und audiovisuelle Sprachaktivitätsdetektion
US7684982B2 (en) Noise reduction and audio-visual speech activity detection
DE602004003443T2 (de) Sprachperiodenerkennung basierend auf Elektromyographie
DE60031354T2 (de) Geräuschunterdrückung vor der Sprachkodierung
DE60027438T2 (de) Verbesserung eines verrauschten akustischen signals
DE19948308C2 (de) Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung
Lim et al. Enhancement and bandwidth compression of noisy speech
DE602005001048T2 (de) Erweiterung der Bandbreite eines schmalbandigen Sprachsignals
DE60104091T2 (de) Verfahren und Vorrichtung zur Sprachverbesserung in verrauschte Umgebung
DE69124005T2 (de) Sprachsignalverarbeitungsvorrichtung
DE69131739T2 (de) Einrichtung zur Sprachsignalverarbeitung für die Bestimmung eines Sprachsignals in einem verrauschten Sprachsignal
DE69627580T2 (de) Verfahren zur Rauschverminderung in einem Sprachsignal
DE60116255T2 (de) Rauschunterdückungsvorrichtung und -verfahren
DE602005000539T2 (de) Verstärkungsgesteuerte Geräuschunterdrückung
DE69720087T2 (de) Verfahren und Vorrichtung zur Unterdrückung von Hintergrundmusik oder -geräuschen im Eingangssignal eines Spracherkenners
DE112011105791B4 (de) Störungsunterdrückungsvorrichtung
DE10030105A1 (de) Spracherkennungseinrichtung
DE112011106045B4 (de) Audiosignal-Wiederherstellungsvorrichtung und Audiosignal-Wiederherstellungsverfahren
DE69635141T2 (de) Verfahren zur Erzeugung von Sprachmerkmalsignalen und Vorrichtung zu seiner Durchführung
DE112007003625T5 (de) Echounterdrückungsvorrichtung, echounterdrückungssystem, Echounterdrückungsverfahren und Computerprogramm
DE60107072T2 (de) Robuste merkmale für die erkennung von verrauschten sprachsignalen
DE102019201456B3 (de) Verfahren für eine individualisierte Signalverarbeitung eines Audiosignals eines Hörgerätes
Mesgarani et al. Speech enhancement based on filtering the spectrotemporal modulations
WO2001047335A2 (de) Verfahren zur elimination von störsignalanteilen in einem eingangssignal eines auditorischen systems, anwendung des verfahrens und ein hörgerät
DE102016003401B4 (de) Erfassungsvorrichtung und Verfahren zum Erfassen einer Sprachäußerung einer sprechenden Person in einem Kraftfahrzeug

Legal Events

Date Code Title Description
8381 Inventor (new situation)

Inventor name: TANEDA, MORIO, 85609 ASCHHEIM, DE

8328 Change in the person/name/address of the agent

Representative=s name: PATENT- UND RECHTSANWAELTE KRAUS & WEISERT, 80539

8364 No opposition during term of opposition