WO2022045395A1 - Procédé de correction de données audio et dispositif d'élimination de plosives - Google Patents
Procédé de correction de données audio et dispositif d'élimination de plosives Download PDFInfo
- Publication number
- WO2022045395A1 WO2022045395A1 PCT/KR2020/011488 KR2020011488W WO2022045395A1 WO 2022045395 A1 WO2022045395 A1 WO 2022045395A1 KR 2020011488 W KR2020011488 W KR 2020011488W WO 2022045395 A1 WO2022045395 A1 WO 2022045395A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- audio data
- plosive
- database
- correcting
- frequency domain
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Procédé de correction de données audio, pour éliminer des plosives, réalisé par un serveur pouvant comprendre les étapes consistant à : collecter des plosives et des sons purs, stocker une valeur de mise à l'échelle et construire une base de données ; recevoir des données audio comprenant un énoncé d'une personne spécifique provenant d'un terminal utilisateur comprenant ou connecté à un microphone ; extraire des données audio d'un segment comprenant des plosives à partir des données audio sur la base de la base de données ; réaliser une correction pour éliminer les plosives des données audio extraites sur la base de la base de données ; et transmettre les données audio corrigées au terminal utilisateur ou à un terminal d'écoute. Les sons purs sont des sons ne comprenant pas de plosives, et la valeur de mise à l'échelle est un rapport de valeur de sortie des plosives aux sons purs et est désignée comme valeur de correction pour éliminer les plosives des données audio.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/KR2020/011488 WO2022045395A1 (fr) | 2020-08-27 | 2020-08-27 | Procédé de correction de données audio et dispositif d'élimination de plosives |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/KR2020/011488 WO2022045395A1 (fr) | 2020-08-27 | 2020-08-27 | Procédé de correction de données audio et dispositif d'élimination de plosives |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022045395A1 true WO2022045395A1 (fr) | 2022-03-03 |
Family
ID=80355429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2020/011488 WO2022045395A1 (fr) | 2020-08-27 | 2020-08-27 | Procédé de correction de données audio et dispositif d'élimination de plosives |
Country Status (1)
Country | Link |
---|---|
WO (1) | WO2022045395A1 (fr) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2362390A1 (fr) * | 2010-02-12 | 2011-08-31 | Nxp B.V. | Suppression du bruit |
US20120321095A1 (en) * | 2003-02-21 | 2012-12-20 | Qnx Software Systems Limited | Signature Noise Removal |
KR20130123713A (ko) * | 2012-05-03 | 2013-11-13 | 현대모비스 주식회사 | 팝 노이즈 제거 방법 |
KR101406742B1 (ko) * | 2006-10-20 | 2014-06-12 | 오렌지 | 피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법 |
US10410623B2 (en) * | 2013-03-15 | 2019-09-10 | Xmos Inc. | Method and system for generating advanced feature discrimination vectors for use in speech recognition |
-
2020
- 2020-08-27 WO PCT/KR2020/011488 patent/WO2022045395A1/fr active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120321095A1 (en) * | 2003-02-21 | 2012-12-20 | Qnx Software Systems Limited | Signature Noise Removal |
KR101406742B1 (ko) * | 2006-10-20 | 2014-06-12 | 오렌지 | 피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법 |
EP2362390A1 (fr) * | 2010-02-12 | 2011-08-31 | Nxp B.V. | Suppression du bruit |
KR20130123713A (ko) * | 2012-05-03 | 2013-11-13 | 현대모비스 주식회사 | 팝 노이즈 제거 방법 |
US10410623B2 (en) * | 2013-03-15 | 2019-09-10 | Xmos Inc. | Method and system for generating advanced feature discrimination vectors for use in speech recognition |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6885735B2 (en) | System and method for transmitting voice input from a remote location over a wireless data channel | |
CN104731767B (zh) | 交流支援装置以及交流支援方法 | |
WO2020246649A1 (fr) | Procédé au moyen duquel un dispositif informatique périphérique reconnaît une voix | |
US20090070102A1 (en) | Speech recognition method, speech recognition system and server thereof | |
CN109599092B (zh) | 一种音频合成方法及装置 | |
Hirson et al. | Speech fundamental frequency over the telephone and face-to-face: Some implications for forensic phonetics1 | |
WO2020015270A1 (fr) | Procédé et appareil de séparation de signal vocal, dispositif informatique et support d'informations | |
WO2020246641A1 (fr) | Procédé de synthèse de la parole et dispositif de synthèse de la parole capables de déterminer une pluralité de locuteurs | |
US6823302B1 (en) | Real-time quality analyzer for voice and audio signals | |
CN110232553A (zh) | 会议支援系统以及计算机可读取的记录介质 | |
US10937429B1 (en) | Voice-based interactive network monitor system | |
WO2022045395A1 (fr) | Procédé de correction de données audio et dispositif d'élimination de plosives | |
Voran | Using articulation index band correlations to objectively estimate speech intelligibility consistent with the modified rhyme test | |
WO2021125592A1 (fr) | Procédé et système à base d'intelligence artificielle pour ajuster un appareil auditif intelligent actif | |
US9295423B2 (en) | System and method for audio kymographic diagnostics | |
CN103581934A (zh) | 一种终端语音质量评估方法和终端 | |
CN111554323A (zh) | 一种语音处理方法、装置、设备及存储介质 | |
JP4500458B2 (ja) | 音声及びオーディオ信号用リアルタイム品質アナライザ | |
US20240071411A1 (en) | Determining dialog quality metrics of a mixed audio signal | |
KR101952730B1 (ko) | 교신 내용을 보팅으로 선별하여 음성인식하는 무선 교신 시스템 | |
WO2017116022A1 (fr) | Appareil et procédé pour étendre la largeur de bande d'écouteur ayant un microphone intra-auriculaire | |
JPH02196373A (ja) | 音声送受信装置 | |
JP7055327B2 (ja) | 会話収集装置、会話収集システム及び会話収集方法 | |
JP2000067063A (ja) | 対話内容利用システム | |
CN110827845A (zh) | 录音方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 20951628 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 20951628 Country of ref document: EP Kind code of ref document: A1 |