WO2022045395A1 - Procédé de correction de données audio et dispositif d'élimination de plosives - Google Patents

Procédé de correction de données audio et dispositif d'élimination de plosives Download PDF

Info

Publication number
WO2022045395A1
WO2022045395A1 PCT/KR2020/011488 KR2020011488W WO2022045395A1 WO 2022045395 A1 WO2022045395 A1 WO 2022045395A1 KR 2020011488 W KR2020011488 W KR 2020011488W WO 2022045395 A1 WO2022045395 A1 WO 2022045395A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio data
plosive
database
correcting
frequency domain
Prior art date
Application number
PCT/KR2020/011488
Other languages
English (en)
Korean (ko)
Inventor
임재윤
Original Assignee
임재윤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 임재윤 filed Critical 임재윤
Priority to PCT/KR2020/011488 priority Critical patent/WO2022045395A1/fr
Publication of WO2022045395A1 publication Critical patent/WO2022045395A1/fr

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Procédé de correction de données audio, pour éliminer des plosives, réalisé par un serveur pouvant comprendre les étapes consistant à : collecter des plosives et des sons purs, stocker une valeur de mise à l'échelle et construire une base de données ; recevoir des données audio comprenant un énoncé d'une personne spécifique provenant d'un terminal utilisateur comprenant ou connecté à un microphone ; extraire des données audio d'un segment comprenant des plosives à partir des données audio sur la base de la base de données ; réaliser une correction pour éliminer les plosives des données audio extraites sur la base de la base de données ; et transmettre les données audio corrigées au terminal utilisateur ou à un terminal d'écoute. Les sons purs sont des sons ne comprenant pas de plosives, et la valeur de mise à l'échelle est un rapport de valeur de sortie des plosives aux sons purs et est désignée comme valeur de correction pour éliminer les plosives des données audio.
PCT/KR2020/011488 2020-08-27 2020-08-27 Procédé de correction de données audio et dispositif d'élimination de plosives WO2022045395A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/KR2020/011488 WO2022045395A1 (fr) 2020-08-27 2020-08-27 Procédé de correction de données audio et dispositif d'élimination de plosives

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/KR2020/011488 WO2022045395A1 (fr) 2020-08-27 2020-08-27 Procédé de correction de données audio et dispositif d'élimination de plosives

Publications (1)

Publication Number Publication Date
WO2022045395A1 true WO2022045395A1 (fr) 2022-03-03

Family

ID=80355429

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/011488 WO2022045395A1 (fr) 2020-08-27 2020-08-27 Procédé de correction de données audio et dispositif d'élimination de plosives

Country Status (1)

Country Link
WO (1) WO2022045395A1 (fr)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2362390A1 (fr) * 2010-02-12 2011-08-31 Nxp B.V. Suppression du bruit
US20120321095A1 (en) * 2003-02-21 2012-12-20 Qnx Software Systems Limited Signature Noise Removal
KR20130123713A (ko) * 2012-05-03 2013-11-13 현대모비스 주식회사 팝 노이즈 제거 방법
KR101406742B1 (ko) * 2006-10-20 2014-06-12 오렌지 피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법
US10410623B2 (en) * 2013-03-15 2019-09-10 Xmos Inc. Method and system for generating advanced feature discrimination vectors for use in speech recognition

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120321095A1 (en) * 2003-02-21 2012-12-20 Qnx Software Systems Limited Signature Noise Removal
KR101406742B1 (ko) * 2006-10-20 2014-06-12 오렌지 피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법
EP2362390A1 (fr) * 2010-02-12 2011-08-31 Nxp B.V. Suppression du bruit
KR20130123713A (ko) * 2012-05-03 2013-11-13 현대모비스 주식회사 팝 노이즈 제거 방법
US10410623B2 (en) * 2013-03-15 2019-09-10 Xmos Inc. Method and system for generating advanced feature discrimination vectors for use in speech recognition

Similar Documents

Publication Publication Date Title
US6885735B2 (en) System and method for transmitting voice input from a remote location over a wireless data channel
CN104731767B (zh) 交流支援装置以及交流支援方法
WO2020246649A1 (fr) Procédé au moyen duquel un dispositif informatique périphérique reconnaît une voix
US20090070102A1 (en) Speech recognition method, speech recognition system and server thereof
CN109599092B (zh) 一种音频合成方法及装置
Hirson et al. Speech fundamental frequency over the telephone and face-to-face: Some implications for forensic phonetics1
WO2020015270A1 (fr) Procédé et appareil de séparation de signal vocal, dispositif informatique et support d'informations
WO2020246641A1 (fr) Procédé de synthèse de la parole et dispositif de synthèse de la parole capables de déterminer une pluralité de locuteurs
US6823302B1 (en) Real-time quality analyzer for voice and audio signals
CN110232553A (zh) 会议支援系统以及计算机可读取的记录介质
US10937429B1 (en) Voice-based interactive network monitor system
WO2022045395A1 (fr) Procédé de correction de données audio et dispositif d'élimination de plosives
Voran Using articulation index band correlations to objectively estimate speech intelligibility consistent with the modified rhyme test
WO2021125592A1 (fr) Procédé et système à base d'intelligence artificielle pour ajuster un appareil auditif intelligent actif
US9295423B2 (en) System and method for audio kymographic diagnostics
CN103581934A (zh) 一种终端语音质量评估方法和终端
CN111554323A (zh) 一种语音处理方法、装置、设备及存储介质
JP4500458B2 (ja) 音声及びオーディオ信号用リアルタイム品質アナライザ
US20240071411A1 (en) Determining dialog quality metrics of a mixed audio signal
KR101952730B1 (ko) 교신 내용을 보팅으로 선별하여 음성인식하는 무선 교신 시스템
WO2017116022A1 (fr) Appareil et procédé pour étendre la largeur de bande d'écouteur ayant un microphone intra-auriculaire
JPH02196373A (ja) 音声送受信装置
JP7055327B2 (ja) 会話収集装置、会話収集システム及び会話収集方法
JP2000067063A (ja) 対話内容利用システム
CN110827845A (zh) 录音方法、装置、设备及存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20951628

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20951628

Country of ref document: EP

Kind code of ref document: A1