CN110503974A - 对抗语音识别方法、装置、设备及计算机可读存储介质 - Google Patents

对抗语音识别方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110503974A
CN110503974A CN201910805939.8A CN201910805939A CN110503974A CN 110503974 A CN110503974 A CN 110503974A CN 201910805939 A CN201910805939 A CN 201910805939A CN 110503974 A CN110503974 A CN 110503974A
Authority
CN
China
Prior art keywords
voice signal
euclidean distance
identified
noise reduction
confrontation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910805939.8A
Other languages
English (en)
Other versions
CN110503974B (zh
Inventor
李夫路
梁爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN201910805939.8A priority Critical patent/CN110503974B/zh
Publication of CN110503974A publication Critical patent/CN110503974A/zh
Application granted granted Critical
Publication of CN110503974B publication Critical patent/CN110503974B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明提供一种对抗语音识别方法、装置、设备及计算机可读存储介质,方法包括:获取待识别语音信号;通过预设的第一降噪算法对所述待识别语音信号进行降噪处理,获得第一目标语音信号,通过预设的第二降噪算法对所述待识别语音信号进行降噪处理,获得第二目标语音信号;分别计算所述待识别语音信号以及所述第一目标语音信号以及第二目标语音信号对应的向量信息;根据所述向量信息确定所述待识别语音信号对应的目标欧式距离;根据所述目标欧式距离以及预设的欧式距离阈值确定所述待识别语音信号是否为对抗语音信号。从而能够精准地确定该待识别语音信号是否为对抗语音,进而能够避免对抗语音导致的用户无法获取到正确的信息的问题。

Description

对抗语音识别方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及区块链领域,尤其涉及一种对抗语音识别方法、装置、设备及计算机可读存储介质。
背景技术
对抗语音即为可以用于定向攻击或非定向攻击的语音信号,具体地,给定一个声波x,可以造出一个干扰项δ,让x+δ能够被机器识别成与语音x本义完全不同的文本。非定向攻击可能将一段被干扰的语音识别成一段乱码,而针对性对抗攻击则危险的多,因为这种攻击通常会诱导模型产生攻击者想要的错误。例如黑客只需在「我去中央公园散步」的语音信号中加入一些难以察觉的噪音,模型就会将该语音信号转换为随机乱码、静音、甚至像「立即打911!」这样的句子。因此,当语音信号中存在对抗语音时,往往会造成信息无法正常被传输,进而导致用户无法获取到正确的信息。
为了提高语音信号的安全性,如何对语音信号中的对抗语音进行识别即成为了亟待解决的问题。
发明内容
本发明提供一种对抗语音识别方法、装置、设备及计算机可读存储介质,用于解决当语音信号中包括对抗语音时,造成信息无法正常被传输,进而导致用户无法获取到正确的信息的技术问题。
本发明的第一个方面是提供一种对抗语音识别方法,包括:
获取待识别语音信号;
通过预设的第一降噪算法对所述待识别语音信号进行降噪处理,获得第一目标语音信号,通过预设的第二降噪算法对所述待识别语音信号进行降噪处理,获得第二目标语音信号;
分别计算所述待识别语音信号以及所述第一目标语音信号以及第二目标语音信号对应的向量信息;
根据所述向量信息确定所述待识别语音信号对应的目标欧式距离;
根据所述目标欧式距离以及预设的欧式距离阈值确定所述待识别语音信号是否为对抗语音信号。
本发明的另一个方面是提供一种对抗语音识别装置,包括:
获取模块,用于获取待识别语音信号;
降噪模块,用于通过预设的第一降噪算法对所述待识别语音信号进行降噪处理,获得第一目标语音信号,通过预设的第二降噪算法对所述待识别语音信号进行降噪处理,获得第二目标语音信号;
向量信息计算模块,用于分别计算所述待识别语音信号以及所述第一目标语音信号以及第二目标语音信号对应的向量信息;
目标欧式距离计算模块,用于根据所述向量信息确定所述待识别语音信号对应的目标欧式距离;
确定模块,用于根据所述目标欧式距离以及预设的欧式距离阈值确定所述待识别语音信号是否为对抗语音信号。
本发明的又一个方面是提供一种对抗语音识别设备,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为由所述处理器执行如第一方面所述的对抗语音识别方法。
本发明的又一个方面是提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的对抗语音识别方法。
本发明提供的对抗语音识别方法、装置、设备及计算机可读存储介质,通过获取待识别语音信号,对该待识别语音信号进行降噪处理,确定降噪处理后的待识别语音信号对应的目标欧式距离,将该目标欧式距离与预设的欧氏距离阈值进行比较,从而能够精准地确定该待识别语音信号是否为对抗语音,进而能够避免对抗语音导致的用户无法获取到正确的信息的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的对抗语音识别方法的流程示意图;
图2为本发明实施例二提供的对抗语音识别方法的流程示意图;
图3为本发明实施例三提供的对抗语音识别装置的结构示意图;
图4为本发明实施例四提供的对抗语音识别设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例所获得的所有其他实施例,都属于本发明保护的范围。
针对上述提及的当语音信号中包括对抗语音时,造成信息无法正常被传输,进而导致用户无法获取到正确的信息的技术问题,本发明提供了一种对抗语音识别方法、装置、设备及计算机可读存储介质。
需要说明的是,本申请提供对抗语音识别方法、装置、设备及计算机可读存储介质可运用在对任意一种对抗语音信号识别的场景中。
本发明基于的网络架构至少包括:对抗语音识别装置以及区块链。其中,对抗语音识别装置采用C/C++、Java、Shell或Python等语言编写;对抗语音识别装置能够在区块链中获取区块链中存储的语音信号。该区块链中具有多个节点,每个节点均可以在区块链中上传语音信号进行存储,其中,该语音信号中包括正常语音信号以及对抗语音信号。
图1为本发明实施例一提供的对抗语音识别方法的流程示意图,如图1所示,所述方法包括:
步骤101、获取待识别语音信号;
步骤102、通过预设的第一降噪算法对所述待识别语音信号进行降噪处理,获得第一目标语音信号,通过预设的第二降噪算法对所述待识别语音信号进行降噪处理,获得第二目标语音信号;
步骤103、分别计算所述待识别语音信号以及所述第一目标语音信号以及第二目标语音信号对应的向量信息;
步骤104、根据所述向量信息确定所述待识别语音信号对应的目标欧式距离;
步骤105、根据所述目标欧式距离以及预设的欧式距离阈值确定所述待识别语音信号是否为对抗语音信号。
在本实施例中,首先可以获取待识别语音信号,为了确定该待识别语音信号是否为对抗语音信号,可以通过预设的第一降噪算法以及第二降噪算法分别对该待识别语音信号进行降噪处理。其中,采用第一降噪算法对待识别语音信号进行降噪后,获得第一目标语音信号,采用第二降噪算法对待识别语音信号进行降噪之后,获得第二目标信号。为了方便计算,可以将上述语音信号转换为向量信息,具体地,可以分别计算待识别语音信号、第一目标语音信号以及第二目标语音信号对应的向量信息。其中,可以采用任意一种方式实现对上述各语音信号进行向量转换,本发明在此不做限制。进一步地,可以根据待识别语音信号、第一目标语音信号以及第二目标语音信号对应的向量信息计算待识别语音信号对应的目标欧式距离。将该目标欧式距离与预设的欧式距离阈值进行比较,根据比较结果即能够精准地确定该待识别语音信号是否为对抗语音信号。
具体地,在上述任一实施例的基础上,所述第一降噪算法为减谱法,所述第二降噪算法为维纳滤波法,相应地,步骤102具体包括:
通过减谱法对所述待识别语音信号进行降噪处理,获得第一目标语音信号;
通过维纳滤波法对所述待识别语音信号进行降噪处理,获得第二目标语音信号。
在本实施例中,第一降噪算法可以为减谱法,第二降噪算法可以为维纳滤波法。相应地,可以通过减谱法对待识别语音信号进行降噪处理,获得第一目标信号,通过维纳滤波法对该待识别语音信号进行降噪处理,获得第二目标信号。通过采用不同的降噪算法对待识别语音信号进行降噪处理,能够提高后续对抗语音信号识别的精准度。
进一步地,在上述任一实施例的基础上,步骤104具体包括:
判断所述目标欧式距离是否大于预设的欧式距离阈值;
若是,则判定所述待识别语音信号为对抗语音信号;
若否,则判定所述待处理信号为正常语音信号。
在本实施例中,可以预先设置有欧式距离阈值,根据待识别语音信号、第一目标语音信号以及第二目标语音信号对应的向量信息计算待识别语音信号对应的目标欧式距离之后,可以该目标欧式距离与预设的欧式距离阈值进行比较,根据比较结果即能够精准地确定该待识别语音信号是否为对抗语音信号。具体地,若检测到目标欧氏距离大于该欧氏距离阈值,则可以判定该待识别语音信号为对抗语音信号,反之,则可以判定该待识别语音信号为正常语音信号。从而通过简单的阈值比对即能够快速地对待识别语音信号的类型进行判定,提高待识别语音信号的识别效率。
相应地,在上述任一实施例的基础上,步骤105之后,还包括:
若所述待识别语音信号为对抗语音信号,则发出报警信号。
在本实施例中,为了使用户及时对对抗语音信号进行了解,当检测到待识别语音信号为对抗语音信号时,可以发出报警信号。该报警信号具体可以为邮件、短信、推送等方式发送至用户终端,也可以为声音报警等,本发明在此不做限制。从而用户能够对对抗语音信号及时发现,及时处理,有效避免了由于对抗语音信号造成信息接收有误的问题。
本发明提供的对抗语音识别方法,通过获取待识别语音信号,对该待识别语音信号进行降噪处理,确定降噪处理后的待识别语音信号对应的目标欧式距离,将该目标欧式距离与预设的欧氏距离阈值进行比较,从而能够精准地确定该待识别语音信号是否为对抗语音,进而能够避免对抗语音导致的用户无法获取到正确的信息的问题。
进一步地,在上述任一实施例的基础上,步骤103具体包括:
计算所述待识别语音信号对应的第一向量信息、所述第一目标语音信号对应的第二向量信息以及第二目标语音信号对应的第三向量信息;
相应地,步骤104具体包括:
分别计算所述第二向量信息以及所述第三向量信息与所述第一向量信息的欧式距离;
将最大的欧式距离作为所述目标欧式距离。
在本实施例中,为了实现对目标欧式距离的获取,可以计算待识别语音信号对应的第一向量信息、第一目标语音信号对应的第二向量信息以及第二目标语音信号对应的第三向量信息。计算第二向量信息与第一向量信息的欧式距离,将该欧式距离记为D1,计算第三向量信息与第一向量信息的欧式距离,将该欧式距离记为D2,比较D1与D2之间的大小,将最大的欧式距离作为该目标欧式距离。
本发明提供的对抗语音识别方法,通过分别计算所述第二向量信息以及所述第三向量信息与所述第一向量信息的欧式距离,将最大的欧式距离作为所述目标欧式距离,从而能够精准地确定目标欧式距离,为后续对抗语音的识别提供了基础。
进一步地,在上述任一实施例的基础上,所述根据所述目标欧式距离以及预设的欧式距离阈值确定所述待识别语音信号是否为对抗语音信号之前,还包括:
从区块链中获取待处理数据集,所述待处理数据集中包括正常语音信号以及对抗语音信号;
根据所述待处理数据集计算所述欧式距离阈值。
在本实施例中,为了实现对对抗语音信息的识别,首先应该确定欧式距离阈值。具体地,对抗语音识别装置可以从区块链中获取待处理数据集,该待处理数据集中包括正常语音信号以及对抗语音信号。该区块链中具有多个节点,每个节点均可以在区块链中上传语音信号进行存储。获取到待处理数据集之后,可以根据该待处理数据集中的正常语音信号以及对抗语音信号实现对欧式距离阈值的确定。
本发明提供的对抗语音识别方法,通过从区块链中获取待处理数据集,所述待处理数据集中包括正常语音信号以及对抗语音信号,根据所述待处理数据集计算所述欧式距离阈值,从而能够精准地确定欧式距离阈值,为后续对抗语音的识别提供了基础。
图2为本发明实施例二提供的对抗语音识别方法的流程示意图,在上述任一实施例的基础上,所述根据所述待处理数据集计算所述欧式距离阈值,包括:
步骤201、针对所述待处理数据集中的每一正常语音信号,采用预设的第一降噪算法以及第二降噪算法对所述正常语音信号进行降噪处理,获得第三目标语音信号以及第四目标语音信号;分别计算所述正常语音信号、第三目标语音信号以及第四目标语音信号对应的向量信息;根据所述向量信息确定所述正常语音信号对应的欧式距离;计算所述待处理数据集中的全部正常语音信号对应的欧式距离均值,获得第一欧式距离均值;
步骤202、针对所述待处理数据集中的每一对抗语音信号,采用预设的第一降噪算法以及第二降噪算法对所述对抗语音信号进行降噪处理,获得第五目标语音信号以及第六目标语音信号;分别计算所述正常语音信号、第五目标语音信号以及第六目标语音信号对应的向量信息;根据所述向量信息确定所述对抗语音信号对应的欧式距离;计算所述待处理数据集中的全部对抗语音信号对应的欧式距离均值,获得第二欧式距离均值;
步骤203、根据所述第一欧式距离均值、第二欧式距离均值以及预设的阈值算法计算所述欧式距离阈值。
在本实施例中,为了实现对对抗语音信息的识别,首先应该确定欧式距离阈值。具体地,对抗语音识别装置从区块链中获取待处理数据集之后,针对待处理数据集中的每一正常语音信号,采用预设的第一降噪算法以及第二降噪算法对所述正常语音信号进行降噪处理,获得第三目标语音信号以及第四目标语音信号。分别计算所述正常语音信号、第三目标语音信号以及第四目标语音信号对应的向量信息。根据所述向量信息确定所述正常语音信号对应的欧式距离。计算所述待处理数据集中的全部正常语音信号对应的欧式距离均值,获得第一欧式距离均值Da’。举例来说,针对待处理数据集中的每一正常语音信号,分别确定正常语音信号对应的第四向量信息、第三目标语音信号对应的第五向量信息以及第四目标语音信号对应的第六向量信息,计算第四向量信息与第五向量信息的欧式距离D3,第四向量信息与第六向量信息的欧式距离D4,比较D3与D4,将距离最大的欧式距离作为正常语音信号对应的欧式距离。针对每一正常语音信号,重复上述步骤,获得多个正常语音信号对应的欧式距离,计算多个正常语音信号对应的欧式距离的均值,获得第一欧式距离均值。针对待处理数据集中的每一对抗语音信号,采用预设的第一降噪算法以及第二降噪算法对对抗语音信号进行降噪处理,获得第五目标语音信号以及第六目标语音信号;分别计算正常语音信号、第五目标语音信号以及第六目标语音信号对应的向量信息;根据向量信息确定对抗语音信号对应的欧式距离;计算待处理数据集中的全部对抗语音信号对应的欧式距离均值,获得第二欧式距离均值Dn’。根据第一欧式距离均值、第二欧式距离均值以及预设的阈值算法计算欧式距离阈值。其中,该预设的阈值算法如公式1所示:
v=c*1/2(Da’+Dn’)(1)
其中,v为欧式距离阈值,c为预设的常数,Da’为第一欧式距离均值,Dn’为第二欧式距离均值。
本发明提供的对抗语音识别方法,通过从区块链中获取待处理数据集,分别计算待处理数据集中正常语音信号对应的第一欧式距离均值,以及对抗语音信号对应的第二欧式距离均值,并根据第一欧式距离均值、第二欧式距离均值以及预设的阈值算法计算欧式距离阈值,从而能够精准地确定欧式距离阈值,为后续对抗语音的识别提供了基础。
图3为本发明实施例三提供的对抗语音识别装置的结构示意图,如图3所示,所述装置包括:
获取模块31,用于获取待识别语音信号;
降噪模块32,用于通过预设的第一降噪算法对所述待识别语音信号进行降噪处理,获得第一目标语音信号,通过预设的第二降噪算法对所述待识别语音信号进行降噪处理,获得第二目标语音信号;
向量信息计算模块33,用于分别计算所述待识别语音信号以及所述第一目标语音信号以及第二目标语音信号对应的向量信息;
目标欧式距离计算模块34,用于根据所述向量信息确定所述待识别语音信号对应的目标欧式距离;
确定模块35,用于根据所述目标欧式距离以及预设的欧式距离阈值确定所述待识别语音信号是否为对抗语音信号。
本发明提供的对抗语音识别装置,通过获取待识别语音信号,对该待识别语音信号进行降噪处理,确定降噪处理后的待识别语音信号对应的目标欧式距离,将该目标欧式距离与预设的欧氏距离阈值进行比较,从而能够精准地确定该待识别语音信号是否为对抗语音,进而能够避免对抗语音导致的用户无法获取到正确的信息的问题。
进一步地,在上述任一实施例的基础上,第一降噪算法为减谱法,第二降噪算法为维纳滤波法,所述降噪模块32包括:
第一降噪单元,用于通过减谱法对所述待识别语音信号进行降噪处理,获得第一目标语音信号;
第二降噪单元,用于通过维纳滤波法对所述待识别语音信号进行降噪处理,获得第二目标语音信号。
进一步地,在上述任一实施例的基础上,所述向量信息计算模块33包括:
向量信息计算单元,用于计算所述待识别语音信号对应的第一向量信息、所述第一目标语音信号对应的第二向量信息以及第二目标语音信号对应的第三向量信息;
相应地,所述目标欧式距离计算模块34包括:
欧式距离计算单元,用于分别计算所述第二向量信息以及所述第三向量信息与所述第一向量信息的欧式距离;
欧式距离确定单元,用于将最大的欧式距离作为所述目标欧式距离。
进一步地,在上述任一实施例的基础上,所述确定模块35包括:
判断单元,用于判断所述目标欧式距离是否大于预设的欧式距离阈值;
第一处理单元,用于若是,则判定所述待识别语音信号为对抗语音信号;
第二处理单元,用于若否,则判定所述待处理信号为正常语音信号。
进一步地,在上述任一实施例的基础上,所述装置还包括:
报警模块,用于若所述待识别语音信号为对抗语音信号,则发出报警信号。
进一步地,在上述任一实施例的基础上,所述装置还包括:
待处理数据集获取模块,用于从区块链中获取待处理数据集,所述待处理数据集中包括正常语音信号以及对抗语音信号;
欧式距离阈值计算模块,用于根据所述待处理数据集计算所述欧式距离阈值。
进一步地,在上述任一实施例的基础上,所述欧式距离阈值计算模块包括:
第一计算单元,用于针对所述待处理数据集中的每一正常语音信号,采用预设的第一降噪算法以及第二降噪算法对所述正常语音信号进行降噪处理,获得第三目标语音信号以及第四目标语音信号;分别计算所述正常语音信号、第三目标语音信号以及第四目标语音信号对应的向量信息;根据所述向量信息确定所述正常语音信号对应的欧式距离;计算所述待处理数据集中的全部正常语音信号对应的欧式距离均值,获得第一欧式距离均值;
第二计算单元,用于针对所述待处理数据集中的每一对抗语音信号,采用预设的第一降噪算法以及第二降噪算法对所述对抗语音信号进行降噪处理,获得第五目标语音信号以及第六目标语音信号;分别计算所述正常语音信号、第五目标语音信号以及第六目标语音信号对应的向量信息;根据所述向量信息确定所述对抗语音信号对应的欧式距离;计算所述待处理数据集中的全部对抗语音信号对应的欧式距离均值,获得第二欧式距离均值;
欧式距离阈值计算单元,用于根据所述第一欧式距离均值、第二欧式距离均值以及预设的阈值算法计算所述欧式距离阈值。
图4为本发明实施例四提供的对抗语音识别设备的结构示意图,如图4所示,所述装置包括:存储器41,处理器42;
存储器41;用于存储所述处理器42可执行指令的存储器41;
其中,所述处理器42被配置为由所述处理器42执行如上述任一实施例所述的对抗语音识别方法。
本发明又一实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述任一实施例所述的对抗语音识别方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种对抗语音识别方法,其特征在于,包括:
获取待识别语音信号;
通过预设的第一降噪算法对所述待识别语音信号进行降噪处理,获得第一目标语音信号,通过预设的第二降噪算法对所述待识别语音信号进行降噪处理,获得第二目标语音信号;
分别计算所述待识别语音信号以及所述第一目标语音信号以及第二目标语音信号对应的向量信息;
根据所述向量信息确定所述待识别语音信号对应的目标欧式距离;
根据所述目标欧式距离以及预设的欧式距离阈值确定所述待识别语音信号是否为对抗语音信号。
2.根据权利要求1所述的方法,其特征在于,所述第一降噪算法为减谱法,所述第二降噪算法为维纳滤波法,相应地,所述通过预设的第一降噪算法对所述待识别语音信号进行降噪处理,获得第一目标语音信号,通过预设的第二降噪算法对所述待识别语音信号进行降噪处理,获得第二目标语音信号,包括:
通过减谱法对所述待识别语音信号进行降噪处理,获得第一目标语音信号;
通过维纳滤波法对所述待识别语音信号进行降噪处理,获得第二目标语音信号。
3.根据权利要求1所述的方法,其特征在于,所述分别计算所述待识别语音信号以及所述第一目标语音信号以及第二目标语音信号对应的向量信息,包括:
计算所述待识别语音信号对应的第一向量信息、所述第一目标语音信号对应的第二向量信息以及第二目标语音信号对应的第三向量信息;
相应地,所述根据所述向量信息确定所述待识别语音信号对应的目标欧式距离,包括:
分别计算所述第二向量信息以及所述第三向量信息与所述第一向量信息的欧式距离;
将最大的欧式距离作为所述目标欧式距离。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述目标欧式距离以及预设的欧式距离阈值确定所述待识别语音信号是否为对抗语音信号,包括:
判断所述目标欧式距离是否大于预设的欧式距离阈值;
若是,则判定所述待识别语音信号为对抗语音信号;
若否,则判定所述待处理信号为正常语音信号。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述目标欧式距离以及预设的欧式距离阈值确定所述待识别语音信号是否为对抗语音信号之后,还包括:
若所述待识别语音信号为对抗语音信号,则发出报警信号。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述目标欧式距离以及预设的欧式距离阈值确定所述待识别语音信号是否为对抗语音信号之前,还包括:
从区块链中获取待处理数据集,所述待处理数据集中包括正常语音信号以及对抗语音信号;
根据所述待处理数据集计算所述欧式距离阈值。
7.根据权利要求6所述的方法,其特征在于,所述根据所述待处理数据集计算所述欧式距离阈值,包括:
针对所述待处理数据集中的每一正常语音信号,采用预设的第一降噪算法以及第二降噪算法对所述正常语音信号进行降噪处理,获得第三目标语音信号以及第四目标语音信号;分别计算所述正常语音信号、第三目标语音信号以及第四目标语音信号对应的向量信息;根据所述向量信息确定所述正常语音信号对应的欧式距离;计算所述待处理数据集中的全部正常语音信号对应的欧式距离均值,获得第一欧式距离均值;
针对所述待处理数据集中的每一对抗语音信号,采用预设的第一降噪算法以及第二降噪算法对所述对抗语音信号进行降噪处理,获得第五目标语音信号以及第六目标语音信号;分别计算所述正常语音信号、第五目标语音信号以及第六目标语音信号对应的向量信息;根据所述向量信息确定所述对抗语音信号对应的欧式距离;计算所述待处理数据集中的全部对抗语音信号对应的欧式距离均值,获得第二欧式距离均值;
根据所述第一欧式距离均值、第二欧式距离均值以及预设的阈值算法计算所述欧式距离阈值。
8.一种对抗语音识别装置,其特征在于,包括:
获取模块,用于获取待识别语音信号;
降噪模块,用于通过预设的第一降噪算法对所述待识别语音信号进行降噪处理,获得第一目标语音信号,通过预设的第二降噪算法对所述待识别语音信号进行降噪处理,获得第二目标语音信号;
向量信息计算模块,用于分别计算所述待识别语音信号以及所述第一目标语音信号以及第二目标语音信号对应的向量信息;
目标欧式距离计算模块,用于根据所述向量信息确定所述待识别语音信号对应的目标欧式距离;
确定模块,用于根据所述目标欧式距离以及预设的欧式距离阈值确定所述待识别语音信号是否为对抗语音信号。
9.一种对抗语音识别设备,其特征在于,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为由所述处理器执行如权利要求1-7任一项所述的对抗语音识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-7任一项所述的对抗语音识别方法。
CN201910805939.8A 2019-08-29 2019-08-29 对抗语音识别方法、装置、设备及计算机可读存储介质 Active CN110503974B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910805939.8A CN110503974B (zh) 2019-08-29 2019-08-29 对抗语音识别方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910805939.8A CN110503974B (zh) 2019-08-29 2019-08-29 对抗语音识别方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110503974A true CN110503974A (zh) 2019-11-26
CN110503974B CN110503974B (zh) 2022-02-22

Family

ID=68590383

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910805939.8A Active CN110503974B (zh) 2019-08-29 2019-08-29 对抗语音识别方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110503974B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111341304A (zh) * 2020-02-28 2020-06-26 广州国音智能科技有限公司 一种基于gan的说话人语音特征训练方法、装置和设备
CN112017669A (zh) * 2020-11-02 2020-12-01 鹏城实验室 语音对抗样本检测方法、装置、终端设备以及存储介质
CN112151052A (zh) * 2020-10-26 2020-12-29 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质
CN112671542A (zh) * 2020-12-16 2021-04-16 深圳市大中华区块链科技有限公司 一种区块链生物语音识别方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165671A (zh) * 2018-07-13 2019-01-08 上海交通大学 基于样本到决策边界距离的对抗样本检测方法
CN109525607A (zh) * 2019-01-07 2019-03-26 四川虹微技术有限公司 对抗攻击检测方法、装置及电子设备
CN109543740A (zh) * 2018-11-14 2019-03-29 哈尔滨工程大学 一种基于生成对抗网络的目标检测方法
CN109784411A (zh) * 2019-01-23 2019-05-21 四川虹微技术有限公司 对抗样本的防御方法、装置、系统及存储介质
US20190238568A1 (en) * 2018-02-01 2019-08-01 International Business Machines Corporation Identifying Artificial Artifacts in Input Data to Detect Adversarial Attacks

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190238568A1 (en) * 2018-02-01 2019-08-01 International Business Machines Corporation Identifying Artificial Artifacts in Input Data to Detect Adversarial Attacks
CN109165671A (zh) * 2018-07-13 2019-01-08 上海交通大学 基于样本到决策边界距离的对抗样本检测方法
CN109543740A (zh) * 2018-11-14 2019-03-29 哈尔滨工程大学 一种基于生成对抗网络的目标检测方法
CN109525607A (zh) * 2019-01-07 2019-03-26 四川虹微技术有限公司 对抗攻击检测方法、装置及电子设备
CN109784411A (zh) * 2019-01-23 2019-05-21 四川虹微技术有限公司 对抗样本的防御方法、装置、系统及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111341304A (zh) * 2020-02-28 2020-06-26 广州国音智能科技有限公司 一种基于gan的说话人语音特征训练方法、装置和设备
CN112151052A (zh) * 2020-10-26 2020-12-29 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质
CN112017669A (zh) * 2020-11-02 2020-12-01 鹏城实验室 语音对抗样本检测方法、装置、终端设备以及存储介质
CN112017669B (zh) * 2020-11-02 2021-02-23 鹏城实验室 语音对抗样本检测方法、装置、终端设备以及存储介质
CN112671542A (zh) * 2020-12-16 2021-04-16 深圳市大中华区块链科技有限公司 一种区块链生物语音识别方法及系统

Also Published As

Publication number Publication date
CN110503974B (zh) 2022-02-22

Similar Documents

Publication Publication Date Title
CN110503974A (zh) 对抗语音识别方法、装置、设备及计算机可读存储介质
CN110600017B (zh) 语音处理模型的训练方法、语音识别方法、系统及装置
CN111816218B (zh) 语音端点检测方法、装置、设备及存储介质
KR102605736B1 (ko) 주파수 변화에 강인한 음향 이벤트 검출 방법 및 그 장치
CN105139858B (zh) 一种信息处理方法及电子设备
EP2843660A1 (en) Method and apparatus for detecting synthesized speech
KR102444411B1 (ko) 음향 이벤트 별로 특성을 고려한 음향 이벤트 검출 방법 및 장치
CN108922553B (zh) 用于音箱设备的波达方向估计方法及系统
CN110428810A (zh) 一种语音唤醒的识别方法、装置及电子设备
US20210089792A1 (en) Method and apparatus for outputting information
CN110545396A (zh) 一种基于定位去噪的语音识别方法及装置
CN110570853A (zh) 基于语音数据的意图识别方法和装置
CN104318921A (zh) 音段切分检测方法及系统、口语评测方法及系统
Anumula et al. An event-driven probabilistic model of sound source localization using cochlea spikes
CN110364178B (zh) 一种语音处理方法、装置、存储介质和电子设备
KR101140896B1 (ko) 음성 세그먼트화를 위한 방법 및 장치
Ranjan et al. Curriculum Learning Based Probabilistic Linear Discriminant Analysis for Noise Robust Speaker Recognition.
CN107132508A (zh) 声源定位方法和装置
WO2023082836A1 (zh) 信道状态确定方法、装置和机器可读存储介质
CN116364107A (zh) 一种语音信号检测方法、装置、设备及存储介质
CN111613247B (zh) 一种基于麦克风阵列的前景语音检测方法及装置
KR20190078669A (ko) 시각 장애인 위한 안전한 보행과 정보 안내 시스템
KR20180041072A (ko) 오디오 프레임 프로세싱을 위한 디바이스 및 방법
CN108877777A (zh) 一种语音识别方法及系统
CN115905642B (zh) 一种增强发言情感的方法、系统、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant