CN111316668A - 扬声器回放的检测 - Google Patents
扬声器回放的检测 Download PDFInfo
- Publication number
- CN111316668A CN111316668A CN201880072084.6A CN201880072084A CN111316668A CN 111316668 A CN111316668 A CN 111316668A CN 201880072084 A CN201880072084 A CN 201880072084A CN 111316668 A CN111316668 A CN 111316668A
- Authority
- CN
- China
- Prior art keywords
- signal
- audio
- sound
- audio frequency
- measure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title description 2
- 238000000034 method Methods 0.000 claims abstract description 59
- 230000005236 sound signal Effects 0.000 claims abstract description 34
- 230000008859 change Effects 0.000 claims abstract description 5
- 230000001186 cumulative effect Effects 0.000 claims description 27
- 238000005315 distribution function Methods 0.000 claims description 27
- 230000000694 effects Effects 0.000 claims description 14
- 230000001419 dependent effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims description 2
- 238000007619 statistical method Methods 0.000 claims description 2
- 230000006835 compression Effects 0.000 claims 1
- 238000007906 compression Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000010255 response to auditory stimulus Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/001—Monitoring arrangements; Testing arrangements for loudspeakers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computer Security & Cryptography (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Telephone Function (AREA)
Abstract
一种确定声音是否由扬声器生成的方法,包括接收代表所述声音的至少一部分的音频信号。所述音频信号被分离在不同的频带中。比较不同的频带的信号内容。基于所述比较,标识信号内容中指示使用扬声器的基于频率的变化。
Description
技术领域
本文所描述的实施方案涉及用于检测何时信号通过扬声器播放的方法和设备。
背景技术
语音生物测定系统越来越广泛地被使用。在这样的系统中,用户通过在注册阶段期间提供他们的话语的样本来训练系统。在后续的使用中,系统能够在已注册用户和未登记的说话人之间进行辨别。语音生物测定系统原则上可以用于控制对各种服务和系统的访问权。
恶意方试图击败语音生物测定系统的一种方式是获取已注册用户的话语的录音,且回放该录音以试图冒充已注册用户以及获得对旨在限于已注册用户的服务的访问权。
这称为重放攻击或欺骗攻击。
发明内容
根据本发明的一个方面,提供了一种确定声音是否由扬声器生成的方法,该方法包括:
接收代表所述声音的至少一部分的音频信号;
将所述音频信号分离在不同的频带中;
比较不同的频带的信号内容;以及
基于所述比较,标识信号内容中指示使用扬声器的基于频率的变化。
根据本发明的一个方面,提供了一种确定声音是否由扬声器生成的方法,该方法包括:
接收代表所述声音的音频信号;
试图在所接收的音频信号中检测由作为扬声器的特性的非线性所产生的特征;以及
如果检测到所述特征,则确定所述声音是由扬声器生成的。
根据本发明的另一方面,提供了一种用于确定声音是否由扬声器生成的系统,该系统被配置用于根据所述方法中的任一方法进行操作。
根据本发明的另一方面,提供了一种包括这种系统的设备。所述设备可以包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器。
根据本发明的另一方面,提供了一种计算机程序产品,包括计算机可读有形介质,以及用于执行根据第一方面的方法的指令。
根据本发明的另一方面,提供了一种非暂时性计算机可读存储介质,在所述非暂时性计算机可读存储介质上存储有计算机可执行指令,当由处理器电路系统执行所述计算机可执行指令时,所述计算机可执行指令使所述处理器电路系统执行根据第一方面的方法。
附图说明
为了更好地理解本发明且示出可以如何实施本发明,现在将参考附图,在附图中:
图1例示了一个智能电话;
图2是例示智能电话的形式的示意图;
图3例示了正在执行重放攻击的一种情形;
图4例示了扬声器的特性;
图5是例示分析音频信号的方法的流程图;
图6是例示分析系统的框图;
图7更详细地例示了图6的系统的一部分;以及
图8例示了图6的系统的一个实施方案。
具体实施方式
下面的描述阐述了根据本公开内容的示例实施方案。对于本领域普通技术人员而言,其他示例实施方案和实施方式将是显而易见的。此外,本领域普通技术人员将认识到,可以代替下面所讨论的实施方案或与下面讨论的实施方案相结合地应用多种等同技术,且所有这样的等同物应被认为是本公开内容所涵盖的。
本文所描述的方法可以在各种各样的设备和系统(例如,移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器)中实施。然而,为了易于解释一个实施方案,将描述一个例示性实施例,其中实施方式发生在智能电话中。
图1例示了一个智能电话10,该智能电话10具有用于检测周边声音的麦克风12。在正常使用中,麦克风当然用于检测将智能电话10握持在他们的脸部附近的用户的话语。
图2是例示智能电话10的形式的示意图。
具体地,图2示出了智能电话10的多个互连部件。应理解,智能电话10实际上将包含许多其他部件,但是以下描述对于理解本发明是足够的。
因此,图2示出了上面所提及的麦克风12。在某些实施方案中,智能电话10设置有多个麦克风12、12a、12b等。
图2还示出了存储器14,该存储器14实际上可以被设置为单个部件或多个部件。存储器14被设置用于存储数据和程序指令。
图2还示出了处理器16,该处理器16实际上也可以被设置为单个部件或多个部件。例如,处理器16的一个部件可以是智能电话10的应用处理器。
图2还示出了收发器18,该收发器18被设置用于允许智能电话10与外部网络通信。例如,收发器18可以包括用于经由WiFi局域网或经由蜂窝网络建立互联网连接的电路系统。
图2还示出了音频处理电路系统20,用于根据需要对由麦克风12所检测到的音频信号执行操作。例如,音频处理电路系统20可以对音频信号进行滤波,或可执行其他信号处理操作。
在此实施方案中,智能电话10设置有语音生物测定功能且设置有控制功能。因此,智能电话10能够响应于来自已注册用户的口语命令来执行多种功能。生物测定功能能够在来自已注册用户的口语命令和由一个不同的人说出的相同命令之间进行区分。因此,本发明的某些实施方案涉及操作智能电话或具有某种语音可操作性的另一便携式电子设备,例如平板计算机或膝上型计算机、游戏控制台、家庭控制系统、家庭娱乐系统、车载娱乐系统、家用电器等,其中在旨在执行口语命令的设备中执行语音生物测定功能。某些其他实施方案涉及在智能电话或其他设备上执行语音生物测定功能的系统,如果语音生物测定功能能够确认说话人是已注册用户,则智能电话或其他设备将命令发送至一个分立的设备。
在一些实施方案中,虽然在智能电话10或靠近用户定位的其他设备上执行语音生物测定功能,但是使用收发器18将口语命令传输至远程话语识别系统,该远程话语识别系统确定口语命令的含义。例如,话语识别系统可以位于云计算环境中的一个或多个远程服务器上。然后,基于口语命令的含义的信号被返回至智能电话10或其他本地设备。
图3示出了正在执行重放攻击的情形的一个实施例。因此,在图3中,智能电话10设置有语音生物测定功能。在此实施例中,智能电话10至少暂时地拥有一个攻击者,该攻击者具有另一智能电话30。智能电话30已经被用来记录智能电话10的已注册用户的语音。使智能电话30靠近智能电话10的麦克风入口12,且回放已注册用户的语音的录音。如果语音生物测定系统不能够检测它所检测到的已注册用户的语音是录音,则攻击者将获得对旨在仅由已注册用户可访问的一个或多个服务的访问权。
已知的是,由于尺寸约束,智能电话(诸如,智能电话30)通常设置有具有相对低质量的扬声器。因此,通过这种扬声器所回放的已注册用户的语音的录音不会与该用户的语音完美匹配,且这一事实可被用来标识重放攻击。例如,扬声器可以具有某些频率相关的特性,且如果可以在由语音生物测定系统所接收的话语信号中检测到这些频率相关的特性,则可以认为该话语信号由重放攻击产生。
尽管图3例示了所公开的分析音频信号的方法的一种可能用途,但是该方法更普遍地适用于期望确定所检测到的声音是否通过扬声器播放的任何系统。在此实施例中,该方法利用典型的扬声器具有取决于频率的非线性这一事实。这与例如麦克风相反,麦克风具有基本上独立于频率的非线性。
图4例示了典型的扬声器的非线性特性。具体地,图4示出了总谐波失真(THD)随着频率的变化。
在低于扬声器的谐振频率fR的相对低的频率处,例如在f1至f2的范围内,THD通常是恒定的。扬声器在谐振频率处具有大的THD,然后随着频率增大(例如,对于f3和更高的频率)而下降。
此非线性特性可以被用于检测何时所接收的声音是通过扬声器播放的。
具体地,由于非线性特性是频率相关的,所以可以在不同的频带中检测非线性的影响,从而标识所接收的信号是否由通过扬声器所播放的声音产生的。
图5是例示分析的方法的流程图,且图6是例示分析系统的基本形式的框图。
在该方法的步骤200处,代表声音的音频信号在系统的输入220处被接收。
在输入22处所接收的信号可以直接从麦克风(诸如,麦克风12)接收,或者可能已经经受了一些初始预处理。因此,如果接收了代表声音的第一信号,则可以从代表声音的一部分的第一信号导出第二信号。然后,系统可以试图在第二信号中检测由非线性所产生的特征,该非线性在某些频率处比在其他频率处更大。
例如,可以对所接收的信号进行预处理,以使得第二信号代表声音的话语成分。更具体地,可以对所接收的信号进行预处理,以使得第二信号代表浊音话语。
第一信号可以在语音活动检测器处被接收,且仅当语音活动检测器在第一信号中检测到话语时才导出第二信号。
在步骤202处,将所接收的信号分离在两个或更多个频带中。图6示出了信号被传送至低通滤波器形式的第一滤波器222,且还被传送至高通滤波器形式的第二滤波器228。优选地,低通滤波器的截止频率被选择为低于将预期使用的任何扬声器的谐振频率。类似地,优选地,高通滤波器的截止频率被选择为显著高于将预期使用的任何扬声器的谐振频率。这将具有的效果是,扬声器的非线性从而对所接收的信号的可检测到的影响在低音频频率处将比在高音频频率处更大。
在其他实施方案中,第一滤波器222和第二滤波器228这二者都是带通滤波器,其中它们的相应通带被选择为使得它们被间隔开,这意味着扬声器的非线性从而对所接收的信号的可检测到的影响在两个通带中将是不同的。
在其他实施方案中,设置了两个以上的滤波器,且再次它们可以是带通滤波器,其中它们的相应通带被间隔开。使用三个或更多个频带提高了扬声器的非线性从而对所检测的信号的可检测到的影响在所述通带中将是不同的概率,尽管目的是检测具有明显不能事先知晓的非线性特性的未知扬声器的存在。
因此,在步骤204中,检查不同频带的信号内容。在图6中所示出的实施例中,滤波器222、228的输出被传送至相应的非线性检测器(NLD)模块224、230。因此,在此实施例中,如在步骤206处所示出的,系统试图在所接收的音频信号中检测由非线性所产生的特征。
更具体地,系统试图在所接收的音频信号中检测由随着频率而改变的非线性(例如,在低音频频率处比在高音频频率处更大)所产生的特征。
非线性检测器(NLD)224、230可以采用多种形式,但是非线性对所接收的信号的一种影响是增大信号的不对称性。也就是说,如果信号包含大数目的样本,且样本值是正值和负值的混合,则非线性的一种影响是引入新样本值,该新样本值是输入信号中的值的平方。这些平方值都将为正,因此它们的存在将增大非线性的输出中正值的比例。
因此,简单形式的非线性检测器(NLD)的一种形式在由滤波器222、228所选定的两个或更多个频带的每一频带中测量波形的不对称性。
该方法的步骤206可以包括分析两个或更多个频率分量以获得相应的度量,然后比较所述度量以标识由非线性所产生的特征,该非线性在所述频带的一个频带中比在另一频带中更大。
更具体地,分析两个或更多个频率分量可以包括获得与相应分量的样本值有关的统计度量。统计度量可以是声音的波形的不对称性的测量。更具体地,统计度量可以是样本值的偏度的测量。
图7示出了NLD的一种可能的实施方式。在此实施方式中,可选的非线性增益被施加至所接收的信号的相关频率分量。非线性增益可以是压缩的,或者如图7中所示出的非线性量化器240,该非线性量化器240用于去除具有小值的样本,以使得较大的样本对后续确定具有较大的影响。所得到的信号被传送至块242,该块242用于测量信号的偏度,以获得相关频带的统计度量。
偏度测量块242可以例如形成皮尔逊偏度系数(Pearson coefficient ofskewness)、非参数偏度(non-parametric skew)或四分位偏度系数(quartile skewnesscoefficient)作为偏度的测量。
非参数偏度Sk可以是:
其中,μ是样本值的平均,v是样本值的中值,且σ是样本值的标准偏差。
替代地,可以使用由平均绝对偏差代替标准偏差的非参数偏度。
四分位偏度系数Sq可以是:
其中Q1、Q2和Q3分别是第一四分位值、第二四分位值和第三四分位值。
NLD的替代形式检查从相应频带中的样本所导出的累积分布函数。
图8例示了所使用的累积分布函数的类型。
具体地,图8示出了针对从较低频率f1延伸至较高频率f2的第一滤波器通带所获得的累积分布函数。例如,针对传送通过滤波器222、228中的一个滤波器的信号,可以获得累积分布函数。曲线250则示出了信号的基频低于相关频率的帧的百分比。因此,作为例示,累积分布函数250示出了百分比c2的帧具有低于频率fc的基频。
在一个实施例中,然后通过将累积分布函数250与参考累积分布函数252进行比较来获得非线性的测量。参考累积分布函数252可以例如具有洛伦兹分布。
累积分布函数250与参考累积分布函数252之间的比较可以借助于竖直距离计算来实现。因此,如上面所提及的,累积分布函数250示出了百分比c2的帧具有低于频率fc的基频。类似地,参考累积分布函数252示出了百分比c1的帧具有低于频率fc的基频。因此,可以在频率fc处计算竖直距离(c2-c1)。可以针对从f1延伸至f2的频带内的所有频率执行相同的计算。然后,这可以被用于形成信号在从f1至f2的频带内的非线性的测量。例如,可以通过跨越从f1至f2的频带寻找累积分布函数250与参考累积分布函数252之间的最大竖直距离,来获得代表信号在相关频带内的非线性的度量。
可以针对传送通过滤波器222、228中的另一滤波器的信号执行相同的步骤,从而获得代表信号在相关频带内的非线性的统计度量。
在对不同的频带的信号内容执行统计分析以生成相应的统计度量之后,在步骤208中,这些度量被传送至比较块226,如图6中所示出的。
比较块226比较针对不同的频带所获得的统计度量。
例如,如果两个频率分量被滤波器222、228分离开,则可以比较针对这两个频带所获得的度量,以获得两个度量的比率值。
如果选择了多于两个的频带,则可以例如将针对这些频带的度量成对地进行比较。也就是说,如果度量对于第一频带是对于第二频带是对于第三频带是则可以形成三个比率和然后,可以将所有这些比率与一个或多个阈值进行比较。
如果选择第一频带和第二频带使得它们很可能显著低于扬声器的谐振频率且显著高于扬声器的谐振频率,则如果低音频频率分量的样本值的偏度的测量与高音频频率分量的样本值的偏度的测量的比率超过了一个阈值,可以确定所接收的音频信号具有由非线性所产生的特征,该非线性在低音频频率处比在高音频频率处更大。
例如,该比率的典型值可能是1.5:1。因此,为了提供良好的辨别度,可以将该比率的阈值设置为1.3:1。
然而,还已知的是,话语典型地是略微不对称的,且一些说话人的话语自然地比其他说话人的话语更不对称。因此,如果系统具有对关于说话人的声称身份的信息的访问权(如在例如说话人验证系统中通常就是这种情况),则该比率的阈值可能被适配成考虑该信息。例如,对于具有低程度的自然不对称性的说话人,该比率的阈值可以被设置为比正常更低的值。对于具有高程度的自然不对称性的说话人,该比率的阈值可以被设置为比正常更高的值。
类似地,非线性会随着声压级而变化。因此,可以基于信号水平来调节该比率的阈值。如果所检测到的声音是安静的,则非线性将对所接收的信号具有相对小的影响,所以为该比率设置一个比正常阈值更低的值将是有利的。相反,如果所检测到的声音是响亮的,则非线性将对所接收的信号具有相对大的影响,所以可以为该比率设置一个比正常阈值更高的值。
尽管在此参考确定针对不同的频带所获得的度量的比率,但是应理解,还可以形成度量之间的差异(诸如,两个频率分量的样本值的偏度的测量),且将此差异与阈值进行比较。
上面描述了一个实施方案,其中从信号获得多个频带中的累积分布函数,且将该累积分布函数与相应的参考累积分布函数进行比较,从而形成频带的非线性的相应测量。然后,可以将针对不同的频带的非线性的这些测量彼此进行比较。
另一可能性是从信号获得多个频带中的相应的累积分布函数,且在比较块226中直接将那些累积分布函数彼此进行比较。例如,该比较可以涉及寻找累积分布函数之间的最大竖直距离(如参考图8所描述的),以及在累积分布函数与参考累积分布函数之间进行比较。
如果多个频带中与信号有关的累积分布函数之间的差异(例如,以它们之间的竖直距离所表示的差异)超过了阈值,则此可以被比较块226用作对声音是由扬声器所生成的指示。
如果比较块226确定声音是由扬声器所生成的,则它生成扬声器指示输出信号。根据需要,此可以被提供至任何后续处理块。在分析用于确定所接收的音频信号是说话人识别系统还是话语识别系统的一部分的情况下,输出信号可以被用于控制该系统的其余部分所采取的动作。例如,在语音生物测定系统的情况下,如果确定声音可能是由扬声器所生成的,则可以确定声音可能是由对语音生物测定系统的重放攻击产生的。在那种情况下,仅当确定声音不是由扬声器生成时,才可以将所接收的音频信号传送至语音生物测定处理模块。因此,在说话人识别系统中,如果比较块226确定所接收的音频信号是响应于通过扬声器所播放的声音而生成的,则可以使所接收的音频信号包含已注册用户的话语的决策无效。
上面参考了获得与两个或更多个频带有关的显式度量(explicit metrics),以及比较那些度量从而标识信号内容中指示使用扬声器的基于频率的变化。然而,还可以使用机器学习技术来试图在所接收的音频信号中检测由随着频率而改变的非线性(例如,在低音频频率处比在高音频频率处更大)的特征。机器学习可以例如使用神经网络。
馈送至机器学习技术的数据例如可以是原始频率数据,或者可以是与信号有关的概率数据(例如,每一频带中的样本值的累积分布函数)。
本领域技术人员将认识到,上文所描述的装置和方法的一些方面可以具体化为例如位于非易失性载体介质(诸如,磁盘、CD-ROM或DVD-ROM、程序化存储器诸如只读存储器(固件))上或位于数据载体(诸如,光学信号载体或电信号载体)上的处理器控制代码。对于许多应用,本发明的实施方案将被实施在DSP(数字信号处理器)、ASIC(专用集成电路)或FPGA(现场可编程门阵列)上。因此,代码可以包括常规程序代码或微代码或例如用于设置或控制ASIC或FPGA的代码。代码还可以包括用于动态地配置可重新配置的装置(诸如,可重新编程逻辑门阵列)的代码。类似地,代码可以包括用于硬件描述语言(诸如Verilog TM或VHDL(超高速集成电路硬件描述语言))的代码。如本领域技术人员将理解,代码可以被分布在彼此通信的多个经耦合的部件之间。在适当的情况下,还可以使用在现场可(重新)编程模拟阵列或类似的设备上运行以配置模拟硬件的代码来实施所述实施方案。
注意,如本文中所使用的,术语模块应被用来指代可以至少部分地由专用硬件部件(诸如,自定义电路系统)实施的功能单元或功能块,和/或至少部分地由一个或多个软件处理器或在合适的通用处理器等上运行的适当的代码实施的功能单元或功能块。模块本身可以包括其他模块或功能单元。模块可以由不需要被协同定位且可以被设置在不同的集成电路上和/或在不同的处理器上运行的多个部件或子模块来提供。
实施方案可以在主机设备中实施,尤其是便携式主机设备和/或电池供电主机设备,诸如移动计算设备(例如,膝上型计算机或平板计算机)、游戏控制台、远程控制设备、家庭自动化控制器或家用电器(包括家用温度或照明控制系统)、玩具、机器(诸如,机器人)、音频播放器、视频播放器或移动电话(例如,智能电话)。
应注意,上文所提及的实施方案例示而非限制本发明,且在不偏离随附权利要求的范围的情况下,本领域技术人员将能够设计许多替代实施方案。词语“包括”不排除除了在权利要求中所列出的那些元件或步骤之外的元件或步骤的存在,“一”或“一个”不排除多个,且单个特征或其他单元可以实现权利要求中所记载的若干单元的功能。权利要求中的任何参考数字或参考标注不应被解释为对所述权利要求范围的限制。
Claims (38)
1.一种确定声音是否由扬声器生成的方法,该方法包括:
接收代表所述声音的至少一部分的音频信号;
将所述音频信号分离在不同的频带中;
比较不同的频带的信号内容;以及
基于所述比较,标识信号内容中指示使用扬声器的基于频率的变化。
2.根据权利要求1所述的方法,其中比较不同的频带的信号内容的步骤包括:
对不同的频带的信号内容执行统计分析以生成统计度量,以及比较针对不同的频带的统计度量。
3.根据权利要求1或2所述的方法,还包括:
如果标识了信号内容中指示使用扬声器的变化,则生成扬声器指示输出信号。
4.根据权利要求1、2或3所述的方法,包括试图通过以下步骤在所接收的音频信号中检测由非线性所产生的特征,该非线性在第一音频频率处比在第二音频频率处更大:
将所接收的音频信号分离为第一音频频率分量和第二音频频率分量;以及
分析所述第一音频频率分量和所述第二音频频率分量。
5.根据权利要求4所述的方法,包括:
分析所述第一音频频率分量和所述第二音频频率分量,以获得相应的度量;以及
比较所述度量,以标识由非线性所产生的特征,该非线性在第一音频频率处比在第二音频频率处更大。
6.根据权利要求4或5所述的方法,其中分析所述第一音频频率分量和所述第二音频频率分量中的至少一个包括获得与相应的分量的样本值有关的统计度量。
7.根据权利要求6所述的方法,其中所述统计度量是所述声音的波形的不对称性的测量。
8.根据权利要求6所述的方法,其中所述统计度量是所述样本值的偏度的测量。
9.根据权利要求8所述的方法,其中所述偏度的测量是皮尔森偏度系数、非参数偏度或四分位偏度系数。
10.根据权利要求8或9在从属于权利要求5时所述的方法,包括:
获得所述第一音频频率分量的样本值的偏度的测量;
获得所述第二音频频率分量的样本值的偏度的测量;
如果所述第一音频频率分量的样本值的偏度的测量与所述第二音频频率分量的样本值的偏度的测量的比率超过了一个阈值,则确定所接收的音频信号具有由非线性所产生的特征,该非线性在第一音频频率处比在第二音频频率处更大。
11.根据权利要求10所述的方法,包括设置所述阈值。
12.根据权利要求10所述的方法,其中所接收的音频信号代表话语,所述方法包括基于说话人的假定身份来设置所述阈值。
13.根据权利要求10所述的方法,包括基于所接收的信号的水平来设置所述阈值。
14.根据权利要求8或9在从属于权利要求5时所述的方法,包括:
获得所述第一音频频率分量的样本值的偏度的测量;
获得所述第二音频频率分量的样本值的偏度的测量;
如果所述第一音频频率分量的样本值的偏度的测量与所述第二音频频率分量的样本值的偏度的测量之间的差异超过了一个阈值,则确定所接收的音频信号具有由非线性所产生的特征,该非线性在第一音频频率处比在第二音频频率处更大。
15.根据权利要求6至14中的一项所述的方法,包括在获得所述统计度量之前,去除具有小样本值的样本。
16.根据权利要求15所述的方法,包括使用非线性量化器来去除具有小样本值的样本。
17.根据权利要求6至14中的一项所述的方法,包括在获得所述统计度量之前,将非线性增益施加至所述样本值。
18.根据权利要求17所述的方法,其中所述非线性增益是压缩。
19.根据权利要求6所述的方法,其中获得与所述相应的分量的样本值有关的统计度量包括与所述相应的分量的样本值有关的累积分布函数。
20.根据权利要求19所述的方法,其中比较不同的频带的信号内容包括:
将每一累积分布函数与针对相应的分量的相应的参考累积分布函数进行比较,以获得它们之间的差异的测量;以及
比较针对相应的分量所获得的所述差异的测量。
21.根据权利要求19所述的方法,其中比较不同的频带的信号内容包括比较与相应的分量有关的累积分布函数。
22.根据任一项前述权利要求所述的方法,用于确定声音是否由具有已知谐振频率的扬声器生成,所述方法包括试图在所接收的音频信号中检测由非线性所产生的特征,该非线性在低于所述已知谐振频率的频率处比在高于所述已知谐振频率的频率处更大。
23.根据任一项前述权利要求所述的方法,包括使用机器学习技术来试图在所接收的音频信号中检测由非线性所产生的特征,该非线性在低音频频率处比在高音频频率处更大。
24.根据权利要求23所述的方法,包括将神经网络用于所述机器学习技术。
25.根据任一项前述权利要求所述的方法,包括:
接收代表所述声音的第一信号;
由所述第一信号导出代表所述声音的一部分的第二信号;以及
试图在所述第二信号中检测由非线性所产生的特征,该非线性在第一音频频率处比在第二音频频率处更大。
26.根据权利要求25所述的方法,其中所述第二信号代表话语。
27.根据权利要求26所述的方法,其中所述第二信号代表浊音话语。
28.根据权利要求25、26或27所述的方法,包括:
在语音活动检测器处接收所述第一信号;以及
仅当所述语音活动检测器在所述第一信号中检测到话语时,才导出代表话语的所述第二信号。
29.根据任一项前述权利要求所述的方法,所述方法用于在语音生物测定系统中使用,还包括:
如果确定所述声音是由扬声器生成的,则确定所述声音可能由对所述语音生物测定系统的重放攻击产生。
30.根据权利要求29所述的方法,包括:
仅当确定所述声音不是由扬声器生成时,才将所接收的音频信号传送至语音生物测定处理模块。
31.一种用于确定声音是否由扬声器生成的系统,该系统包括用于接收代表所述声音的至少一部分的音频信号的输入;以及,处理器;且所述系统被配置用于:
接收代表所述声音的至少一部分的音频信号;
将所述音频信号分离在不同的频带中;
比较不同的频带的信号内容;以及
基于所述比较,标识信号内容中指示使用扬声器的基于频率的变化。
32.一种包括根据权利要求31所述的系统的设备。
33.根据权利要求32所述的设备,其中所述设备包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器。
34.一种计算机程序产品,包括计算机可读有形介质,以及用于执行根据权利要求1至30中的任一项所述的方法的指令。
35.一种非暂时性计算机可读存储介质,在所述非暂时性计算机可读存储介质上存储有计算机可执行指令,当由处理器电路系统执行所述计算机可执行指令时,所述计算机可执行指令使所述处理器电路系统执行根据权利要求1至30中的任一项所述的方法。
36.一种包括根据权利要求35所述的非暂时性计算机可读存储介质的设备。
37.根据权利要求36所述的设备,其中所述设备包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器。
38.一种确定声音是否由扬声器生成的方法,该方法包括:
接收代表所述声音的音频信号;
试图在所接收的音频信号中检测由作为扬声器的特性的非线性所产生的特征;以及
如果检测到所述特征,则确定所述声音是由扬声器生成的。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762585660P | 2017-11-14 | 2017-11-14 | |
US62/585,660 | 2017-11-14 | ||
GB1801659.2 | 2018-02-01 | ||
GBGB1801659.2A GB201801659D0 (en) | 2017-11-14 | 2018-02-01 | Detection of loudspeaker playback |
PCT/GB2018/053274 WO2019097216A1 (en) | 2017-11-14 | 2018-11-13 | Detection of loudspeaker playback |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111316668A true CN111316668A (zh) | 2020-06-19 |
CN111316668B CN111316668B (zh) | 2021-09-28 |
Family
ID=61730925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880072084.6A Active CN111316668B (zh) | 2017-11-14 | 2018-11-13 | 扬声器回放的检测 |
Country Status (4)
Country | Link |
---|---|
US (2) | US10616701B2 (zh) |
CN (1) | CN111316668B (zh) |
GB (2) | GB201801659D0 (zh) |
WO (1) | WO2019097216A1 (zh) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019002831A1 (en) | 2017-06-27 | 2019-01-03 | Cirrus Logic International Semiconductor Limited | REPRODUCTIVE ATTACK DETECTION |
GB201713697D0 (en) | 2017-06-28 | 2017-10-11 | Cirrus Logic Int Semiconductor Ltd | Magnetic detection of replay attack |
GB2563953A (en) | 2017-06-28 | 2019-01-02 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201801530D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
GB201801526D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
GB201801527D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
GB201801528D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
GB201801532D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for audio playback |
GB201803570D0 (en) | 2017-10-13 | 2018-04-18 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201801661D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic International Uk Ltd | Detection of liveness |
GB201804843D0 (en) | 2017-11-14 | 2018-05-09 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201801663D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB2567503A (en) | 2017-10-13 | 2019-04-17 | Cirrus Logic Int Semiconductor Ltd | Analysing speech signals |
GB201801874D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Improving robustness of speech processing system against ultrasound and dolphin attacks |
GB201801664D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB201801659D0 (en) | 2017-11-14 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of loudspeaker playback |
US11475899B2 (en) | 2018-01-23 | 2022-10-18 | Cirrus Logic, Inc. | Speaker identification |
US11735189B2 (en) | 2018-01-23 | 2023-08-22 | Cirrus Logic, Inc. | Speaker identification |
US11264037B2 (en) | 2018-01-23 | 2022-03-01 | Cirrus Logic, Inc. | Speaker identification |
KR102531654B1 (ko) * | 2018-05-04 | 2023-05-11 | 삼성전자주식회사 | 음성 입력 인증 디바이스 및 그 방법 |
US10529356B2 (en) | 2018-05-15 | 2020-01-07 | Cirrus Logic, Inc. | Detecting unwanted audio signal components by comparing signals processed with differing linearity |
US10692490B2 (en) | 2018-07-31 | 2020-06-23 | Cirrus Logic, Inc. | Detection of replay attack |
US10915614B2 (en) | 2018-08-31 | 2021-02-09 | Cirrus Logic, Inc. | Biometric authentication |
US11037574B2 (en) | 2018-09-05 | 2021-06-15 | Cirrus Logic, Inc. | Speaker recognition and speaker change detection |
WO2020107261A1 (zh) * | 2018-11-28 | 2020-06-04 | 华为技术有限公司 | 一种检测概率无声故障的方法和装置 |
KR20220104693A (ko) | 2019-11-21 | 2022-07-26 | 시러스 로직 인터내셔널 세미컨덕터 리미티드 | 라이브 스피치 검출 |
US11527245B2 (en) * | 2020-04-29 | 2022-12-13 | Rovi Guides, Inc. | Systems and methods for avoiding inadvertently triggering a voice assistant |
US11854572B2 (en) | 2021-05-18 | 2023-12-26 | International Business Machines Corporation | Mitigating voice frequency loss |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104252860A (zh) * | 2013-06-26 | 2014-12-31 | 沃福森微电子股份有限公司 | 语音识别 |
CN105702263A (zh) * | 2016-01-06 | 2016-06-22 | 清华大学 | 语音重放检测方法和装置 |
CN105869630A (zh) * | 2016-06-27 | 2016-08-17 | 上海交通大学 | 基于深度学习的说话人语音欺骗攻击检测方法及系统 |
CN105913855A (zh) * | 2016-04-11 | 2016-08-31 | 宁波大学 | 一种基于长窗比例因子的回放语音攻击检测算法 |
CN105933272A (zh) * | 2015-12-30 | 2016-09-07 | 中国银联股份有限公司 | 能够防止录音攻击的声纹认证方法、服务器、终端及系统 |
CN105938716A (zh) * | 2016-03-30 | 2016-09-14 | 浙江大学 | 一种基于多精度拟合的样本复制语音自动检测方法 |
CN106297772A (zh) * | 2016-08-24 | 2017-01-04 | 武汉大学 | 基于扬声器引入的语音信号失真特性的回放攻检测方法 |
CN106531172A (zh) * | 2016-11-23 | 2017-03-22 | 湖北大学 | 基于环境噪声变化检测的说话人语音回放鉴别方法及系统 |
CN107251573A (zh) * | 2014-12-23 | 2017-10-13 | 思睿逻辑国际半导体有限公司 | 包括集成语音分析的麦克风单元 |
Family Cites Families (246)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT1229725B (it) | 1989-05-15 | 1991-09-07 | Face Standard Ind | Metodo e disposizione strutturale per la differenziazione tra elementi sonori e sordi del parlato |
US5568559A (en) | 1993-12-17 | 1996-10-22 | Canon Kabushiki Kaisha | Sound processing apparatus |
US5710866A (en) | 1995-05-26 | 1998-01-20 | Microsoft Corporation | System and method for speech recognition using dynamically adjusted confidence measure |
US5787187A (en) | 1996-04-01 | 1998-07-28 | Sandia Corporation | Systems and methods for biometric identification using the acoustic properties of the ear canal |
JP2002514318A (ja) * | 1997-01-31 | 2002-05-14 | ティ―ネティックス,インコーポレイテッド | 録音された音声を検出するシステムおよび方法 |
US6182037B1 (en) | 1997-05-06 | 2001-01-30 | International Business Machines Corporation | Speaker recognition over large population with fast and detailed matches |
US6229880B1 (en) | 1998-05-21 | 2001-05-08 | Bell Atlantic Network Services, Inc. | Methods and apparatus for efficiently providing a communication system with speech recognition capabilities |
US6275806B1 (en) | 1999-08-31 | 2001-08-14 | Andersen Consulting, Llp | System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters |
US7039951B1 (en) | 2000-06-06 | 2006-05-02 | International Business Machines Corporation | System and method for confidence based incremental access authentication |
JP2002143130A (ja) | 2000-11-08 | 2002-05-21 | Matsushita Electric Ind Co Ltd | 個人認証方法、および個人認証装置、およびこの装置を搭載した情報通信装置、および個人認証システム |
US7016833B2 (en) | 2000-11-21 | 2006-03-21 | The Regents Of The University Of California | Speaker verification system using acoustic data and non-acoustic data |
GB2375205A (en) | 2001-05-03 | 2002-11-06 | Orange Personal Comm Serv Ltd | Determining identity of a user |
US20020194003A1 (en) | 2001-06-05 | 2002-12-19 | Mozer Todd F. | Client-server security system and method |
WO2002103680A2 (en) | 2001-06-19 | 2002-12-27 | Securivox Ltd | Speaker recognition system ____________________________________ |
JP2003058190A (ja) | 2001-08-09 | 2003-02-28 | Mitsubishi Heavy Ind Ltd | 個人認証方式 |
US7240007B2 (en) | 2001-12-13 | 2007-07-03 | Matsushita Electric Industrial Co., Ltd. | Speaker authentication by fusion of voiceprint match attempt results with additional information |
US8148989B2 (en) | 2002-03-11 | 2012-04-03 | Keith Kopp | Ferromagnetic detection enhancer compatible with magnetic resonance |
JP4195267B2 (ja) | 2002-03-14 | 2008-12-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声認識装置、その音声認識方法及びプログラム |
JP2003271191A (ja) | 2002-03-15 | 2003-09-25 | Toshiba Corp | 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム |
US20040006481A1 (en) | 2002-07-03 | 2004-01-08 | Daniel Kiecza | Fast transcription of speech |
US7424427B2 (en) | 2002-10-17 | 2008-09-09 | Verizon Corporate Services Group Inc. | Systems and methods for classifying audio into broad phoneme classes |
JP4247002B2 (ja) | 2003-01-22 | 2009-04-02 | 富士通株式会社 | マイクロホンアレイを用いた話者距離検出装置及び方法並びに当該装置を用いた音声入出力装置 |
US7418392B1 (en) | 2003-09-25 | 2008-08-26 | Sensory, Inc. | System and method for controlling the operation of a device by voice commands |
US20060116874A1 (en) | 2003-10-24 | 2006-06-01 | Jonas Samuelsson | Noise-dependent postfiltering |
US7492913B2 (en) | 2003-12-16 | 2009-02-17 | Intel Corporation | Location aware directed audio |
US20050171774A1 (en) | 2004-01-30 | 2005-08-04 | Applebaum Ted H. | Features and techniques for speaker authentication |
JP4217646B2 (ja) | 2004-03-26 | 2009-02-04 | キヤノン株式会社 | 認証方法及び認証装置 |
EP1600791B1 (en) | 2004-05-26 | 2009-04-01 | Honda Research Institute Europe GmbH | Sound source localization based on binaural signals |
JP4359887B2 (ja) | 2004-06-23 | 2009-11-11 | 株式会社デンソー | 個人認証システム |
WO2006054205A1 (en) | 2004-11-16 | 2006-05-26 | Koninklijke Philips Electronics N.V. | Audio device for and method of determining biometric characteristincs of a user. |
US7529379B2 (en) | 2005-01-04 | 2009-05-05 | Motorola, Inc. | System and method for determining an in-ear acoustic response for confirming the identity of a user |
US20060171571A1 (en) | 2005-02-01 | 2006-08-03 | Chan Michael T | Systems and methods for quality-based fusion of multiple biometrics for authentication |
JP3906230B2 (ja) | 2005-03-11 | 2007-04-18 | 株式会社東芝 | 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US7536304B2 (en) | 2005-05-27 | 2009-05-19 | Porticus, Inc. | Method and system for bio-metric voice print authentication |
US20070055517A1 (en) | 2005-08-30 | 2007-03-08 | Brian Spector | Multi-factor biometric authentication |
WO2007034371A2 (en) | 2005-09-22 | 2007-03-29 | Koninklijke Philips Electronics N.V. | Method and apparatus for acoustical outer ear characterization |
US8458465B1 (en) | 2005-11-16 | 2013-06-04 | AT&T Intellectual Property II, L. P. | Biometric authentication |
US20070129941A1 (en) | 2005-12-01 | 2007-06-07 | Hitachi, Ltd. | Preprocessing system and method for reducing FRR in speaking recognition |
US8549318B2 (en) | 2006-02-13 | 2013-10-01 | Affirmed Technologies, Llc | Method and system for preventing unauthorized use of a vehicle by an operator of the vehicle |
ATE449404T1 (de) | 2006-04-03 | 2009-12-15 | Voice Trust Ag | Sprecherauthentifizierung in digitalen kommunikationsnetzen |
US7552467B2 (en) | 2006-04-24 | 2009-06-23 | Jeffrey Dean Lindsay | Security systems for protecting an asset |
US8760636B2 (en) | 2006-08-11 | 2014-06-24 | Thermo Scientific Portable Analytical Instruments Inc. | Object scanning and authentication |
US7372770B2 (en) | 2006-09-12 | 2008-05-13 | Mitsubishi Electric Research Laboratories, Inc. | Ultrasonic Doppler sensor for speech-based user interface |
EP2070231B1 (en) | 2006-10-03 | 2013-07-03 | Shazam Entertainment, Ltd. | Method for high throughput of identification of distributed broadcast content |
EP1928213B1 (en) | 2006-11-30 | 2012-08-01 | Harman Becker Automotive Systems GmbH | Headtracking system and method |
JP5012092B2 (ja) | 2007-03-02 | 2012-08-29 | 富士通株式会社 | 生体認証装置、生体認証プログラムおよび複合型生体認証方法 |
WO2008113024A1 (en) | 2007-03-14 | 2008-09-18 | Spectros Corporation | Metabolism-or biochemical-based anti-spoofing biometrics devices, systems, and methods |
US20080285813A1 (en) | 2007-05-14 | 2008-11-20 | Motorola, Inc. | Apparatus and recognition method for capturing ear biometric in wireless communication devices |
WO2009022454A1 (ja) | 2007-08-10 | 2009-02-19 | Panasonic Corporation | 音声分離装置、音声合成装置および声質変換装置 |
AU2015202397B2 (en) | 2007-09-24 | 2017-03-02 | Apple Inc. | Embedded authentication systems in an electronic device |
US20090105548A1 (en) | 2007-10-23 | 2009-04-23 | Bart Gary F | In-Ear Biometrics |
WO2009104437A1 (ja) | 2008-02-22 | 2009-08-27 | 日本電気株式会社 | 生体認証装置、生体認証方法及び生体認証用プログラム |
US8150108B2 (en) | 2008-03-17 | 2012-04-03 | Ensign Holdings, Llc | Systems and methods of identification based on biometric parameters |
US8315876B2 (en) | 2008-05-09 | 2012-11-20 | Plantronics, Inc. | Headset wearer identity authentication with voice print or speech recognition |
US8380503B2 (en) * | 2008-06-23 | 2013-02-19 | John Nicholas and Kristin Gross Trust | System and method for generating challenge items for CAPTCHAs |
US8793135B2 (en) | 2008-08-25 | 2014-07-29 | At&T Intellectual Property I, L.P. | System and method for auditory captchas |
US20100076770A1 (en) | 2008-09-23 | 2010-03-25 | Veeru Ramaswamy | System and Method for Improving the Performance of Voice Biometrics |
JP2010086328A (ja) | 2008-09-30 | 2010-04-15 | Yamaha Corp | 認証装置および携帯電話機 |
US8442824B2 (en) | 2008-11-26 | 2013-05-14 | Nuance Communications, Inc. | Device, system, and method of liveness detection utilizing voice biometrics |
WO2010066269A1 (en) | 2008-12-10 | 2010-06-17 | Agnitio, S.L. | Method for verifying the identify of a speaker and related computer readable medium and computer |
US9767806B2 (en) * | 2013-09-24 | 2017-09-19 | Cirrus Logic International Semiconductor Ltd. | Anti-spoofing |
US20150112682A1 (en) | 2008-12-10 | 2015-04-23 | Agnitio Sl | Method for verifying the identity of a speaker and related computer readable medium and computer |
US8997191B1 (en) | 2009-02-03 | 2015-03-31 | ServiceSource International, Inc. | Gradual template generation |
US8275622B2 (en) | 2009-02-06 | 2012-09-25 | Mitsubishi Electric Research Laboratories, Inc. | Ultrasonic doppler sensor for speaker recognition |
US8130915B2 (en) | 2009-08-26 | 2012-03-06 | International Business Machines Corporation | Verification of user presence during an interactive voice response system session |
CN101673544B (zh) | 2009-10-10 | 2012-07-04 | 上海电虹软件有限公司 | 一种基于声纹识别和定位跟踪的交叉监控方法和系统 |
US20130024191A1 (en) | 2010-04-12 | 2013-01-24 | Freescale Semiconductor, Inc. | Audio communication device, method for outputting an audio signal, and communication system |
US8775179B2 (en) | 2010-05-06 | 2014-07-08 | Senam Consulting, Inc. | Speech-based speaker recognition systems and methods |
US10204625B2 (en) | 2010-06-07 | 2019-02-12 | Affectiva, Inc. | Audio analysis learning using video data |
US9118488B2 (en) | 2010-06-17 | 2015-08-25 | Aliphcom | System and method for controlling access to network services using biometric authentication |
US20110317848A1 (en) | 2010-06-23 | 2011-12-29 | Motorola, Inc. | Microphone Interference Detection Method and Apparatus |
US10042993B2 (en) | 2010-11-02 | 2018-08-07 | Homayoon Beigi | Access control through multifactor authentication with multimodal biometrics |
US9064257B2 (en) | 2010-11-02 | 2015-06-23 | Homayoon Beigi | Mobile device transaction using multi-factor authentication |
US9354310B2 (en) | 2011-03-03 | 2016-05-31 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for source localization using audible sound and ultrasound |
US9049983B1 (en) | 2011-04-08 | 2015-06-09 | Amazon Technologies, Inc. | Ear recognition as device input |
CA2835460C (en) | 2011-05-10 | 2018-05-29 | Foteini AGRAFIOTI | System and method for enabling continuous or instantaneous identity recognition based on physiological biometric signals |
US8655796B2 (en) | 2011-06-17 | 2014-02-18 | Sanjay Udani | Methods and systems for recording verifiable documentation |
US9536523B2 (en) | 2011-06-22 | 2017-01-03 | Vocalzoom Systems Ltd. | Method and system for identification of speech segments |
EP2546680B1 (en) | 2011-07-13 | 2014-06-04 | Sercel | Method and device for automatically detecting marine animals |
US8548803B2 (en) | 2011-08-08 | 2013-10-01 | The Intellisis Corporation | System and method of processing a sound signal including transforming the sound signal into a frequency-chirp domain |
US9171548B2 (en) | 2011-08-19 | 2015-10-27 | The Boeing Company | Methods and systems for speaker identity verification |
CN102982804B (zh) | 2011-09-02 | 2017-05-03 | 杜比实验室特许公司 | 音频分类方法和系统 |
US8768707B2 (en) | 2011-09-27 | 2014-07-01 | Sensory Incorporated | Background speech recognition assistant using speaker verification |
US8613066B1 (en) | 2011-12-30 | 2013-12-17 | Amazon Technologies, Inc. | Techniques for user authentication |
GB2499781A (en) | 2012-02-16 | 2013-09-04 | Ian Vince Mcloughlin | Acoustic information used to determine a user's mouth state which leads to operation of a voice activity detector |
KR101971697B1 (ko) | 2012-02-24 | 2019-04-23 | 삼성전자주식회사 | 사용자 디바이스에서 복합 생체인식 정보를 이용한 사용자 인증 방법 및 장치 |
US9042867B2 (en) | 2012-02-24 | 2015-05-26 | Agnitio S.L. | System and method for speaker recognition on mobile devices |
CN103295578B (zh) | 2012-03-01 | 2016-05-18 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
CN104205721B (zh) | 2012-03-08 | 2018-03-23 | 诺基亚技术有限公司 | 情景感知自适应认证方法和装置 |
US20130275873A1 (en) | 2012-04-13 | 2013-10-17 | Qualcomm Incorporated | Systems and methods for displaying a user interface |
US20130279724A1 (en) | 2012-04-19 | 2013-10-24 | Sony Computer Entertainment Inc. | Auto detection of headphone orientation |
US9013960B2 (en) | 2012-04-20 | 2015-04-21 | Symbol Technologies, Inc. | Orientation of an ultrasonic signal |
US8676579B2 (en) | 2012-04-30 | 2014-03-18 | Blackberry Limited | Dual microphone voice authentication for mobile device |
US9363670B2 (en) | 2012-08-27 | 2016-06-07 | Optio Labs, Inc. | Systems and methods for restricting access to network resources via in-location access point protocol |
US20140067679A1 (en) | 2012-08-28 | 2014-03-06 | Solink Corporation | Transaction Verification System |
AU2013315343B2 (en) | 2012-09-11 | 2019-05-30 | Auraya Pty Ltd | Voice authentication system and method |
US8856541B1 (en) | 2013-01-10 | 2014-10-07 | Google Inc. | Liveness detection |
WO2014112375A1 (ja) | 2013-01-17 | 2014-07-24 | 日本電気株式会社 | 話者識別装置、話者識別方法、および話者識別用プログラム |
KR101829114B1 (ko) | 2013-01-25 | 2018-03-29 | 퀄컴 인코포레이티드 | 모바일 디바이스에 대한 거동 특징들의 적응적 관찰 |
CN103973441B (zh) | 2013-01-29 | 2016-03-09 | 腾讯科技(深圳)有限公司 | 基于音视频的用户认证方法和装置 |
US9152869B2 (en) | 2013-02-26 | 2015-10-06 | Qtech Systems Inc. | Biometric authentication systems and methods |
JP6093040B2 (ja) | 2013-03-14 | 2017-03-08 | インテル コーポレイション | サービスを提供するための装置、方法、コンピュータプログラム及び記憶媒体 |
US9721086B2 (en) | 2013-03-15 | 2017-08-01 | Advanced Elemental Technologies, Inc. | Methods and systems for secure and reliable identity-based computing |
US9263055B2 (en) | 2013-04-10 | 2016-02-16 | Google Inc. | Systems and methods for three-dimensional audio CAPTCHA |
US9317736B1 (en) | 2013-05-08 | 2016-04-19 | Amazon Technologies, Inc. | Individual record verification based on features |
US9679053B2 (en) | 2013-05-20 | 2017-06-13 | The Nielsen Company (Us), Llc | Detecting media watermarks in magnetic field data |
GB2515527B (en) | 2013-06-26 | 2016-08-31 | Cirrus Logic Int Semiconductor Ltd | Speech Recognition |
CN110096253B (zh) | 2013-07-11 | 2022-08-30 | 英特尔公司 | 利用相同的音频输入的设备唤醒和说话者验证 |
US9965608B2 (en) | 2013-07-18 | 2018-05-08 | Samsung Electronics Co., Ltd. | Biometrics-based authentication method and apparatus |
US9711148B1 (en) | 2013-07-18 | 2017-07-18 | Google Inc. | Dual model speaker identification |
US9523764B2 (en) | 2013-08-01 | 2016-12-20 | Symbol Technologies, Llc | Detection of multipath and transmit level adaptation thereto for ultrasonic locationing |
US10030878B2 (en) | 2013-08-21 | 2018-07-24 | Honeywell International Inc. | User interaction with building controller device using a remote server and a duplex connection |
EP3040985B1 (en) | 2013-08-26 | 2023-08-23 | Samsung Electronics Co., Ltd. | Electronic device and method for voice recognition |
US9484036B2 (en) * | 2013-08-28 | 2016-11-01 | Nuance Communications, Inc. | Method and apparatus for detecting synthesized speech |
EP2860706A3 (en) | 2013-09-24 | 2015-08-12 | Agnitio S.L. | Anti-spoofing |
KR102333704B1 (ko) | 2013-09-30 | 2021-12-01 | 삼성전자주식회사 | 생체 신호에 기초하여 컨텐츠를 처리하는 방법, 및 그에 따른 디바이스 |
US20170049335A1 (en) | 2015-08-19 | 2017-02-23 | Logitech Europe, S.A. | Earphones with biometric sensors |
US10229256B2 (en) * | 2013-10-25 | 2019-03-12 | Intel Corporation | Techniques for preventing voice replay attacks |
CN104143326B (zh) | 2013-12-03 | 2016-11-02 | 腾讯科技(深圳)有限公司 | 一种语音命令识别方法和装置 |
ES2907259T3 (es) | 2013-12-06 | 2022-04-22 | The Adt Security Corp | Aplicación activada por voz para dispositivos móviles |
US9530066B2 (en) | 2013-12-11 | 2016-12-27 | Descartes Biometrics, Inc | Ear-scan-based biometric authentication |
US20150168996A1 (en) | 2013-12-17 | 2015-06-18 | United Sciences, Llc | In-ear wearable computer |
US9390726B1 (en) | 2013-12-30 | 2016-07-12 | Google Inc. | Supplementing speech commands with gestures |
US9430629B1 (en) | 2014-01-24 | 2016-08-30 | Microstrategy Incorporated | Performing biometrics in uncontrolled environments |
WO2015117674A1 (en) | 2014-02-07 | 2015-08-13 | Huawei Technologies Co., Ltd. | Method for unlocking a mobile communication device and a device thereof |
US10248770B2 (en) | 2014-03-17 | 2019-04-02 | Sensory, Incorporated | Unobtrusive verification of user identity |
US10540979B2 (en) | 2014-04-17 | 2020-01-21 | Qualcomm Incorporated | User interface for secure access to a device using speaker verification |
US10516657B2 (en) | 2014-04-24 | 2019-12-24 | Mcafee, Llc | Methods and apparatus to enhance security of authentication |
US9412358B2 (en) | 2014-05-13 | 2016-08-09 | At&T Intellectual Property I, L.P. | System and method for data-driven socially customized models for language generation |
US9384738B2 (en) | 2014-06-24 | 2016-07-05 | Google Inc. | Dynamic threshold for speaker verification |
WO2016003299A1 (en) | 2014-07-04 | 2016-01-07 | Intel Corporation | Replay attack detection in automatic speaker verification systems |
US9613200B2 (en) | 2014-07-16 | 2017-04-04 | Descartes Biometrics, Inc. | Ear biometric capture, authentication, and identification method and system |
US9549273B2 (en) | 2014-08-28 | 2017-01-17 | Qualcomm Incorporated | Selective enabling of a component by a microphone circuit |
US9959863B2 (en) | 2014-09-08 | 2018-05-01 | Qualcomm Incorporated | Keyword detection using speaker-independent keyword models for user-designated keywords |
US9396537B2 (en) | 2014-09-09 | 2016-07-19 | EyeVerify, Inc. | Systems and methods for liveness analysis |
US9548979B1 (en) | 2014-09-19 | 2017-01-17 | United Services Automobile Association (Usaa) | Systems and methods for authentication program enrollment |
US9794653B2 (en) | 2014-09-27 | 2017-10-17 | Valencell, Inc. | Methods and apparatus for improving signal quality in wearable biometric monitoring devices |
JP6303971B2 (ja) | 2014-10-17 | 2018-04-04 | 富士通株式会社 | 話者交替検出装置、話者交替検出方法及び話者交替検出用コンピュータプログラム |
PL3016314T3 (pl) | 2014-10-28 | 2017-08-31 | Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie | System i sposób detekcji zapisanej informacji biometrycznej |
US9418656B2 (en) | 2014-10-29 | 2016-08-16 | Google Inc. | Multi-stage hotword detection |
US10262655B2 (en) | 2014-11-03 | 2019-04-16 | Microsoft Technology Licensing, Llc | Augmentation of key phrase user recognition |
US10318575B2 (en) | 2014-11-14 | 2019-06-11 | Zorroa Corporation | Systems and methods of building and using an image catalog |
US10740465B2 (en) | 2014-12-05 | 2020-08-11 | Texas State University—San Marcos | Detection of print-based spoofing attacks |
JP6394709B2 (ja) | 2014-12-11 | 2018-09-26 | 日本電気株式会社 | 話者識別装置および話者識別用の登録音声の特徴量登録方法 |
US9437193B2 (en) | 2015-01-21 | 2016-09-06 | Microsoft Technology Licensing, Llc | Environment adjusted speaker identification |
US9734410B2 (en) | 2015-01-23 | 2017-08-15 | Shindig, Inc. | Systems and methods for analyzing facial expressions within an online classroom to gauge participant attentiveness |
US9300801B1 (en) | 2015-01-30 | 2016-03-29 | Mattersight Corporation | Personality analysis of mono-recording system and methods |
US20170011406A1 (en) | 2015-02-10 | 2017-01-12 | NXT-ID, Inc. | Sound-Directed or Behavior-Directed Method and System for Authenticating a User and Executing a Transaction |
US9305155B1 (en) | 2015-02-12 | 2016-04-05 | United Services Automobile Association (Usaa) | Toggling biometric authentication |
US10305895B2 (en) | 2015-04-14 | 2019-05-28 | Blubox Security, Inc. | Multi-factor and multi-mode biometric physical access control device |
JP6596376B2 (ja) | 2015-04-22 | 2019-10-23 | パナソニック株式会社 | 話者識別方法及び話者識別装置 |
US10709388B2 (en) | 2015-05-08 | 2020-07-14 | Staton Techiya, Llc | Biometric, physiological or environmental monitoring using a closed chamber |
KR20180015162A (ko) | 2015-05-31 | 2018-02-12 | 센스4캐어 | 사람 활동을 원격 모니터링하는 시스템 |
US9641585B2 (en) | 2015-06-08 | 2017-05-02 | Cisco Technology, Inc. | Automated video editing based on activity in video conference |
MY182294A (en) | 2015-06-16 | 2021-01-18 | Eyeverify Inc | Systems and methods for spoof detection and liveness analysis |
CN105185380B (zh) | 2015-06-24 | 2020-06-23 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
US10178301B1 (en) | 2015-06-25 | 2019-01-08 | Amazon Technologies, Inc. | User identification based on voice and face |
US10546183B2 (en) | 2015-08-10 | 2020-01-28 | Yoti Holding Limited | Liveness detection |
GB2541466B (en) | 2015-08-21 | 2020-01-01 | Validsoft Ltd | Replay attack detection |
US10277581B2 (en) | 2015-09-08 | 2019-04-30 | Oath, Inc. | Audio verification |
US9838775B2 (en) | 2015-09-16 | 2017-12-05 | Apple Inc. | Earbuds with biometric sensing |
US20180289354A1 (en) | 2015-09-30 | 2018-10-11 | Koninklijke Philips N.V. | Ultrasound apparatus and method for determining a medical condition of a subject |
EP3156978A1 (en) | 2015-10-14 | 2017-04-19 | Samsung Electronics Polska Sp. z o.o. | A system and a method for secure speaker verification |
KR102405793B1 (ko) | 2015-10-15 | 2022-06-08 | 삼성전자 주식회사 | 음성 신호 인식 방법 및 이를 제공하는 전자 장치 |
US9613245B1 (en) | 2015-10-22 | 2017-04-04 | Motorola Mobility Llc | Device and method for authentication by a biometric sensor |
US10062388B2 (en) | 2015-10-22 | 2018-08-28 | Motorola Mobility Llc | Acoustic and surface vibration authentication |
US10937407B2 (en) | 2015-10-26 | 2021-03-02 | Staton Techiya, Llc | Biometric, physiological or environmental monitoring using a closed chamber |
JP6324939B2 (ja) | 2015-11-05 | 2018-05-16 | 株式会社ソニー・インタラクティブエンタテインメント | 情報処理装置およびログイン制御方法 |
US9691392B1 (en) | 2015-12-09 | 2017-06-27 | Uniphore Software Systems | System and method for improved audio consistency |
WO2017127646A1 (en) | 2016-01-22 | 2017-07-27 | Knowles Electronics, Llc | Shared secret voice authentication |
SG10201600561YA (en) | 2016-01-25 | 2017-08-30 | Mastercard Asia Pacific Pte Ltd | A Method For Facilitating A Transaction Using A Humanoid Robot |
DE102016000630A1 (de) | 2016-01-25 | 2017-07-27 | Boxine Gmbh | Spielzeug |
WO2017137947A1 (en) | 2016-02-10 | 2017-08-17 | Vats Nitin | Producing realistic talking face with expression using images text and voice |
US10262188B2 (en) | 2016-02-15 | 2019-04-16 | Qualcomm Incorporated | Liveness and spoof detection for ultrasonic fingerprint sensors |
US20170256270A1 (en) | 2016-03-02 | 2017-09-07 | Motorola Mobility Llc | Voice Recognition Accuracy in High Noise Conditions |
US10476888B2 (en) | 2016-03-23 | 2019-11-12 | Georgia Tech Research Corporation | Systems and methods for using video for user and message authentication |
US9972322B2 (en) | 2016-03-29 | 2018-05-15 | Intel Corporation | Speaker recognition using adaptive thresholding |
US9984314B2 (en) | 2016-05-06 | 2018-05-29 | Microsoft Technology Licensing, Llc | Dynamic classifier selection based on class skew |
US20170347348A1 (en) | 2016-05-25 | 2017-11-30 | Smartear, Inc. | In-Ear Utility Device Having Information Sharing |
CN109196879A (zh) | 2016-05-27 | 2019-01-11 | 布佳通有限公司 | 确定在用户的耳朵处的耳机存在 |
GB2551209B (en) | 2016-06-06 | 2019-12-04 | Cirrus Logic Int Semiconductor Ltd | Voice user interface |
US10635800B2 (en) | 2016-06-07 | 2020-04-28 | Vocalzoom Systems Ltd. | System, device, and method of voice-based user authentication utilizing a challenge |
EP4113511A1 (en) | 2016-07-11 | 2023-01-04 | FTR Labs Pty Ltd | Method and system for automatically diarising a sound recording |
US10433052B2 (en) | 2016-07-16 | 2019-10-01 | Ron Zass | System and method for identifying speech prosody |
KR20180013524A (ko) | 2016-07-29 | 2018-02-07 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 생체 정보 인증 방법 |
GB2552721A (en) | 2016-08-03 | 2018-02-07 | Cirrus Logic Int Semiconductor Ltd | Methods and apparatus for authentication in an electronic device |
US9892732B1 (en) | 2016-08-12 | 2018-02-13 | Paypal, Inc. | Location based voice recognition system |
US10079024B1 (en) * | 2016-08-19 | 2018-09-18 | Amazon Technologies, Inc. | Detecting replay attacks in voice-based authentication |
EP3287921B1 (en) | 2016-08-26 | 2020-11-04 | Nxp B.V. | Spoken pass-phrase suitability determination |
US10460095B2 (en) | 2016-09-30 | 2019-10-29 | Bragi GmbH | Earpiece with biometric identifiers |
US10210723B2 (en) | 2016-10-17 | 2019-02-19 | At&T Intellectual Property I, L.P. | Wearable ultrasonic sensors with haptic signaling for blindside risk detection and notification |
US10198626B2 (en) | 2016-10-19 | 2019-02-05 | Snap Inc. | Neural networks for facial modeling |
US10678502B2 (en) | 2016-10-20 | 2020-06-09 | Qualcomm Incorporated | Systems and methods for in-ear control of remote devices |
JP2018074366A (ja) | 2016-10-28 | 2018-05-10 | 京セラ株式会社 | 電子機器、制御方法およびプログラム |
US20180146370A1 (en) | 2016-11-22 | 2018-05-24 | Ashok Krishnaswamy | Method and apparatus for secured authentication using voice biometrics and watermarking |
KR102072235B1 (ko) | 2016-12-08 | 2020-02-03 | 한국전자통신연구원 | 자동 발화속도 분류 방법 및 이를 이용한 음성인식 시스템 |
US10497382B2 (en) | 2016-12-16 | 2019-12-03 | Google Llc | Associating faces with voices for speaker diarization within videos |
US10432623B2 (en) | 2016-12-16 | 2019-10-01 | Plantronics, Inc. | Companion out-of-band authentication |
EP3555882B1 (en) | 2016-12-19 | 2021-10-27 | Rovi Guides, Inc. | Systems and methods for distinguishing valid voice commands from false voice commands in an interactive media guidance application |
US10032451B1 (en) | 2016-12-20 | 2018-07-24 | Amazon Technologies, Inc. | User recognition for speech processing systems |
US10192553B1 (en) | 2016-12-20 | 2019-01-29 | Amazon Technologes, Inc. | Initiating device speech activity monitoring for communication sessions |
US10237070B2 (en) | 2016-12-31 | 2019-03-19 | Nok Nok Labs, Inc. | System and method for sharing keys across authenticators |
US20180187969A1 (en) | 2017-01-03 | 2018-07-05 | Samsung Electronics Co., Ltd. | Refrigerator |
US10467509B2 (en) | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Computationally-efficient human-identifying smart assistant computer |
US10360916B2 (en) | 2017-02-22 | 2019-07-23 | Plantronics, Inc. | Enhanced voiceprint authentication |
US10692502B2 (en) * | 2017-03-03 | 2020-06-23 | Pindrop Security, Inc. | Method and apparatus for detecting spoofing conditions |
US9990926B1 (en) | 2017-03-13 | 2018-06-05 | Intel Corporation | Passive enrollment method for speaker identification systems |
US10347244B2 (en) | 2017-04-21 | 2019-07-09 | Go-Vivace Inc. | Dialogue system incorporating unique speech to text conversion method for meaningful dialogue response |
DK179948B1 (en) | 2017-05-16 | 2019-10-22 | Apple Inc. | Recording and sending Emoji |
US10410634B2 (en) | 2017-05-18 | 2019-09-10 | Smartear, Inc. | Ear-borne audio device conversation recording and compressed data transmission |
US10210685B2 (en) | 2017-05-23 | 2019-02-19 | Mastercard International Incorporated | Voice biometric analysis systems and methods for verbal transactions conducted over a communications network |
GB2580856A (en) | 2017-06-13 | 2020-08-05 | Beijing Didi Infinity Technology & Dev Co Ltd | International Patent Application For Method, apparatus and system for speaker verification |
US10339935B2 (en) | 2017-06-19 | 2019-07-02 | Intel Corporation | Context-aware enrollment for text independent speaker recognition |
WO2019002831A1 (en) | 2017-06-27 | 2019-01-03 | Cirrus Logic International Semiconductor Limited | REPRODUCTIVE ATTACK DETECTION |
GB2563953A (en) | 2017-06-28 | 2019-01-02 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201713697D0 (en) | 2017-06-28 | 2017-10-11 | Cirrus Logic Int Semiconductor Ltd | Magnetic detection of replay attack |
GB201801527D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
GB201801530D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
GB201801526D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
JP7197259B2 (ja) | 2017-08-25 | 2022-12-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法、情報処理装置およびプログラム |
JP7123540B2 (ja) | 2017-09-25 | 2022-08-23 | キヤノン株式会社 | 音声情報による入力を受け付ける情報処理端末、方法、その情報処理端末を含むシステム |
US10733987B1 (en) | 2017-09-26 | 2020-08-04 | Amazon Technologies, Inc. | System and methods for providing unplayed content |
GB201801663D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB201801664D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB201801874D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Improving robustness of speech processing system against ultrasound and dolphin attacks |
GB201803570D0 (en) | 2017-10-13 | 2018-04-18 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB2567503A (en) | 2017-10-13 | 2019-04-17 | Cirrus Logic Int Semiconductor Ltd | Analysing speech signals |
GB201801661D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic International Uk Ltd | Detection of liveness |
GB201804843D0 (en) | 2017-11-14 | 2018-05-09 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
US10515640B2 (en) | 2017-11-08 | 2019-12-24 | Intel Corporation | Generating dialogue based on verification scores |
GB201801659D0 (en) | 2017-11-14 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of loudspeaker playback |
US10733276B2 (en) | 2017-12-08 | 2020-08-04 | Cirrus Logic International Semiconductor Ltd. | Multi-microphone human talker detection |
NO344671B1 (en) | 2017-12-21 | 2020-03-02 | Elliptic Laboratories As | Contextual display |
US11264037B2 (en) | 2018-01-23 | 2022-03-01 | Cirrus Logic, Inc. | Speaker identification |
US11735189B2 (en) | 2018-01-23 | 2023-08-22 | Cirrus Logic, Inc. | Speaker identification |
GB2608710B (en) | 2018-01-23 | 2023-05-17 | Cirrus Logic Int Semiconductor Ltd | Speaker identification |
US10834365B2 (en) | 2018-02-08 | 2020-11-10 | Nortek Security & Control Llc | Audio-visual monitoring using a virtual assistant |
US11335079B2 (en) | 2018-03-05 | 2022-05-17 | Intel Corporation | Method and system of reflection suppression for image processing |
US10063542B1 (en) | 2018-03-16 | 2018-08-28 | Fmr Llc | Systems and methods for simultaneous voice and sound multifactor authentication |
US10878825B2 (en) | 2018-03-21 | 2020-12-29 | Cirrus Logic, Inc. | Biometric processes |
US10720166B2 (en) | 2018-04-09 | 2020-07-21 | Synaptics Incorporated | Voice biometrics systems and methods |
US10685075B2 (en) | 2018-04-11 | 2020-06-16 | Motorola Solutions, Inc. | System and method for tailoring an electronic digital assistant query as a function of captured multi-party voice dialog and an electronically stored multi-party voice-interaction template |
US11196669B2 (en) | 2018-05-17 | 2021-12-07 | At&T Intellectual Property I, L.P. | Network routing of media streams based upon semantic contents |
LU100813B1 (en) | 2018-06-05 | 2019-12-05 | Essence Smartcare Ltd | Identifying a location of a person |
US10904246B2 (en) | 2018-06-26 | 2021-01-26 | International Business Machines Corporation | Single channel input multi-factor authentication via separate processing pathways |
US10593336B2 (en) | 2018-07-26 | 2020-03-17 | Accenture Global Solutions Limited | Machine learning for authenticating voice |
-
2018
- 2018-02-01 GB GBGB1801659.2A patent/GB201801659D0/en not_active Ceased
- 2018-11-13 CN CN201880072084.6A patent/CN111316668B/zh active Active
- 2018-11-13 US US16/189,372 patent/US10616701B2/en active Active
- 2018-11-13 GB GB2006210.5A patent/GB2581295B/en active Active
- 2018-11-13 WO PCT/GB2018/053274 patent/WO2019097216A1/en active Application Filing
-
2020
- 2020-02-28 US US16/805,428 patent/US11051117B2/en active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104252860A (zh) * | 2013-06-26 | 2014-12-31 | 沃福森微电子股份有限公司 | 语音识别 |
CN107251573A (zh) * | 2014-12-23 | 2017-10-13 | 思睿逻辑国际半导体有限公司 | 包括集成语音分析的麦克风单元 |
CN105933272A (zh) * | 2015-12-30 | 2016-09-07 | 中国银联股份有限公司 | 能够防止录音攻击的声纹认证方法、服务器、终端及系统 |
CN105702263A (zh) * | 2016-01-06 | 2016-06-22 | 清华大学 | 语音重放检测方法和装置 |
CN105938716A (zh) * | 2016-03-30 | 2016-09-14 | 浙江大学 | 一种基于多精度拟合的样本复制语音自动检测方法 |
CN105913855A (zh) * | 2016-04-11 | 2016-08-31 | 宁波大学 | 一种基于长窗比例因子的回放语音攻击检测算法 |
CN105869630A (zh) * | 2016-06-27 | 2016-08-17 | 上海交通大学 | 基于深度学习的说话人语音欺骗攻击检测方法及系统 |
CN106297772A (zh) * | 2016-08-24 | 2017-01-04 | 武汉大学 | 基于扬声器引入的语音信号失真特性的回放攻检测方法 |
CN106531172A (zh) * | 2016-11-23 | 2017-03-22 | 湖北大学 | 基于环境噪声变化检测的说话人语音回放鉴别方法及系统 |
Non-Patent Citations (1)
Title |
---|
JESUS VILLALBA ET AL: ""Preventing replay attacks on speaker verification systems"", 《SECURITY TECHNOLOGY (ICCST), 2011 IEEE INTERNATIONAL CARNAHAN CONFERENCE ON》 * |
Also Published As
Publication number | Publication date |
---|---|
US20200204937A1 (en) | 2020-06-25 |
GB2581295B (en) | 2022-04-06 |
US11051117B2 (en) | 2021-06-29 |
GB201801659D0 (en) | 2018-03-21 |
WO2019097216A1 (en) | 2019-05-23 |
CN111316668B (zh) | 2021-09-28 |
US20190149932A1 (en) | 2019-05-16 |
US10616701B2 (en) | 2020-04-07 |
GB202006210D0 (en) | 2020-06-10 |
GB2581295A (en) | 2020-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111316668B (zh) | 扬声器回放的检测 | |
US11704397B2 (en) | Detection of replay attack | |
US10832702B2 (en) | Robustness of speech processing system against ultrasound and dolphin attacks | |
US11276409B2 (en) | Detection of replay attack | |
US11631402B2 (en) | Detection of replay attack | |
US10839808B2 (en) | Detection of replay attack | |
WO2019002831A1 (en) | REPRODUCTIVE ATTACK DETECTION | |
GB2567503A (en) | Analysing speech signals | |
CN110785809A (zh) | 重放攻击的磁检测 | |
US10529356B2 (en) | Detecting unwanted audio signal components by comparing signals processed with differing linearity | |
US10818298B2 (en) | Audio processing | |
US10762905B2 (en) | Speaker verification | |
US11024318B2 (en) | Speaker verification | |
US20230343359A1 (en) | Live speech detection | |
CN111201570A (zh) | 分析话语信号 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |