CN115989683A - 用于认证和补偿的方法和系统 - Google Patents

用于认证和补偿的方法和系统 Download PDF

Info

Publication number
CN115989683A
CN115989683A CN202080103548.2A CN202080103548A CN115989683A CN 115989683 A CN115989683 A CN 115989683A CN 202080103548 A CN202080103548 A CN 202080103548A CN 115989683 A CN115989683 A CN 115989683A
Authority
CN
China
Prior art keywords
hptf
user
model
authentication
global
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080103548.2A
Other languages
English (en)
Inventor
郑剑文
S-F·施
陈松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harman International Industries Inc
Original Assignee
Harman International Industries Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harman International Industries Inc filed Critical Harman International Industries Inc
Publication of CN115989683A publication Critical patent/CN115989683A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1041Mechanical or electronic switches, or control elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Headphones And Earphones (AREA)

Abstract

本公开描述了一种针对耳机进行认证和动态补偿的方法和系统。所述方法在用户佩戴耳机时,基于耳机传递函数(HPTF)来针对用户执行认证。所述方法还可以检测用户的HPTF与经调整的HPTF之间是否存在频率响应偏差。此外,如果用户的HPTF与经调整的HPTF之间存在频率响应偏差,则所述方法可以基于检测到的频率响应偏差来动态地补偿用户的HPTF。

Description

用于认证和补偿的方法和系统
技术领域
本公开涉及一种用于认证和补偿的方法和系统,并且具体涉及一种基于耳机传递函数(HPTF)针对耳机进行生物特征认证和动态补偿的方法和系统。
背景技术
生物特征认证用于对边缘装置实现无缝用户体验,同时提供装置(诸如手机和膝上型计算机)安全。为了实现更好的用户体验,发明了各种技术来减少意图至动作时间。这个意图至动作时间是由用户希望目标装置执行动作的时刻至边缘装置完成执行的时刻定义的。然后开发了现代识别技术(诸如图像和语音识别技术)以减少意图至动作时间。边缘计算与云服务相结合的最新进展极大地提高了生活质量。
面部识别基于使相机安装在目标装置上,并且大部分是通过使用神经网络相关技术来比较预先注册的面部特征而实现的。然后使用各种技术(诸如基于IR的深度传感器和立体成像)来提高视觉精度。这些方法主要用于防止恶意人员通过展示目标的照片来破坏系统。然而,这些系统在功率消耗和传感器成本方面往往花费更高。此外,在过去两年中,移动装置正试图摆脱使图像传感器前置以实现更高的屏占比。
语音识别基于使传声器捕获声学输入,随后分析输入至预先注册的命令的实时流式传输以进行匹配。由于识别准确度在很大程度上是与SNR结合,因此熟知算法(诸如多传声器和降噪)被用来提高准确度。在功率消耗和传感器成本方面,多通道和降噪技术也花费较高。此外,语音识别需要用户说出关键词,这在公共场合有时可能不方便。
为克服上述不便以及功率消耗和传感器的成本较高的缺点,有必要提供一种改进的认证技术。
此外,通常在许多耳机中,HPTF是通过在仿真人头上使用特殊的耳朵模拟器来测量的。声学工程师根据所测量的HPTF调整耳机的频率响应。然而,由于个体差异,由耳朵模拟器测量的HPTF可能并不令人满意。当最终用户购买耳机并听音乐时,他听到的可能不是声学工程师已调好的期望声音。不同的聆听者在一个耳机中听到不同的声音,即使他们完美地佩戴耳机。此外,尽管耳机具有良好的低音表现,但如果未正确地佩戴耳机,聆听者仍可能听到很少的低音,因为耳机与聆听者的耳朵之间存在大量空气泄漏。
聆听者的个人HPTF涉及在耳机的内表面与鼓膜之间的与所测量的HPTF的反射不同的反射,或者仅仅是因为一些不期望的空气泄漏,这会引入一些音色畸变。
为了通过耳机向不同的聆听者忠实地回放声音,需要对HPTF进行校准和补偿。因此,有必要提供一种改进的技术,用于在认证后使用耳机时自适应且有效地执行实时校准。
发明内容
根据本公开的一个方面,提供了一种针对耳机进行认证和动态补偿的方法。所述方法在用户佩戴耳机时,基于耳机传递函数(HPTF)来针对用户执行认证。所述方法还可以检测用户的HPTF与经调整的HPTF之间是否存在频率响应偏差。此外,如果用户的HPTF与经调整的HPTF之间存在频率响应偏差,则所述方法可以基于检测到的频率响应偏差来动态地补偿用户的HPTF。
根据本公开的另一个方面,提供了一种针对耳机进行认证和动态补偿的系统。所述系统包括存储器和耦合至存储器的处理器。处理器被配置为在用户佩戴耳机时,基于耳机传递函数(HPTF)来针对用户执行认证。此外,处理器被配置为检测用户的HPTF与经调整的HPTF之间是否存在频率响应偏差。此外,处理器被配置为:在用户的HPTF与经调整的HPTF之间存在频率响应偏差的情况下,基于检测到的频率响应偏差,动态地补偿用户的HPTF。
根据本公开的又一个方面,提供了一种包括计算机可执行指令的计算机可读存储介质,所述计算机可执行指令在由计算机执行时,使计算机执行本文公开的方法。
附图说明
图1示出了根据本公开的一个或多个实施方案的FxLMS的系统配置。
图2示出了根据本公开的一个或多个实施方案的针对耳机进行认证和动态补偿的方法的流程图。
图3示出了根据本公开的一个或多个实施方案的构建HPTF模型和认证决策的方法流程图。
图4示出了根据本公开的一个或多个实施方案的基于HPTF对用户进行实时认证的方法流程图。
图5示出了根据本公开的一个或多个实施方案的基于HPTF进行动态补偿的方法流程图。
图6示出了经调整的HPTF曲线、用户的HPTF曲线和对应的补偿曲线的示例性结果。
图7示出了根据本公开的一个或多个实施方案的基于HPTF进行动态补偿的框图。
图8示出了HPTF曲线针对用户的左耳朵的实验结果。
图9示出了HPTF曲线针对用户的右耳朵的实验结果。
为有助于理解,已尽可能使用相同的附图标记来指代附图中通用的相同元件。可以设想,一个实施方案中公开的元件可在无需特别指明的情况下有利地在另一个实施方案中使用。这里所指的附图不应理解成按比例绘制,除非特别注明。而且,为了清楚地说明和解释,通常将附图简化并将细节或部件省略。附图和讨论用于解释下面讨论的原理,其中相同的标号表示相同的元件。
具体实施方式
下面将提供示例进行说明。对各种示例的描述将出于说明目的而呈现,而非旨在详尽或仅限于所公开的实施方案。在不背离所描述实施方案的范围和精神的情况下,许多修改和变化对于本领域普通技术人员来说将是显而易见的。
耳机传递函数(HPTF)被定义为从耳机的扬声器至鼓膜处的声压的声学传递函数。一般来说,不同的耳机或聆听者的个人HPTF有明显差异,因为每个耳机都具有其自身的设计特点,并且每个聆听者也具有其独特的耳朵特性。相应地,本公开将针对基于HPTF的应用提供一些实施方案。例如,在耳机产品中,本文讨论的方法和系统可以应用于生物特征认证。在生物特征认证之后,本发明将提供一种方法和系统,用于进行频率响应偏差的检测和校准,以在耳机产品的使用期间针对个人用户获得期望声音表现。
主动噪声消除(ANC)耳机基于对周围噪声的监测。即,所述耳机使用内部传声器和外部传声器来捕获环境声音。然后,利用经校准回放系统保持周围噪声的幅值并反转其相位,可以再现具有紧密耦合反馈回路的高精度抗噪声。
HPTF涉及两个部分,即自由场测量以及耳廓加耳道与内部传声器之间的冲激响应。由于可以在受控环境中测量自由场测量,并且可以在生产线中校准制造公差,因此剩下的唯一变量是传声器至耳廓加耳道响应,如描绘为耳朵参考点(ERP)至耳朵入口点(EEP)。这个ER P至EEP传递函数(H)在耳廓加耳道之间是因人而异的。
图1示出了根据本公开的一个或多个实施方案的FxLMS的系统配置的示意图。可以利用系统识别算法(诸如FxLMS)动态地计算H
w(n+1)=w(n)-μe(n)r′(n)             (1)
其中μ是自适应步长,w(n)是在时间n的权重向量,e(n)=d(n)+wT(n)r(n)。e(n)是由误差传声器测量的残余噪声,d(n)是要消除的噪声,r(n)和r′(n)分别从卷积r′(n)和r′(n)=h′(n)*x(n)获得。x(n)是合成参考信号,h(n)和h′(n)分别是冲击响应H(f)和H′(f)。H(f)是次级路径的传递函数,并且H′(f)是对H(f)的估计,其也被视为HPTF。FxLMS的系统配置可如图1所示。
图2示出了根据本公开的一个或多个实施方案的针对耳机进行认证和动态补偿的方法的流程图。如图1所示,在S201处,当用户佩戴耳机时,基于耳机传递函数(HPTF)来针对用户执行认证。认证结果可以用于确定用户是否可以继续使用耳机。然后,为了获得耳机的期望声音表现,可以实时地执行自适应和有效的校准和补偿。例如,在S202处,检测用户的HPTF与经调整的HPTF之间的频率响应偏差。然后,在S203处,基于检测到的频率响应偏差对用户的HPTF执行动态补偿。将在下面说明图1所示方法的具体实现方式。
HPTF认证
在认证应用方面,HPTF差异问题可以变换为识别问题,可以利用统计建模(诸如贝叶斯方法和神经网络)来解决所述识别问题。
为了区分目标用户的通用HPTF,将使用统计模型。在本实施方案(不限于)中,基于所测量的冲激响应来构建高斯混合模型(GMM)。为了构建GMM参考,首先将消声室中的自由场响应测量为H自由场(f)。对于每个数据点,i∈P个人(其被测量M次(总大小为P*M),用于训练),捕获换能器至传声器传递函数,描绘为HHPTF(f)(i省略),然后由以下获得H(f):
H(f)=HHPTF(f)/H自由场(f)            (2)
为了提高准确度,可以将数据预处理为幅值数据和相对相位数据,如下所示,
Figure BDA0004096711980000061
∠H(f)=tan-1[Im(H(f))/Re(H(f))]             (4)
然后,可以将每个数据点(i)视为向量:每样本数据[幅值,相位]×[左,右],并在每个测试对象的头部上针对不同配件测量所述数据点M次。然后根据GMM模型构建过程对全局模型进行相应的训练,以获得X~N全局(μ,σ)。
HPTF模型构建和认证决策
图3示出了根据本公开的一个或多个实施方案的构建HPTF模型和认证决策的方法流程图。
例如,通常可以测量消声自由场换能器至传声器传递函数,即获得H自由场(f)。参见图3,在S301处,可以在制造期间收集来自P个人的HPTF,每一个挂载M次。在S302处,基于收集的HPTF,形成具有X~N全局xx)的全局GMM。然后,在S303处,可以收集来自最终用户的HPTF,并将其挂载M次。基于来自最终用户的收集的HPTF,在S304处,形成具有Y~N局部YY)的局部GMM。在S305处,通过使用预定义损失函数,诸如最小均方误差(MMSE),确定运行时损失系数。
为了注册新目标,通过使用FxLMS结合存储的H自由场(f),可以提取H目标(f)=HHPTF(f)/H自由场(f),并且针对目标用户的这个过程将重复M次以通过预定义特征距离D将局部模型创建为Y~N局部(μ,σ),在这种情况下,所述预定义特征距离可以被简化为分布最小均方误差(MMSE),如下所示,
Figure BDA0004096711980000071
其中β0…βP是参数估计值。
为了使用上面创建的模型实现生物认证,距离函数计算如下:如果平均(||X-Y||)>(||Y-μY||),由于特征距离比全局X~N全局xx)更接近局部Y~N局部YY),因此可以确定装置被认证。否则,如果特征距离比局部Y~N局部YY)更接近全局X~N全局xx),则认证返回失败作为结果。
运行时HPTF提取模型
图4示出了根据本公开的一个或多个实施方案的基于HPTF对用户进行实时认证的方法流程图。在S401处,当最终用户使用耳机时,可以获得来自传声器和换能器的音频流。任选地,可以在获得来自传声器和换能器的音频流之前执行针对音频回放和用户输入的检查。在S402处,可以如上所述获得换能器与传声器之间的传递函数H(f)。任选地,在S403处,进一步检查FxLMS算法收敛性,并且如果FxLMS算法收敛,则输出传递函数H(f)。在S404处,将传递函数与全局X~N全局xx)和局部Y~N局部YY)进行比较。然后,在S405处,可以基于所述比较来执行基于GMM MMSE的认证。例如,如果特征距离比全局X~N全局xx)更接近局部Y~N局部YY),则装置被认证。否则,如果特征距离比局部Y~N局部YY)更接近全局X~N全局xx),则认证过程返回失败作为结果。
偏差检测和频率响应校准
为了通过耳机向不同的聆听者忠实地回放声音并改善使用的声音体验,可以对HPTF进行校准和补偿。可以使用一些方法来做到这一点。例如,可以使用一种方法:将传声器放入聆听者的耳道内并且执行一次性校准,播放扫频信号或其他特殊测量信号。所述方法可以对HPTF进行补偿,但补偿后只保持较短的时间,因为聆听者可能不会每次都将耳机佩戴在同一位置,这意味着聆听者每次要使用耳机时都必须重复这个校准,否则校准可能无效。本文还公开了一种用于进行实时补偿的改进的自适应且有效的方法。
考虑到聆听者可能佩戴发生空气泄漏的耳机,并且不同聆听者具有不同的HPTF并且通常与标准仿真人头的HPTF有很大差异,本文提出了一种方法,以由声学工程师补偿真实HPTF与精心设计的HPTF之间的差异。
图5示出了根据本公开的一个或多个实施方案的基于HPTF进行动态补偿的框图。在S501处,可以通过FxLMS估计聆听者的HPTFH(f),并且在S502处,获得聆听者的通过FxLMS估计的HPTFH(f)的幅度响应。此外,可以从工程师获得经调整的HPTFH0(f)的幅度响应。估计的HPTFH(f)和经调整的HPTFH0(f)的幅度响应可被写为,
M(f)=|H(f)|,M0(f)=|H0(f)|              (6)
其中|*|是绝对值运算符。然后,在S503处,比较M(f)和M0(f)以确定聆听者佩戴耳机时的频率响应偏差有多大,例如以便确定在低频范围内空气泄漏有多少。
然后,在S504处,基于检测到的频率响应偏差对用户的HPTF曲线执行动态补偿。例如,平滑且有界的校准函数F(*)被用于获得其差异的经补偿幅度Mc(f),
Mc(f)=F(M0(f)-M(f))           (7)
其中F(*)可以是一些线性或非线性函数,例如,
Figure BDA0004096711980000091
α和β是可以根据真实系统调整的两个参数。图6展示了经调整的HPTF曲线、用户的HPTF曲线和对应的补偿曲线的示例。
图7示出了根据本公开的一个或多个实施方案的基于HPTF进行动态补偿的框图。如图7所示,用于动态补偿的系统可以包括预处理单元701、后处理单元702、FxLMS系统703、实时校准单元704和补偿单元705。例如,当用户佩戴耳机听音乐时,可以首先由预处理单元701对音乐输入进行预处理,诸如通过A/D转换、EQ、自适应限幅器、缩混等。然后,经预处理的数据被输入到补偿单元705。通过使用FxLMS系统703,可以如上所述估计聆听者的传递函数HPTF。在实时校准单元704中,将HPTFH(f)的幅度响应与来自工程师的经调整HPTFH0(f)的幅度响应进行比较,然后可以使用平滑且有界的校准函数来获得经补偿幅度Mc(f)。然后,将经补偿幅度Mc(f)输出给补偿单元705,以基于经补偿幅度Mc(f)执行动态补偿。后处理单元702可以对经补偿数据进行后处理,例如通过EQ、自适应限幅器等。
在本公开中,提供了一种新的方式来匿名检测跨不同用户的HPTF之间的个体差异。然后展示基于频率响应偏差可以如何利用差异进行应用(诸如生物特征认证和耳机健康检测)。最后,基于检测到的HPTF与目标曲线之间的增量差异,可以对差异执行动态补偿,并将提供一致的聆听体验。
图8和图9示出了HPTF曲线针对用户的左耳和右耳的实验结果。例如,随机选择5个用户进行实验,并且每个用户正常戴上耳机,以相应地提取HPTF。图8和图9分别示出了针对左耳和右耳的堆叠在彼此之上的每个用户的均值和方差。如根据结果所展示,每个人之间的分布存在可识别的差异,并且可以将其描绘为从上一节提到的特征距离。这个特征距离在500Hz至2kHz以及5kHz至15kHz附近特别明显,因为这些是测试对象之间的耳廓和耳道差异。图8还可指示耳机的左声道存在一些空气泄漏,因为每个用户在200Hz以下的频率响应差异很大。
上面公开了用于使用运行时计算的HPTF模型与可听装置交互的新颖方法。此类动作可以在消费者装置(诸如解锁安全装置(例如移动电话))和声学个性化(例如播放/暂停、加载/存储播放列表)中找到。这同样适用于电子商务和软件服务。例如,用于安全支付的认证协议(例如Google Store)和用于身份识别和验证的会议软件(例如WebEx登录ID自动化会议设置)。本文公开的技术基于来自左耳与右耳两者的在个体之间的HPTF差异,并且为数字认证和人机交互提供替代手段。这也扩展到使用统计分析来确定可听声学行为的方法。
已呈现各种实施方案的描述以用于说明目的,但并非意在详尽或限于公开的实施方案。选择本文使用的术语是为了最好地解释实施方案的原理,对市场上发现的技术的实际应用或技术上的改进,或者使本领域的其他普通技术人员能够理解本文公开的实施方案。
在前面,参考了本公开中呈现的实施方案。然而,本公开的范围不限于具体描述的实施方案。相反,前述特征和元素的任何组合(无论是否与不同的实施方案相关)都被设想为实现和实践设想的实施方案。此外,尽管本文公开的实施方案可以实现优于其他可能解决方案或优于现有技术的优点,但是特定优点是否由给定实施方案实现并不限制本公开的范围。因此,前述方面、特征、实施方案和优点仅仅是说明性的并且不被认为是所附权利要求的要素或限制,除非在权利要求中明确陈述。
本公开的各方面可采用以下形式:完全硬件实施方案、完全软件实施方案(包括固件、常驻软件、微代码等)或组合了软件方面与硬件方面的实施方案,所述各实施方案在本文中一般都可称为“电路”、“模块”、“单元”或“系统”。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括一个(或多个)计算机可读存储介质,所述计算机可读存储介质在其上具有计算机可读程序指令,用于使处理器执行本公开的各方面。
计算机可读存储介质可以是可以保持和存储供指令执行装置使用的指令的有形装置。计算机可读存储介质可以是例如但不限于电子存储装置、磁性存储装置、光学存储装置、电磁存储装置、半导体存储装置或前述的任何合适的组合。计算机可读存储介质的更具体示例的不完全列表包括以下各项:便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存存储器)、静态随机存取存储器(SRAM)、便携式光盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码的装置(诸如具有记录在其上的指令的凹槽中的穿孔卡或凸起结构),以及前述的任何合适的组合。如本文所用,计算机可读存储介质不应理解为暂态信号本身,诸如无线电波或其他自由传播电磁波、通过波导或其他传输介质传播的电磁波(例如,穿过光纤电缆的光脉冲)或通过线材传输的电信号。
本文所述的计算机可读程序指令可以经由网络(例如,互联网、局域网、广域网和/或无线网络)从计算机可读存储介质下载到相应的计算/处理装置,或者下载到外部计算机或外部存储装置。网络可以包括铜传输线缆、光学传输纤维、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。
本文参考根据本公开的实施方案的方法、设备(系统)和计算机程序产品的流程图图示和/或框图描述了本公开的各方面。应当理解,流程图图示和/或框图中的每个框以及流程图图示和/或框图中的框的组合可以通过计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理设备的处理器以便产生机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令建立用于实施在流程图和/或框图的一个或多个框中规定的功能/操作的手段。
附图中的流程图和框图示出根据本公开的各种实施方案的系统、方法和计算机程序产品的可能实现方式的架构、功能和操作。就这一点而言,流程图或框图中的每个框可表示指令模块、指令片段或指令部分,其包括用于实现指定逻辑功能的一个或多个可执行指令。在一些替代实现方式中,框中标注的功能可以以不同于图中标注的顺序发生。例如,连续示出的两个框实际上可以大体上同时执行,或者这些框有时可以按相反的顺序执行,这取决于所涉及的功能。还应注意到,框图和/或流程图图示的每个框,以及框图和/或流程图图示的框的组合,可由执行指定功能或动作或执行专用硬件和计算机指令的组合的基于专用硬件的系统来实现。
尽管前述内容针对本公开的实施方案,但是可在不背离其基本范围的情况下设计出本公开的其他和更多实施方案,且所述基本范围由以下权利要求确定。

Claims (15)

1.一种针对耳机进行认证和动态补偿的方法,所述方法包括:
在用户佩戴所述耳机时,基于耳机传递函数(HPTF)来针对所述用户执行认证;
检测所述用户的HPTF与经调整的HPTF之间的频率响应偏差;以及
基于所检测到的频率响应偏差对所述用户的HPTF进行动态补偿。
2.根据权利要求1所述的方法,其中所述执行所述认证还包括:
构建HPTF模型和认证决策;
针对所述用户测量HPTF;以及
基于所测量的HPTF、所构建的HPTF模型和认证决策对所述用户进行认证。
3.根据权利要求2所述的方法,其中所述构建HPTF模型和认证决策还包括:
从多个人收集全局HPTF,针对每个人重复预定次数;
基于所收集的全局HPTF,形成具有全局分布的全局模型;
从所述用户收集局部HPTF,重复所述预定次数;
基于所收集的局部HPTF,形成具有局部分布的局部模型;以及
通过使用预定义丢失函数,确定运行时丢失系数。
4.根据权利要求3所述的方法,其中所述方法还包括:
基于所述全局模型和所述局部模型,计算特征距离;
如果所述特征距离比所述全局模型更接近所述局部模型,则确定所述认证成功;以及
如果所述特征距离比所述局部模型更接近所述全局模型,则确定所述认证失败。
5.根据权利要求1至4中任一项所述的方法,其中所述全局模型和所述局部模型基于高斯混合模型。
6.根据权利要求1至5中任一项所述的方法,其中所述方法还包括测量消声自由场换能器至传声器传递函数。
7.根据权利要求1至6中任一项所述的方法,其中所述检测所述用户的HPTF与所述经调整的HPTF之间的所述频率响响偏差还包括:
通过FxLMS算法估计所述用户的所述HPTF;
获得所述用户的所估计的HPTF的幅度响应;
将所述幅度响应和经调整幅度响应进行比较;以及
基于所述比较,实时确定所述频率响应偏差。
8.一种针对耳机进行认证和动态补偿的系统,所述系统包括:
存储装置;以及
处理器,所述处理器耦合到所述存储装置;
其中所述处理器被配置为:
在用户佩戴所述耳机时,基于耳机传递函数(HPTF)来针对所述用户执行认证;
检测所述用户的HPTF与经调整的HPTF之间的频率响应偏差;以及
基于所检测到的频率响应偏差对所述用户的HPTF进行动态补偿。
9.根据权利要求8所述的系统,其中所述处理器被进一步配置为:
构建HPTF模型和认证决策;
针对所述用户测量HPTF;并且
基于所测量的HPTF、所构建的HPTF和认证决策对所述用户进行认证。
10.根据权利要求9所述的系统,其中所述处理器被进一步配置为:
从多个人收集全局HPTF,针对每个人重复预定次数;
基于所收集的全局HPTF,形成具有全局分布的全局模型;
从所述用户收集局部HPTF,重复所述预定次数;
基于所收集的HPTF,形成具有局部分布的局部模型;以及
通过使用预定义丢失函数,确定运行时丢失系数。
11.根据权利要求10所述的系统,其中所述处理器被进一步配置为:
基于所述全局模型和所述局部模型,计算特征距离;
如果所述特征距离比所述全局模型更接近所述局部模型,则确定所述认证成功;以及
如果所述特征距离比所述局部模型更接近所述全局模型,则确定所述认证失败。
12.根据权利要求8至11中任一项所述的系统,其中所述全局模型和所述局部模型基于高斯混合模型。
13.根据权利要求8至12中任一项所述的系统,其中所述处理器被进一步被配置为测量消声自由场换能器至传声器传递函数。
14.根据权利要求8至13中任一项所述的系统,其中所述处理器被进一步配置为:
通过FxLMS算法估计所述用户的所述HPTF;
获得所述用户的所估计的HPTF的幅度响应;
将所述幅度响应和经调整幅度响应进行比较;以及
基于所述比较,实时确定所述频率响应偏差。
15.一种计算机可读存储介质,其包括计算机可执行指令,所述计算机可执行指令在由计算机执行时,使所述计算机执行根据权利要求1至7中任一项所述的方法。
CN202080103548.2A 2020-09-01 2020-09-01 用于认证和补偿的方法和系统 Pending CN115989683A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2020/112776 WO2022047606A1 (en) 2020-09-01 2020-09-01 Method and system for authentication and compensation

Publications (1)

Publication Number Publication Date
CN115989683A true CN115989683A (zh) 2023-04-18

Family

ID=80492068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080103548.2A Pending CN115989683A (zh) 2020-09-01 2020-09-01 用于认证和补偿的方法和系统

Country Status (4)

Country Link
US (1) US20230209240A1 (zh)
EP (1) EP4209014A4 (zh)
CN (1) CN115989683A (zh)
WO (1) WO2022047606A1 (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3435156B2 (ja) * 2001-07-19 2003-08-11 松下電器産業株式会社 音像定位装置
CN104240695A (zh) * 2014-08-29 2014-12-24 华南理工大学 一种优化的基于耳机重放的虚拟声合成方法
US10341799B2 (en) * 2014-10-30 2019-07-02 Dolby Laboratories Licensing Corporation Impedance matching filters and equalization for headphone surround rendering
US10999620B2 (en) * 2016-01-26 2021-05-04 Julio FERRER System and method for real-time synchronization of media content via multiple devices and speaker systems
GB201801532D0 (en) * 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Methods, apparatus and systems for audio playback
CN111212349B (zh) * 2020-01-13 2021-04-09 中国科学院声学研究所 一种基于头骨阻抗识别的骨导耳机均衡方法

Also Published As

Publication number Publication date
EP4209014A1 (en) 2023-07-12
US20230209240A1 (en) 2023-06-29
EP4209014A4 (en) 2024-05-15
WO2022047606A1 (en) 2022-03-10

Similar Documents

Publication Publication Date Title
EP3625718B1 (en) Headset for acoustic authentication of a user
US9699556B2 (en) Enhancing audio using a mobile device
Denk et al. An individualised acoustically transparent earpiece for hearing devices
JP6121481B2 (ja) マルチマイクロフォンを用いた3次元サウンド獲得及び再生
US11134348B2 (en) Method of operating a hearing aid system and a hearing aid system
US20140112483A1 (en) Distance-based automatic gain control and proximity-effect compensation
CN110313031B (zh) 针对语音隐私的自适应语音可懂度控制
BR112015014380B1 (pt) Filtro e método para filtragem espacial informada utilizando múltiplas estimativas da direção de chegada instantânea
Braun et al. A multichannel diffuse power estimator for dereverberation in the presence of multiple sources
WO2020020247A1 (zh) 信号处理方法、装置以及计算机存储介质
KR101982812B1 (ko) 헤드셋 및 그의 음질 향상 방법
CN113534052B (zh) 骨导设备虚拟声源定位性能测试方法、系统、装置及介质
Yang et al. VoShield: Voice liveness detection with sound field dynamics
Liski et al. Adaptive equalization of acoustic transparency in an augmented-reality headset
US11250833B1 (en) Method and system for detecting and mitigating audio howl in headsets
EP4327569A1 (en) Error correction of head-related filters
Gupta et al. Acoustic transparency in hearables for augmented reality audio: Hear-through techniques review and challenges
Yousefian et al. A hybrid coherence model for noise reduction in reverberant environments
WO2022047606A1 (en) Method and system for authentication and compensation
US10186279B2 (en) Device for detecting, monitoring, and cancelling ghost echoes in an audio signal
CN113132846B (zh) 耳机的主动降噪方法及装置、半入耳式主动降噪耳机
Gupta et al. Study on differences between individualized and non-individualized hear-through equalization for natural augmented listening
US20180158447A1 (en) Acoustic environment understanding in machine-human speech communication
KR20220058851A (ko) 머리 전달 함수 적응을 위한 방법 및 시스템
Matsumoto Vision-referential speech enhancement of an audio signal using mask information captured as visual data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination