CN114423339A - 信息处理装置、信息处理方法及存储介质 - Google Patents

信息处理装置、信息处理方法及存储介质 Download PDF

Info

Publication number
CN114423339A
CN114423339A CN201980100182.0A CN201980100182A CN114423339A CN 114423339 A CN114423339 A CN 114423339A CN 201980100182 A CN201980100182 A CN 201980100182A CN 114423339 A CN114423339 A CN 114423339A
Authority
CN
China
Prior art keywords
response function
frequency response
information processing
processing apparatus
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980100182.0A
Other languages
English (en)
Inventor
伊藤良峻
荒川隆行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN114423339A publication Critical patent/CN114423339A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1041Mechanical or electronic switches, or control elements
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/117Identification of persons
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/68Arrangements of detecting, measuring or recording means, e.g. sensors, in relation to patient
    • A61B5/6801Arrangements of detecting, measuring or recording means, e.g. sensors, in relation to patient specially adapted to be attached to or worn on the body surface
    • A61B5/6813Specially adapted to be attached to a specific body part
    • A61B5/6814Head
    • A61B5/6815Ear
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/30Individual registration on entry or exit not involving the use of a pass
    • G07C9/32Individual registration on entry or exit not involving the use of a pass in combination with an identity check
    • G07C9/37Individual registration on entry or exit not involving the use of a pass in combination with an identity check using biometric data, e.g. fingerprints, iris scans or voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/06Authentication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/30Security of mobile devices; Security of mobile applications
    • H04W12/33Security of mobile devices; Security of mobile applications using wearable devices, e.g. using a smartwatch or smart-glasses

Abstract

提供一种信息处理装置,配备有:获取单元,被配置为基于在用户头部中传播的声波来获取频域中的声学特性;以及提取单元,被配置为生成包括有理多项式的第一频率响应函数,并且然后基于第一频率响应函数来提取用于用户的生物特征认证的特征量,在有理多项式中分母包含指示声学特性的峰特征的项以及分子包含指示声学特性的谷特征的项。

Description

信息处理装置、信息处理方法及存储介质
技术领域
本公开涉及信息处理装置、信息处理方法和存储介质。
背景技术
专利文献1公开一种耳机,具有基于在用户头部中传播的声学信号的个人认证功能。专利文献1所公开的个人认证设备从声学特性中提取对数频谱、梅尔频率倒谱系数、线性预测分析系数等作为特征量,以将特征量用于用户认证。
[引用列表]
[专利文献]
PTL 1:国际公开No.WO2018/034178
PTL 2:国际公开No.WO2018/198310
PTL 3:日本专利申请特开No.2005-339265
发明内容
[技术问题]
通过诸如专利文献1所述的可穿戴装置获得的声学特性可能会取决于穿戴状态而改变。因为这些因素所致声学特性的变化可能会影响认证准确性,所以需要一种对于佩戴状态的差异具有鲁棒性的特征提取方法。
本公开旨在提供对于佩戴状态差异具有鲁棒性、能够提取特征量的信息处理装置、信息处理方法和存储介质。
[问题的解决方案]
根据公开的一个示例性方面,提供一种信息处理装置,包括:获取单元,被配置为基于在用户头部中传播的声波来获取频域中的声学特性;以及提取单元,被配置为生成具有有理多项式方程的第一频率响应函数,以基于第一频率响应函数来提取用于用户的生物特征认证的特征量,有理多项式方程包括在分母中指示声学特性的峰的特征的项以及在分子中指示声学特性的谷的特征的项。
根据公开的另一个示例性方面,提供一种信息处理方法,包括:基于在用户头部中传播的声波来获取频域中的声学特性;以及生成具有有理多项式方程的第一频率响应函数,以基于第一频率响应函数来提取用于用户的生物特征认证的特征量,该有理多项式方程包括在分母中指示声学特性的峰的特征的项以及在分子中指示声学特性的谷的特征的项。
根据公开的另一个示例性方案方面,提供一种存储介质,用于存储程序,该程序使得计算机进行:基于在用户头部中传播的声波来获取频域中的声学特性;以及生成具有有理多项式方程的第一频率响应函数,以基于第一频率响应函数来提取用于用户的生物特征认证的特征量,该有理多项式方程包括在分母中指示声学特性的峰的特征的项以及在分子中指示声学特性的谷的特征的项。
[发明的有益效果]
根据本公开,信息处理装置、信息处理方法和存储介质能够提供对于佩戴状态中的差异具有鲁棒性的特征量。
附图说明
图1是示出根据第一示例性实施例的信息处理系统的整体配置的示意图。
图2是示出根据第一实施例的耳机控制装置的硬件配置的方框图。
图3是示出根据第一实施例的信息通信装置的硬件配置的方框图。
图4是示出根据第一实施例的耳机和信息通信装置的功能方框图。
图5是示出根据第一实施例的信息通信装置进行的生物特征认证处理的概要的流程图。
图6是示出根据第一实施例的信息通信装置进行的特征量提取处理的流程图。
图7是示出声学特性的测量示例的曲线图。
图8是示出反复戴上和卸下耳机时的声学特性的变化的示例的曲线图。
图9是示出根据第二实施例的信息通信装置进行的特征量提取处理的流程图。
图10是示出根据第三实施例的信息通信装置进行的特征量提取处理的流程图。
图11是示出根据第四实施例的信息通信装置进行的特征量提取处理的流程图。
图12是示出根据第五实施例的信息处理装置的功能方框图。
具体实施方式
下面参照附图描述本公开的示例性实施例。在整个附图中,相同或对应的组件用相同的附图标记表示,并且可以省略或简化其描述。
[第一示例性实施例]
下面描述根据实施例的信息处理系统。本实施例的信息处理系统是使用可穿戴装置(诸如耳机)进行生物特征认证的系统。
图1是示出根据实施例的信息处理系统的整体配置的示意图。信息处理系统包括信息通信装置1和耳机2,它们可以相互无线连接。
耳机2包括耳机控制装置20、扬声器26和麦克风27。耳机2是一种可以戴在用户3的头部(具体而言是戴在耳朵上)的声学装置,通常是无线耳机、无线头戴式耳机等。扬声器26充当在用户佩戴耳机2时向用户3的耳道发射声波的声波产生单元,并且被布置在耳机2的佩戴面一侧。麦克风27被布置在耳机2的安装面一侧,从而在用户3佩戴耳机2时接收被耳道等反射的声波。耳机控制装置20控制扬声器26和麦克风27,并与信息通信装置1通信。
注意,在说明书中,诸如声波和语音之类的“声音”包括频率或声压级在可听范围之外的不可听声音。
信息通信装置1例如是与耳机2可通信地连接的计算机,并基于声学信息进行生物特征认证。信息通信装置1还控制耳机2的操作,发送用于产生从耳机2发出的声波的声音数据,并接收从耳机2接收的声波中获取的声音数据。作为具体示例,当用户3使用耳机2聆听音乐时,信息通信装置1将音乐的压缩数据发送给耳机2。当耳机2是用于活动大厅、医院等场所中的业务指令的电话装置时,信息通信装置1将业务指令的音频数据发送给耳机2。在这种情况下,可以进一步将用户3的话语的音频数据从耳机2发送给信息通信装置1。
注意,该整体配置只是示例,并且例如,可通过电线来连接信息通信装置1和耳机2。此外,可将信息通信装置1和耳机2配置为集成装置,并且可以在信息处理系统中包括其他装置。
图2是示出耳机控制装置20的硬件配置的方框图。耳机控制装置20包括中央处理器(CPU)201、随机存取存储器(RAM)202、只读存储器(ROM)203、以及闪存204。耳机控制装置20还包括扬声器接口(I/F)205、麦克风I/F 206、通信I/F 207和电池208。耳机控制装置20的每个单元经由总线、电线、驱动装置等(未示出)相互连接。
CPU 201是这样一种处理器,它具有根据存储在ROM 203、闪存204等中的程序来进行预定操作并且还控制耳机控制装置20的每个单元的功能。RAM 202包括易失性存储介质,并提供CPU 201操作所需的临时存储区域。ROM 203包括非易失性存储介质,并存储必要信息,诸如用于耳机控制装置20操作的程序。闪存204包括非易失性存储介质,是用于临时存储数据、存储耳机控制装置20的操作程序等的存储装置。
通信I/F 207是基于诸如Bluetooth(注册商标)、Wi-Fi(注册商标)标准的通信接口,并且是用于与信息通信装置1进行通信的模块。
扬声器I/F 205是用于驱动扬声器26的接口。扬声器I/F 205包括数模转换电路、放大器等。扬声器I/F 205将音频数据转换为模拟信号并将模拟信号提供给扬声器26。因此,扬声器26基于音频数据发出声波。
麦克风I/F 206是用于从麦克风27获取信号的接口。麦克风I/F 206包括模数转换电路、放大器等。麦克风I/F 206将通过麦克风27接收的声波产生的模拟信号转换成数字信号。因此,耳机控制装置20基于所接收的声波来获取音频数据。
电池208例如是次级电池,并供应耳机2操作所需的电力。因此,耳机2可通过无线方式操作,而不经电线连接外部电源。
注意,图2所示硬件配置只是示例,并且可以添加其他装置,也可以不提供某些装置。某些装置可以用具有类似功能的其他装置来代替。例如,耳机2还可包括诸如按钮的输入装置,从而能够接收用户3的操作,还可包括诸如显示器和显示灯的显示装置,用于向用户3提供信息。如上所述,可以适当改变图2所示的硬件配置。
图3是示出信息通信装置1的硬件配置的方框图。信息通信装置1包括CPU 101、RAM102、ROM 103和HDD(硬盘驱动器)104。信息通信装置1还包括通信I/F 105、输入装置106和输出装置107。信息通信装置1的每个单元经由总线、电线、驱动装置等(未示出)相互连接。
在图3中,虽然将构成信息通信装置1的每个单元示出为集成装置,但是可通过外部装置来提供这些功能的一部分。例如,输入装置106和输出装置107可以是外部装置,除了构成包括CPU 101等的计算机的功能的单元之外。
CPU 101是这样一种处理器,它具有根据存储在ROM 103、HDD 104等中的程序进行预定操作并且还控制信息通信装置1的每个单元的功能。RAM 102包括易失性存储器介质,并提供CPU 101操作所需的临时存储区域。ROM 103包括非易失性存储介质,并存储必要信息,诸如用于信息通信装置1操作的程序。HDD 104由非易失性存储介质构成,并且是用于暂时存储要发送给耳机2的数据以及从耳机2接收的数据、存储信息通信装置1的操作程序等的存储装置。
通信I/F 105是基于诸如Bluetooth(注册商标)、Wi-Fi(注册商标)标准的通信接口,并且是用于与诸如耳机2的其他装置进行通信的模块。
输入装置106是键盘、点击装置等,并用于用户3操作信息通信装置1。点击装置的示例包括鼠标、轨迹球、触摸板、手写板等。
输出装置107例如是显示装置。显示装置是液晶显示器、OLED(有机发光二极管)显示器等,并用于显示信息、用于操作输入的GUI(图形用户界面)等。输入装置106和输出装置107可以整体形成触摸板。
注意,图3所示硬件配置只是示例,并且可以添加其他装置,也可以不提供某些装置。某些装置可以用具有类似功能的其他装置来代替。此外,实施例的一些功能可以经由网络由其他装置提供,并且实施例的功能可通过分布在多个装置中来实现。例如,HDD 104可以用使用半导体存储器的固态驱动器(SSD)代替,或者可以用云存储代替。如上所述,可以适当改变图3所示的硬件配置。
图4是示出根据实施例的耳机2和信息通信装置1的功能方框图。信息通信装置1包括声学特性获取单元121、特征量提取单元122和确定单元123。耳机2的方框图结构与图2相同,因此省略其描述。注意,声学特性获取单元121可以更一般地称为获取单元,而特征量提取单元122可以更一般地称为提取单元。
CPU 101将存储在ROM 103、HDD 104等中的程序加载到RAM 102中并执行程序,从而进行预定的算术处理。CPU 101基于程序来控制信息通信装置1的每个单元,诸如通信I/F105。因此,CPU 101实现声学特性获取单元121、特征量提取单元122和确定单元123的功能。下面将描述通过每个功能单元进行的具体处理的细节。
在图4中,可以在耳机控制装置20而非信息通信装置1中提供信息通信装置1中所述功能单元的一些或全部功能。也就是说,可通过信息通信装置1、耳机控制装置20来实现上述功能,或者信息通信装置1和耳机控制装置20可以相互合作。信息通信装置1和耳机控制装置20可以更一般地称为信息处理装置。在以下描述中,假设在信息通信装置1中设置与声学信息的获取和确定相关的每个功能单元,如图4所示,除非另有说明。
图5是示出根据实施例的信息通信装置1进行的生物特征认证处理的概要的流程图。下面参照图5描述信息通信装置1的操作。
例如,当用户3操作耳机2以开始使用时,执行图5所示生物特征认证处理。或者,当耳机2加电时,每当经过预定时间就可以执行图5的生物特征认证处理。
在步骤S101中,声学特性获取单元121指令耳机控制装置20发出检查声音。耳机控制装置20向扬声器26发送检查信号,且扬声器26向用户3的耳道发出基于检查信号生成的检查声音。
可将包括预定范围频率分量的信号(诸如扫频信号、M序列(最大长度序列)信号、白噪声和脉冲信号)用作检查信号。因此,可以获取包括预定频率范围内的信息的声学信号。检查声音可以是频率和声压级在可听范围之内的可听声音。在这种情况下,可通过在认证时使得用户3感知声波来通知用户3进行了认证。检查声音可以是频率或声压级在可听范围之外的不可听声音。在这种情况下,因为可以使得用户3难以感知声波,所以提高了使用的舒适性。
在步骤S102中,麦克风27接收耳道等反射的声波(耳声),并将耳道反射的声波转换为时域中的电信号。该电信号有时称为声学信号。麦克风27将声学信号发送给耳机控制装置20,而耳机控制装置20将声学信号发送给信息通信装置1。
在步骤S103中,声学特性获取单元121基于在用户头部中传播的声波来获取频域中的声学特性。该声学特性例如可以是通过使用诸如快速傅里叶变换的算法将时域中的声学信号转换为频域而获取的频谱。所获取的声学特性存储在HDD 104中。
在步骤S104中,特征量提取单元122从声学特性中提取特征量。下面将描述该处理的细节。所提取的特征量存储在HDD 104中并用于生物特征认证。
在步骤S105中,确定单元123通过将特征量提取单元122提取的特征量与存储在HDD 104中的注册者的预注册特征量进行比较来确定用户3是否为注册者。如果确定用户3是注册者(步骤S106中“是”),则处理进行到步骤S107。如果确定用户3并非注册者(步骤S106中“否”),则处理进行到步骤S108。
在步骤S107中,信息通信装置1向耳机2发送指示允许用户3使用耳机2的控制信号。因此,耳机2变为用户3可用。
在步骤S108中,信息通信装置1向耳机2发送指示不允许用户3使用耳机2的控制信号。因此,耳机2变为用户3不可用。不可用状态例如可以是耳机2的扬声器26没有发出声音的状态。步骤S107和S108中的控制并不控制耳机2,但是可以控制信息通信装置1。例如,信息通信装置1与耳机2之间的通信连接状态可以在允许使用状态和不允许使用状态之间变化。
在步骤S105中,确定单元123还可基于声学特性或特征量来确定用户3是否将耳机2戴在他的耳朵中。当确定用户3没有将耳机戴在用户3的耳朵中时,可以与确定用户3并非注册者的场合一样进行不允许使用耳机2的处理。
图6是示出根据的信息通信装置1进行的特征量提取处理的流程图。下面参照图6更详细地描述图5的步骤S104中的特征量提取处理。
在步骤S111中,特征量提取单元122基于声学特性获取单元121获取的声学特性来计算有理多项式模型的频率响应函数。有理多项式模型的声学特性和频率响应函数得到解释。有时候将有理多项式模型的频率响应函数称为第一频率响应函数。
图7是示出通过音响特性取得部121获取的声学特性的测量示例的曲线图。在图7中,横轴表示频率,纵轴表示任意单位的信号强度。纵轴以对数标度显示。该强度例如表示麦克风27所接收的声波的强度。下面,通过用扬声器所发出的声波的强度将麦克风27所接收的声波的强度归一化来获得声学特性26。
如图7所示,所获取的声学特性具有多个峰(最大点)P1、P2、P3和多个谷(最小点)N1、N2。峰P1、P2、P3和谷N1、N2表示在由用户3的耳道、鼓膜和耳机2形成的气柱中发生的共振。因为观察到多个峰P1、P2、P3和谷N1、N2,所以可知存在多种共振模式。例如,每个峰P1、P2和P3表示在耳机2的麦克风27的位置处声波的振幅增加的共振模式。除了气柱中的共振之外,还可以观察到耳机2中的共振模式。因为峰P1、P2、P3和谷N1、N2的特性取决于用户3的耳道的形状,所以提取用于识别个体的特征量是有效的。
这种声学特性可通过基于下式(1)所示的有理多项式模型的频率响应函数来表示。
[方程1]
Figure BDA0003535965520000101
其中ω是角频率。Ωl(ω)是多项式展开式中的基函数,并且该基函数与获取声学特性的对象无关。Ωl(ω)是复函数。αl和βl是多项式的实系数,并且该术语取决于对象而异。也就是说,αl和βl是表示对象特征的特征量。Nm是有理多项式模型中采用的模式数量,指标l是表示每个模式的参数。
方程(1)的分母在强度峰出现的频率处变为零,而方程(1)的分子在强度谷出现的频率处变为零。因此,在基于有理多项式模型的频率响应函数中,分母中考虑峰特征,分子中考虑谷特征。特征量提取单元122确定系数αl和βl,从而通过方程(1)来近似所获取的声学特性,以估计频率响应函数。对于这种近似,可以使用诸如最小二乘法、最大似然估计法的近似方法,包括诸如最小化误差函数的算法。
在步骤S112中,特征量提取单元122将基于有理多项式模型的频率响应函数的系数αl和βl输出,作为指示用户3的特征量。在特征量的输出中,可以对于相互不同的多个Nm提取系数αl和βl,并且可将在多个Nm中获取的系数αl和βl组合,以提取作为特征量。因此,可以在特征量中反映在多个Nm中稳定获取的峰和谷的特性。
因为在导出时不需要对系数αl和βl进行处理来计算对数,所以系数αl和βl是在佩戴状态下对差异具有鲁棒性的特征量。下面描述其细节。
下面描述上述特征量提取方法的效果。如上所述,声学特性包括由于在由用户3的耳道、鼓膜和耳机2形成的气柱中发生的共振引起的峰和谷。因为这些峰和谷的频率和振幅取决于气柱的形状,所以它们会取决于耳机2的位置而变化。因此,声学特性可能会根据耳机2的佩戴状态而变化。
图8是示出反复戴上和卸下耳机2时的声学特性的变化的示例的曲线图。在图8中,通过反复戴上和取下来改变佩戴状态,从而获取五次声学特性,并将这些声学特性叠加显示。注意图8中的峰P4和P5以及谷N3,可以看出,谷N3的变化大于峰P4和P5的变化。
下面用简单的示例来说明为什么谷N3的变化大于峰P4和P5的变化。假设在耳道中只有两种共振模式,并且由两种共振模式产生的声学特性可以分为两种,S1(f)和S2(f)。假设S1(f)具有在固有频率f1处出现峰的特性,而S2(f)具有在固有频率f2处出现峰的特性。此时,假设模式之间的相位差为θ,考虑两种模式在f1与f2之间的频率处的干扰后声学特性Si(f)满足以下方程(2)。
[方程2]
|Si(f)|2=|S1(f)|2+|S2(f)|2+2|S1(f)||S2(f)|cosθ (2)
当耳机2的佩戴状态发生变化时,通过改变|S1(f)|、|S2(f)|和θ这三个参数来改变声学特性|Si(f)|。因为S2(f)的影响在固有频率f1处足够小,所以可通过以下方程(3)来近似声学特性|Si(f)|。
[方程3]
|Si(f)|2≈|S1(f)|2 (3)
因为S1(f)的影响在固有频率f2处足够小,所以可通过以下方程(4)来近似声学特性|Si(f)|。
[方程4]
|Si(f)|2≈|S2(f)|2 (4)
基于方程(3)和(4),在固有频率附近可以忽略包括θ的项。因此可以看出,在固有频率附近,声学特性|Si(f)|受佩戴状态变化引起的绝对值(功率)变化的影响,但不受佩戴状态变化引起的相位差变化的影响。这对应于图8中峰P4和P5附近相对较小的波动。另一方面,因为上述近似在f1和f2中间附近的频率不成立,所以绝对值的变化和相位差的变化都可以是改变声学特性的因素。这对应于图8中谷N3附近相对较大的波动。
如专利文献1所述,已将梅尔频率倒谱系数用作用于认证的特征量。导出梅尔频谱系数的处理可包括计算声学特性的对数的处理。将声学特性转换为对数标度强调了低强度区域。
如上所述,在谷附近,因为相邻模式之间的相位差θ容易受到影响,所以由于佩戴状态的变化引起的变化显著。此外,转换为对数标度强调了强度最小的谷附近变化的影响。通过叠加这两种影响,在导出处理中包括计算对数的处理的使用梅尔频率倒谱系数的特征量提取可能容易受到佩戴状态变化的影响。
另一方面,根据本实施例的特征量提取方法对于佩戴状态差异具有鲁棒性,因为在导出中不需要对数计算的处理。由于以上原因,在本实施例中,可以提取对耳机2的佩戴状态差异具有鲁棒性的特征量,同时关注谷和峰的特征。
在本实施例中,通过有理多项式模型从频率响应函数中提取特征量。下面将说明,该处理是这样一种提取特征量的方法,其关注谷和峰的特征。可将方程(1)中基于有理多项式模型的频率响应函数转换为下面方程(5)中所示的基于极点/残差模型的频率响应函数。这种转换对应于有理多项式模型对频率响应函数的部分分数展开。有时候将极点/残差模型的频率响应函数称为第二频率响应函数。
[方程5]
Figure BDA0003535965520000131
其中,λk是表示声学特性极点的复数,Rk是表示极点形状的复数。有时候将λk和Rk分别称为极点和残差。注意:j是虚数单位,C是余项,而“*”是表示复共轭的符号。
在物理上,λk包括有关极点的固有频率fk和极点衰减率ζk的信息。极点的固有频率fk和衰减率ζk分别由以下方程(6)和(7)来表示。在此,Re(λk)是λk的实部,Im(λk)是λk的虚部。
[方程6]
Figure BDA0003535965520000132
[方程7]
Figure BDA0003535965520000133
在固有频率下,方程(5)括号内jω-λk项的虚部变为零,jω-λk项的实部变为由衰减率ζk决定的常数。因此,方程(5)括号内的项是代表第k个峰的阻尼振动的函数。换言之,方程(5)通过Nm阻尼振动的和来表达频率响应函数。
通过这种方式,可将基于方程(1)的有理多项式模型的频率响应函数转换为基于阻尼振动之和构成的极点/残差模型的频率响应函数。因此,基于有理多项式模型的频率响应函数实质上包含共振模式的特征,并且适用于关注共振模式的峰和谷特征的特征量提取。
注意,可以从极点/残差模型的频率响应函数中包含的项中提取特征量,而不是从有理多项式模型中提取。但是,因为极点/残差模型的各个项因对象而异,所以在特征量匹配时难以确定要比较的项,而有理多项式模型的基函数并不依赖于用户,因此具有在匹配特征量时容易进行比较的优点。因此,优选从包含在有理多项式模型的频率响应函数中的项中提取特征量。
[第二示例性实施例]
本实施例的信息处理系统在特征量提取处理的内容上与第一实施例不同,但其他部分与第一实施例相似。下面主要描述与第一实施例的不同之处,并省略或简化对共同部分的描述。
图9是示出根据实施例的信息通信装置1进行的特征量提取处理的流程图。本实施例与第一实施例的不同之处在于增加了将有理多项式模型转换为极点/残差模型并排除一些项的处理。
在步骤S111中,与第一实施例一样,特征量提取单元122计算有理多项式模型的频率响应函数。
在步骤S121中,特征量提取单元122将有理多项式模型的频率响应函数转换为极点/残差模型的频率响应函数。该处理的内容如使用方程(1)、(5)等在第一实施例中所述,因此省略其描述。
在步骤S122中,特征量提取单元122从极点/残差模型的频率响应函数的各个项中确定非重要项。非重要项是由于耳道中的共振物理现象,明显不能充分表示阻尼振动的项。具体而言,存在诸如衰减比ζk为负的项、固有频率fk在可能发生共振的频率范围之外的项等,这些项显然与耳道中的共振物理现象相悖。
在步骤S123中,特征量提取单元122根据极点/残差模型的频率响应函数中的各个项来确定不稳定项。不稳定项是在通过改变诸如近似条件这样的计算条件多次进行通过频率响应函数来近似声学特性的处理时不会稳定出现的项。例如,当在诸如方程(1)或(5)所示的模型中考虑模式数量Nm时不具有相同的固有频率和相同的衰减率的项是不稳定项。作为确定不稳定项的方法的具体示例,在要考虑的模式数量为Na或Na+1的情况下,其中固有频率或衰减率的变化量超过预定误差范围的确定模式的方法被称为不稳定模式。这种不稳定项并不代表耳道中的共振物理现象,而很可能是计算因素造成的伪象。
在步骤S124中,特征量提取单元122从极点/残差模型的频率响应函数中排除一些项,将它们转换为有理多项式模型的频率响应函数。在此,“一些项”可以是在步骤S122中提取的非重要项和在步骤S123中提取的非重要项。将不能充分代表物理现象的项排除。此外,因为不需要提取余项C作为表示用户3特征的特征量,“一些项”可包括余项C。具体而言,排除一些项的处理可以是将余数Rk或相应项的余项C的值更改为零的处理。
在步骤S112中,通过与第一实施例中相同的处理,特征量提取单元122将在步骤S124中获得的有理多项式模型的频率响应函数的系数输出作为特征量。
根据本实施方式的技术,与第一实施例一样,能够提取对佩戴状态差异具有鲁棒性的特征量。此外,因为在排除非重要项、不稳定项等之后提取特征量,所以可以提取更适当地反映诸如用户3耳道形状这样的生物特征的特征量。
[第三示例性实施例]
本实施例的信息处理系统在特征量提取处理的内容上与第一、第二实施例不同,但是在其他部分与第一、第二实施例类似。下面主要描述与第二实施例的不同,并省略或简化对共同部分的描述。
图10是示出根据实施例的信息通信装置1进行的特征量提取处理的流程图。本实施例与第二实施例的不同之处在于增加了这样的处理:根据通过排除一些项获得的有理多项式模型的频率响应函数,通过重构频谱来计算梅尔频率倒谱系数(MFCC)。
从步骤S111到步骤S124的处理与第二实施例中的处理相同,因此省略其描述。
在步骤S131中,特征量提取单元122从在步骤S124中生成的有理多项式模型的频率响应函数来重构声学特性的频谱。
在步骤S132中,特征量提取单元122从重构频谱计算梅尔频率倒谱系数。下面描述计算梅尔频率倒谱系数的方法的示例。
首先,特征量提取单元122将梅尔滤波器组应用于重构频谱。梅尔滤波器组是包括多个三角窗函数的滤波器组。基于考虑人类听觉特性的梅尔尺度,将多个三角窗函数配置为使得频率越高,频宽就越宽。应用梅尔滤波器组获得的频谱称为梅尔频谱。此外,将梅尔频谱的强度(纵轴)转换为对数标度称为梅尔对数频谱。通过转换为对数标度,可以很好地表示具有小增益的高阶共振现象。
接着,特征量提取单元122对梅尔对数频谱进行离散余弦变换,以计算频域中的倒谱。通过提取倒谱中预定范围内的阶的项的系数来计算梅尔频率倒谱系数。在该方法中,考虑人的听觉特性,可通过加权来获取经过有效压缩的特征量。
在步骤S133中,特征量提取单元122将在步骤S132的处理中获取的梅尔频率倒谱系数输出作为特征量。
根据本实施例的技术,与第二实施例一样,可以提取更适当地表达诸如用户3耳道形状这样的生物特征的特征量。此外,因为在梅尔频率倒谱系数的计算处理中进行考虑人类听觉特性的加权,所以可以提取经过有效压缩的特征量。
[第四示例性实施例]
本实施例的信息处理系统在特征量提取处理的内容上与第一至第三实施例不同,但是在其他部分与第一至第三实施例类似。下面主要描述与第三实施例的不同,并省略或简化对共同部分的描述。
图11是示出根据实施例的信息通信装置1进行的特征量提取处理的流程图。本实施例与第二或第三实施例的不同之处在于,将有理多项式模型的频率响应函数的系数和梅尔频率倒谱系数都提取为特征量。
从步骤S111到步骤S124的处理与第二实施例中的处理相同,因此省略其描述。
在步骤S141中,特征量提取单元122通过与第一或第二实施例中相同的处理,将在步骤S124中获取的有理多项式模型的频率响应函数的系数输出作为第一特征量。
步骤S131和S132中的处理与第三实施例中的处理相同,因此省略其描述。
在步骤S142中,特征量提取单元122将通过步骤S132中的处理获取的梅尔频率倒谱系数输出作为第二特征量。
在特征量提取之后的确定处理(图5中的步骤S105)中,基于第一特征量和第二特征量两者来确定用户3是否为注册者。具体而言,可以使用这样的技术,其中将通过使用第一特征量的核对获得的第一分数和通过使用第二特征量的核对获得的第二分数进行加权并以预定比率相加,并基于相加的分数来确定用户3是否为注册者。此外,使用第一特征量的核对和使用第二特征量的核对可以分开进行,并且两个核对结果的逻辑和或逻辑积可以作为最终核对结果。
根据本实施例的技术,因为根据第二实施例的特征量提取技术和根据第三实施例的特征量提取技术一起使用,所以可以兼获两种效果。此外,在本实施例中,因为可通过使用由其提取峰和谷特征的第一特征量和主要由其提取声学特性的波形特征的第二特征量来进行确定,所以可以实现其中考虑更多的多方面信息的高准确性生物特征认证。
以上实施例所述的系统也可以如以下的第五实施例那样配置。
[第五示例性实施例]
图12是示出根据第五实施例的信息处理装置4的功能方框图。信息处理装置4包括获取单元421和提取单元422。获取单元421基于在用户头部中传播的声波来获取频域中的声学特性。提取单元422生成具有有理多项式(包括在分母中指示声学特性的峰特性的项)的第一频率响应函数,并基于第一频率响应函数来提取用于用户的生物特征认证的特征量。
根据本实施例,提供能够提取对佩戴状态差异具有鲁棒性的特征量的信息处理装置4。
[变型示例性实施例]
本公开并不限于上述实施例,在不脱离本公开精神的情况下可以视情况进行修改。例如,将一个实施例的一部分配置添加到另一个实施例的示例或者将另一个实施例的一部分配置替换的示例也是本公开的实施例。
在上述实施例中,将耳机2例示为可佩戴装置的示例,但是耳机并不限于在外耳孔中佩戴的耳机,只要能够获取处理所需的声学信息。例如,可穿戴装置可以是覆盖整个耳朵的耳机,或者是除了外耳孔之外从头部间接发送声波的骨传导型声学装置。此外,可穿戴装置可以由安装在双耳上的两个耳机构成,在这种情况下,可以对双耳进行上述实施例的生物测定,也可以只对单耳进行上述实施例的生物测定。
其中将用于操作实施例的配置的程序记录在存储介质中,从而实现实施例的功能,将记录在存储介质中的程序作为代码读出,并在计算机中执行的处理方法也包括在每个实施例中。也就是说,计算机可读存储介质也包括在每个实施例的范围内。此外,在每个实施例中,不仅包括记录上述程序的存储介质,也包括程序本身。此外,在上述实施例中包括的一个或多个组件可以是诸如ASIC(专用集成电路)、FPGA(现场可编程门阵列)等被配置为实现每个组件的功能的电路。
作为存储介质,例如可以使用软盘、硬盘、光盘、磁光盘、CD(压缩盘)-ROM、磁带、非易失性存储卡和ROM。此外,不仅记录在存储介质上自行执行处理的程序,在OS(操作系统)上运行并与其他软件以及扩展板的功能合作执行处理的程序也包括在每个实施例的范围内。
通过上述实施例的功能实现的服务也可通过软件即服务(SaaS)的形式提供给用户。
注意,上述实施例只是本公开实施例的示例,本发明的技术范围不应理解为仅限于此。也就是说,在不背离其技术理念或主要特征的情况下,可通过多种方式来实践本公开。
也可将上述实施例的一些或全部描述如下,但不限于此。
(附记1)
一种信息处理装置,包括:
获取单元,其被配置为基于在用户头部中传播的声波来获取频域中的声学特性;以及
提取单元,其被配置为生成具有有理多项式方程的第一频率响应函数,以基于第一频率响应函数来提取用于用户的生物特征认证的特征量,该有理多项式方程包括在分母中指示声学特性的峰的特征的项以及在分子中指示声学特性的谷的特征的项。
(附记2)
根据附记1所述的信息处理装置,其中,提取单元被配置为提取所述有理多项式方程的系数作为所述特征量。
(附记3)
根据附记1或2所述的信息处理装置,其中,第一频率响应函数的分母在与峰相对应的频率处为零。
(附记4)
根据附记1至3中的任一项所述的信息处理装置,其中,声学特性包括多个峰,并且其中,提取单元被配置为生成具有多个分数之和的第二频率响应函数。
(附记5)
根据附记4所述的信息处理装置,其中,多个分数的每个分母中的虚部在与所述多个峰中的一个峰相对应的频率处为零。
(附记6)
根据附记4或5所述的信息处理装置,其中,第一频率响应函数和第二频率响应函数是可以相互转换的。
(附记7)
根据附记6所述的信息处理装置,其中,第二频率响应函数包括第一频率响应函数的部分分数展开。
(附记8)
根据附记4至7中的任一项所述的信息处理装置,其中,提取单元被配置为通过从第二频率响应函数中包括的多个分数中排除一些项并转换为第一频率响应函数来生成第一频率响应函数。
(附记9)
根据附记4至8中的任一项所述的信息处理装置,其中,提取单元被配置为通过从第二频率响应函数中包括的多个分数中排除物理上的非重要项并转换为第一频率响应函数来生成第一频率响应函数。
(附记10)
根据附记4至9中的任一项所述的信息处理装置,其中,提取单元被配置为通过从第二频率响应函数中包括的多个分数中排除用于改变计算条件的不稳定项并转换为第一频率响应函数来生成第一频率响应函数。
(附记11)
根据附记8至10中的任一项所述的信息处理装置,其中,提取单元被配置为通过使用从第二频率响应函数转换的所述第一频率响应函数来生成频域中的频谱。
(附记12)
根据附记11所述的信息处理装置,其中,提取单元被配置为基于频谱来提取特征量。
(附记13)
根据附记11或12所述的信息处理装置,其中,提取单元被配置为基于第一频率响应函数的系数来提取第一特征量,并基于频谱来提取第二特征量。
(附记14)
根据附记1至13中的任一项所述的信息处理装置,其中,声学特性取决于在用户的耳道中传播的声波,该声波通过佩戴在用户头部的可穿戴装置来获取。
(附记15)
一种信息处理方法,包括:
基于在用户头部中传播的声波来获取频域中的声学特性;以及
生成具有有理多项式方程的第一频率响应函数,以基于第一频率响应函数来提取用于用户的生物特征认证的特征量,该有理多项式方程包括在分母中指示声学特性的峰的特征的项以及在分子中指示声学特性的谷的特征的项。
(附记16)
一种存储介质,用于存储程序,该程序使得计算机进行:
基于在用户头部中传播的声波来获取频域中的声学特性;以及
生成具有有理多项式方程的第一频率响应函数,以基于第一频率响应函数来提取用于用户的生物特征认证的特征量,该有理多项式方程包括在分母中指示声学特性的峰的特征的项以及在分子中指示声学特性的谷的特征的项。
[附图标记列表]
1 信息通信装置
2 耳机
3 用户
20 耳机控制装置
26 扬声器
27 麦克风
101、201 CPU
102、202 RAM
103,203 ROM
104 HDD
105、207 通信接口
106 输入装置
107 输出装置
121 声学特性获取单元
122 特征量提取单元
123 确定单元
204 闪存
205 扬声器接口
206 麦克风接口
208 电池
421 获取单元
422 提取单元

Claims (16)

1.一种信息处理装置,包括:
获取单元,所述获取单元被配置为基于在用户的头部中传播的声波来获取频域中的声学特性;以及
提取单元,所述提取单元被配置为生成具有有理多项式方程的第一频率响应函数,以基于所述第一频率响应函数来提取被用于所述用户的生物特征认证的特征量,所述有理多项式方程包括在分母中指示所述声学特性的峰的特征的项以及在分子中指示所述声学特性的谷的特征的项。
2.根据权利要求1所述的信息处理装置,其中,
所述提取单元被配置为提取所述有理多项式方程的系数作为所述特征量。
3.根据权利要求1或2所述的信息处理装置,其中,
所述第一频率响应函数的分母在与所述峰相对应的频率处为零。
4.根据权利要求1至3中的任一项所述的信息处理装置,其中,
所述声学特性包括多个峰,并且
其中,所述提取单元被配置为生成具有多个分数之和的第二频率响应函数。
5.根据权利要求4所述的信息处理装置,其中,
所述多个分数的每个分母中的虚部在与所述多个峰中的一个峰相对应的频率处为零。
6.根据权利要求4或5所述的信息处理装置,其中,
所述第一频率响应函数和所述第二频率响应函数是可以相互转换的。
7.根据权利要求6所述的信息处理装置,其中,
所述第二频率响应函数包括所述第一频率响应函数的部分分数展开。
8.根据权利要求4至7中的任一项所述的信息处理装置,其中,
所述提取单元被配置为:通过从所述第二频率响应函数中包括的所述多个分数中排除一些项并且转换为所述第一频率响应函数,来生成所述第一频率响应函数。
9.根据权利要求4至8中的任一项所述的信息处理装置,其中,
所述提取单元被配置为:通过从所述第二频率响应函数中包括的所述多个分数中排除物理上的非重要项并且转换为所述第一频率响应函数,来生成所述第一频率响应函数。
10.根据权利要求4至9中的任一项所述的信息处理装置,其中,
所述提取单元被配置为:通过从所述第二频率响应函数中包括的所述多个分数中排除用于改变计算条件的不稳定项并且转换为所述第一频率响应函数,来生成所述第一频率响应函数。
11.根据权利要求8至10中的任一项所述的信息处理装置,其中,
所述提取单元被配置为:通过使用从所述第二频率响应函数转换的所述第一频率响应函数,来生成所述频域中的频谱。
12.根据权利要求11所述的信息处理装置,其中,
所述提取单元被配置为基于所述频谱来提取所述特征量。
13.根据权利要求11或12所述的信息处理装置,其中,
所述提取单元被配置为:基于所述第一频率响应函数的系数来提取第一特征量,并且基于所述频谱来提取第二特征量。
14.根据权利要求1至13中的任一项所述的信息处理装置,其中,
所述声学特性取决于在所述用户的耳道中传播的声波,所述声波是由佩戴在所述用户的所述头部的可穿戴装置来被获取的。
15.一种信息处理方法,包括:
基于在用户的头部中传播的声波,来获取频域中的声学特性;以及
生成具有有理多项式方程的第一频率响应函数,以基于所述第一频率响应函数来提取被用于所述用户的生物特征认证的特征量,所述有理多项式方程包括在分母中指示所述声学特性的峰的特征的项以及在分子中指示所述声学特性的谷的特征的项。
16.一种存储介质,其存储有程序,所述程序使得计算机进行:
基于在用户的头部中传播的声波,来获取频域中的声学特性;以及
生成具有有理多项式方程的第一频率响应函数,以基于所述第一频率响应函数来提取被用于所述用户的生物特征认证的特征量,所述有理多项式方程包括在分母中指示所述声学特性的峰的特征的项以及在分子中指示所述声学特性的谷的特征的项。
CN201980100182.0A 2019-09-12 2019-09-12 信息处理装置、信息处理方法及存储介质 Pending CN114423339A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/035904 WO2021048974A1 (ja) 2019-09-12 2019-09-12 情報処理装置、情報処理方法及び記憶媒体

Publications (1)

Publication Number Publication Date
CN114423339A true CN114423339A (zh) 2022-04-29

Family

ID=74866307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980100182.0A Pending CN114423339A (zh) 2019-09-12 2019-09-12 信息处理装置、信息处理方法及存储介质

Country Status (6)

Country Link
US (1) US11937040B2 (zh)
EP (1) EP4029442A4 (zh)
JP (1) JP7239007B2 (zh)
CN (1) CN114423339A (zh)
BR (1) BR112022002570A2 (zh)
WO (1) WO2021048974A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11438683B2 (en) * 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US20230048401A1 (en) * 2021-08-13 2023-02-16 Cirrus Logic International Semiconductor Ltd. Methods, apparatus and systems for biometric processes
WO2023089822A1 (ja) * 2021-11-22 2023-05-25 日本電信電話株式会社 装着ユーザ識別装置、装着ユーザ識別システム、装着ユーザ識別方法及び装着ユーザ識別プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180307818A1 (en) * 2015-10-21 2018-10-25 Nec Corporation Personal authentication device, personal authentication method, and personal authentication program
WO2018198310A1 (ja) * 2017-04-28 2018-11-01 日本電気株式会社 個人認証装置、個人認証方法および記録媒体
CN108803859A (zh) * 2018-05-28 2018-11-13 Oppo广东移动通信有限公司 信息处理方法、装置、终端、耳机及可读存储介质

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4126498B2 (ja) 2004-05-27 2008-07-30 カシオ計算機株式会社 電子計算装置および計算表示処理プログラム
US7529379B2 (en) * 2005-01-04 2009-05-05 Motorola, Inc. System and method for determining an in-ear acoustic response for confirming the identity of a user
JP5015939B2 (ja) * 2005-09-22 2012-09-05 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音響的外耳特徴付けのための方法及び装置
JP4740889B2 (ja) 2007-03-06 2011-08-03 日本電信電話株式会社 パラメータ推定装置,パラメータ推定方法,その方法を実装したプログラム及びそのプログラムを記録した記録媒体
JP2010086328A (ja) * 2008-09-30 2010-04-15 Yamaha Corp 認証装置および携帯電話機
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
JP5891438B2 (ja) 2012-03-16 2016-03-23 パナソニックIpマネジメント株式会社 音像定位装置、音像定位処理方法、および音像定位処理プログラム
WO2014061578A1 (ja) * 2012-10-15 2014-04-24 Necカシオモバイルコミュニケーションズ株式会社 電子機器、及び音響再生方法
JP6446679B2 (ja) 2015-03-02 2019-01-09 カルソニックカンセイ株式会社 車両用計器装置
JP6730568B2 (ja) * 2015-10-28 2020-07-29 国立研究開発法人情報通信研究機構 立体音再生装置およびプログラム
WO2018034178A1 (ja) 2016-08-19 2018-02-22 日本電気株式会社 個人認証システム、個人認証装置、個人認証方法および記録媒体
EP3513724B1 (en) 2016-09-16 2022-04-06 Nec Corporation Personal authentication device, personal authentication method, and recording medium
WO2018101317A1 (ja) 2016-12-02 2018-06-07 日本電気株式会社 認証システム、認証管理サーバ、方法およびプログラム
GB201801527D0 (en) * 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Method, apparatus and systems for biometric processes

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180307818A1 (en) * 2015-10-21 2018-10-25 Nec Corporation Personal authentication device, personal authentication method, and personal authentication program
WO2018198310A1 (ja) * 2017-04-28 2018-11-01 日本電気株式会社 個人認証装置、個人認証方法および記録媒体
CN108803859A (zh) * 2018-05-28 2018-11-13 Oppo广东移动通信有限公司 信息处理方法、装置、终端、耳机及可读存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
叶学松: "基于人工神经网络及心音小波分析的冠心病诊断方法的研究", 浙江大学学报(工学版), no. 02, pages 15 - 20 *
李倩 等: "讲话人识别系统的鼻腔参数研究", 声学技术, no. 03, pages 61 - 65 *
林宝成 等: "基于ARMA模型的汉语讲话者识别", 声学学报, no. 03, pages 229 - 234 *
许志杰 等: "最小二乘复频域法实复系数矩阵的分析", 噪声与振动控制, no. 03, pages 25 - 29 *

Also Published As

Publication number Publication date
EP4029442A4 (en) 2022-09-07
WO2021048974A1 (ja) 2021-03-18
US11937040B2 (en) 2024-03-19
BR112022002570A2 (pt) 2022-05-03
US20220295170A1 (en) 2022-09-15
EP4029442A1 (en) 2022-07-20
JPWO2021048974A1 (zh) 2021-03-18
JP7239007B2 (ja) 2023-03-14

Similar Documents

Publication Publication Date Title
CN114423339A (zh) 信息处理装置、信息处理方法及存储介质
WO2019113130A1 (en) Voice activity detection systems and methods
CN103229517B (zh) 包括多个音频传感器的设备及其操作方法
EP2064698B1 (en) A method and a system for providing sound generation instructions
JP6334895B2 (ja) 信号処理装置及びその制御方法、プログラム
Maruri et al. V-speech: Noise-robust speech capturing glasses using vibration sensors
US10262678B2 (en) Signal processing system, signal processing method and storage medium
CN114424581A (zh) 用于音频信号生成的系统和方法
KR20150123579A (ko) 사용자 음성으로부터 감정정보를 확인하는 방법 및 장치
Eklund Data augmentation techniques for robust audio analysis
US11711647B1 (en) Voice detection using ear-based devices
CN113455017A (zh) 信息处理设备、可佩戴设备、信息处理方法和存储介质
JP5803125B2 (ja) 音声による抑圧状態検出装置およびプログラム
US11501758B2 (en) Environment aware voice-assistant devices, and related systems and methods
JP2008257110A (ja) 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体
US10314529B2 (en) Vocal monitoring and biofeedback device
Horner et al. Evaluation of mel-band and MFCC-based error metrics for correspondence to discrimination of spectrally altered musical instrument sounds
WO2022173990A1 (en) Multi-channel speech compression system and method
JP2007127891A (ja) 発話主体同定装置及びコンピュータプログラム
JP7131636B2 (ja) 情報処理装置、装着型機器、情報処理方法及び記憶媒体
WO2021226515A1 (en) System and method for data augmentation for multi-microphone signal processing
WO2022195827A1 (ja) 情報処理装置、情報処理方法及び記憶媒体
Lagrange et al. Robust similarity metrics between audio signals based on asymmetrical spectral envelope matching
CN113242719A (zh) 信息处理设备、可穿戴设备、信息处理方法和存储介质
CN116868267A (zh) 多通道语音压缩系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination