CN113412630A

CN113412630A - 处理装置、处理方法、再现方法和程序

Info

Publication number: CN113412630A
Application number: CN201980090944.3A
Authority: CN
Inventors: 下条敬洋; 村田寿子; 小西正也; 藤井优美; 高地邦明; 永井俊明
Original assignee: JVCKenwood Corp
Current assignee: JVCKenwood Corp
Priority date: 2019-02-14
Filing date: 2019-12-24
Publication date: 2021-09-17
Anticipated expiration: 2039-12-24
Also published as: CN113412630B; EP3926977A4; JP7115353B2; WO2020166216A1; EP3926977A1; JP2020136752A; US20210377684A1

Abstract

目的在于提供能够进行适当处理的处理装置、处理方法、再现方法以及程序。本实施方式涉及的处理装置(201)包括：包络线计算部(214)，计算拾音信号相对于频率特性的包络线；尺度变换部(215)，通过对包络线的频率数据进行尺度变换以及数据插值，来生成尺度变换数据；归一化系数计算部(216)，将尺度变换数据划分到多个频带，求出每个频带的特征值，并基于特征值计算归一化系数；以及归一化部(217)，使用归一化系数对时域的拾音信号进行归一化。

Description

处理装置、处理方法、再现方法和程序

技术领域

本发明涉及一种处理装置、处理方法、再现方法和程序。

背景技术

专利文献1中公开的录音和再现系统使用了滤波器单元，该滤波器单元用于处理提供给扬声器的信号。滤波器单元包括两个滤波器设计步骤。在第一步骤中，以滤波器(a)的形式描述虚拟声源的位置和再现声场的特定位置之间的传递函数。此外，再现声场的特定位置是收听者的耳根部或头部区域。此外，在第二步骤中，使传递函数滤波器(A)与用于反转扬声器的输入和特定位置之间的电声传输路径或路径组(C)的串扰消除用滤波器(Hx)的矩阵进行卷积。此外，串扰消除用滤波器(Hx)的矩阵通过测量脉冲响应来创建。

然而，作为声像定位技术，有使用头戴式耳机使声像定位在收听者的头部外侧的头外定位技术。在头外定位技术中，通过消除从头戴式耳机到耳朵的特性(头戴式耳机特性)、赋予从一个扬声器(单声道扬声器)到耳朵的两个特性(空间音响传输特性)，使声像定位在头外。

在立体声扬声器的头外定位再现中，由设置在收听者(listener)本人的耳朵上的麦克(以下记载为麦克)对从两声道(以下记载为ch)的扬声器发出的测量信号(脉冲音等)进行录音。然后，处理装置基于拾取测量信号而得到的拾音信号来生成滤波器。通过将所生成的滤波器与2ch的音频信号进行卷积，能够实现头外定位再现。

此外，为了生成用于消除从头戴式耳机到耳朵的特性的滤波器，使用设置在收听者本人的耳朵上的麦克来测量从头戴式耳机到耳根和鼓膜的特性(也称为外耳道传递函数ECTF、外耳道传输特性)。

在专利文献2中公开了生成外耳道传递函数的逆滤波器的方法。在专利文献2的方法中，为了防止由陷波引起的高音噪声，而校正外耳道传递函数的振幅分量。具体而言，在振幅分量的增益低于增益阈值的情况下，通过校正增益值来调整陷波。并且，基于校正后的外耳道传递函数，来生成逆滤波器。

现有技术文献

专利文献

专利文献1：日本特表平10-509565号公报；

专利文献2：日本特开2015-126268号公报。

发明内容

发明所要解决的问题

在进行头外定位处理的情况下，优选利用设置在收听者本人的耳朵上的麦克来测量特性。在测量外耳道传输特性的情况下，在收听者的耳朵上佩戴了麦克、头戴式耳机的状态下，实施脉冲响应测量等。通过使用收听者本人的特性，能够生成适合于收听者的滤波器。为了生成这样的滤波器等，希望适当地处理通过测量得到的拾音信号。

本实施方式是鉴于上述问题而提出的，其目的在于提供一种能够适当地处理拾音信号的处理装置、处理方法、再现方法以及程序。

用于解决问题的手段

本实施方式涉及一种处理装置，包括：包络线计算部，计算拾音信号相对于频率特性的包络线；尺度转换部，通过对所述包络线的频率数据进行尺度转换以及数据插值，来生成尺度转换数据；归一化系数计算部，将所述尺度转换数据划分到多个频带，求出每个所述频带的特征值，并基于所述特征值计算归一化系数；以及归一化部，使用所述归一化系数对时域的拾音信号进行归一化。

本实施方式涉及一种处理方法，包括以下步骤：计算针对拾音信号的频率特性的包络线；通过对所述包络线的频率数据进行尺度变换以及数据插值，来生成尺度变换数据；将所述尺度变换数据划分到多个频带，求出每个所述频带的特征值，并基于所述特征值计算归一化系数；以及使用所述归一化系数对时域的拾音信号进行归一化。

本实施方式涉及一种程序，用于使计算机执行处理方法，所述处理方法包括以下步骤：计算针对拾音信号的频率特性的包络线；通过对所述包络线的频率数据进行尺度变换以及数据插值，来生成尺度变换数据；将所述尺度变换数据划分到多个频带，求出每个所述频带的特征值，并基于所述特征值计算归一化系数；以及使用所述归一化系数对时域的拾音信号进行归一化。

发明效果

根据本实施方式，能够提供能够适当地处理拾音信号的处理装置、处理方法、再现方法以及程序。

附图说明

图1是表示本实施方式涉及的头外定位处理装置的框图；

图2是示意性地表示测量装置的结构的图；

图3是表示处理装置的结构的框图；

图4是表示拾音信号的功率谱及其包络线的曲线图；

图5是表示归一化前后的功率谱的曲线图；

图6是表示在下陷(dip)校正前的归一化功率谱的曲线图；

图7是表示在下陷校正后的归一化功率谱的曲线图；

图8是表示滤波器生成处理的流程图。

具体实施方式

说明本实施方式涉及的声像定位处理的概要。本实施方式涉及的头外定位处理是使用空间音响传输特性和外耳道传输特性执行头外定位处理的处理。空间音响传输特性是从扬声器等声源到外耳道的传输特性。外耳道传输特性是从头戴式耳机或入耳式耳机的扬声器单元到鼓膜的传输特性。在本实施方式中，测量在未佩戴头戴式耳机或入耳式耳机的状态下的空间音响传输特性，并且，测量在佩戴头戴式耳机或入耳式耳机的状态下的外耳道传输特性，并使用这些测量数据实现头外定位处理。本实施方式在用于测量空间音响传输特性或外耳道传输特性的麦克系统上具有特征。

本实施方式涉及的头外定位处理由个人计算机、智能电话、平板电脑PC等用户终端执行。用户终端是具有处理器等处理单元、存储器或硬盘等存储单元、液晶监视器等显示单元、触摸面板、按钮、键盘、鼠标等输入单元的信息处理装置。用户终端也可以具有收发数据的通信功能。此外，具有头戴式耳机或入耳式耳机的输出单元连接到用户终端。用户终端与输出装置的连接可以是有线连接，也可以是无线连接。

实施方式1.

(头外定位处理装置)

图1表示作为本实施方式涉及的声场再现装置的一例的、头外定位处理装置100的框图。头外定位处理装置100对佩戴头戴式耳机43的用户U再现声场。因此，头外定位处理装置100对Lch和Rch的立体声输入信号XL、XR进行声像定位处理。Lch和Rch的立体声输入信号XL、XR是从CD(Compact Disc，紧凑型光盘)播放器等输出的模拟音频再现信号、或者mp3(MPEG audio Layer-3，音频层3)等数字音频数据。此外，音频再现信号或数字音频数据被统称为再现信号。即，Lch和Rch的立体声输入信号XL和XR成为再现信号。

此外，头外定位处理装置100不限于物理上的单个装置，可以由不同的装置执行一部分处理。例如，可以通过智能电话等执行部分处理，剩余处理可以由内置在头戴式耳机43中的DSP(Digital Signal Processor，数字信号处理器)等执行。

头外定位处理装置100包括头外定位处理部10、保存逆滤波器Linv的滤波器部41、保存逆滤波器Rinv的滤波器部42以及头戴式耳机43。头外定位处理部10、滤波器部41及滤波器部42具体而言能够通过处理器等来实现。

头外定位处理部10包括保存空间音响传输特性Hls、Hlo、Hro、Hrs的卷积运算部11～12、21～22以及加法器24、25。卷积运算部11～12、21～22进行使用了空间音响传输特性的卷积处理。头外定位处理部10被输入来自CD播放器等的立体声输入信号XL、XR。在头外定位处理部10中设定有空间音响传输特性。头外定位处理部10对各ch的立体声输入信号XL、XR卷积空间音响传输特性的滤波器(以下也称为空间音响滤波器)。空间音响传输特性可以是在被测量者的头部或耳廓处测量的头部传输函数HRTF，也可以是仿真头或第三人的头部传输函数。

将四个空间音响传输特性Hls、Hlo、Hro、Hrs设置为一组后的特性作为空间音响传递函数。在卷积运算部11、12、21、22中用于卷积的数据成为空间音响滤波器。通过用预定的滤波器长度切割空间音响传输特性Hls、Hlo、Hro、Hrs而生成空间音响滤波器。

空间音响传输特性Hls、Hlo、Hro、Hrs各自通过脉冲响应测量等预先获取。例如，用户U将麦克分别佩戴在左耳和右耳上。配置在用户U前方的左右扬声器分别输出用于进行脉冲响应测量的脉冲音。然后，利用麦克对从扬声器输出的脉冲音等测量信号进行拾取。基于通过麦克拾取到的拾音信号，获取空间音响传输特性Hls、Hlo、Hro、Hrs。测量左扬声器和左麦克之间的空间音响传输特性Hls、左扬声器和右麦克之间的空间音响传输特性Hlo、右扬声器和左麦克之间的空间音响传输特性Hro、以及右扬声器和右麦克之间的空间音响传输特性Hrs。

然后，卷积运算部11对Lch的立体声输入信号XL卷积与空间音响传输特性Hls对应的空间音响滤波器。卷积运算部11将卷积运算数据输出到加法器24。卷积运算部21对Rch的立体声输入信号XR卷积与空间音响传输特性Hro对应的空间音响滤波器。卷积运算部21将卷积运算数据输出到加法器24。加法器24将两个卷积运算数据相加并输出到滤波器部41。

卷积运算部12对Lch的立体声输入信号XL卷积与空间音响传输特性Hlo对应的空间音响滤波器。卷积运算部12将卷积运算数据输出到加法器25。卷积运算部22对Rch的立体声输入信号XR卷积与空间音响传输特性Hrs对应的空间音响滤波器。卷积运算部22将卷积运算数据输出到加法器25。加法器25将两个卷积运算数据相加并输出到滤波器部42。

在滤波器部41和42中设定用于消除头戴式耳机特性(头戴式耳机的再现单元和麦克之间的特性)的逆滤波器Linv和Rinv。然后，将逆滤波器Linv和Rinv与已经进行了头外定位处理部10中的处理的再现信号(卷积运算信号)进行卷积。利用滤波器部41将Lch侧的头戴式耳机特性的逆滤波器Linv与来自加法器24的Lch信号进行卷积。同样地，滤波器部42将Rch侧的头戴式耳机特性的逆滤波器Rinv与来自加法器25的Rch信号进行卷积。当佩戴了头戴式耳机43时，逆滤波器Linv、Rinv消除从头戴式耳机单元到麦克的特性。麦克可以配置在从外耳道入口到鼓膜之间的任何位置。

滤波器部41将处理后的Lch信号YL输出到头戴式耳机43的左单元43L。滤波器部42将处理后的Rch信号YR输出到头戴式耳机43的右单元43R。用户U佩戴有头戴式耳机43。头戴式耳机43向用户U输出Lch信号YL和Rch信号YR(以下，Lch信号YL和Rch信号YR也被统称为立体声信号)。由此，能够再现定位在用户U的头外的声像。

这样，头外定位处理装置100使用与空间音响传输特性Hls、Hlo、Hro、Hrs对应的空间音响滤波器和头戴式耳机特性的逆滤波器Linv、Rinv进行头外定位处理。在以下的说明中，将与空间音响传输特性Hls、Hlo、Hro、Hrs对应的空间音响滤波器和头戴式耳机特性的逆滤波器Linv、Rinv汇总作为头外定位处理滤波器。在2ch的立体声再现信号的情况下，头外定位滤波器包括四个空间音响滤波器和两个逆滤波器。然后，头外定位处理装置100通过使用合计六个头外定位滤波器对立体声再现信号执行卷积运算处理，来执行头外定位处理。头外定位滤波器优选是基于用户U个人的测量。例如，基于由佩戴在用户U的耳朵上的麦克拾取的拾音信号来设定头外定位滤波器。

这样，空间音响滤波器和头戴式耳机特性的逆滤波器Linv、Rinv是音频信号用的滤波器。通过将这些滤波器卷积到再现信号(立体声输入信号XL、XR)，头外定位处理装置100执行头外定位处理。在本实施方式中，用于生成逆滤波器Linv、Rinv的处理成为技术特征之一。以下，对用于生成逆滤波器的处理进行说明。

(外耳道传输特性的测量装置)

为了生成逆滤波器，使用图2说明测量外耳道传输特性的测量装置200。图2示出了用于对用户U测量传输特性的结构。测量装置200包括麦克单元2、头戴式耳机43和处理装置201。此外，这里，被测量者1是与图1的用户U相同的人。

在本实施方式中，测量装置200的处理装置201根据测量结果进行用于适当地生成滤波器的运算处理。处理装置201是个人计算机(PC)、平板终端、智能电话等，具备存储器和处理器。存储器存储有处理程序、各种参数、测量数据等。处理器执行存储在存储器中的处理程序。处理器通过执行处理程序来执行各处理。处理器例如可以是CPU(CentralProcessing Unit，中央处理单元)、FPGA(Field-Programmable Gate Array，现场可编程门阵列)、DSP(Digital Signal Processor，数字信号处理器)、ASIC(Application SpecificIntegrated Circuit，专用集成电路)或GPU(Graphics Processing Unit，图形处理单元)等。

处理装置201与麦克单元2和头戴式耳机43连接。此外，麦克单元2可以内置在头戴式耳机43中。麦克单元2包括左麦克2L和右麦克2R。左麦克2L佩戴在用户U的左耳9L上。右麦克2R佩戴在用户U的右耳9R上。处理装置201可以是与头外定位处理装置100相同的处理装置，也可以是不同的处理装置。另外，还可以使用入耳式耳机来代替头戴式耳机43。

头戴式耳机43包括头戴式耳机带43B、左单元43L和右单元43R。头戴式耳机带43B将左单元43L与右单元43R连结。左单元43L向用户U的左耳9L输出声音。右单元43R向用户U的右耳9R输出声音。头戴式耳机43是密闭型、开放型、半开放型或半密闭型等，与头戴式耳机种类无关。在麦克单元2佩戴于用户U的状态下，用户U佩戴头戴式耳机43。即，在佩戴有左麦克2L、右麦克2R的左耳9L、右耳9R上分别佩戴头戴式耳机43的左单元43L、右单元43R。头戴式耳机带43B产生将左单元43L和右单元43R分别按压在左耳9L和右耳9R上的偏压力。

左麦克2L拾取从头戴式耳机43的左单元43L输出的声音。右麦克2R拾取从头戴式耳机43的右单元43R输出的声音。左麦克2L及右麦克2R的麦克部配置于外耳孔附近的拾音位置。左麦克2L和右麦克2R被构成为不干扰头戴式耳机43。即，在左麦克2L和右麦克2R被配置在左耳9L和右耳9R的适当位置的状态下，用户U能够佩戴头戴式耳机43。

处理装置201向头戴式耳机43输出测量信号。由此，头戴式耳机43产生脉冲音等。具体地说，利用左麦克2L测量从左单元43L输出的脉冲音。利用右麦克2R测量从右单元43R输出的脉冲音。在输出测量信号时，麦克2L和2R获取拾取信号，从而执行脉冲响应测量。

处理装置201通过对来自麦克2L和2R的拾音信号执行相同的处理，生成逆滤波器Linv和Rinv。以下，将详细描述测量装置200的处理装置201及其处理。图3是示出处理装置201的控制框图。处理装置201包括测量信号生成部211、拾音信号获取部212、包络线计算部214和尺度变换部215。此外，处理装置201包括归一化系数计算部216、归一化部217、变换部218、下陷校正部219和滤波器生成部220。

测量信号生成部211包括D/A转换器和放大器等，生成用于测量外耳道传输特性的测量信号。测量信号例如是脉冲信号、TSP(Time Streched Pulse，时间扩展脉冲)信号等。这里，测量装置200使用脉冲音作为测量信号来执行脉冲响应测量。

麦克单元2的左麦克2L、右麦克2R分别对测量信号进行拾取，并将拾音信号输出到处理装置201。拾音信号获取部212获取由左麦克2L、右麦克2R拾取的拾音信号。此外，拾音信号获取部212也可以包括对来自麦克2L、2R的拾音信号进行A/D转换的A/D转换器。拾音信号获取部212也可以对通过多次测量得到的信号进行同步相加。将时域的拾音信号称为ECTF。

包络线计算部214计算拾音信号的频率特性的包络线。包络线计算部214能够使用倒谱分析来求出包络线。首先，包络线计算部214通过离散傅立叶变换、离散余弦变换计算拾音信号(ECTF)的频率特性。包络线计算部214例如通过对时域的ECTF进行FFT(快速傅立叶变换)来计算频率特性。频率特性包括功率谱和相位谱。此外，包络线计算部214也可以生成振幅谱而代替功率谱。

对功率谱的各功率值(幅度值)进行对数变换。包络线计算部214通过对对数变换的频谱进行逆傅立叶变换来获得倒谱。包络线计算部214将提升器(Lifter)应用于倒谱。提升器是仅通过低频带分量的低通提升器(Low pass lifter)。包络线计算部214对通过提升器的倒谱进行FFT变换，能够求出ECTF的功率谱的包络线。图4是示出功率谱及其包络线的一例的曲线图。

这样，为了计算包络线的数据而使用倒谱分析，能够通过简单的计算使功率谱平滑化。因此，能够减少运算量。包络线计算部214也可以使用倒谱分析以外的方法。例如，对于对振幅值进行对数变换后的值，也可以通过应用一般的平滑化(Smoothing)方法来计算包络线。作为平滑化方法，能够使用简单移动平均、Savitzky-Golay滤波器、平滑样条等。

尺度变换部215使包络线数据的尺度变化，以使离散的频谱数据在对数轴上成为等间隔。由包络线计算部214求出的包络线数据在频率上成为等间隔。即，包络线数据在频率线性轴上成为等间隔，因此在频率对数轴上成为非等间隔。因此，尺度变换部215对包络线数据进行插值处理，以使包络线数据在频率对数轴上成为等间隔。

在包络线数据中，在对数轴上，越在低频域，相邻的数据间隔越粗，越在高频域，相邻的数据间隔越密。因此，尺度变换部215对数据间隔粗的低频带的数据进行插值。具体而言，尺度变换部215通过进行三维样条插值等插值处理，求出在对数轴上等间隔配置的离散的包络线数据。将进行了尺度变换的包络线数据作为尺度变换数据。尺度变换数据是频率与功率值建立了对应关系的频谱。

对变换为对数尺度的理由进行说明。通常可以说人类的感觉量是被变换成对数。因此，以对数轴来考虑听到的声音的频率也是重要的。通过进行尺度变换，在上述的感觉量中数据成为等间隔，所以能够在全部的频带中对数据进行等效处理。其结果是，数学运算、频带的分割或加权变得容易，能够得到稳定的结果。此外，尺度变换部215不限于对数尺度，只要将包络线数据变换为接近人的听觉的尺度(称为听觉尺度)即可。听觉尺度可以以对数尺度(Log scale)、梅尔(mel)尺度、巴克(Bark)尺度、ERB(Equivalent RectangularBandwidth，等效矩形带宽)尺度等进行尺度变换。尺度变换部215通过数据插值，以听觉尺度对包络线数据进行尺度变换。例如，尺度变换部215通过对听觉尺度中对数据间隔粗的低频带的数据进行插值，从而使低频带的数据变密。在听觉尺度上等间隔的数据在线性尺度(Linear scale)中成为低频带密、高频带粗的数据。通过如此，尺度变换部215能够生成以听觉尺度等间隔的尺度变换数据。当然，尺度变换数据在听觉尺度中也可以不是完全等间隔的数据。

归一化系数计算部216基于尺度变换数据计算归一化系数。因此，归一化系数计算部216将尺度变换数据划分为多个频带，并针对每个频带计算特征值。然后，归一化系数计算部216基于每个频带的特征值计算归一化系数。归一化系数计算部216对每个频带的特征值进行加权相加以计算归一化系数。

归一化系数计算部216将尺度变换数据分割成四个频带(以下称为第一至第四频带)。第一频带是最小频率(例如，10Hz)以上且小于1000Hz。第一频带是根据头戴式耳机43是否适合而改变的范围。第二频带是1000Hz以上且小于4kHz。第二频带是头戴式耳机本身的特性不根据个人而表现的范围。第三频带是4kHz以上且小于12kHz。第三特性是个人的特性表现得最好的范围。第四频带是12kHz以上且最大频率(例如，22.4kHz)以下。第四频带是按照每个佩戴头戴式耳机而变化的范围。此外，各频带的范围是示例，不限于上述值。

特征值例如是各频带中的尺度变换数据的最大值、最小值、平均值、中央值这四个值。将第一频带的四个值设为Amax(最大值)、Amin(最小值)、Aave(平均值)和Amed(中央值)。第二频带的四个值设为Bmax、Bmin、Bave、Bmed。同样地，将第三频带的四个值设为Cmax、Cmin、Cave、Cmed，将第四频带的四个值设为Dmax、Dmin、Dave、Dmed。

归一化系数计算部216针对每个频带基于四个特征值来计算基准值。

当将第一频带的基准值设为Astd时，基准值Astd由以下的式(1)表示。

Astd＝Amax×0.15+Amin×0.15+Aave×0.3+Amed×0.4……(1)

当将第二频带的基准值设为Bstd时，基准值Bstd由以下的式(2)表示。

Bstd＝Bmax×0.25+Bmin×0.25+Bave×0.4+Bmed×0.1……(2)

当将第三频带的基准值设为Cstd时，基准值Cstd由以下的式(3)表示。

Cstd＝Cmax×0.4+Cmin×0.1+Cave×0.3+Cmed×0.2……(3)

当将第四频带的基准值设为Dstd时，基准值Dstd由以下的式(4)表示。

Dstd＝Dmax×0.1+Dmin×0.1+Dave×0.5+Dmed×0.3……(4)

当将归一化系数设为Std时，归一化系数Std由以下的式(5)表示。

Std＝Astd×0.25+Bstd×0.4+Cstd×0.25+Dstd×0.1……(5)

如上所述，归一化系数计算部216通过对每个频带的特征值进行加权相加来计算归一化系数Std。归一化系数计算部216被分成四个频带，并且从每个频带提取四个特征值。归一化系数计算部216对16个特征值进行加权相加。可以计算每个频带的方差值，以根据方差值改变加权。作为特征值可以使用积分值等。另外，一个频带的特征值的数量不限于四个，可以是五个以上，也可以是三个以下。最大值、最小值、平均值、中央值、积分值和方差值的至少一个以上为特征值即可。换句话说，对最大值、最小值、平均值、中央值、积分值和方差值的一个以上的加权相加的系数可以是0。

归一化部217使用归一化系数对拾音信号进行归一化。具体而言，归一化部217将Std×ECTF计算为归一化后的拾音信号。将归一化后的拾音信号设为归一化ECTF。归一化部217能够通过使用归一化系数将ECTF归一化到适当水平。

转换部218通过离散傅立叶变换或离散余弦变换计算归一化ECTF的频率特性。例如，转换部218通过对时域的归一化ECTF进行FFT(高速傅立叶变换)，来计算频率特性。归一化ECTF的频率特性包括功率谱和相位谱。此外，转换部218也可以生成振幅谱而代替功率谱。将归一化ECTF的频率特性设为归一化频率特性。另外，将归一化ECTF的功率谱和相位谱设为归一化功率谱和归一化相位谱。图5表示归一化前后的功率谱。通过进行归一化，功率谱的功率值变化为适当的水平。

下陷校正部219校正归一化功率谱的下陷(dip)。下陷校正部219将归一化功率谱的功率值为阈值以下的部位判定为下陷，对成为下陷的部位的功率值进行校正。例如，下陷校正部219通过对低于阈值的部位进行插值来校正下陷。将下陷校正后的归一化功率谱作为校正功率谱。

下陷校正部219将归一化功率谱分成两个频带，针对每个频带设定不同的阈值。例如，将12kHz设为边界频率，将12kHz以下设为低频带，将12kHz以上设为高频带。将低频带的阈值设为第一阈值TH1，将高频带的阈值设为第二阈值TH2。优选第一阈值TH1低于第二阈值TH2，例如，能够将第一阈值TH1设为-13dB，将第二阈值TH2设为-9dB。当然，下陷校正部219可以分为三个以上的频带，并针对每个频带设定不同的阈值。

图6和图7表示下陷校正前后的功率谱。图6是表示下陷校正前的功率谱、即归一化功率谱的曲线图。图7是表示下陷校正后的校正后功率谱的曲线图。

如图6所示，在低频带中，在部位P1处，功率值低于第一阈值TH1。下陷校正部219在低频带中，将功率值低于第一阈值TH1的部位P1判定为下陷。在高频带中，在部位P2处，功率值低于第二阈值TH2。下陷校正部219在高频带中，将功率值低于第二阈值TH2的部位P2判定为下陷。

下陷校正部219增大部位P1、P2处的功率值。例如，下陷校正部219将部位P1的功率值置换为第一阈值TH1。下陷校正部219将部位P2的功率值置换为第二阈值TH2。另外，如图7所示，下陷校正部219可以揉入低于阈值的部位和不低于阈值的部位之间的边界部分。或者，下陷校正部219可以通过使用样条插值等方法对部位P1、P2进行插值来校正下陷。

滤波器生成部220使用校正后功率谱来生成滤波器。滤波器生成部220求出校正后功率谱的逆特性。具体而言，滤波器生成部220求出消除校正后功率谱(校正了下陷的频率特性)那样的逆特性。逆特性是具有滤波器系数的功率谱，该滤波器系数用于消除校正后的对数功率谱。

滤波器生成部220通过离散傅立叶逆变换或离散余弦逆变换根据逆特性和相位特性(归一化相位频谱)计算时域信号。滤波器生成部220通过对逆特性和相位特性进行IFFT(快速傅立叶逆变换)生成时间信号。滤波器生成部220通过以预定的滤波器长度切割所生成的时间信号来计算逆滤波器。

处理装置201通过对由左麦克2L拾取的拾音信号实施上述处理，来生成逆滤波器Linv。处理装置201通过对由右麦克2R拾取的拾音信号实施上述处理，来生成逆滤波器Rinv。逆滤波器Linv、Rinv分别被设定在图1的滤波器部41、42中。

如上所述，在本实施方式中，处理装置201的归一化系数计算部216基于尺度变换数据计算归一化系数。因此，归一化部217能够使用合适的归一化系数进行归一化。着眼于听感上重要的频带，能够计算归一化系数。一般而言，在对时域信号进行归一化的情况下，以使平方和、RMS(均方根)成为既定值的方式求出系数。与使用这种通用方法的情况相比，能够通过本实施方式的处理求出合适的归一化系数。

被测量者1的外耳道传输特性的测量使用麦克单元2和头戴式耳机43进行。并且，处理装置201能够是智能电话等。因此，测量的设定可能在每次测量中都不同。另外，在头戴式耳机43和麦克单元2的佩戴中可能会出现偏差。处理装置201通过将如上述那样计算出的归一化系数Std与ECTF相乘，来进行归一化。由此，能够抑制测量时的设定等引起的偏差，测量外耳道传输特性。

滤波器生成部220使用在下陷校正部219中下陷被校正后的校正功率谱来计算逆特性。由此，在与下陷对应的频带中，能够防止逆特性的功率值成为急剧的上升波形。由此，能够生成合适的逆滤波器。进而，下陷校正部219将频率特性分为2个以上的频带，设定不同的阈值。通过如此，能够针对每个频带适当地校正下陷。因此，能够生成更合适的逆滤波器Linv、Rinv。

此外，为了适当地进行这种下陷校正，归一化部217对ECTF进行归一化。下陷校正部219校正归一化ECTF的功率谱(或振幅谱)的下陷。因此，下陷校正部219能够适当地校正下陷。

使用图8说明本实施方式中的处理装置201中的处理方法。图8是表示本实施方式涉及的处理方法的流程图。

首先，包络线计算部214使用倒谱分析计算ECTF的功率谱的包络线(S1)。如上所述，包络线计算部214也可以使用倒谱分析以外的方法。

尺度变换部215将包络线数据在对数上进行向等间隔的数据的尺度变换(S2)。尺度变换部215通过三维样条插值等对数据间隔粗的低频带的数据进行插值。由此，在频率对数轴中得到等间隔的尺度变换数据。尺度变换部215不限于对数尺度，也可以使用之前所述的各种的听觉尺度进行尺度变换。

归一化系数计算部216使用每个频带的加权进行归一化系数的计算(S3)。在归一化系数计算部216中，预先对多个频带的每个频带设定权重。归一化系数计算部216针对每个频带提取尺度变换数据的特征值。然后，归一化系数计算部216通过对多个特征值进行加权相加来计算归一化系数。

归一化部217使用归一化系数来计算归一化ECTF(S4)。归一化部217通过将时域的ECTF乘以归一化系数来计算归一化ECTF。

变换部218计算归一化ECTF的频率特性(S5)。变换部218通过对归一化ECTF进行离散傅立叶变换等，计算归一化功率谱和归一化相位谱。

下陷校正部219针对每个频带使用不同的阈值，对归一化功率谱的下陷进行插值(S6)。例如，下陷校正部219在低频带中对归一化功率谱的功率值低于第一阈值TH1的部位进行插值。下陷校正部219在高频带中对归一化功率谱的功率值低于第二阈值TH2的部位进行插值。由此，能够进行校正，以使归一化功率谱的下陷成为每个频带各自的阈值。由此，能够求出校正后功率谱。

滤波器生成部220使用校正后功率谱，计算时域数据(S7)。滤波器生成部220计算校正后功率谱的逆特性。逆特性是用于消除基于校正后功率谱的头戴式耳机特性的数据。然后，滤波器生成部220通过对逆特性和在S5中求出的归一化相位频谱实施逆FFT，计算时域数据。

滤波器生成部220通过以预定滤波器长度切割时域数据来计算逆滤波器(S8)。滤波器生成部220将逆滤波器Linv、Rinv输出到头外定位处理装置100。头外定位处理装置100使用逆滤波器Linv、Rinv再现头外定位处理后的再现信号。由此，用户U能够适当地收听头外定位处理后的再现信号。

此外，在上述实施方式中，处理装置201生成了逆滤波器Linv、Rinv，但处理装置201并不限定于生成逆滤波器Linv、Rinv。例如，处理装置201适合于需要进行将拾音信号适当地归一化处理的情况。

上述处理中的一部分或全部可以由计算机程序执行。上述程序可以使用各种类型的非临时性计算机可读介质(non-transitory computer readable medium)来保存并提供给计算机。非临时性计算机可读介质包括各种类型的具有实体的记录介质(tangiblestorage medium)。非临时性计算机可读介质的例子包括磁记录介质(例如，软盘、磁带、硬盘驱动器)、磁光记录介质(例如，磁光盘)、CD-ROM(Read Only Memory，只读存储器)、CD-R、CD-R/W、半导体存储器(例如，掩模ROM、PROM(Programmable ROM，可编程ROM)、EPROM(Erasable PROM，可擦可编程只读存储器)、闪存ROM、RAM(Random Access Memory，随机存取存储器))。另外，程序也可以由各种类型的临时性计算机可读介质(transitorycomputer readable medium)提供给计算机。临时性计算机可读介质的例子包括电信号、光信号和电磁波。临时性计算机可读介质能够通过电线和光纤等有线通信路径或无线通信路径向计算机提供程序。

以上，基于实施方式具体说明了本发明人所完成的发明，但本发明不限于上述实施方式，在不脱离其主旨的范围内当然能够进行各种变更。

本申请要求以2019年2月14日提交的日本申请特愿2019-24336为基础的优先权，其公开的全部内容在此引入。

产业上的可用性

本公开可应用于处理拾音信号的处理装置。

符号说明

U 用户

1 被测量者

10 头外定位处理部

11 卷积运算部

12 卷积运算部

21 卷积运算部

22 卷积运算部

24 加法器

25 加法器

41 滤波器部

42 滤波器部

43 头戴式耳机

200 测量装置

201 处理装置

211 测量信号生成部

212 拾音信号获取部

214 包络线计算部

215 尺度变换部

216 归一化系数计算部

217 归一化部

218 变换部

219 下陷校正部

220 滤波器生成部

Claims

1.一种处理装置，包括：

包络线计算部，计算针对拾音信号的频率特性的包络线；

尺度变换部，通过对所述包络线的频率数据进行尺度变换以及数据插值，来生成尺度变换数据；

归一化系数计算部，将所述尺度变换数据划分到多个频带，求出每个所述频带的特征值，并基于所述特征值计算归一化系数；以及

归一化部，使用所述归一化系数对时域的拾音信号进行归一化。

2.如权利要求1所述的处理装置，包括：

变换部，将所述归一化的拾音信号变换到频域，计算归一化频率特性；

下陷校正部，对所述归一化频率特性的功率值或振幅值进行下陷校正；以及

滤波器生成部，使用进行了所述下陷校正后的归一化频率特性来生成滤波器。

3.如权利要求2所述的处理装置，其中，

所述下陷校正部使用根据每个频带而不同的阈值来校正下陷。

4.如权利要求1至3中任一项所述的处理装置，其中，

所述归一化系数计算部针对每个所述频带求出多个特征值，

通过对所述多个特征值进行加权相加来计算所述归一化系数。

5.一种处理方法，包括以下步骤：

计算针对拾音信号的频率特性的包络线；

通过对所述包络线的频率数据进行尺度变换以及数据插值，来生成尺度变换数据；

将所述尺度变换数据划分到多个频带，求出每个所述频带的特征值，并基于所述特征值计算归一化系数；以及

使用所述归一化系数对时域的拾音信号进行归一化。

6.如权利要求5所述的处理方法，包括：

变换部，将所述归一化的拾音信号变换为频域，计算归一化频率特性；

下陷校正部，对所述归一化频率特性进行下陷插值；以及

滤波器生成部，使用进行了所述下陷插值的归一化频率特性来生成滤波器。

7.一种再现方法，包括以下步骤：

使用由权利要求6所述的处理方法生成的所述滤波器，对再现信号进行头外定位处理。

8.一种程序，用于使计算机执行处理方法，所述处理方法包括以下步骤：

计算针对拾音信号的频率特性的包络线；

将所述尺度变换数据分为多个频带，求出每个所述频带的特征值，并基于所述特征值计算归一化系数；以及

使用所述归一化系数对时域的拾音信号进行归一化。