CN102461207A

CN102461207A - 声音重放装置、声音重放方法和程序

Info

Publication number: CN102461207A
Application number: CN2010800303127A
Authority: CN
Inventors: 藤井修
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2009-05-29
Filing date: 2010-05-27
Publication date: 2012-05-16
Anticipated expiration: 2030-05-27
Also published as: WO2010137650A1; US20120128178A1; MX2011012736A; JPWO2010137650A1; JP5149991B2; US9093968B2; CN102461207B

Abstract

当重放声音时，控制声音以使其针对老年人特有的听觉机能处于最佳状态。披露一种声音重放装置，该声音重放装置包括设置输入声音信号的频率特性的频率特性设定装置以及当通过声音输出声音信号时可变地控制音量的音量设定装置。频率特性设定装置根据由音量设定装置设定的音量增加，从突出包含人声频带的声音频带的频率特性改变至与频率对应的增益特性逐渐平坦的频率特性。因而，人声频带以相对强烈地突出以使老年人也能在低音量下听见人声，并且随着音量增高，频率特性改变至更为平坦的频率特性，由此在减少由特定频带的突出造成的不便的同时输出容易听见的声音。

Description

声音重放装置、声音重放方法和程序

技术领域

本发明涉及一种声音重放装置、声音重放方法和程序，尤其涉及一种执行优化输出声音特性的处理以在重放广播波、记录内容的声音时使输出声音容易被听到并防止令人不适的感觉的声音重放装置、声音重放方法以及用于实现声音重放装置的功能的程序。

背景技术

当收看/收听电视广播和记录的视频/音频内容时，使用重放这些内容的声音的装置。声音重放装置适用于例如电视、音频设备和PC之类具有声音重放装置能力的装置等，并具有输入广播波和记录的音频/视频内容的声音信号以从包含在这些装置内的或外部连接的扬声器中输出声音的功能。

当用户使用这种声音重放装置收听重放的声音时，用户通常根据用户的喜好或需要调节音量以收听该声音。例如，当老年人收听重放的声音时，由于老年人特有的衰弱的听觉机能等，难以听见细小的声音。由于这样的老年人相比年轻人而言更难以听到包含在重放声音中的词和音等人声，因此提供控制以突出包含人声的频率范围作为针对老年人的声音特性控制是优选的。

在这种情形下，如果试图增加音量以准确地听到人声，则不止是人声，噪声和音效也会增加，因此人声不一定变得更容易听到。如果增加音量，由于老年人特有的听觉机能变化，相比年轻人可能更感觉到声音太响并造成不适。

图14是以建模方式表述的由于衰老导致听力恶化状态的曲线图。如图14所示，一般来说，人的听觉机能随着年龄逐渐衰弱并且难以听见较小音量的声音。在较高频段下，听力变得尤其糟糕，并且在较高频段下的声音比较低频段下的声音更难听到。

由于超重振现象，响的声音就老年人听起来比年轻人听起来更响。图15是以建模方式表示如何由于超重振现象听到声音的一个示例图。如图15所示，在老年人的情形下，例如可闻声压在超过60dBSPL后猝然上升，并且声音在大约80dBSPL与正常人(例如年轻人)相同的声压水平下变得可闻。在超出80dBSPL后，相比正常人，老年人感觉声音更响。因此，这种现象被归结为响的声音听上去更响，同时细小声音难以听见。尽管个人情况不同，但这种现象在老年人中尤为普遍。

因此，老年人的问题在于，由于声音难以在较小的音量被听到，由此例如音和词等人声无法被清楚地识别，并且老年人还存在如下问题，由于声音听上去如何改变取决于音量，因此即使提供控制以在较小的音量下突出人声，越大的音量相比年轻人而言感觉更响，反而会造成不适感。

因此，对于广播波和重放中的内容，必须因地制宜地突出声音(人声)以抑制噪声和音乐，即使在这个时候增加或降低音量，也必须最佳地控制输出声音特性以防止不适感。

例如，专利文献1披露了一种语音频带突出电路，该电路突出音/字以使该音/字在低音量下被清楚地听到并在中等或较大音量下维持原始声音平衡的同时适当地突出音/字。该语音频带突出电路包括：从L/R声道信号两者取出同相分量的同相分量提取电路；从同相分量A中提取语音频带B的带通滤波器；从语音频带B吸收并衰减规定的频率分量C的陷波滤波器；放大输出信号D和输出输出信号E的自动电平控制电路(ALC)；控制放大电平的微型计算机；合成输出信号E和输入L/R声道并将它们输出作为语音频带突出L/R声道信号Lout和Rout的第一和第二合成电路。微型计算机确定原始音频信号的信号电平和/或设定音量值，并以基本反比例的关系控制自动电平控制电路的放大电平。

现有技术文献

[专利文献]

专利文献1：日本专利特开No.2005-86462

发明概述

本发明要解决的问题

为了应对老年人特有的听觉机能的特性并使老年人舒适地收听重放的声音，必须根据情况突出声音(人声)以抑制噪音和音乐，并且即使此时音量增加或减小，也必须最佳地控制输出声音特性以防止令人不适的感觉。

专利文献1披露一种自动电平控制(ALC)的一般控制方法，但没有披露用于消除由于老年人听觉机能恶化所导致的收听困难和不适感的优化声音特性的技术理念。

本发明是鉴于上述情况构思出的，且因此本发明的目的在于提供一种能提供控制以当重放声音时使声音针对老年人特有的听觉机能在适当状态下被听见的声音重放装置、声音重放方法以及程序。

用于解决问题的手段

为了解决这些问题，本发明的第一技术手段是一种声音重放装置，其包括：频率特性设定装置，其设定输入声音信号的频率特性；以及音量设定装置，其在将声音信号输出作为声音时可变地控制音量，其中频率特性设定装置突出包括人声频带的声音频带或衰减除声音频带以外的频带，而音量设定装置压缩一动态范围。

第二技术手段是一种声音重放装置，包括：频率特性设定装置，其设定输入声音信号的频率特性；以及音量设定装置，其在将声音信号输出作为声音时可变地控制音量，其中频率特性设定装置根据由音量设定装置设定的音量增加，从突出包含人声频带的声音频带的频率特性变更至与频率相应的增益特性逐渐平坦的频率特性。

第三技术手段是第二技术手段的声音重放装置，其中声音频带在大约1kHz-8kHz的范围内。

第四技术手段是第二或第三技术手段的声音重放装置，其包括收听者选择装置，该收听者选择装置根据用户操作选择收听者是老年人还是年轻人，其中如果选择了老年人，则频率特性根据由音量设定装置设定的音量增加而改变。

第五技术手段是一种声音重放装置，包括：动态范围设定装置，其设定输入声音信号的动态范围；以及音量设定装置，其在将声音信号输出作为声音时可变地控制音量，其中该动态范围设定装置作出改变以根据由音量设定装置设定的音量增加逐渐增加动态范围的压缩率。

第六技术手段是第五技术手段的声音重放装置，其包括收听者选择装置，该收听者选择装置根据用户操作选择收听者是老年人还是年轻人，其中如果选择了老年人，则动态范围的压缩率根据由音量设定装置设定的音量增加而改变。

第七技术手段是一种声音重放装置，包括：从分别对应于多个声道的多个声音信号提取共同分量的装置；从所述多个声音信号的每一个中减去该共同分量以提取该共同分量以外的分量的装置；改变所提取的共同分量的增益和该共同分量以外的分量的增益并混合这些分量的装置；以及音量设定装置，其在将声音信号作为声音输出时可变地控制音量，其中声音重放装置根据由音量设定装置设定的音量增加而减少共同分量的增益。

第八技术手段是第七技术手段的声音重放装置，其包括收听者选择装置，该收听者选择装置根据用户操作选择收听者是老年人还是年轻人，其中如果选择了老年人，则根据由音量设定装置设定的音量增加根据由音量设定装置设定的音量增加而改变混合比及增益。

第九技术手段是一种由声音重放装置执行的声音重放方法，所述声音重放装置设定输入声音信号的频率特性且当将声音信号作为声音输出时可变地控制音量，该方法包括以下步骤：声音重放装置突出包括人声频带的声音频带或衰减除声音频带以外的频带，并压缩一动态范围。

第十技术手段是一种由声音重放装置执行的声音重放方法，所述声音重放装置设定输入声音信号的频率特性且当将声音信号作为声音输出时可变地控制音量，其中该方法包括以下步骤：根据在声音输出时设定的音量增加，使声音重放装置从突出包含人声的声音频带的频率特性变更至与频率相应的增益特性逐渐平坦的频率特性。

第十一技术手段是一种由声音重放装置执行的声音重放方法，所述声音重放装置设定输入声音信号的动态范围且当将声音信号作为声音输出时可变地控制音量，其中该方法包括以下步骤：根据在声音输出时设定的音量增加，使声音重放装置改变该动态范围的压缩率以逐渐地增加压缩率。第十二技术手段是由声音重放装置执行的声音重放方法，该方法从分别对应于多个声道的多个声音信号提取共同分量，从所述多个声音信号的每一个中减去该共同分量以提取该共同分量以外的分量，改变所提取的共同分量的增益和该共同分量以外的分量的增益并混合这些分量，并当将输出信号作为声音输出时可变地控制音量，其中该方法包括使声音重放装置根据设定音量的增加而减小共同分量的增益的步骤。

第十三技术手段是通过计算机实现如前面第一至第八技术手段中的任何一个的声音重放装置的功能的程序。

发明效果

本发明可提供一种当重放声音时能够提供控制以针对老年人特有的听觉机能以适当状态听到声音的声音重放装置、声音重放方法和程序。

附图简述

[图1]图1是根据本发明的声音重放装置的第一实施例的示例性配置的图。

[图2]图2是图1的系数a1-b2系数表的设定例的图。

[图3]图3是在均衡器部分中的频率特性的设定例的图。

[图4]图4是解释当增加大约1kHz至8kHz频率的频带的增益以相比于其它频带突出该频带时的效果的图。

[图5]图5是与音量连动变化的频率特性的一个示例的图。

[图6]图6是针对老年人的重放声压的范围宽度的设定例的图。

[图7]图7是针对年轻人的重放声压的范围宽度的设定例的图。

[图8]图8是解释根据本发明的声音重放装置的第二实施例的图。

[图9]图9是图7的DRC阈值表和增益表的设定例的图。

[图10]图10是解释与音量连动变化的动态范围压缩特性的设定例的图。

[图11]图11是解释根据本发明的声音重放装置的第三实施例的方框图。

[图12]图12是解释图10配置中的共同分量的图。

[图13]图13是图10配置中的增益表的设定例的图。

[图14]图14是以建模方式表述的由于衰老导致听力恶化状态的图。

[图15]图15是以建模方式描述的声音由于超重振现象如何被听到的一个示例图。

具体实施方式

[第一实施例]

根据本发明的声音重放装置的第一实施例的特征在于，重放输入声音信号以输出声音的声音重放装置在声音输出的音量相对小时，用均衡器突出与人声对应的声音频带的频率，同时随着声音重放装置的音量增加而逐渐改变输出声音的频带以使之平坦化(沿频率方向平坦化)。因此，在该实施例中，采用改变输入声音信号的频率特性的均衡器，以根据声音输出的音量来用均衡器改变声音信号的频率特性。

图1是根据本发明的声音重放装置的第一实施例的示例性配置的图，并描述了改变输入声音信号的频率特性的均衡器部分的示例性配置。根据本发明的声音重放装置的该实施例适用于具有接收和输出广播信号的装置，例如电视机和PC的装置。或者，该实施例适用于重放从例如录音机的外部记录装置或外部存储器输入的输入声音信号或通过网络从外部输入的声音信号的装置。图1中描述的均衡器部分转换输入声音信号的频率特性并输出该信号。声音信号被未示出的放大器放大并从未示出的扬声器输出作为声音。

本实施例的声音重放装置具有音量设定装置，该音量设定装置允许根据用户操作设定来自扬声器的输出声音的音量，并且均衡器部分10根据音量改变频率特性并输出该信号。与音量相应的频率特性变化是基于声音重放装置的最大输出声压信息确定的。

本例中的均衡器部分10是由双二次(二次传递函数)数字滤波器11a-11c级联连接成三级而构成的参量均衡器，并且是能将声音频带分割成若干部分以调节例如每个频带的通过电平的增益的参数的均衡器。

均衡器部分10设有系数a1-b2选择部分21、23。系数a1-b2选择部分21、23基于声音重放装置的音量信息和声音重放装置的最大输出声压信息，选择后继级上的双二次数字滤波器11b、11c的系数a1-b2(a1、a2、b1和b2)，以改变均衡器部分10的特性。对于从系数a1-b2的系数选择，系数表22、24被事先存储在声音重放装置的例如存储器的存储装置中，并基于音量信息和最大输出声压信息从系数表选择这些系数。第一级上的双二次数字滤波器11a被用作高通滤波器。

双二次数字滤波器11(11a-11c)中的每一个包括混频器12、13和两个延时元件14、15。描述过程的一个示例，首先，用输入信号对输入侧上的混频器12进行初始化，并从混频器12减去第一延时元件14后侧上的值D1与系数a1之积。还从混频器12减去第二延时元件15后侧上的值D2与系数a2之积。结果，混频器12的值D0被确定。

输出侧上的混频器13被输入侧上的混频器12的值D0与系数b0的乘积所覆写，并且第一延时元件14的后侧上的值D1与系数b11的乘积被加至输出侧上的混频器13。第二延时元件15的后侧上的值D2与系数b2的乘积也被加至混频器13。

然后通过延时元件14、15的作用来更新这些值。换句话说，用第二延时元件15前侧上的值D1更新后侧上的值D2，并用第一延时元件14前侧上的值D0更新后侧上的值D1。用输入侧上的混频器12的值来更新输出侧上的混频器13的值。

均衡器部分10针对各级反复进行双二次数字滤波器11的这些处理，并在输出侧上作为输出信号输出混频器13的输出。

通过前述的配置选择双二次数字滤波器11的系数，可改变每个频带的电平和锐度。尽管如前所述的均衡器部分的配置和操作是传统已知的技术，然而在根据本发明的实施例中，声音重放装置的均衡器部分10的系数是由声音重放装置的音量信息和最大输出声压信息进行控制的，从而允许根据音量为老年人设定最佳的频率特性。

图2是图1的系数a1-b2系数表的设定例的图。用于选择第二级上的双二次数字滤波器11b的系数的第一系数a1-b2选择部分21所使用的第一a1-b2系数表22根据音量为重放机最大输出的每个电平设定系数。例如，如图2(A)所示，在重放机最大输出电平为1时，对于音量1确定系数以使系数a1＝0.9，……，b2＝0.6。另外也对音量2和之后的音量以相同的方式确定系数，直到音量60。在该例中，音量1-60简单地表示以60级设定的声音输出电平。重放机最大输出电平1、2……作为与预定电平对应的唯一序号而被分配。

对于第三级上的双二次数字滤波器11c，其包括与第二级相同的配置。换句话说，用来选择第三级上的双二次数字滤波器11c的系数的第二系数a1-b2选择部分23所使用的第二a1-b2系数表24根据音量为重放机最大输出的每个电平设定系数。例如，如图2(B)所述，在重放机最大输出电平为1时，针对音量1确定系数以使系数a1＝0.6，……，b2＝0.8。另外也对音量2和之后的音量以相同的方式确定系数，直到音量60为止。

第一级上的滤波器充当增益一直为零的高通滤波器(HPF)，而其输出特性仅由截止频率(Fc)和Q(品质因数)确定。

均衡器部分10输出声音信号，该声音信号具有通过第一至第三级上的参量均衡器而进行了调整的特性。

重放机最大输出声压指示可由每个重放装置重放的最大声压水平(以dBspl“声压水平”为单位)。例如，家用电气设备具有作为商品标准的额定功率(W)，而驱动扬声器的放大器的额定功率是给定的不同标准，这取决于声音重放装置的型号，例如在双声道情形下为10W+10W或5W+5W。最大输出声压是从放大器的额定功率和声音重放装置的扬声器的效率[dB/W/m]＝[dBSPL]之间的关系确定的。

例如，如果每声道的额定值为10W并且扬声器的效率为80DB/W/m，则重放机最大输出声压为90dBSPL。在10W+10W双声道的情形下，当用相同相位的信号测量时，重放机最大输出声压为大约96dBSPL。

另一方面，图15所述的声压或下文中描述的图6、7、10等所述的声压不是电气特性，而是表示如何控制从声音重放装置输出的声压。假设音量指示刻度(例如最大值为60)的相同位置，例如如果额定值为5W而扬声器效率为80dB/W/m，则重放机最大输出声压为85dBSPL，这比额定值为10W且扬声器效率为80dB/W/m的情形低上5dBSPL，由于DRC的阈值和增益可被压缩至图6、7、10、15等所述的范围，因此必须提供降低5dBSPL的控制。换句话说，由于到达收听者耳朵的声压水平根据声音重放装置给予多少W+多少W作为额定功率以及扬声器效率为多少dBSPL而不同，因此需要具有由(额定值种类)×(扬声器效率种类)的多种组合产生的多种表格。

图3是在均衡器部分中的频率特性的设定例的图。如前所述，在该实施例中，根据音量优化均衡器部分10的双二次数字滤波器11中的系数设定。图3的示例描述在中等音量情形下的频率特性(图3(A))和在这种情形下的系数值(图3B)。

在图3(A)描述的示例中，提供控制以使在输出声音中突出与人声对应的频带，该频带是老年人尤为难以听见的频带，从而使该频带被更好地听到。在这种情形下，增加大约1kHz至8kHz频率的频带的增益，以相比于其它频带突出该频带，该频带一般对应于人声频带的高次共振峰。尽管也可突出等于或大于8kHz的频带，然而对老年人来说，他们非常难以听见在这种程度下的较高频带的声音，因此即使增加声压也不一定能很好地听见。如果突出较高频带，由于输出声音信号的峰值分量饱和并可能使信号波形发生削波，因此不一定硬要突出该频带。从这个观点看来，均衡器部分10的系数被设定为在中等音量的情形下获得图3(A)中描述的频率特性。图3(B)示出在这种情形下的系数的设定例并描述(在第一至第三级上的)参量均衡器1-3中的每一个的系数设定的例子。

第一级上的高通滤波器具有例如160Hz的截止频率，而鉴于频率和增益[dB]之间的关系，当频率等于或大于300Hz时，第一级上的高通滤波器的特性被平坦化。这是因为老年人对于例如那些等于或低于300Hz的低频带中的声音具有与年轻人相同程度的听力，并且不受超重振现象的影响。由于均衡器部分的频率特性在包含人声对应频带以外的效果音和噪声的低频带侧上具有减弱的频率特性，因此优选不在所有频带内使第一级上的高通滤波器的特性平坦化，例如如前所述地设定截止频率。

图4是解释当增加大约1kHz至8kHz的频率的频带的增益以相比其它频带突出该频带时的效果的图。

正常的人声具有能量集中在如图4的S1表示的频率上的A、B、C和D的特性分布。这些A、B、C和D分别被称为基频、第一共振峰、第二共振峰和第三共振峰。一般来说，声音在基频下最强并在高次共振峰下衰减。

在该实施例中，正常情况下衰减的第一至第三共振峰如S2所示那样被放大，以调节至容易传播(容易听见)的音质。当音量相对较低时，相对地突出大约1kHz至8kHz频率的中等频率范围，并且随着音量增加，频率特性被改变为更平坦的形状。

图5是与音量连动变化的频率特性的一个示例的图。如前所述，在该实施例中，来自均衡器部分10的输出声音的频率特性根据声音重放装置中设定的音量而变换。在该例中，假设音量的电平例如由1至60表示。如图5所示，当音量相对较低时，中等频率范围被相对突出，而低频范围和高频范围相对较低。随着音量增加，均衡器部分的系数改变并且频率特性改变至更平坦的形状。当音量处于最大值时(在本例中音量＝60)，除了在靠近最低频率的某些区域以外，获得几乎完全平坦的频率特性。因此，在本实施例中，提供控制以使与这些频率对应的增益特性根据由音量设定装置设定的音量增加，从包含人声频带的声音频带被加以突出的频率特性改变至逐渐平坦的频率特性。

通过在低音量下相对强烈地突出人声的频带以使人声容易被老年人听见并随着音量如此增大而获得更平坦的频率特性，可在抑制由某一频带上的突出造成的不适感的同时实现容易听见的声音输出。

在该实施例中，可预置对于老年人的重放模式和对于年轻人的重放模式，当通过用户操作选择对于老年人的重放模式时，可提供控制以根据前述音量增大来改变频率特性。在这种情形下，用于针对老年人选择重放模式和针对年轻人选择重放模式的装置对应于本发明的收听者选择装置。

[第二实施例]

在老年人的情形下，由于衰老的最低可闻极限的电平上升并且相比年轻人来说难以听到具有较小声压的声音。如前所述，超重振现象可能发生在可舒适听见的声压的上限侧，例如超出70-80dBSPL的声压的重放对于老年人来说是不合适的。

因此，对于老年人的最佳声压水平的范围一般比年轻人的更窄。为了应对这些老年人，在该实施例中设定对于老年人的重放声压的动态范围。

图6是针对老年人的重放声压的范围宽度的设定例的图，而图7是针对年轻人的重放声压的范围宽度的设定例的图。图6和图7描述了例如当记录重放装置所适用的电视机中的设定输出音量处于最大值时重放声压的范围宽度。

如图6所示，在本例中，针对老年人的重放声压是用70dBSPL左右的上限和15dBSPL左右的下限来界定的。其原因在于，如前面根据超重振现象描述的，老年人不喜欢用较大声压重放的声音，并且具有如前所述较高的最低可闻电平。比较而言，如图7所示，针对年轻人的重放声压范围可用80dBSPL的上限和等于或低于10dBSPL的下限来界定。这是因为即使界定更宽的重放范围，年轻人也能收听重放的声音而不会感觉不适或嘈杂。

如前所述，在本实施例中，设定针对老年人的重放声压的动态范围。可预置针对老年人的重放模式和针对年轻人的重放模式，并且这些模式可根据需要通过用户操作切换。

在该实施例中，针对老年人的重放声压动态范围的压缩率根据声音重放装置的音量改变而改变。更具体地说，动态范围的压缩率根据声音重放装置的音量增加而增加。结果，即使当音量较大时，老年人也能收听重放的声音而不会感到因超重振现象引起的不适。

图8是解释根据本发明的声音重放装置的第二实施例的图。

本实施例的声音重放装置包括压缩输入声音信号的动态范围的动态范围压缩器31、以及放大/衰减来自动态范围压缩器31的输出声音信号的放大器/衰减器32。该声音重放装置具有：DRC(动态范围压缩)阈值选择部分33，该DRC阈值选择部分33选择动态范围压缩器31的阈值；以及增益选择部分34，该增益选择部分34选择放大器/衰减器32的增益，DRC阈值选择部分33和增益选择部分34基于声音重放装置的音量信息和重放机最大输出声压信息来选择动态范围压缩器31的阈值并选择放大器/衰减器32的增益。

动态范围压缩器31和放大器/衰减器32基于输入声音信号的信号电平改变输出声音信号的电平。例如，动态范围压缩器31以与输入信号电平直接成正比的电平输出声音信号，直到输入声音信号的频率到达该阈值为止，并且如果声音信号的频率超出该阈值，则以相对于输入信号电平衰减的电平来输出声音信号。放大器/衰减器32根据设定的增益放大/衰减从动态范围输出的声音信号并输出该信号。该动态范围压缩率(范围宽度)可通过控制阈值来任意地改变。

通过动态范围压缩器31和放大器/衰减器32的这种配置，可根据声音信号的信号电平适当地压缩输入声音信号的总动态范围并精确地执行声音信号的重放。动态范围压缩器31和放大器/衰减器32可通过组合而构成为ALC(自动电平控制)。

由DRC阈值选择部分33选择的阈值可预先作为DRC阈值表35存储在例如存储器的存储装置中。在这种情形下，在DRC阈值表35中，针对重放机最大输出的每个电平设定与音量对应的阈值。图9(A)描述了DRC阈值表的设定例。在该例中，在重放机最大输出电平为1时，针对音量1确定-5dB的阈值并针对音量2确定-6dB的阈值。也可在音量2之后以相同方式确定这些阈值，直到音量60。如同第一实施例的情形，音量1-60简单地表示以60级设定的声音输出电平，并且重放装置最大输出电平1、2……作为与预定电平对应的唯一序号而被分配。

由增益选择部分34选择的增益可预先作为增益表36存储在例如存储器的存储装置中。在这种情形下，在增益表36中，针对重放机最大输出的每个电平设定与音量对应的增益。图9(B)描述了增益表的设定例。在该例中，在重放机最大输出电平为1时，确定增益以使音量1的增益为1.5而音量2的增益为1.4。也可以相同方式确定音量2之后的增益，直到音量60。另外在该例中，音量1-60也简单地表示以60级设定的声音输出电平。重放装置最大输出电平1、2……作为与预定电平对应的唯一序号而被分配。

通过前述配置，在该实施例中，基于记录重放装置的音量信息和最大输出声压信息，DRC阈值选择部分33从DRC阈值表35中选择一阈值以改变动态范围压缩器31中的压缩特性，并通过由增益选择部分34选择的增益来优化放大/衰减率。

图10是解释与音量连动变化的动态范围压缩特性的设定例的图。如果在动态范围压缩器31中动态范围压缩率不变，则随着记录重放装置的音量增加，上限声压上升。而在本实施例中，动态范围的压缩率随着声音重放装置的音量增加而改变。具体地说，动态范围压缩器31的阈值被设定为较低以增加动态范围的压缩率。在这种情况下，动态范围的压缩率相对于音量的增加而非线性地增加。换句话说，随着音量增加，压缩率相对于音量的斜率变得更大。

例如，如图10所示，当音量20下的压缩上限C1在35dBSPL左右时，如果记录重放装置的音量增加至音量50，则将压缩上限C2设定为稍小于70dBSPL。如果将音量设定至作为本例中最大音量的音量60，则压缩上限C3被设定在稍高于70dBSPL附近。

如果动态范围的压缩率是常数，则压缩上限根据音量的增加而增加并会达到可能使老年人感到不适的声压(例如70-80dBSPL或更高)。相反，在该实施例中，与音量增加对应的压缩上限增加被非线性地抑制以根据音量增加减小动态范围宽度。换句话说，动态范围压缩率根据音量的增加而增加。

结果，即使声音重放装置的音量变得更大，拟重放的最大声压的水平也被抑制至某一电平或更小(在本例中在最大音量下为70dBSPL左右或更低)，并且老年人可收听重放的声音而不会感到不适。

对于老年人的重放声音的动态范围具有如图6所示高于年轻人设定的下限值。这意味着如果输入较小音量的声音信号，则输出值上升以用较高的声压重放声音信号。下限值是通过设定图8的放大器/衰减器32的增益而设定的。在这种情形下，设定独立于输入声音信号的信号振幅的固定值以上升动态范围的下限值的声压水平。

如前所述，在本实施例中，通过对动态范围压缩器31选择阈值来抑制动态范围的上限值，动态范围的压缩率随着重放装置的音量增加而增加，并通过设定放大器/衰减器32的增益而升高动态范围的下限值。结果，能够以最佳的动态范围向老年人重放声音。

[第三实施例]

本实施例的声音重放装置配置为从输入信号的多个声道提取共同分量，从声道分量减去共同分量以计算共同分量以外的分量，并改变所提取的共同分量和共同分量以外的分量的比例并混合这些分量。

通过这种配置，例如将人声的声音信号作为共同分量取出。人声的声音信号例如通过用聚音麦克风来聚集声音而记录成局限于中央，并且分布至L声道和R声道。包含人声的共同分量可通过从这些声音信号中取出L声道和R声道的共同分量而获得。

在该实施例中，包含人声的共同分量与共同分量以外的分量的比例针对老年人而被优化。具体地说，包含人声的共同分量和共同分量以外的分量的比例及增益是根据声音重放装置的音量改变的。具体地，当记录重放装置的音量小时，共同分量的增益增加以使共同分量的混合比更高，由此突出包含人声的共同分量。结果，在较小音量下人声更易于被听见。当记录重放装置的音量变得较大时，使包含人声的共同分量的增益较小，以使上述比例变为等于共同分量以外的其它分量的比例，由此减少在较大音量下由于超重振现象引起的不适感。

图11是解释根据本发明的声音重放装置的第三实施例的方框图。根据本实施例的声音重放装置包括声音信号变换部分40，该声音信号变换部分具有将输入声音分割成共同分量和共同分量以外的分量并调节这些分量的混合比和增益的功能。

声音信号变换部分40包括频谱变换部分42(42a、42b)、共同分量提取部分43、乘法部分44(44a、44b、44c)、逆变换部分45(45a、45b、45c)、减法器47、48、输入端子41a、41b、输出端子46a、46b以及加法器49、50。

各自对应于多个声道的多个声音信号被输入到声音信号变换部分40。在该例中，由PCM(脉冲码调制)数字编码的双声道声音信号被输入到声音信号变换部分40。双声道声音输入信号例如可以是电视广播中的立体声信号。在立体声广播中，通常基于输入的双声道声音信号将不同的声音信号提供给包含在例如电视机的声音重放装置中的左、右扬声器，并从相应的扬声器输出不同的声音。与左声道对应的左侧声音信号和与右声道对应的右侧声音信号各自从输入端子41a、41b输入至声音信号变换部分40，并且从声音信号变换部分40输出的声音作为声音从左、右扬声器输出。

频谱变换部分42a将通过输入端子41a输入的右侧声音信号分成例如1024样本/帧。如果声音信号的采样频率为44.1kHz，则每帧的时间是23ms(＝(1/44100)×1024)。频谱变换部分42a随后将经帧分割的声音信号乘以例如汉宁窗的窗函数。该窗函数的施加可减小经帧分割的声音信号的频率分析的误差。应用于该实施例的窗函数不仅限于汉宁窗。

频谱变换部分42a随后针对每个帧对作用窗函数的声音信号执行快速傅立叶变换(FFT)，并将时域中的声音信号转换成频域的数据即频谱(此后称其为右侧声音信号谱)，并输出到共同分量提取部分43和减法器47。

频谱变换部分42b使用与频谱变换部分42a相同的过程来计算通过输入端子41b输入的左侧声音信号的频谱(在下文中称其为左侧声音信号频谱)并将其输出至共同分量提取部分43和减法器48。

也可通过经修正的离散余弦变换而不是FFT来计算频谱，并且频谱变换的技术没有特别限制。

共同分量提取部分43提取右侧声音信号频谱和左侧声音信号频谱的共同分量。图12是用于解释共同分量的图；图12(A)是左侧声音信号频谱和右侧声音信号频谱的共同分量的图；图12(B)是仅共同分量的图。共同分量提取部分43从C(k)＝MIN(XL(k)，XR(k))(其中XL(k)是左侧声音信号频谱而XR(k)是右侧声音信号频谱)计算和输出共同分量频谱C(k)至减法器47、48和乘法部分44b。共同分量提取部分43提取XR(k)和XL(k)中的较小一个频谱作为共同分量。

如前所述，立体声广播节目等双声道输入信号被输入至声音信号变换部分40。在常见的立体声广播节目中，声音通过用于声音记录的单声道麦克风记录，而音以外的BGM、效果音等预先通过左右两个麦克风(立体声)记录。如果通过这三个麦克风记录记录的节目通过两个声道作立体声广播，则三个声道的信号被向下混频入两个声道。因此，通过用于声音记录的单声道麦克风记录的人声的声音信号与通过左右两个麦克风记录的环境音信号混频以送出双声道声音信号。

在这种情况下，人声信号和环境音信号的混合比是由广播站设置的。在这种情形下，右侧声音信号是通过混合了由右麦克风记录和用于声音记录的单声道麦克风记录的声音获得的声音信号。前述左侧声音信号是通过混合了由左麦克风记录和用于声音记录的单声道麦克风记录的声音获得的声音信号。因此，表征人声的声音信号对于左侧声音信号和右侧声音信号是共同的并包含在这两种信号中。对于包含音的音乐，音通过用于声音记录的单声道麦克风被记录，并且在乐器声音通过左侧和右侧两个麦克风(立体声)记录之后，音和声音被向下混频入两个声道。

共同分量提取部分43主要将如前所述对于右侧声音信号和左侧声音信号是共同的并包含在这些信号中的代表人声的声音信号的分量提取作为共同分量。

减法器47将从频谱变换部分42a输出的右侧声音信号频谱XR(k)减去从共同分量提取部分43输出的共同分量频谱C(k)，以计算右分量频谱XR’(k)并将其输出至乘法部分44a。类似地，减法器48将从频谱变换部分42b输出的左侧声音信号频谱XL(k)减去从共同分量提取部分43输出的共同分量频谱C(k)，以计算左分量频谱XL’(k)并将其输出至乘法部分44c。

乘法部分44a将从减法器47输出的XR’(k)乘以增益G1以计算XR″(k)(＝G1×XR’(k))并将其输出至逆变换部分45a。乘法部分44b将从共同分量提取部分43输出的C(k)乘以增益G2以计算C″(k)(＝M2×C(k))并将其输出至逆变换部分45b。乘法部分44c将从减法器48输出的XL’(k)乘以增益G3以计算XL″(k)(＝M1×XL’(k))并将其输出至逆变换部分45c。

逆变换部分45b使用逆FFT将从乘法部分44b输出的共同分量C”(k)转换成时域的信号波形，并将信号波形分配和输出至加法器49、50。

逆变换部分45a使用逆FFT将作为频域信息的右分量输出频谱XR″(k)转换成时域的信号波形，并输出该信号波形。加法器49将经历逆FFT的右分量和从逆变换部分45b输出的共同分量相加并作为输出至右扬声器的声音输出信号而输出。

同样，逆变换部分45c使用逆FFT将作为频域信息的左分量输出频谱XL″(k)转换成时域的信号波形，并输出该信号波形。加法器50将经历逆FFT的左分量和从逆变换部分45b输出的共同分量相加并作为输出至左扬声器的声音输出信号而输出。

适用于共同分量频谱的增益G2是满足1≤M1的值，而适用于共同分量以外的分量频谱(右分量频谱XR’(k)和左分量频谱XL’(k))的增益G1、G3是满足0≤M1≤1的值。乘法部分44a、44b、44c使用这些增益作为乘数值与输入分量的频谱相乘以改变共同分量频谱和共同分量以外的频谱的混合比和增益。

在乘法部分44a、44b和44c中设定的增益是通过增益选择部分51选择的。由增益选择部分51选择的增益值事先作为增益表52保存和保持在例如存储器的存储装置中。增益表52为重放机最大输出的每个电平设置与音量对应的增益。

图13是设定增益表的示例的图。在该例中，在重放机最大输出电平为1时，乘法部分44a(定义为乘法部分(1))、乘法部分44b(定义为乘法部分(2))以及乘法部分44c(定义为乘法部分(3))的增益针对音量1被设为0.7、1.5和0.7。也针对音量2设定拟与相应乘法部分44a-44c相乘的增益，之后亦然。音量1-60简单地表示以60级设定的声音输出电平。重放机最大输出电平1、2……作为与预定电平对应的唯一序号而被分配。

增益选择部分51输入声音重放装置的音量信息以及声音重放装置的最大输出声压信息，并参照增益表来提取相应增益值并设定至乘法部分44a-44c。因此，共同分量频谱和共同分量以外的频谱的混合比和增益可设定至与声音重放装置的音量对应的值。

在增益表52中设定的增益被定义为如下的值：当声音重放装置的音量小时，增加包含人声的共同分量的比例并通过增益突出共同分量。随着声音重放装置的音量增加，包含人声的共同分量的增益减小且共同分量以外的分量的增益增加，以当重放分量时使共同分量的增益及共同分量以外的分量的比例改变而逐渐变得相等。

例如，在图13的示例中，在小音量1时，乘法部分44a、44c针对共同分量以外的分量的增益为0.7，而乘法部分44b针对共同分量的增益为1.5。因此，从乘法部分44输出的共同分量和共同分量以外的分量之比为1.5：0.7。这意味着共同分量的比例较大并且共同分量以1.5的增益突出并输出。

另一方面，在图13的示例中，在音量60时，针对共同分量以外的分量的乘法部分44a、44c和针对共同分量的乘法部分44b中的所有增益均为1.0。结果，共同分量和共同分量以外的分量以同一比例输出。共同分量的增益为1.0，而突出的共同分量的增益降低至与其它分量相同的水平。

在本发明的实施例中，优选地，共同分量的增益在较小音量下被设定为等于或大于1，且共同分量的增益随着声音重放装置音量的增加而减小以提供控制，从而使共同分量和共同分量以外的分量的混合比逐渐相等。

如前所述，在本实施例中，通过在较小音量下增加共同分量的比例和增益，包含在共同分量中的人声变得更易听见，而当音量变得更大时，通过均等地输出共同分量和共同分量以外的分量并减小共同分量的增益，可减小由于超重振现象引起的不适感，并可为老年人提供最佳的声音输出控制。

与前述实施例相同，可预置针对老年人的重放模式和针对年轻人的重放模式，并且当通过用户操作选择针对老年人的重放模式时，可提供控制以随着音量增加而改变共同分量和其它分量的比例和增益，如前所述。

运作在本实施例中的声音重放装置上的程序是控制CPU等以实现根据本发明的手段(或手段的一部分)的功能的程序(可运作以驱动计算机实现这些功能的程序)。该程序可包括用于显示装置以便于用户使用声音重放装置的图形用户接口(GUI)。由声音重放装置处理的信息在处理时暂时存放在RAM中，并随后存储到各种ROM和HDD中，并由CPU根据需要读取和修改/写入。

存储程序的记录介质可以是任何半导体介质(例如ROM和非易失性存储卡)、光学记录介质(例如BD，DVD，MO，MD，CD和BD)以及磁记录介质(例如磁带和软磁盘)。

不单单是通过执行所加载程序实现的实施例的功能，还有本发明的功能，均可基于来自程序的指令通过与操作系统或另一应用程序等协作地执行一处理而实现。如果流通到市面上，该程序可存储和分布到便携式记录介质中，或可通过例如因特网的网络传递至所连接的服务器计算机。

工业适用性

由于可突出广播和重放的内容中例如音和词的人声，因此根据本发明的声音信号变换装置能够优选地用于电视接收装置等。

附图标记说明

10均衡器部分

11a，11b，11c双二次数字滤波器

12，13混频器

14延时元件

14，15延时装置15延时元件

21第一系数a1-b2选择部分

22第一系数a1-b2系数表

23第二系数a1-b2选择部分

24第二系数a1-b2系数表

31动态范围压缩器

32放大器/衰减器

33DRC阈值选择部分

34增益选择部分

35DRC阈值表

36增益表40声音信号变换部分

41a，41b输入端子

42频谱变换部分42a频谱变换部分

42b频谱变换部分

43共同分量提取部分

44乘法部分

44a，44b，44c乘法部分

45逆变换部分

45a逆变换部分

45b逆变换部分

45c逆变换部分

46a，46b输出端子

47，48减法器

49，50加法器

51增益选择部分

52增益表

Claims

1.一种声音重放装置，包括：频率特性设定装置，所述频率特性设定装置设定输入声音信号的频率特性；以及音量设定装置，所述音量设定装置在将声音信号作为声音输出时可变地控制音量，其中

所述频率特性设定装置突出包含人声频带的声音频带或衰减除所述声音频带之外的其它频带；以及

所述音量设定装置压缩一动态范围。

2.一种声音重放装置，包括：频率特性设定装置，所述频率特性设定装置设定输入声音信号的频率特性；以及音量设定装置，所述音量设定装置在将声音信号作为声音输出时可变地控制音量，其中

所述频率特性设定装置根据由所述音量设定装置设定的音量增加，从突出包含人声频带的声音频带的频率特性变更至与频率对应的增益特性逐渐平坦的频率特性。

3.如权利要求2所述的声音重放装置，其特征在于，所述声音频带在大约1kHz-8kHz的范围内。

4.如权利要求2或3所述的声音重放装置，其特征在于，包括收听者选择装置，所述收听者选择装置根据用户操作选择收听者是老年人还是年轻人，其中如果选择了老年人，则频率特性根据由所述音量设定装置设定的音量增加而改变。

5.一种声音重放装置，包括：动态范围设定装置，所述动态范围设定装置设定输入声音信号的动态范围；以及音量设定装置，所述音量设定装置在将声音信号作为声音输出时可变地控制音量，其中

所述动态范围设定装置根据由所述音量设定装置设定的音量增加作出改变以逐渐增加动态范围的压缩率。

6.如权利要求5所述的声音重放装置，其特征在于，包括收听者选择装置，所述收听者选择装置根据用户操作选择收听者是老年人还是年轻人，其中如果选择了老年人，则所述动态范围的压缩率根据由所述音量设定装置设定的音量增加而改变。

7.一种声音重放装置，包括：从分别对应于多个声道的多个声音信号提取共同分量的装置；从所述多个声音信号的每一个中减去所述共同分量以提取所述共同分量以外的分量的装置；改变所提取的共同分量的增益和所述共同分量以外的分量的增益并混合这些分量的装置；以及音量设定装置，所述音量设定装置在将声音信号作为声音输出时可变地控制音量，其中

所述声音重放装置根据由音量设定装置设定的音量增加而减少共同分量的增益。

8.如权利要求7所述的声音重放装置，其特征在于，包括收听者选择装置，所述收听者选择装置通过用户操作选择收听者是老年人还是年轻人，其中如果选择了老年人，则根据所述由音量设定装置设定的音量增加、根据由所述音量设定装置设定的音量增加而改变所述增益。

9.一种由声音重放装置执行的声音重放方法，所述声音重放装置设定输入声音信号的频率特性，且在将声音信号作为声音输出时可变地控制音量，所述方法包括如下步骤：

所述声音重放装置突出包括人声频带的声音频带或衰减所述声音频带以外的频带；并压缩一动态范围。

10.一种由声音重放装置执行的声音重放方法，所述声音重放装置设定输入声音信号的频率特性，并在将声音信号作为声音输出时可变地控制音量，所述方法包括如下步骤：

所述声音重放装置根据在声音输出时设定的音量增加，从突出包含人声频带的声音频带的频率特性改变至与频率对应的增益特性逐渐平坦的频率特性。

11.一种由声音重放装置执行的声音重放方法，所述声音重放装置设定输入声音信号的动态范围，并在将声音信号作为声音输出时可变地控制音量，所述方法包括如下步骤：

所述声音重放装置根据在声音输出时设定的音量增加，改变所述动态范围的压缩率以逐渐地增加所述压缩率。

12.一种由声音重放装置执行的声音重放方法，所述声音重放装置从分别对应于多个声道的多个声音信号提取共同分量，从所述多个声音信号中的每一个减去所述共同分量以提取所述共同分量以外的分量，改变所提取的共同分量的增益和所述共同分量以外的分量的增益并混合这些分量，并在将声音信号作为声音输出时可变地控制音量，所述方法包括如下步骤：

所述声音重放装置根据设定音量的增加而减小所述共同分量的增益。

13.一种通过计算机实现如权利要求1-8中任何一项所述的声音重放装置的功能的程序。