CN109688497B

CN109688497B - 声音播放装置、方法及非暂态存储介质

Info

Publication number: CN109688497B
Application number: CN201811206968.4A
Authority: CN
Inventors: 廖俊旻; 郭彦闵
Original assignee: HTC Corp
Current assignee: HTC Corp
Priority date: 2017-10-18
Filing date: 2018-10-17
Publication date: 2021-10-01
Anticipated expiration: 2038-10-17
Also published as: US20190122681A1; US11004457B2; TWI703557B; TW201917723A; CN109688497A

Abstract

本公开涉及声音播放装置、方法及非暂态存储媒体。该声音播放方法应用于声音播放装置中，且包含：接收与聆听者数据以及声源数据相关的输入声音讯号；进行编码程序，以将输入声音讯号与编码函式矩阵相乘，进而产生编码结果，其中编码函式矩阵的多个元素与基底函式相关；获取解码函式矩阵并代入至少一方向参数，其中解码函式矩阵配置以补偿输入声音讯号的理想逼近结果以及模拟逼近结果间的误差；进行解码程序，以将编码结果乘以代入方向参数的解码函式矩阵，进而产生输出声音讯号；以及重制输出声音讯号。本发明可在不耗费过多运算资源的情形下加强声音的方向感。

Description

声音播放装置、方法及非暂态存储介质

技术领域

本发明涉及声音播放技术，且特别涉及一种声音播放装置、方法及非暂态存储媒体。

背景技术

近年来，虚拟现实技术广泛地应用于例如游戏、工程或是军事的用途中。为了体验虚拟现实的环境，使用者需要通过设置于例如，但不限于头戴装置(head-mounted device；HMD)上的显示装置，来观看用以显示虚拟环境的画面。其中，头戴装置是穿戴于于使用者身上。进一步地，使用者可使用同样设置于头戴装置上的声音播放装置来聆听基于虚拟环境产生的声音。

由声音播放装置所重制(reproduce)的声音讯号，可以利用数学方法来模拟。然而，由于运算资源有限，部分原始声音讯号的特征例如，但不限于不同方向的方向性成分，将可能在数学模型建构的过程中遗失，而使得重制后的声音与原始声音讯号不同。

因此，如何设计一个新的声音播放装置、方法及非暂态存储媒体，以解决上述的缺失，乃为此一业界亟待解决的问题。

发明内容

本发明的目的在于在不耗费过多运算资源的情形下，加强声音的方向感。

本发明的一实施方式在于提供一种声音播放方法，应用于声音播放装置中，且包含：接收与聆听者数据以及声源数据相关的输入声音讯号；进行编码程序，以将输入声音讯号与编码函式矩阵相乘，进而产生编码结果，其中编码函式矩阵的多个元素(entry)与基底函式相关；获取解码函式矩阵并代入至少一方向参数，其中解码函式矩阵配置以补偿输入声音讯号的理想逼近结果以及模拟逼近结果间的误差；进行解码程序，以将编码结果乘以代入方向参数的解码函式矩阵，进而产生输出声音讯号；以及重制输出声音讯号。

于一实施例中，基底函式为球面谐波(spherical harmonics)函式。

于一实施例中，理想逼近结果是对测试声音讯号以第一编码函式矩阵以及第一解码函式矩阵进行编码再解码所产生，且第一编码函式矩阵以及第一解码函式矩阵对应于具有无限的多个项次(indeterminate)的基底函式；模拟逼近结果是对测试声音讯号以第二编码函式矩阵以及第二解码函式矩阵进行编码再解码所产生，且第二编码函式矩阵以及第二解码函式矩阵对应于具有有限的项次的基底函式；以及解码函式矩阵是以第二解码函式矩阵与补偿矩阵相乘所产生，其中补偿矩阵是由误差所产生。

于一实施例中，第一解码函式矩阵是第一编码函式矩阵的反矩阵，第二解码函式矩阵是第二编码函式矩阵的反矩阵。

于一实施例中，项次对应于测试声音讯号的不同的多个方向成分。

于一实施例中，解码函式矩阵根据误差，加强对应于输入声音讯号的传输方向的方向成分。

于一实施例中，声音播放方法还包含：对输出声音讯号进行反向响应计算，以进一步重制输出声音讯号，其中反向响应计算对应于用以重制输出声音讯号的声音播放电路的频率响应特性。

本发明的另一实施方式在于提供一种声音播放装置，包含：存储元件、声音播放电路以及处理器。存储元件配置以存储多个计算机可执行指令。处理器电性耦接于存储元件以及声音播放电路，并配置以获取并执行计算机可执行指令，以在计算机可执行指令被执行时执行声音播放方法。声音播放方法包含：接收与聆听者数据以及声源数据相关的输入声音讯号；进行编码程序，以将输入声音讯号与编码函式矩阵相乘，进而产生编码结果，其中编码函式矩阵的多个元素与基底函式相关；获取解码函式矩阵并代入至少一方向参数，其中解码函式矩阵配置以补偿输入声音讯号的理想逼近结果以及模拟逼近结果间的误差；进行解码程序，以将编码结果乘以代入方向参数的解码函式矩阵，进而产生输出声音讯号；以及使声音播放电路重制输出声音讯号。

于一实施例中，理想逼近结果是对测试声音讯号以第一编码函式矩阵以及第一解码函式矩阵进行编码再解码所产生，且第一编码函式矩阵以及第一解码函式矩阵对应于具有无限的多个项次的基底函式；模拟逼近结果是对测试声音讯号以第二编码函式矩阵以及第二解码函式矩阵进行编码再解码所产生，且第二编码函式矩阵以及第二解码函式矩阵对应于具有有限的项次的基底函式；以及解码函式矩阵是以第二解码函式矩阵与补偿矩阵相乘所产生，其中补偿矩阵是由误差所产生。

本发明的又一实施方式在于提供一种非暂态(non-transitory)计算机可读取存储媒体，配置以存储包含多个计算机可执行指令的计算机程序，用以执行应用在声音播放装置的声音播放方法，声音播放装置至少包含存储元件、声音播放电路以及电性耦接于存储元件及声音播放电路并配置以获取并执行计算机可执行指令，以在计算机可执行指令被执行时执行声音播放方法的处理器。声音播放方法包含：接收与聆听者数据以及声源数据相关的输入声音讯号；进行编码程序，以将输入声音讯号与编码函式矩阵相乘，进而产生编码结果，其中编码函式矩阵的多个元素与基底函式相关；获取解码函式矩阵并代入至少一方向参数，其中解码函式矩阵配置以补偿输入声音讯号的理想逼近结果以及模拟逼近结果间的误差；进行解码程序，以将编码结果乘以代入方向参数的解码函式矩阵，进而产生输出声音讯号；以及使声音播放电路重制输出声音讯号。

应用本发明的优点在于本发明的声音播放装置以及声音播放方法可根据聆听者以及声源的位置的关系来加强，而不会耗费过多的运算资源。通过加强声音讯号的波峰与波谷，聆听者可对声音讯号有较强的方向感。

附图说明

图1为本发明一实施例中，一种声音播放装置的方框图；

图2为本发明一实施例中，一种声音播放方法的流程图；

图3为本发明一实施例中，一个系统的范例性示意图；以及

图4为本发明一实施例中，位于虚拟环境的聆听者以及声源的示意图。

附图标记说明：

1：声音播放装置

10：存储元件

100：计算机可执行指令

102：聆听者数据

104：声源数据

106：解码函式矩阵

11：声音讯号

12：声音播放电路

13：输出声音讯号

14：处理器

200：声音播放方法

201-205：步骤

3：系统

300：声源

301：编码结果

302：编码单元

304：解码单元

306：头部相关转换函式转换器

308：补偿单元

310：混合单元

4：虚拟环境

40：聆听者

42：声源

44：声音

具体实施方式

请参照本公开内容的实施例，其中以下的范例将搭配附图进行说明。在附图及说明中所使用相同的元件符号，将指称相同或类似的元件。

须注意的是，在说明书以及权利要求中所进行的叙述中，当元件被描述为“连接”或“耦接”至另一元件时，其可为直接连接或耦接至另一元件，或是可能存在有中间的元件。相对的，当元件被描述为“直接连接”或“直接耦接”至另一元件时，将不会有中间的元件存在。更进一步地，“电性连接”或“连接”可更用以指称两个或多个元件间的交互操作以及互动。

须注意的是，在说明书以及权利要求中所进行的叙述中，虽然“第一”、“第二”等用语可用以描述不同的元件，这些元件可不被这些用语所限制。这些用语仅用以区分不同的元件。举例来说，第一元件亦可被改称为第二元件，且类似地，第二元件亦可被改称第一元件，而不会悖离实施例的范围。

须注意的是，在说明书以及权利要求中所进行的叙述中，“包含”、“包括”、“具有”、“含有”及类似的用语是被理解为开放性的，例如表示“包含，但不限于”。

须注意的是，在说明书以及权利要求中所进行的叙述中，“及/或”的语句包含所列举的一个或多个相关事物中的任何以及全部的组合。

须注意的是，在说明书以及权利要求中所进行的叙述中，在以下的实施例的叙述中用以指称方向的词汇，例如“上”、“下”、“左”、“右”、“前”及“后”，是与附图中的方向相关。因此，这样指称方向的词汇是用以叙述，而非限制本公开内容。

须注意的是，在说明书以及权利要求中所进行的叙述中，除非另行定义，所有的用语(包含技术性或是科学性用语)具有任何本公开内容所属技术领域的通常知识者所普遍理解的相同意义。须更进一步了解的是，此些用语，例如定义于常用的字典者，除非特别定义，否则需解读为具有与在相关的技术领域所使用的相同意义，而不能被广泛地解读。

请参照图1。图1为本发明一实施例中，一种声音播放装置1的方框图。于一实施例中，声音播放装置1可应用于头戴装置中。更详细地说，声音播放装置1的元件可分布设置在头戴装置的不同位置上。

声音播放装置1包含存储元件10、声音播放电路12以及处理器14。

于一实施例中，存储元件10可为例如，但不限于光盘、随机存取存储器、只读存储器、软盘、硬盘或光学磁片。存储元件10配置以存储多个计算机可执行指令100。

声音播放电路12配置以播放由处理器14产生的输出声音讯号13。于一实施例中，声音播放电路12可包含第一播放单元以及第二播放单元(未示出)，配置以播放第一声道声音和第二声道声音。其中，使用者可穿戴头戴装置，并将第一播放单元和第二播放单元置入或是靠近使用者的双耳，以聆听播放结果。

处理器14电性耦接于存储元件10以及声音播放电路12。于一实施例中，处理器14配置以获取并执行计算机可执行指令100，并据以执行声音播放装置1的功能。

请参照图2及图3。声音播放装置1的功能将在以下的段落搭配图1、图2及图3进行详细的说明。

图2为本发明一实施例中，一种声音播放方法200的流程图。声音播放方法200可应用于图1的声音播放装置1中。

图3为本发明一实施例中，一个系统3的范例性示意图。

于一实施例中，当计算机可执行指令100由处理器14执行时，可执行声音播放方法200，并使声音播放装置1运行为系统3。系统3包含声源300、编码单元302、解码单元304、多个头部相关转换函式(head-related transfer function；HRTF)转换器306以及多个补偿单元308。

声音播放方法200包含下列步骤(应了解到，在本实施方式中所提及的步骤，除特别叙明其顺序者外，均可依实际需要调整其前后顺序，甚至可同时或部分同时执行)。

于步骤201，接收与聆听者数据102以及声源数据104相关的输入声音讯号11。

请同时参照图4。图4为本发明一实施例中，位于虚拟环境4的聆听者 40以及声源42的示意图。

于一实施例中，聆听者数据102包含聆听者40，例如头戴装置的使用者，在虚拟环境4的位置的信息。聆听者数据102可存储于存储元件10中，并可根据例如，但不限于游戏或是军事训练的模拟情境的过程实时地产生。处理器14可自存储元件10中获取聆听者数据102。

于一实施例中，声源数据104包含用以在虚拟环境4中产生可由使用者感知的声音44的声源42的位置的信息。于一实施例中，声源42相当于图3中的声源300。

声源数据104可由处理器14通过例如，但不限于声音播放装置1的网络模块(未示出)所获取，并可在模拟情境的过程中产生。

根据聆听者数据102以及声源数据104，处理器14可取得聆听者40以及声源42的位置。

在声源42以及聆听者40间，可形成声音44的传输路径，此传输路径具有一传输方向。声音44可在模拟情境的过程根据输入声音讯号11产生，其中输入声音讯号11可由处理器14通过例如，但不限于声音播放装置1 的网络模块(未示出)所获取。更详细地说，当输入声音讯号11被声音播放装置1处理并重制后，头戴装置的使用者将可感知到声音44。

于步骤202，进行编码程序，以将输入声音讯号与编码函式矩阵相乘，进而产生编码结果，其中编码函式矩阵的多个元素与基底函式相关。

于一实施例中，编码程序是由图3所示出的编码单元302执行。详细的编码程序将于下列段落中描述。

于一实施例中，基底函式为球面谐波(spherical harmonics)函式，且这样的基底函式可由下式描述：

这样的基底函式，是与输入声音讯号11的传输方向相关的球面角度坐标(spherical angular coordinates)θ及

的函式，且具有由m及n所定义的阶数。

于步骤203，由存储元件10获取解码函式矩阵106并代入至少一方向参数，其中解码函式矩阵106配置以补偿输入声音讯号11的理想逼近结果以及模拟逼近结果间的误差。

于一实施例中，一个测试声音讯号S_t可由对测试声音讯号S_t以第一编码函式矩阵

以及第一解码函式矩阵

进行编码再解码，来产生理想逼近结果

其中，第一编码函式矩阵

以及第一解码函式矩阵

对应于具有无限的多个项次(即由m及n定义的阶数为无限)的基底函式。其中上述的项次对应于测试声音讯号S_t的不同的方向成分。于一实施例中，第一解码函式矩阵

是第一编码函式矩阵

的反矩阵。

因此，第一解码函式矩阵

可表示为

而理想逼近结果

可表示为：

更进一步地，测试声音讯号S_t可由对测试声音讯号S_t以第二编码函式矩阵

以及第二解码函式矩阵

进行编码再解码，来产生模拟逼近结果

其中，第二编码函式矩阵

以及第二解码函式矩阵

对应于相同但却具有有限的多个项次(即由m及n定义的阶数为有限)的基底函式。其中上述的项次对应于测试声音讯号S_t的不同的方向成分。于一实施例中，第二解码函式矩阵

是第二编码函式矩阵

的反矩阵。

因此，第二解码函式矩阵

可表示为

而模拟逼近结果

可表示为：

理想逼近结果

以及模拟逼近结果

间的关系可表示为：

其中，项次

表示理想逼近结果

以及模拟逼近结果

间的误差。于一实施例中，项次

可被计算，并可被用以做为一个补偿矩阵，来对第二解码函式矩阵

进行调整。

因此，通过将第二解码函式矩阵

乘以补偿矩阵

可产生解码函式矩阵106，且解码函式矩阵106将可补偿上述的误差。于一实施例中，解码函式矩阵106是存储于存储元件10中，并可在解码程序进行时获取。更进一步地，输入声音讯号11的方向参数，例如θ及

可用以代入解码函式矩阵106。其中方向参数为用以描述输入声音讯号11的传输方向的参数。

须注意的是，上述的实施例中，以球面谐波函式做为基底函式的方式仅为一范例。然而，于其他实施例中，其他形式的函式亦可被使用来做为基底函式。

于步骤204，进行解码程序，以将编码结果301乘以代入方向参数的解码函式矩阵106，进而产生输出声音讯号13。

于一实施例中，解码单元304以及补偿单元308共同执行上述的解码程序，其中解码单元304根据第二解码函式矩阵

进行运算，而补偿单元308根据补偿矩阵

进行运算。当补偿单元308的数目为N时，补偿单元308将分别根据对应不同方向成分的补偿矩阵

及

进行运算。

于一实施例中，头部相关转换函式转换器306可选择性地设置于补偿单元308前，其中头部相关转换函式转换器306配置以根据头部相关转换函式进行转换。于其他实施例中，补偿单元308可设置于头部相关转换函式转换器306前。

于一实施例中，由于使用了输入声音讯号11的方向参数以及补偿矩阵

解码函式矩阵106根据误差，加强对应于输入声音讯号11的传输方向的方向成分(亦即图4的声音44的传输路径的方向)。

于步骤205，使声音播放电路12重制输出声音讯号13。

于一实施例中，图3所示出的混合单元310可被设置以进一步产生两轨输出的输出声音讯号13，以使输出声音讯号13可被例如，但不限于耳机所重制。于其他实施例中，当声音播放电路12具有更多通道时，混合单元 310亦可产生多声道形式的输出声音讯号13。

更进一步地，于一实施例中，可在存储元件10中存储对应于用以重制输出声音讯号13的声音播放电路12的频率响应特性的反向响应。因此，此反向响应可被获取并先对输出声音讯号13进行反向响应计算，再进一步重制输出声音讯号13。

因此，输出声音讯号13的方向特性将不会被声音播放电路12的种类，不管是耳机、扩大系统或是其他类型的声音播放装置所影响。

本发明的声音播放装置1以及声音播放方法200可对输入声音讯号11 进行强化，以在编码程序和解码程序后，使输出声音讯号13保持输入声音讯号11的方向性，而不会因为编码过程而失真。

须注意的是，在部分实施例中，声音播放方法200可由计算机应用程序实作。当计算机应用程序由计算机、电子装置或是图1示出的处理器14 执行时，此执行装置将执行声音播放方法200。计算机应用程序可存储于非暂态的计算机可读取存储媒体例如只读存储器、快闪存储器、软盘、硬盘、光学碟片、快闪碟片、快闪硬盘、磁带、可由网络存取的数据库或任何在属于本公开书的范围中，可由本领域熟知此技艺者所使用具有类似功能的存储媒体中。

以上所述仅为本发明的优选实施例而已，并不用以限制本发明，凡在本发明的原则之内所作的任何修改，等同替换和改进等均应包含本发明的保护范围之内。

Claims

1.一种声音播放方法，应用于一声音播放装置中，其特征在于，包含：

接收与一聆听者数据以及一声源数据相关的一输入声音讯号，该聆听者数据和该声源数据是在模拟情境的过程中实时地产生，该聆听者数据包含一聆听者在一虚拟环境中的位置信息，且该声源数据包含用以在该虚拟环境中产生可由一使用者感知声音的声源的位置信息；

进行一编码程序，以将该输入声音讯号与一编码函式矩阵相乘，进而产生一编码结果，其中该编码函式矩阵的多个元素与一基底函式相关；

获取一解码函式矩阵并代入至少一方向参数，其中该解码函式矩阵配置以补偿该输入声音讯号的一理想逼近结果以及一模拟逼近结果间的一误差，其中该理想逼近结果是对一测试声音讯号以一第一编码函式矩阵以及一第一解码函式矩阵进行编码再解码所产生，且该模拟逼近结果是对该测试声音讯号以一第二编码函式矩阵以及一第二解码函式矩阵进行编码再解码所产生；

根据多个头部相关转换函式对该编码结果进行转换；

进行一解码程序，以将该编码结果乘以代入该方向参数的该解码函式矩阵，进而产生一输出声音讯号；以及

重现该输出声音讯号。

2.如权利要求1所述的声音播放方法，其特征在于，该基底函式为球面谐波函式。

3.如权利要求1所述的声音播放方法，其特征在于，该第一编码函式矩阵以及该第一解码函式矩阵对应于具有无限的多个项次的该基底函式，且该第二编码函式矩阵以及该第二解码函式矩阵对应于具有有限的所述多个项次的该基底函式；以及

该解码函式矩阵是以该第二解码函式矩阵与一补偿矩阵相乘所产生，其中该补偿矩阵是由该误差所产生。

4.如权利要求3所述的声音播放方法，其特征在于，该第一解码函式矩阵是该第一编码函式矩阵的反矩阵，该第二解码函式矩阵是该第二编码函式矩阵的反矩阵。

5.如权利要求3所述的声音播放方法，其特征在于，所述多个项次对应于该测试声音讯号的不同的多个方向成分。

6.如权利要求5所述的声音播放方法，其特征在于，该解码函式矩阵根据该误差，加强对应于该输入声音讯号的一传输方向的所述多个方向成分。

7.如权利要求1所述的声音播放方法，其特征在于，该声音播放方法还包含：

对该输出声音讯号进行一反向响应计算，以进一步重现该输出声音讯号，其中该反向响应计算对应于用以重现该输出声音讯号的一声音播放电路的一频率响应特性。

8.一种声音播放装置，包含：

一存储元件，配置以存储多个计算机可执行指令；

一声音播放电路；以及

一处理器，电性耦接于该存储元件以及该声音播放电路，并配置以获取并执行所述多个计算机可执行指令，以在所述多个计算机可执行指令被执行时执行一声音播放方法，该声音播放方法包含：

根据多个头部相关转换函式对该编码结果进行转换；

使该声音播放电路重现该输出声音讯号。

9.如权利要求8所述的声音播放装置，其特征在于，该第一编码函式矩阵以及该第一解码函式矩阵对应于具有无限的多个项次的该基底函式，且该第二编码函式矩阵以及该第二解码函式矩阵对应于具有有限的所述多个项次的该基底函式；以及

10.一种非暂态计算机可读取存储介质，配置以存储包含多个计算机可执行指令的一计算机程序，用以执行应用在一声音播放装置的一声音播放方法，该声音播放装置至少包含一存储元件、一声音播放电路以及电性耦接于该存储元件及该声音播放电路并配置以获取并执行所述多个计算机可执行指令，以在所述多个计算机可执行指令被执行时执行一声音播放方法的一处理器，该声音播放方法包含：

根据多个头部相关转换函式对该编码结果进行转换；

使该声音播放电路重现该输出声音讯号。