CN115278468A - 声音输出方法、装置、电子设备及计算机可读存储介质 - Google Patents
声音输出方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN115278468A CN115278468A CN202210594061.XA CN202210594061A CN115278468A CN 115278468 A CN115278468 A CN 115278468A CN 202210594061 A CN202210594061 A CN 202210594061A CN 115278468 A CN115278468 A CN 115278468A
- Authority
- CN
- China
- Prior art keywords
- sound
- head
- sound signal
- related transfer
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000003860 storage Methods 0.000 title claims abstract description 18
- 230000006870 function Effects 0.000 claims abstract description 74
- 230000005236 sound signal Effects 0.000 claims abstract description 74
- 238000012546 transfer Methods 0.000 claims abstract description 63
- 238000012545 processing Methods 0.000 claims abstract description 30
- 238000012360 testing method Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 abstract description 6
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 18
- 230000005540 biological transmission Effects 0.000 description 9
- 210000005069 ears Anatomy 0.000 description 6
- 101000893549 Homo sapiens Growth/differentiation factor 15 Proteins 0.000 description 5
- 101000692878 Homo sapiens Regulator of MON1-CCZ1 complex Proteins 0.000 description 5
- 102100026436 Regulator of MON1-CCZ1 complex Human genes 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 102000008482 12E7 Antigen Human genes 0.000 description 4
- 108010020567 12E7 Antigen Proteins 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/40—Visual indication of stereophonic sound image
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Otolaryngology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Stereophonic System (AREA)
Abstract
本申请实施例公开了一种声音输出方法、装置、电子设备及计算机可读存储介质,所述方法包括拾取目标声音,形成原始声音信号,获取目标声音与相对零度方向的夹角α;根据所述夹角α,在用于声音信号处理的头相关传递函数集中匹配与所述夹角α相对应的一对头相关传递函数,所述头相关传递函数被配置为具有声音方向特性;采用选取出的所述一对头相关传递函数对所述原始声音信号进行处理,生成左声音信号和右声音信号;将左声音信号输出至左发声装置,将右声音信号输出至右发声装置。本申请实施例的一个技术效果在于增强目标声音在其所在方向上产生的声音,便于人耳对于目标声音的位置判断,在佩戴者主观上提高对声源的定位能力,提升用户体验。
Description
技术领域
本申请属于音频处理技术领域,具体地,本申请涉及一种声音输出方法、装置、电子设备及计算机可读存储介质。
背景技术
VR、AR等头戴式电子设备经过数年技术发展,现已得到使用者的认可,此类头戴设备被消费者广泛应用在娱乐方面。当消费者在使用此类头戴设备时,设备内的声音会为消费者营造出特定的视听效果。然而,这种视听效果会使消费者对外部真实环境的判断能力造成干扰,降低消费者对外界声源方向的敏感度。
在实际应用中,消费者往往难以听清外界声音,或者难以判断外界声音来源的方向。这种现象使消费者难以对外部声源做出响应,例如他人对消费者的呼唤,或者环境中产生的危险讯号。
为此,有必要对电子设备的声音传输技术进行改进,使消费者在使用电子设备时能够更容易判断外界声源的方向。
发明内容
本申请的一个目的是提供一种声音输出方法、装置、电子设备及计算机可读存储介质新技术方案。
根据本申请的第一方面,提供了一种声音输出方法,所述方法包括:
拾取目标声音,形成原始声音信号,获取目标声音与相对零度方向的夹角α;
根据所述夹角α,在用于声音信号处理的头相关传递函数集中匹配与所述夹角α相对应的一对头相关传递函数,所述头相关传递函数被配置为具有声音方向特性;
采用选取出的所述一对头相关传递函数对所述原始声音信号进行处理,生成左声音信号和右声音信号;
将左声音信号输出至左发声装置,将右声音信号输出至右发声装置。
可选地,将采用所述声音输出方法的设备的对称轴所在的方向选为相对零度方向。
可选地,将在使用状态下的左发声装置与右发声装置的中轴线的正前方选为所述相对零度方向。
可选地,所述方法还包括在形成原始声音信号后,对原始声音信号进行降噪。
可选地,所述头相关传递数据集通过对仿真人头进行声学测试获取。
本申请的一个技术效果在于:增强目标声音在其所在方向上产生的声音,便于人耳对于目标声音的位置判断,在佩戴者主观上提高对声源的定位能力,提升用户体验。
根据本申请的第二方面,还提供了一种用于执行第一方面的声音输出方法的声音输出装置,包括:
麦克风,用于拾取目标声音,并形成原始声音信号;
角度判断模块,用于获取目标声音与相对零度方向的夹角α;
声音处理模块,用于选取与夹角α相对应的一对头相关传递函数,并采用选取出的所述一对头相关传递函数对所述原始声音信号进行处理,生成左声音信号和右声音信号;
左发声装置,用于接收左声音信号并产生声音;
右发声装置,用于接收右声音信号并产生声音。
可选地,所述声音输出装置设置为头戴设备。
可选地,所述麦克风至少为两个,各个所述麦克风呈阵列分布。
本申请的一个技术效果在于:声音输出装置通过麦克风收集目标声音,形成原始声音信号后,通过角度判断模块获取夹角α,再通过声音处理模块,选取与夹角α相对应的一对头相关传递函数,对所述原始声音信号进行处理,生成左声音信号和右声音信号,最后分别通过左发声装置与右发声装置产生声音。即,其能够采用角度判断模块和声音处理模块相互配合的方式,以实现根据目标声音与相对零度的夹角α,选取相应的头相关传递函数与原始声音信号进行叠加,从而增强目标声音在其所在方向上产生的声音,便于人耳对于目标声音的位置判断,在佩戴者主观上提高对声源的定位能力,提升用户体验。
通过以下参照附图对本申请的示例性实施例的详细描述,本申请的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本说明书的实施例,并且连同其说明一起用于解释本说明书的原理。
图1为本公开实施例提供的电子设备的硬件配置示意图;
图2为本公开实施例提供的声音输出方法的流程示意图;
图3为本公开实施例提供的声音输出装置的硬件结构示意图。
图4为本公开实施例提供的声音输出装置的原理框图。
图5为本公开实施例提供的电子设备的原理框图。
具体实施方式
现在将参照附图来详细描述本申请的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本申请及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<硬件配置>
图1是根据本公开实施例的电子设备的硬件配置的框图。
如图1所示,该电子设备例如可以是VR设备、AR(增强现实,Augmented Reality)设备及MR(混合现实,Mixed Real ity)设备等,本公开实施例对此不作限定。
在一个实施例中,如图1所示,电子设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、角度判断模块1600、声音处理模块1700、麦克风1800、发声装置1900等等。
其中,处理器1100可以包括但不限于中央处理器CPU、微处理器MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括各种总线接口,例如串行总线接口(包括USB接口)、并行总线接口等。通信装置1400例如能够进行有线或无线通信。显示装置1500例如是液晶显示屏、LED显示屏、OLED(Organic Light-Emitting Diode)显示屏等。输入装置1600例如包括触摸屏、键盘、手柄等。角度判断模块1600可以用于获取目标声音与相对零度方向的夹角α。声音处理模块1700可以用于选取与夹角α相对应的一对头相关传递函数,并采用选取出的所述一对头相关传递函数对所述原始声音信号进行处理,生成声音信号。电子设备可以通过麦克风1800采集音频信息,并通过发声装置1900接收声音信号并产生声音。
本领域技术人员应当理解,尽管在图1中示出了电子设备1000的多个装置,但是,本说明书实施例的电子设备1000可以仅涉及其中的部分装置,也可以还包含其他装置,在此不做限定。
本实施例中,电子设备1000的存储器1200用于存储指令,该指令用于控制处理器1100进行操作以实施或者支持实施根据任意实施例的声音输出方法。技术人员可以根据本说明书所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
在上述描述中,技术人员可以根据本公开所提供的方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
图1所示的电子设备仅是解释性的,并且决不是为了要限制本公开、其应用或用途。
<方法实施例>
图2示出了本公开的一个实施例的声音输出方法,该声音输出方法例如可以由如图1所示的电子设备实施。
如图2所示,该实施例提供的声音输出方法可以包括以下步骤S2100~S2400。
步骤S2100,拾取目标声音,形成原始声音信号,获取目标声音与相对零度方向的夹角α。
本实施例中,通过设置在电子设备上的麦克风拾取目标声音,并形成原始声音信号。其中,目标声音具体为人声。
可选地,将采用所述声音输出方法的设备的对称轴所在的方向选为相对零度方向。
可选地,将在使用状态下的左发声装置与右发声装置的中轴线的正前方选为所述相对零度方向。
可选地,图3为本公开实施例提供的声音输出装置300的硬件结构示意图。参照图3,声音输出装置300设置有两个麦克风310,分别为位于图3左侧的MIC1以及位于图3右侧的MIC2,MIC1与MIC2阵列分布。此时相对零度方向可以设置为两个麦克风310的对称轴所在方向。
本实施例中,原则上可以指定任意角度为相对零度。设置该相对零度方向的目的为确定一个起始方向,从而在获取目标声音的位置后,只需通过比较目标声音的位置与相对零度之间的夹角,即可得到夹角α。
可选地,电子设备在实际使用状态下,左发声装置位于使用者的左耳位置,右发声装置位于使用者的右耳位置。相对零度方向为左发声装置与右发声装置连线的中轴线上,且设置为正前方。其中,前方相对于使用者的后方而言,以使用者面部所在一侧为前方,以使用者的后脑勺一侧为后方。该前方具体指使用者佩戴可实施本方法的电子设备后,使用者的视线所看向的方向为前方。具体地,本实施例中正前方则限定为使用者的视线所看向的方向,且该方向与左发声装置及右发声装置所在水平面平行。
在另一种可选的实施方式中,左发声装置及右发声装置可以固定安装在电子设备(例如VR、AR设备)上,左发声装置及右发声装置在电子装置上的位置相对固定。此时相对零度方向为使用者佩戴电子设备后,左发声装置与右发声装置所在位置的中轴线的正前方。其中正前方为使用者的视线正前方。
可选地,左发声装置及右发声装置也可以是两个独立的扬声器,需要使用者自行佩戴。在该状态下,左发声装置佩戴于使用者的左耳,右发声装置佩戴于使用者的右耳。此时相对零度方向为左发声装置与右发声装置中轴线的正前方,也即佩戴电子设备的消费者的两个耳朵连线的中轴线的正前方。其中该正前方为使用者的视线正前方。
由于人体在判断方向时,通常以视线正前方为起始方向。因此本实施例中相对零度方向的设置更符合人体判断方向的习惯。此外,后续所采用的头相关传递函数为人耳对不同角度的外界声源的反应函数集,在获取头相关传递函数时通常采用该相对零度方向为基础,因此本实施例中采用与获取头相关传递函数所采用的相对零度方向,有利于后续选取与夹角α相匹配的头相关传递函数。换言之,在本步骤中测试得到的夹角α可以直接与头相关传递函数进行匹配,而不需要先将二者的角度值以同一相对零度方向调整后再进行匹配,从而提高了本实施例的使用效率。
具体地,本申请实施例中,在获取目标声音与相对零度方向的夹角时,通过设置在电子设备不同位置的麦克风收集同一目标声音,通过对比多个麦克风收集到的目标声音的时间、强度等信息,利用波束形成等算法确定目标声音的方向,并输出目标声音与相对零度方向之间的夹角。
图3为本公开实施例提供的声音输出装置300的硬件结构示意图。参照图3,本申请实施例设置有两个麦克风310用于拾取目标声音,两个麦克风310以相对零度方向为中心轴对称分布。目标声音位于图3所示的左侧。当两个麦克风310拾取目标声音时,位于左侧的MIC1相比位于右侧的MIC2先接收到目标声音,且MIC1接受到的目标声音响度大于MIC2所接收到的目标声音响度。通过波束形成算法通过将阵列中的MIC1与MIC2所采集到的信号进行滤波、加权叠加后形成波束,并扫描整个接收空间,对一个平面的声压分布进行成像可视化,确定目标声音的方向,并输出目标声音相对于相对零度方向的夹角α。
可选地,在电子设备上的麦克风拾取目标声音,并形成原始声音信号后,对原始声音信号进行降噪。本实施例中该降噪过程采用基于统计模型的语音增强方法进行降噪。具体地,本公开实施例中将目标声音设置为人声,那么环境中除人声外的其余声音则为噪音。通过采用基于统计模型的语音增强方法进行降噪时,将人声信号进行加强,对环境中除目标声音信号外的噪声信号进行抑制,以提高信噪比,改善原始声音信号的质量。
在获取目标声音与相对零度方向的夹角α之后,进入:
步骤S2200,根据所述夹角α,在用于声音信号处理的头相关传递函数集中匹配与所述夹角α相对应的一对头相关传递函数,所述头相关传递函数被配置为具有声音方向特性。
头相关传递函数携带了声波从声源到双耳的传输过程中,头部、耳廓、躯干等对声音造成的影响的信息。头相关传递函数将空间各方位声音到双耳的传播过程整合为左右的两个传播信道,用以根据声源相对于头部的角度来构建双声道虚拟声,重现空间三维声音效果。
头相关传递函数为一对函数集,具体包括不同角度的外界声源分别在佩戴者的左耳及右耳处产生的复数声压的信息。一般情况下,头相关传递函数是关于声源的水平方位角θ、仰角Φ、声源到头中心的距离r以及声波的角频率Ω的函数。
上述角度不同,头相关传递函数不同,其所携带的复数声压信息也不同。由此,各个角度区间对应的头相关传递函数集合形成函数集。在本发明的技术方案中,主要考量水平方位角θ不同所造成的佩戴者对外界声源的听感不同。因此,对应不同的θ角度位置处的声源,头相关传递函数不同,各个头相关传递函数包含了各个位置处声源发出的声音的方向特性,通过该方向特性对声音信号进行处理,形成不同的复数声压。
在本技术方案中,头相关传递函数集的获取方式有多种。本技术方案可以针对不同的产品以及性能要求,为电子产品配置不同的头相关传递函数的获取方式。一种实施例中,头相关传递函数集通过对仿真人头进行声学测试获取。其中,可以根据实际需要选取具有不同生理参数的仿真人头进行测试。选取特定生理参数下的仿真人头后,通过测量消声室内空间球面上各点声源到该仿真人头双耳的声音传播数据,对各点上的声音传播数据进行分析生成头相关传递函数,然后生成头相关传递函数集。将生成的该头相关传递函数集预先存储于电子设备中。
本申请中通过采用该方式获取的头相关传递函数集可以适配大部分佩戴者,并且该头相关传递函数集的存在,使得在获取夹角α后,可以直接匹配与该夹角α对应的一组头相关传递函数,从而节省头相关传递函数的选取、处理时间,提高声音信号传输以及播放声音的实时同步率。
在测试获取头相关传递函数时,本发明可以主要考量水平方向的角度变化。例如,可以将水平方向的360度拆分为10度一份,也可以拆分为20度。在每一份角度区间内放置声源进行一套声音测试。这样可以针对所选取的仿真人头获得36对或者18对头相关传递函数,进而组成头相关函数集。本发明可以不将水平方向上的360度拆分为过多的份数,例如360份,每1度测试一套。因为佩戴者在实际聆听声音时,往往无法精确判断声音来源的角度,而是大致判断声音来源的方向。由此,头相关传递函数集也不需要依据角度划分出过多的组。如果性能需要划分出精确角度,也可以通过精确测试获取精确的头相关传递函数集。
在选取与夹角α相匹配的一对头相关传递函数之后,进入:
步骤S2300,采用选取出的所述一对头相关传递函数对所述原始声音信号进行处理,生成左声音信号和右声音信号。
头相关传递函数在每个角度上均具有分别对应左耳及右耳的一组函数,在根据夹角α选取出一组头相关传递函数后,将该头相关传递函数与原始声音信号进行叠加,分别生成对应左耳的左声音信号,以及对应右耳的右声音信号。
在生成左声音信号和右声音信号后,进入:
步骤S2400,将左声音信号输出至左发声装置,将右声音信号输出至右发声装置。
具体地,左发声装置与右发声装置设置为扬声器,当声音输出装置使用时,左发声装置对应于佩戴者的左耳,右发声装置对应于佩戴者的右耳。
根据本公开实施例,根据目标声音与相对零度的夹角α,选取相应的头相关传递函数与原始声音信号进行叠加,从而增强目标声音在其所在方向上产生的声音,便于人耳对于目标声音的位置判断,在佩戴者主观上提高对声源的定位能力,提升用户体验。
<装置实施例>
本公开实施例提供了一种声音输出装置300,该声音输出装置300可以包括麦克风310、角度判断模块320、声音处理模块330、左发声装置340以及右发声装置350。
麦克风310,用于拾取目标声音,并形成原始声音信号。
角度判断模块320,用于获取目标声音与相对零度方向的夹角α。
声音处理模块330,用于选取与夹角α相对应的一对头相关传递函数,并采用选取出的所述一对头相关传递函数对所述原始声音信号进行处理,生成左声音信号和右声音信号。
左发声装置340,用于接收左声音信号并产生声音,右发声装置350,用于接收右声音信号并产生声音。
具体地,左发声装置340与右发声装置350设置为扬声器,当声音输出装置使用时,左发声装置340对应于佩戴者的左耳,右发声装置350对应于佩戴者的右耳。
在一个实施例中,所述声音输出装置300设置为头戴设备。
在一个实施例中,所述麦克风310至少为两个,各个所述麦克风310呈阵列分布。具体地,参照图3,麦克风310设置有两个,两个麦克风310以相对零度方向为轴对称分布。本申请不对麦克风310的位置具体限定,麦克风310阵列分布于声音输出装置300的不同位置,从而在对同一目标声音进行收集时,通过判断同一目标声音到达不同麦克风的位置的时间及强度大小,实现对目标声音位置的判断。
根据本公开实施例,声音输出装置通过麦克风收集目标声音,形成原始声音信号后,通过角度判断模块获取夹角α,再通过声音处理模块330,选取与夹角α相对应的一对头相关传递函数,对所述原始声音信号进行处理,生成左声音信号和右声音信号,最后分别通过左发声装置与右发声装置产生声音。即,其能够采用角度判断模块和声音处理模块相互配合的方式,以实现根据目标声音与相对零度的夹角α,选取相应的头相关传递函数与原始声音信号进行叠加,从而增强目标声音在其所在方向上产生的声音,便于人耳对于目标声音的位置判断,在佩戴者主观上提高对声源的定位能力,提升用户体验。
<设备实施例>
图5是根据一个实施例的电子设备400的原理框图。该电子设备包括处理器420和存储器410。
该存储器410可以用于存储可执行的计算机指令。
该处理器420可以用于根据所述可执行的计算机指令的控制,执行根据本公开方法实施例所述的声音输出方法。
该电子设备400可以是头戴显示设备,也可以是具备其他硬件结构的设备,在此不做限定。该电子设备400例如可以是VR设备、AR设备及MR设备等,本公开实施例对此不作限定。
在另外的实施例中,该电子设备400可以包括以上声音输出装置300。
在一个实施例中,以上电子设备400的各模块可以通过处理器运行存储器中存储的计算机指令实现。
<计算机可读存储介质>
本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器运行时执行本公开实施例提供的声音输出方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本公开的范围由所附权利要求来限定。
Claims (10)
1.一种声音输出方法,其特征在于,所述方法包括:
拾取目标声音,形成原始声音信号,获取目标声音与相对零度方向的夹角α;
根据所述夹角α,在用于声音信号处理的头相关传递函数集中匹配与所述夹角α相对应的一对头相关传递函数,所述头相关传递函数被配置为具有声音方向特性;
采用选取出的所述一对头相关传递函数对所述原始声音信号进行处理,生成左声音信号和右声音信号;
将左声音信号输出至左发声装置,将右声音信号输出至右发声装置。
2.根据权利要求1所述的声音输出方法,其特征在于,将采用所述声音输出方法的设备的对称轴所在的方向选为相对零度方向。
3.根据权利要求2所述的声音输出方法,其特征在于,将在使用状态下的左发声装置与右发声装置的中轴线的正前方选为所述相对零度方向。
4.根据权利要求1所述的声音输出方法,其特征在于,所述方法还包括在形成原始声音信号后,对原始声音信号进行降噪。
5.根据权利要求1所述的声音输出方法,其特征在于,所述头相关传递数据集通过对仿真人头进行声学测试获取。
6.一种用于执行权利要求1-5所述的声音输出方法的声音输出装置,其特征在于,包括:
麦克风,用于拾取目标声音,并形成原始声音信号;
角度判断模块,用于获取目标声音与相对零度方向的夹角α;
声音处理模块,用于选取与夹角α相对应的一对头相关传递函数,并采用选取出的所述一对头相关传递函数对所述原始声音信号进行处理,生成左声音信号和右声音信号;
左发声装置,用于接收左声音信号并产生声音;
右发声装置,用于接收右声音信号并产生声音。
7.根据权利要求6所述的声音输出装置,其特征在于,所述声音输出装置设置为头戴设备。
8.根据权利要求6所述的声音输出装置,其特征在于,所述麦克风至少为两个,各个所述麦克风呈阵列分布。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行的计算机指令;
处理器,用于根据所述可执行的计算机指令的控制,执行权利要求1-5中任意一项所述的声音输出方法。
10.一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器运行时执行权利要求1-5中任意一项所述的声音输出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210594061.XA CN115278468A (zh) | 2022-05-27 | 2022-05-27 | 声音输出方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210594061.XA CN115278468A (zh) | 2022-05-27 | 2022-05-27 | 声音输出方法、装置、电子设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115278468A true CN115278468A (zh) | 2022-11-01 |
Family
ID=83759330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210594061.XA Pending CN115278468A (zh) | 2022-05-27 | 2022-05-27 | 声音输出方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115278468A (zh) |
-
2022
- 2022-05-27 CN CN202210594061.XA patent/CN115278468A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022201783B2 (en) | Technique for directing audio in augmented reality system | |
US10939225B2 (en) | Calibrating listening devices | |
US20210211829A1 (en) | Calibrating listening devices | |
US9706292B2 (en) | Audio camera using microphone arrays for real time capture of audio images and method for jointly processing the audio images with video images | |
KR20180108766A (ko) | 증강 현실 헤드폰 환경 렌더링 | |
Geronazzo et al. | Applying a single-notch metric to image-guided head-related transfer function selection for improved vertical localization | |
Geronazzo et al. | The impact of an accurate vertical localization with HRTFs on short explorations of immersive virtual reality scenarios | |
US11812222B2 (en) | Technique for directing audio in augmented reality system | |
CN111818441B (zh) | 音效实现方法、装置、存储介质及电子设备 | |
US9832587B1 (en) | Assisted near-distance communication using binaural cues | |
US11259138B2 (en) | Dynamic head-related transfer function | |
US10390167B2 (en) | Ear shape analysis device and ear shape analysis method | |
CN115278468A (zh) | 声音输出方法、装置、电子设备及计算机可读存储介质 | |
CN112927718B (zh) | 感知周围环境的方法、装置、终端和存储介质 | |
CN116939473A (zh) | 一种音频生成方法和相关装置 | |
JP2018152834A (ja) | 仮想聴覚環境において音声信号出力を制御する方法及び装置 | |
CN116421971A (zh) | 空间音频信号的生成方法及装置、存储介质、电子设备 | |
Dodds et al. | Full Reviewed Paper at ICSA 2019 | |
CN115529534A (zh) | 声音信号的处理方法、装置、智能头戴设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |