CN117037815A - 基于hrtf数据信息的家庭影院个性化环绕声生成系统及方法 - Google Patents

基于hrtf数据信息的家庭影院个性化环绕声生成系统及方法 Download PDF

Info

Publication number
CN117037815A
CN117037815A CN202311060586.6A CN202311060586A CN117037815A CN 117037815 A CN117037815 A CN 117037815A CN 202311060586 A CN202311060586 A CN 202311060586A CN 117037815 A CN117037815 A CN 117037815A
Authority
CN
China
Prior art keywords
data information
hrtf data
personalized
user
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202311060586.6A
Other languages
English (en)
Inventor
谭波
刘少鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Lingjing Av Technology Co ltd
Original Assignee
Suzhou Lingjing Av Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Lingjing Av Technology Co ltd filed Critical Suzhou Lingjing Av Technology Co ltd
Priority to CN202311060586.6A priority Critical patent/CN117037815A/zh
Publication of CN117037815A publication Critical patent/CN117037815A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0018Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Otolaryngology (AREA)
  • Stereophonic System (AREA)

Abstract

本发明提供一种基于HRTF数据信息的家庭影院个性化环绕声生成系统及方法,涉及家庭影院技术领域,该系统包括音频获取模块,用于获取音频数据;音频解码器模块,用于对获取的音频数据进行解码,将音频数据恢复为原始音频信号;个性化音频生成模块,包括HRTF数据信息获取单元,用于获取用户HRTF数据信息;HRTF数据信息预处理单元,用于对获取的用户HRTF数据信息进行预处理;HRTF数据信息存储单元,用于存储预处理后的用户HRTF数据信息;个性化音频处理单元,用于基于预处理后的用户HRTF数据信息和恢复的原始音频信号进行处理,生成个性化虚拟环绕声音频信号。本发明解决了现有家庭影院系统中生成的虚拟环绕声不能满足用户的差异化需求的问题。

Description

基于HRTF数据信息的家庭影院个性化环绕声生成系统及方法
技术领域
本发明涉及家庭影院技术领域,尤其涉及一种基于HRTF数据信息的家庭影院个性化环绕声生成系统及方法。
背景技术
目前市面上所有的家庭影院系统中的虚拟环绕声都是直接在音频文件处理好,所有人听到的都一样。其中音频文件直接使用头相关传输函数(Head Related TransferFunction,简称HRTF)模型进行不可还原性处理,使用的HRTF模型为公用大数据平均模型,因为每个人的生理心理个体化差异,所以制作出来经过HRTF处理的声音不可能适应每个人,不可能让每一个用户听感都完美适配。此外,家庭影院系统中使用插件对音频进行渲染后,其HRTF数据不可更改,用户只能听到制作人员制作时使用的HRTF数据模型生成的声音。
发明内容
为此,本发明实施例提供了一种基于HRTF数据信息的家庭影院个性化环绕声生成系统及方法,用于解决现有技术中在家庭影院系统中,虚拟环绕声使用的HRTF模型单一、无法修改,不能满足用户的差异化需求的问题。
为了解决上述问题,本发明实施例提供一种基于HRTF数据信息的家庭影院个性化环绕声生成系统,所述系统包括:
音频获取模块,用于获取音频数据;
音频解码器模块,与所述音频获取模块连接,用于对获取的音频数据进行解码,将音频数据恢复为原始音频信号;
个性化音频生成模块,与所述音频解码器模块连接,包括HRTF数据信息获取单元、HRTF数据信息预处理单元、HRTF数据信息存储单元以及个性化音频处理单元;
所述HRTF数据信息获取单元,用于获取用户HRTF数据信息;
所述HRTF数据信息预处理单元,与所述HRTF数据信息获取单元连接,用于对获取的用户HRTF数据信息进行预处理;
所述HRTF数据信息存储单元,与所述HRTF数据信息预处理单元连接,用于存储预处理后的用户HRTF数据信息;
所述个性化音频处理单元,与所述HRTF数据信息存储单元连接,用于基于预处理后的用户HRTF数据信息和恢复的原始音频信号进行处理,生成个性化虚拟环绕声音频信号,具体包括:
对原始音频信号进行声场渲染与空间音频处理,得到具有虚拟环绕声的音频信号;
从用户HRTF数据信息库中检索对应的用户HRTF数据信息,将检索到的用户HRTF数据信息与具有虚拟环绕声的音频信号进行编码,得到个性化虚拟环绕声音频信号。
优选地,所述HRTF数据信息获取单元,用于获取用户HRTF数据信息,具体包括:
基于深度学习的估计法:使用深度学习网络通过对大量人工测量或数值模拟得到的HRTF数据信息进行训练,得到HRTF估计模型;然后输入新用户人头部信息如照片或3D扫描数据,经HRTF估计模型估计得到HRTF数据信息;
匹配法:比较输入用户头部信息与数据库中的大量HRTF测量结果,找出与输入信息最匹配的HRTF数据信息进行采用或估计。
优选地,所述HRTF数据信息预处理单元,与所述HRTF数据信息获取单元连接,用于对获取的用户HRTF数据信息进行预处理,具体包括:
首先,对获取的用户HRTF数据信息进行预处理,包括幅值归一化、相位校正、噪音去除;
然后,对预处理的用户HRTF数据信息按照用户特征进行分类,所述用户特征包括性别、年龄、头部大小,并构建用户HRTF数据信息库;
最后,将用户HRTF数据信息库中的用户HRTF数据信息进行格式规范。
优选地,所述用户HRTF数据信息库中的用户HRTF数据信息按照SOFA格式进行存储。
优选地,所述用户HRTF数据信息与具有虚拟环绕声的音频信号进行编码,编码格式为LJA格式。
优选地,还包括外接设备,所述外接设备与所述个性化音频生成模块连接,用于对个性化音频生成模块生成的个性化虚拟环绕声音频信号进行播放。
优选地,在外接设备对个性化音频生成模块生成的个性化虚拟环绕声音频信号进行播放前,个性化音频生成模块对生成的LJA格式个性化虚拟环绕声音频信号进行解码。
本发明实施例还提供了一种基于HRTF数据信息的家庭影院个性化环绕声生成方法,所述方法包括:
获取音频数据;
对获取的音频数据进行解码,将音频数据恢复为原始音频信号;
获取用户HRTF数据信息,对获取的用户HRTF数据信息进行预处理,并存储预处理后的用户HRTF数据信息,基于预处理后的用户HRTF数据信息和恢复的原始音频信号进行处理,生成个性化虚拟环绕声音频信号;所述基于预处理后的用户HRTF数据信息和恢复的原始音频信号进行处理,生成个性化虚拟环绕声音频信号的方法为:
对原始音频信号进行声场渲染与空间音频处理,得到具有虚拟环绕声的音频信号;
从用户HRTF数据信息库中检索对应的用户HRTF数据信息,将检索到的用户HRTF数据信息与具有虚拟环绕声的音频信号进行编码,得到个性化虚拟环绕声音频信号;
对生成的个性化虚拟环绕声音频信号进行播放。
本发明实施例还提供了一种电子装置,所述电子装置包括处理器、存储器和总线系统,所述处理器和存储器通过该总线系统相连,所述存储器用于存储指令,所述处理器用于执行存储器存储的指令,以实现上述所述的基于HRTF数据信息的家庭影院个性化环绕声生成方法。
本发明实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机软件产品,所述计算机软件产品包括的若干指令,用以使得一台计算机设备执行上述所述的基于HRTF数据信息的家庭影院个性化环绕声生成方法。
从以上技术方案可以看出,本发明申请具有以下优点:
本发明实施例提供了一种基于HRTF数据信息的家庭影院个性化环绕声生成系统及方法,本发明个性化音频生成模块通过获取用户HRTF数据信息,对获取的用户HRTF数据信息进行预处理,并存储预处理后的用户HRTF数据信息,基于预处理后的用户HRTF数据信息和恢复的原始音频信号进行处理,生成个性化虚拟环绕声音频信号。使得音频数据只有在个性化音频生成模块中和用户本人的HRTF数据结合才会编码,在此之前音频数据文件使用普通播放器无法播放,不经过个性化音频生成模块的音频数据文件即便播放,也没有任何环绕感,编码后的音频数据文件听感数据也只适合用户本人,让盗版成为不可能。此外本发明系统中还可以内置多个不同国家的HRTF数据模型,用户可以跳过采集HRTF数据信息过程,直接使用系统中提供的HRTF数据模型。
附图说明
为了更清楚地说明本发明实施案例或现有技术中的技术方案,下边将对实施例中所需要使用的附图做简单说明,通过参考附图会更清楚的理解本发明的特征和优点,附图是示意性的而不应该理解为对本发明进行任何限制,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他的附图。其中:
图1为根据实施例中提供的一种基于HRTF数据信息的家庭影院个性化环绕声生成系统的框图;
图2为根据实施例中提供的一种基于HRTF数据信息的家庭影院个性化环绕声生成方法的流程图。
附图标记:
10、音频获取模块;20、音频解码器模块;30、个性化音频生成模块;31、HRTF数据信息获取单元;32、HRTF数据信息预处理单元;33、HRTF数据信息存储单元;34、个性化音频处理单元。
具体实施方式
为使本发明实施例的目的、技术方案与优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
如图1所示,本发明实施例提出一种基于HRTF数据信息的家庭影院个性化环绕声生成系统,该系统包括:
音频获取模块10,用于获取音频数据;
音频解码器模块20,与所述音频获取模块连接10,用于对获取的音频数据进行解码,将音频数据恢复为原始音频信号;
个性化音频生成模块30,与所述音频解码器模块连接20,包括HRTF数据信息获取单元31、HRTF数据信息预处理单元32、HRTF数据信息存储单元33以及个性化音频处理单元34;
所述HRTF数据信息获取单元31,用于获取用户HRTF数据信息;
所述HRTF数据信息预处理单元32,与所述HRTF数据信息获取单元31连接,用于对获取的用户HRTF数据信息进行预处理;
所述HRTF数据信息存储单元33,与所述HRTF数据信息预处理单元32连接,用于存储预处理后的用户HRTF数据信息;
所述个性化音频处理单元34,与所述HRTF数据信息存储单元33连接,用于基于预处理后的用户HRTF数据信息和恢复的原始音频信号进行处理,生成个性化虚拟环绕声音频信号,具体包括:
对原始音频信号进行声场渲染与空间音频处理,得到具有虚拟环绕声的音频信号;
从用户HRTF数据信息库中检索对应的用户HRTF数据信息,将检索到的用户HRTF数据信息与具有虚拟环绕声的音频信号进行编码,得到个性化虚拟环绕声音频信号。
本发明实施例提供了一种基于HRTF数据信息的家庭影院个性化环绕声生成系统,通过音频获取模块获取音频数据;通过音频解码器模块对获取的音频数据进行解码,将音频数据恢复为原始音频信号;通过个性化音频生成模块获取用户HRTF数据信息,对获取的用户HRTF数据信息进行预处理,并存储预处理后的用户HRTF数据信息,基于预处理后的用户HRTF数据信息和恢复的原始音频信号进行处理,生成个性化虚拟环绕声音频信号。使得音频数据只有在个性化音频生成模块中和用户本人的HRTF数据结合才会编码,在此之前音频数据文件使用普通播放器无法播放,不经过个性化音频生成模块的音频数据文件即便播放,也没有任何环绕感,编码后的音频数据文件听感数据也只适合用户本人,让盗版成为不可能。此外本发明系统中还可以内置多个不同国家的HRTF数据模型,用户可以跳过采集HRTF数据信息过程,直接使用系统中提供的HRTF数据模型。
进一步地,音频获取模块10用于获取音频数据;
进一步地,音频解码器模块20与音频获取模块10连接,用于对获取的音频数据进行解码,将音频数据恢复为原始音频信号;
进一步地,个性化音频生成模块30与音频解码器模块20连接,包括HRTF数据信息获取单元31、HRTF数据信息预处理单元32、HRTF数据信息存储单元33以及个性化音频处理单元34。
其中,HRTF数据信息获取单元31用于获取用户HRTF数据信息。获取用户的HRTF数据信息的方法为:
基于深度学习的估计法:使用深度学习网络通过对大量人工测量或数值模拟得到的HRTF数据信息进行训练,得到HRTF估计模型;然后输入新用户人头部信息如照片或3D扫描数据,经HRTF估计模型估计得到HRTF数据信息;
匹配法:比较输入用户头部信息与数据库中的大量HRTF测量结果,找出与输入信息最匹配的HRTF数据信息进行采用或估计。
HRTF数据信息预处理单元32与HRTF数据信息获取单元31连接,用于对获取的用户HRTF数据信息进行预处理。对获取的用户HRTF数据信息进行预处理的方法具体包括:
首先,对获取的用户HRTF数据信息进行预处理,包括幅值归一化、相位校正、噪音去除,以获得高质量的HRTF数据。获取的用户HRTF数据信息包括用户头部扫描信息(如3D模型或照片)和多个方向的HRTF响应。
然后,对预处理的用户HRTF数据信息按照用户特征进行分类,用户特征包括性别、年龄、头部大小,并构建用户HRTF数据信息库。用户HRTF数据信息库中的数据信息通过用户ID进行调取。
最后,将用户HRTF数据信息库中的用户HRTF数据信息进行格式规范。具体地,用户HRTF数据信息库中的用户HRTF数据信息按照SOFA格式进行存储。
HRTF数据信息存储单元33与HRTF数据信息预处理单元32连接,用于存储预处理后的用户HRTF数据信息。将预处理后的数据信息按照规范的格式和分类方式存入HRTF数据信息存储单元33进行离线存储,以供个性化音频生成模块30读取与调用。
此外,个性化音频生成模块30还包括API、SDK等接口供用户应用读取指定的HRTF数据。接口支持按性别、年龄、头部大小等条件查询与检索HRTF数据信息库。
个性化音频处理单元34与HRTF数据信息存储单元33连接,用于基于预处理后的用户HRTF数据信息和恢复的原始音频信号进行处理,生成个性化虚拟环绕声音频信号。
具体地,对原始音频信号进行声场渲染与空间音频处理,得到具有虚拟环绕声的音频信号;从用户HRTF数据信息库中检索对应的用户HRTF数据信息,将检索到的用户HRTF数据信息与具有虚拟环绕声的音频信号进行编码,编码格式为LJA格式,得到个性化虚拟环绕声音频信号。
进一步地,外接设备与个性化音频生成模块30连接,用于对个性化音频生成模块30生成的个性化虚拟环绕声音频信号进行播放。在播放前,个性化音频生成模块对生成的LJA格式个性化虚拟环绕声音频信号进行解码。在播放时,系统每5秒处理一次接下来5秒的内容,而不是全部处理完再播放,或者如果系统运算够快可以优化为2秒甚至更短,这样可以保证用户在快进或者跳转位置播放时,因为声音处理最多等待2秒-5秒。理想状态为2秒以内。
实施例二
如图2所示,本发明提供一种基于HRTF数据信息的家庭影院个性化环绕声生成方法,方法包括:
S1:获取音频数据;
S2:对获取的音频数据进行解码,将音频数据恢复为原始音频信号;
S3:获取用户HRTF数据信息,对获取的用户HRTF数据信息进行预处理,并存储预处理后的用户HRTF数据信息,基于预处理后的用户HRTF数据信息和恢复的原始音频信号进行处理,生成个性化虚拟环绕声音频信号;所述基于预处理后的用户HRTF数据信息和恢复的原始音频信号进行处理,生成个性化虚拟环绕声音频信号的方法为:
对原始音频信号进行声场渲染与空间音频处理,得到具有虚拟环绕声的音频信号;
从用户HRTF数据信息库中检索对应的用户HRTF数据信息,将检索到的用户HRTF数据信息与具有虚拟环绕声的音频信号进行编码,得到个性化虚拟环绕声音频信号;
S4:对生成的个性化虚拟环绕声音频信号进行播放。
本实施例的一种基于HRTF数据信息的家庭影院个性化环绕声生成方法,采用前述的基于HRTF数据信息的家庭影院个性化环绕声生成系统执行,因此基于HRTF数据信息的家庭影院个性化环绕声生成方法中的具体实施方式可见前文基于HRTF数据信息的家庭影院个性化环绕声生成系统的实施例部分,例如,S1,S2,S3,S4,分别采用前述的基于HRTF数据信息的家庭影院个性化环绕声生成系统中音频获取模块10,音频解码器模块20,个性化音频生成模块30,外接设备,所以,其具体实施方式可以参照相应的各个部分实施例的描述,为了避免冗余,在此不再赘述。
本发明实施例还提供了一种电子装置,所述电子装置包括处理器、存储器和总线系统,所述处理器和存储器通过该总线系统相连,所述存储器用于存储指令,所述处理器用于执行存储器存储的指令,以实现上述所述的基于HRTF数据信息的家庭影院个性化环绕声生成方法。为了避免冗余,在此不再赘述。
此外,本发明实施例还提供了一种手机,用户通过手机上的App填写个人的世界区域、年龄、身高等特征,结合APP扫描耳部及相关数据,生成用户的HRTF数据信息文件,其保存在系统或云端,可以快速读取。当用户使用家庭影院时,HRTF数据信息文件与具有虚拟环绕声的音频信号进行结合,生成个性化虚拟环绕声音频信号,个性化音频生成模块30对生成的个性化虚拟环绕声音频信号进行解码,外接设备对解码后的个性化虚拟环绕声音频信号进行播放。
本发明实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机软件产品,所述计算机软件产品包括的若干指令,用以使得一台计算机设备执行上述所述的基于HRTF数据信息的家庭影院个性化环绕声生成方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (10)

1.一种基于HRTF数据信息的家庭影院个性化环绕声生成系统,其特征在于,包括:
音频获取模块,用于获取音频数据;
音频解码器模块,与所述音频获取模块连接,用于对获取的音频数据进行解码,将音频数据恢复为原始音频信号;
个性化音频生成模块,与所述音频解码器模块连接,包括HRTF数据信息获取单元、HRTF数据信息预处理单元、HRTF数据信息存储单元以及个性化音频处理单元;
所述HRTF数据信息获取单元,用于获取用户HRTF数据信息;
所述HRTF数据信息预处理单元,与所述HRTF数据信息获取单元连接,用于对获取的用户HRTF数据信息进行预处理;
所述HRTF数据信息存储单元,与所述HRTF数据信息预处理单元连接,用于存储预处理后的用户HRTF数据信息;
所述个性化音频处理单元,与所述HRTF数据信息存储单元连接,用于基于预处理后的用户HRTF数据信息和恢复的原始音频信号进行处理,生成个性化虚拟环绕声音频信号,具体包括:
对原始音频信号进行声场渲染与空间音频处理,得到具有虚拟环绕声的音频信号;
从用户HRTF数据信息库中检索对应的用户HRTF数据信息,将检索到的用户HRTF数据信息与具有虚拟环绕声的音频信号进行编码,得到个性化虚拟环绕声音频信号。
2.根据权利要求1所述的基于HRTF数据信息的家庭影院个性化环绕声生成系统,其特征在于,所述HRTF数据信息获取单元,用于获取用户HRTF数据信息,具体包括:
基于深度学习的估计法:使用深度学习网络通过对大量人工测量或数值模拟得到的HRTF数据信息进行训练,得到HRTF估计模型;然后输入新用户人头部信息如照片或3D扫描数据,经HRTF估计模型估计得到HRTF数据信息;
匹配法:比较输入用户头部信息与数据库中的大量HRTF测量结果,找出与输入信息最匹配的HRTF数据信息进行采用或估计。
3.根据权利要求1所述的基于HRTF数据信息的家庭影院个性化环绕声生成系统,其特征在于,所述HRTF数据信息预处理单元,与所述HRTF数据信息获取单元连接,用于对获取的用户HRTF数据信息进行预处理,具体包括:
首先,对获取的用户HRTF数据信息进行预处理,包括幅值归一化、相位校正、噪音去除;
然后,对预处理的用户HRTF数据信息按照用户特征进行分类,所述用户特征包括性别、年龄、头部大小,并构建用户HRTF数据信息库;
最后,将用户HRTF数据信息库中的用户HRTF数据信息进行格式规范。
4.根据权利要求3所述的基于HRTF数据信息的家庭影院个性化环绕声生成系统,其特征在于,所述用户HRTF数据信息库中的用户HRTF数据信息按照SOFA格式进行存储。
5.根据权利要求1所述的基于HRTF数据信息的家庭影院个性化环绕声生成系统,其特征在于,所述用户HRTF数据信息与具有虚拟环绕声的音频信号进行编码,编码格式为LJA格式。
6.根据权利要求1所述的基于HRTF数据信息的家庭影院个性化环绕声生成系统,其特征在于,还包括外接设备,所述外接设备与所述个性化音频生成模块连接,用于对个性化音频生成模块生成的个性化虚拟环绕声音频信号进行播放。
7.根据权利要求6所述的基于HRTF数据信息的家庭影院个性化环绕声生成系统,其特征在于,在外接设备对个性化音频生成模块生成的个性化虚拟环绕声音频信号进行播放前,个性化音频生成模块对生成的LJA格式个性化虚拟环绕声音频信号进行解码。
8.一种基于HRTF数据信息的家庭影院个性化环绕声生成方法,其特征在于,采用权利要求1至7任意一项所述的基于HRTF数据信息的家庭影院个性化环绕声生成系统,包括:
获取音频数据;
对获取的音频数据进行解码,将音频数据恢复为原始音频信号;
获取用户HRTF数据信息,对获取的用户HRTF数据信息进行预处理,并存储预处理后的用户HRTF数据信息,基于预处理后的用户HRTF数据信息和恢复的原始音频信号进行处理,生成个性化虚拟环绕声音频信号;所述基于预处理后的用户HRTF数据信息和恢复的原始音频信号进行处理,生成个性化虚拟环绕声音频信号的方法为:
对原始音频信号进行声场渲染与空间音频处理,得到具有虚拟环绕声的音频信号;
从用户HRTF数据信息库中检索对应的用户HRTF数据信息,将检索到的用户HRTF数据信息与具有虚拟环绕声的音频信号进行编码,得到个性化虚拟环绕声音频信号;
对生成的个性化虚拟环绕声音频信号进行播放。
9.一种电子装置,其特征在于,所述电子装置包括处理器、存储器和总线系统,所述处理器和存储器通过该总线系统相连,所述存储器用于存储指令,所述处理器用于执行存储器存储的指令,以实现权利要求8所述的基于HRTF数据信息的家庭影院个性化环绕声生成方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机软件产品,所述计算机软件产品包括的若干指令,用以使得一台计算机设备执行权利要求8所述的基于HRTF数据信息的家庭影院个性化环绕声生成方法。
CN202311060586.6A 2023-08-22 2023-08-22 基于hrtf数据信息的家庭影院个性化环绕声生成系统及方法 Withdrawn CN117037815A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311060586.6A CN117037815A (zh) 2023-08-22 2023-08-22 基于hrtf数据信息的家庭影院个性化环绕声生成系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311060586.6A CN117037815A (zh) 2023-08-22 2023-08-22 基于hrtf数据信息的家庭影院个性化环绕声生成系统及方法

Publications (1)

Publication Number Publication Date
CN117037815A true CN117037815A (zh) 2023-11-10

Family

ID=88627939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311060586.6A Withdrawn CN117037815A (zh) 2023-08-22 2023-08-22 基于hrtf数据信息的家庭影院个性化环绕声生成系统及方法

Country Status (1)

Country Link
CN (1) CN117037815A (zh)

Similar Documents

Publication Publication Date Title
JP6676801B2 (ja) マルチチャンネル音声コンテンツを表すビットストリームを生成する方法、およびデバイス
JP6883636B2 (ja) ダッキング制御のためのメタデータ
CN104036789B (zh) 多媒体处理方法及多媒体装置
CN106104680B (zh) 将音频信道插入到声场的描述中
KR101884483B1 (ko) 미디어 인식 및 움직임 신호와의 동기화
CN108141695B (zh) 高阶立体混响(hoa)内容的屏幕相关适应
CN110797038B (zh) 音频处理方法、装置、计算机设备及存储介质
TW201603006A (zh) 寫碼自高階立體混響聲音訊信號分解之向量
CN106471577B (zh) 在高阶立体混响系数中的标量与向量之间进行确定
CN106575506A (zh) 高阶立体混响音频数据的中间压缩
US20150264483A1 (en) Low frequency rendering of higher-order ambisonic audio data
CN106797527A (zh) Hoa内容的显示屏相关调适
TW201601144A (zh) 選擇碼簿以用於寫碼自高階立體混響音訊信號分解之向量
Borsos et al. Speechpainter: Text-conditioned speech inpainting
KR20160119218A (ko) 사운드 이미지 재생 방법 및 디바이스
JP6297721B2 (ja) 高次アンビソニックオーディオレンダラのための希薄情報を取得すること
JP6605725B2 (ja) 複数の遷移の間の高次アンビソニック係数のコーディング
WO2019069710A1 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
CN117037815A (zh) 基于hrtf数据信息的家庭影院个性化环绕声生成系统及方法
CN106465029B (zh) 用于渲染高阶立体混响系数及产生位流的装置和方法
CN112562430A (zh) 辅助阅读方法、视频播放方法、装置、设备及存储介质
TW202029185A (zh) 音訊資料之靈活渲染
TWM314880U (en) Multimedia video generation device
CN114128312B (zh) 用于低频效果的音频渲染
CN115119036A (zh) 一种视频动画制作方法及处理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20231110