CN116567510A - 影院声道还音故障检测方法、系统、终端及介质 - Google Patents
影院声道还音故障检测方法、系统、终端及介质 Download PDFInfo
- Publication number
- CN116567510A CN116567510A CN202310481685.5A CN202310481685A CN116567510A CN 116567510 A CN116567510 A CN 116567510A CN 202310481685 A CN202310481685 A CN 202310481685A CN 116567510 A CN116567510 A CN 116567510A
- Authority
- CN
- China
- Prior art keywords
- channel
- target
- frequency band
- sound
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 claims abstract description 32
- 230000004044 response Effects 0.000 claims description 37
- 238000012216 screening Methods 0.000 claims description 14
- 230000008859 change Effects 0.000 claims description 12
- 238000004088 simulation Methods 0.000 claims description 11
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000001914 filtration Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 208000037656 Respiratory Sounds Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/001—Monitoring arrangements; Testing arrangements for loudspeakers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Abstract
本发明公开了一种影院声道还音故障检测方法、系统、终端及介质,通过将音频数据输入房间声学模型进行模拟,获得参考信号,播放音频数据并录制,获得录制信号,根据声道的能量筛选出可能会出现故障的目标声道,然后在目标声道比较参考信号、录音信号的能量值,采用故障计数器记录两项能量值差距较大的情况的出现次数,最后根据故障计数器的值来判定目标声道是否出现故障。与现有技术相比,能够准确地检测出在哪一个声道出现还音故障。
Description
技术领域
本发明涉及影院故障检测技术领域,尤其涉及的是一种影院声道还音故障检测方法、系统、终端及介质。
背景技术
声道还音故障是影院常见故障之一,一旦声道出现故障,将会影响观众的观影感受。
在正常播放影片时,目前虽然可以通过分析声压级来获得影院还音是否正常,但因为多个扬声器同时发声,不能实时检测出哪一个声道有故障。
因此,现有技术有待改进和提高。
发明内容
本发明的主要目的在于提供一种影院声道还音故障检测方法、系统、智能终端及存储介质,旨在解决不能实时检测出哪一个声道有故障的问题。
为了实现上述目的,本发明第一方面提供一种影院声道还音故障检测方法,所述方法包括:
从目标音频流获取当前帧的音频数据;
将所述音频数据输入预先构建的房间声学模型进行声学模拟,获得参考信号;
播放所述音频数据并录制,获得录音信号;
基于时间偏移,对齐所述参考信号和所述录音信号;
基于所述参考信号,根据声道的能量对声道进行筛选,获得若干目标声道,并获取所述参考信号、所述录音信号在所述目标声道的能量值;
在每个所述目标声道获取所述参考信号、所述录音信号的能量值的差值,当所述差值超过预设阈值时,递增当前目标声道对应的故障计数器的值;
将所述目标音频流的下一帧设为当前帧,进行循环检测直至满足设定条件;
根据所有的所述故障计数器的值获得故障检测结果并输出。
可选的,所述基于时间偏移,对齐所述参考信号和所述录音信号,包括:
比较所述参考信号和所述录音信号之间的时间偏移,获得音频延时值;
基于所述音频延时值,对齐所述参考信号和所述录音信号。
可选的,所述基于所述参考信号,根据声道的能量对声道进行筛选,获得若干目标声道,并获取所述参考信号、所述录音信号在所述目标声道的能量值,包括:
计算所述参考信号在每个声道的能量值;
计算每个声道的能量值与所有声道的能量值之和的比值,当所述比值超过预设比值阈值时,设定当前声道为所述目标声道,并计算所述录音信号在所述目标声道的能量值。
可选的,所述基于所述参考信号,根据声道的能量对声道进行筛选,获得若干目标声道,并获取所述参考信号、所述录音信号在所述目标声道的能量值,包括:
获取频段列表;
对所述频段列表中每一个频段进行如下操作:
计算所述参考信号中每个声道在所述频段的能量值,获得若干频段能量值;
计算每个声道的频段能量值与所有频段能量值之和的比值,当所述比值超过设定阈值时,设定当前声道为所述目标声道,设定当前频段为目标频段,设定当前频段能量值为所述参考信号在所述目标声道的能量值,计算所述录音信号中所述目标声道在所述频段的能量值,获得所述录音信号在所述目标声道的能量值。
可选的,所述目标声道中包括多个所述目标频段,所述参考信号、所述录音信号在所述目标声道的能量值包括多个所述目标频段对应的能量值,计算所述目标声道的参考信号、录音信号的能量值之间的差值,当所述差值超过预设阈值时,递增当前目标声道对应的故障计数器的值,包括:
计算所述目标声道在每个所述目标频段下所述参考信号、所述录音信号的能量值之间的差值,当所述差值超过预设阈值时,递增所述目标声道中所述目标频段的故障计数器的值;
当所述目标声道在任一所述目标频段下所述参考信号、所述录音信号的能量值之间的差值超过预设阈值时,递增所述目标声道对应的故障计数器的值。
可选的,获得目标声道之后,还包括:
计算所述目标声道在每个频段下所述录音信号、所述参考信号的能量值之间的比值,获得若干增益系数;
基于所有的增益系数,获得所述目标声道的频率响应曲线;
获取所述频率响应曲线与前一帧的频率响应曲线之间的频响变化值;
当所述频响变化值超过设定阈值时,递增所述目标声道的故障计数器的值。
本发明第二方面提供影院声道还音故障检测系统,其中,上述系统包括:
音频数据获取模块,用于从目标音频流获取当前帧的音频数据;
声学模拟模块,用于将所述音频数据输入预先构建的房间声学模型进行声学模拟,获得参考信号;
录制模块,用于播放所述音频数据并录制,获得录音信号;
对齐模块,用于基于时间偏移,对齐所述参考信号和所述录音信号;
声道筛选模块,用于基于所述参考信号,根据声道的能量对声道进行筛选,获得若干目标声道,并获取所述参考信号、所述录音信号在所述目标声道的能量值;
比较模块,用于在每个所述目标声道获取所述参考信号、所述录音信号的能量值的差值,当所述差值超过预设阈值时,递增当前目标声道对应的故障计数器的值;
检测模块,用于将所述目标音频流的下一帧设为当前帧,进行循环检测直至满足设定条件,根据所有故障计数器的值获得故障检测结果并输出。
可选的,所述声道筛选模块还包括频道比较单元,所述频道比较单元用于获取频段列表,对所述频段列表中每一个频段进行如下操作:计算所述参考信号中每个声道在所述频段的能量值,获得若干频段能量值;计算每个声道的频段能量值与所有频段能量值之和的比值,当所述比值超过设定阈值时,设定当前声道为所述目标声道,设定当前频段为目标频段,设定当前频段能量值为所述参考信号在所述目标声道的能量值,计算所述录音信号中所述目标声道在所述频段的能量值,获得所述录音信号在所述目标声道的能量值。
本发明第三方面提供一种智能终端,上述智能终端包括存储器、处理器以及存储在上述存储器上并可在上述处理器上运行的影院声道还音故障检测程序,上述影院声道还音故障检测程序被上述处理器执行时实现任意一项上述影院声道还音故障检测方法的步骤。
本发明第四方面提供一种计算机可读存储介质,上述计算机可读存储介质上存储有影院声道还音故障检测程序,上述影院声道还音故障检测程序被处理器执行时实现任意一项上述影院声道还音故障检测方法的步骤。
由上可见,本发明通过将音频数据输入房间声学模型进行模拟,获得参考信号,播放音频数据并录制,获得录制信号,根据声道的能量筛选出可能会出现故障的目标声道,然后在目标声道比较参考信号、录音信号的能量值,采用故障计数器记录两项能量值差距较大的情况的出现次数,最后根据故障计数器的值来判定目标声道是否出现故障。与现有技术相比,能够准确地检测出在哪一个声道出现还音故障。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例提供的影院声道还音故障检测方法流程示意图;
图2是图1实施例的影院声道还音故障检测功能框图;
图3是图1实施例中步骤S500的一种具体流程示意图;
图4是图1实施例中步骤S500的另一种具体流程示意图;
图5是根据频响变化检测还音故障具体流程示意图;
图6是图1实施例中步骤S600的具体流程示意图;
图7是本发明实施例提供的影院声道还音故障检测系统的结构示意图;
图8是本发明实施例提供的一种智能终端的内部结构原理框图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况下,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当…时”或“一旦”或“响应于确定”或“响应于检测到”。类似的,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述的条件或事件]”或“响应于检测到[所描述条件或事件]”。
下面结合本发明实施例的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其它不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
在正常播放影片时,目前虽然可以分析声压级是否异常得到影院整体还音是否正常,但因为是多个扬声器同时发声,不能判定出哪一声道有还音故障。
为了解决上述问题,本发明提供了一种影院声道还音故障检测方法,通过将音频数据输入房间声学模型进行模拟,获得参考信号,播放音频数据并录制,获得录制信号,根据声道的能量筛选出可能会出现故障的目标声道,然后比较参考信号、录音信号在目标声道的能量值来判定目标声道是否出现故障。能够准确地检测出出现还音故障的声道。
示例性方法
本发明实施例提供一种影院声道还音故障检测方法,作为检测模块运行在影院的后台服务器上,用来自动检测影院的声道是否存在还音故障。具体的,如图1所示,本实施例包括如下步骤:
步骤S100:从目标音频流获取当前帧的音频数据;
具体地,目前影院采用的立体声还音系统通常为5.1声道,包括中置声道,前置左、右声道,后置左、右环绕声道及重低音声道。中置声道也称为主声道,包含人声和近景的动作声(包括人的呼吸声,脚步声等)。左右声道主要包含背景音乐以及远景的环境声等。目标音频流是指用来做声道测试的音频流,为5.1声道音频流。可以是预先录制好的音频流,也可以是选取的一段影片。开始检测时,从目标音频流的起始位置或预设位置按照预设时间长度(如5秒)对目标音频流进行分帧,每一帧目标音频流的长度均为预设时间长度。然后读取当前帧的音频流,对该音频流进行分析,从中获取到当前帧各个声道的音频数据。其中,预设位置可以根据需要设定,如目标音频流的起始位置之后5分钟。
在一些可能的实施方式中,影院采用的立体声还音系统为7.1声道或15.1声道,相应地,目标音频流也为7.1声道音频流或15.1声道音频流;若目标音频流仍为5.1声道音频流时,可以通过声道映射表将5.1声道音频流转换为7.1声道音频流或15.1声道音频流,然后用于对声道进行还音故障检测。
如图2所示,本实施例的目标音频流来自于数字影院媒体服务器,包含各个声道的音频流输入音频混音路由模块,然后通过均衡及延时模块对各个声道的音频信号进行均衡及延时处理后,将各个声道的音频数据输入功放后传输至扬声器。因此,可以从音频混音路由模块获取到各个声道的音频数据。
步骤S200:将音频数据输入预先构建的房间声学模型进行声学模拟,获得参考信号;
具体地,根据影院的播放空间结构,采用房间声学环境建模,获得包含多个声源和一个接受者的房间声学模型。房间声学模型根据声学环境的结构对声音信号的传播过程进行建模,精确模拟房间脉冲响应。
房间声学模型建立后,输入音频数据,模拟在影院内采用各个喇叭播放该音频数据,根据房间声学模型获得在影院内设定位置的声音信号作为参考信号,用来和影院现场采集的声音信号进行比对。
根据声学参数构建房间声学模型,获取设定位置的声音信号,是本领域的常规技术手段,在此不再赘述。
步骤S300:播放音频数据并录制,获得录音信号;
具体地,将各个声道的音频数据分别传输至各个声道的扬声器,通过扬声器在影院现场播放上述音频数据,播放的同时通过麦克风在影院房间内设定位置采集声音信号,获得录音信号。其中,设定位置不做限定,优选设置在影厅的中央位置。
步骤S400:基于时间偏移,对齐参考信号和录音信号;
具体地,依据房间声学模型获得的参考信号和影院现场录制获得的录音信号会存在声音不同步的现象,两个声音信号不同步时会产生时间偏移,通过对参考信号和录音信号的波形进行分析比较,获取到参考信号和录音信号之间的时间偏移,即音频延时值。根据获得的音频延时值修正参考信号或录音信号的相位来实现参考信号和录音信号的对齐。根据音频延时修正对齐音频信号的技术手段已广泛用于远程会议、影院放映中,是本领域的常规技术手段,在此不再赘述。
在一些示例中,通过采用FFT(快速傅里叶变换)转换参考信号和录音信号,获得对应的相位频谱和振幅频谱,比较相位频谱之间的差值确定音频延时值。
步骤S500:基于参考信号,根据声道的能量对声道进行筛选,获得若干目标声道,并获取参考信号、录音信号在目标声道的能量值;
具体地,通过对影片内容进行分析可知,可能存在某一时间段是某一声道能量为主,则该时间段可作为该声道的测试点,在该时间段也将该声道称为目标声道。如果该时间段内该声道声压异常,则该声道故障的可能性高。因此,首先根据声道的能量筛选出若干目标声道,再判断目标声道的声压是否异常,可以大幅地提高检测效率。获得目标声道后,计算参考信号、录音信号在目标声道的能量值以做进一步的比较。
在一个实施例中,如图3所示,步骤S500具体包括如下步骤:
步骤A510:计算参考信号在每个声道的能量值;
步骤A520:计算每个声道的能量值与所有声道的能量值之和的比值,当上述比值超过预设比值阈值时,设定当前声道为目标声道,并计算录音信号在上述目标声道的能量值。
具体地,首先需要确定当前帧下的目标声道。通过计算当前帧下参考信号在每个声道的能量值,然后将每个声道的能量值除以所有声道的能量值,获得比值,当某个声道计算出的比值超过预设比值阈值时,即表明该声道的能量远高于其他声道的能量,确定为目标声道。举例来说,左声道的能量值与所有声道的能量值的比值超过80%时,则设定左声道为目标声道。确定目标声道后,并可以同时计算录音信号在该目标声道的能量值,当然也可以在后续比较参考信号、录音信号在目标声道的能量值时再获取录音信号在目标声道的能量值。计算声道的能量值的方法不限,可以直接计算声道的能量值;也可以将声道划分为不同频段,分别计算每个频段的能量值,将所有频段的能量值累加获得声道的能量值。需要说明的是,不同的帧可能存在不同的目标声道。例如:当前帧左声道为目标声道,下一帧中可能中置声道为目标声道。
在一个示例中,计算参考信号中声道的能量值时,通过快速傅里叶变换或子带滤波将参考信号中声道的当前帧划分成多个频段,分别计算每个频段的能量。如通过傅里叶变换将单个声道的音频信号从时域转到频域,得到该声道在不同频率点的系数,每个频段的能量值是该频段内所有频率点的能量值之和,具体表达式为:
Xref(i)是参考信号中声道信号经FFT变换后的第i个频率点的系数,Start(band)是该频段起始频率点,End(band)是该频段的终止频率点。
获得每个频段的能量值后,累计所有频段的能量值获得声道的能量值,本实施例中将声道划分为32个频段,具体表达式为:E_ref_total=E_ref_band0+E_ref_band1+...ref_band31。将所有声道的能量值进行累计,可以获得参考信号的总能量值。
确定目标声道后,同样地,采用上述计算声道能量值的方法计算录音信号的能量值。
对于多个声道同时发声的情况,有可能不同的频段分布在不同的声道。例如:低音分布在左后声道或右后声道。因此从某一频段上看,仍可能有单一声道在该频道为主要能量声道,即该声道在该频段的能量与所有声道在该频道的能量之和的比超过某一阈值,则在当前帧,该频段为该声道的频域测试点,该频段也称为目标频段。
为了从频段的角度确定目标声道,并比较录音信号、参考信号中目标声道在目标频段的能量值从而更精准地检测目标声道是否故障,在另一个实施例中,如图4所示,步骤S500具体包括如下步骤:
步骤B510:获取频段列表;
具体地,频段列表可以根据目标音频流划分而得,也可以直接使用常用的的频段列表。如本实施例的频段列表中包括32个频段。
步骤B520:对频段列表中每一个频段进行如下操作:计算参考信号中每个声道在该频段的能量值,获得若干频段能量值;计算每个声道的频段能量值与所有频段能量值之和的比值,当上述比值超过设定阈值时,设定当前声道为目标声道,设定当前频段为目标频段,设定当前频段能量值为参考信号在目标声道的能量值,计算录音信号中目标声道在目标频段的能量值,获得录音信号在目标声道的能量值。
具体地,首先计算参考信号中每个声道在当前频段的能量值,获得每个声道对应的频段能量值,然后将每个声道的频段能量值除以所有声道的频段能量值之和,获得的结果超过设定阈值(如80%)时,就可以认定在当前帧当前频段为目标频段,当前声道为目标声道,并设定当前频段能量值为参考信号在目标声道的能量值。
例如:8KHz-10KHz为划分出的一个频段,在当前帧,左声道在8KHz-10KHz的能量值与所有声道在8KHz-10KHz的能量值总和的比值为90%,则认定8KHz-10KHz为当前帧的目标频段,左声道为当前帧的目标声道。并直接将左声道在8KHz-10KHz的能量值作为左声道的能量值。后续进行参考信号、录音信号的能量值比较时,就可以只比较目标频段的能量值,以过滤到其他频段的能量值的干扰,使得比较结果更具有代表性。
当设定阈值不合理,参考信号、录音信号的声道能量值的差值虽然没有超过设定阈值时也可能存在声道故障,此种情形下就可能产生误报。为了保证检测准确率以及能够自动地对频段的故障进行处理使得还音的质量更高,获得了每个声道在各个频段的能量值的基础上,在一些实施例中,获得目标声道之后,如图5所示,还包括如下步骤:
步骤S510:计算目标声道在每个频段下录音信号、参考信号的能量值之间的比值,获得若干增益系数;
步骤S520:基于所有的增益系数,获得目标声道的频率响应曲线;
步骤S530:获取频率响应曲线与前一帧的频率响应曲线之间的频响变化值;
步骤S540:当频响变化值超过设定阈值时,递增目标声道的故障计数器的值。
具体地,依次将目标声道每个频段下录音信号的能量值E_rec_band(n)除以参考信号的能量值E_ref_band(n),得到各个频段对应的增益系数G(n)。具体表达式为:G(n)=E_rec_band(n)/E_ref_band(n)。
然后根据所有的增益系数,以增益系数为纵坐标,频段为横坐标,可以得到目标声道的频率响应曲线。根据当前帧的频率响应曲线和上一帧的频率响应曲线,比较各个频段的增益系数,监测频率响应曲线的变化,获得频响变化值。当某个频段的频响变化值超过设定阈值时,表示目标声道可能出现故障,递增目标声道的故障计数器的值。可选的,也可发送警报信息给管理员。需要说明的是,也可以将当前帧的频率响应曲线和之前若干帧的频率响应曲线的拟合值进行比较,获得频响变化值。
步骤S600:在每个目标声道获取参考信号、录音信号的能量值的差值,当上述差值超过预设阈值时,递增当前目标声道对应的故障计数器的值;
具体地,针对不同的影片,在不同的帧目标声道可能是不相同的。也就是说,会存在多个目标声道。已获取了参考信号、录音信号在每个目标声道的能量值之后再逐个进行目标声道的比对,即计算录音信号中目标声道的能量值E_rec_total和参考信号中的目标声道的能量值E_ref_total之间的差值,当差值超过预设阈值时,则比对的当前目标声道对应的故障计数器的值加1,从而获得各个目标声道对应的故障计数器的值以判定目标声道是否出现故障。例如检测结束时,左声道对应的故障计数器的值超过设定阈值15时,判定左声道出现还音故障。
进一步地,还可以比较参考信号与录音信号在各频段的能量值之间的偏差来确定声道故障是在哪一频段出现的,出现故障的频段也称为目标频段。在一个实施例中,目标声道包括多个目标频段,如图6所示,步骤S600具体包括如下步骤:
步骤S610:计算目标声道中每个目标频段下参考信号、录音信号的能量值之间的差值,当上述差值超过预设阈值时,递增目标声道中目标频段的故障计数器的值;
具体地,依次获取目标声道中每一个目标频段下参考信号的能量值、录音信号的能量值,将两者相减,获得差值,当上述差值超过预设阈值时,表明目标声道在当前的目标频段下可能出现故障,将目标声道中目标频段对应的故障计数器的值加一。在音频流检测结束后,当目标声道中目标频段的故障计数器的值超过设定阈值时,可以判定目标声道在目标频段出现故障。例如:右声道在3KHz-5KHz的频段时参考信号、录音信号的能量值之间的差值超过设定阈值时,则将右声道3KHz-5KHz频段对应的故障计数器加一,当右声道3KHz-5KHz频段对应的故障计数器总数超过5时,判定右声道在3KHz-5KHz频段出现故障。
步骤S620:当目标声道在任一目标频段下参考信号、录音信号的能量值之间的差值超过预设阈值时,递增目标声道对应的故障计数器的值。
具体地,在目标声道中,若出现任意一个目标频段下参考信号、录音信号的能量值之间的差值超过预设阈值,则判定目标声道可能出现故障,对目标声道对应的故障计数器的值加一,以对目标声道是否故障进行快速判断。
由上所述,通过累计目标声道下具体频段出现的能量异常的次数来进一步地获得出现还音故障的频段,能够更加精准地定位故障类型,并可以必要时自动调整声道以保持影院还音质量。例如:当发现目标声道在某一频点有x dB的降低,通过将音频处理器的均衡器(EQ)将该频点的增益提高x dB来保持最终频响与原来一致。
步骤S700:将目标音频流的下一帧设为当前帧,进行循环检测直至满足设定条件,根据所有的故障计数器的值获得故障检测结果并输出。
具体地,对当前帧检测完毕后,获取目标音频流的下一帧,并设定为当前帧,返回步骤S100进行循环检测,直至达到设定条件,结束循环检测。设定条件不限,可以为下述中的一项或多项:目标音频流所有帧检测完毕、故障计数器的值达到设定阈值、完成了设定数量帧的检测等等。
检测完毕后,将每个声道对应的故障计数器的值与设定阈值进行比较,若某个声道对应的故障计数器的值大于或等于设定阈值,则判定该声道出现故障,否则,判定该声道正常。对所有的故障计数器的值比对完成后,就可以得知影院中哪些声道出现了故障。
在一些示例中,还统计了目标声道在目标频段对应的故障计数器的值,则可以根据目标频段对应的故障计数器的值判定目标频段是否存在还音故障和目标声道是否故障。
在一个示例中,当声道出现故障时,还发送报警信号至监控系统以通知相关人员及时进行处理。例如中置声道出现故障时,可以将中置声道信号混入左右声道信号中,或将左中右三个声道混合输出。
由上所述,通过将音频数据输入房间声学模型进行模拟,获得参考信号,播放音频数据并录制,获得录制信号,根据声道的能量筛选出可能会出现故障的目标声道,然后比较参考信号、录音信号在目标声道的能量值来判定目标声道是否出现故障。能够准确地检测出出现还音故障的声道;并可以根据声道中的频段对参考信号、录音信号在目标声道的频段进行能量值比较,更加精确地检测出在哪个频段出现还音故障。
示例性系统
如图7所示,对应于上述影院声道还音故障检测方法,本发明实施例还提供影院声道还音故障检测系统,上述系统包括:
音频数据获取模块600,用于从目标音频流获取当前帧的音频数据;
声学模拟模块610,用于将所述音频数据输入预先构建的房间声学模型进行声学模拟,获得参考信号;
录制模块620,用于播放所述音频数据并录制,获得录音信号;
对齐模块630,用于基于时间偏移,对齐所述参考信号和所述录音信号;
声道筛选模块640,用于基于所述参考信号,根据声道的能量对声道进行筛选,获得若干目标声道,并获取所述参考信号、所述录音信号在所述目标声道的能量值;
比较模块650,用于在每个所述目标声道获取所述参考信号、所述录音信号的能量值的差值,当所述差值超过预设阈值时,递增当前目标声道对应的故障计数器的值;
检测模块660,用于将所述目标音频流的下一帧设为当前帧,进行循环检测直至满足设定条件,根据所有故障计数器的值获得故障检测结果并输出。
可选的,所述声道筛选模块640还包括频道比较单元,所述频道比较单元用于获取频段列表,对所述频段列表中每一个频段进行如下操作:计算所述参考信号中每个声道在所述频段的能量值,获得若干频段能量值;计算每个声道的频段能量值与所有频段能量值之和的比值,当所述比值超过设定阈值时,设定当前声道为所述目标声道,设定当前频段为目标频段,设定当前频段能量值为所述参考信号在所述目标声道的能量值,计算所述录音信号中所述目标声道在所述频段的能量值,获得所述录音信号在所述目标声道的能量值。
具体的,本实施例中,上述影院声道还音故障检测系统的各模块的具体功能可以参照上述影院声道还音故障检测方法中的对应描述,在此不再赘述。
基于上述实施例,本发明还提供了一种智能终端,其原理框图可以如图8所示。上述智能终端包括通过系统总线连接的处理器、存储器、网络接口以及显示屏。其中,该智能终端的处理器用于提供计算和控制能力。该智能终端的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和影院声道还音故障检测程序。该内存储器为非易失性存储介质中的操作系统和影院声道还音故障检测程序的运行提供环境。该智能终端的网络接口用于与外部的终端通过网络连接通信。该影院声道还音故障检测程序被处理器执行时实现上述任意一种影院声道还音故障检测方法的步骤。该智能终端的显示屏可以是液晶显示屏或者电子墨水显示屏。
本领域技术人员可以理解,图8中示出的原理框图,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的智能终端的限定,具体的智能终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种智能终端,上述智能终端包括存储器、处理器以及存储在上述存储器上并可在上述处理器上运行的影院声道还音故障检测程序,上述影院声道还音故障检测程序被上述处理器执行时进行以下操作指令:
从目标音频流获取当前帧的音频数据;
将所述音频数据输入预先构建的房间声学模型进行声学模拟,获得参考信号;
播放所述音频数据并录制,获得录音信号;
基于时间偏移,对齐所述参考信号和所述录音信号;
基于所述参考信号,根据声道的能量对声道进行筛选,获得若干目标声道,并获取所述参考信号、所述录音信号在所述目标声道的能量值;
在每个所述目标声道获取所述参考信号、所述录音信号的能量值的差值,当所述差值超过预设阈值时,递增当前目标声道对应的故障计数器的值;
将所述目标音频流的下一帧设为当前帧,进行循环检测直至满足设定条件;
根据所有的所述故障计数器的值获得故障检测结果并输出。
可选的,所述基于时间偏移,对齐所述参考信号和所述录音信号,包括:
比较所述参考信号和所述录音信号之间的时间偏移,获得音频延时值;
基于所述音频延时值,对齐所述参考信号和所述录音信号。
可选的,所述基于所述参考信号,根据声道的能量对声道进行筛选,获得若干目标声道,并获取所述参考信号、所述录音信号在所述目标声道的能量值,包括:
计算所述参考信号在每个声道的能量值;
计算每个声道的能量值与所有声道的能量值之和的比值,当所述比值超过预设比值阈值时,设定当前声道为所述目标声道,并计算所述录音信号在所述目标声道的能量值。
可选的,所述基于所述参考信号,根据声道的能量对声道进行筛选,获得若干目标声道,并获取所述参考信号、所述录音信号在所述目标声道的能量值,包括:
获取频段列表;
对所述频段列表中每一个频段进行如下操作:
计算所述参考信号中每个声道在所述频段的能量值,获得若干频段能量值;
计算每个声道的频段能量值与所有频段能量值之和的比值,当所述比值超过设定阈值时,设定当前声道为所述目标声道,设定当前频段为目标频段,设定当前频段能量值为所述参考信号在所述目标声道的能量值,计算所述录音信号中所述目标声道在所述频段的能量值,获得所述录音信号在所述目标声道的能量值。
可选的,所述目标声道中包括多个所述目标频段,所述参考信号、所述录音信号在所述目标声道的能量值包括多个所述目标频段对应的能量值,计算所述目标声道的参考信号、录音信号的能量值之间的差值,当所述差值超过预设阈值时,递增当前目标声道对应的故障计数器的值,包括:
计算所述目标声道在每个所述目标频段下所述参考信号、所述录音信号的能量值之间的差值,当所述差值超过预设阈值时,递增所述目标声道中所述目标频段的故障计数器的值;
当所述目标声道在任一所述目标频段下所述参考信号、所述录音信号的能量值之间的差值超过预设阈值时,递增所述目标声道对应的故障计数器的值。
可选的,获得目标声道之后,还包括:
计算所述目标声道在每个频段下所述录音信号、所述参考信号的能量值之间的比值,获得若干增益系数;
基于所有的增益系数,获得所述目标声道的频率响应曲线;
获取所述频率响应曲线与前一帧的频率响应曲线之间的频响变化值;
当所述频响变化值超过设定阈值时,递增所述目标声道的故障计数器的值。
本发明实施例还提供一种计算机可读存储介质,上述计算机可读存储介质上存储有影院声道还音故障检测程序,上述影院声道还音故障检测程序被处理器执行时实现本发明实施例提供的任意一种影院声道还音故障检测方法的步骤。
应理解,上述实施例中各步骤的序号大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各实例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟是以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以由另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
上述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,上述计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质可以包括:能够携带上述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,上述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不是相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.影院声道还音故障检测方法,其特征在于,所述方法包括:
从目标音频流获取当前帧的音频数据;
将所述音频数据输入预先构建的房间声学模型进行声学模拟,获得参考信号;
播放所述音频数据并录制,获得录音信号;
基于时间偏移,对齐所述参考信号和所述录音信号;
基于所述参考信号,根据声道的能量对声道进行筛选,获得若干目标声道,并获取所述参考信号、所述录音信号在所述目标声道的能量值;
在每个所述目标声道获取所述参考信号、所述录音信号的能量值的差值,当所述差值超过预设阈值时,递增当前目标声道对应的故障计数器的值;
将所述目标音频流的下一帧设为当前帧,进行循环检测直至满足设定条件;
根据所有的所述故障计数器的值获得故障检测结果并输出。
2.如权利要求1所述的影院声道还音故障检测方法,其特征在于,所述基于时间偏移,对齐所述参考信号和所述录音信号,包括:
比较所述参考信号和所述录音信号之间的时间偏移,获得音频延时值;
基于所述音频延时值,对齐所述参考信号和所述录音信号。
3.如权利要求1所述的影院声道还音故障检测方法,其特征在于,所述基于所述参考信号,根据声道的能量对声道进行筛选,获得若干目标声道,并获取所述参考信号、所述录音信号在所述目标声道的能量值,包括:
计算所述参考信号在每个声道的能量值;
计算每个声道的能量值与所有声道的能量值之和的比值,当所述比值超过预设比值阈值时,设定当前声道为所述目标声道,并计算所述录音信号在所述目标声道的能量值。
4.如权利要求1所述的影院声道还音故障检测方法,其特征在于,所述基于所述参考信号,根据声道的能量对声道进行筛选,获得若干目标声道,并获取所述参考信号、所述录音信号在所述目标声道的能量值,包括:
获取频段列表;
对所述频段列表中每一个频段进行如下操作:
计算所述参考信号中每个声道在所述频段的能量值,获得若干频段能量值;
计算每个声道的频段能量值与所有频段能量值之和的比值,当所述比值超过设定阈值时,设定当前声道为所述目标声道,设定当前频段为目标频段,设定当前频段能量值为所述参考信号在所述目标声道的能量值,计算所述录音信号中所述目标声道在所述频段的能量值,获得所述录音信号在所述目标声道的能量值。
5.如权利要求4所述的影院声道还音故障检测方法,其特征在于,所述目标声道中包括多个所述目标频段,所述参考信号、所述录音信号在所述目标声道的能量值包括多个所述目标频段对应的能量值,计算所述目标声道的参考信号、录音信号的能量值之间的差值,当所述差值超过预设阈值时,递增当前目标声道对应的故障计数器的值,包括:
计算所述目标声道在每个所述目标频段下所述参考信号、所述录音信号的能量值之间的差值,当所述差值超过预设阈值时,递增所述目标声道中所述目标频段的故障计数器的值;
当所述目标声道在任一所述目标频段下所述参考信号、所述录音信号的能量值之间的差值超过预设阈值时,递增所述目标声道对应的故障计数器的值。
6.如权利要求1所述的影院声道还音故障检测方法,其特征在于,获得目标声道之后,还包括:
计算所述目标声道在每个频段下所述录音信号、所述参考信号的能量值之间的比值,获得若干增益系数;
基于所有的增益系数,获得所述目标声道的频率响应曲线;
获取所述频率响应曲线与前一帧的频率响应曲线之间的频响变化值;
当所述频响变化值超过设定阈值时,递增所述目标声道的故障计数器的值。
7.影院声道还音故障检测系统,其特征在于,所述系统包括:
音频数据获取模块,用于从目标音频流获取当前帧的音频数据;
声学模拟模块,用于将所述音频数据输入预先构建的房间声学模型进行声学模拟,获得参考信号;
录制模块,用于播放所述音频数据并录制,获得录音信号;
对齐模块,用于基于时间偏移,对齐所述参考信号和所述录音信号;
声道筛选模块,用于基于所述参考信号,根据声道的能量对声道进行筛选,获得若干目标声道,并获取所述参考信号、所述录音信号在所述目标声道的能量值;
比较模块,用于在每个所述目标声道获取所述参考信号、所述录音信号的能量值的差值,当所述差值超过预设阈值时,递增当前目标声道对应的故障计数器的值;
检测模块,用于将所述目标音频流的下一帧设为当前帧,进行循环检测直至满足设定条件,根据所有故障计数器的值获得故障检测结果并输出。
8.如权利要求7所述的影院声道还音故障检测系统,其特征在于,所述声道筛选模块还包括频道比较单元,所述频道比较单元用于获取频段列表,对所述频段列表中每一个频段进行如下操作:计算所述参考信号中每个声道在所述频段的能量值,获得若干频段能量值;计算每个声道的频段能量值与所有频段能量值之和的比值,当所述比值超过设定阈值时,设定当前声道为所述目标声道,设定当前频段为目标频段,设定当前频段能量值为所述参考信号在所述目标声道的能量值,计算所述录音信号中所述目标声道在所述频段的能量值,获得所述录音信号在所述目标声道的能量值。
9.智能终端,其特征在于,所述智能终端包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的影院声道还音故障检测程序,所述影院声道还音故障检测程序被所述处理器执行时实现如权利要求1-6任意一项所述影院声道还音故障检测方法的步骤。
10.计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有影院声道还音故障检测程序,所述影院声道还音故障检测程序被处理器执行时实现如权利要求1-6任意一项所述影院声道还音故障检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310481685.5A CN116567510A (zh) | 2023-04-27 | 2023-04-27 | 影院声道还音故障检测方法、系统、终端及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310481685.5A CN116567510A (zh) | 2023-04-27 | 2023-04-27 | 影院声道还音故障检测方法、系统、终端及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116567510A true CN116567510A (zh) | 2023-08-08 |
Family
ID=87492496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310481685.5A Pending CN116567510A (zh) | 2023-04-27 | 2023-04-27 | 影院声道还音故障检测方法、系统、终端及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116567510A (zh) |
-
2023
- 2023-04-27 CN CN202310481685.5A patent/CN116567510A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9602940B2 (en) | Audio playback system monitoring | |
CN101416533B (zh) | 在音频系统中的方法和设备 | |
US20130003981A1 (en) | Calibration of Headphones to Improve Accuracy of Recorded Audio Content | |
US9756437B2 (en) | System and method for transmitting environmental acoustical information in digital audio signals | |
EP1322037B1 (en) | Method for designing a modal equalizer for a low frequency sound reproduction | |
EP2949133B1 (en) | Automatic loudspeaker polarity detection | |
US20170373656A1 (en) | Loudspeaker-room equalization with perceptual correction of spectral dips | |
CN113534052B (zh) | 骨导设备虚拟声源定位性能测试方法、系统、装置及介质 | |
Fleischmann et al. | Identification and evaluation of target curves for headphones | |
CN110072181B (zh) | 低音增感方法及装置 | |
Kabzinski et al. | An adaptive crosstalk cancellation system using microphones at the ears | |
CN116567510A (zh) | 影院声道还音故障检测方法、系统、终端及介质 | |
WO2023081535A1 (en) | Automated audio tuning and compensation procedure | |
CN116471531A (zh) | 影院中置声道还音故障检测方法、系统、终端及介质 | |
CN116546412A (zh) | 影院多声道还音故障检测方法、系统、终端及介质 | |
US10972064B2 (en) | Audio processing | |
Valente et al. | Subjective expectation adjustments of early-to-late reverberant energy ratio and reverberation time to match visual environmental cues of a musical performance | |
CN113257247A (zh) | 一种测试方法及系统 | |
Griesinger | Accurate reproduction of binaural recordings through individual headphone equalization and time domain crosstalk cancellation | |
Vairetti et al. | The subwoofer room impulse response (SUBRIR) database | |
Rychtáriková et al. | Laboratory listening tests in building and room acoustics | |
Röcher et al. | Dynamic Crosstalk-Cancellation with Room Compensation for Immersive CAVE-Environments | |
Informative | Dubbing Stages (Mixing Rooms), Screening Rooms and Indoor Theaters—B-Chain Electroacoustic Response | |
WO2023081534A1 (en) | Automated audio tuning launch procedure and report | |
Leembruggen | Précis of the TC-25CSS Theater Testing Report |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |