CN115426582A - 一种耳机音频处理方法及装置 - Google Patents
一种耳机音频处理方法及装置 Download PDFInfo
- Publication number
- CN115426582A CN115426582A CN202211381090.4A CN202211381090A CN115426582A CN 115426582 A CN115426582 A CN 115426582A CN 202211381090 A CN202211381090 A CN 202211381090A CN 115426582 A CN115426582 A CN 115426582A
- Authority
- CN
- China
- Prior art keywords
- audio
- denoising
- processing
- module
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 95
- 238000000605 extraction Methods 0.000 claims abstract description 40
- 238000001514 detection method Methods 0.000 claims abstract description 31
- 230000009467 reduction Effects 0.000 claims abstract description 24
- 238000001228 spectrum Methods 0.000 claims abstract description 20
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000005516 engineering process Methods 0.000 claims abstract description 10
- 230000008569 process Effects 0.000 claims abstract description 7
- 238000004088 simulation Methods 0.000 claims description 13
- 101001048529 Plectranthus scutellarioides Hydroxyphenylpyruvate reductase Proteins 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 5
- 238000004148 unit process Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 239000012141 concentrate Substances 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000000737 periodic effect Effects 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000008447 perception Effects 0.000 claims 1
- 238000012544 monitoring process Methods 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 210000000613 ear canal Anatomy 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1083—Reduction of ambient noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
- H04S7/306—For headphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
Abstract
本发明公开了一种耳机音频处理方法及装置,具体涉及音频处理技术领域,具体包括以下步骤:音频获取模块安装在耳机内部,通过脉宽调制技术对音频进行处理传输至音频特征提取模块,然后音频特征提取模块通过音频频谱处理、音位处理以及非结构音频处理获得音频特征;然后音频降噪处理模块根据音频特征提取模块已经特征提取的音频读取后进行音频去噪处理,获得去噪音频;接着去噪检测模块对去噪进一步降噪,获得降噪音频,保证音频输出质量;本发明通过音频特征提取模块将噪声数据和正常的音频数据划分到相应的区域内,为音频降噪处理提供了基础,通过去噪检测模块在精度和时间效率上具有大幅度提高为去噪后的音频实时监测。
Description
技术领域
本发明涉及音频处理技术领域,更具体地说,本发明涉及一种耳机音频处理方法及装置。
背景技术
随着无线通信技术的快速发展,无线通信技术的应用场合越来越多,例如将无线通信技术应用于耳机上,使得无线耳机具有很高的便捷性,因此受到人们的青睐,随着智能电子产品越来越成为人们生活中不可或缺的产品,无线耳机也成了智能电子产品播放音频的产品,无线耳机在传输音频时,常常因为音频数据采集、接收以及数据传输过程中,各个模块或装置出现相互干扰的情形,使得无线耳机出现不同的噪声,给人们在使用耳机时降低了用户的体验感。
目前耳机音频处理主要通过使用耳机壳外侧装置的麦克风来测量环境噪声,利用噪声消除信号将扬声器位置外的环境噪声消除,为了从耳道麦克风信号中去除主音频信号来识别剩余的环境噪声,从耳道麦克风信号中减去主音频信号滤波后的正确相位和幅度,但是嘈杂的环境中,需要主要分析的是音频以外的环境杂音,没有对音频在传输过程中产生的噪声进行处理,此外去除的杂音效果不好无法到达三维立体身临其境的音频效果,因此需要一种新的一种耳机音频处理方法。
发明内容
为了克服现有技术的上述缺陷,本发明的实施例提供一种耳机音频处理方法及装置,通过音频特征提取模块将噪声数据和正常的音频数据划分到相应的区域内,为音频降噪处理提供了基础,通过去噪检测模块在精度和时间效率上具有大幅度提高为去噪后的音频实时监测,通过三维立体声模块利用HPPR混合混响的模拟方式和参数化预测的方式获得三维立体混合音频确保早期混响和后期混响在音域中平滑过渡,使得音频具有快速且真实立体的混合效果,使得用户具有身临其境的感觉,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种耳机音频处理方法,其运行步骤具体如下:
步骤S1、音频获取模块安装在耳机内部,通过脉宽调制技术对音频进行处理传输至音频特征提取模块,然后音频特征提取模块通过音频频谱处理、音位处理以及非结构音频处理获得音频特征;
步骤S2、然后音频降噪处理模块根据音频特征提取模块已经特征提取的音频读取后进行音频去噪处理,获得去噪音频;
步骤S3、接着去噪检测模块对去噪进一步降噪,获得降噪音频,保证音频输出质量;
步骤S4、最后三维立体声模块利用HPPR混合混响的模拟方式和参数化预测的方式获得三维立体混合音频。
一种耳机音频处理装置,包括音频获取模块、音频特征提取模块、音频降噪处理模块、去噪检测模块、三维立体声模块,所述音频获取模块安装在耳机内部,通过脉宽调制技术对音频进行处理传输至音频特征提取模块,所述音频特征提取模块通过音频频谱处理、音位处理以及非结构音频处理获得音频特征,所述音频降噪处理模块根据音频特征提取模块已经特征提取的音频读取后进行音频去噪处理,获得去噪音频,所述去噪检测模块是对去噪进一步降噪,获得降噪音频,保证音频输出质量,所述三维立体声模块利用HPPR混合混响的模拟方式和参数化预测的方式获得三维立体混合音频。
在一个优选的实施方式中,所述音频特征提取模块包括音频频谱处理单元、音位处理单元和非结构音频处理单元,所述音频频谱处理单元通过快速傅里叶变换的方式进行处理,由于音频是通过振动产生,傅里叶公式计算中,通过周期函数将不同的振动和不同相位的正弦波进行叠加,获得不同音频频谱,通过计算频谱投影点与最接近峰值之间的距离得到相位差,利用相位差绘制准确的正弦函数。
在一个优选的实施方式中,所述音位处理单元是对音频按照序列分出的三个部分,即音位、音节和音素,利用音位通过梅尔频率倒谱系数的方式进行处理,获得音位对应特定的音素或单个音位对应一组音素中的任何一个,所述非结构音频处理单元通过对音频类非结构化数据进行整个向量化标识,利用连续数值离散化的方式将其划分不同音域范围,这是由于噪声数据存在于离群区间,因此将噪声数据和正常的音频数据划分到相应的区域内,为音频降噪处理提供了基础。
在一个优选的实施方式中,所述音频降噪处理模块采用平均化处理的方式将不同的特征提取后的原始音频数据作为数值型数据,输入单个音频,步骤如下:
音频数据集为X={X1,X2,X3,…,Xi,…,Xm},此处m是音频文件的个数,Xi代表第i个音频文件;
音频输入为Xi={Xi(1),Xi(2),Xi(3),…,Xi(j),…,Xi(n)},此处n代表特征的种类;
音频输出为ACC(X),
具体步骤如下:
A1:对实时音频特征提取的特征信息进行预处理;
A2:按照7:2:1的比例划分训练、验证和测试集;
A3:训练得到去噪模型,每10个音频数据集展示一次检测结果并记录至为音频数据库;
A4:调整数据参数并优化模型结构;
A5:输出ACC(X),
其中ACC(X)为降噪处理后的音频,Dense-DNN模型为去噪模型,通过音频降噪处理模块处理的过程,快速根据处理好的音频特征进行降噪处理为去噪检测模块做好了基础。
在一个优选的实施方式中,所述去噪检测模块是通过引用池化层理念将原始音频数据中的所有信息集中到一个点上,其中包含噪声点和去噪点,所述噪声与主音频之间存在映射关系,即通过噪声点和去噪点(t)去噪模型和降噪模型去除噪声:
其中为去噪音频,为降噪音频,H(t)为主音频中存在的去噪点,i为第i个音频文件,所述去噪检测模块对原始音频先去噪大部分噪声,再利用降噪模型进行降噪处理,得到纯净的音频,所述去噪检测模块利用去噪点和降噪点两种关系分析出不同的特征提取规则,依据不同的特征提取规则使得每一个音频都具有详细的标识,经过去噪和降噪处理后的数据准确的学习噪声特征,易于区分噪声音频和清洗噪声音频,通过去噪检测模块在精度和时间效率上具有大幅度提高为去噪后的音频实时监测。
在一个优选的实施方式中,所述三维立体声模块通过音频的物理特性和感知特性利用HPPR混合混响的模拟方式在音频特征处理后建立卷积ISM建模的短早期音频与音频信号模拟,之后利用早期混响后的参数化预测模型自动计算确定获得三维立体混合音频,所述参数化预测模型依据卷积ISM建模处理后的音频再利用FDN实现后期的混响效果,此方式确保早期混响和后期混响在音域中平滑过渡,使得音频具有快速且真实立体的混合效果,使得用户具有身临其境的感觉。
在一个优选的实施方式中,所述卷积ISM建模是在一个封闭的环境中,一个点声源产生的混响由一系列特定位置的虚拟声源产生的声压来进行建模,获得立体修正音频,减少卷积运算,确保了音频的三维立体混合的真实性。
附图说明
图1为本发明的系统结构框图。
图2为本发明的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例可以应用于计算机系统/服务器,其可与众多其他通用或专用计算系统环境或配置一起操作。适于与计算机系统/服务器一起使用的众所周知的计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境等等。
计算机系统/服务器可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
实施例1
本实施例提供了如图1所示一种耳机音频处理装置,包括音频获取模块、音频特征提取模块、音频降噪处理模块、去噪检测模块、三维立体声模块,所述音频获取模块安装在耳机内部,通过脉宽调制技术对音频进行处理传输至音频特征提取模块,所述音频特征提取模块通过音频频谱处理、音位处理以及非结构音频处理获得音频特征,所述音频降噪处理模块根据音频特征提取模块已经特征提取的音频读取后进行音频去噪处理,获得去噪音频,所述去噪检测模块是对去噪进一步降噪,获得降噪音频,保证音频输出质量,所述三维立体声模块利用HPPR混合混响的模拟方式和参数化预测的方式获得三维立体混合音频。
本实施例提供了如图2所示一种耳机音频处理方法,具体运行方式如下:
步骤S1、音频获取模块安装在耳机内部,通过脉宽调制技术对音频进行处理传输至音频特征提取模块,然后音频特征提取模块通过音频频谱处理、音位处理以及非结构音频处理获得音频特征;
本实施例需要具体说明的是音频特征提取模块包括音频频谱处理单元、音位处理单元和非结构音频处理单元,所述音频频谱处理单元通过快速傅里叶变换的方式进行处理,由于音频是通过振动产生,傅里叶公式计算中,通过周期函数将不同的振动和不同相位的正弦波进行叠加,获得不同音频频谱,通过计算频谱投影点与最接近峰值之间的距离得到相位差,利用相位差绘制准确的正弦函数。
其中需要具体说明的是音位处理单元是对音频按照序列分出的三个部分,即音位、音节和音素,利用音位通过梅尔频率倒谱系数的方式进行处理,获得音位对应特定的音素或单个音位对应一组音素中的任何一个。
其中需要具体说明的是非结构音频处理单元通过对音频类非结构化数据进行整个向量化标识,利用连续数值离散化的方式将其划分不同音域范围,这是由于噪声数据存在于离群区间,因此将噪声数据和正常的音频数据划分到相应的区域内,为音频降噪处理提供了基础。
步骤S2、然后音频降噪处理模块根据音频特征提取模块已经特征提取的音频读取后进行音频去噪处理,获得去噪音频;
本实施例需要具体说明的是音频降噪处理模块采用平均化处理的方式将不同的特征提取后的原始音频数据作为数值型数据,输入单个音频,步骤如下:
音频数据集为X={X1,X2,X3,…,Xi,…,Xm},此处m是音频文件的个数,Xi代表第i个音频文件;
音频输入为Xi={Xi(1),Xi(2),Xi(3),…,Xi(j),…,Xi(n)},此处n代表特征的种类;
音频输出为ACC(X),
具体步骤如下:
A1:对实时音频特征提取的特征信息进行预处理;
A2:按照7:2:1的比例划分训练、验证和测试集;
A3:训练得到去噪模型,每10个音频数据集展示一次检测结果并记录至为音频数据库;
A4:调整数据参数并优化模型结构;
A5:输出ACC(X),
其中ACC(X)为降噪处理后的音频,Dense-DNN模型为去噪模型,通过音频降噪处理模块处理的过程,快速根据处理好的音频特征进行降噪处理为去噪检测模块做好了基础。
步骤S3、接着去噪检测模块对去噪进一步降噪,获得降噪音频,保证音频输出质量;
本实施例需要具体说明的是去噪检测模块是通过引用池化层理念将原始音频数据中的所有信息集中到一个点上,其中包含噪声点和去噪点,所述噪声与主音频之间存在映射关系,即通过噪声点和去噪点(t)去噪模型和降噪模型去除噪声:
其中为去噪音频,为降噪音频,H(t)为主音频中存在的去噪点,i为第i个音频文件,所述去噪检测模块对原始音频先去噪大部分噪声,再利用降噪模型进行降噪处理,得到纯净的音频,所述去噪检测模块利用去噪点和降噪点两种关系分析出不同的特征提取规则,依据不同的特征提取规则使得每一个音频都具有详细的标识,经过去噪和降噪处理后的数据准确的学习噪声特征,易于区分噪声音频和清洗噪声音频,通过去噪检测模块在精度和时间效率上具有大幅度提高为去噪后的音频实时监测。
步骤S4、最后三维立体声模块利用HPPR混合混响的模拟方式和参数化预测的方式获得三维立体混合音频。
本实施例需要具体说明的是三维立体声模块通过音频的物理特性和感知特性利用HPPR混合混响的模拟方式在音频特征处理后建立卷积ISM建模的短早期音频与音频信号模拟,之后利用早期混响后的参数化预测模型自动计算确定获得三维立体混合音频,此方式确保早期混响和后期混响在音域中平滑过渡,使得音频具有快速且真实立体的混合效果,使得用户具有身临其境的感觉。
其中需要具有说明的是卷积ISM建模是在一个封闭的环境中,一个点声源产生的混响由一系列特定位置的虚拟声源产生的声压来进行建模,从而获得立体修正音频,所述参数化预测模型依据卷积ISM建模处理后的音频再利用FDN实现后期的混响效果,减少卷积运算,确保了音频的三维立体混合的真实性。
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种耳机音频处理方法,其特征在于:其运行步骤具体如下:
步骤S1、音频获取模块安装在耳机内部,通过脉宽调制技术对音频进行处理传输至音频特征提取模块,然后音频特征提取模块通过音频频谱处理、音位处理以及非结构音频处理获得音频特征;
步骤S2、然后音频降噪处理模块根据音频特征提取模块已经特征提取的音频读取后进行音频去噪处理,获得去噪音频;
步骤S3、接着去噪检测模块对去噪进一步降噪,获得降噪音频,保证音频输出质量;
步骤S4、最后三维立体声模块利用HPPR混合混响的模拟方式和参数化预测的方式获得三维立体混合音频。
2.一种耳机音频处理装置,其特征在于:包括音频获取模块、音频特征提取模块、音频降噪处理模块、去噪检测模块、三维立体声模块,所述音频获取模块安装在耳机内部,通过脉宽调制技术对音频进行处理传输至音频特征提取模块,所述音频特征提取模块通过音频频谱处理、音位处理以及非结构音频处理获得音频特征,所述音频降噪处理模块根据音频特征提取模块已经特征提取的音频读取后进行音频去噪处理,获得去噪音频,所述去噪检测模块是对去噪进一步降噪,获得降噪音频,保证音频输出质量,所述三维立体声模块利用HPPR混合混响的模拟方式和参数化预测的方式获得三维立体混合音频。
3.根据权利要求2所述的一种耳机音频处理装置,其特征在于:所述音频特征提取模块包括音频频谱处理单元、音位处理单元和非结构音频处理单元,所述音频频谱处理单元通过快速傅里叶变换的方式进行处理,傅里叶公式计算中,通过周期函数将不同的振动和不同相位的正弦波进行叠加,获得不同音频频谱,通过计算频谱投影点与最接近峰值之间的距离得到相位差,利用相位差绘制准确的正弦函数。
4.根据权利要求3所述的一种耳机音频处理装置,其特征在于:所述音位处理单元是对音频按照序列分出的三个部分,即音位、音节和音素,利用音位通过梅尔频率倒谱系数的方式进行处理,获得音位对应特定的音素或单个音位对应一组音素中的任何一个,所述非结构音频处理单元通过对音频类非结构化数据进行整个向量化标识,利用连续数值离散化的方式将其划分不同音域范围。
5.根据权利要求2所述的一种耳机音频处理装置,其特征在于:所述音频降噪处理模块采用平均化处理的方式将不同的特征提取后的原始音频数据作为数值型数据,输入单个音频,步骤如下:
音频数据集为X={X1,X2,X3,…,Xi,…,Xm},此处m是音频文件的个数,Xi代表第i个音频文件;
音频输入为Xi={Xi(1),Xi(2),Xi(3),…,Xi(j),…,Xi(n)},此处n代表特征的种类;
音频输出为ACC(X),
具体步骤如下:
A1:对实时音频特征提取的特征信息进行预处理;
A2:按照7:2:1的比例划分训练、验证和测试集;
A3:训练得到去噪模型,每10个音频数据集展示一次检测结果并记录至为音频数据库;
A4:调整数据参数并优化模型结构;
A5:输出ACC(X),
其中ACC(X)为降噪处理后的音频。
6.根据权利要求5所述的一种耳机音频处理装置,其特征在于:所述去噪检测模块是通过引用池化层理念将原始音频数据中的所有信息集中到一个点上,其中包含噪声点和去噪点,所述噪声与主音频之间存在映射关系,即通过噪声点和去噪点(t)去噪模型和降噪模型去除噪声:
7.根据权利要求2所述的一种耳机音频处理装置,其特征在于:所述三维立体声模块通过音频的物理特性和感知特性利用HPPR混合混响的模拟方式在音频特征处理后建立卷积ISM建模的短早期音频与音频信号模拟,之后利用早期混响后的参数化预测模型自动计算确定获得三维立体混合音频,所述参数化预测模型依据卷积ISM建模处理后的音频再利用FDN实现后期的混响效果。
8.根据权利要求7所述的一种耳机音频处理装置,其特征在于:所述卷积ISM建模是在一个封闭的环境中,一个点声源产生的混响由一系列特定位置的虚拟声源产生的声压来进行建模,获得立体修正音频。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211381090.4A CN115426582B (zh) | 2022-11-06 | 2022-11-06 | 一种耳机音频处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211381090.4A CN115426582B (zh) | 2022-11-06 | 2022-11-06 | 一种耳机音频处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115426582A true CN115426582A (zh) | 2022-12-02 |
CN115426582B CN115426582B (zh) | 2023-04-07 |
Family
ID=84208001
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211381090.4A Active CN115426582B (zh) | 2022-11-06 | 2022-11-06 | 一种耳机音频处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115426582B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116366169A (zh) * | 2023-06-01 | 2023-06-30 | 浙江大学 | 超声波信道建模方法、电子设备及存储介质 |
CN117714933A (zh) * | 2024-01-02 | 2024-03-15 | 广州市行动者科技有限责任公司 | 一种用于通信的头戴式蓝牙耳机 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080118078A1 (en) * | 2006-11-16 | 2008-05-22 | Sony Corporation | Acoustic system, acoustic apparatus, and optimum sound field generation method |
US20100241426A1 (en) * | 2009-03-23 | 2010-09-23 | Vimicro Electronics Corporation | Method and system for noise reduction |
US20140169581A1 (en) * | 2011-07-26 | 2014-06-19 | Sony Corporation | Audio signal processing device, imaging device, audio signal processing method, program, and recording medium |
CN106954139A (zh) * | 2017-04-19 | 2017-07-14 | 音曼(北京)科技有限公司 | 一种联合耳机和扬声器的声场渲染方法及系统 |
US20170324390A1 (en) * | 2014-11-18 | 2017-11-09 | Limitear Ltd. | Portable programmable device, system, method and computer program product |
CN108346433A (zh) * | 2017-12-28 | 2018-07-31 | 北京搜狗科技发展有限公司 | 一种音频处理方法、装置、设备及可读存储介质 |
CN110047468A (zh) * | 2019-05-20 | 2019-07-23 | 北京达佳互联信息技术有限公司 | 语音识别方法、装置及存储介质 |
CN111063342A (zh) * | 2020-01-02 | 2020-04-24 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置、计算机设备及存储介质 |
CN111968662A (zh) * | 2020-08-10 | 2020-11-20 | 北京小米松果电子有限公司 | 音频信号的处理方法及装置、存储介质 |
CN111988705A (zh) * | 2019-05-21 | 2020-11-24 | 北京小米移动软件有限公司 | 音频处理方法、装置、终端及存储介质 |
CN115116458A (zh) * | 2022-06-10 | 2022-09-27 | 腾讯科技(深圳)有限公司 | 语音数据转换方法、装置、计算机设备及存储介质 |
-
2022
- 2022-11-06 CN CN202211381090.4A patent/CN115426582B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080118078A1 (en) * | 2006-11-16 | 2008-05-22 | Sony Corporation | Acoustic system, acoustic apparatus, and optimum sound field generation method |
US20100241426A1 (en) * | 2009-03-23 | 2010-09-23 | Vimicro Electronics Corporation | Method and system for noise reduction |
US20140169581A1 (en) * | 2011-07-26 | 2014-06-19 | Sony Corporation | Audio signal processing device, imaging device, audio signal processing method, program, and recording medium |
US20170324390A1 (en) * | 2014-11-18 | 2017-11-09 | Limitear Ltd. | Portable programmable device, system, method and computer program product |
CN106954139A (zh) * | 2017-04-19 | 2017-07-14 | 音曼(北京)科技有限公司 | 一种联合耳机和扬声器的声场渲染方法及系统 |
CN108346433A (zh) * | 2017-12-28 | 2018-07-31 | 北京搜狗科技发展有限公司 | 一种音频处理方法、装置、设备及可读存储介质 |
CN110047468A (zh) * | 2019-05-20 | 2019-07-23 | 北京达佳互联信息技术有限公司 | 语音识别方法、装置及存储介质 |
CN111988705A (zh) * | 2019-05-21 | 2020-11-24 | 北京小米移动软件有限公司 | 音频处理方法、装置、终端及存储介质 |
CN111063342A (zh) * | 2020-01-02 | 2020-04-24 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置、计算机设备及存储介质 |
CN111968662A (zh) * | 2020-08-10 | 2020-11-20 | 北京小米松果电子有限公司 | 音频信号的处理方法及装置、存储介质 |
CN115116458A (zh) * | 2022-06-10 | 2022-09-27 | 腾讯科技(深圳)有限公司 | 语音数据转换方法、装置、计算机设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
赵至柔: "《多语种语音参数抽取及统计特征识别研究》", 《硕博学位论文》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116366169A (zh) * | 2023-06-01 | 2023-06-30 | 浙江大学 | 超声波信道建模方法、电子设备及存储介质 |
CN116366169B (zh) * | 2023-06-01 | 2023-10-24 | 浙江大学 | 超声波信道建模方法、电子设备及存储介质 |
CN117714933A (zh) * | 2024-01-02 | 2024-03-15 | 广州市行动者科技有限责任公司 | 一种用于通信的头戴式蓝牙耳机 |
CN117714933B (zh) * | 2024-01-02 | 2024-05-28 | 广州市行动者科技有限责任公司 | 一种用于通信的头戴式蓝牙耳机 |
Also Published As
Publication number | Publication date |
---|---|
CN115426582B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115426582B (zh) | 一种耳机音频处理方法及装置 | |
Zheng et al. | Phase-aware speech enhancement based on deep neural networks | |
Zhao et al. | Two-stage deep learning for noisy-reverberant speech enhancement | |
CN113436643B (zh) | 语音增强模型的训练及应用方法、装置、设备及存储介质 | |
CN112949708B (zh) | 情绪识别方法、装置、计算机设备和存储介质 | |
CN110459241B (zh) | 一种用于语音特征的提取方法和系统 | |
WO2007001821A2 (en) | Multi-sensory speech enhancement using a speech-state model | |
CN112837670B (zh) | 语音合成方法、装置及电子设备 | |
Li et al. | Digital signal processing in audio and acoustical engineering | |
JP2013037174A (ja) | 雑音/残響除去装置とその方法とプログラム | |
Shankar et al. | Efficient two-microphone speech enhancement using basic recurrent neural network cell for hearing and hearing aids | |
CN116868265A (zh) | 用于动态声学环境中的数据增强和语音处理的系统和方法 | |
WO2017045512A1 (zh) | 一种语音识别的方法、装置、终端及语音识别设备 | |
Loweimi et al. | Robust Source-Filter Separation of Speech Signal in the Phase Domain. | |
JP4119112B2 (ja) | 混合音の分離装置 | |
US20230386492A1 (en) | System and method for suppressing noise from audio signal | |
Srinivas et al. | A classification-based non-local means adaptive filtering for speech enhancement and its FPGA prototype | |
CN106098080A (zh) | 一种噪声环境下言语识别阈的确定方法及装置 | |
CN116959474A (zh) | 音频数据处理方法、装置、设备和存储介质 | |
CN115881157A (zh) | 音频信号的处理方法及相关设备 | |
CN114302301A (zh) | 频响校正方法及相关产品 | |
Lim et al. | Non-stationary noise cancellation using deep autoencoder based on adversarial learning | |
Chun et al. | Comparison of cnn-based speech dereverberation using neural vocoder | |
Zhang et al. | URGENT Challenge: Universality, Robustness, and Generalizability For Speech Enhancement | |
Sharma et al. | Development of a speech separation system using frequency domain blind source separation technique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |