CN112489664B - 一种混音方法和装置 - Google Patents

一种混音方法和装置 Download PDF

Info

Publication number
CN112489664B
CN112489664B CN202011375166.3A CN202011375166A CN112489664B CN 112489664 B CN112489664 B CN 112489664B CN 202011375166 A CN202011375166 A CN 202011375166A CN 112489664 B CN112489664 B CN 112489664B
Authority
CN
China
Prior art keywords
voice recording
background music
energy
coefficient
mixing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011375166.3A
Other languages
English (en)
Other versions
CN112489664A (zh
Inventor
熊佳
陈森海
徐志坚
谢睿
陈光尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Quwan Network Technology Co Ltd
Original Assignee
Guangzhou Quwan Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Quwan Network Technology Co Ltd filed Critical Guangzhou Quwan Network Technology Co Ltd
Priority to CN202011375166.3A priority Critical patent/CN112489664B/zh
Publication of CN112489664A publication Critical patent/CN112489664A/zh
Application granted granted Critical
Publication of CN112489664B publication Critical patent/CN112489664B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请公开了一种混音方法和装置,其中方法包括:获取用于混音的人声录音和背景音乐;对人声录音进行语音活动性检测,获取人声录音的第一能量;对背景音乐进行能量检测,获取背景音乐的第二能量;根据预置人声录音系数计算公式,结合第一能量和第二能量,计算人声录音对应的人声录音系数;根据预置背景音乐系数计算公式,结合第一能量和第二能量,计算背景音乐对应的背景音乐系数;基于人声录音系数、背景音乐系数对人声录音和背景音乐进行混音,得到混音文件。解决了现有的混音调节方法,人为操作麻烦降低了用户体验的技术问题。

Description

一种混音方法和装置
技术领域
本申请涉及混音技术领域,尤其涉及一种混音方法和装置。
背景技术
声音作为传递信息的载体,在人们的日常沟通中起重要作用。互联网时代,用于丰富人们生活的声音类产品越来越多。在很多声音类产品中,都会有人声录音叠加背景音乐的混音播放场景。但如果处理不当,人声录音和背景音乐的混音效果不佳,会引起人耳听感的不适。因此,改善人声录音和背景音乐的混音效果,对于提升用户的声音体验非常重要。
很多声音类APP的常规做法是,提供一个音量调节界面,用户在录制人声时手动调节人声录音和背景音乐的音量,然后混音获得一个人声录音和背景音乐听感舒适的混音效果。然而上述的混音调节方法,人为操作麻烦降低了用户体验。
发明内容
本申请提供了一种混音方法和装置,解决了现有的混音调节方法,人为操作麻烦降低了用户体验的技术问题。
有鉴于此,本申请第一方面提供了一种混音方法,包括:
获取用于混音的人声录音和背景音乐;
对所述人声录音进行语音活动性检测,获取所述人声录音的第一能量;对所述背景音乐进行能量检测,获取所述背景音乐的第二能量;
根据预置人声录音系数计算公式,结合所述第一能量和所述第二能量,计算所述人声录音对应的人声录音系数;
根据预置背景音乐系数计算公式,结合所述第一能量和所述第二能量,计算所述背景音乐对应的背景音乐系数;
基于所述人声录音系数、所述背景音乐系数对所述人声录音和所述背景音乐进行混音,得到混音文件。
可选地,对所述人声录音进行语音活动性检测,获取所述人声录音的第一能量,具体包括:
对所述人声录音逐帧进行语音活动性检测,获取所述人声录音各帧的第一子能量;
根据所有所述第一子能量,计算所述人声录音的第一能量。
可选地,对所述背景音乐进行能量检测,获取所述背景音乐的第二能量,具体包括:
对所述背景音乐逐帧进行能量检测,获取所述背景音乐各帧的第二子能量;
根据所有所述第二子能量,计算所述背景音乐的第二能量。
可选地,预置人声录音系数计算公式为:
其中,coefv为人声录音系数,为第二能量,/>为第一能量。
可选地,预置背景音乐系数计算公式为:
其中,coefm为背景音乐系数,为第二能量,/>为第一能量。
可选地,基于所述人声录音系数、所述背景音乐系数对所述人声录音和所述背景音乐进行混音,得到混音文件,具体包括:
将所述人声录音系数和所述人声录音相乘,得到第一中间文件;
将所述背景音乐系数和所述背景音乐相乘,得到第二中间文件;
将所述第一中间文件和所述第二中间文件做波形叠加处理,得到叠加文件;
将所述叠加文件做饱和处理,得到混音文件。
可选地,,基于所述人声录音系数、所述背景音乐系数对所述人声录音和所述背景音乐进行混音,得到混音文件,之前还包括:
当判断到所述人声录音系数小于预置系数阈值时,将所述人声录音系数配置为所述预置系数阈值后执行后续步骤;
当判断到所述背景音乐系数小于预置系数阈值时,将所述背景音乐系数配置为所述预置系数阈值后执行后续步骤。
可选地,对所述人声录音进行语音活动性检测,获取所述人声录音的第一能量,之前还包括:
通过自动增益控制将所述人声录音的音量调整至预置音量范围内。
可选地,通过自动增益控制将所述人声录音的音量调整至预置音量范围内,之前还包括:
对所述人声录音进行降噪处理。
本申请第二方面提供了一种混音装置,包括:
第一获取单元,用于获取用于混音的人声录音和背景音乐;
第二获取单元,用于对所述人声录音进行语音活动性检测,获取所述人声录音的第一能量;
第三获取单元,用于对所述背景音乐进行能量检测,获取所述背景音乐的第二能量;
第一计算单元,用于根据预置人声录音系数计算公式,结合所述第一能量和所述第二能量,计算所述人声录音对应的人声录音系数;
第二计算单元,用于根据预置背景音乐系数计算公式,结合所述第一能量和所述第二能量,计算所述背景音乐对应的背景音乐系数;
混音单元,用于基于所述人声录音系数、所述背景音乐系数对所述人声录音和所述背景音乐进行混音,得到混音文件。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请提供了一种混音方法,包括:获取用于混音的人声录音和背景音乐;对人声录音进行语音活动性检测,获取人声录音的第一能量;对背景音乐进行能量检测,获取背景音乐的第二能量;根据预置人声录音系数计算公式,结合第一能量和第二能量,计算人声录音对应的人声录音系数;根据预置背景音乐系数计算公式,结合第一能量和第二能量,计算背景音乐对应的背景音乐系数;基于人声录音系数、背景音乐系数对人声录音和背景音乐进行混音,得到混音文件。
本申请中,在利用背景音乐和人声录音进行混音时,根据语音活动性检测获取人声录音的第一能量、能量检测获取背景音乐的第二能量,然后根据第一能量和第二能量计算混音时,人声录音对应的人声录音系数、背景音乐对应的背景音乐系数,最后便可基于人声录音系数、背景音乐系数对人声录音和背景音乐进行混音,得到混音文件,根据检测的人声录音和背景音乐的音频特征自动调节二者混音时的音量比例(各自对应的系数),在听感上进行融合,无需用户手动调节,提升了用户体验,从而解决了现有的混音调节方法,人为操作麻烦降低了用户体验的技术问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例中一种混音方法的实施例一的流程示意图;
图2为本申请实施例中一种混音方法的实施例二的流程示意图;
图3为本申请实施例中一种自动增益控制的流程示意图;
图4为本申请实施例中一种混音装置的实施例的结构示意图。
具体实施方式
本申请实施例提供了一种混音方法和装置,解决了现有的混音调节方法,人为操作麻烦降低了用户体验的技术问题。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,本申请实施例中一种混音方法的实施例一的流程示意图。
本实施例中的一种混音方法,包括:
步骤101、获取用于混音的人声录音和背景音乐。
可以理解的是,获取人声录音可以是通过麦克风等进行采集,在此不做具体限定和赘述。
步骤102、对人声录音进行语音活动性检测,获取人声录音的第一能量。
步骤103、对背景音乐进行能量检测,获取背景音乐的第二能量。
步骤104、根据预置人声录音系数计算公式,结合第一能量和第二能量,计算人声录音对应的人声录音系数。
步骤105、根据预置背景音乐系数计算公式,结合第一能量和第二能量,计算背景音乐对应的背景音乐系数。
步骤106、基于人声录音系数、背景音乐系数对人声录音和背景音乐进行混音,得到混音文件。
本实施例中,在利用背景音乐和人声录音进行混音时,根据语音活动性检测获取人声录音的第一能量、能量检测获取背景音乐的第二能量,然后根据第一能量和第二能量计算混音时,人声录音对应的人声录音系数、背景音乐对应的背景音乐系数,最后便可基于人声录音系数、背景音乐系数对人声录音和背景音乐进行混音,得到混音文件,根据检测的人声录音和背景音乐的音频特征自动调节二者混音时的音量比例(各自对应的系数),在听感上进行融合,无需用户手动调节,提升了用户体验,从而解决了现有的混音调节方法,人为操作麻烦降低了用户体验的技术问题。
以上为本申请实施例提供的一种混音方法的实施例一,以下为本申请实施例提供的一种混音方法的实施例二。
请参阅图2,本申请实施例中一种混音方法的实施例二的流程示意图。
本实施例中的一种混音方法,包括:
步骤201、获取用于混音的人声录音和背景音乐。
需要说明的是,步骤201的描述与实施例一中的步骤101的描述相同,具体可以参见上述步骤101的描述,在此不再赘述。
步骤202、对人声录音进行降噪处理。
降噪处理是为了降低人声录音中的噪声含量,减少听觉疲劳,改善听感。可以理解的是,降噪处理的方法可以是现有的多种方法,在此不再限定和赘述。
步骤203、通过自动增益控制将人声录音的音量调整至预置音量范围内。
自动增益控制是为了将人声录音的音量调整到一个合适的音量范围,使人声录音不会过大或过小,为后面混音做准备,是最终生成听感舒适的混音文件的预处理。
通过自动增益控制将人声录音的音量调整至预置音量范围内的具体实施流程如图3所示,先对人声录音的各帧进行子帧能量计算,然后对各帧进行语音活动性检测,接着计算衰减因子跟踪子帧能量包络,接着计算子帧增益,再接着进行小信号子帧增益矫正和防止增益过大削波,最后将增益施加到输入信号后,便可输出调节到一个合适的音量范围的人声录音。
步骤204、对人声录音逐帧进行语音活动性检测,获取人声录音各帧的第一子能量。
可以理解的是,第n帧的第一子能量计算公式为:
其中,xi是音频采样点i的幅值,L是帧长(采样点数)。
步骤205、根据所有第一子能量,计算人声录音的第一能量。
可以理解的是,本实施例中的第一能量为平均能量,具体的计算公式为:
其中,N是总帧数,例如10s长的语音,10ms作为一帧,一共有N=1000帧。
可以理解的是,第一能量也可以是第一子能量的总和,也可以是第一子能量中的最大值、最小值等,具体本领域技术人员可以根据自己的需要设置,在此不再一一赘述。
步骤206、对背景音乐逐帧进行能量检测,获取背景音乐各帧的第二子能量。
需要说明的是,步骤206的描述与步骤204的描述相似,具体可以参见上述步骤204的描述,在.此不再赘述。
步骤207、根据所有第二子能量,计算背景音乐的第二能量。
需要说明的是,步骤207的描述与步骤205的描述相似,具体可以参见上述步骤205的描述,在.此不再赘述。
可以理解的是,第一能量和第二能量的设置为同一类型的数据,即第一能量为第一子能量总和时,第二能量也为对应的总和。
步骤208、根据预置人声录音系数计算公式,结合第一能量和第二能量,计算人声录音对应的人声录音系数。
预置人声录音系数计算公式为:
其中,coefv为人声录音系数,为第二能量,/>为第一能量。
步骤209、根据预置背景音乐系数计算公式,结合第一能量和第二能量,计算背景音乐对应的背景音乐系数。
预置背景音乐系数计算公式为:
其中,coefm为背景音乐系数,为第二能量,/>为第一能量。
步骤210、当判断到人声录音系数小于预置系数阈值时,将人声录音系数配置为预置系数阈值执行后续步骤。
本实施例中,为了混音效果更好,对于过小的人声录音系数做下限保护:
可以理解的是,上述预置系数阈值0.1仅仅为一种示意性的举例说明,本领域技术人员可以根据需要设置其他的数值,在此不做限定和赘述。
步骤211、当判断到背景音乐系数小于预置系数阈值时,将背景音乐系数配置为预置系数阈值后执行后续步骤。
本实施例中,为了混音效果更好,对于过小的背景音乐系数做下限保护:
可以理解的是,上述预置系数阈值0.1仅仅为一种示意性的举例说明,本领域技术人员可以根据需要设置其他的数值,在此不做限定和赘述。
步骤212、将人声录音系数和人声录音相乘,得到第一中间文件。
步骤213、将背景音乐系数和背景音乐相乘,得到第二中间文件。
步骤214、将第一中间文件和第二中间文件做波形叠加处理,得到叠加文件。
步骤215、将叠加文件做饱和处理,得到混音文件。
本实施例中,在利用背景音乐和人声录音进行混音时,根据语音活动性检测获取人声录音的第一能量、能量检测获取背景音乐的第二能量,然后根据第一能量和第二能量计算混音时,人声录音对应的人声录音系数、背景音乐对应的背景音乐系数,最后便可基于人声录音系数、背景音乐系数对人声录音和背景音乐进行混音,得到混音文件,根据检测的人声录音和背景音乐的音频特征自动调节二者混音时的音量比例(各自对应的系数),在听感上进行融合,无需用户手动调节,提升了用户体验,从而解决了现有的混音调节方法,人为操作麻烦降低了用户体验的技术问题。
以上为本申请实施例提供的一种混音方法的实施例二,以下为本申请实施例提供的一种混音装置的实施例,请参阅图4。
请参阅图4,本申请实施例中一种混音装置的实施例的结构示意图。
本实施例中的一种混音装置,包括:
第一获取单元401,用于获取用于混音的人声录音和背景音乐;
第二获取单元402,用于对人声录音进行语音活动性检测,获取人声录音的第一能量;
第三获取单元403,用于对背景音乐进行能量检测,获取背景音乐的第二能量;
第一计算单元404,用于根据预置人声录音系数计算公式,结合第一能量和第二能量,计算人声录音对应的人声录音系数;
第二计算单元405,用于根据预置背景音乐系数计算公式,结合第一能量和第二能量,计算背景音乐对应的背景音乐系数;
混音单元406,用于基于人声录音系数、背景音乐系数对人声录音和背景音乐进行混音,得到混音文件。
本实施例中,在利用背景音乐和人声录音进行混音时,根据语音活动性检测获取人声录音的第一能量、能量检测获取背景音乐的第二能量,然后根据第一能量和第二能量计算混音时,人声录音对应的人声录音系数、背景音乐对应的背景音乐系数,最后便可基于人声录音系数、背景音乐系数对人声录音和背景音乐进行混音,得到混音文件,根据检测的人声录音和背景音乐的音频特征自动调节二者混音时的音量比例(各自对应的系数),在听感上进行融合,无需用户手动调节,提升了用户体验,从而解决了现有的混音调节方法,人为操作麻烦降低了用户体验的技术问题。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个待安装电网网络,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请个实施例中的功能单元可以集成在一个处理单元中,也可以是个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。

Claims (9)

1.一种混音方法,其特征在于,包括:
获取用于混音的人声录音和背景音乐;
对所述人声录音进行语音活动性检测,获取所述人声录音的第一能量;
对所述背景音乐进行能量检测,获取所述背景音乐的第二能量;
根据预置人声录音系数计算公式,结合所述第一能量和所述第二能量,计算所述人声录音对应的人声录音系数;
根据预置背景音乐系数计算公式,结合所述第一能量和所述第二能量,计算所述背景音乐对应的背景音乐系数;
基于所述人声录音系数、所述背景音乐系数对所述人声录音和所述背景音乐进行混音,得到混音文件;
所述预置人声录音系数计算公式为:
其中,coefv为所述人声录音系数,为所述第二能量,/>为所述第一能量。
2.根据权利要求1所述的混音方法,其特征在于,对所述人声录音进行语音活动性检测,获取所述人声录音的第一能量,具体包括:
对所述人声录音逐帧进行语音活动性检测,获取所述人声录音各帧的第一子能量;
根据所有所述第一子能量,计算所述人声录音的第一能量。
3.根据权利要求1所述的混音方法,其特征在于,对所述背景音乐进行能量检测,获取所述背景音乐的第二能量,具体包括:
对所述背景音乐逐帧进行能量检测,获取所述背景音乐各帧的第二子能量;
根据所有所述第二子能量,计算所述背景音乐的第二能量。
4.根据权利要求1所述的混音方法,其特征在于,预置背景音乐系数计算公式为:
其中,coefm为背景音乐系数,为第二能量,/>为第一能量。
5.根据权利要求1所述的混音方法,其特征在于,基于所述人声录音系数、所述背景音乐系数对所述人声录音和所述背景音乐进行混音,得到混音文件,具体包括:
将所述人声录音系数和所述人声录音相乘,得到第一中间文件;
将所述背景音乐系数和所述背景音乐相乘,得到第二中间文件;
将所述第一中间文件和所述第二中间文件做波形叠加处理,得到叠加文件;
将所述叠加文件做饱和处理,得到混音文件。
6.根据权利要求1所述的混音方法,其特征在于,基于所述人声录音系数、所述背景音乐系数对所述人声录音和所述背景音乐进行混音,得到混音文件,之前还包括:
当判断到所述人声录音系数小于预置系数阈值时,将所述人声录音系数配置为所述预置系数阈值后执行后续步骤;
当判断到所述背景音乐系数小于预置系数阈值时,将所述背景音乐系数配置为所述预置系数阈值后执行后续步骤。
7.根据权利要求1所述的混音方法,其特征在于,对所述人声录音进行语音活动性检测,获取所述人声录音的第一能量,之前还包括:
通过自动增益控制将所述人声录音的音量调整至预置音量范围内。
8.根据权利要求7所述的混音方法,其特征在于,通过自动增益控制将所述人声录音的音量调整至预置音量范围内,之前还包括:
对所述人声录音进行降噪处理。
9.一种混音装置,其特征在于,包括:
第一获取单元,用于获取用于混音的人声录音和背景音乐;
第二获取单元,用于对所述人声录音进行语音活动性检测,获取所述人声录音的第一能量;
第三获取单元,用于对所述背景音乐进行能量检测,获取所述背景音乐的第二能量;
第一计算单元,用于根据预置人声录音系数计算公式,结合所述第一能量和所述第二能量,计算所述人声录音对应的人声录音系数;
第二计算单元,用于根据预置背景音乐系数计算公式,结合所述第一能量和所述第二能量,计算所述背景音乐对应的背景音乐系数;
混音单元,用于基于所述人声录音系数、所述背景音乐系数对所述人声录音和所述背景音乐进行混音,得到混音文件;
所述预置人声录音系数计算公式为:
其中,coefv为所述人声录音系数,为所述第二能量,/>为所述第一能量。
CN202011375166.3A 2020-11-30 2020-11-30 一种混音方法和装置 Active CN112489664B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011375166.3A CN112489664B (zh) 2020-11-30 2020-11-30 一种混音方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011375166.3A CN112489664B (zh) 2020-11-30 2020-11-30 一种混音方法和装置

Publications (2)

Publication Number Publication Date
CN112489664A CN112489664A (zh) 2021-03-12
CN112489664B true CN112489664B (zh) 2023-08-01

Family

ID=74937485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011375166.3A Active CN112489664B (zh) 2020-11-30 2020-11-30 一种混音方法和装置

Country Status (1)

Country Link
CN (1) CN112489664B (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0555200U (ja) * 1991-12-28 1993-07-23 株式会社ケンウッド アシストボーカル回路
CN101079601A (zh) * 2006-05-26 2007-11-28 佛山市顺德区顺达电脑厂有限公司 可携式信息处理装置的音量调整系统及其方法
CN103559876B (zh) * 2013-11-07 2016-04-20 科大讯飞股份有限公司 音效处理方法及系统
CN105405448B (zh) * 2014-09-16 2019-09-03 科大讯飞股份有限公司 一种音效处理方法及装置
CN109828740B (zh) * 2019-01-21 2021-06-08 北京小唱科技有限公司 音频调节方法及装置
CN111179947B (zh) * 2020-01-06 2022-09-09 广州欢聊网络科技有限公司 一种音频信号处理的方法及装置

Also Published As

Publication number Publication date
CN112489664A (zh) 2021-03-12

Similar Documents

Publication Publication Date Title
James et al. Adaptive dynamic range optimization for cochlear implants: a preliminary study
Hersbach et al. Combining directional microphone and single-channel noise reduction algorithms: a clinical evaluation in difficult listening conditions with cochlear implant users
JP2021057907A (ja) ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整
JP2023024570A (ja) 多様な再生環境のためのダイナミックレンジ制御
RU2520420C2 (ru) Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала
Mauger et al. Perceptually optimized gain function for cochlear implant signal-to-noise ratio based noise reduction
Souza et al. Exploring the limits of frequency lowering
US9431982B1 (en) Loudness learning and balancing system
Moore et al. Comparison of the CAM2 and NAL-NL2 hearing aid fitting methods
JP7266916B2 (ja) ラウドネスレベルを制御するオーディオ信号処理方法及び装置
Khing et al. The effect of automatic gain control structure and release time on cochlear implant speech intelligibility
WO2019033943A1 (zh) 音量调节方法、装置、移动终端及存储介质
James et al. An investigation of input level range for the nucleus 24 cochlear implant system: speech perception performance, program preference, and loudness comfort ratings
Donaldson et al. Effects of presentation level on phoneme and sentence recognition in quiet by cochlear implant listeners
Sato et al. Acceptable range of speech level in noisy sound fields for young adults and elderly persons
Rana et al. Effect of audibility on better-ear glimpsing as a function of frequency in normal-hearing and hearing-impaired listeners
Dingemanse et al. Effects of a transient noise reduction algorithm on speech intelligibility in noise, noise tolerance and perceived annoyance in cochlear implant users
Brochier et al. The effect of presentation level and stimulation rate on speech perception and modulation detection for cochlear implant users
CN112489664B (zh) 一种混音方法和装置
Dingemanse et al. Optimising the effect of noise reduction algorithm ClearVoice in cochlear implant users by increasing the maximum comfort levels
Zakis et al. Environmental noise reduction configuration: Effects on preferences, satisfaction, and speech understanding
WO2024001463A1 (zh) 音频信号的处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品
Brons et al. Detection threshold for sound distortion resulting from noise reduction in normal-hearing and hearing-impaired listeners
Saba et al. Formant priority channel selection for an “n-of-m” sound processing strategy for cochlear implants
Lai et al. Effects of adaptation rate and noise suppression on the intelligibility of compressed-envelope based speech

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant