CN116386650A - 一种基于应用程序的音频增益方法及装置 - Google Patents
一种基于应用程序的音频增益方法及装置 Download PDFInfo
- Publication number
- CN116386650A CN116386650A CN202310324960.2A CN202310324960A CN116386650A CN 116386650 A CN116386650 A CN 116386650A CN 202310324960 A CN202310324960 A CN 202310324960A CN 116386650 A CN116386650 A CN 116386650A
- Authority
- CN
- China
- Prior art keywords
- gain
- audio
- application program
- preset
- audio file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000005070 sampling Methods 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 8
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Control Of Amplification And Gain Control (AREA)
Abstract
本发明公开了一种基于应用程序的音频增益方法及装置,该方法包括:通过预设的应用程序读取目标音频文件的增益阈值及增益时长,并根据所述增益阈值及所述增益时长获得所述目标音频文件的增益周期,同时根据所述应用程序中预设的音频解码方式对所述目标音频文件进行解码,持续获得所述目标音频文件对应的第一音频,最后根据所述增益周期,通过预设在所述应用程序中的自动增益方案对所述持续获得的第一音频进行持续增益直至所述增益达到所述增益阈值,获得增益后的第二音频,提高音频增益效果及用户听感体验。
Description
技术领域
本发明涉及音频处理技术领域,尤其涉及一种基于应用程序的音频增益方法及装置。
背景技术
当前,村村响广播已经是十分广泛的应用,利用网络传输音频流,可以实现实时广播,随着音频广播的不断发展,音频数据处理技术在一定程度上也得到了相应的提高。对人们的听觉感受有着较大的影响。
现有技术中,村村响广播的扩声喇叭的播放方式,是直接将音频流根据设定的值,直接放大输出,这样在短时间增益直接到达峰值,对人们的听觉感受有着较大的影响。特别对于有突发心脏病的人们有惊吓休克的危险。
发明内容
本发明公开了一种基于应用程序的音频增益方法及装置,可有效提升音频音量增益,提高用户的使用感受。
为了实现上述目的,第一方面,本发明公开了一种基于应用程序的音频增益方法,包括:
通过预设的应用程序读取目标音频文件的增益阈值及增益时长,并根据所述增益阈值及所述增益时长获得所述目标音频文件的增益周期;
根据所述应用程序中预设的音频解码方式对所述目标音频文件进行解码,持续获得所述目标音频文件对应的第一音频;
根据所述增益周期,通过预设在所述应用程序中的自动增益方案对所述持续获得的第一音频进行持续增益直至所述增益达到所述增益阈值,获得增益后的第二音频。
本发明公开了一种音频音量增益方式,首先通过预设的应用程序中包含的音频增益方式获得目标音频文件对应的音频增益时长及音频增益区间,以使根据所述增益时长及增益阈值获得所述目标音频文件的增益周期,进而根据所述增益周期对所述目标音频文件进行周期性持续不断的增益,接着对所述目标音频文件进行解码,获得所述音频文件对应的第一音频,以使根据所述增益周期对所述第一音频进行增益处理,包括利用所述增益方案中的增益周期及所述增益方案中的增益阈值对所述第一音频进行持续增益,直至达到所述增益区间,获得增益后的第二音频,实现音频音量的持续增益,有效的进行音频增益,本发明首先通过预设的增益方式获得目标音频文件的定制增益方案,满足不同音频文件的增益要求,接着利用所述定制的增益方案中的增益周期不断的提升对所述第一音频的增益,直至所述音频的增益达到阈值,实现所述音频音量的循循渐进的动态增益,输出增益后的第二音频,以使用户获得更好的听感,提高用户的使用体验。
作为优选例子,在所述通过预设的应用程序读取目标音频文件的增益阈值及增益时长,具体包括:
通过读取所述应用程序中配置的文件获得所述应用程序上一次关闭时的第一增益值,或通过所述应用程序接收调整增益值指令数据包进而根据所述数据包获得第二增益值;
根据所述第一增益值或所述第二增益值,通过所述应用程序计算获得所述目标音频文件的增益阈值;
获取所述目标音频文件的采样率、所述目标音频文件中一个采样点占用的字节数及声卡一次播放一帧音频的采样点数量,并根据所述采样率、所述字节数及所述采样点数量,获得所述声卡播放每一帧音频的耗时;
根据所述耗时及预设的所述声卡播放的音频帧数,通过所述应用程序获得所述增益时长。
本发明通过读取应用程序的配置文件获得上一次关闭时的第一增益值,或通过应用程序接收增益值数据包,根据所述数据包获得目标音频文件的第二增益值,根据所述第一增益值及所述第二增益值,确定所述目标音频文件的增益阈值,以使得根据所述增益阈值进行增益,提高音频增益的效率,接着利用应用程序获得音频的增益时长,根据所述增益阈值及所述增益时长确定增益方案,以使进行音频的徇徇增益,提升音频增益的效果。
作为优选例子,在所述根据所述增益阈值及所述增益时长获得所述目标音频文件的增益周期,具体包括:
通过所述应用程序计算所述增益时长及所述增益阈值的比例,获得所述目标音频文件的增益周期。
本发明通过获得所述增益时长及增益阈值的比例,实现所述目标音频文件均匀的不断进行音频增益,提高音频的增益效果。
作为优选例子,在所述根据所述应用程序中预设的音频解码方式对所述目标音频文件进行解码,持续获得所述目标音频文件对应的第一音频,具体包括:
开启所述应用程序中预设的解码线程,根据预设的ffmpeg API对所述目标音频文件进行解码,获得所述目标音频文件对应的PCM数据;
根据所述PCM数据,通过预设的声卡持续播放所述PCM数据以使持续获得所述PCM数据对应的第一音频。
本发明通过所述应用程序对目标音频文件进行解码,并利用声卡播放解码后获得的数据,以使通过预设的声卡持续播放所述数据,便于后续利用获得的增益方案在所述数据播放过程中持续对所述数据进行增益。
作为优选例子,在所述通过预设在所述应用程序中的自动增益方案对所述持续获得的第一音频进行持续增益,具体包括:
根据所述增益周期,以使预设在所述应用程序中的IIC协议根据所述周期发送音频增益指令从小到大依次设置增益值;
根据所述从小到大设置的增益值对所述持续获得的第一音频进行持续增益,输出增益后的第二音频。
本发明根据获得的所述增益的周期,从小到大设置增益值,同时利用所述不断变大的增益值对所述持续获得的第一音频从开始到结尾持续的进行增益,以使所述第一音频的增益呈现慢慢变化的趋势,提高增益的效果,以使用户获得更好的听感体验。
第二方面,本发明公开了一种基于应用程序的音频增益装置,包括读取模块、解码模块及增益模块;
所述读取模块用于通过预设的应用程序读取目标音频文件的增益阈值及增益时长,并根据所述增益阈值及所述增益时长获得所述目标音频文件的增益周期;
所述解码模块用于根据所述应用程序中预设的音频解码方式对所述目标音频文件进行解码,持续获得所述目标音频文件对应的第一音频;
所述增益模块用于根据所述增益周期,通过预设在所述应用程序中的自动增益方案对所述持续获得的第一音频进行持续增益直至所述增益达到所述增益阈值,获得增益后的第二音频。
本发明公开的一种基于应用程序的音频增益装置,通过预设的应用程序中包含的音频增益方式获得目标音频文件对应的音频增益时长及音频增益区间,以使根据所述增益时长及增益阈值获得所述目标音频文件的增益周期,进而根据所述增益周期对所述目标音频文件进行周期性持续不断的增益,接着对所述目标音频文件进行解码,获得所述音频文件对应的第一音频,以使根据所述增益周期对所述第一音频进行增益处理,包括利用所述增益方案中的增益周期及所述增益方案中的增益阈值对所述第一音频进行持续增益,直至达到所述增益区间,获得增益后的第二音频,实现音频音量的持续增益,有效的进行音频增益,本发明首先通过预设的增益方式获得目标音频文件的定制增益方案,满足不同音频文件的增益要求,接着利用所述定制的增益方案中的增益周期不断的提升对所述第一音频的增益,直至所述音频的增益达到阈值,实现所述音频音量的循循渐进的动态增益,输出增益后的第二音频,以使用户获得更好的听感,提高用户的使用体验。
作为优选例子,在所述读取模块包括阈值单元、时长单元及周期单元;
所述阈值单元用于通过读取所述应用程序中配置的文件获得所述应用程序上一次关闭时的第一增益值,或通过所述应用程序接收调整增益值指令数据包进而根据所述数据包获得第二增益值;根据所述第一增益值或所述第二增益值,通过所述应用程序计算获得所述目标音频文件的增益阈值;
所述时长单元用于获取所述目标音频文件的采样率、所述目标音频文件中一个采样点占用的字节数及声卡一次播放一帧音频的采样点数量,并根据所述采样率、所述字节数及所述采样点数量,获得所述声卡播放每一帧音频的耗时;根据所述耗时及预设的所述声卡播放的音频帧数,通过所述应用程序获得所述增益时长;
所述周期单元用于通过所述应用程序计算所述增益时长及所述增益阈值的比例,获得所述目标音频文件的增益周期。
本发明通过读取应用程序的配置文件获得上一次关闭时的第一增益值,或通过应用程序接收增益值数据包,根据所述数据包获得目标音频文件的第二增益值,根据所述第一增益值及所述第二增益值,确定所述目标音频文件的增益阈值,以使得根据所述增益阈值进行增益,提高音频增益的效率,接着利用应用程序获得音频的增益时长,根据所述增益阈值及所述增益时长确定增益方案,以使进行音频的徇徇增益,提升音频增益的效果。
作为优选例子,在所述解码模块包括解码单元及播放单元;
所述解码单元用于开启所述应用程序中预设的解码线程,根据预设的ffmpeg API对所述目标音频文件进行解码,获得所述目标音频文件对应的PCM数据;
所述播放单元用于根据所述PCM数据,通过预设的声卡持续播放所述PCM数据以使持续获得所述PCM数据对应的第一音频。
本发明通过所述应用程序对目标音频文件进行解码,并利用声卡播放解码后获得的数据,以使通过预设的声卡持续播放所述数据,便于后续利用获得的增益方案在所述数据播放过程中持续对所述数据进行增益。
作为优选例子,在所述增益模块包括设置单元及增益单元;
所述设置单元用于根据所述增益周期确定所述增益的周期,以使预设在所述应用程序中的IIC协议根据所述周期发送音频增益指令从小到大依次设置增益值;
所述增益单元用于根据所述从小到大设置的增益值对所述持续获得的第一音频进行持续增益,输出增益后的第二音频。
本发明根据获得的所述增益的增益周期为周期,从小到大设置增益值,同时利用所述不断变大的增益值对所述持续获得的第一音频从开始到结尾持续的进行增益,以使所述第一音频的增益呈现慢慢变化的趋势,提高增益的效果,以使用户获得更好的听感体验。
第三方面,本发明公开了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面所述的一种基于应用程序的音频增益方法。
附图说明
图1:为本发明实施例提供的一种基于应用程序的音频增益方法的流程示意图;
图2:为本发明实施例提供的一种基于应用程序的音频增益装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例提供了一种基于应用程序的音频增益方法,该方法的具体实施流程请参照图1,主要包括步骤101至步骤103,所述步骤主要包括:
步骤101:通过预设的应用程序读取目标音频文件的增益阈值及增益时长,并根据所述增益阈值及所述增益时长获得所述目标音频文件的增益周期。
在本实施例中,该步骤主要包括:通过读取所述应用程序中配置的文件获得所述应用程序一次关闭时的第一增益值,或通过所述应用程序接收调整增益值指令数据包进而根据所述数据包获得第二增益值;根据所述第一增益值或所述第二增益值,通过所述应用程序计算获得所述目标音频文件的增益阈值;获取所述目标音频文件的采样率、所述目标音频文件中一个采样点占用的字节数及声卡一次播放一帧音频的采样点数量,并根据所述采样率、所述字节数及所述采样点数量,获得所述声卡播放每一帧音频的耗时;根据所述耗时及预设的所述声卡播放的音频帧数,通过所述应用程序获得所述增益时长;通过所述应用程序计算所述增益时长及所述增益阈值的比例,获得所述目标音频文件的增益周期。
在本实施例中,该步骤具体为:启动预设的应用程序,所述应用程序通过读取配置文件得出上一次关闭程序时的第一增益值即增益值now,从而所述应用程序得出本次增益的区间为[0~now],或所述应用程序通过网络接收一个调整增益值指令数据包,根据所述数据包获得第二增益值即设置一个新的增益值new,则所述应用程序得出增益的区间为[now~new]或[new~now],根据所述增益值now或所述增益值new确定本次增益的增益阈值,同时设置音频PCM的采样率为rate,一个采样点占用的字节数为byte,声卡一次播放一帧的数据为N个采样点,那么通过所述应用程序计算获得CPU声卡播放一帧所用的时间(毫秒)为:
(N*1000)/(rate*byte)=播放一帧所用的时间(ms)
在本实施例中,所述应用程序预设增益时长为CPU声卡播放100帧所用的耗时,进而计算出益延时方案,若所述增益区间为[0~now],即所述音频未进行增益且未接受到增益调节指令,则增益的阈值为now且每增益一次的增益周期(毫秒)的计算公式为:
(播放一帧所用的时间*100)/now=每增益一次的延时(ms)
若所述音频音频未进行增益且接收到增益调节指令对应的增益的阈值为new,则每增益一次的增益周期(毫秒)的计算公式为:
(播放一帧所用的时间*100)/new=每增益一次的延时(ms)
若所述音频已经在增益的过程中,接收到增益的调节指令,即开始增益时获得上一次的增益阈值为now,接收到的增益的调节指令对应的增益值为new,则判断所述now与new的大小,若所述now大于所述new,则所述增益的区间为[now~new],则所述每增益一次的增益周期(毫秒)的计算公式为:
(播放一帧所用的时间)/|(now-new)|=每增益一次的延时(ms)
若所述new大于所述now,则所述增益的区间为[new~now],则所述每增益一次的增益周期(毫秒)的计算公式为:
(播放一帧所用的时间)/|(new-now)|=每增益一次的延时(ms)
本步骤通过读取应用程序的配置文件获得上一次关闭时的第一增益值,或通过应用程序接收增益值数据包,根据所述数据包获得目标音频文件的第二增益值,根据所述第一增益值及所述第二增益值,确定所述目标音频文件的增益阈值,以使得根据所述增益阈值进行增益,提高音频增益的效率,接着利用应用程序获得音频的增益时长,根据所述增益阈值及所述增益时长确定增益方案,再通过获得所述增益时长及增益阈值的比例,实现所述目标音频文件均匀的不断进行音频增益,提高音频的增益效果。
步骤102:根据所述应用程序中预设的音频解码方式对所述目标音频文件进行解码,持续获得所述目标音频文件对应的第一音频。
在本实施例中,该步骤主要包括:开启所述应用程序中预设的解码线程,根据预设的ffmpeg API对所述目标音频文件进行解码,获得所述目标音频文件对应的PCM数据;根据所述PCM数据,通过预设的声卡持续播放所述PCM数据以使持续获得所述PCM数据对应的第一音频。
在本实施例中,该步骤具体为:在目标音频文件到达的时候,应用程序启动自动增益轮询线程及开启解码线程,利用所述解码线程对目标音频文件进行解码,通过ffmpegAPI对目标音频文件进行解码获得PCM数据,再通过CPU声卡播放这些PCM数据输出第一音频。
该步骤通过所述应用程序对目标音频文件进行解码,并利用声卡播放解码后获得的数据,以使通过预设的声卡持续播放所述数据,便于后续利用获得的增益方案在所述数据播放过程中持续对所述数据进行增益。
步骤103:根据所述增益周期,通过预设在所述应用程序中的自动增益方案对所述持续获得的第一音频进行持续增益直至所述增益达到所述增益阈值,获得增益后的第二音频。
在本实施例中,该步骤主要包括:根据所述增益周期,通过预设在所述应用程序中的IIC协议根据所述增益周期发送音频增益指令从小到大依次设置增益值;根据所述从小到大设置的增益值对所述持续获得的第一音频依次进行持续增益,输出增益后的第二音频。
在本实施例中,该步骤具体为:在所述通过CPU声卡播放所述PCM数据输出第一音频的过程中,所述应用程序利用所述启动的自动增益轮询线程通过IIC发送音频增益指令从小到大设置增益值,所述增益值的增益阈值为now或new,根据所述获得的增益周期对所述正在播放的第一音频进行周期性持续增益,直到所述增益值到达所述增益阈值,获得增益后的第二音频。
该步骤根据获得的所述增益的周期,从小到大设置增益值,同时利用所述不断变大的增益值对所述持续获得的第一音频从开始到结尾持续的进行增益,以使所述第一音频的增益呈现慢慢变化的趋势,提高增益的效果,以使用户获得更好的听感体验。
本实施例另外提供了一种基于应用程序的音频增益装置,包括读取模块201、解码模块202及增益模块203。
所述读取模块201用于通过预设的应用程序读取目标音频文件的增益阈值及增益时长,并根据所述增益阈值及所述增益时长获得所述目标音频文件的增益周期。
所述解码模块202用于根据所述应用程序中预设的音频解码方式对所述目标音频文件进行解码,持续获得所述目标音频文件对应的第一音频。
所述增益模块203用于根据所述增益周期,通过预设在所述应用程序中的自动增益方案对所述持续获得的第一音频进行持续增益直至所述增益达到所述增益阈值,获得增益后的第二音频。
在本实施例中,所述读取模块201包括阈值单元、时长单元及周期单元;
所述阈值单元用于通过读取所述应用程序中配置的文件获得所述应用程序上一次关闭时的第一增益值,或通过所述应用程序接收调整增益值指令数据包进而根据所述数据包获得第二增益值;根据所述第一增益值或所述第二增益值,通过所述应用程序计算获得所述目标音频文件的增益阈值;
所述时长单元用于获取所述目标音频文件的采样率、所述目标音频文件中一个采样点占用的字节数及声卡一次播放一帧音频的采样点数量,并根据所述采样率、所述字节数及所述采样点数量,获得所述声卡播放每一帧音频的耗时;根据所述耗时及预设的所述声卡播放的音频帧数,通过所述应用程序获得所述增益时长;
所述周期单元用于通过所述应用程序计算所述增益时长及所述增益阈值的比例,获得所述目标音频文件的增益周期。
在本实施例中,所述解码模块202包括解码单元及播放单元。
所述解码单元用于开启所述应用程序中预设的解码线程,根据预设的ffmpeg API对所述目标音频文件进行解码,获得所述目标音频文件对应的PCM数据。
所述播放单元用于根据所述PCM数据,通过预设的声卡持续播放所述PCM数据以使持续获得所述PCM数据对应的第一音频。
在本实施例中,所述增益模块203包括设置单元及增益单元。
所述设置单元用于根据所述增益周期,以使预设在所述应用程序中的IIC协议根据所述增益周期发送音频增益指令从小到大依次设置增益值。
所述增益单元用于根据所述从小到大设置的增益值对所述持续获得的第一音频依次进行持续增益,输出增益后的第二音频。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如本发明实施例所述的一种基于应用程序的音频增益方法。
本发明实施例公开的一种音频音量增益方式及装置,首先通过预设的应用程序中包含的音频增益方式获得目标音频文件对应的音频增益时长及音频增益区间,以使根据所述增益时长及增益阈值获得所述目标音频文件的增益周期,进而根据所述增益周期对所述目标音频文件进行周期性持续不断的增益,接着对所述目标音频文件进行解码,获得所述音频文件对应的第一音频,以使根据所述增益周期对所述第一音频进行增益处理,包括利用所述增益方案中的增益周期及所述增益方案中的增益阈值对所述第一音频进行持续增益,直至达到所述增益区间,获得增益后的第二音频,实现音频音量的持续增益,有效的进行音频增益,本发明首先通过预设的增益方式获得目标音频文件的定制增益方案,满足不同音频文件的增益要求,接着利用所述定制的增益方案中的增益周期不断的提升对所述第一音频的增益,直至所述音频的增益达到阈值,实现所述音频音量的循循渐进的动态增益,输出增益后的第二音频,以使用户获得更好的听感,提高用户的使用体验。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于应用程序的音频增益方法,其特征在于,包括:
通过预设的应用程序读取目标音频文件的增益阈值及增益时长,并根据所述增益阈值及所述增益时长获得所述目标音频文件的增益周期;
根据所述应用程序中预设的音频解码方式对所述目标音频文件进行解码,持续获得所述目标音频文件对应的第一音频;
根据所述增益周期,通过预设在所述应用程序中的自动增益方案对所述持续获得的第一音频进行持续增益直至所述增益达到所述增益阈值,获得增益后的第二音频。
2.如权利要求1所述的一种基于应用程序的音频增益方法,其特征在于,所述通过预设的应用程序读取目标音频文件的增益阈值及增益时长,具体包括:
通过读取所述应用程序中配置的文件获得所述应用程序上一次关闭时的第一增益值,或通过所述应用程序接收调整增益值指令数据包进而根据所述数据包获得第二增益值;
根据所述第一增益值或所述第二增益值,通过所述应用程序计算获得所述目标音频文件的增益阈值;
获取所述目标音频文件的采样率、所述目标音频文件中一个采样点占用的字节数及声卡一次播放一帧音频的采样点数量,并根据所述采样率、所述字节数及所述采样点数量,获得所述声卡播放每一帧音频的耗时;
根据所述耗时及预设的所述声卡播放的音频帧数,通过所述应用程序获得所述增益时长。
3.如权利要求1所述的一种基于应用程序的音频增益方法,其特征在于,所述根据所述增益阈值及所述增益时长获得所述目标音频文件的增益周期,具体包括:
通过所述应用程序计算所述增益时长及所述增益阈值的比例,获得所述目标音频文件的增益周期。
4.如权利要求1所述的一种基于应用程序的音频增益方法,其特征在于,所述根据所述应用程序中预设的音频解码方式对所述目标音频文件进行解码,持续获得所述目标音频文件对应的第一音频,具体包括:
开启所述应用程序中预设的解码线程,根据预设的ffmpeg API对所述目标音频文件进行解码,获得所述目标音频文件对应的PCM数据;
根据所述PCM数据,通过预设的声卡持续播放所述PCM数据以使持续获得所述PCM数据对应的第一音频。
5.如权利要求1所述的一种基于应用程序的音频增益方法,其特征在于,所述通过预设在所述应用程序中的自动增益方案对所述持续获得的第一音频进行持续增益,具体包括:
根据所述增益周期,通过预设在所述应用程序中的IIC协议根据所述增益周期进而发送音频增益指令从小到大依次设置增益值;
根据所述从小到大设置的增益值对所述持续获得的第一音频依次进行持续增益,输出增益后的第二音频。
6.一种基于应用程序的音频增益装置,其特征在于,包括读取模块、解码模块及增益模块;
所述读取模块用于通过预设的应用程序读取目标音频文件的增益阈值及增益时长,并根据所述增益阈值及所述增益时长获得所述目标音频文件的增益周期;
所述解码模块用于根据所述应用程序中预设的音频解码方式对所述目标音频文件进行解码,持续获得所述目标音频文件对应的第一音频;
所述增益模块用于根据所述增益周期,通过预设在所述应用程序中的自动增益方案对所述持续获得的第一音频进行持续增益直至所述增益达到所述增益阈值,获得增益后的第二音频。
7.如权利要求6所述的一种基于应用程序的音频增益装置,其特征在于,所述读取模块包括阈值单元、时长单元及周期单元;
所述阈值单元用于通过读取所述应用程序中配置的文件获得所述应用程序上一次关闭时的第一增益值,或通过所述应用程序接收调整增益值指令数据包进而根据所述数据包获得第二增益值;根据所述第一增益值或所述第二增益值,通过所述应用程序计算获得所述目标音频文件的增益阈值;
所述时长单元用于获取所述目标音频文件的采样率、所述目标音频文件中一个采样点占用的字节数及声卡一次播放一帧音频的采样点数量,并根据所述采样率、所述字节数及所述采样点数量,获得所述声卡播放每一帧音频的耗时;根据所述耗时及预设的所述声卡播放的音频帧数,通过所述应用程序获得所述增益时长;
所述周期单元用于通过所述应用程序计算所述增益时长及所述增益阈值的比例,获得所述目标音频文件的增益周期。
8.如权利要求6所述的一种基于应用程序的音频增益装置,其特征在于,所述解码模块包括解码单元及播放单元;
所述解码单元用于开启所述应用程序中预设的解码线程,根据预设的ffmpeg API对所述目标音频文件进行解码,获得所述目标音频文件对应的PCM数据;
所述播放单元用于根据所述PCM数据,通过预设的声卡持续播放所述PCM数据以使持续获得所述PCM数据对应的第一音频。
9.如权利要求6所述的一种基于应用程序的音频增益装置,其特征在于,所述增益模块包括设置单元及增益单元;
所述设置单元用于根据所述增益周期,以使预设在所述应用程序中的IIC协议根据所述增益周期发送音频增益指令从小到大依次设置增益值;
所述增益单元用于根据所述从小到大设置的增益值对所述持续获得的第一音频依次进行持续增益,输出增益后的第二音频。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述程序被处理器执行时实现如权利要求1至5任一项所述的一种基于应用程序的音频增益方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310324960.2A CN116386650A (zh) | 2023-03-29 | 2023-03-29 | 一种基于应用程序的音频增益方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310324960.2A CN116386650A (zh) | 2023-03-29 | 2023-03-29 | 一种基于应用程序的音频增益方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116386650A true CN116386650A (zh) | 2023-07-04 |
Family
ID=86980057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310324960.2A Pending CN116386650A (zh) | 2023-03-29 | 2023-03-29 | 一种基于应用程序的音频增益方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116386650A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1964187A (zh) * | 2005-11-11 | 2007-05-16 | 鸿富锦精密工业(深圳)有限公司 | 音量管理系统及方法 |
US20110121879A1 (en) * | 2009-11-25 | 2011-05-26 | C-Media Electronics Inc. | Method of automatic gain modulation and apparatus implementing the same |
CN102257728A (zh) * | 2008-10-17 | 2011-11-23 | 夏普株式会社 | 音频信号调节设备及音频信号调节方法 |
CN104683920A (zh) * | 2015-01-30 | 2015-06-03 | 惠州市德赛西威汽车电子有限公司 | 一种实现音量平滑升降的方法及装置 |
KR101892190B1 (ko) * | 2017-12-12 | 2018-10-04 | (주)인프라칩 | 시각장애인을 위한 스마트 안경 및 그 활용 방법 |
CN112669878A (zh) * | 2020-12-23 | 2021-04-16 | 北京声智科技有限公司 | 声音增益值的计算方法、装置和电子设备 |
-
2023
- 2023-03-29 CN CN202310324960.2A patent/CN116386650A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1964187A (zh) * | 2005-11-11 | 2007-05-16 | 鸿富锦精密工业(深圳)有限公司 | 音量管理系统及方法 |
CN102257728A (zh) * | 2008-10-17 | 2011-11-23 | 夏普株式会社 | 音频信号调节设备及音频信号调节方法 |
US20110121879A1 (en) * | 2009-11-25 | 2011-05-26 | C-Media Electronics Inc. | Method of automatic gain modulation and apparatus implementing the same |
CN104683920A (zh) * | 2015-01-30 | 2015-06-03 | 惠州市德赛西威汽车电子有限公司 | 一种实现音量平滑升降的方法及装置 |
KR101892190B1 (ko) * | 2017-12-12 | 2018-10-04 | (주)인프라칩 | 시각장애인을 위한 스마트 안경 및 그 활용 방법 |
CN112669878A (zh) * | 2020-12-23 | 2021-04-16 | 北京声智科技有限公司 | 声音增益值的计算方法、装置和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11227612B2 (en) | Audio frame loss and recovery with redundant frames | |
JP4621792B2 (ja) | 音質補正装置、音質補正方法及び音質補正用プログラム | |
CN110347367B (zh) | 音量调节方法、终端设备、存储介质及电子设备 | |
CN109147802B (zh) | 一种播放语速调节方法及装置 | |
CN105390144B (zh) | 一种音频处理方法和音频处理装置 | |
CN110782907B (zh) | 语音信号的发送方法、装置、设备及可读存储介质 | |
CN111245734B (zh) | 音频数据传输方法、装置、处理设备及存储介质 | |
WO2023197809A1 (zh) | 一种高频音频信号的编解码方法和相关装置 | |
CN113365129B (zh) | 蓝牙音频数据处理方法、发射器、接收器及收发设备 | |
WO2019033943A1 (zh) | 音量调节方法、装置、移动终端及存储介质 | |
CN110446102A (zh) | 音频信号的响度调整方法及装置 | |
WO2019033942A1 (zh) | 音量调节方法、装置、终端设备及存储介质 | |
CN112992159B (zh) | 一种lc3音频编解码方法、装置、设备及存储介质 | |
CN116386650A (zh) | 一种基于应用程序的音频增益方法及装置 | |
CN107426200B (zh) | 一种多媒体数据处理方法和装置 | |
CN113345447B (zh) | 防止广告干扰的音频编解码方法、系统、发射器及接收器 | |
CN111179947A (zh) | 一种音频信号处理的方法及装置 | |
CN105323652B (zh) | 播放多媒体文件的方法和装置 | |
CN103686220B (zh) | 移除直播中的网络延迟的方法及系统 | |
CN109286922B (zh) | 蓝牙提示音处理方法、系统、可读存储介质和蓝牙设备 | |
CN113823277A (zh) | 基于深度学习的关键词识别方法、系统、介质及设备 | |
CN104934040A (zh) | 音频信号的时长调整方法和装置 | |
JP2004354677A (ja) | 情報処理装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、再生装置 | |
CN116709115A (zh) | 一种广场舞专用广播音频播放方法 | |
CN112954397A (zh) | 数据传输调整方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |