CN107331403A - 一种基于算法的音频优化方法、智能终端及存储装置 - Google Patents
一种基于算法的音频优化方法、智能终端及存储装置 Download PDFInfo
- Publication number
- CN107331403A CN107331403A CN201710511873.2A CN201710511873A CN107331403A CN 107331403 A CN107331403 A CN 107331403A CN 201710511873 A CN201710511873 A CN 201710511873A CN 107331403 A CN107331403 A CN 107331403A
- Authority
- CN
- China
- Prior art keywords
- frequency
- audio
- audio file
- mapping function
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000005457 optimization Methods 0.000 title claims abstract description 34
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 238000013507 mapping Methods 0.000 claims abstract description 60
- 230000005236 sound signal Effects 0.000 claims abstract description 29
- 238000006243 chemical reaction Methods 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 20
- 230000009466 transformation Effects 0.000 claims abstract description 14
- 238000012360 testing method Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 81
- 238000004590 computer program Methods 0.000 claims description 14
- 238000009826 distribution Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 8
- 239000002184 metal Substances 0.000 claims description 3
- 230000007480 spreading Effects 0.000 claims description 3
- 238000003892 spreading Methods 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 2
- 238000007906 compression Methods 0.000 claims description 2
- 230000009467 reduction Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 11
- 230000000875 corresponding effect Effects 0.000 abstract description 6
- 230000002596 correlated effect Effects 0.000 abstract description 5
- 230000004044 response Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/02—Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
- G10H1/06—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
- G10H1/12—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
- G10H1/125—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms using a digital filter
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G5/00—Tone control or bandwidth control in amplifiers
- H03G5/16—Automatic control
- H03G5/165—Equalizers; Volume or gain control in limited frequency bands
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/025—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/131—Mathematical functions for musical analysis, processing, synthesis or composition
- G10H2250/215—Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
- G10H2250/235—Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种基于算法的音频优化方法、智能终端及存储装置,所述方法包括:预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件;提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,确定音频信号的类型;根据音频信号的类型,通过函数库匹配对应的频率映射函数转换得到处理后的音频文件,再通过傅里叶逆变换得到优化的音频文件。本发明通过原始音频与标准音源的对比匹配,寻找相近的音源类型,进而确定变换的频率映射函数,将频率进行映射,压缩或扩展相关频率,自动进行调音,达到改善音质的效果。
Description
技术领域
本发明涉及音频处理技术领域,尤其涉及一种基于算法的音频优化方法、智能终端及存储装置。
背景技术
目前,电视节目中的音频处理主要是改善音频设备的频率响应,使频率响应曲线达到“平直”效果来直接反应声音的再现能力,以追求声音的准确性。不同产品对不同音频频率的响应能力不同,若其频率响应曲线越平直,声音再现越好。但是人耳听感与各频段声音有很大的关系,各频段的幅度不同和分布不同,给听者带来的感觉享受不同。例如音频若包含过量的低次级谐波,容易使人耳产生疲劳;音乐演奏音频如西洋管弦乐队,提升其8千赫兹左右的音量,可以增加明亮度。所以只追求频响曲线平直、声音准确的处理方法,容易失去声音的特性,声音不能完美表现出来。现有的常用来提高音频特性的方法,是利用频率均衡器对音频波形进行滤波,调整各个频段的增益值。通过频率均衡器可以改善音乐的听觉效果,但这种方法只适用于个人喜好风格的手动调整,且不能自动调整不同条件场景下的音效,对于普通观众来说并不能随时带来更好的听觉效果。
因此,现有技术还有待于改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种基于算法的音频优化方法、智能终端及存储装置,旨在通过原始音频与标准音源的对比匹配,寻找相近的音源类型,进而确定变换的频率映射函数,将频率进行映射,压缩或扩展相关频率,自动进行调音,达到改善音质的效果。
本发明解决技术问题所采用的技术方案如下:
一种基于算法的音频优化方法,其中,所述方法包括:
预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件;
提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,确定音频信号的类型;
根据音频信号的类型,通过函数库匹配对应的频率映射函数转换得到处理后的音频文件,再通过傅里叶逆变换得到优化的音频文件。
所述的基于算法的音频优化方法,其中,所述函数库包括第一频率映射函数和第二频率映射函数,所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变,调整音频频率。
所述的基于算法的音频优化方法,其中,所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变具体包括:
预先将所述频域上的音频文件中音频的频段划分为若干个区间;
根据音频信号的类型,对于每个不同区间频段的频率,通过选择第一频率映射函数或者第二频率映射函数进行针对性处理。
所述的基于算法的音频优化方法,其中,所述第一频率映射函数为:
其中f为频域上的音频文件中音频的频率,f'为处理后的音频文件中音频的频率。
所述的基于算法的音频优化方法,其中,所述第一频率映射函数对频域上的音频文件中音频的频率转换处理为:
将频域上的音频文件中小于等于330Hz的频率转换为330Hz,用于将音频的低音部分擦除;
将频域上的音频文件中大于330Hz但小于1000Hz的频率保持不变;
将频域上的音频文件中大于等于1000Hz的频率转换为1000Hz,用于将音频的高音部分擦除。
所述的基于算法的音频优化方法,其中,所述第二频率映射函数为:
其中f为频域上的音频文件中音频的频率,f'为处理后的音频文件中音频的频率,k为扩展系数。
所述的基于算法的音频优化方法,其中,所述第二频率映射函数对频域上的音频文件中音频的频率转换处理为:
将频域上的音频文件中小于等于330Hz的频率转换为330Hz,用于将音频的低音部分擦除;
将频域上的音频文件中大于330Hz的频率进行k倍扩大。
所述的基于算法的音频优化方法,其中,所述第一频率映射函数用于保留音频的中频部分,压缩低频和高频分布范围,应用于减小背景噪音和保持声音清晰纯正的语言节目;
所述第二频率映射函数用于扩展音频的中音和高音部分,压缩低音部分,应用于强调中音高音来表现金属打击声音的金属音乐演奏。
一种智能终端,其中,包括:处理器、与处理器通信连接的存储器,所述存储器存储有计算机程序,所述计算机程序用于被执行时实现所述的基于算法的音频优化方法;所述处理器用于调用所述存储器中的计算机程序,以实现所述的基于算法的音频优化方法。
一种存储装置,其中,所述存储装置存储有计算机程序,所述计算机程序能够被执行用于实现所述的基于算法的音频优化方法。
本发明的有益效果:本发明公开了一种基于算法的音频优化方法、智能终端及存储装置,所述方法包括:预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件;提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,确定音频信号的类型;根据音频信号的类型,通过函数库匹配对应的频率映射函数转换得到处理后的音频文件,再通过傅里叶逆变换得到优化的音频文件。本发明通过原始音频与标准音源的对比匹配,寻找相近的音源类型,进而确定变换的频率映射函数,将频率进行映射,压缩或扩展相关频率,自动进行调音,达到改善音质的效果。
附图说明
图1是本发明基于算法的音频优化方法的较佳实施例的流程图。
图2是本发明通过频率映射函数对音频频率分布范围进行针对性改变过程的较佳实施例的流程图。
图3是本发明基于算法的音频优化方法中通过第一频率映射函数对频域上的音频文件中音频的频率转换处理的较佳实施例的流程图。
图4是本发明基于算法的音频优化方法中通过第二频率映射函数对频域上的音频文件中音频的频率转换处理的较佳实施例的流程图。
图5是本发明基于算法的音频优化方法中移动终端的较佳实施例的功能原理框图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明较佳实施例所述的一种基于算法的音频优化方法,如图1所示,所述方法包括以下步骤:
步骤S100、预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件。
具体地,原始音频文件中的音频数据描述的是随时间变化声音幅值变化的关系,由于本发明是对音频的频率进行转换,所以需要把时域(时域是描述数学函数或物理信号对时间的关系,例如一个信号的时域波形可以表达信号随着时间的变化)上的原始音频文件(y(t))通过傅里叶变换转换为频域(频域是描述信号在频率方面特性时用到的一种坐标系)上的音频文件(F[y(t)])。
傅里叶变换是数字信号处理领域一种很重要的算法,傅里叶原理表明:任何连续测量的时序或信号,都可以表示为不同频率的正弦波信号的无限叠加,而根据该原理创立的傅里叶变换算法利用直接测量到的原始信号,以累加方式来计算该信号中不同正弦波信号的频率、振幅和相位。因此,可以说,傅里叶变换将原来难以处理的时域信号转换成了易于分析的频域信号(信号的频谱),可以利用一些工具对这些频域信号进行处理、加工。最后还可以利用傅里叶逆变换将这些频域信号转换成时域信号。
傅里叶变换公式为:
公式中F(ω)为f(t)的像函数,f(t)为F(ω)的像原函数。
步骤S200、提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,确定音频信号的类型。
具体地,要对频域上的音频文件(F[y(t)])处理为音质较好的处理后的音频文件(F'[y(t)]),需要从函数库选择合适的频率映射函数来进行转换。各种声源频率范围不同,例如大钢琴的频率范围为27Hz~12000Hz,脚步声为100Hz~9000Hz。任何一个音频文件,其频率映射函数的选取可以根据一个标准音源作为匹配信息标准。
根据音频信号的某些特性(频率分布范围、频幅信息),提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,找到相符合音频测试标准音源,即确定了音频信号的类型,从而确定要变换的频率映射函数。
步骤S300、根据音频信号的类型,通过函数库匹配对应的频率映射函数转换得到处理后的音频文件,再通过傅里叶逆变换得到优化的音频文件。
具体地,所述函数库包括第一频率映射函数和第二频率映射函数,所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变,调整音频频率,来改善音频的音质表现。
如图2所示,所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变具体包括:
S10,预先将所述频域上的音频文件中音频的频段划分为若干个区间;例如两个区间或者三个区间不等;
S20,根据音频信号的类型,对于每个不同区间频段的频率,通过选择第一频率映射函数或者第二频率映射函数进行针对性处理。
进一步地,所述第一频率映射函数为:
其中f为频域上的音频文件中音频的频率,f'为处理后的音频文件中音频的频率。
如图3所示,所述第一频率映射函数对频域上的音频文件中音频的频率转换处理为(即所述第一频率映射函数公式的具体含义):
S11,将频域上的音频文件中小于等于330Hz的频率转换为330Hz,用于将音频的低音部分擦除;
S12,将频域上的音频文件中大于330Hz但小于1000Hz的频率保持不变;
S13,将频域上的音频文件中大于等于1000Hz的频率转换为1000Hz,用于将音频的高音部分擦除。
具体地,本发明将频段的调整点划为:330Hz,1000Hz,即小于330Hz划为低频,大于330Hz小于1000Hz为中频,大于1000Hz为高频。所述第一频率映射函数将原来所有小于等于330Hz的频率转换为330Hz,这样就把音频的低音部分擦除掉;原大于330Hz但小于1000Hz的频率不变,大于等于1000Hz的频率调整为1000Hz,即高频信息消失。该函数保留中频部分,压缩低频和高频分布范围,主要应用于语言节目等音源,目的是减少低频和高频分量,可以使背景噪音减小,声音清晰纯正。
进一步地,所述第二频率映射函数为:
其中f为频域上的音频文件中音频的频率,f'为处理后的音频文件中音频的频率,k为扩展系数。
如图4所示,所述第二频率映射函数对频域上的音频文件中音频的频率转换处理为(即所述第二频率映射函数公式的具体含义):
S21,将频域上的音频文件中小于等于330Hz的频率转换为330Hz,用于将音频的低音部分擦除;
S22,将频域上的音频文件中大于330Hz的频率进行k倍扩大。
具体地,本发明所述第二频率映射函数将小于等于330Hz的音频频率擦除,将大于330Hz的音频频率进行扩大,扩大了大于330Hz的频率范围,即扩展中音和高音部分,压缩低音,主要用来处理金属音乐演奏,强调中音高音来表现金属打击的声音。当然,k还可以为压缩系数(即k﹤1,此时对音频中的一些频率进行压缩)。
本发明中的所述函数库优先由第一频率映射函数和第二频率映射函数组成,当然还可以包括其他频率映射函数,函数库中的频率映射函数主要通过对音频频率分布范围进行针对性改变,来改善音频的音质表现。函数库的函数用来实现音频文件(F[y(t)])到音频文件(F'[y(t)])的变换,这个变换可以是线性变换,非线性变换(对数变换、指数变换)或者分段线性变换(如第一频率映射函数和第二频率映射函数)、分段非线性变换。函数的表达式可以根据频段(高频、中频、低频)划分点的不同分段表示,以达到对音频信号的细化或者简略处理。根据专业调音师的要求,不断增加针对不同音质改善的表达式,这些函数构成了专业化的面向音频处理的函数库。根据应用要求的不同,选择不同的变换函数,这些函数将有选择地对某一频率范围进行扩展或压缩。
本发明的技术方案区别于传统的滤波改善音质,本发明将频率与频率进行映射,通过频率映射函数压缩或扩展相关频率,针对性地修饰音色,达到改善音质的效果,优化听觉效果;通过与标准音源的对比匹配,寻找相近的音源类型,进而确定变换的映射函数,这样能自动调音,并达到专业调音的效果。
本发明还提供了一种移动终端,如图5所示,所述移动终端包括:处理器(processor)10、存储器(memory)20、通信接口(Communications Interface)30和总线40;
其中,所述处理器10、存储器20、通信接口30通过所述总线40完成相互间的通信;
所述通信接口30用于所述移动终端的通信设备之间的信息传输;
所述处理器10用于调用所述存储器20中的计算机程序,以执行上述各方法实施例所提供的方法,例如包括:预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件;提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,确定音频信号的类型;根据音频信号的类型,通过函数库匹配对应的频率映射函数转换得到处理后的音频文件,再通过傅里叶逆变换得到优化的音频文件。
本发明还提供一种存储装置,其中,所述存储装置存储有计算机程序,所述计算机程序能够被执行以用于实现所述基于算法的音频优化方法。
综上所述,本发明提供了一种基于算法的音频优化方法、智能终端及存储装置,所述方法包括:预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件;提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,确定音频信号的类型;根据音频信号的类型,通过函数库匹配对应的频率映射函数转换得到处理后的音频文件,再通过傅里叶逆变换得到优化的音频文件。本发明通过原始音频与标准音源的对比匹配,寻找相近的音源类型,进而确定变换的频率映射函数,将频率进行映射,压缩或扩展相关频率,自动进行调音,达到改善音质的效果;补偿声音表现在人听觉上的缺陷,从而达到更好的听觉效果。
当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等)来完成,所述的程序可存储于一计算机可读取的存储介质中,该程序在执行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、磁碟、光盘等。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (10)
1.一种基于算法的音频优化方法,其特征在于,所述方法包括:
预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件;
提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,确定音频信号的类型;
根据音频信号的类型,通过函数库匹配对应的频率映射函数转换得到处理后的音频文件,再通过傅里叶逆变换得到优化的音频文件。
2.根据权利要求1所述的基于算法的音频优化方法,其特征在于,所述函数库包括第一频率映射函数和第二频率映射函数,所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变,调整音频频率。
3.根据权利要求2所述的基于算法的音频优化方法,其特征在于,所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变具体包括:
预先将所述频域上的音频文件中音频的频段划分为若干个区间;
根据音频信号的类型,对于每个不同区间频段的频率,通过选择第一频率映射函数或者第二频率映射函数进行针对性处理。
4.根据权利要求3所述的基于算法的音频优化方法,其特征在于,所述第一频率映射函数为:
其中f为频域上的音频文件中音频的频率,f'为处理后的音频文件中音频的频率。
5.根据权利要求4所述的基于算法的音频优化方法,其特征在于,所述第一频率映射函数对频域上的音频文件中音频的频率转换处理为:
将频域上的音频文件中小于等于330Hz的频率转换为330Hz,用于将音频的低音部分擦除;
将频域上的音频文件中大于330Hz但小于1000Hz的频率保持不变;
将频域上的音频文件中大于等于1000Hz的频率转换为1000Hz,用于将音频的高音部分擦除。
6.根据权利要求3所述的基于算法的音频优化方法,其特征在于,所述第二频率映射函数为:
其中f为频域上的音频文件中音频的频率,f'为处理后的音频文件中音频的频率,k为扩展系数。
7.根据权利要求6所述的基于算法的音频优化方法,其特征在于,所述第二频率映射函数对频域上的音频文件中音频的频率转换处理为:
将频域上的音频文件中小于等于330Hz的频率转换为330Hz,用于将音频的低音部分擦除;
将频域上的音频文件中大于330Hz的频率进行k倍扩大。
8.根据权利要求3所述的基于算法的音频优化方法,其特征在于,所述第一频率映射函数用于保留音频的中频部分,压缩低频和高频分布范围,应用于减小背景噪音和保持声音清晰纯正的语言节目;
所述第二频率映射函数用于扩展音频的中音和高音部分,压缩低音部分,应用于强调中音高音来表现金属打击声音的金属音乐演奏。
9.一种智能终端,其特征在于,包括:处理器、与处理器通信连接的存储器,所述存储器存储有计算机程序,所述计算机程序用于被执行时实现如权利要求1-8任一项所述的方法;所述处理器用于调用所述存储器中的计算机程序,以实现如权利要求1-8任一项所述的方法。
10.一种存储装置,其特征在于,所述存储装置存储有计算机程序,所述计算机程序能够被执行用于实现如权利要求1至8任一项所述的基于算法的音频优化方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710511873.2A CN107331403B (zh) | 2017-06-27 | 2017-06-27 | 一种基于算法的音频优化方法、智能终端及存储装置 |
US16/319,156 US10861472B2 (en) | 2017-06-27 | 2018-02-10 | Algorithm-based audio optimization method, intelligent terminal and storage device |
EP18814481.0A EP3471097B1 (en) | 2017-06-27 | 2018-02-10 | Algorithm-based audio optimization method, intelligent terminal and storage device |
PCT/CN2018/076101 WO2019000961A1 (zh) | 2017-06-27 | 2018-02-10 | 一种基于算法的音频优化方法、智能终端及存储装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710511873.2A CN107331403B (zh) | 2017-06-27 | 2017-06-27 | 一种基于算法的音频优化方法、智能终端及存储装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107331403A true CN107331403A (zh) | 2017-11-07 |
CN107331403B CN107331403B (zh) | 2020-11-06 |
Family
ID=60198010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710511873.2A Active CN107331403B (zh) | 2017-06-27 | 2017-06-27 | 一种基于算法的音频优化方法、智能终端及存储装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10861472B2 (zh) |
EP (1) | EP3471097B1 (zh) |
CN (1) | CN107331403B (zh) |
WO (1) | WO2019000961A1 (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019000961A1 (zh) * | 2017-06-27 | 2019-01-03 | 深圳创维-Rgb电子有限公司 | 一种基于算法的音频优化方法、智能终端及存储装置 |
CN110035299A (zh) * | 2019-04-18 | 2019-07-19 | 雷欧尼斯(北京)信息技术有限公司 | 沉浸式对象音频的压缩传输方法与架构 |
CN110580914A (zh) * | 2019-07-24 | 2019-12-17 | 安克创新科技股份有限公司 | 一种音频处理方法、设备及具有存储功能的装置 |
CN110992739A (zh) * | 2019-12-26 | 2020-04-10 | 上海乂学教育科技有限公司 | 学生在线听写系统 |
CN111343540A (zh) * | 2020-03-05 | 2020-06-26 | 维沃移动通信有限公司 | 一种钢琴音频的处理方法及电子设备 |
CN112037812A (zh) * | 2020-09-01 | 2020-12-04 | 深圳爱卓软科技有限公司 | 音频处理方法 |
CN116486828A (zh) * | 2023-06-14 | 2023-07-25 | 北京觅图科技有限公司 | 一种音频数据处理方法、装置及系统 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114944154B (zh) * | 2022-07-26 | 2022-11-15 | 深圳市长丰影像器材有限公司 | 音频调整方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101807427A (zh) * | 2010-02-26 | 2010-08-18 | 中山大学 | 一种音频输出系统 |
CN102354497A (zh) * | 2010-04-09 | 2012-02-15 | 奥迪康有限公司 | 使用频率变换通过移动包络对声音感知的改进 |
CN102419981A (zh) * | 2011-11-02 | 2012-04-18 | 展讯通信(上海)有限公司 | 音频信号时间尺度和频率尺度缩放处理方法及设备 |
CN105390144A (zh) * | 2015-10-15 | 2016-03-09 | 广东欧珀移动通信有限公司 | 一种音频处理方法和音频处理装置 |
US9583116B1 (en) * | 2014-07-21 | 2017-02-28 | Superpowered Inc. | High-efficiency digital signal processing of streaming media |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040175010A1 (en) * | 2003-03-06 | 2004-09-09 | Silvia Allegro | Method for frequency transposition in a hearing device and a hearing device |
AU2003904207A0 (en) * | 2003-08-11 | 2003-08-21 | Vast Audio Pty Ltd | Enhancement of sound externalization and separation for hearing-impaired listeners: a spatial hearing-aid |
CN101667814B (zh) * | 2009-09-24 | 2012-08-15 | 华为终端有限公司 | 音频播放方法及音频播放装置 |
CN103177727B (zh) * | 2011-12-23 | 2015-05-06 | 重庆重邮信科通信技术有限公司 | 一种音频频带处理方法及系统 |
US9183849B2 (en) * | 2012-12-21 | 2015-11-10 | The Nielsen Company (Us), Llc | Audio matching with semantic audio recognition and report generation |
CN104078050A (zh) * | 2013-03-26 | 2014-10-01 | 杜比实验室特许公司 | 用于音频分类和音频处理的设备和方法 |
CN105519138B (zh) * | 2013-08-20 | 2019-07-09 | 唯听助听器公司 | 具有自适应分类器的助听器 |
CN103473005B (zh) * | 2013-09-29 | 2017-04-26 | 深圳Tcl新技术有限公司 | 对播放的音频进行音效控制的方法及装置 |
WO2015144243A1 (en) * | 2014-03-28 | 2015-10-01 | Arcelik Anonim Sirketi | Image display device with automatic sound enhancement function |
CN107331403B (zh) * | 2017-06-27 | 2020-11-06 | 深圳创维-Rgb电子有限公司 | 一种基于算法的音频优化方法、智能终端及存储装置 |
-
2017
- 2017-06-27 CN CN201710511873.2A patent/CN107331403B/zh active Active
-
2018
- 2018-02-10 EP EP18814481.0A patent/EP3471097B1/en active Active
- 2018-02-10 WO PCT/CN2018/076101 patent/WO2019000961A1/zh unknown
- 2018-02-10 US US16/319,156 patent/US10861472B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101807427A (zh) * | 2010-02-26 | 2010-08-18 | 中山大学 | 一种音频输出系统 |
CN102354497A (zh) * | 2010-04-09 | 2012-02-15 | 奥迪康有限公司 | 使用频率变换通过移动包络对声音感知的改进 |
CN102419981A (zh) * | 2011-11-02 | 2012-04-18 | 展讯通信(上海)有限公司 | 音频信号时间尺度和频率尺度缩放处理方法及设备 |
US9583116B1 (en) * | 2014-07-21 | 2017-02-28 | Superpowered Inc. | High-efficiency digital signal processing of streaming media |
CN105390144A (zh) * | 2015-10-15 | 2016-03-09 | 广东欧珀移动通信有限公司 | 一种音频处理方法和音频处理装置 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10861472B2 (en) | 2017-06-27 | 2020-12-08 | Shenzhen Chuangwei-Rgb Electronic Co., Ltd. | Algorithm-based audio optimization method, intelligent terminal and storage device |
EP3471097A4 (en) * | 2017-06-27 | 2020-02-26 | Shenzhen Chuangwei-RGB Electronic Co., Ltd. | ALGORITHM-BASED AUDIO OPTIMIZATION METHOD, INTELLIGENT TERMINAL AND STORAGE DEVICE |
WO2019000961A1 (zh) * | 2017-06-27 | 2019-01-03 | 深圳创维-Rgb电子有限公司 | 一种基于算法的音频优化方法、智能终端及存储装置 |
CN110035299A (zh) * | 2019-04-18 | 2019-07-19 | 雷欧尼斯(北京)信息技术有限公司 | 沉浸式对象音频的压缩传输方法与架构 |
CN110035299B (zh) * | 2019-04-18 | 2021-02-05 | 雷欧尼斯(北京)信息技术有限公司 | 沉浸式对象音频的压缩传输方法与系统 |
CN110580914A (zh) * | 2019-07-24 | 2019-12-17 | 安克创新科技股份有限公司 | 一种音频处理方法、设备及具有存储功能的装置 |
CN110992739B (zh) * | 2019-12-26 | 2021-06-01 | 上海松鼠课堂人工智能科技有限公司 | 学生在线听写系统 |
CN110992739A (zh) * | 2019-12-26 | 2020-04-10 | 上海乂学教育科技有限公司 | 学生在线听写系统 |
CN111343540A (zh) * | 2020-03-05 | 2020-06-26 | 维沃移动通信有限公司 | 一种钢琴音频的处理方法及电子设备 |
CN111343540B (zh) * | 2020-03-05 | 2021-07-20 | 维沃移动通信有限公司 | 一种钢琴音频的处理方法及电子设备 |
CN112037812A (zh) * | 2020-09-01 | 2020-12-04 | 深圳爱卓软科技有限公司 | 音频处理方法 |
CN116486828A (zh) * | 2023-06-14 | 2023-07-25 | 北京觅图科技有限公司 | 一种音频数据处理方法、装置及系统 |
CN116486828B (zh) * | 2023-06-14 | 2023-09-08 | 北京觅图科技有限公司 | 一种音频数据处理方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
EP3471097B1 (en) | 2021-04-21 |
EP3471097A4 (en) | 2020-02-26 |
US20200066286A1 (en) | 2020-02-27 |
WO2019000961A1 (zh) | 2019-01-03 |
CN107331403B (zh) | 2020-11-06 |
EP3471097A1 (en) | 2019-04-17 |
US10861472B2 (en) | 2020-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107331403A (zh) | 一种基于算法的音频优化方法、智能终端及存储装置 | |
US10523168B2 (en) | Method and apparatus for processing an audio signal based on an estimated loudness | |
US8755545B2 (en) | Stability and speech audibility improvements in hearing devices | |
WO2005101898A2 (en) | A method and system for sound source separation | |
US8306821B2 (en) | Sub-band periodic signal enhancement system | |
Westermann et al. | Binaural dereverberation based on interaural coherence histograms | |
CN106572419A (zh) | 一种立体声音效增强系统 | |
WO2014113185A1 (en) | Vehicle engine sound extraction and reproduction | |
JP6482880B2 (ja) | ミキシング装置、信号ミキシング方法、及びミキシングプログラム | |
WO2009123387A1 (en) | Procedure for processing noisy speech signals, and apparatus and computer program therefor | |
WO2022256577A1 (en) | A method of speech enhancement and a mobile computing device implementing the method | |
AU2002300314B2 (en) | Apparatus And Method For Frequency Transposition In Hearing Aids | |
WO2022247494A1 (zh) | 音频信号补偿方法及装置、耳机、存储介质 | |
CN110853606A (zh) | 一种音效配置方法、装置及计算机可读存储介质 | |
US20110235815A1 (en) | Method and arrangement for audio signal processing | |
US20060089836A1 (en) | System and method of signal pre-conditioning with adaptive spectral tilt compensation for audio equalization | |
US9696962B1 (en) | Harmonic tracking equalizer | |
CN115119110A (zh) | 音效调节方法、音频播放设备以及计算机可读存储介质 | |
CN114067817A (zh) | 低音增强方法、装置、电子设备及存储介质 | |
JPH07146700A (ja) | ピッチ強調方法および装置ならびに聴力補償装置 | |
Hoffmann et al. | Towards audio signal equalization based on spectral characteristics of a listening room and music content reproduced | |
US11380345B2 (en) | Real-time voice timbre style transform | |
CN113542983B (zh) | 一种音频信号处理方法、装置、设备及存储介质 | |
US20240098401A1 (en) | Suspended audio device with bass boost performance | |
CN117153192B (zh) | 音频增强方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |