CN107331403A - 一种基于算法的音频优化方法、智能终端及存储装置 - Google Patents

一种基于算法的音频优化方法、智能终端及存储装置 Download PDF

Info

Publication number
CN107331403A
CN107331403A CN201710511873.2A CN201710511873A CN107331403A CN 107331403 A CN107331403 A CN 107331403A CN 201710511873 A CN201710511873 A CN 201710511873A CN 107331403 A CN107331403 A CN 107331403A
Authority
CN
China
Prior art keywords
frequency
audio
audio file
mapping function
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710511873.2A
Other languages
English (en)
Other versions
CN107331403B (zh
Inventor
陈学思
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Skyworth RGB Electronics Co Ltd
Original Assignee
Shenzhen Skyworth RGB Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Skyworth RGB Electronics Co Ltd filed Critical Shenzhen Skyworth RGB Electronics Co Ltd
Priority to CN201710511873.2A priority Critical patent/CN107331403B/zh
Publication of CN107331403A publication Critical patent/CN107331403A/zh
Priority to US16/319,156 priority patent/US10861472B2/en
Priority to EP18814481.0A priority patent/EP3471097B1/en
Priority to PCT/CN2018/076101 priority patent/WO2019000961A1/zh
Application granted granted Critical
Publication of CN107331403B publication Critical patent/CN107331403B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G10H1/06Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
    • G10H1/12Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
    • G10H1/125Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms using a digital filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/16Automatic control
    • H03G5/165Equalizers; Volume or gain control in limited frequency bands
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/131Mathematical functions for musical analysis, processing, synthesis or composition
    • G10H2250/215Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
    • G10H2250/235Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种基于算法的音频优化方法、智能终端及存储装置,所述方法包括:预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件;提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,确定音频信号的类型;根据音频信号的类型,通过函数库匹配对应的频率映射函数转换得到处理后的音频文件,再通过傅里叶逆变换得到优化的音频文件。本发明通过原始音频与标准音源的对比匹配,寻找相近的音源类型,进而确定变换的频率映射函数,将频率进行映射,压缩或扩展相关频率,自动进行调音,达到改善音质的效果。

Description

一种基于算法的音频优化方法、智能终端及存储装置
技术领域
本发明涉及音频处理技术领域,尤其涉及一种基于算法的音频优化方法、智能终端及存储装置。
背景技术
目前,电视节目中的音频处理主要是改善音频设备的频率响应,使频率响应曲线达到“平直”效果来直接反应声音的再现能力,以追求声音的准确性。不同产品对不同音频频率的响应能力不同,若其频率响应曲线越平直,声音再现越好。但是人耳听感与各频段声音有很大的关系,各频段的幅度不同和分布不同,给听者带来的感觉享受不同。例如音频若包含过量的低次级谐波,容易使人耳产生疲劳;音乐演奏音频如西洋管弦乐队,提升其8千赫兹左右的音量,可以增加明亮度。所以只追求频响曲线平直、声音准确的处理方法,容易失去声音的特性,声音不能完美表现出来。现有的常用来提高音频特性的方法,是利用频率均衡器对音频波形进行滤波,调整各个频段的增益值。通过频率均衡器可以改善音乐的听觉效果,但这种方法只适用于个人喜好风格的手动调整,且不能自动调整不同条件场景下的音效,对于普通观众来说并不能随时带来更好的听觉效果。
因此,现有技术还有待于改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种基于算法的音频优化方法、智能终端及存储装置,旨在通过原始音频与标准音源的对比匹配,寻找相近的音源类型,进而确定变换的频率映射函数,将频率进行映射,压缩或扩展相关频率,自动进行调音,达到改善音质的效果。
本发明解决技术问题所采用的技术方案如下:
一种基于算法的音频优化方法,其中,所述方法包括:
预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件;
提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,确定音频信号的类型;
根据音频信号的类型,通过函数库匹配对应的频率映射函数转换得到处理后的音频文件,再通过傅里叶逆变换得到优化的音频文件。
所述的基于算法的音频优化方法,其中,所述函数库包括第一频率映射函数和第二频率映射函数,所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变,调整音频频率。
所述的基于算法的音频优化方法,其中,所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变具体包括:
预先将所述频域上的音频文件中音频的频段划分为若干个区间;
根据音频信号的类型,对于每个不同区间频段的频率,通过选择第一频率映射函数或者第二频率映射函数进行针对性处理。
所述的基于算法的音频优化方法,其中,所述第一频率映射函数为:
其中f为频域上的音频文件中音频的频率,f'为处理后的音频文件中音频的频率。
所述的基于算法的音频优化方法,其中,所述第一频率映射函数对频域上的音频文件中音频的频率转换处理为:
将频域上的音频文件中小于等于330Hz的频率转换为330Hz,用于将音频的低音部分擦除;
将频域上的音频文件中大于330Hz但小于1000Hz的频率保持不变;
将频域上的音频文件中大于等于1000Hz的频率转换为1000Hz,用于将音频的高音部分擦除。
所述的基于算法的音频优化方法,其中,所述第二频率映射函数为:
其中f为频域上的音频文件中音频的频率,f'为处理后的音频文件中音频的频率,k为扩展系数。
所述的基于算法的音频优化方法,其中,所述第二频率映射函数对频域上的音频文件中音频的频率转换处理为:
将频域上的音频文件中小于等于330Hz的频率转换为330Hz,用于将音频的低音部分擦除;
将频域上的音频文件中大于330Hz的频率进行k倍扩大。
所述的基于算法的音频优化方法,其中,所述第一频率映射函数用于保留音频的中频部分,压缩低频和高频分布范围,应用于减小背景噪音和保持声音清晰纯正的语言节目;
所述第二频率映射函数用于扩展音频的中音和高音部分,压缩低音部分,应用于强调中音高音来表现金属打击声音的金属音乐演奏。
一种智能终端,其中,包括:处理器、与处理器通信连接的存储器,所述存储器存储有计算机程序,所述计算机程序用于被执行时实现所述的基于算法的音频优化方法;所述处理器用于调用所述存储器中的计算机程序,以实现所述的基于算法的音频优化方法。
一种存储装置,其中,所述存储装置存储有计算机程序,所述计算机程序能够被执行用于实现所述的基于算法的音频优化方法。
本发明的有益效果:本发明公开了一种基于算法的音频优化方法、智能终端及存储装置,所述方法包括:预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件;提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,确定音频信号的类型;根据音频信号的类型,通过函数库匹配对应的频率映射函数转换得到处理后的音频文件,再通过傅里叶逆变换得到优化的音频文件。本发明通过原始音频与标准音源的对比匹配,寻找相近的音源类型,进而确定变换的频率映射函数,将频率进行映射,压缩或扩展相关频率,自动进行调音,达到改善音质的效果。
附图说明
图1是本发明基于算法的音频优化方法的较佳实施例的流程图。
图2是本发明通过频率映射函数对音频频率分布范围进行针对性改变过程的较佳实施例的流程图。
图3是本发明基于算法的音频优化方法中通过第一频率映射函数对频域上的音频文件中音频的频率转换处理的较佳实施例的流程图。
图4是本发明基于算法的音频优化方法中通过第二频率映射函数对频域上的音频文件中音频的频率转换处理的较佳实施例的流程图。
图5是本发明基于算法的音频优化方法中移动终端的较佳实施例的功能原理框图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明较佳实施例所述的一种基于算法的音频优化方法,如图1所示,所述方法包括以下步骤:
步骤S100、预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件。
具体地,原始音频文件中的音频数据描述的是随时间变化声音幅值变化的关系,由于本发明是对音频的频率进行转换,所以需要把时域(时域是描述数学函数或物理信号对时间的关系,例如一个信号的时域波形可以表达信号随着时间的变化)上的原始音频文件(y(t))通过傅里叶变换转换为频域(频域是描述信号在频率方面特性时用到的一种坐标系)上的音频文件(F[y(t)])。
傅里叶变换是数字信号处理领域一种很重要的算法,傅里叶原理表明:任何连续测量的时序或信号,都可以表示为不同频率的正弦波信号的无限叠加,而根据该原理创立的傅里叶变换算法利用直接测量到的原始信号,以累加方式来计算该信号中不同正弦波信号的频率、振幅和相位。因此,可以说,傅里叶变换将原来难以处理的时域信号转换成了易于分析的频域信号(信号的频谱),可以利用一些工具对这些频域信号进行处理、加工。最后还可以利用傅里叶逆变换将这些频域信号转换成时域信号。
傅里叶变换公式为:
公式中F(ω)为f(t)的像函数,f(t)为F(ω)的像原函数。
步骤S200、提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,确定音频信号的类型。
具体地,要对频域上的音频文件(F[y(t)])处理为音质较好的处理后的音频文件(F'[y(t)]),需要从函数库选择合适的频率映射函数来进行转换。各种声源频率范围不同,例如大钢琴的频率范围为27Hz~12000Hz,脚步声为100Hz~9000Hz。任何一个音频文件,其频率映射函数的选取可以根据一个标准音源作为匹配信息标准。
根据音频信号的某些特性(频率分布范围、频幅信息),提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,找到相符合音频测试标准音源,即确定了音频信号的类型,从而确定要变换的频率映射函数。
步骤S300、根据音频信号的类型,通过函数库匹配对应的频率映射函数转换得到处理后的音频文件,再通过傅里叶逆变换得到优化的音频文件。
具体地,所述函数库包括第一频率映射函数和第二频率映射函数,所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变,调整音频频率,来改善音频的音质表现。
如图2所示,所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变具体包括:
S10,预先将所述频域上的音频文件中音频的频段划分为若干个区间;例如两个区间或者三个区间不等;
S20,根据音频信号的类型,对于每个不同区间频段的频率,通过选择第一频率映射函数或者第二频率映射函数进行针对性处理。
进一步地,所述第一频率映射函数为:
其中f为频域上的音频文件中音频的频率,f'为处理后的音频文件中音频的频率。
如图3所示,所述第一频率映射函数对频域上的音频文件中音频的频率转换处理为(即所述第一频率映射函数公式的具体含义):
S11,将频域上的音频文件中小于等于330Hz的频率转换为330Hz,用于将音频的低音部分擦除;
S12,将频域上的音频文件中大于330Hz但小于1000Hz的频率保持不变;
S13,将频域上的音频文件中大于等于1000Hz的频率转换为1000Hz,用于将音频的高音部分擦除。
具体地,本发明将频段的调整点划为:330Hz,1000Hz,即小于330Hz划为低频,大于330Hz小于1000Hz为中频,大于1000Hz为高频。所述第一频率映射函数将原来所有小于等于330Hz的频率转换为330Hz,这样就把音频的低音部分擦除掉;原大于330Hz但小于1000Hz的频率不变,大于等于1000Hz的频率调整为1000Hz,即高频信息消失。该函数保留中频部分,压缩低频和高频分布范围,主要应用于语言节目等音源,目的是减少低频和高频分量,可以使背景噪音减小,声音清晰纯正。
进一步地,所述第二频率映射函数为:
其中f为频域上的音频文件中音频的频率,f'为处理后的音频文件中音频的频率,k为扩展系数。
如图4所示,所述第二频率映射函数对频域上的音频文件中音频的频率转换处理为(即所述第二频率映射函数公式的具体含义):
S21,将频域上的音频文件中小于等于330Hz的频率转换为330Hz,用于将音频的低音部分擦除;
S22,将频域上的音频文件中大于330Hz的频率进行k倍扩大。
具体地,本发明所述第二频率映射函数将小于等于330Hz的音频频率擦除,将大于330Hz的音频频率进行扩大,扩大了大于330Hz的频率范围,即扩展中音和高音部分,压缩低音,主要用来处理金属音乐演奏,强调中音高音来表现金属打击的声音。当然,k还可以为压缩系数(即k﹤1,此时对音频中的一些频率进行压缩)。
本发明中的所述函数库优先由第一频率映射函数和第二频率映射函数组成,当然还可以包括其他频率映射函数,函数库中的频率映射函数主要通过对音频频率分布范围进行针对性改变,来改善音频的音质表现。函数库的函数用来实现音频文件(F[y(t)])到音频文件(F'[y(t)])的变换,这个变换可以是线性变换,非线性变换(对数变换、指数变换)或者分段线性变换(如第一频率映射函数和第二频率映射函数)、分段非线性变换。函数的表达式可以根据频段(高频、中频、低频)划分点的不同分段表示,以达到对音频信号的细化或者简略处理。根据专业调音师的要求,不断增加针对不同音质改善的表达式,这些函数构成了专业化的面向音频处理的函数库。根据应用要求的不同,选择不同的变换函数,这些函数将有选择地对某一频率范围进行扩展或压缩。
本发明的技术方案区别于传统的滤波改善音质,本发明将频率与频率进行映射,通过频率映射函数压缩或扩展相关频率,针对性地修饰音色,达到改善音质的效果,优化听觉效果;通过与标准音源的对比匹配,寻找相近的音源类型,进而确定变换的映射函数,这样能自动调音,并达到专业调音的效果。
本发明还提供了一种移动终端,如图5所示,所述移动终端包括:处理器(processor)10、存储器(memory)20、通信接口(Communications Interface)30和总线40;
其中,所述处理器10、存储器20、通信接口30通过所述总线40完成相互间的通信;
所述通信接口30用于所述移动终端的通信设备之间的信息传输;
所述处理器10用于调用所述存储器20中的计算机程序,以执行上述各方法实施例所提供的方法,例如包括:预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件;提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,确定音频信号的类型;根据音频信号的类型,通过函数库匹配对应的频率映射函数转换得到处理后的音频文件,再通过傅里叶逆变换得到优化的音频文件。
本发明还提供一种存储装置,其中,所述存储装置存储有计算机程序,所述计算机程序能够被执行以用于实现所述基于算法的音频优化方法。
综上所述,本发明提供了一种基于算法的音频优化方法、智能终端及存储装置,所述方法包括:预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件;提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,确定音频信号的类型;根据音频信号的类型,通过函数库匹配对应的频率映射函数转换得到处理后的音频文件,再通过傅里叶逆变换得到优化的音频文件。本发明通过原始音频与标准音源的对比匹配,寻找相近的音源类型,进而确定变换的频率映射函数,将频率进行映射,压缩或扩展相关频率,自动进行调音,达到改善音质的效果;补偿声音表现在人听觉上的缺陷,从而达到更好的听觉效果。
当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等)来完成,所述的程序可存储于一计算机可读取的存储介质中,该程序在执行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、磁碟、光盘等。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (10)

1.一种基于算法的音频优化方法,其特征在于,所述方法包括:
预先将时域上的原始音频文件通过傅里叶变换转换为频域上的音频文件;
提取音频信号的频率范围和频幅信息,与已存在的多种不同类型的音频测试标准音源的频率范围和频幅信息匹配,确定音频信号的类型;
根据音频信号的类型,通过函数库匹配对应的频率映射函数转换得到处理后的音频文件,再通过傅里叶逆变换得到优化的音频文件。
2.根据权利要求1所述的基于算法的音频优化方法,其特征在于,所述函数库包括第一频率映射函数和第二频率映射函数,所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变,调整音频频率。
3.根据权利要求2所述的基于算法的音频优化方法,其特征在于,所述第一频率映射函数和第二频率映射函数用于通过对音频频率分布范围进行针对性改变具体包括:
预先将所述频域上的音频文件中音频的频段划分为若干个区间;
根据音频信号的类型,对于每个不同区间频段的频率,通过选择第一频率映射函数或者第二频率映射函数进行针对性处理。
4.根据权利要求3所述的基于算法的音频优化方法,其特征在于,所述第一频率映射函数为:
其中f为频域上的音频文件中音频的频率,f'为处理后的音频文件中音频的频率。
5.根据权利要求4所述的基于算法的音频优化方法,其特征在于,所述第一频率映射函数对频域上的音频文件中音频的频率转换处理为:
将频域上的音频文件中小于等于330Hz的频率转换为330Hz,用于将音频的低音部分擦除;
将频域上的音频文件中大于330Hz但小于1000Hz的频率保持不变;
将频域上的音频文件中大于等于1000Hz的频率转换为1000Hz,用于将音频的高音部分擦除。
6.根据权利要求3所述的基于算法的音频优化方法,其特征在于,所述第二频率映射函数为:
其中f为频域上的音频文件中音频的频率,f'为处理后的音频文件中音频的频率,k为扩展系数。
7.根据权利要求6所述的基于算法的音频优化方法,其特征在于,所述第二频率映射函数对频域上的音频文件中音频的频率转换处理为:
将频域上的音频文件中小于等于330Hz的频率转换为330Hz,用于将音频的低音部分擦除;
将频域上的音频文件中大于330Hz的频率进行k倍扩大。
8.根据权利要求3所述的基于算法的音频优化方法,其特征在于,所述第一频率映射函数用于保留音频的中频部分,压缩低频和高频分布范围,应用于减小背景噪音和保持声音清晰纯正的语言节目;
所述第二频率映射函数用于扩展音频的中音和高音部分,压缩低音部分,应用于强调中音高音来表现金属打击声音的金属音乐演奏。
9.一种智能终端,其特征在于,包括:处理器、与处理器通信连接的存储器,所述存储器存储有计算机程序,所述计算机程序用于被执行时实现如权利要求1-8任一项所述的方法;所述处理器用于调用所述存储器中的计算机程序,以实现如权利要求1-8任一项所述的方法。
10.一种存储装置,其特征在于,所述存储装置存储有计算机程序,所述计算机程序能够被执行用于实现如权利要求1至8任一项所述的基于算法的音频优化方法。
CN201710511873.2A 2017-06-27 2017-06-27 一种基于算法的音频优化方法、智能终端及存储装置 Active CN107331403B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201710511873.2A CN107331403B (zh) 2017-06-27 2017-06-27 一种基于算法的音频优化方法、智能终端及存储装置
US16/319,156 US10861472B2 (en) 2017-06-27 2018-02-10 Algorithm-based audio optimization method, intelligent terminal and storage device
EP18814481.0A EP3471097B1 (en) 2017-06-27 2018-02-10 Algorithm-based audio optimization method, intelligent terminal and storage device
PCT/CN2018/076101 WO2019000961A1 (zh) 2017-06-27 2018-02-10 一种基于算法的音频优化方法、智能终端及存储装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710511873.2A CN107331403B (zh) 2017-06-27 2017-06-27 一种基于算法的音频优化方法、智能终端及存储装置

Publications (2)

Publication Number Publication Date
CN107331403A true CN107331403A (zh) 2017-11-07
CN107331403B CN107331403B (zh) 2020-11-06

Family

ID=60198010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710511873.2A Active CN107331403B (zh) 2017-06-27 2017-06-27 一种基于算法的音频优化方法、智能终端及存储装置

Country Status (4)

Country Link
US (1) US10861472B2 (zh)
EP (1) EP3471097B1 (zh)
CN (1) CN107331403B (zh)
WO (1) WO2019000961A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019000961A1 (zh) * 2017-06-27 2019-01-03 深圳创维-Rgb电子有限公司 一种基于算法的音频优化方法、智能终端及存储装置
CN110035299A (zh) * 2019-04-18 2019-07-19 雷欧尼斯(北京)信息技术有限公司 沉浸式对象音频的压缩传输方法与架构
CN110580914A (zh) * 2019-07-24 2019-12-17 安克创新科技股份有限公司 一种音频处理方法、设备及具有存储功能的装置
CN110992739A (zh) * 2019-12-26 2020-04-10 上海乂学教育科技有限公司 学生在线听写系统
CN111343540A (zh) * 2020-03-05 2020-06-26 维沃移动通信有限公司 一种钢琴音频的处理方法及电子设备
CN112037812A (zh) * 2020-09-01 2020-12-04 深圳爱卓软科技有限公司 音频处理方法
CN116486828A (zh) * 2023-06-14 2023-07-25 北京觅图科技有限公司 一种音频数据处理方法、装置及系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114944154B (zh) * 2022-07-26 2022-11-15 深圳市长丰影像器材有限公司 音频调整方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101807427A (zh) * 2010-02-26 2010-08-18 中山大学 一种音频输出系统
CN102354497A (zh) * 2010-04-09 2012-02-15 奥迪康有限公司 使用频率变换通过移动包络对声音感知的改进
CN102419981A (zh) * 2011-11-02 2012-04-18 展讯通信(上海)有限公司 音频信号时间尺度和频率尺度缩放处理方法及设备
CN105390144A (zh) * 2015-10-15 2016-03-09 广东欧珀移动通信有限公司 一种音频处理方法和音频处理装置
US9583116B1 (en) * 2014-07-21 2017-02-28 Superpowered Inc. High-efficiency digital signal processing of streaming media

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040175010A1 (en) * 2003-03-06 2004-09-09 Silvia Allegro Method for frequency transposition in a hearing device and a hearing device
AU2003904207A0 (en) * 2003-08-11 2003-08-21 Vast Audio Pty Ltd Enhancement of sound externalization and separation for hearing-impaired listeners: a spatial hearing-aid
CN101667814B (zh) * 2009-09-24 2012-08-15 华为终端有限公司 音频播放方法及音频播放装置
CN103177727B (zh) * 2011-12-23 2015-05-06 重庆重邮信科通信技术有限公司 一种音频频带处理方法及系统
US9183849B2 (en) * 2012-12-21 2015-11-10 The Nielsen Company (Us), Llc Audio matching with semantic audio recognition and report generation
CN104078050A (zh) * 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
CN105519138B (zh) * 2013-08-20 2019-07-09 唯听助听器公司 具有自适应分类器的助听器
CN103473005B (zh) * 2013-09-29 2017-04-26 深圳Tcl新技术有限公司 对播放的音频进行音效控制的方法及装置
WO2015144243A1 (en) * 2014-03-28 2015-10-01 Arcelik Anonim Sirketi Image display device with automatic sound enhancement function
CN107331403B (zh) * 2017-06-27 2020-11-06 深圳创维-Rgb电子有限公司 一种基于算法的音频优化方法、智能终端及存储装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101807427A (zh) * 2010-02-26 2010-08-18 中山大学 一种音频输出系统
CN102354497A (zh) * 2010-04-09 2012-02-15 奥迪康有限公司 使用频率变换通过移动包络对声音感知的改进
CN102419981A (zh) * 2011-11-02 2012-04-18 展讯通信(上海)有限公司 音频信号时间尺度和频率尺度缩放处理方法及设备
US9583116B1 (en) * 2014-07-21 2017-02-28 Superpowered Inc. High-efficiency digital signal processing of streaming media
CN105390144A (zh) * 2015-10-15 2016-03-09 广东欧珀移动通信有限公司 一种音频处理方法和音频处理装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10861472B2 (en) 2017-06-27 2020-12-08 Shenzhen Chuangwei-Rgb Electronic Co., Ltd. Algorithm-based audio optimization method, intelligent terminal and storage device
EP3471097A4 (en) * 2017-06-27 2020-02-26 Shenzhen Chuangwei-RGB Electronic Co., Ltd. ALGORITHM-BASED AUDIO OPTIMIZATION METHOD, INTELLIGENT TERMINAL AND STORAGE DEVICE
WO2019000961A1 (zh) * 2017-06-27 2019-01-03 深圳创维-Rgb电子有限公司 一种基于算法的音频优化方法、智能终端及存储装置
CN110035299A (zh) * 2019-04-18 2019-07-19 雷欧尼斯(北京)信息技术有限公司 沉浸式对象音频的压缩传输方法与架构
CN110035299B (zh) * 2019-04-18 2021-02-05 雷欧尼斯(北京)信息技术有限公司 沉浸式对象音频的压缩传输方法与系统
CN110580914A (zh) * 2019-07-24 2019-12-17 安克创新科技股份有限公司 一种音频处理方法、设备及具有存储功能的装置
CN110992739B (zh) * 2019-12-26 2021-06-01 上海松鼠课堂人工智能科技有限公司 学生在线听写系统
CN110992739A (zh) * 2019-12-26 2020-04-10 上海乂学教育科技有限公司 学生在线听写系统
CN111343540A (zh) * 2020-03-05 2020-06-26 维沃移动通信有限公司 一种钢琴音频的处理方法及电子设备
CN111343540B (zh) * 2020-03-05 2021-07-20 维沃移动通信有限公司 一种钢琴音频的处理方法及电子设备
CN112037812A (zh) * 2020-09-01 2020-12-04 深圳爱卓软科技有限公司 音频处理方法
CN116486828A (zh) * 2023-06-14 2023-07-25 北京觅图科技有限公司 一种音频数据处理方法、装置及系统
CN116486828B (zh) * 2023-06-14 2023-09-08 北京觅图科技有限公司 一种音频数据处理方法、装置及系统

Also Published As

Publication number Publication date
EP3471097B1 (en) 2021-04-21
EP3471097A4 (en) 2020-02-26
US20200066286A1 (en) 2020-02-27
WO2019000961A1 (zh) 2019-01-03
CN107331403B (zh) 2020-11-06
EP3471097A1 (en) 2019-04-17
US10861472B2 (en) 2020-12-08

Similar Documents

Publication Publication Date Title
CN107331403A (zh) 一种基于算法的音频优化方法、智能终端及存储装置
US10523168B2 (en) Method and apparatus for processing an audio signal based on an estimated loudness
US8755545B2 (en) Stability and speech audibility improvements in hearing devices
WO2005101898A2 (en) A method and system for sound source separation
US8306821B2 (en) Sub-band periodic signal enhancement system
Westermann et al. Binaural dereverberation based on interaural coherence histograms
CN106572419A (zh) 一种立体声音效增强系统
WO2014113185A1 (en) Vehicle engine sound extraction and reproduction
JP6482880B2 (ja) ミキシング装置、信号ミキシング方法、及びミキシングプログラム
WO2009123387A1 (en) Procedure for processing noisy speech signals, and apparatus and computer program therefor
WO2022256577A1 (en) A method of speech enhancement and a mobile computing device implementing the method
AU2002300314B2 (en) Apparatus And Method For Frequency Transposition In Hearing Aids
WO2022247494A1 (zh) 音频信号补偿方法及装置、耳机、存储介质
CN110853606A (zh) 一种音效配置方法、装置及计算机可读存储介质
US20110235815A1 (en) Method and arrangement for audio signal processing
US20060089836A1 (en) System and method of signal pre-conditioning with adaptive spectral tilt compensation for audio equalization
US9696962B1 (en) Harmonic tracking equalizer
CN115119110A (zh) 音效调节方法、音频播放设备以及计算机可读存储介质
CN114067817A (zh) 低音增强方法、装置、电子设备及存储介质
JPH07146700A (ja) ピッチ強調方法および装置ならびに聴力補償装置
Hoffmann et al. Towards audio signal equalization based on spectral characteristics of a listening room and music content reproduced
US11380345B2 (en) Real-time voice timbre style transform
CN113542983B (zh) 一种音频信号处理方法、装置、设备及存储介质
US20240098401A1 (en) Suspended audio device with bass boost performance
CN117153192B (zh) 音频增强方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant