CN116312601B - 音频处理方法、装置、存储介质及电子设备 - Google Patents

音频处理方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN116312601B
CN116312601B CN202310575741.1A CN202310575741A CN116312601B CN 116312601 B CN116312601 B CN 116312601B CN 202310575741 A CN202310575741 A CN 202310575741A CN 116312601 B CN116312601 B CN 116312601B
Authority
CN
China
Prior art keywords
bit
data
filter
audio
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310575741.1A
Other languages
English (en)
Other versions
CN116312601A (zh
Inventor
鲁勇
刘波
刘海平
梁健林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Intengine Technology Co Ltd
Original Assignee
Beijing Intengine Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Intengine Technology Co Ltd filed Critical Beijing Intengine Technology Co Ltd
Priority to CN202310575741.1A priority Critical patent/CN116312601B/zh
Publication of CN116312601A publication Critical patent/CN116312601A/zh
Application granted granted Critical
Publication of CN116312601B publication Critical patent/CN116312601B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请实施例公开了一种音频处理方法、装置、存储介质及电子设备。该方法包括:获取音频数据的比特符号数和滤波器系数的比特符号数,根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波数据,根据增益放大器系数对所述滤波数据进行放大,以得到放大数据,计算所述增益放大器系数对应的移动比特位,并根据所述移动比特位调整所述放大数据。本申请实施例可以根据增益放大器系数来对滤波以及放大处理后的数据进行调整,从而提升数据计算的准确性,并使得最终的音频数据具备更高的信噪比。

Description

音频处理方法、装置、存储介质及电子设备
技术领域
本申请涉及音频数据处理技术领域,具体涉及一种音频处理方法、装置、存储介质及电子设备。
背景技术
近年来,在语音芯片中,一般都会对数字音频分别进行滤波和放大处理,具体可以通过滤波器以及增益放大器实现上述功能,其中,音频滤波器是依赖于频率的放大器电路,在工作音频范围,0Hz到超过20千赫。音频滤波器可以放大,通过或衰减某些频率范围。具体可以分为低通滤波器、高通滤波器以及带通滤波器。而增益放大器则是一个电子放大器,其放大低功率电子音频信号,例如来自信号无线电接收器或电吉他拾音器到足够高用于驱动电平的扬声器或耳机。
目前,基于语音芯片的成本考虑,在一些现有的技术中会使增益放大器和滤波器共用一个数字乘法器,而最终得到的音频信号需要根据滤波后的数据以及增益放大器的系数共同计算,又由于增益放大器的系数为常量,因此滤波后的数据精度就会影响到最终的音频数据的信噪比,影响其准确性。
发明内容
本申请实施例提供一种音频处理方法、装置、存储介质及电子设备,可以根据增益放大器系数来对滤波以及放大处理后的数据进行调整,从而提升数据计算的准确性,并使得最终的音频数据具备更高的信噪比。
本申请实施例提供了一种音频处理方法,包括:
获取音频数据的比特符号数和滤波器系数的比特符号数;
根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波数据;
根据增益放大器系数对所述滤波数据进行放大,以得到放大数据;
计算所述增益放大器系数对应的移动比特位,并根据所述移动比特位调整所述放大数据。
在一实施例中,所述根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波数据,包括:
根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波器的累加器对应的比特数;
根据所述滤波器的累加器对应的比特数计算所述音频数据对应的滤波数据。
在一实施例中,所述根据增益放大器系数对所述滤波数据进行放大,以得到放大数据,包括:
根据所述音频数据的比特符号数和增益放大器系数的比特符号数计算乘法器对应的比特数以及与所述乘法器对应的比特数对应的第一放大数据;
根据所述第一放大数据以及音频数据的比特符号数确定第二放大数据。
在一实施例中,所述计算所述增益放大器系数对应的移动比特位,包括:
计算所述增益放大器系数对应的底数以及指数;
将所述指数作为移动比特位。
在一实施例中,所述根据所述移动比特位调整所述放大数据,包括:
根据所述移动比特位调整所述滤波器的累加器对应的比特数,并根据所述底数调整所述增益放大器系数;
基于调整后的滤波器的累加器对应的比特数以及增益放大器系数,重新计算所述放大数据。
在一实施例中,在得到所述滤波数据后,所述方法还包括:
舍去滤波器的量化比特数;
在得到所述放大数据后,所述方法还包括:
舍去增益放大器的量化比特数。
在一实施例中,所述方法还包括:
根据所述滤波器系数的比特符号数计算所述滤波器的量化比特数;
根据所述增益放大器系数的比特符号数计算所述增益放大器的量化比特数。
本申请实施例还提供一种音频处理装置,包括:
获取模块,用于获取音频数据的比特符号数和滤波器系数的比特符号数;
滤波模块,用于根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波数据;
放大模块,用于根据增益放大器系数对所述滤波数据进行放大,以得到放大数据;
计算模块,用于计算所述增益放大器系数对应的移动比特位,并根据所述移动比特位调整所述放大数据。
本申请实施例还提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行如上任一实施例所述的音频处理方法中的步骤。
本申请实施例还提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,执行如上任一实施例所述的音频处理方法中的步骤。
本申请实施例提供的音频处理方法、装置、存储介质及电子设备,可以获取音频数据的比特符号数和滤波器系数的比特符号数,根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波数据,根据增益放大器系数对所述滤波数据进行放大,以得到放大数据,计算所述增益放大器系数对应的移动比特位,并根据所述移动比特位调整所述放大数据。本申请实施例可以根据增益放大器系数来对滤波以及放大处理后的数据进行调整,从而提升数据计算的准确性,并使得最终的音频数据具备更高的信噪比。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的音频处理装置的一种系统示意图。
图2为本申请实施例提供的音频处理方法的一种流程示意图。
图3为本申请实施例提供的音频处理方法的另一种流程示意图。
图4为本申请实施例提供的音频处理装置的一种结构示意图。
图5为本申请实施例提供的音频处理装置的另一结构示意图。
图6为本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种音频处理方法、装置、存储介质及电子设备。具体地,本申请实施例的音频处理方法可以由电子设备或服务器执行,其中,该电子设备可以为终端。该终端可以为智能手机、平板电脑、笔记本电脑、触控屏幕、游戏机、个人计算机(PC,PersonalComputer)、个人数字助理(Personal Digital Assistant,PDA)等终端设备,终端还可以包括客户端,该客户端可以是媒体播放客户端或即时通信客户端等。
例如,当该音频处理方法运行于电子设备时,电子设备可以获取音频数据的比特符号数和滤波器系数的比特符号数,根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波数据,根据增益放大器系数对所述滤波数据进行放大,以得到放大数据,计算所述增益放大器系数对应的移动比特位,并根据所述移动比特位调整所述放大数据。其中终端设备可以通过图形用户界面与用户进行交互。该终端设备将图形用户界面提供给用户的方式可以包括多种,例如,可以渲染显示在终端设备的显示屏上,或者,通过全息投影呈现图形用户界面。例如,终端设备可以包括触控显示屏和处理器,该触控显示屏用于呈现图形用户界面以及接收用户作用于图形用户界面产生的操作指令。
请参阅图1,图1为本申请实施例提供的音频处理装置的系统示意图。该系统可以包括至少一个电子设备1000,至少一个服务器或个人电脑2000。用户持有的电子设备1000可以通过网络连接到不同的服务器或个人电脑。电子设备1000可以是具有计算硬件的终端设备,该计算硬件能够支持和执行与多媒体对应的软件产品。另外,电子设备1000还可以具有用于感测和获得用户通过在一个或者多个触控显示屏的多个点执行的触摸或者滑动操作的输入的一个或者多个多触敏屏幕。另外,电子设备1000可以通过网络与服务器或个人电脑2000相互连接。网络可以是无线网络或者有线网络,比如无线网络为无线局域网(WLAN)、局域网(LAN)、蜂窝网络、2G网络、3G网络、4G网络、5G网络等。另外,不同的电子设备1000之间也可以使用自身的蓝牙网络或者热点网络连接到其他嵌入式平台或者连接到服务器以及个人电脑等。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
本申请实施例提供了一种音频处理方法,该方法可以由电子设备或服务器执行。本申请实施例以音频处理方法由电子设备执行为例来进行说明。其中,该电子设备包括触控显示屏和处理器,该触控显示屏用于呈现图形用户界面以及接收用户作用于图形用户界面产生的操作指令。用户通过触控显示屏对图形用户界面进行操作时,该图形用户界面可以通过响应于接收到的操作指令控制电子设备本地的内容,也可以通过响应于接收到的操作指令控制服务器端的内容。例如,用户作用于图形用户界面产生的操作指令包括用于对音频数据进行处理的指令,处理器被配置为在接收到用户提供的指令之后启动对应的应用程序。此外,处理器被配置为在触控显示屏上渲染和绘制与应用程序相关联的图形用户界面。触控显示屏是能够感测屏幕上的多个点同时执行的触摸或者滑动操作的多触敏屏幕。用户在使用手指在图形用户界面上执行触控操作,图形用户界面在检测到触控操作时,控制应用的图形用户界面中显示对应的操作。
请参阅图2,该方法的具体流程可以如下:
步骤101,获取音频数据的比特符号数和滤波器系数的比特符号数。
在一实施例中,上述音频数据为需要进行滤波以及放大的音频数据,具体可以为纯音频文件或视频文件,还可以为从视频文件中提取得到的音频文件,也可以是用户上传的音频文件或者是通过录音文件得到的音频,音频文件或视频文件可以是本地或者从网络下载的文件,还可以是从其他设备获取到的文件。
比如,用户可以通过客户端获取想要处理的音频文件或视频文件,客户端可以将接收到的音频文件作为初始音频数据,或者可以从接收到的音频文件或视频文件中提取音频数据。
在一实施例中,电子设备可以从网络端、本地存储介质或外部存储介质中直接得到音频数据;也可以是从网络端、本地存储介质或外部存储介质中得到未经处理的音频数据,并通过对音频数据进行预处理,上述预处理可以包括降噪处理、数据转换处理等。
以从网络端得到音频数据为例,电子设备可以获取网页中的音频数据,比如通过传入的URL链接得到当前网页的源码,然后使用正则表达式方法获取所需视频或音频的URL,并保存视频或音频的ID以及URL等信息。然后通过保存的视频或音频URL下载对应的视频或音频,具体的,针对下载的视频文件,可以将所有视频转化成相同格式,如mp4、avi、rmvb等。针对下载的音频文件,可以将所有音频转化成采样率16kHz的音频。其中,转换工具可使用ffmpeg、sox等,且视频或音频格式可根据需求调整,本申请对此不作进一步限定。
在获取到上述音频数据后,便可以进一步提取该音频数据的比特符号数,比如该音频数据是一个16bit的信号(bit,比特,是一个数据的计量单位)。其意思是指音频信号数据每秒的传输率16字节。除此之外还需获取滤波器系数的比特符号数,其中,滤波器系数代表滤波器传递函数的逆傅里叶变换的数值,系数定义滤波器的特性,构成数字滤波器实现的基础。
举例来说,音频数据为k比特有符号数,其对应的量化比特数为k-1。而滤波器系数为m比特有符号数,其对应的量化比特即为m-1。也即本实施例可以根据滤波器系数的比特符号数计算滤波器的量化比特数,根据增益放大器系数的比特符号数计算增益放大器的量化比特数。
步骤102,根据音频数据的比特符号数和滤波器系数的比特符号数计算滤波数据。
在一实施例中,在计算滤波数据时可以通过以下至少一种滤波方法:限幅滤波法、中位值滤波法、算术平均滤波法、递推平均滤波法、中位值平均滤波法、限幅平均滤波法、一阶滞后滤波法、加权递推平均滤波法、消抖滤波法、限幅消抖滤波法以及IIR 数字滤波法。
具体的,在计算滤波数据时,还需要依据音频数据的比特符号数和滤波器系数的比特符号数,比如,针对k比特有符号数的音频数据,量化比特数为k-1,其滤波后的音频数据也为k比特有符号数,滤波器系数为m比特有符号数,量化比特数为m-1, 因为共用数字乘法器,该增益放大器系数G也为m比特有符号数,量化比特为m-1。数字滤波器的累加器accum为n比特,其中n>m+k+1,因此通过计算可以得到滤波后的音频取V[k-1:0]=accum[k+m-2:m-1]。舍去滤波器的量化比特数m-1。
步骤103,根据增益放大器系数对滤波数据进行放大,以得到放大数据。
在一实施例中,得到上述滤波后的数据之后,还需要进一步通过放大器对滤波数据进行放大处理,上述放大器可以包括单端音频功率放大器、桥接音频功率放大器以及差分音频功率放大器中的至少一种。具体的,根据该放大器的增益系数对滤波数据进行放大处理,从而得到处理后的放大数据。
举例来说,放大后的音频数据乘法器结果为k+m个比特,因此通过计算可得R[k+m-1:0]=V *G=accum[k+m-2:m-1]*G[m-1:0],其中G为增益放大器系数,也即增益常量,从而放大后的音频数据为k比特有符号数U[k-1:0]= R[k+m-2:m-1]。舍去增益放大器的量化比特数m-1。
步骤104,计算增益放大器系数对应的移动比特位,并根据移动比特位调整放大数据。
在一实施例中,从芯片成本考虑,该数字放大器和滤波器共用一个数字乘法器,还可以通过对增益常量G的判断,以调整滤波后数据V取自累加器accum的位数,使V更精确,提高信噪比。具体的,滤波后的数据V,取自固定的累加器accum的位数V[k-1:0]=accum[k+m-2:m-1]。因为G为常量,其比特位数对增益控制后的音频信号U=V*G并不产生影响,但V的精确度影响到U的信噪比。举例来说,当增益常量G=8.8时,也即放大器对音频数据放大8.8倍,此时U=accum[30:15]*8.8。因为需要放大8.8倍且不饱和,故accum[30:28]为零值。因此我们把累加器往左移3个比特位,放大8倍,而增益常量G向右移动3个比特位,缩小8倍,总放大系数不变。此时V[k-1:0]=accum[k+m-5:m-4],U=accum[27:12]*1.1。由此我们用到了累加器accum中[14:12]3个比特位的数据。至少提高了半比特信噪比。
由上可知,本申请实施例提供的音频处理方法可以获取音频数据的比特符号数和滤波器系数的比特符号数,根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波数据,根据增益放大器系数对所述滤波数据进行放大,以得到放大数据,计算所述增益放大器系数对应的移动比特位,并根据所述移动比特位调整所述放大数据。本申请实施例可以根据增益放大器系数来对滤波以及放大处理后的数据进行调整,从而提升数据计算的准确性,并使得最终的音频数据具备更高的信噪比。
请参阅图3,为本申请实施例提供的音频处理方法的另一流程示意图。该方法的具体流程可以如下:
步骤201,获取音频数据的比特符号数和滤波器系数的比特符号数。
比如,电子设备可以获取网页中的音频数据,比如通过传入的URL链接得到当前网页的源码,然后使用正则表达式方法获取所需视频或音频的URL,并保存视频或音频的ID以及URL等信息。然后通过保存的视频或音频URL下载对应的视频或音频。
步骤202,根据音频数据的比特符号数和滤波器系数的比特符号数计算滤波器的累加器对应的比特数。
进一步的,获取音频数据的比特符号数和滤波器系数的比特符号数,比如音频数据为16比特有符号数,其对应的量化比特数为15。而滤波器系数为16比特有符号数,其对应的量化比特即为15,又由于滤波器与放大器共用数字乘法器,因此放大器增益系数也为16,滤波器的累加器n=16+16+1=33。
步骤203,根据滤波器的累加器对应的比特数计算音频数据对应的滤波数据。
在一实施例中,在得到滤波数据后,方法还包括:舍去滤波器的量化比特数。比如,滤波后的音频数据V[15:0]=accum[30:15],舍去滤波器的量化比特数15。
步骤204,根据音频数据的比特符号数和增益放大器系数的比特符号数计算乘法器对应的比特数以及与乘法器对应的比特数对应的第一放大数据。
步骤205,根据第一放大数据以及音频数据的比特符号数确定第二放大数据。
在一实施例中,在得到第二放大数据后,方法还包括:舍去增益放大器的量化比特数。比如,放大后的音频数据乘法器结果32个比特,R[31:0]= V*G=accum[30:15]*G[15:0],放大后的音频数据16比特 U[15:0] =R[30:15],舍去增益放大器的量化比特数15。
步骤206,计算增益放大器系数对应的底数以及指数,将指数作为移动比特位。
步骤207,根据移动比特位调整滤波器的累加器对应的比特数,并根据底数调整增益放大器系数。
步骤208,基于调整后的滤波器的累加器对应的比特数以及增益放大器系数,重新计算第二放大数据。
具体的,本实施例可以通过对增益常量G的判断,以调整滤波后数据V取自累加器accum的位数,使V更精确,提高信噪比。举例来说,当增益常量G=8.8时,也即放大器对音频数据放大8.8倍,此时U=accum[30:15]*8.8,而经计算可知8=23,因此增益常量G需要向右移动3个比特位,此时V[k-1:0]=accum[k+m-5:m-4],此时U=accum[27:12]*1.1。
本实施例通过对增益G的预先分析,对V的取值精度进行调整,最少影响半比特放大精度,且无任何额外的运算开销。
上述所有的技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
由上可知,本申请实施例提供的音频处理方法可以获取音频数据的比特符号数和滤波器系数的比特符号数,根据音频数据的比特符号数和滤波器系数的比特符号数计算滤波器的累加器对应的比特数,根据滤波器的累加器对应的比特数计算音频数据对应的滤波数据,根据音频数据的比特符号数和增益放大器系数的比特符号数计算乘法器对应的比特数以及与乘法器对应的比特数对应的第一放大数据,根据第一放大数据以及音频数据的比特符号数确定第二放大数据,计算增益放大器系数对应的底数以及指数,将指数作为移动比特位,根据移动比特位调整滤波器的累加器对应的比特数,并根据底数调整增益放大器系数,基于调整后的滤波器的累加器对应的比特数以及增益放大器系数,重新计算第二放大数据。本申请实施例可以根据增益放大器系数来对滤波以及放大处理后的数据进行调整,从而提升数据计算的准确性,并使得最终的音频数据具备更高的信噪比。
为便于更好的实施本申请实施例的音频处理方法,本申请实施例还提供一种音频处理装置。请参阅图4,图4为本申请实施例提供的音频处理装置的一种结构示意图。该音频处理装置可以包括:
获取模块301,用于获取音频数据的比特符号数和滤波器系数的比特符号数;
滤波模块302,用于根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波数据;
放大模块303,用于根据增益放大器系数对所述滤波数据进行放大,以得到放大数据;
计算模块304,用于计算所述增益放大器系数对应的移动比特位,并根据所述移动比特位调整所述放大数据。
在一实施例中,请进一步参阅图5,图5为本申请实施例提供的音频处理装置的另一种结构示意图。其中,滤波模块302可以包括:
第一计算子模块3021,用于根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波器的累加器对应的比特数;
滤波子模块3022,用于根据所述滤波器的累加器对应的比特数计算所述音频数据对应的滤波数据。
在一实施例中,放大模块303可以包括:
第二计算子模块3031,用于根据所述音频数据的比特符号数和增益放大器系数的比特符号数计算乘法器对应的比特数以及与所述乘法器对应的比特数对应的第一放大数据;
放大子模块3032,用于根据所述第一放大数据以及音频数据的比特符号数确定第二放大数据。
上述所有的技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
由上可知,本申请实施例提供的音频处理装置,通过获取音频数据的比特符号数和滤波器系数的比特符号数,根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波数据,根据增益放大器系数对所述滤波数据进行放大,以得到放大数据,计算所述增益放大器系数对应的移动比特位,并根据所述移动比特位调整所述放大数据。本申请实施例可以根据增益放大器系数来对滤波以及放大处理后的数据进行调整,从而提升数据计算的准确性,并使得最终的音频数据具备更高的信噪比。
相应的,本申请实施例还提供一种电子设备,该电子设备可以为终端或者服务器,该终端可以为智能手机、平板电脑、笔记本电脑、触控屏幕、游戏机、个人计算机(PC,PersonalComputer)、个人数字助理(Personal Digital Assistant,PDA)等终端设备。如图6所示,图6为本申请实施例提供的电子设备的结构示意图。该电子设备400包括有一个或者一个以上处理核心的处理器401、有一个或一个以上存储介质的存储器402及存储在存储器402上并可在处理器上运行的计算机程序。其中,处理器401与存储器402电性连接。本领域技术人员可以理解,图中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
处理器401是电子设备400的控制中心,利用各种接口和线路连接整个电子设备400的各个部分,通过运行或加载存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备400的各种功能和处理数据,从而对电子设备400进行整体监控。
在本申请实施例中,电子设备400中的处理器401会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能:
获取音频数据的比特符号数和滤波器系数的比特符号数;
根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波数据;
根据增益放大器系数对所述滤波数据进行放大,以得到放大数据;
计算所述增益放大器系数对应的移动比特位,并根据所述移动比特位调整所述放大数据。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
可选的,如图6所示,电子设备400还包括:触控显示屏403、射频电路404、音频电路405、输入单元406以及电源407。其中,处理器401分别与触控显示屏403、射频电路404、音频电路405、输入单元406以及电源407电性连接。本领域技术人员可以理解,图6中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
触控显示屏403可用于显示图形用户界面以及接收用户作用于图形用户界面产生的操作指令。触控显示屏403可以包括显示面板和触控面板。其中,显示面板可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。可选的,可以采用液晶显示器(LCD,LiquidCrystal Display)、有机发光二极管(OLED,OrganicLight-Emitting Diode)等形式来配置显示面板。触控面板可用于收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并生成相应的操作指令,且操作指令执行对应程序。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器401,并能接收处理器401发来的命令并加以执行。触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器401以确定触摸事件的类型,随后处理器401根据触摸事件的类型在显示面板上提供相应的视觉输出。在本申请实施例中,可以将触控面板与显示面板集成到触控显示屏403而实现输入和输出功能。但是在某些实施例中,触控面板与触控面板可以作为两个独立的部件来实现输入和输出功能。即触控显示屏403也可以作为输入单元406的一部分实现输入功能。
在本申请实施例中,通过处理器401执行应用程序在触控显示屏403上生成图形用户界面。该触控显示屏403用于呈现图形用户界面以及接收用户作用于图形用户界面产生的操作指令。
射频电路404可用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。
音频电路405可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。音频电路405可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路405接收后转换为音频数据,再将音频数据输出处理器401处理后,经射频电路404以发送给比如另一电子设备,或者将音频数据输出至存储器402以便进一步处理。音频电路405还可能包括耳塞插孔,以提供外设耳机与电子设备的通信。
输入单元406可用于接收输入的数字、字符信息或用户特征信息(例如指纹、虹膜、面部信息等),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
电源407用于给电子设备400的各个部件供电。可选的,电源407可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源407还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管图6中未示出,电子设备400还可以包括摄像头、传感器、无线保真模块、蓝牙模块等,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
由上可知,本实施例提供的电子设备,可以获取音频数据的比特符号数和滤波器系数的比特符号数,根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波数据,根据增益放大器系数对所述滤波数据进行放大,以得到放大数据,计算所述增益放大器系数对应的移动比特位,并根据所述移动比特位调整所述放大数据。本申请实施例可以根据增益放大器系数来对滤波以及放大处理后的数据进行调整,从而提升数据计算的准确性,并使得最终的音频数据具备更高的信噪比。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,其中存储有多条计算机程序,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种音频处理方法中的步骤。例如,该计算机程序可以执行如下步骤:
获取音频数据的比特符号数和滤波器系数的比特符号数;
根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波数据;
根据增益放大器系数对所述滤波数据进行放大,以得到放大数据;
计算所述增益放大器系数对应的移动比特位,并根据所述移动比特位调整所述放大数据。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read OnlyMemory)、随机存取记忆体(RAM,Random AccessMemory)、磁盘或光盘等。
由于该存储介质中所存储的计算机程序,可以执行本申请实施例所提供的任一种音频处理方法中的步骤,因此,可以实现本申请实施例所提供的任一种音频处理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种音频处理方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (8)

1.一种音频处理方法,其特征在于,包括:
获取音频数据的比特符号数和滤波器系数的比特符号数;
根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波器的累加器对应的比特数,根据所述滤波器的累加器对应的比特数计算所述音频数据对应的滤波数据,其中,针对k比特有符号数的音频数据,量化比特数为k-1,滤波后的音频数据也为k比特有符号数,滤波器系数为m比特有符号数,量化比特数为m-1,数字滤波器的累加器accum为n比特,其中n>m+k+1,滤波后的音频取V[k-1:0]=accum[k+m-2:m-1];
根据增益放大器系数对所述滤波数据进行放大,以得到放大数据,其中,放大器和滤波器共用一个数字乘法器,放大数据乘法器结果为k+m个比特,计算可得R[k+m-1:0]=V*G=accum[k+m-2:m-1]*G[m-1:0],G为增益放大器系数,放大数据为k比特有符号数U[k-1:0]=R[k+m-2:m-1];
计算所述增益放大器系数对应的底数以及指数,将所述指数作为移动比特位,并根据所述移动比特位调整所述放大数据,增益控制后的音频信号U=V*G,其中,以所述移动比特位作为倍数对滤波器的累加器对应的比特数进行放大,并以所述移动比特位作为倍数对增益放大器系数G进行缩小。
2.如权利要求1所述的音频处理方法,其特征在于,所述根据增益放大器系数对所述滤波数据进行放大,以得到放大数据,包括:
根据所述音频数据的比特符号数和增益放大器系数的比特符号数计算乘法器对应的比特数以及与所述乘法器对应的比特数对应的第一放大数据;
根据所述第一放大数据以及音频数据的比特符号数确定第二放大数据。
3.如权利要求1所述的音频处理方法,其特征在于,所述根据所述移动比特位调整所述放大数据,包括:
根据所述移动比特位调整所述滤波器的累加器对应的比特数,并根据所述指数调整所述增益放大器系数;
基于调整后的滤波器的累加器对应的比特数以及增益放大器系数,重新计算所述放大数据。
4.如权利要求1所述的音频处理方法,其特征在于,在得到所述滤波数据后,所述方法还包括:
舍去滤波器的量化比特数;
在得到所述放大数据后,所述方法还包括:
舍去增益放大器的量化比特数。
5.如权利要求4所述的音频处理方法,其特征在于,所述方法还包括:
根据所述滤波器系数的比特符号数计算所述滤波器的量化比特数;
根据所述增益放大器系数的比特符号数计算所述增益放大器的量化比特数。
6.一种音频处理装置,其特征在于,包括:
获取模块,用于获取音频数据的比特符号数和滤波器系数的比特符号数;
滤波模块,用于根据所述音频数据的比特符号数和滤波器系数的比特符号数计算滤波器的累加器对应的比特数,根据所述滤波器的累加器对应的比特数计算所述音频数据对应的滤波数据,其中,针对k比特有符号数的音频数据,量化比特数为k-1,滤波后的音频数据也为k比特有符号数,滤波器系数为m比特有符号数,量化比特数为m-1,数字滤波器的累加器accum为n比特,其中n>m+k+1,滤波后的音频取V[k-1:0]=accum[k+m-2:m-1];
放大模块,用于根据增益放大器系数对所述滤波数据进行放大,以得到放大数据,其中,放大器和滤波器共用一个数字乘法器,放大数据乘法器结果为k+m个比特,计算可得R[k+m-1:0]=V*G=accum[k+m-2:m-1]*G[m-1:0],G为增益放大器系数,放大数据为k比特有符号数U[k-1:0]=R[k+m-2:m-1];
计算模块,用于计算所述增益放大器系数对应的底数以及指数,将所述指数作为移动比特位,并根据所述移动比特位调整所述放大数据,增益控制后的音频信号U=V*G,其中,以所述移动比特位作为倍数对滤波器的累加器对应的比特数进行放大,并以所述移动比特位作为倍数对增益放大器系数G进行缩小。
7.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行如权利要求1-5任一项所述的音频处理方法中的步骤。
8.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,执行如权利要求1-5任一项所述的音频处理方法中的步骤。
CN202310575741.1A 2023-05-22 2023-05-22 音频处理方法、装置、存储介质及电子设备 Active CN116312601B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310575741.1A CN116312601B (zh) 2023-05-22 2023-05-22 音频处理方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310575741.1A CN116312601B (zh) 2023-05-22 2023-05-22 音频处理方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN116312601A CN116312601A (zh) 2023-06-23
CN116312601B true CN116312601B (zh) 2023-08-29

Family

ID=86815266

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310575741.1A Active CN116312601B (zh) 2023-05-22 2023-05-22 音频处理方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN116312601B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1278637A (zh) * 1999-06-18 2001-01-03 阿尔卡塔尔公司 编码信号的方法
CN101316122A (zh) * 2007-05-31 2008-12-03 大唐移动通信设备有限公司 一种自动增益控制的方法及装置
CN101617362A (zh) * 2007-03-02 2009-12-30 松下电器产业株式会社 语音解码装置和语音解码方法
JP2010114553A (ja) * 2008-11-05 2010-05-20 Mitsubishi Electric Corp 音声信号処理装置及び方法
CN115514344A (zh) * 2022-11-04 2022-12-23 深圳时识科技有限公司 数字带通滤波器、滤波方法、音频特征提取器和芯片

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1278637A (zh) * 1999-06-18 2001-01-03 阿尔卡塔尔公司 编码信号的方法
CN101617362A (zh) * 2007-03-02 2009-12-30 松下电器产业株式会社 语音解码装置和语音解码方法
CN101316122A (zh) * 2007-05-31 2008-12-03 大唐移动通信设备有限公司 一种自动增益控制的方法及装置
JP2010114553A (ja) * 2008-11-05 2010-05-20 Mitsubishi Electric Corp 音声信号処理装置及び方法
CN115514344A (zh) * 2022-11-04 2022-12-23 深圳时识科技有限公司 数字带通滤波器、滤波方法、音频特征提取器和芯片

Also Published As

Publication number Publication date
CN116312601A (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
CN106782613B (zh) 信号检测方法及装置
CN112308806B (zh) 图像处理方法、装置、电子设备以及可读存储介质
CN111083289B (zh) 音频播放方法、装置、存储介质及移动终端
CN109817241B (zh) 音频处理方法、装置及存储介质
CN106384597B (zh) 一种音频数据处理方法、及设备
CN109243488B (zh) 音频检测方法、装置及存储介质
CN108492837B (zh) 音频突发白噪声的检测方法、装置及存储介质
EP4131907A1 (en) Sound recording method and apparatus
CN112532958B (zh) 图像处理方法、装置、电子设备以及可读存储介质
CN111477243A (zh) 音频信号处理方法及电子设备
CN107452399B (zh) 音频特征提取方法及装置
CN116312601B (zh) 音频处理方法、装置、存储介质及电子设备
CN116994596A (zh) 啸叫抑制方法、装置、存储介质及电子设备
CN116486833B (zh) 音频增益调整方法、装置、存储介质及电子设备
CN115985323B (zh) 语音唤醒方法、装置、电子设备及可读存储介质
WO2023143544A1 (zh) 语音控制方法、装置、设备、介质及智能语音采集系统
CN113593602B (zh) 一种音频处理方法、装置、电子设备和存储介质
CN111402876A (zh) 数据传输方法、装置及设备
CN113990363A (zh) 一种音频播放参数调整方法、装置、电子设备和存储介质
CN109963235B (zh) 一种声音信号处理方法及移动终端
CN109240986B (zh) 一种日志处理方法、装置及存储介质
US10127009B2 (en) Data processing method and terminal thereof
WO2020107385A1 (zh) 增益处理方法及其装置、电子设备、信号采集方法及其系统
CN111309224A (zh) 音效调节方法、装置、存储介质及移动终端
CN117387655B (zh) 计步方法、装置、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Audio processing methods, devices, storage media, and electronic devices

Granted publication date: 20230829

Pledgee: Jiang Wei

Pledgor: BEIJING INTENGINE TECHNOLOGY Co.,Ltd.

Registration number: Y2024980019734