CN113362839A - 音频数据处理方法、装置、计算机设备及存储介质 - Google Patents

音频数据处理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN113362839A
CN113362839A CN202110610485.6A CN202110610485A CN113362839A CN 113362839 A CN113362839 A CN 113362839A CN 202110610485 A CN202110610485 A CN 202110610485A CN 113362839 A CN113362839 A CN 113362839A
Authority
CN
China
Prior art keywords
audio
hearing
gain
information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110610485.6A
Other languages
English (en)
Inventor
张之勇
王健宗
程宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110610485.6A priority Critical patent/CN113362839A/zh
Publication of CN113362839A publication Critical patent/CN113362839A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请实施例属于音频处理领域,涉及一种音频数据处理方法、装置、计算机设备及存储介质,方法包括:获取待处理音频以及预先计算好的听力增益信息,所述听力增益信息包括若干个频段上的增益信息;根据所述听力增益信息对所述待处理音频进行放大,得到第一音频;获取输入的压缩参数以及平滑增益参数;根据所述压缩参数对所述第一音频进行压缩,得到第二音频;基于所述平滑增益参数对所述第二音频进行增益补偿,得到待输出音频;将所述待输出音频发送至音频播放器,以指示所述音频播放器播放所述待输出音频。此外,本申请还涉及区块链技术,听力增益信息可存储于区块链中。本申请提高了音频数据处理效率。

Description

音频数据处理方法、装置、计算机设备及存储介质
技术领域
本申请涉及音频处理技术领域,尤其涉及一种音频处理方法、装置、计算机设备及存储介质。
背景技术
正常的人耳能够感知频率范围广泛的声音,然而听力损失(hearing disorders)会使人耳对低响度声音的敏感度降低,导致对声音的感知缺陷。助听器是改善听力常用的装备,它将声音信号映射到听力损失人群可识别的听力范围,使他们可以正常接受到声音信号。
然而,当前的助听器安装与调试都需要通过医用助听器软件完成,用户需要专程赶去医院,人力和时间成本较高;助听器的安装需要考虑用户的喜好和意见,当助听器安装不合适、或者用户对助听器产生调整需求时,需要重新到医院进行调试,过程繁琐,用户无法及时通过助听器对音频数据进行处理、收听,导致音频数据处理效率较低。
发明内容
本申请实施例的目的在于提出一种音频数据处理方法、装置、计算机设备及存储介质,以解决音频数据处理效率较低的问题。
为了解决上述技术问题,本申请实施例提供一种音频数据处理方法,采用了如下所述的技术方案:
获取待处理音频以及预先计算好的听力增益信息,所述听力增益信息包括若干个频段上的增益信息;
根据所述听力增益信息对所述待处理音频进行放大,得到第一音频;
获取输入的压缩参数以及平滑增益参数;
根据所述压缩参数对所述第一音频进行压缩,得到第二音频;
基于所述平滑增益参数对所述第二音频进行增益补偿,得到待输出音频;
将所述待输出音频发送至音频播放器,以指示所述音频播放器播放所述待输出音频。
为了解决上述技术问题,本申请实施例还提供一种音频数据处理装置,采用了如下所述的技术方案:
获取模块,用于获取待处理音频以及预先计算好的听力增益信息,所述听力增益信息包括若干个频段上的增益信息;
音频放大模块,用于根据所述听力增益信息对所述待处理音频进行放大,得到第一音频;
参数获取模块,用于获取输入的压缩参数以及平滑增益参数;
音频压缩模块,用于根据所述压缩参数对所述第一音频进行压缩,得到第二音频;
增益补偿模块,用于基于所述平滑增益参数对所述第二音频进行增益补偿,得到待输出音频;
音频发送模块,用于将所述待输出音频发送至音频播放器,以指示所述音频播放器播放所述待输出音频。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
获取待处理音频以及预先计算好的听力增益信息,所述听力增益信息包括若干个频段上的增益信息;
根据所述听力增益信息对所述待处理音频进行放大,得到第一音频;
获取输入的压缩参数以及平滑增益参数;
根据所述压缩参数对所述第一音频进行压缩,得到第二音频;
基于所述平滑增益参数对所述第二音频进行增益补偿,得到待输出音频;
将所述待输出音频发送至音频播放器,以指示所述音频播放器播放所述待输出音频。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
获取待处理音频以及预先计算好的听力增益信息,所述听力增益信息包括若干个频段上的增益信息;
根据所述听力增益信息对所述待处理音频进行放大,得到第一音频;
获取输入的压缩参数以及平滑增益参数;
根据所述压缩参数对所述第一音频进行压缩,得到第二音频;
基于所述平滑增益参数对所述第二音频进行增益补偿,得到待输出音频;
将所述待输出音频发送至音频播放器,以指示所述音频播放器播放所述待输出音频。
与现有技术相比,本申请实施例主要有以下有益效果:获取待处理音频和预先计算好的听力增益信息,其中,听力增益信息包括若干个频段上的增益信息;听力增益信息根据用户的听力状况得到,根据听力增益信息对待处理音频进行放大,得到符合用户听力状况的第一音频;用户可以通过终端对音频数据处理进行个性化定制、输入压缩参数以及平滑增益参数;压缩参数用于音频压缩以减小带宽,提高传输速度;平滑增益参数用于对压缩后的音频进行增益补偿,以平滑音频信号,得到待输出音频,待输出音频可以经音频播放器输出,本申请借助终端即可实现音频数据处理的个性化设置,操作便捷,提高了音频数据处理效率。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的音频数据处理方法的一个实施例的流程图;
图3是根据本申请的音频数据处理装置的一个实施例的结构示意图;
图4是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving PictureExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(MovingPictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的音频数据处理方法一般由终端执行,相应地,音频数据处理装置一般设置于终端中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的音频数据处理方法的一个实施例的流程图。所述的音频数据处理方法,包括以下步骤:
步骤S201,获取待处理音频以及预先计算好的听力增益信息,听力增益信息包括若干个频段上的增益信息。
在本实施例中,音频数据处理方法运行于其上的电子设备(例如图1所示的终端)可以通过有线连接方式或者无线连接方式与服务器进行通信。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
具体地,本申请通过终端替代传统的助听器,为患有听力损失的用户进行音频处理。在实际应用中,终端包括但不限于各种智能手机、平板电脑、工业计算机、个人计算机、膝上型便携计算机和台式计算机,这些终端具有传统助听器的基本组件,具有强大的音频数据处理能力和易用性,具有替代传统助听器的潜质。
当终端中存在需要输出的音频时,终端会触发音频输出指令,终端根据音频输出指令获取待输出音频,并获取预先计算好的、存储在终端中的听力增益信息。
听力增益信息包括若干个频段上的增益信息,增益信息可以是增益值。听力增益信息是根据用户的听力状况得到的,当用户患有听力损失时,针对该用户的听力增益信息可以针对性地对用户将要收听的音频进行放大,以使用户可以正常地听到声音。
进一步的,上述步骤S201可以包括:当接收到音频输出指令时,根据音频输出指令获取初始音频以及预先计算好的听力增益信息,初始音频包括通话音频和页面音频;根据预设的降噪算法对初始音频进行降噪,得到待处理音频。
其中,音频输出指令可以是指示终端输出音频的指令。初始音频是尚未进行处理的音频,初始音频经过一系列处理由音频播放器进行输出。
具体地,当用户通过终端进行语音通话,或者用户在终端展示的页面中进行音频播放操作时,终端会触发音频输出指令。终端根据音频输出指令获取初始音频。初始音频可以通过采样得到。
初始音频包括通话音频和页面音频。当用户进行语音通话时,初始音频可以是通话中产生的通话音频;当用户在页面中进行音频播放操作时,页面中多媒体播放产生的音频即为页面音频。通话音频和页面音频涵盖了各种场景下用户可能听到的声音,保证了用户在各种场景下均可以通过终端实现音频数据处理。
终端可以先根据预设的降噪算法对初始音频进行降噪处理,降噪算法包括但不限于谱减法、最小均方误差法或维纳滤波器算法,降噪处理后得到待处理音频。
听力增益信息存储在终端中,终端接收到音频输出指令后,还要获取听力增益信息。
本实施例中,在接收到音频输出指令后,获取初始音频并对初始音频进行降噪处理,从而得到较为纯净的待处理音频。
需要强调的是,为进一步保证上述听力增益信息的私密和安全性,上述听力增益信息还可以存储于一区块链的节点中。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
步骤S202,根据听力增益信息对待处理音频进行放大,得到第一音频。
具体地,患有听力损失的用户在不同频段的音频上的听力感知能力是有差异的,即,在不同频段的音频上,对低响度音频的敏感度并不相同,例如,当音频信号频率为250Hz时,用户最低可感知15dB的声音,当音频信号频率为500Hz时,用户最低可感知20dB的声音,因此,对于不同频段的音频信号,需要采用不同的增益值。
听力增益信息包括多个频段上的增益信息,增益信息可以是具体的增益值。终端根据听力增益信息,对待处理音频中不同频段的音频信号进行放大,得到第一音频。
步骤S203,获取输入的压缩参数以及平滑增益参数。
其中,压缩参数是对音频信号进行压缩时涉及的参数,压缩参数可以包括若干种参数;平滑增益参数是对音频信号进行增益补偿时涉及的参数,平滑增益参数可以包括若干种参数。
具体地,在向用户播放音频之前,还需要对第一音频进行压缩处理和增益补偿,以对音频信号进行进一步的改善。终端根据压缩参数和平滑增益参数对音频信号进行压缩和增益补偿。压缩参数和平滑增益参数可以由用户输入,用户可以自行调节压缩参数和平滑增益参数,以获得更好的体验。
步骤S204,根据压缩参数对第一音频进行压缩,得到第二音频。
具体地,终端根据用户输入的压缩参数对第一音频进行压缩处理,压缩处理可以减小音频信号的带宽,提高音频信号的传输速度;同时,压缩可以对第一音频中的高强度信号进行衰减,防止放大后的信号过强,损害用户听力。压缩处理后得到第二音频。
步骤S205,基于平滑增益参数对第二音频进行增益补偿,得到待输出音频。
具体地,压缩可能会对音频信号的平滑性造成影响,为了防止最后输出的音频信号失真,还需要再对压缩后的音频信号进行增益补偿,以提高音频信号的连续性与平滑性。终端根据平滑增益参数对第二音频进行增益补偿,得到待输出音频。
步骤S206,将待输出音频发送至音频播放器,以指示音频播放器播放待输出音频。
具体地,终端将待输出音频发送至音频播放器,由音频播放器播放待输出音频,音频播放器可以是终端内部的音频播放器,还可以是外置的音频播放器,例如,音频播放器可以是终端外接的助听器,从而实现基于终端对助听器进行设置与调试。
本实施例中,获取待处理音频和预先计算好的听力增益信息,其中,听力增益信息包括若干个频段上的增益信息;听力增益信息根据用户的听力状况得到,根据听力增益信息对待处理音频进行放大,得到符合用户听力状况的第一音频;用户可以通过终端对音频数据处理进行个性化定制、输入压缩参数以及平滑增益参数;压缩参数用于音频压缩以减小带宽,提高传输速度;平滑增益参数用于对压缩后的音频进行增益补偿,以平滑音频信号,得到待输出音频,待输出音频可以经音频播放器输出,本申请借助终端即可实现音频数据处理的个性化设置,操作便捷,提高了音频数据处理效率。
进一步的,上述步骤S201之前,还可以包括:获取预先存储的用户听力信息;在终端展示的配置页面中展示预设的增益计算算法;根据用户在配置页面中选取的增益计算算法对用户听力信息进行计算,得到听力增益信息。
其中,用户听力信息可以是记录用户耳朵听力状况的信息;配置页面可以是终端显示的页面,用于对音频数据处理进行个性化设置;增益计算算法用于指示如何根据用户听力信息计算听力增益信息。
具体地,听力增益信息可以预先计算得到。终端可以预先存储用户的用户听力信息,并通过配置页面展示预设的增益计算算法,用户可以自行选择增益计算算法。增益计算算法可以是助听器验配公式,在一个实施例中,助听器验配公式包括DSL-v5、NAL-NL2和半增益规则。终端根据用户选取的增益计算算法对用户听力信息进行计算,得到与用户相关联的听力增益信息。
本实施例中,在终端的配置页面中展示增益计算算法,并根据用户选取的增益计算算法计算听力增益信息,实现了音频数据处理个性化设置。
进一步的,上述获取预先存储的用户听力信息的步骤之前,还可以包括:当接收到听力检测指令时,通过音频播放器进行用户听力测试,得到听力图;将听力图确定为用户听力信息;或者,根据终端的配置页面中触发的听力信息获取指令,获取用户听力信息。
其中,听力检测指令可以是指示终端对用户进行听力测试的指令;听力信息获取指令可以是指示终端获取用户听力信息的指令。
具体地,用户可以借助终端实现用户听力测试。终端可以安装有音频数据处理的应用,用户可以点击应用页面中的听力检测按钮,触发听力检测指令。可以将音频信号分为若干个频段,在进行用户听力测试时,终端通过音频播放器播放各频段中心频率的音频信号,并且在播放一种频率的音频信号时,音频信号的响度按照由小到大的规律进行变化,或者按照由大到小的规律进行变化。对于某一频率的音频信号,当音频信号的响度刚好达到用户听得到和听不到的临界点时,记录此时的响度作为用户在该频率下的听力阈值。完成所有中心频率的检测后,可以根据频率、听力阈值得到听力图,听力图的横坐标为频率,纵坐标为以分贝数表示的听力阈值,听力图将作为用户听力信息。
举例说明,将音频信号分为8个频段,每个频段的中心频率分别为0.25kHz、0.5kHz、1kHz、2kHz、3kHz、4kHz、6kHz和8kHz。终端先播放0.25kHz的音频信号,且音频信号的响度从0dB开始递增,当递增至10dB时,用户听到声音,操作终端记录10dB为0.25kHz的听力阈值。最后,根据各中心频率及其对应的听力阈值得到听力图。
用户也可以操作终端以其他方式获取用户听力信息,例如,用户操作终端查看存储在终端本地的用户听力信息并点击确认,触发听力信息获取指令,终端根据听力信息获取指令获取选定的用户听力信息。
用户还可以操作终端通过互联网获取用户听力信息,例如,从医院的数据库中获取用户听力信息,用户操作终端触发听力信息获取指令,终端根据听力信息获取指令获取用户听力信息。
本实施例中,可以由终端进行用户听力测试得到用户听力信息,或者根据用户操作触发的听力信息获取指令获取用户听力信息,丰富了用户听力信息的获取方式。
进一步的,上述步骤S202可以包括:对待处理音频进行傅里叶变换,得到待处理音频的频域音频信号;对频域音频信号进行对数变换,得到待增益音频信号;根据听力增益信息,确定待增益音频信号中各频段信号的增益信息;根据确定的增益信息对待增益音频信号中各频段信号进行放大,得到第一音频。
具体地,终端首先对待处理音频x(n)进行傅里叶变换,在一个实施例中,终端对待处理音频x(n)做短时傅里叶变换,将时域信号转换为频域信号,得到频域音频信号X(n,k)。然后再对频域音频信号X(n,k)进行对数变换,得到待增益音频信号XL(n,k)。在一个实施例中,对数变换如下:
XL(n,k)=10log10|X(n,k)2| (1)
听力增益信息可以将音频信号划分为若干个频段,处于同一频段中的音频信号具有相同的增益信息。在一个实施例中,共有8个频段,每个频段的中心频率分别为0.25kHz、0.5kHz、1kHz、2kHz、3kHz、4kHz、6kHz和8kHz。终端根据听力增益信息确定待增益音频信号中各频段信号的增益信息A(k);对于各频段信号,根据确定的增益信息A(k)进行信号放大,得到第一音频XG(n,k)。
XG(n,k)=XL(n,k)+A(k) (2)
本实施例中,对待处理音频进行时频转换和对数变换,再根据各频段信号的增益信息进行信号放大,使得各频段信号的信号强度高于用户的听力阈值,保证了用户可以听清楚各频段的声音。
进一步的,上述步骤S204可以包括:根据压缩参数,确定第一音频中各频段信号的压缩方式;根据确定的压缩方式,对第一音频中各频段信号进行压缩,得到第二音频。
具体地,压缩参数包括若干种不同的参数,在一个实施例中,压缩参数包括压缩阈值T、拐点宽度W和压缩比CR。终端首先根据压缩阈值T和拐点宽度W判断第一音频XG(n,k)中各频段信号的压缩方式,然后按照确定的压缩方式对各频段信号进行压缩,得到第二音频VG。其中,压缩可以按照如下公式进行:
Figure BDA0003095637130000111
本实施例中,根据压缩参数确定第一音频中各频段信号的压缩方式,从而根据确定的压缩方式对各频段信号进行压缩,降低了信号带宽,提高了音频信号的传输速率。
进一步的,上述步骤S205可以包括:根据平滑增益参数,计算第二音频的音频峰值;根据待处理音频的频域音频信号、平滑增益参数和音频峰值对第二音频进行增益补偿,得到待输出音频。
具体地,平滑增益参数包括若干种参数,在一个实施例中,平滑增益参数包括启动时间τA、释放时间τB和补偿增益值M。在进行增益补偿时,先结合第二音频VG、待增益音频信号XL(n,k)、启动时间常数αA和释放时间常数αR计算第二音频VG的音频峰值ZG,计算公式如下:
Figure BDA0003095637130000112
其中,WG=VG-XL,由第二音频VG和待增益音频信号XL(n,k)计算得到;启动时间常数
Figure BDA0003095637130000121
释放时间常数
Figure BDA0003095637130000122
其中fs为得到初始音频时的采样频率,K是声压级启动常量。
再根据音频峰值ZG、补偿增益值M和频域音频信号X(n,k)计算得到待输出音频Y(n,k):
Figure BDA0003095637130000123
本实施例中,根据平滑增益参数对第二音频进行增益补偿,以提高音频信号的连续性和光滑性,得到可以输出的音频信号。
本申请可以针对用户的左耳与右耳单独进行音频信号处理,即,用户的左耳可以有一套用户听力信息、听力增益信息、压缩参数和平滑增益参数,右耳可以有一套用户听力信息、听力增益信息、压缩参数和平滑增益参数,这样,在用户左耳和右耳听力状况不一致时,可以进行针对性设置,改善用户体验。根据用户设置的增益计算算法、压缩参数和平滑增益参数进行音频数据处理,用户听到声音后,还可以重新选择增益计算算法、压缩参数和平滑增益参数,来达到最舒适的使用效果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
进一步参考图3,作为对上述图2所示方法的实现,本申请提供了一种音频数据处理装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图3所示,本实施例所述的音频数据处理装置300包括:获取模块301、音频放大模块302、参数获取模块303、音频压缩模块304、增益补偿模块305以及音频发送模块306,其中:
获取模块301,用于获取待处理音频以及预先计算好的听力增益信息,听力增益信息包括若干个频段上的增益信息。
音频放大模块302,用于根据听力增益信息对待处理音频进行放大,得到第一音频。
参数获取模块303,用于获取输入的压缩参数以及平滑增益参数。
音频压缩模块304,用于根据压缩参数对第一音频进行压缩,得到第二音频。
增益补偿模块305,用于基于平滑增益参数对第二音频进行增益补偿,得到待输出音频。
音频发送模块306,用于将待输出音频发送至音频播放器,以指示音频播放器播放待输出音频。
本实施例中,获取待处理音频和预先计算好的听力增益信息,其中,听力增益信息包括若干个频段上的增益信息;听力增益信息根据用户的听力状况得到,根据听力增益信息对待处理音频进行放大,得到符合用户听力状况的第一音频;用户可以通过终端对音频数据处理进行个性化定制、输入压缩参数以及平滑增益参数;压缩参数用于音频压缩以减小带宽,提高传输速度;平滑增益参数用于对压缩后的音频进行增益补偿,以平滑音频信号,得到待输出音频,待输出音频可以经音频播放器输出,本申请借助终端即可实现音频数据处理的个性化设置,操作便捷,提高了音频数据处理效率。
在本实施例的一些可选的实现方式中,音频数据处理装置300还可以包括:信息获取模块、算法展示模块以及信息计算模块,其中:
信息获取模块,用于获取预先存储的用户听力信息。
算法展示模块,用于在终端展示的配置页面中展示预设的增益计算算法。
信息计算模块,用于根据用户在配置页面中选取的增益计算算法对用户听力信息进行计算,得到听力增益信息。
本实施例中,在终端的配置页面中展示增益计算算法,并根据用户选取的增益计算算法计算听力增益信息,实现了音频数据处理个性化设置。
在本实施例的一些可选的实现方式中,音频数据处理装置300还可以包括:听力测试模块、听力图确定模块以及听力信息获取模块,其中:
听力测试模块,用于当接收到听力检测指令时,通过音频播放器进行用户听力测试,得到听力图。
听力图确定模块,用于将听力图确定为用户听力信息。
听力信息获取模块,用于根据终端的配置页面中触发的听力信息获取指令,获取用户听力信息。
本实施例中,可以由终端进行用户听力测试得到用户听力信息,或者根据用户操作触发的听力信息获取指令获取用户听力信息,丰富了用户听力信息的获取方式。
在本实施例的一些可选的实现方式中,获取模块301可以包括:获取子模块以及降噪子模块,其中:
获取子模块,用于当接收到音频输出指令时,根据音频输出指令获取初始音频以及预先计算好的听力增益信息,初始音频包括通话音频和页面音频。
降噪子模块,用于根据预设的降噪算法对初始音频进行降噪,得到待处理音频。
本实施例中,在接收到音频输出指令后,获取初始音频并对初始音频进行降噪处理,从而得到较为纯净的待处理音频。
在本实施例的一些可选的实现方式中,音频放大模块302可以包括:音频变换子模块、对数变换子模块、增益确定子模块以及信号放大子模块,其中:
音频变换子模块,用于对待处理音频进行傅里叶变换,得到待处理音频的频域音频信号。
对数变换子模块,用于对频域音频信号进行对数变换,得到待增益音频信号。
增益确定子模块,用于根据听力增益信息,确定待增益音频信号中各频段信号的增益信息。
信号放大子模块,用于根据确定的增益信息对待增益音频信号中各频段信号进行放大,得到第一音频。
本实施例中,对待处理音频进行时频转换和对数变换,再根据各频段信号的增益信息进行信号放大,使得各频段信号的信号强度高于用户的听力阈值,保证了用户可以听清楚各频段的声音。
在本实施例的一些可选的实现方式中,音频压缩模块304可以包括:方式确定子模块以及信号压缩子模块,其中:
方式确定子模块,用于根据压缩参数,确定第一音频中各频段信号的压缩方式。
信号压缩子模块,用于根据确定的压缩方式,对第一音频中各频段信号进行压缩,得到第二音频。
本实施例中,根据压缩参数确定第一音频中各频段信号的压缩方式,从而根据确定的压缩方式对各频段信号进行压缩,降低了信号带宽,提高了音频信号的传输速率。
在本实施例的一些可选的实现方式中,增益补偿模块305可以包括:峰值计算子模块以及增益补偿子模块,其中:
峰值计算子模块,用于根据平滑增益参数,计算第二音频的音频峰值。
增益补偿子模块,用于根据待处理音频的频域音频信号、平滑增益参数和音频峰值对第二音频进行增益补偿,得到待输出音频。
本实施例中,根据平滑增益参数对第二音频进行增益补偿,以提高音频信号的连续性和光滑性,得到可以输出的音频信号。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43、音频播放器44。需要指出的是,图中仅示出了具有组件41-44的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如音频数据处理方法的计算机可读指令等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的计算机可读指令或者处理数据,例如运行所述音频数据处理方法的计算机可读指令。
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
音频播放器44用于输出音频,可以包括外接的助听器。
本实施例中提供的计算机设备可以执行上述音频数据处理方法。此处音频数据处理方法可以是上述各个实施例的音频数据处理方法。
本实施例中,获取待处理音频和预先计算好的听力增益信息,其中,听力增益信息包括若干个频段上的增益信息;听力增益信息根据用户的听力状况得到,根据听力增益信息对待处理音频进行放大,得到符合用户听力状况的第一音频;用户可以通过终端对音频数据处理进行个性化定制、输入压缩参数以及平滑增益参数;压缩参数用于音频压缩以减小带宽,提高传输速度;平滑增益参数用于对压缩后的音频进行增益补偿,以平滑音频信号,得到待输出音频,待输出音频可以经音频播放器输出,本申请借助终端即可实现音频数据处理的个性化设置,操作便捷,提高了音频数据处理效率。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的音频数据处理方法的步骤。
本实施例中,获取待处理音频和预先计算好的听力增益信息,其中,听力增益信息包括若干个频段上的增益信息;听力增益信息根据用户的听力状况得到,根据听力增益信息对待处理音频进行放大,得到符合用户听力状况的第一音频;用户可以通过终端对音频数据处理进行个性化定制、输入压缩参数以及平滑增益参数;压缩参数用于音频压缩以减小带宽,提高传输速度;平滑增益参数用于对压缩后的音频进行增益补偿,以平滑音频信号,得到待输出音频,待输出音频可以经音频播放器输出,本申请借助终端即可实现音频数据处理的个性化设置,操作便捷,提高了音频数据处理效率。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (10)

1.一种音频数据处理方法,其特征在于,包括下述步骤:
获取待处理音频以及预先计算好的听力增益信息,所述听力增益信息包括若干个频段上的增益信息;
根据所述听力增益信息对所述待处理音频进行放大,得到第一音频;
获取输入的压缩参数以及平滑增益参数;
根据所述压缩参数对所述第一音频进行压缩,得到第二音频;
基于所述平滑增益参数对所述第二音频进行增益补偿,得到待输出音频;
将所述待输出音频发送至音频播放器,以指示所述音频播放器播放所述待输出音频。
2.根据权利要求1所述的音频数据处理方法,其特征在于,在所述获取待处理音频以及预先计算好的听力增益信息,所述音频增益包括若干个频段上的增益信息的步骤之前,还包括:
获取预先存储的用户听力信息;
在终端展示的配置页面中展示预设的增益计算算法;
根据用户在所述配置页面中选取的增益计算算法对所述用户听力信息进行计算,得到听力增益信息。
3.根据权利要求2所述的音频数据处理方法,其特征在于,所述获取预先存储的用户听力信息的步骤之前,还包括:
当接收到听力检测指令时,通过音频播放器进行用户听力测试,得到听力图;
将所述听力图确定为用户听力信息;
或者,
根据终端的配置页面中触发的听力信息获取指令,获取用户听力信息。
4.根据权利要求1所述的音频数据处理方法,其特征在于,所述获取待处理音频以及预先计算好的听力增益信息的步骤包括:
当接收到音频输出指令时,根据所述音频输出指令获取初始音频以及预先计算好的听力增益信息,所述初始音频包括通话音频和页面音频;
根据预设的降噪算法对所述初始音频进行降噪,得到待处理音频。
5.根据权利要求1所述的音频数据处理方法,其特征在于,所述根据所述听力增益信息对所述待处理音频进行放大,得到第一音频的步骤包括:
对所述待处理音频进行傅里叶变换,得到所述待处理音频的频域音频信号;
对所述频域音频信号进行对数变换,得到待增益音频信号;
根据所述听力增益信息,确定所述待增益音频信号中各频段信号的增益信息;
根据确定的增益信息对所述待增益音频信号中各频段信号进行放大,得到第一音频。
6.根据权利要求1所述的音频数据处理方法,其特征在于,所述根据所述压缩参数对所述第一音频进行压缩,得到第二音频的步骤包括:
根据所述压缩参数,确定所述第一音频中各频段信号的压缩方式;
根据确定的压缩方式,对所述第一音频中各频段信号进行压缩,得到第二音频。
7.根据权利要求1所述的音频数据处理方法,其特征在于,所述基于所述平滑增益参数对所述第二音频进行增益补偿,得到待输出音频的步骤包括:
根据所述平滑增益参数,计算所述第二音频的音频峰值;
根据所述待处理音频的频域音频信号、所述平滑增益参数和所述音频峰值对所述第二音频进行增益补偿,得到待输出音频。
8.一种音频数据处理装置,其特征在于,包括:
获取模块,用于获取待处理音频以及预先计算好的听力增益信息,所述听力增益信息包括若干个频段上的增益信息;
音频放大模块,用于根据所述听力增益信息对所述待处理音频进行放大,得到第一音频;
参数获取模块,用于获取输入的压缩参数以及平滑增益参数;
音频压缩模块,用于根据所述压缩参数对所述第一音频进行压缩,得到第二音频;
增益补偿模块,用于基于所述平滑增益参数对所述第二音频进行增益补偿,得到待输出音频;
音频发送模块,用于将所述待输出音频发送至音频播放器,以指示所述音频播放器播放所述待输出音频。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的音频数据处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的音频数据处理方法的步骤。
CN202110610485.6A 2021-06-01 2021-06-01 音频数据处理方法、装置、计算机设备及存储介质 Pending CN113362839A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110610485.6A CN113362839A (zh) 2021-06-01 2021-06-01 音频数据处理方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110610485.6A CN113362839A (zh) 2021-06-01 2021-06-01 音频数据处理方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN113362839A true CN113362839A (zh) 2021-09-07

Family

ID=77531028

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110610485.6A Pending CN113362839A (zh) 2021-06-01 2021-06-01 音频数据处理方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN113362839A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114267382A (zh) * 2021-12-28 2022-04-01 深圳万兴软件有限公司 音乐音效处理的限制器控制方法、装置、设备及介质
WO2024093536A1 (zh) * 2022-11-03 2024-05-10 Oppo广东移动通信有限公司 音频信号处理方法及装置、音频播放设备、存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6094489A (en) * 1996-09-13 2000-07-25 Nec Corporation Digital hearing aid and its hearing sense compensation processing method
EP1448022A1 (en) * 2003-02-14 2004-08-18 GN ReSound A/S Dynamic Compression in a hearing aid
CN101808265A (zh) * 2008-12-23 2010-08-18 Gn瑞声达A/S 自适应反馈增益校正
EP2265039A1 (en) * 2009-02-09 2010-12-22 Panasonic Corporation Hearing aid
CN104902419A (zh) * 2014-12-26 2015-09-09 深圳市微纳集成电路与系统应用研究院 一种适用于数字助听器的移频压缩方法
US20180176696A1 (en) * 2016-12-16 2018-06-21 Gn Hearing A/S Binaural hearing device system with a binaural impulse environment detector
CN110012406A (zh) * 2019-04-10 2019-07-12 深圳湃声声学科技有限公司 音频信号处理方法、装置、处理器及骨传导助听器
US20200065058A1 (en) * 2018-08-22 2020-02-27 Mimi Hearing Technologies GmbH Systems and methods for sound enhancement in audio systems
CN111447539A (zh) * 2020-03-25 2020-07-24 北京聆通科技有限公司 一种用于听力耳机的验配方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6094489A (en) * 1996-09-13 2000-07-25 Nec Corporation Digital hearing aid and its hearing sense compensation processing method
EP1448022A1 (en) * 2003-02-14 2004-08-18 GN ReSound A/S Dynamic Compression in a hearing aid
CN101808265A (zh) * 2008-12-23 2010-08-18 Gn瑞声达A/S 自适应反馈增益校正
EP2265039A1 (en) * 2009-02-09 2010-12-22 Panasonic Corporation Hearing aid
CN104902419A (zh) * 2014-12-26 2015-09-09 深圳市微纳集成电路与系统应用研究院 一种适用于数字助听器的移频压缩方法
US20180176696A1 (en) * 2016-12-16 2018-06-21 Gn Hearing A/S Binaural hearing device system with a binaural impulse environment detector
US20200065058A1 (en) * 2018-08-22 2020-02-27 Mimi Hearing Technologies GmbH Systems and methods for sound enhancement in audio systems
CN110012406A (zh) * 2019-04-10 2019-07-12 深圳湃声声学科技有限公司 音频信号处理方法、装置、处理器及骨传导助听器
CN111447539A (zh) * 2020-03-25 2020-07-24 北京聆通科技有限公司 一种用于听力耳机的验配方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114267382A (zh) * 2021-12-28 2022-04-01 深圳万兴软件有限公司 音乐音效处理的限制器控制方法、装置、设备及介质
CN114267382B (zh) * 2021-12-28 2024-02-13 深圳万兴软件有限公司 音乐音效处理的限制器控制方法、装置、设备及介质
WO2024093536A1 (zh) * 2022-11-03 2024-05-10 Oppo广东移动通信有限公司 音频信号处理方法及装置、音频播放设备、存储介质

Similar Documents

Publication Publication Date Title
US11671770B2 (en) Systems and methods for providing personalized audio replay on a plurality of consumer devices
US8085941B2 (en) System and method for dynamic sound delivery
CN105164918B (zh) 具有动态阈值的频带压缩
US10966033B2 (en) Systems and methods for modifying an audio signal using custom psychoacoustic models
US10993049B2 (en) Systems and methods for modifying an audio signal using custom psychoacoustic models
JP6290429B2 (ja) 音声処理システム
CN109217834B (zh) 增益调整方法、音频设备及可读存储介质
CN113362839A (zh) 音频数据处理方法、装置、计算机设备及存储介质
US9251803B2 (en) Voice filtering method, apparatus and electronic equipment
KR20190012003A (ko) 청각 인지 속성에 기반하여 디지털 오디오 신호의 이득을 조정하는 전자 장치 및 방법
CN112309418B (zh) 一种抑制风噪声的方法及装置
US20210326099A1 (en) Systems and methods for providing content-specific, personalized audio replay on consumer devices
TW201503707A (zh) 電話語音處理之方法及其電腦程式
WO2024001463A1 (zh) 音频信号的处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品
US10841713B2 (en) Integration of audiogram data into a device
WO2020073564A1 (zh) 用于检测音频信号的响度的方法和装置
CN111370017B (zh) 一种语音增强方法、装置、系统
CN112307161B (zh) 用于播放音频的方法和装置
US20200244802A1 (en) Systems and methods for adaption of a telephonic audio signal
CN110996205A (zh) 耳机的控制方法、耳机及可读存储介质
CN111048107B (zh) 音频处理方法和装置
EP3896999A1 (en) Systems and methods for a hearing assistive device
EP2849181A1 (en) Voice filtering method, apparatus and electronic equipment
KR20080010038A (ko) 휴대용 단말기에서 청력 저하를 방지하기 위한 장치 및방법
CN112312258A (zh) 一种具有听力防护及听力补偿的智能耳机

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination