CN115065849B - 音频录制方法、装置及电子设备 - Google Patents

音频录制方法、装置及电子设备 Download PDF

Info

Publication number
CN115065849B
CN115065849B CN202210652351.5A CN202210652351A CN115065849B CN 115065849 B CN115065849 B CN 115065849B CN 202210652351 A CN202210652351 A CN 202210652351A CN 115065849 B CN115065849 B CN 115065849B
Authority
CN
China
Prior art keywords
audio
recording
audio data
amplitude
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210652351.5A
Other languages
English (en)
Other versions
CN115065849A (zh
Inventor
罗志成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zitiao Network Technology Co Ltd
Original Assignee
Beijing Zitiao Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zitiao Network Technology Co Ltd filed Critical Beijing Zitiao Network Technology Co Ltd
Priority to CN202210652351.5A priority Critical patent/CN115065849B/zh
Publication of CN115065849A publication Critical patent/CN115065849A/zh
Application granted granted Critical
Publication of CN115065849B publication Critical patent/CN115065849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4334Recording operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone

Abstract

本公开涉及一种音频录制方法、装置及电子设备,涉及数据处理技术领域,其中方法包括:首先获取当前采集到的音频数据的音频幅度信息,以及获取与设置的录音音量对应的预设幅度信息;再根据所述音频幅度信息和所述预设幅度信息,对所述音频数据进行音频增益调节;然后依据增益调节后的音频数据进行音频录制。通过应用本公开的技术方案,可用户可以实现在通话过程中,即使说话声音大小不断变化,对端也能听到恒定不变的声音大小,在说话声音比较小的时候,对端也能听到清晰、音量适中的声音,保证通话质量。

Description

音频录制方法、装置及电子设备
技术领域
本公开涉及数据处理技术领域,尤其涉及一种音频录制方法、装置及电子设备。
背景技术
随着科技的发展,智能终端(如智能电视、智能手机、平板电脑等)的功能越来越强大,人们可使用智能终端进行视频通话,通话录音声音的大小受三个因素的影响,包括:1、人说话的声音大小;2、人发声的位置到智能终端麦克风的距离;3、智能终端麦克风的录音增益。
有时人发声的位置到智能终端麦克风的距离是可能发生变化的,然而,发明人发现目前智能终端麦克风的录音增益普遍都是固定的,当通话人的位置发生变化时,会容易导致通话对端听到的声音忽大忽小,影响通话质量。如果通话人距离智能终端声音稍远,还可能出现对端听不到声音的现象。
发明内容
有鉴于此,本公开提供了一种音频录制方法、装置及电子设备,主要目的在于改善目前由于智能终端麦克风的录音增益普遍都是固定的,因此当通话人的位置发生变化时,会容易导致通话对端听到的声音忽大忽小,影响通话质量的技术问题。
第一方面,本公开提供了一种音频录制方法,包括:
获取当前采集到的音频数据的音频幅度信息,以及获取与设置的录音音量对应的预设幅度信息;
根据所述音频幅度信息和所述预设幅度信息,对所述音频数据进行音频增益调节;
依据增益调节后的音频数据进行音频录制。
第二方面,本公开提供了一种音频录制装置,包括:
获取模块,被配置为获取当前采集到的音频数据的音频幅度信息,以及获取与设置的录音音量对应的预设幅度;
调节模块,被配置为根据所述音频幅度信息和所述预设幅度信息,对所述音频数据进行音频增益调节;
录制模块,被配置为依据增益调节后的音频数据进行音频录制。
第三方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的音频录制方法。
第四方面,本公开提供了一种电子设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面所述的音频录制方法。
借由上述技术方案,本公开提供的一种音频录制方法、装置及电子设备,与目前现有技术相比,本公开可实现智能调节智能终端麦克风的录音增益,当通话人的位置发生变化时,也能保证通话对端听到的声音大小恒定不变。具体的,可首先获取当前采集到的音频数据的音频幅度信息,以及获取与设置的录音音量对应的预设幅度信息;再根据该音频幅度信息和预设幅度信息,对音频数据进行音频增益调节;然后依据增益调节后的音频数据进行音频录制。通过应用本公开的技术方案,用户可以实现在通话过程中,即使说话声音大小不断变化,对端也能听到恒定不变的声音大小,在说话声音比较小的时候,对端也能听到清晰、音量适中的声音,保证通话质量。
上述说明仅是本公开技术方案的概述,为了能够更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为了让本公开的上述和其它目的、特征和优点能够更明显易懂,以下特举本公开的具体实施方式。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了本公开实施例提供的一种音频录制方法的流程示意图;
图2示出了本公开实施例提供的另一种音频录制方法的流程示意图;
图3示出了本公开实施例提供的一种应用场景的示意图;
图4示出了本公开实施例提供的一种应用示例的流程示意图;
图5示出了本公开实施例提供的音频增益调节示例的流程示意图;
图6示出了本公开实施例提供的一种音频录制装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
为了改善目前由于智能终端麦克风的录音增益普遍都是固定的,因此当通话人的位置发生变化时,会容易导致通话对端听到的声音忽大忽小,影响通话质量的技术问题。本实施例提供了一种音频录制方法,如图1所示,可应用于智能终端(如智能电视、智能手机、平板电脑等)端侧,该方法包括:
步骤101、获取当前采集到的音频数据的音频幅度信息,以及获取与设置的录音音量对应的预设幅度信息。
声音是介质振动在听觉系统中产生的反应。声音可以被分解为不同频率不同强度正弦波的叠加,声音有两个基本的物理属性:频率与振幅(幅度),其中,声音的振幅就是音量。
在本实施例中,可通过智能终端的麦克风设备采集音频数据,如可包含用户发出的语音信息、环境音信息等音频数据。识别音频数据的音频幅度信息,该音频幅度信息可反映出采集到的音频的音量情况。
用户可选择设置录音的音量,或者可由系统默认设置录音的音量等,使得可按照该录音音量进行音频录制。对于本实施例,可将设置的录音音量转化为预设幅度信息,如与设置的录音音量对应的预设幅度,不同的录音音量均有各自对应的预设幅度。
步骤102、根据当前采集到的音频数据的音频幅度信息和与设置的录音音量对应的预设幅度信息,对当前采集到的音频数据进行音频增益调节。
本实施例对于当前采集到的音频数据进行音频增益调节的过程可以是动态调节的过程,根据实时采集到的音频数据的音频幅度信息和与设置的录音音量对应的预设幅度信息实时进行比较判断,并根据实时得到的比较结果,对实时采集到的音频数据进行音频增益调节。
例如,如果音频数据的音频幅度小于与设置的录音音量对应的预设幅度,则可对音频数据提高音频的增益,保证录制得到的音频的音量符合设置的录音音量的要求。
步骤103、依据增益调节后的音频数据进行音频录制。
与目前现有技术相比,本实施例可实现智能调节智能终端麦克风的录音增益,当通话人的位置发生变化时,也能保证通话对端听到的声音大小恒定不变。具体的,可首先获取当前采集到的音频数据的音频幅度信息,以及获取与设置的录音音量对应的预设幅度信息;再根据该音频幅度信息和预设幅度信息,对音频数据进行音频增益调节;然后依据增益调节后的音频数据进行音频录制。
通过应用本实施例的技术方案,用户可以实现在通话过程中,即使说话声音大小不断变化,对端也能听到恒定不变的声音大小,在说话声音比较小的时候,对端也能听到清晰、音量适中的声音,保证通话质量。
进一步的,作为上述实施例的细化和扩展,为了完整说明本实施例方法的具体实现过程,本实施例提供了如图2所示的具体方法,该方法包括:
步骤201、获取当前采集到的音频数据的音频幅度信息,以及获取与设置的录音音量对应的预设幅度信息。
可选的,获取当前采集到的音频数据的音频幅度信息,具体可包括:首先从音频处理的硬件抽象层中通过目标线程,获取当前采集到的音频数据;然后确定该音频数据的音频幅度信息。通过这种可选方式,可准确获取当前采集到的音频数据的音频幅度信息,保证后续可做到精确地对当前采集到的音频数据进行音频增益调节。
示例性的,以智能终端使用安卓(Android)操作系统为例,上述从音频处理的硬件抽象层中通过目标线程,获取音频数据,具体可包括:从Audio HAL中通过音频数据实体(AudioFlinger)的RecordThread线程,获取音频数据。通过这种示例性的可选方式,可准确获取使用安卓操作系统采集到的音频数据的音频幅度信息。
在实际应用中,为了满足不同的实际需求来设置录音时的音量(即录音音量),可选的,在步骤201之前还可包括:基于用户的语音特征信息和录音环境特征信息,设置录音音量;或者,按照用户选择的录音音量大小设置录音音量;或者,按照默认录音音量设置录音音量。
例如,用户a可根据自己的需求,选择设置录音音量,如用户a通过音量面板,选择是否打开录音音量调节,进而选择是否设置录音音量。通过这种可选方式,可满足用户a的实际录音需求,提升了用户a的使用体验,使得用户a可以实现在通话过程中,即使说话声音大小不断变化,对端也能听到用户a自己设置的恒定不变的声音大小,保证通话质量。
再例如,用户通过音量面板打开智能录音增益调节,按照默认录音音量(如用户普遍都能够听清楚声音内容的音量大小)设置录音音量等。通过这种可选方式,可帮助用户快速设置符合要求的录音音量,保证录音内容后续能够被清楚播放出来。
再例如,提前采集一段用户输入的语音数据(用户可按照规定文字讲出相关内容,或者随便采集一段用户说的语音),从该语音数据中提取用户的语音特征信息和录音环境特征信息,语音特征信息可包括:用户本身发出的声音的音高、音强、音长、音色等特征。其中,音高指声波频率,即每秒钟振动次数的多少;音强指声波振幅的大小;音长指声波振动持续时间的长短,也称为"时长";音色指声音的特色和本质,也称作"音质"。录音环境特征信息可包括:除了用户本身声源以外,其他声源的个数,以及这些声源发出的声音特征,如响度、音调等。通过这些特征可分析出其他声源的嘈杂程度,对用户本身声源发出声音的音频录制的影响。
通过这种可选方式可根据用户的语音特征信息和录音环境特征信息,综合分析出合适的录音音量,帮助用户快速设置合适的录音音量,做到针对录音场景化的精确录音音量选择。例如,如果用户说话较快(声波频率快、声波振动持续时间长),说话声偏小(声波振幅低),并且环境音嘈杂程度一般时,可设置较高的录音音量;如果用户说话较慢(声波频率慢、声波振动持续时间短),说话声偏大(声波振幅高),音质良好,并且环境音嘈杂程度良好时,可相比之下设置正常适中或稍偏小一些的录音音量等。使得录制的音频在播放时,在保证能清楚听清的前提下,不至于一下子播放声音过大,影响收听体验。
示例性的,基于用户的语音特征信息和录音环境特征信息,设置录音音量,包括:从声学指标维度依据用户的语音特征信息和录音环境特征信息,分析当前录音场景的评分信息;获取与评分信息对应的目标分数范围;按照与目标分数范围对应的预设音量,设置录音音量。
声学指标可包括:背景噪声、混响时间、扩散性、频响特性、声聚焦、声影区、清晰度、声染色等指标。例如,本可选方式中,基于用户的语音特征信息和录音环境特征信息,可从每个声学指标的评分角度分别进行打分,然后可加权求和得到总的评分,找到该评分所处于的目标分数范围,进而按照与目标分数范围对应的预设音量,设置录音音量。其中,不同的分数范围均有各自对应的预设音量。如500分至800分的分数范围对应预设音量a;801分至1200分的分数范围对应预设音量b;1201分至1500分的分数范围对应预设音量c。通过计算得到总的评分为1000分,处于801分至1200分的分数范围内,因此可设置录音音量为预设音量b所对应的音量数值。
通过上述示例性的可选方式,可准确从声学指标维度基于用户的语音特征信息和录音环境特征信息,综合分析出合适的录音音量,帮助用户快速设置合适的录音音量。
本实施例在设置得到录音音量之后,可将设置的录音音量转化为预设幅度信息。
步骤202、从音频幅度信息中获取当前采集到的音频数据的最大幅度,以及从预设幅度信息中获取与设置的录音音量对应的预设幅度。
步骤203、根据当前采集到的音频数据的最大幅度和与设置的录音音量对应的预设幅度,对音频数据进行音频增益调节。
在实际应用中,音频数据的最大幅度可更好地体现出声音的最大强度,进而可更好地体现出采集到的音频数据的音量大小情况,本实施例,将当前采集到的音频数据的最大幅度和与设置的录音音量对应的预设幅度进行比较,并根据比较结果可精准对音频数据进行音频增益调节。对于音频增益调节方案可存在多种可选方式,作为其中一种可选方式,具体可如执行步骤2031至2032所示的过程。
步骤2031、基于当前采集到的音频数据的最大幅度与预设幅度的比较结果,确定音频所需的增益系数。
如果当前采集到的音频数据的最大幅度等于与设置的录音音量对应的预设幅度,说明当前采集到的音频数据的声音强度符合录音音量对应的音量强度要求,可无需对音频数据进行音频增益调节,直接进行音频录制。而如果采集到的音频数据的最大幅度大于与设置的录音音量对应的预设幅度,也可无需对音频数据进行音频增益调节,或者降低音频的增益效果。
如果当前采集到的音频数据的最大幅度小于与设置的录音音量对应的预设幅度,则确定音频所需的增益系数。示例性的,步骤2031具体可包括:获取预设幅度与该音频数据的最大幅度之间的幅度差值,并基于幅度差值确定增益系数。如预设幅度与该音频数据的最大幅度之间的幅度差值越大,增益系数可设置得越大,以增强音频增益的效果。
步骤2032、利用音频所需的增益系数,对当前采集到的音频数据进行音频增益调节。
步骤204、依据增益调节后的音频数据进行音频录制。
可选的,步骤204具体可包括:通过音频录制模块对增益调节后的音频数据进行音频录制。通过这种可选方式,可准确对增益调节后的音频数据进行音频录制。
示例性的,以智能终端使用安卓操作系统为例,上述通过音频录制模块对增益调节后的音频数据进行音频录制,具体可包括:通过AudioRecord模块对增益调节后的音频数据进行音频录制。通过这种示例性的可选方式,可准确对使用安卓操作系统采集到的音频数据进行音频录制。
为了说明上述各实施例的具体实现过程,给出如下应用场景,但不限于此:
如图3所示,目前智能电视已成为家庭必须的电器,电视的功能也由传统单一的观看视频,使用电视进行视频通话的人也越来越多,通话录音声音的大小受三个因素的影响,包括:1.人说话的声音大小;2.人发声的位置到电视麦克风的距离;3.智能电视麦克风的录音增益。
但智能电视不像智能手机那样能方便的随身携带。因此人发声的位置到电视麦克风的距离是可能发生变化的。然而目前所有的智能电视麦克风的录音增益都是固定的,这导致一个问题,当通话人的位置发生变化时,会导致通话对端听到的声音忽大忽小,影响通话质量。如果通话人距离电视位置稍远,还可能出现对端听不到声音的现象,如果想要维持对端声音的大小平稳,需要通话人根据离电视麦克风的距离,调整说话声音的大小,这明显是不现实的。另外,不同人的声音大小不一样,相同的麦克风增益,不能适用所有人。
在实际应用中,也可以使用通话应用进行收音增益的调节,但是并不能做到智能调整,并且只有某些应用具有此功能。
基于上述情况,为了解决上述电视收音音量大小的问题,利用本实施例提供的方法,通过检测当前录音的音频幅度,判断与预设的音频录音幅度大小,智能调整录音增益。以智能电视使用安卓操作系统为例,安卓原生的录音音频数据流程可包括:通话App使用AudioRecord接口进行录音,录音数据的来源由AudioFlinger的RecordThread从Audio HAL获取。
在此基础上进行改进,如图4所示,在AudioFlinger从Audio HAL获取到录音数据后,经过录音增益调节模块进行增益调节,最后经过AudioRecord接口送给通话App。用户可通过音量面板,选择是否打开录音音量调节,如打开智能录音增益调节,则调用AudioManagersetParameter接口设置录音音量并转化为预设音量幅度,最终设置到录音增益调节模块中。如图5所示,为录音增益调节的流程示意图。在音频输入后,获取当前音频最大幅度,判断是否设置了录音音量,如果设置了录音音量,则可继续判断当前音频的音频幅度是否小于预设幅度,如果是,则计算音频所需的增益系数,并按照该增益系数进行音频的增益调整,然后输出给AudioRecord接口,进而给到通话App。
通过本实施例上述方案,用户可以实现在通话过程中,即使说话声音大小不断变化,对端也能听到恒定不变的声音大小。另外,用户可以通过音量面板,像设置播放音量一样,调整录音音量,实现在说话声音比较小的时候,对端听到清晰,音量适中的声音。
进一步的,作为图1和图2所示方法的具体实现,本实施例提供了一种音频录制装置,如图6所示,该装置包括:获取模块31、调节模块32、录制模块33。
获取模块31,被配置为获取当前采集到的音频数据的音频幅度信息,以及获取与设置的录音音量对应的预设幅度;
调节模块32,被配置为根据所述音频幅度信息和所述预设幅度信息,对所述音频数据进行音频增益调节;
录制模块33,被配置为依据增益调节后的音频数据进行音频录制。
在具体的应用场景中,调节模块32,具体被配置为根据所述音频数据的最大幅度和与设置的录音音量对应的预设幅度,对所述音频数据进行音频增益调节。
在具体的应用场景中,调节模块32,具体还被配置为基于所述最大幅度与所述预设幅度的比较结果,确定音频所需的增益系数;利用所述增益系数,对所述音频数据进行音频增益调节。
在具体的应用场景中,调节模块32,具体还被配置为获取所述预设幅度与所述最大幅度之间的幅度差值,并基于所述幅度差值确定所述增益系数。
在具体的应用场景中,本装置还包括:设置模块;
设置模块,被配置为在所述获取当前采集到的音频数据的音频幅度信息,以及获取与设置的录音音量对应的预设幅度信息之前,基于用户的语音特征信息和录音环境特征信息,设置录音音量;或,按照用户选择的录音音量大小设置录音音量;或,按照默认录音音量设置录音音量。
在具体的应用场景中,设置模块,具体被配置为从声学指标维度依据所述语音特征信息和所述录音环境特征信息,分析当前录音场景的评分信息;获取与所述评分信息对应的目标分数范围;按照与所述目标分数范围对应的预设音量,设置录音音量。
在具体的应用场景中,获取模块31,具体被配置为从音频处理的硬件抽象层中通过目标线程,获取所述音频数据;确定所述音频数据的音频幅度信息;
录制模块33,具体被配置为通过音频录制模块对增益调节后的音频数据进行音频录制。
在具体的应用场景中,获取模块31,具体还被配置为从Audio HAL中通过AudioFlinger的RecordThread,获取所述音频数据;
录制模块33,具体还被配置为通过AudioRecord模块对增益调节后的音频数据进行音频录制。
需要说明的是,本实施例提供的一种音频录制装置所涉及各功能单元的其它相应描述,可以参考图1和图2中的对应描述,在此不再赘述。
基于上述如图1和图2所示方法,相应的,本实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述如图1和图2所示的音频录制方法。
基于这样的理解,本公开的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施场景的方法。
基于上述如图1和图2所示的方法,以及图6所示的虚拟装置实施例,为了实现上述目的,本公开实施例还提供了一种电子设备,如智能电视、智能手机、平板电脑等,该设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1和图2所示的音频录制方法。
可选的,上述实体设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的上述实体设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述实体设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本公开可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本实施例的方案,与目前现有技术相比,可实现智能调节智能终端麦克风的录音增益,当通话人的位置发生变化时,也能保证通话对端听到的声音大小恒定不变。用户可以实现在通话过程中,即使说话声音大小不断变化,对端也能听到恒定不变的声音大小,在说话声音比较小的时候,对端也能听到清晰、音量适中的声音,保证通话质量。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种音频录制方法,其特征在于,包括:
从声学指标维度依据语音特征信息和录音环境特征信息,分析当前录音场景的评分信息;所述语音特征信息包括语速、音高、音长和音色中的至少一种;
获取与所述评分信息对应的目标分数范围;
按照与所述目标分数范围对应的预设音量,设置录音音量;
获取当前采集到的音频数据的音频幅度信息,以及获取与设置的录音音量对应的预设幅度信息;
根据所述音频幅度信息和所述预设幅度信息,对所述音频数据进行音频增益调节;
依据增益调节后的音频数据进行音频录制。
2.根据权利要求1所述的方法,其特征在于,所述根据所述音频幅度信息和所述预设幅度信息,对所述音频数据进行音频增益调节,包括:
根据所述音频数据的最大幅度和与设置的录音音量对应的预设幅度,对所述音频数据进行音频增益调节。
3.根据权利要求2所述的方法,其特征在于,根据所述音频数据的最大幅度和与设置的录音音量对应的预设幅度,对所述音频数据进行音频增益调节,具体包括:
基于所述最大幅度与所述预设幅度的比较结果,确定音频所需的增益系数;
利用所述增益系数,对所述音频数据进行音频增益调节。
4.根据权利要求3所述的方法,其特征在于,所述基于所述最大幅度与所述预设幅度的比较结果,确定音频所需的增益系数,包括:
获取所述预设幅度与所述最大幅度之间的幅度差值,并基于所述幅度差值确定所述增益系数。
5.根据权利要求1所述的方法,其特征在于,所述获取当前采集到的音频数据的音频幅度信息,包括:
从音频处理的硬件抽象层中通过目标线程,获取所述音频数据;
确定所述音频数据的音频幅度信息;
所述依据增益调节后的音频数据进行音频录制,包括:
通过音频录制模块对增益调节后的音频数据进行音频录制。
6.根据权利要求5所述的方法,其特征在于,所述从音频处理的硬件抽象层中通过目标线程,获取所述音频数据,具体包括:
从Audio HAL中通过AudioFlinger的RecordThread,获取所述音频数据;
所述通过音频录制模块对增益调节后的音频数据进行音频录制,具体包括:
通过AudioRecord模块对增益调节后的音频数据进行音频录制。
7.一种音频录制装置,其特征在于,包括:
设置模块,被配置为从声学指标维度依据语音特征信息和录音环境特征信息,分析当前录音场景的评分信息;所述语音特征信息包括语速、音高、音长和音色中的至少一种;获取与所述评分信息对应的目标分数范围;按照与所述目标分数范围对应的预设音量,设置录音音量;
获取模块,被配置为获取当前采集到的音频数据的音频幅度信息,以及获取与设置的录音音量对应的预设幅度;
调节模块,被配置为根据所述音频幅度信息和所述预设幅度信息,对所述音频数据进行音频增益调节;
录制模块,被配置为依据增益调节后的音频数据进行音频录制。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法。
9.一种电子设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法。
CN202210652351.5A 2022-06-06 2022-06-06 音频录制方法、装置及电子设备 Active CN115065849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210652351.5A CN115065849B (zh) 2022-06-06 2022-06-06 音频录制方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210652351.5A CN115065849B (zh) 2022-06-06 2022-06-06 音频录制方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN115065849A CN115065849A (zh) 2022-09-16
CN115065849B true CN115065849B (zh) 2023-11-14

Family

ID=83200598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210652351.5A Active CN115065849B (zh) 2022-06-06 2022-06-06 音频录制方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN115065849B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103077733A (zh) * 2012-12-28 2013-05-01 华为终端有限公司 音频信息录制方法及录音装置
CN103269405A (zh) * 2013-05-23 2013-08-28 深圳市中兴移动通信有限公司 友好提示的方法及装置
KR20140060187A (ko) * 2012-11-09 2014-05-19 현대자동차주식회사 음성인식시스템의 증폭율 조정장치 및 방법
CN105721705A (zh) * 2016-02-29 2016-06-29 北京小米移动软件有限公司 通话质量的控制方法、装置和移动终端
WO2019033438A1 (zh) * 2017-08-18 2019-02-21 广东欧珀移动通信有限公司 音频信号调节方法、装置、存储介质及终端
WO2019047105A1 (zh) * 2017-09-07 2019-03-14 深圳传音通讯有限公司 一种基于智能终端的通话音量控制方法及控制系统
CN113409800A (zh) * 2020-03-16 2021-09-17 浙江宇视科技有限公司 一种监控音频的处理方法、装置、存储介质及电子设备
CN114063968A (zh) * 2021-11-11 2022-02-18 北京字节跳动网络技术有限公司 一种音频设备选择方法、装置及电子设备
CN114464190A (zh) * 2022-01-30 2022-05-10 云知声智能科技股份有限公司 一种语音识别场景下音量自适应方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013102411A (ja) * 2011-10-14 2013-05-23 Sony Corp 音声信号処理装置、および音声信号処理方法、並びにプログラム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140060187A (ko) * 2012-11-09 2014-05-19 현대자동차주식회사 음성인식시스템의 증폭율 조정장치 및 방법
CN103077733A (zh) * 2012-12-28 2013-05-01 华为终端有限公司 音频信息录制方法及录音装置
CN103269405A (zh) * 2013-05-23 2013-08-28 深圳市中兴移动通信有限公司 友好提示的方法及装置
CN105721705A (zh) * 2016-02-29 2016-06-29 北京小米移动软件有限公司 通话质量的控制方法、装置和移动终端
WO2019033438A1 (zh) * 2017-08-18 2019-02-21 广东欧珀移动通信有限公司 音频信号调节方法、装置、存储介质及终端
CN110870201A (zh) * 2017-08-18 2020-03-06 Oppo广东移动通信有限公司 音频信号调节方法、装置、存储介质及终端
WO2019047105A1 (zh) * 2017-09-07 2019-03-14 深圳传音通讯有限公司 一种基于智能终端的通话音量控制方法及控制系统
CN113409800A (zh) * 2020-03-16 2021-09-17 浙江宇视科技有限公司 一种监控音频的处理方法、装置、存储介质及电子设备
CN114063968A (zh) * 2021-11-11 2022-02-18 北京字节跳动网络技术有限公司 一种音频设备选择方法、装置及电子设备
CN114464190A (zh) * 2022-01-30 2022-05-10 云知声智能科技股份有限公司 一种语音识别场景下音量自适应方法及装置

Also Published As

Publication number Publication date
CN115065849A (zh) 2022-09-16

Similar Documents

Publication Publication Date Title
CN108305603B (zh) 音效处理方法及其设备、存储介质、服务器、音响终端
CN109686347A (zh) 音效处理方法、音效处理装置、电子设备和可读介质
CN106612482B (zh) 一种调整音频参数的方法及移动终端
WO2019033438A1 (zh) 音频信号调节方法、装置、存储介质及终端
CN112216294B (zh) 音频处理方法、装置、电子设备及存储介质
JP2012235310A (ja) 信号処理装置および方法、プログラム、並びにデータ記録媒体
CN109361995B (zh) 一种电器设备的音量调节方法、装置、电器设备和介质
CN104851423B (zh) 一种声音信息处理方法及装置
CN115065849B (zh) 音频录制方法、装置及电子设备
CN110931019A (zh) 公安语音数据采集方法、装置、设备和计算机存储介质
CN116132869A (zh) 耳机音量的调节方法、耳机及存储介质
CN111696566B (zh) 语音处理方法、装置和介质
CN115119110A (zh) 音效调节方法、音频播放设备以及计算机可读存储介质
CN117643075A (zh) 用于言语增强的数据扩充
CN106791252A (zh) 一种来电铃声的播放方法及装置
CN111370017B (zh) 一种语音增强方法、装置、系统
WO2008075305A1 (en) Method and apparatus to address source of lombard speech
CN110827851B (zh) 调节音量的方法、电子设备及计算机存储介质
CN110996205A (zh) 耳机的控制方法、耳机及可读存储介质
CN112532788A (zh) 音频播放方法、终端及存储介质
CN111696564B (zh) 语音处理方法、装置和介质
CN111696565B (zh) 语音处理方法、装置和介质
KR102650763B1 (ko) 오디오 소스 지향성에 기초한 심리음향 강화
US10615765B2 (en) Sound adjustment method and system
Björnsson Amplified Speech in Live Theatre, What should it Sound Like?

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant