CN115379256A - 一种音频调整方法、装置、电子设备和存储介质 - Google Patents

一种音频调整方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN115379256A
CN115379256A CN202210997515.8A CN202210997515A CN115379256A CN 115379256 A CN115379256 A CN 115379256A CN 202210997515 A CN202210997515 A CN 202210997515A CN 115379256 A CN115379256 A CN 115379256A
Authority
CN
China
Prior art keywords
audio
voice
background
volume requirement
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210997515.8A
Other languages
English (en)
Other versions
CN115379256B (zh
Inventor
邓刚
赵宏亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Changfeng Imaging Equipment Co ltd
Original Assignee
Shenzhen Changfeng Imaging Equipment Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Changfeng Imaging Equipment Co ltd filed Critical Shenzhen Changfeng Imaging Equipment Co ltd
Priority to CN202210997515.8A priority Critical patent/CN115379256B/zh
Priority claimed from CN202210997515.8A external-priority patent/CN115379256B/zh
Publication of CN115379256A publication Critical patent/CN115379256A/zh
Application granted granted Critical
Publication of CN115379256B publication Critical patent/CN115379256B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • H04N21/8113Monomedia components thereof involving special audio data, e.g. different tracks for different languages comprising music, e.g. song in MP3 format

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Graphics (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例公开了一种音频调整方法、装置、电子设备和存储介质,音频调整方法包括:将预先确定的目标音频的音量要求发送至发送端,接收发送端发送的语音音频;其中,语音音频是根据音量要求调整后的语音音频;将语音音频和背景音频进行混音处理,得到目标音频。本发明实施例中,可以接收到根据音量要求调整后的语音音频,使得语音音频的音量值和背景音频的音量值更加匹配,进一步使得最终播放的目标音频的音量值符合用户需求,避免设备输出的人声音频信息失真的情况发生,提高了用户的视听感。

Description

一种音频调整方法、装置、电子设备和存储介质
技术领域
本发明实施例涉及音频信号处理技术,尤其涉及一种音频调整方法、装置、电子设备和存储介质。
背景技术
随着科技的发展,自媒体视频和网络直播等的娱乐方式已经越来越受到大众的欢迎。现如今,用户通过手机创作的自媒体视频几乎都是背景音效和人声同时存在的。并且用户在通过手机进行的网络直播时,一般也都是在播放有背景音效的情况下进行直播的。
现有的音频调整方法中,当用户在直播或创作视频时,可以同时调整背景音乐音量和语音音量。但这种音频调整方式,会导致背景音乐音量和语音音量不够匹配。当背景音乐的音量和语音音量不匹配时,会造成设备输出的人声音频信息失真,影响用户的视听感。
发明内容
本发明实施例提供一种音频调整方法、装置、电子设备和存储介质,本发明实施例通过对播放的音频信息中的语音音频进行调整,避免发生输出的人声音频失真的情况。
第一方面,本发明实施例提供一种音频调整方法,应用于接收端,所述方法包括:
将预先确定的目标音频的音量要求发送至发送端,接收所述发送端发送的语音音频;其中,所述语音音频是根据所述音量要求调整后的语音音频;
将所述语音音频和所述背景音频进行混音处理,得到目标音频。
第二方面,本发明实施例提供一种音频调整方法,应用于发送端,所述方法包括:
获取接收端发送的播放音频的音量要求;
基于所述音量要求,对预先获取的用户的语音音频进行调整,得到调整后的语音音频;
将所述调整后的语音音频发送至所述接收端。
第三方面,本发明实施例提供一种音频调整装置,应用于接收端,所述装置包括:
第一发送模块,用于将预先确定的目标音频的音量要求发送至发送端,接收所述发送端发送的语音音频;其中,所述语音音频是根据所述音量要求调整后的语音音频;
处理模块,用于将所述语音音频和所述背景音频进行混音处理,得到目标音频。
第四方面,本发明实施例提供一种音频调整装置,应用于发送端,所述装置包括:
接收模块,用于获取接收端发送的播放音频的音量要求;
调整模块,用于基于所述音量要求,对预先获取的用户的语音音频进行调整,得到调整后的语音音频;
第二发送模块,用于将所述调整后的语音音频发送至所述接收端。
第五方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的音频调整方法。
第六方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的音频调整方法。
本发明实施例中,可以将预先确定的目标音频的音量要求发送至发送端,接收发送端发送的语音音频;其中,语音音频是根据音量要求调整后的语音音频;将语音音频和背景音频进行混音处理,得到目标音频。即本发明实施例中,可以接收到根据音量要求调整后的语音音频,使得语音音频的音量值和背景音频的音量值更加匹配,进一步使得最终播放的目标音频的音量值符合用户需求,避免设备输出的人声音频信息失真的情况发生,提高了用户的视听感。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的应用于接收端的音频调整方法的一个流程图;
图2为本发明实施例提供的应用于接收端的音频调整方法的另一流程图;
图3为本发明实施例提供的应用于发送端的一种音频调整方法的流程图;
图4为本发明实施例提供的应用于接收端的音频调整装置的结构示意图;
图5为本发明实施例提供的应用于发送端的音频调整装置的结构示意图;
图6为本发明实施例提供的电子设备的一个结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
图1为本发明实施例提供的应用于接收端的音频调整方法的一个流程图,本发明实施例的方法可适用于对播放的音频信息中的语音音频进行调整,避免发生输出的人声音频失真的情况。该方法可以由本发明实施例提供的应用于接收端的音频调整装置来执行,该装置可采用软件和/或硬件的方式实现。在一个具体的实施例中,该装置可以集成在电子设备中,电子设备比如可以是服务器等。以下实施例将以该装置集成在电子设备中为例进行说明,参考图1,该方法具体可以包括如下步骤:
步骤101、将预先确定的目标音频的音量要求发送至发送端,接收发送端发送的语音音频。
其中,语音音频是根据音量要求调整后的语音音频。目标音频是根据语音音频和背景音频得到的,最终被播放的音频。背景音频是用户通过客户端自定义的音频。目标音频的音量要求是根据背景音频和播放模式确定出的一个音量值或一个音量值范围。播放模式是用户通过客户端提前选定的,用于播放目标音频的一种模式。
具体地,用户可以通过客户端根据实际环境和具体需求选择出合适的播放模式。例如,当用户在户外进行直播时,可以将播放模式设定为户外模式。当用户在进行语音直播时,可以将播放模式设定为聊天模式。在获取到用户设置的播放模式后,接收端可以获取到用户通过客户端设置的背景音频和背景音频的音量值。进一步地,根据背景音频的音量值和播放模式,可以确定出目标音频的音量要求。例如,当用户在声音嘈杂的户外进行直播时,直播设备采集到的用户的语音音频的音量会比较小。为了不影响用户的直播效果,用户可以将播放模式设置成户外模式。接收端在确定出播放模式后,获取用户通过客户端设置的背景音频和背景音音频的音量值。假设用户设置的背景音频的音量值为b,则根据用户选择的播放模式可以确定出目标音频的音量要求为c至d之间。
进一步地,接收端在预先确定出目标音频的音量要求后,将目标音频的音量要求发送至发送端。发送端在接收到目标音频的音量要求后,可以根据目标音频的音量要求对用户发出的语音音频进行增益值调整,使得调整后的语音音频和背景音频组成的目标音频的音量值满足预先确定的音量要求。
步骤102、将语音音频和背景音频进行混音处理,得到目标音频。
其中,语音音频是发送端向接收端发送的,经过增益值调整后的音频。语音音频中包括语音音频的播放内容和播放信息。语音音频的播放信息包括语音音频的音量值。混音处理是把多种来源的声音,整合至一个立体音轨或单音音轨中。本方案中,对语音音频和背景音频进行混音处理可以得到目标音频。
具体地,接收端包括电信号处理单元,接收端在接收到发送端发送的语音音频后。可以将语音音频发送至电信号处理单元,电信号处理单元可以对语音音频和背景音频进行混音播放,该混音播放得到的音频就是目标音频。
本实施例的技术方案,可以将预先确定的目标音频的音量要求发送至发送端,接收发送端发送的语音音频;其中,语音音频是根据音量要求调整后的语音音频。将语音音频和背景音频进行混音处理,得到目标音频。利用本实施例的技术方案,可以接收到根据音量要求调整后的语音音频,使得语音音频的音量值和背景音频的音量值更加匹配,进一步使得最终播放的目标音频的音量值符合用户需求,避免设备输出的人声音频信息失真的情况发生,提高了用户的视听感。
图2为本发明实施例提供的应用于接收端的音频调整方法的另一流程图,本实施例是在上述实施例的基础上进行细化。具体地方法可如图2所示,该方法可以包括如下步骤:
步骤201、接收客户端发送的背景音频。
其中,背景音频包括背景音频的播放内容和播放信息。客户端可以是手机、平板电脑和笔记本电脑等设备。具体地,用户可以通过客户端根据自身需求选择背景音频。客户端在接收到用户选择的背景音频后,可以将背景音频发送给接收端。进一步地,接收端可以接收到客户端发送的背景音频。
本方案实施例中,可选的,接收客户端发送的背景音频包括如下步A1至步骤A2:
步骤A1:确定接收端是否连接客户端的音频输出接口;当接收端连接音频输出接口时,通过音频输出接口接收背景音频的模拟音频信号,并通过客户端接收背景音频的数字音频信号。
其中,音频输出接口可以是耳机接口等用于输出音频的输出接口。当客户端连接有耳机时,接收端可以通过耳机接收客户端发送的背景音频的模拟音频信号。与此同时,接收端也可以接收到客户端发送的背景音频的数字音频信号。数字音频信号是对模拟音频信号的一种量化。利用D/A转换器对数字音频信号进行D/A转换后可以得到数字音频信号的模拟音频信号。接收端在接收到背景音频的模拟音频信号后,接收端可以播放接收到的背景音频的模拟音频信号。
步骤A2:当接收端未连接所述音频输出接口时,通过所述客户端接收背景音频的数字音频信号。
具体地,当接收端未连接耳机等音频输出接口,接收端无法通过耳机接收到背景音频的模拟信号时,客户端可以播放背景音频,接收端可以通过客户端接收到背景音频的数字音频信号。
步骤202、根据背景音频的播放信息和预先确定的播放模式确定音量要求。
其中,背景音频的播放信息包括背景音频的播放音量和背景音频在被播放时的各种控制参数。音量要求可能是一个具体的值,也可能是一个范围。通过音量要求可以计算出在该播放模式下,背景音频的音量值和语音音频音量值的比例。用户可以根据目标音频的播放环境和具体需求,通过客户端提前设定播放模式。
具体地,根据背景音频的播放信息和播放模式可以得到最终要播放的音频的音量要求。示例的,用户在室内进行语音直播时,可以将播放模式选择为聊天模式,接收端可以根据背景音频的音量值和聊天模式,确定出在聊天模式下,将背景音频和语音音频进行混音播放后的目标音频的音量要求为:背景音频和语音音频的音量值的比例的1:5(聊天模式下,背景音频的音量值小于语音音频的音量值)。
步骤203、将预先确定的目标音频的音量要求发送至发送端,接收发送端发送的语音音频。
步骤204、将语音音频和背景音频进行混音处理,得到目标音频。
步骤205、基于音量要求确定目标音频在当前时间点上的调整策略。
其中,调整策略包括:需要调整和不需要调整。在实际应用中,接收端接收到的语音音频、背景音频等可能会发生变化,可能会导致正在播放的目标音频不符合目标音频的音量要求。因此,在播放目标音频时,需要对目标音频进行实时监听。具体地,接收端包括监听单元,监听单元可以对播放出的目标音频进行实时监听,监听单元可以基于音量要求确定目标音频在当前时间点上的调整策略。本方案实施例中,可选的,基于音量要求确定目标音频在当前时间点上的调整策略包括如下步骤B1-步骤B2:
步骤B1:确定背景音频在当前时间点上是否存在背景语音。
其中,背景语音是背景音频中存在的语音信息。示例的,如果用户在进行直播时,使用的背景音频是纯音乐的,则表示背景音频在当前时间点上不存在背景语音。如果用户在进行直播时,使用的背景音频是带有歌词的歌曲,则表示背景音频在当前时间点上存在背景语音。
步骤B2:若背景音频在当前时间点上存在背景语音,则根据在当前时间点上存在的背景语音和音量要求,确定目标音频在当前时间点上的调整策略为需要调整。
若背景音频在当前时间点上存在背景语音,接收端在根据播放模式对目标音频进行监听和调整时,可能会受到背景音频中的背景语音的影响,导致对目标音频的监听和调整不准确。因此,当监听到背景音频在当前时间点上存在背景语音时,需要根据当前时间点上存在的背景语音和音量要求,调整在当前时间点上的目标音频。示例的,当用户的播放模式为唱歌模式时,在监听到目标音频中的背景音频中存在背景语音时,可以对语音音频进行增益值调整,使得用户在直播唱歌时,不被背景音频中的原唱影响。即使得在背景音频中存在背景语音的情况下,播放出的目标音频符合音量要求。
通过上述步骤,可以根据背景音频中是否存在背景语音的情况对语音音频进行调整,使得用户发出的语音音频不被背景音频中的背景语音影响,优化用户体验。
步骤206、当目标音频在当前时间点上的调整策略为需要调整时,基于背景语音和调整策略对目标音频中的语音音频再次进行调整。
其中,对目标音频中的语音音频再次进行调整包括对语音音频进行增益值调整。增益值调整是对元器件、电路、设备或系统,其电流、电压或功率增加的程度的调整。对语音音频的增益值进行调整可以调整语音音频信号的各个相关参数,使得播放出的目标音频符合音量要求。具体地,当目标音频在当前时间点上的调整策略为需要调整时,表明背景音频中存在的背景语音会对最终的播放效果产生影响。因此,为了提高目标音频的播放质量,使得播放出的目标音频符合音量要求,可以根据背景语音和目标音频的音量要求对语音音频进行增益值调整。
本发明实施例中,通过接收客户端发送的背景音频以及背景音频的播放信息。根据背景音频的播放信息和预先确定的播放模式确定音量要求。将预先确定的目标音频的音量要求发送至发送端,接收发送端发送的语音音频。将语音音频和背景音频进行混音处理,得到目标音频。基于音量要求确定目标音频在当前时间点上的调整策略;其中,调整策略包括:需要调整和不需要调整;当调整策略为需要调整时,基于目标音频在当前时间点上的调整策略对目标音频中的语音音频再次进行调整。本实施例的技术方案中,可以根据播放模式和背景音频准确的确定出目标音频的音量要求,提高了语音音频和背景音频音量值的匹配度。并且本实施例的技术方案可以根据背景音频中是否存在背景语音的情况对语音音频进行调整,使得用户发出的语音音频不被背景音频中的背景语音影响,优化了用户体验。
图3为本发明实施例提供的应用于发送端的一种音频调整方法的流程图,本实施例是在上述实施例的基础上进行细化。具体地方法可如图3所示,该方法可以包括如下步骤:
步骤301、获取接收端发送的播放音频的音量要求。
其中,播放音频是最终通过客户端/接收端播放的,对背景音频和语音音频进行混音处理后的音频。播放音频的音量要求是接收端根据用户选择的背景音频和播放模式确定出的音量要求。音量要求可能是一个具体的值,也可能是一个范围。接收端在在确定出音量要求后,将音量要求发送给发送端,发送端可以接收到该音量要求。
步骤302、基于音量要求,对预先获取的用户的语音音频进行调整,得到调整后的语音音频。
具体地,发送端可以设置于用户周围,发送端中包括发送端的主板电路,其主板电路中设置有主控芯片,主控芯片中包括拾音单元。发送端可以通过拾音单元采集用户发出的语音音频,并将该语音音频存储至发送端。
进一步地,发送端在接收到接收端发送的音量要求后,可以对存储的用户的语音音频进行增益值调增,使得调整后的语音音频与背景音频在被混音播放后,可以满足该音量要求。示例的,用户在室内进行语音直播时,可以将播放模式选择为聊天模式。接收端可以根据背景音频的音量值和聊天模式,确定出在聊天模式下,将背景音频和语音音频进行混音播放后的目标音频的音量要求为:背景音频和语音音频的音量值的比例的1:5(聊天模式下,背景音频的音量值小于语音音频的音量值)。发送端可以根据“背景音频和语音音频的音量值的比例的1:5”的要求,对采集到的用户的语音音频进行增益值调整,使得语音音频的音量值和背景音频的音量值达到5:1的要求。
步骤303、将调整后的语音音频发送至接收端。
进一步地,发送端在对语音音频进行调整后,可以将调整后的语音音频发送给接收端,以使得接收端对调整后语音频和背景音频进行混音播放。
本发明实施例中,可以接收端发送的播放音频的音量要求基于音量要求,对预先获取的用户的语音音频进行调整,得到调整后的语音音频,将调整后的语音音频发送至接收端。本发明实施例的技术方案,可以根据音量要求对用户的语音音频进行增益值调整,使得最终播放的目标音频的音量值符合用户需求,避免设备输出的人声音频信息失真的情况发生,提高了用户的视听感。
图4为本发明实施例提供的应用于接收端的音频调整装置的结构示意图,该装置适用于执行本发明实施例提供的音频调整方法。如图4所示,该装置具体可以包括:
第一发送模块401,用于将预先确定的目标音频的音量要求发送至发送端,接收所述发送端发送的语音音频;其中,所述语音音频是根据所述音量要求调整后的语音音频;
处理模块402,用于将所述语音音频和所述背景音频进行混音处理,得到目标音频。
可选的,所述装置还用于:
将预先确定的目标音频的音量要求发送至发送端,接收所述发送端发送的语音音频;其中,所述语音音频是根据所述音量要求调整后的语音音频;
将所述语音音频和所述背景音频进行混音处理,得到目标音频。
可选的,在将预先确定的目标音频的音量要求发送至发送端之前,所述装置还用于:
接收客户端发送的背景音频,其中,所述背景音频包括所述背景音频的播放内容和播放信息;
根据所述背景音频的播放信息和预先确定的播放模式确定音量要求。
可选的,所述装置还用于:
确定所述接收端是否连接所述客户端的音频输出接口;
当所述接收端连接所述音频输出接口时,通过所述音频输出接口接收所述背景音频的模拟音频信号,并通过所述客户端接收所述背景音频的数字音频信号;
当所述接收端未连接所述音频输出接口时,通过所述客户端接收所述背景音频的数字音频信号。
可选的,所述装置还包括:
策略确定单元,用于基于所述音量要求确定所述目标音频在当前时间点上的调整策略;其中,所述调整策略包括:需要调整和不需要调整;
音频调整单元,用于基于所述目标音频在当前时间点上的调整策略对所述目标音频中的语音音频再次进行调整。
可选的,所述策略确定单元具体用于:
确定所述背景音频在当前时间点上是否存在背景语音;
若所述背景音频在当前时间点上存在背景语音,则根据在当前时间点上存在的背景语音和所述音量要求,确定所述目标音频在当前时间点上的调整策略为需要调整。
可选的,所述音频调整单元具体用于:
当所述目标音频在当前时间点上的调整策略为需要调整时,基于所述背景语音和所述调整策略对所述目标音频中的语音音频再次进行调整。
本发明实施例所提供的音频调整装置可执行本发明任意实施例所提供的音频调整方法,具备执行方法相应的功能模块和有益效果。本实施例中未详尽描述的内容可以参考本发明任意方法实施例中的描述。
图5为本发明实施例提供的应用于发送端的音频调整装置的结构示意图,该装置适用于执行本发明实施例提供的音频调整方法。如图5所示,该装置具体可以包括:
接收模块501,用于获取接收端发送的播放音频的音量要求;
调整模块502,用于基于所述音量要求,对预先获取的用户的语音音频进行调整,得到调整后的语音音频;
第二发送模块503,用于将所述调整后的语音音频发送至所述接收端。
本发明实施例所提供的音频调整装置可执行本发明任意实施例所提供的音频调整方法,具备执行方法相应的功能模块和有益效果。本实施例中未详尽描述的内容可以参考本发明任意方法实施例中的描述。
图6为本发明实施例提供的电子设备的一个结构示意图,参考图6,其示出了适于用来实现本发明实施例的电子设备的计算机系统12的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。另外,本实施例中的电子设备12,显示器24不是作为独立个体存在,而是嵌入镜面中,在显示器24的显示面不予显示时,显示器24的显示面与镜面从视觉上融为一体。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图6中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及音频信号调整,例如实现本发明实施例所提供的一种音频调整方法将预先确定的目标音频的音量要求发送至发送端,接收所述发送端发送的语音音频;其中,所述语音音频是根据所述音量要求调整后的语音音频;将所述语音音频和所述背景音频进行混音处理,得到目标音频。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明所有发明实施例提供的一种音频调整方法:将预先确定的目标音频的音量要求发送至发送端,接收所述发送端发送的语音音频;其中,所述语音音频是根据所述音量要求调整后的语音音频;将所述语音音频和所述背景音频进行混音处理,得到目标音频。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体地例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种音频调整方法,其特征在于,应用于接收端,所述方法包括:
将预先确定的目标音频的音量要求发送至发送端,接收所述发送端发送的语音音频;其中,所述语音音频是根据所述音量要求调整后的语音音频;
将所述语音音频和所述背景音频进行混音处理,得到目标音频。
2.根据权利要求1所述的方法,其特征在于,在将预先确定的目标音频的音量要求发送至发送端之前,所述方法还包括:
接收客户端发送的背景音频,其中,所述背景音频包括所述背景音频的播放内容和播放信息;
根据所述背景音频的播放信息和预先确定的播放模式确定音量要求。
3.根据权利要求2所述的方法,其特征在于,所述接收客户端发送的背景音频,包括:
确定所述接收端是否连接所述客户端的音频输出接口;
当所述接收端连接所述音频输出接口时,通过所述音频输出接口接收所述背景音频的模拟音频信号,并通过所述客户端接收所述背景音频的数字音频信号;
当所述接收端未连接所述音频输出接口时,通过所述客户端接收所述背景音频的数字音频信号。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
基于所述音量要求确定所述目标音频在当前时间点上的调整策略;其中,所述调整策略包括:需要调整和不需要调整;
基于所述目标音频在当前时间点上的调整策略对所述目标音频中的语音音频再次进行调整。
5.根据权利要求4所述的方法,其特征在于,所述基于所述音量要求确定所述目标音频在当前时间点上的调整策略,包括:
确定所述背景音频在当前时间点上是否存在背景语音;
若所述背景音频在当前时间点上存在背景语音,则根据在当前时间点上存在的背景语音和所述音量要求,确定所述目标音频在当前时间点上的调整策略为需要调整。
6.根据权利要求4所述的方法,其特征在于,所述基于所述调整策略对所述语音音频再次进行调整,包括:
当所述目标音频在当前时间点上的调整策略为需要调整时,基于所述背景语音和所述调整策略对所述目标音频中的语音音频再次进行调整。
7.一种音频调整方法,其特征在于,应用于发送端,所述方法包括:
获取接收端发送的播放音频的音量要求;
基于所述音量要求,对预先获取的用户的语音音频进行调整,得到调整后的语音音频;
将所述调整后的语音音频发送至所述接收端。
8.一种音频调整装置,其特征在于,应用于接收端,所述音频信号调整装置包括:
第一发送模块,用于将预先确定的目标音频的音量要求发送至发送端,接收所述发送端发送的语音音频;其中,所述语音音频是根据所述音量要求调整后的语音音频;
处理模块,用于将所述语音音频和所述背景音频进行混音处理,得到目标音频。
9.一种音频调整装置,其特征在于,应用于发送端,所述音频信号调整装置包括:
接收模块,用于获取接收端发送的播放音频的音量要求;
调整模块,用于基于所述音量要求,对预先获取的用户的语音音频进行调整,得到调整后的语音音频;
第二发送模块,用于将所述调整后的语音音频发送至所述接收端。
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7中任一所述的音频调整方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至7中任一所述的音频调整方法。
CN202210997515.8A 2022-08-19 一种音频调整方法、装置、电子设备和存储介质 Active CN115379256B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210997515.8A CN115379256B (zh) 2022-08-19 一种音频调整方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210997515.8A CN115379256B (zh) 2022-08-19 一种音频调整方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN115379256A true CN115379256A (zh) 2022-11-22
CN115379256B CN115379256B (zh) 2024-06-25

Family

ID=

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1819707A (zh) * 2005-02-08 2006-08-16 上海渐华科技发展有限公司 卡拉ok麦克风
CN104093095A (zh) * 2014-07-15 2014-10-08 邓成忠 一种可自动调节音量的唱歌装置
CN105611404A (zh) * 2015-12-31 2016-05-25 北京东方云图科技有限公司 一种根据视频应用场景自动调节音频音量的方法及装置
CN205584350U (zh) * 2016-04-29 2016-09-14 广州朗国电子科技有限公司 K歌控制装置及电视机
US20200135158A1 (en) * 2017-05-02 2020-04-30 Yunjiang LOU System and Method of Reading Environment Sound Enhancement Based on Image Processing and Semantic Analysis
CN111653263A (zh) * 2020-06-12 2020-09-11 百度在线网络技术(北京)有限公司 音量调节方法、装置、电子设备以及存储介质
CN111866664A (zh) * 2020-07-20 2020-10-30 深圳市康冠商用科技有限公司 一种音频处理方法、装置、设备及计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1819707A (zh) * 2005-02-08 2006-08-16 上海渐华科技发展有限公司 卡拉ok麦克风
CN104093095A (zh) * 2014-07-15 2014-10-08 邓成忠 一种可自动调节音量的唱歌装置
CN105611404A (zh) * 2015-12-31 2016-05-25 北京东方云图科技有限公司 一种根据视频应用场景自动调节音频音量的方法及装置
CN205584350U (zh) * 2016-04-29 2016-09-14 广州朗国电子科技有限公司 K歌控制装置及电视机
US20200135158A1 (en) * 2017-05-02 2020-04-30 Yunjiang LOU System and Method of Reading Environment Sound Enhancement Based on Image Processing and Semantic Analysis
CN111653263A (zh) * 2020-06-12 2020-09-11 百度在线网络技术(北京)有限公司 音量调节方法、装置、电子设备以及存储介质
CN111866664A (zh) * 2020-07-20 2020-10-30 深圳市康冠商用科技有限公司 一种音频处理方法、装置、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN109658932B (zh) 一种设备控制方法、装置、设备及介质
US7755526B2 (en) System and method to modify a metadata parameter
US7844452B2 (en) Sound quality control apparatus, sound quality control method, and sound quality control program
CN112272170B (zh) 语音通信方法及装置、电子设备、存储介质
CN111033614B (zh) 音量调节方法、装置、移动终端及存储介质
CN107465824B (zh) 音量调节方法、装置、移动终端及存储介质
CN110799936B (zh) 音量调节方法、装置、终端设备及存储介质
US11564050B2 (en) Audio output apparatus and method of controlling thereof
CN107526570B (zh) 音量调节方法、装置、终端设备及存储介质
CN111163330A (zh) 直播视频的渲染方法、装置、系统、设备及存储介质
CN108573393A (zh) 评论信息处理方法、装置、服务器及存储介质
WO2019033942A1 (zh) 音量调节方法、装置、终端设备及存储介质
CN107145327A (zh) 一种音频播放方法、装置及智能设备
CN107483734B (zh) 音量调节方法、装置、终端设备及存储介质
CN108829370B (zh) 有声资源播放方法、装置、计算机设备及存储介质
CN114845212A (zh) 音量优化方法、装置、电子设备及可读存储介质
CN113360129A (zh) 声音播放方法、装置、电子设备及可读存储介质
CN115379256B (zh) 一种音频调整方法、装置、电子设备和存储介质
CN115379256A (zh) 一种音频调整方法、装置、电子设备和存储介质
CN106293607B (zh) 自动切换音频输出模式的方法及系统
CN115802087A (zh) 音画同步处理方法及其相关设备
US20180152739A1 (en) Device-Based Audio-Format Selection
CN112307161B (zh) 用于播放音频的方法和装置
EP2573728A1 (en) Sound-source distribution method for an electronic terminal, and system for same
CN114615609B (zh) 助听器控制方法、助听器设备、装置、设备和计算机介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant