CN112261470A - 音频处理方法及装置 - Google Patents

音频处理方法及装置 Download PDF

Info

Publication number
CN112261470A
CN112261470A CN202011135853.8A CN202011135853A CN112261470A CN 112261470 A CN112261470 A CN 112261470A CN 202011135853 A CN202011135853 A CN 202011135853A CN 112261470 A CN112261470 A CN 112261470A
Authority
CN
China
Prior art keywords
audio
playing
sound source
target
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011135853.8A
Other languages
English (en)
Inventor
马荣强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN202011135853.8A priority Critical patent/CN112261470A/zh
Publication of CN112261470A publication Critical patent/CN112261470A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请公开了一种音频处理方法及装置,属于电子设备领域。该方法中,会在播放目标音视频的过程中,检测是否存在为目标音视频的发声源预先设置的音频播放参数,若存在,则调用音频播放参数,按照音频播放参数播放发声源对应的音频。这样,根据预先为各发声源自己对应设置的音频播放参数来播放发声源对应的音频,一定程度上可以使得音频播放过程更为多样化,进而可以提高音频播放效果。

Description

音频处理方法及装置
技术领域
本申请属于电子设备领域,具体涉及一种音频处理方法及装置。
背景技术
随着电子设备的不断普及,电子设备的应用越来越广泛,人们使用电子设备播放音频的应用越来越多,比如,可以通过播放软件观看视频或者听音频,也可以在阅读软件中收听语音读物等。
现有的处理音频方法,一般是根据系统音频播放设置直接对音频整体进行播放,这样,使得音频播放过程较为单一,音频播放效果较差。
发明内容
本申请实施例的目的是提供一种音频处理方法及装置,能够解决音频处理方法较为单一,无法实现用户的多样化需求的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种音频处理方法,该方法包括:
在播放目标音视频的过程中,检测是否存在为所述目标音视频的发声源预先设置的音频播放参数;
若存在,则调用所述音频播放参数,按照所述音频播放参数播放所述发声源对应的音频。
第二方面,本申请实施例提供了一种音频处理装置,该装置包括:
第一检测模块,用于在播放目标音视频的过程中,检测是否存在为所述目标音视频的发声源预先设置的音频播放参数;
第一播放模块,用于若存在,则调用所述音频播放参数,按照所述音频播放参数播放所述发声源对应的音频。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的音频处理方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的音频处理方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的音频处理方法。
综上所述,本申请实施例提供的音频处理方法,会在播放目标音视频的过程中,检测是否存在为目标音视频的发声源预先设置的音频播放参数,若存在,则调用音频播放参数,按照音频播放参数播放发声源对应的音频。这样,根据预先为各发声源自己对应设置的音频播放参数来播放发声源对应的音频,一定程度上可以使得音频播放过程更为多样化,进而可以提高音频播放效果。
附图说明
图1是本申请实施例提供的一种音频处理方法的步骤流程图;
图2是本申请实施例提供的另一种音频处理方法的步骤流程图;
图3是本申请实施例提供的一种音频处理示意图;
图4是本发明实施例还提供了一种音频处理装置的结构框图;
图5为实现本申请实施例的一种电子设备的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的音频处理方法进行详细地说明。
图1是本申请实施例提供的一种音频处理方法的步骤流程图,如图1所示,该方法可以包括:
步骤101、在播放目标音视频的过程中,检测是否存在为所述目标音视频的发声源预先设置的音频播放参数。
具体播放目标音视频时,可以是接收第一输入;响应于所述第一输入,播放目标音视频。
本申请实施例中,第一输入可以是对目标音视频进行播放的确定操作,该第一输入可以是针对播放音视频按钮的点击操作,其中,播放音视频按钮可以是电子设备上的实体按键或按键组合,也可以是显示播放音视频界面上的虚拟按钮。第一输入也可以是执行播放音视频的手势操作,还可以是预设的特定运动轨迹的滑动操作。用户可以在需要播放目标音视频时,执行第一输入,相应地,电子设备可以接收该第一输入。目标音视频可以是用户选定的音频或者视频,该目标音视频可以是预先在电子设备上存储的音频或者视频,也可以是网络上在线播放的音频或者视频,本发明对此不做限制。播放目标音视频,可以是获取目标音频或者视频的播放参数,按照播放参数播放目标音频或者视频。
本申请实施例中,目标音视频中的发声源,可以是将目标音频或者视频中出现的人物、动物或者旁白等作为发声源,其中,在播放目标音视频时,当前时刻的音频中可以有一个发声源,也可以同时有多个发声源。具体的,确定目标音视频中的发声源,可以是预先对目标音视频进行检测,确定目标音视频中出现的发声源个数,再根据每个发声源的音频特征,从目标音视频中提取仅包含一个发声源音频特征的音频,将该仅包含一个发声源音频特征的音频作为目标音视频中该发声源的音频。
检测是否存在为目标音视频的发声源预先设置的音频播放参数,可以是在播放目标音视频的过程中,检测是否存在针对任一发声源的音频预先设置的音频播放参数。其中,音频播放参数可以是播放音频时的音量、语速,也可以是播放音频时的音色、使用语言等,对此本发明不作限制。
步骤102、若存在,则调用所述音频播放参数,按照所述音频播放参数播放所述发声源对应的音频。
本申请实施例中,调用音频播放参数,按照音频播放参数播放发声源对应的音频,可以是根据预先设置的音频播放参数,调用相匹配的音频播放参数,并按照预先设置的音频播放参数来播放该发声源对应的音频。
示例的,目标音视频中存储有针对发声源人物A,设置的音频播放参数为“音量设置为80,音色设置为萝莉音”,而目标音视频当前的播放参数为“音量设置为50,音色设置为无音色变换”,则在播放目标音视频时,以“音量设置为80,音色设置为萝莉音”来播放人物A对应的音频,以“音量设置为50,音色设置为无音色变换”来播放除人物A之外的音频。
综上所述,本申请实施例提供的音频处理方法,会在播放目标音视频的过程中,检测是否存在为目标音视频的发声源预先设置的音频播放参数,若存在,则调用音频播放参数,按照音频播放参数播放发声源对应的音频。这样,根据预先为各发声源自己对应设置的音频播放参数来播放发声源对应的音频,一定程度上可以使得音频播放过程更为多样化,进而可以提高音频播放效果。
图2是本申请实施例提供的另一种音频处理方法的步骤流程图,如图2所示,该方法可以包括:
步骤201、显示所述目标音视频对应的发声源列表;所述发声源列表中记录有所述目标音视频中包括的发声源。
本申请实施例中,显示目标音视频对应的发声源列表,可以是在预设显示界面上显示包含目标音视频中所有发声源的列表,该预设显示界面可以是在播放目标音视频界面上添加的界面,也可以是在其他界面上添加的新界面,对于显示界面的显示位置与样式本发明对此不做限制。发生源列表中可以表征有该目标音视频中出现的所有发声源,具体的,可以是发声源对应的人物名称,比如,可以是“目标音视频中的发声源:人物A、人物B、人物C、……”,也可以是发声源对应的人物图像,比如,可以是“目标音视频中的发声源:人物A图像、人物B图像、人物C图像、……”,还可以是表征发声源的符号、链接等,本发明对此不做限制。通过显示目标音视频对应的发声源列表,可以使用户更直观的获取到目标音视频中的所有发声源,从而可以提高确定目标发声源的效率。
步骤202、接收用户对所述发声源列表中记录的发声源的选择操作。
本申请实施例中,对发声源的选择操作可以是在显示的发生源列表中,对发声源的单击、双击、重按、长按等操作,具体的,可以是对表征发声源的文字、图像、符号、链接等的选择操作。用户可以在需要选择发声源时,执行该选择操作,相应地,电子设备可以接收该选择操作,将选中的发声源作为用户确定的目标发声源。示例的,显示有发声源列表“目标音视频中的发声源:人物A、人物B、人物C、……”,接收用户对“人物C”的选择操作,则可以将“人物C”对应的发声源作为目标发声源。通过接收用户在发声源列表中的选择操作确定目标发声源,可以提高用户操作的便利性。
步骤203、接收用户针对所述选择操作选中的目标发声源输入的音频播放参数。
本申请实施例中,音频播放参数可以至少包括播放时所使用的语言、播放语速、播放音量和/播放时所使用的音色,其中,播放语速可以是播放目标发声源时的速度,可以包括正常、快速、慢速等,播放时所使用的音色可以是根据指定音色对目标发声源进行转换后,播放指定音色的目标发声源,音色可以包括大叔音、沙哑音、萝莉音、御姐音等。
示例的,目标发声源的初始播放参数为“音量40,音色无,语速正常”,用户针对目标发声源输入的音频播放参数可以为“音量80,音色萝莉音,语速慢速”,则电子设备接收用户针对目标发声源输入的音频播放参数,即,接收“音量80,音色萝莉音,语速慢速”的音频播放参数。相较于需要进入电子设备的系统输出设置里,接收对目标发声源的播放参数,本发明可以直接接收用户针对目标发声源输入的音频播放参数,从而可以简化用户的操作步骤。
本发明实施例还可以在接收用户针对选择操作选中的目标发声源输入的音频播放参数之后,执行如下操作:接收用户对发声源列表中记录的其他发声源的选择操作,将音频播放参数设置为所选择的其他发声源的音频播放参数。
本申请实施例中,其他发声源可以是发声源列表中除目标发声源之外的发声源,该选择操作可以是针对其他发生源执行的点击等选中操作。将音频播放参数设置为所选择的其他发声源的音频播放参数,可以是将针对目标发声源设置的音频输出参数复制给其他发声源,以便其他发声源可以依据目标发声源设置的音频输出参数进行输出。这样,在接收到用户针对目标发声源输入的音频播放参数之后,还可以接收对发声源列表中记录的其他发声源的选择操作,将输入的音频播放参数作为所选择的其他发声源的音频播放参数,可以简化用户的操作步骤,从而提高音频处理的效率。
步骤204、将所述输入的音频播放参数,设置为所述目标发声源的音频播放参数。
示例的,目标发声源为“人物A”对应的音频,该人物A的初始音频播放参数为“音量30,音色无,语速正常”,而接收到针对人物A输入的音频播放参数为“音量85,音色大叔音,语速快速”,则可以将人物A的音频播放参数设置为“音量85,音色大叔音,语速快速”。通过将输入的音频播放参数设置为目标发声源的音频播放参数,可以提高音频处理的效率。
步骤205、在播放目标音视频的过程中,检测是否存在为所述目标音视频的发声源预先设置的音频播放参数。
具体的,本步骤的实现方式可以参照前述步骤103,本申请实施例对此不作限定。
步骤206、若存在,则调用所述音频播放参数,按照所述音频播放参数播放所述发声源对应的音频。
本发明实施例还可以在按照音频播放参数播放发声源对应的音频之前,执行如下操作:获取外界环境的环境音量;根据所述环境音量,调整所述音频播放参数播放中的播放音量;其中,调整后的所述播放音量的大小与所述环境音量的大小正相关。
具体的,外界环境的环境音量可以是在播放目标音视频时,电子设备所处的外界环境的环境音量,而获取外界环境的环境音量可以是电子设备调用麦克风录取外界环境的声音,再根据录取到的外界环境的声音确定外界环境的环境音量。根据环境音量调整音频播放参数播放中的播放音量,可以是先确定环境音量是否超过预设阈值,该预设阈值可以是根据实际情况预先设定的,比如,可以是60分贝,当环境音量超过预设阈值时,可以认为当前电子设备所处的环境较为嘈杂,则可以调整的音频播放参数播放中的播放音量,即,外界环境音量越大的情况下,调整后的播放音量也越大。具体的,可以是将目标音视频的播放音量直接调整为预设音量值,比如,该预设音量值可以为75,也可以是接收输入的调整播放音量,将目标音视频的播放音量调整为输入的调整播放音量。这样,根据电子设备所处的环境音量来调整播放目标音视频时的播放音量,使得用户不必手动调整音量,直接根据环境音量就可以自动调整播放音量,从而简化了用户的操作,并且,也保证了在嘈杂的环境中用户可以清楚接收到输出的目标音视频,降低了环境变化对用户接收音频的影响。示例的,获取到电子设备当前的环境音量为80分贝,由于环境音量80分贝大于预设阈值60分贝,则可以将播放目标音视频的音量,由原播放音量35调整为预设音量值60。
需要说明的是,可以先检测是否打开环境相关设置,在打开环境相关设置的情况下,再执行获取外界环境的环境音量的步骤。该环境相关设置可以是在播放参数设置界面上显示的设置按钮,通过接收用户针对该环境相关设置的确定操作,则可以打开该环境相关设置。这样,在打开环境相关设置的情况下,来执行获取外界环境的环境音量,可以提高音频处理的效率,避免发生不必要的误操作。
进一步地,电子设备还可以根据当前外界环境的环境音量,调整目标音视频显示的播放速度。具体的,可以是在环境音量超过预设阈值的情况下,将目标音视频显示的播放速度调整为预设播放速度,该预设播放速度可以是用户预先设置的,可以在当前外界环境的环境音量越大的情况下,调整目标音视频显示的播放速度越慢。例如,电子设备获取到当前外界环境的环境音量为82分贝,超过预设阈值60分贝,则可以将目标音视频显示的播放速度调整为慢速播放。这样,根据环境音量调整音视频显示的播放速度,可以避免由于环境较为嘈杂而导致用户遗漏音视频显示的内容,从而可以降低外界环境对用户接收音视频显示的影响,提高了用户接收音视频的效率。
本发明实施例中在接收用户针对所述选择操作选中的目标发声源输入的音频播放参数时,可以是接收不同音频内容场景下所述目标发声源对应的音频播放参数;相应地,调用所述音频播放参数的操作可以具体为:确定所述发声源在所述目标音视频中对应的当前音频内容场景;调用所述当前音频内容场景下所述目标发声源对应的音频播放参数。
具体的,可以是将视频对应的视频类型作为该视频对应的音频内容场景,也可以是在音频播放的内容中包含对应场景的关键词时,将该场景作为当前播放音频的音频内容场景,比如,当播放的目标音视频是动作类型的影片,则可以确定该目标音视频对应的音频内容场景为动作,当播放的目标音视频中出现关于爱情的关键词,比如,关键词可以是“喜欢”、“爱”等,则可以确定该目标音视频对应的音频内容场景为爱情,当播放的目标音视频是历史权谋电视剧,则可以确定该目标音视频对应的音频内容场景为历史。接收不同音频内容场景下目标发声源对应的音频播放参数,可以是对同一发声源在不同音频内容场景下设置不同的音频播放参数,也可以是对同一发声源在不同音频内容场景下设置相同的音频播放参数。
进一步地,确定发声源在目标音视频中对应的当前音频内容场景,调用当前音频内容场景下目标发声源对应的音频播放参数,可以是对目标发声源进行预先处理确定目标发声源包含的音频内容场景,比如,可以是对目标发声源对应的音频进行音频转文字处理,通过查找确定文字中是否包含音频内容场景对应的关键字,根据出现的关键字确定对应的音频内容场景,在播放到设置有音频播放参数的音频内容场景时,调用该音频内容场景对应音频播放参数播放目标发声源对应的音频。这样,在目标发声源不同的音频内容场景下调用该音频内容场景下的音频播放参数播放音频,可以实现用户对音频处理的多样化需求。
示例的,目标音视频中包含有人物A、人物B、人物C、人物D、人物E,接收用户的选择操作,确定人物A、人物B、人物C为目标发声源,其中,目标人物A包含的音频内容场景有:历史、爱情、动作,目标人物B包含的音频内容场景有:情感、催泪、惊悚,目标人物C包含的音频内容场景有:郊游、运动、草原,则可以对目标人物A设置有音频播放参数00,对目标人物A的历史音频内容场景下设置音频播放参数01,对目标人物A的爱情音频内容场景下设置音频播放参数02,对目标人物A的动作音频内容场景下设置音频播放参数03;可以对目标人物B设置有音频播放参数10,对目标人物B的情感音频内容场景下设置音频播放参数11,对目标人物B的催泪音频内容场景下设置音频播放参数12,对目标人物B的惊悚音频内容场景下设置音频播放参数13;可以对目标人物C设置有音频播放参数20,对目标人物C的郊游音频内容场景下设置音频播放参数21,对目标人物C的运动音频内容场景下设置音频播放参数22,对目标人物C的草原音频内容场景下设置音频播放参数23。
本发明实施例还可以检测是否存在为所述发声源预先设置的显示参数;若存在为所述发声源预先设置的显示参数,则调用所述显示参数,并在播放所述发声源对应的音频的过程中,根据显示参数显示所述发声源对应的音频的文本;其中,显示参数至少包括文本显示位置、文本显示方式、文本字体和/或文本颜色。
具体的,发声源对应的显示参数可以是用于显示发声源音频对应的字幕文本内容时所用的参数,该显示参数可以是文本显示位置、文本显示方式、文本字体和/或文本颜色等。可以在为目标发声源设置音频播放参数时,为目标发声源设置显示参数,也可以是预先设定针对目标发声源的显示参数。在播放目标发声源对应的音频时,当检测到存在针对目标发声源设置的显示参数,则可以根据该显示参数来显示目标发声源对应音频的文本内容。例如,针对目标发声源人物A设置有显示参数“文本显示位置:屏幕上方,文本显示方式:滚动显示,文本字体大小:三号,文本颜色:红色”,则可以调用该显示参数来显示人物A对应音频的文本内容。通过为不同发声源设置不同的显示参数,并根据该显示参数来显示对应的文本内容,可以增加对音频处理的多样性,可以实现不同用户的多样性需求。
本发明可以实现的场景为在用户观看视频的过程中,会存在特别关注的人物与不关注的人物,相较于现有技术中,只能通过对音频整体来调节声音大小、语速等参数,本发明可以实现对视频中单个人物对应的音频播放参数进行设置,以及对关注的音频内容场景下对该人物的音频播放参数进行设置,使得在播放该视频时,当出现关注的目标音频内容场景中,可以调用设置的音频播放参数来播放该人物对应的音频,从而可以凸显出需要关注的人物声音和场景。当出现未设置音频播放参数的音频内容场景时,可以调用系统设置的音频内容参数播放该音频,当出现不关注的目标音频内容场景时,可以调用其他设置的音频播放参数来进行快速灰度播放,比如,其他设置的灰度播放可以是将音频的音量减小到20、语速为加快来播放。这样,既可以突出播放用户关注的音频内容场景下的音频,也可以加快播放用户不关注的音频内容场景下的音频,从而可以提高音频处理的多样性,提高了用户的体验。
本发明还可以实现的场景为用户使用语音阅读书籍和小说时,由于目前很多应用程序只是简单的使用系统默认的语音进行阅读,使得阅读的效果较为单调,本发明可以根据小说的人物,以及具体内容场景设置不同的音频播放参数,比如,可以根据个人的喜好,将不同人物的声音,比如,男、女、小孩、动物等,分别设置成自己喜欢的模式,比如,沧桑,萝莉,童音,甜蜜等音频播放参数,再配合不同的内容场景,比如,打斗,爱情、放牧、惊悚等场景,将小说的内容通过多种多样的音频展现给用户,可以实现用户对音频处理的多样化需求,提高了用户接收有声读物的体验。
本发明还可以实现的场景为在嘈杂的环境中,比如用户在乘坐地铁、公交等交通工具时,正好视频演到精彩部分,或者需要听到或者看到某个人物重要场景的时候,由于嘈杂的环境往往会使用户错过或者没有听清喜欢的重要场景或者重要人物的对话。相较于现有技术中只能通过用户反复拖动进度条来重新观看,或者手动调节声音来重新观看,本发明可以根据对电子设备所处环境的环境音量,在不同的环境音量下,根据用户不同的需求,来自动调节播放音频的音量和播放速率。例如,在走路或者跑步运动的场景下,由于用户不能实时关注音频播放的情况,会导致错过用户关注的重要场景,在现有技术中只能通过实时的手动调节,点击暂停播放来重新收听错过的场景内容,操作方法较为繁琐,而本发明可以根据对电子设备所处坏境的采集,确定环境音量,来实时自动控制音频的播放速率,比如用户在走路或者跑步的时候,环境音量较为嘈杂,可以以正常倍速播放或者更慢的倍速播放音频,当用户在安静坐着看视频的时候,环境音量较为安静,可以自动以1.5倍或者更高的倍速播放音频。这样,可以简化用户的操作步骤,并且,可以根据个人习惯和偏好对音频进行调节,提高了用户的体验。
示例的,图3是是本申请实施例提供的一种音频处理示意图,如图3所示,先接收到设置指令,再选定设置目标发声源,设置并保存音频输出参数到对应的目标发声源,可以检测是否需要设定其他目标发声源,若需要,则可以将音频输出参数复制到其他目标发声源,若不需要,则可以保存退出,同时,还可以在播放时检测当前播放音频是否是设定目标发声源,若不是,则使用系统默认参数播放,若是,则可以调用设定的音频输出参数,并且,检测是否有设置的显示相关参数,若是,则使用设定的显示参数显示目标发声源对应的文本,若否,则使用系统默认方式显示。
综上所述,本申请实施例提供的音频处理方法,会先显示目标音视频对应的发声源列表,该发声源列表中记录有目标音视频中包括的发声源,接收用户对发声源列表中记录的发声源的选择操作,再接收用户针对选择操作选中的目标发声源输入的音频播放参数,将输入的音频播放参数,设置为目标发声源的音频播放参数,最后,在播放目标音视频的过程中,检测是否存在为目标音视频的发声源预先设置的音频播放参数,若存在,则调用音频播放参数,按照音频播放参数播放发声源对应的音频。这样,通过显示目标音视频对应的发声源列表来确定目标发声源,可以使用户更直观的获取到目标音视频中的所有发声源,从而可以提高确定目标发声源的效率,以及提高用户操作的便利性,并且,根据预先为各发声源自己对应设置的音频播放参数来播放发声源对应的音频,一定程度上可以使得音频播放过程更为多样化,进而可以提高音频播放效果。
需要说明的是,本申请实施例提供的音频处理方法,执行主体可以为音频处理装置,或者该音频处理装置中的用于执行音频处理的方法的控制模块。本申请实施例中以音频处理装置执行音频处理方法为例,说明本申请实施例提供的音频处理装置。
图4是本发明实施例还提供了一种音频处理装置的结构框图,如图4所示,该音频处理装置30可以包括:
第一检测模块301,用于在播放目标音视频的过程中,检测是否存在为所述目标音视频的发声源预先设置的音频播放参数;
第一播放模块302,用于若存在,则调用所述音频播放参数,按照所述音频播放参数播放所述发声源对应的音频。
综上所述,本申请实施例提供的音频处理装置,会在播放目标音视频的过程中,检测是否存在为目标音视频的发声源预先设置的音频播放参数,若存在,则调用音频播放参数,按照音频播放参数播放发声源对应的音频。这样,根据预先为各发声源自己对应设置的音频播放参数来播放发声源对应的音频,一定程度上可以使得音频播放过程更为多样化,进而可以提高音频播放效果。
可选的,所述装置30还包括:
第一显示模块,用于显示所述目标音视频对应的发声源列表;所述发声源列表中记录有所述目标音视频中包括的发声源;
第一接收模块,用于接收用户对所述发声源列表中记录的发声源的选择操作;
第二接收模块,用于接收用户针对所述选择操作选中的目标发声源输入的音频播放参数;
第一设置模块,用于将所述输入的音频播放参数,设置为所述目标发声源的音频播放参数。
可选的,所述装置30还包括:
第三接收模块,用于接收用户对所述发声源列表中记录的其他发声源的选择操作;
第二设置模块,用于将所述音频播放参数设置为所选择的其他发声源的音频播放参数。
可选的,所述第二接收模块,还用于:
接收不同音频内容场景下所述目标发声源对应的音频播放参数;
相应地,所述第一播放模块302,还用于:
确定所述发声源在所述目标音视频中对应的当前音频内容场景;
调用所述当前音频内容场景下所述目标发声源对应的音频播放参数。
可选的,所述装置30还包括:
获取模块,用于获取外界环境的环境音量;
调整模块,用于根据所述环境音量,调整所述音频播放参数播放中的播放音量;其中,调整后的所述播放音量的大小与所述环境音量的大小正相关。
可选的,所述装置30还包括:
第二检测模块,用于检测是否存在为所述发声源预先设置的显示参数;
第二显示模块,用于若存在为所述发声源预先设置的显示参数,则调用所述显示参数,并在播放所述发声源对应的音频的过程中,根据显示参数显示所述发声源对应的音频的文本;其中,显示参数至少包括文本显示位置、文本显示方式、文本字体和/或文本颜色。
可选的,所述音频播放参数至少包括播放时所使用的语言、播放语速、播放音量和/播放时所使用的音色。
综上所述,本申请实施例提供的音频处理装置,会先显示目标音视频对应的发声源列表,该发声源列表中记录有目标音视频中包括的发声源,接收用户对发声源列表中记录的发声源的选择操作,再接收用户针对选择操作选中的目标发声源输入的音频播放参数,将输入的音频播放参数,设置为目标发声源的音频播放参数,最后,在播放目标音视频的过程中,检测是否存在为目标音视频的发声源预先设置的音频播放参数,若存在,则调用音频播放参数,按照音频播放参数播放发声源对应的音频。这样,通过显示目标音视频对应的发声源列表来确定目标发声源,可以使用户更直观的获取到目标音视频中的所有发声源,从而可以提高确定目标发声源的效率,以及提高用户操作的便利性,并且,根据预先为各发声源自己对应设置的音频播放参数来播放发声源对应的音频,一定程度上可以使得音频播放过程更为多样化,进而可以提高音频播放效果。
本申请实施例中的音频处理装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personaldigital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的音频处理装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的音频处理装置能够实现图1至图3的方法实施例的各个过程,为避免重复,这里不再赘述。
可选的,本申请实施例还提供一种电子设备400,包括处理器410,存储器409,存储在存储器409上并可在所述处理器410上运行的程序或指令,该程序或指令被处理器410执行时实现上述音频处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图5为实现本申请实施例的一种电子设备的硬件结构示意图。
该电子设备400包括但不限于:射频单元401、网络模块402、音频输出单元403、输入单元404、传感器405、显示单元406、用户输入单元407、接口单元408、存储器409、以及处理器410等部件。
本领域技术人员可以理解,电子设备400还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器410逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图5中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器410,用于在播放目标音视频的过程中,检测是否存在为所述目标音视频的发声源预先设置的音频播放参数;
音频输出单元403,用于若存在,则调用所述音频播放参数,按照所述音频播放参数播放所述发声源对应的音频。
综上所述,本申请实施例提供的音频处理方法,会在播放目标音视频的过程中,检测是否存在为目标音视频的发声源预先设置的音频播放参数,若存在,则调用音频播放参数,按照音频播放参数播放发声源对应的音频。这样,根据预先为各发声源自己对应设置的音频播放参数来播放发声源对应的音频,一定程度上可以使得音频播放过程更为多样化,进而可以提高音频播放效果。
应理解的是,本申请实施例中,输入单元404可以包括图形处理器(GraphicsProcessing Unit,GPU)4041和麦克风4042,图形处理器4041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元406可包括显示面板4061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板4061。用户输入单元407包括触控面板4071以及其他输入设备4072。触控面板4071,也称为触摸屏。触控面板4071可包括触摸检测装置和触摸控制器两个部分。其他输入设备4072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器409可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器410可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器410中。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述音频处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述音频处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (10)

1.一种音频处理方法,其特征在于,所述方法包括:
在播放目标音视频的过程中,检测是否存在为所述目标音视频的发声源预先设置的音频播放参数;
若存在,则调用所述音频播放参数,按照所述音频播放参数播放所述发声源对应的音频。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
显示所述目标音视频对应的发声源列表;所述发声源列表中记录有所述目标音视频中包括的发声源;
接收用户对所述发声源列表中记录的发声源的选择操作;
接收用户针对所述选择操作选中的目标发声源输入的音频播放参数;
将所述输入的音频播放参数,设置为所述目标发声源的音频播放参数。
3.根据权利要求2所述的方法,其特征在于,所述接收用户针对所述选择操作选中的目标发声源输入的音频播放参数,包括:
接收不同音频内容场景下所述目标发声源对应的音频播放参数;
相应地,所述调用所述音频播放参数,包括:
确定所述发声源在所述目标音视频中对应的当前音频内容场景;
调用所述当前音频内容场景下所述目标发声源对应的音频播放参数。
4.根据权利要求1所述的方法,其特征在于,所述按照所述音频播放参数播放所述发声源对应的音频之前,还包括:
获取外界环境的环境音量;
根据所述环境音量,调整所述音频播放参数播放中的播放音量;其中,调整后的所述播放音量的大小与所述环境音量的大小正相关。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
检测是否存在为所述发声源预先设置的显示参数;
若存在为所述发声源预先设置的显示参数,则调用所述显示参数,并在播放所述发声源对应的音频的过程中,根据显示参数显示所述发声源对应的音频的文本;
其中,显示参数至少包括文本显示位置、文本显示方式、文本字体和/或文本颜色。
6.一种音频处理装置,其特征在于,所述装置包括:
第一检测模块,用于在播放目标音视频的过程中,检测是否存在为所述目标音视频的发声源预先设置的音频播放参数;
第一播放模块,用于若存在,则调用所述音频播放参数,按照所述音频播放参数播放所述发声源对应的音频。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第一显示模块,用于显示所述目标音视频对应的发声源列表;所述发声源列表中记录有所述目标音视频中包括的发声源;
第一接收模块,用于接收用户对所述发声源列表中记录的发声源的选择操作;
第二接收模块,用于接收用户针对所述选择操作选中的目标发声源输入的音频播放参数;
第一设置模块,用于将所述输入的音频播放参数,设置为所述目标发声源的音频播放参数。
8.根据权利要求7所述的装置,其特征在于,所述第二接收模块,还用于:
接收不同音频内容场景下所述目标发声源对应的音频播放参数;
相应地,所述第一播放模块,还用于:
确定所述发声源在所述目标音视频中对应的当前音频内容场景;
调用所述当前音频内容场景下所述目标发声源对应的音频播放参数。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
获取模块,用于获取外界环境的环境音量;
调整模块,用于根据所述环境音量,调整所述音频播放参数播放中的播放音量;其中,调整后的所述播放音量的大小与所述环境音量的大小正相关。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二检测模块,用于检测是否存在为所述发声源预先设置的显示参数;
第二显示模块,用于若存在为所述发声源预先设置的显示参数,则调用所述显示参数,并在播放所述发声源对应的音频的过程中,根据显示参数显示所述发声源对应的音频的文本;其中,显示参数至少包括文本显示位置、文本显示方式、文本字体和/或文本颜色。
CN202011135853.8A 2020-10-21 2020-10-21 音频处理方法及装置 Pending CN112261470A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011135853.8A CN112261470A (zh) 2020-10-21 2020-10-21 音频处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011135853.8A CN112261470A (zh) 2020-10-21 2020-10-21 音频处理方法及装置

Publications (1)

Publication Number Publication Date
CN112261470A true CN112261470A (zh) 2021-01-22

Family

ID=74264733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011135853.8A Pending CN112261470A (zh) 2020-10-21 2020-10-21 音频处理方法及装置

Country Status (1)

Country Link
CN (1) CN112261470A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116208700A (zh) * 2023-04-25 2023-06-02 深圳市华卓智能科技有限公司 一种手机与音频设备通信的控制方法和系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05204388A (ja) * 1992-01-24 1993-08-13 Mitsubishi Electric Corp メッセージ出力装置
CN101189657A (zh) * 2005-05-31 2008-05-28 皇家飞利浦电子股份有限公司 一种用于对多媒体信号执行自动配音的方法和设备
CN105898364A (zh) * 2016-05-26 2016-08-24 北京小米移动软件有限公司 一种视频播放处理方法、装置、终端及系统
CN107027053A (zh) * 2017-05-08 2017-08-08 深圳Tcl数字技术有限公司 音频播放方法、终端及计算机可读存储介质
CN107071316A (zh) * 2016-12-30 2017-08-18 华为技术有限公司 自动调节音量的方法和终端设备
CN107396177A (zh) * 2017-08-28 2017-11-24 北京小米移动软件有限公司 视频播放方法、装置及存储介质
CN108337543A (zh) * 2017-12-27 2018-07-27 努比亚技术有限公司 一种视频播放方法、终端及计算机可读存储介质
CN109121005A (zh) * 2018-09-30 2019-01-01 联想(北京)有限公司 多媒体数据的处理方法及电子设备
CN109618223A (zh) * 2019-01-28 2019-04-12 北京易捷胜科技有限公司 一种声音替换方法
CN110493636A (zh) * 2019-08-30 2019-11-22 母国标 音视频调节方法、装置、终端设备及存储介质
CN110933490A (zh) * 2019-11-20 2020-03-27 深圳创维-Rgb电子有限公司 一种画质和音质的自动调整方法、智能电视机及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05204388A (ja) * 1992-01-24 1993-08-13 Mitsubishi Electric Corp メッセージ出力装置
CN101189657A (zh) * 2005-05-31 2008-05-28 皇家飞利浦电子股份有限公司 一种用于对多媒体信号执行自动配音的方法和设备
CN105898364A (zh) * 2016-05-26 2016-08-24 北京小米移动软件有限公司 一种视频播放处理方法、装置、终端及系统
CN107071316A (zh) * 2016-12-30 2017-08-18 华为技术有限公司 自动调节音量的方法和终端设备
CN107027053A (zh) * 2017-05-08 2017-08-08 深圳Tcl数字技术有限公司 音频播放方法、终端及计算机可读存储介质
CN107396177A (zh) * 2017-08-28 2017-11-24 北京小米移动软件有限公司 视频播放方法、装置及存储介质
CN108337543A (zh) * 2017-12-27 2018-07-27 努比亚技术有限公司 一种视频播放方法、终端及计算机可读存储介质
CN109121005A (zh) * 2018-09-30 2019-01-01 联想(北京)有限公司 多媒体数据的处理方法及电子设备
CN109618223A (zh) * 2019-01-28 2019-04-12 北京易捷胜科技有限公司 一种声音替换方法
CN110493636A (zh) * 2019-08-30 2019-11-22 母国标 音视频调节方法、装置、终端设备及存储介质
CN110933490A (zh) * 2019-11-20 2020-03-27 深圳创维-Rgb电子有限公司 一种画质和音质的自动调整方法、智能电视机及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116208700A (zh) * 2023-04-25 2023-06-02 深圳市华卓智能科技有限公司 一种手机与音频设备通信的控制方法和系统

Similar Documents

Publication Publication Date Title
US9786326B2 (en) Method and device of playing multimedia and medium
CN107370887B (zh) 一种表情生成方法及移动终端
CN110634483A (zh) 人机交互方法、装置、电子设备及存储介质
CN109245997B (zh) 语音消息播放方法及装置
WO2022022536A1 (zh) 音频播放方法、音频播放装置和电子设备
EP3933570A1 (en) Method and apparatus for controlling a voice assistant, and computer-readable storage medium
CN111131875A (zh) 信息的展示方法、装置、系统、电子设备及存储介质
CN111556352B (zh) 多媒体资源分享方法、装置、电子设备及存储介质
CN113806570A (zh) 图像生成方法和生成装置、电子设备和存储介质
CN113852767B (zh) 视频编辑方法、装置、设备及介质
CN110062276A (zh) 音视频数据的处理方法、装置及电子设备和存储介质
CN112261470A (zh) 音频处理方法及装置
CN112732374A (zh) 一种页面展示方法、展示装置、电子设备及存储介质
CN116233554A (zh) 视频播放方法、装置、电子设备和存储介质
CN114189719B (zh) 视频信息提取方法、装置、电子设备及存储介质
KR20230120668A (ko) 영상통화 방법 및 장치
CN115278352A (zh) 一种视频播放方法、装置、设备及存储介质
CN113885994A (zh) 显示方法、装置和电子设备
CN111913770B (zh) 显示方法、装置、电子设备及介质
CN113593614A (zh) 图像处理方法及装置
CN112565913A (zh) 视频通话方法、装置和电子设备
CN113409766A (zh) 一种识别方法、装置、用于识别的装置及语音合成方法
CN113674731A (zh) 语音合成处理方法、装置和介质
CN112487247A (zh) 视频处理方法及视频处理装置
CN112988956B (zh) 自动生成对话的方法及装置、信息推荐效果检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210122