CN109508166B - 音频播放方法、装置、设备及存储介质 - Google Patents

音频播放方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109508166B
CN109508166B CN201810873034.XA CN201810873034A CN109508166B CN 109508166 B CN109508166 B CN 109508166B CN 201810873034 A CN201810873034 A CN 201810873034A CN 109508166 B CN109508166 B CN 109508166B
Authority
CN
China
Prior art keywords
audio
preset
playing
information
volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810873034.XA
Other languages
English (en)
Other versions
CN109508166A (zh
Inventor
罗夏君
叶世权
杨浩
徐礼超
蒙建康
李明伟
张团庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Shanghai Xiaodu Technology Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Shanghai Xiaodu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd, Shanghai Xiaodu Technology Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Priority to CN201810873034.XA priority Critical patent/CN109508166B/zh
Publication of CN109508166A publication Critical patent/CN109508166A/zh
Application granted granted Critical
Publication of CN109508166B publication Critical patent/CN109508166B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

本发明提供一种音频播放方法、装置、设备及存储介质,该方法可包括:向服务器发送播放请求;接收服务器发送的包括预设音频的信息和目标音频的信息的待播放信息;根据待播放信息在播放目标音频的过程中播放预设音频。本发明可提高用户沉浸感,提高用户体验。

Description

音频播放方法、装置、设备及存储介质
技术领域
本发明涉及信息处理技术领域,尤其涉及一种音频播放方法、装置、设备及存储介质。
背景技术
随着网络以及人工智能技术的发展,越来越多的智能设备应运而生,且越来越多的用户倾向于接受智能化的服务。
作为智能化服务中的音乐播放,大多可在播放音乐之前,先为用户播放该介绍音频。这使得用户的音乐沉浸感较差,其用户体验较差。
发明内容
本发明提供一种音频播放方法、装置、设备及存储介质,以提高用户的沉浸感,提高用户体验。
第一方面,本发明提供一种音频播放方法,包括:
向服务器发送播放请求;
接收服务器发送的待播放信息;所述待播放信息包括:预设音频的信息和目标音频的信息;
根据所述待播放信息在播放所述目标音频的过程中播放所述预设音频。
第二方面,本发明还提供一种音频播放方法,包括:
接收终端发送的播放请求;
根据所述播放请求,确定待播放的预设音频和目标音频;
向所述终端发送待播放信息;所述待播放信息包括:所述预设音频的信息,和,所述目标音频的信息;所述待播放信息用于使得所述终端在播放所述目标音频的过程中播放所述预设音频。
第三方面,本发明提供一种音频播放装置,包括:
发送模块,用于向服务器发送播放请求;
接收模块,用于接收服务器发送的待播放信息;所述待播放信息包括:预设音频的信息和目标音频的信息;
播放模块,用于根据所述待播放信息,在播放所述目标音频的过程中播放所述预设音频。
第四方面,本发明提供一种音频播放装置,包括:
接收模块,用于接收终端发送的播放请求;
确定模块,用于根据所述播放请求,确定待播放信息;所述待播放信息包括:预设音频的信息和目标音频的信息;
发送模块,用于向所述终端发送所述待播放信息;所述待播放信息用于使得所述终端根据所述待播放信息,在播放所述目标音频的过程中播放所述预设音频。
第五方面,本发明提供一种终端,包括:存储器及处理器;所述存储器与所述处理器连接;
所述存储器,用于存储程序指令;
所述处理器,用于在程序指令被执行时,可实现第一方面所述的音频播放方法。
第六方面,本发明提供一种服务器,包括:存储器及处理器;所述存储器与所述处理器连接;
所述存储器,用于存储程序指令;
所述处理器,用于在程序指令被执行时,可实现第二方面所述的音频播放方法。
第七方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面所述的音频播放方法。
第八方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第二方面所述的音频播放方法。
本发明提供一种音频播放方法、装置、设备及存储介质,可通过终端向服务器发送播放请求,并接收服务器发送的包括有预设音频的信息和目标音频的信息的待播放信息,根据该待播放信息在播放该目标音频的过程中播放该预设音频。该方法中可在目标音频的播放过程中播放预设音频,实现了目标音频和预设音频的叠加播放,使得预设音频和目标音频的播放更流畅更自然,提高了用户的沉浸感,提高用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种音频播放方法的流程图一;
图2为本发明实施例提供的一种音频播放方法的流程图二;
图3为本发明实施例提供的一种音频播放装置的结构示意图一;
图4为本发明实施例提供的一种音频播放装置的结构示意图二;
图5为本发明实施例提供的终端的结构示意图;
图6为本发明实施例提供的服务器的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例各部分及附图中的术语“第一”、“第二”及“第三”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明下述实施例所涉及的方法流程图仅是示例性说明,不是必须包括所有的内容和步骤,也不是必须按照所描述的顺序执行。例如,有些步骤还可以分解,而有些步骤可以合并或部分合并,因此,实际执行的顺序可根据实际情况改变。
本发明下述实施例所涉及的方框图中的功能模块仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或者不同网络和/或处理器和/或微控制器中实现这些功能实体。
如下结合多个实例对本发明实施例提供的音频播放方法、装置、设备及存储介质进行说明。图1为本发明实施例提供的一种音频播放方法的流程图一。该音频播放方法可由终端与服务器交互实现。其中,该终端例如是台式电脑、笔记本、个人数字助理(PersonalDigital Assistant,简称:PDA)、智能手机、平板电脑、智能机器人、智能音箱等任一具有播放功能的终端。该服务器例如可以为音频播放功能对应的云端服务器。
示例地,具有音频播放功能的终端例如可安装或集成有音频类应用程序,该服务器例如可以为该音频类应用程序的应用服务器。如图1所示,本实施例所示的音频播放方法可包括如下:
S101、终端向服务器发送播放请求。
该终端可在接收到用户输入的操作指令的情况下,向服务器发送该播放请求。其中,该操作指令,例如可以为用户输入的播放指令,或者,开机指令,或者音频类应用程序的开启指令等任一类型的指令。该操作指令可以为通过语音输入的操作指令,也可以为通过触控手势输入的指令,还可以为通过输入点击操作等输入的指令。
S102、服务器接收来自终端的该播放请求。
S103、服务器根据该播放请求,确定待播放的预设音频和目标音频。
该播放请求中可包括有播放需求的信息,也可不包括播放需求的信息。
其中,该播放需求可以为用户针对目标音频的泛需求,也可以为用户针对目标音频的精确需求。该泛需求例如可以该目标音频的风格或类型等,该精准需求可以该目标音频的名称等。
在一种实现方式中,若该播放请求中包括该播放需求的信息,则该服务器可根据该播放需求的信息,分别确定该预设音频和该目标音频。
在该实现方式下,该播放需求的信息可以为用户输入的播放指令所对应的播放需求。也就是说,该播放需求的信息可以为用户通过输入播放指令,所输入的信息。例如,若该播放指令为语音播放指令,则该播放需求的信息可以为用户通过该语音播放指令所输入的信息。该语音播放指令可以为用户输入的音频,该终端可以对该输入的音频进行语义分析,得到该输入音频的语义,根据该输入音频的语义得到该播放需求的信息。
在该实现方式中,示例地,该服务器可根据该播放需求的信息,从预设的播报音频库中,确定该预设音频;根据该播放需求的信息,从预设的音频资源库中确定该目标音频。该播报音频库包括至少一个真人音频。该音频资源库中包括至少一个音频。该音频资源库中,每个音频可以为音乐、电台音频或者故事音频等任一类型的音频。
可选的,如上所示的该播放需求可以包括如下任一:点播类播放需求、切换类播放需求、反馈类播放需求。对于每一类的播放需求,该预设的播报音频库中,可具有至少一个播报音频。
可选的,该预设的播放音频库中,每个播报音频可以为真人音频,即预先录入的真人音频。采用真人音频进行播报,可使得预设音频的播报实现电台般的播报效果,提高收听沉浸感。该每个播报音频还可以为通过文本语音合成的音频,即采用文本语音合成技术对预设的话术文本进行处理所得到的音频。该文本语音合成技术例如可以为文本到语音(Text To Speech,简称TTS)技术。
可选的,该服务器根据播放请求所包括的播放需求的信息,从该预设的播放音频库中该播放需求对应的至少一个播报音频中选择一个播放音频作为该预设音频。该服务器例如可从该播放需求对应的至少一个播报音频中随机选择一个播放音频,作为该预设音频。该服务器还可从该播放需求对应的至少一个播报音频中,选择播放频率最高的一个播放音频作为该预设音频。需要说明的是,其它的选择规则,从该播放需求对应的至少一个播报音频中选择一个播放音频作为该预设音频,本发明不对此进行限制。
例如,当用户输入包括话术“播放安静的音乐”的音频,则该播放需求可以为点播类播放需求;当用户输入包括话术“换个音乐”的音频,则该播放需求可以为切换类播放需求;当用户输入包括话术“不喜欢这首音乐”的音频,则该播放需求可以为反馈类播放需求。
当用户输入包括话术“播放安静的音乐”的音频,该播放请求可以为话术“播放安静的音乐”的音频所对应的播放需求的信息,则该服务器可根据该播放需求的信息,从预设的播报音频库中确定该播放需求对应的至少一个播报音频,并从中选择一个播报音频确定为该预设音频。该预设音频例如可以为目标音频的介绍音频,如包括“安静的时候,少不了这些音乐的陪伴”等类似话术的音频。
当用户输入包括话术“换首音乐”的音频,该播放请求可以为话术“换首音乐”的音频所对应的播放需求的信息,则该服务器可根据该播放需求的信息,从预设的播报音频库中确定该播放需求对应的至少一个播报音频,并从中选择一个播报音频确定为该预设音频。该预设音频例如可以为目标音频的介绍音频,如包括“为您播放另一风格的音乐”等类似话术的音频。
当用户输入包括话术“不喜欢这首音乐”的音频,该播放请求可以为话术“不喜欢这首音乐”的音频所对应的播放需求的信息,则该服务器可根据该播放需求的信息,从预设的播报音频库中确定该播放需求对应的至少一个播报音频,并从中选择一个播报音频确定为该预设音频。该预设音频例如可以为目标音频的介绍音频,如包括“为您播放其它音乐”等类似话术的音频。
该预设的播报音频库中,播报音频可以介绍音频。若为介绍音频,则一条播报音频可对应至少一种音频信息。该音频信息例如可以为如下任一音频名称、作曲者、作词者、演奏者、歌词、发行时间、专辑名称、语言种类、音频类型。也就是说,在该实施例的方案中,该预设的播报音频库中,可针对每种音频信息,可维护其对应的至少一个播报音频。
该介绍音频可以为演奏者本人录入的介绍音频,也可以为其它用户或个人录入的介绍音频。若为演奏者录入的介绍音频,该实施例还可提升音频播放的粉丝黏性,提高用户体验。
在该预设的播报音频库中,播报音频还可以为广告音频,如此,还可实现了广告音频与目标音频的自然融合,在实现广告效果的同时,不打断用户的视听体验。
在另一种实现方式中,若该播放请求中不包括播放需求的信息,则该服务器可根据历史播放需求的信息,分别确定该预设音频和该目标音频;或者,该服务器还可随机选择该预设音频和该目标音频;或者,该服务器还可根据其它的信息,确定该预设音频和该目标音频。
在该另一种实现方式中,若该播放请求中不包括播放需求的信息,则该服务器可根据该播放请求,从预设的话术文本库中,确定目标话术文本,并采用文本语音合成技术,对该目标话术文本进行处理,得到该预设音频。该话术文本库中包括至少一个话术文本。
该服务器可从该预设的话术文本库中,随机选择一个目标话术文本,或者,根据历史播放信息,选择该目标话术文本。例如,若该播放请求中不包括播放需求的信息,则该服务器可随机选择话术“为你精选欧美慢摇”等类似的文本作为目标话术文本。
S104、服务器向终端发送待播放信息,该待播放信息包括:该预设音频的信息和该目标音频的信息。
该预设音频的信息例如可以为该预设音频的播放文件,或者,该预设音频的资源链接,该目标音频的信息也可以为该目标音频的播放文件,或者,该目标音频的资源链接。
该目标音频可包括至少一个目标音频,则该待播放信息中,可包括待播放列表,该待播放列表中包括每个目标音频的信息,如该每个目标音频的资源链接。每个目标音频可以为音乐、电台音频或者故事音频等。
S105、终端接收来自终端的该待播放信息。
S106、终端根据该待播放信息,在播放该目标音频的过程中播放该预设音频。
若该预设音频的信息包括该预设音频的播放文件,该目标音频的信息包括该目标音频的播放文件,则该服务器可直接播放该目标音频以及该预设音频,在播放该目标音频的过程中播放该预设音频。
若该预设音频的信息包括该预设音频的资源链接,该目标音频的信息包括该目标音频的资源链接,则该服务器可根据该预设音频的资源链接获取该预设音频,根据该目标音频的资源链接,获取该目标音频;在播放该目标音频的过程中播放该预设音频。因而,该方法还可实现终端对预设音频及目标音频的动态加载及播放。
其中,该预设音频的播放时长可小于该目标音频的播放时长。
可选的,在播放该预设音频的过程中,该预设音频的音量可大于该目标音频的音量,可使得用户在聆听预设音频的过程中,也感受到目标音频,并且还可避免不同音频的听觉混淆。
本发明实施例提供的音频播放方法,可通过终端向服务器发送播放请求,并接收服务器发送的包括有预设音频的信息和目标音频的信息的待播放信息,继而根据该待播放信息在播放该目标音频的过程中播放该预设音频。该方法可在音频播放过程中进行预设音频的播放,实现了预设音频和目标音频的叠加播放,使得预设音频和目标音频的播放更流畅更自然,提高了用户的沉浸感,提高用户体验。
在上述音频播放方法的基础上,本发明实施例还可提供一种音频播放方法。图2为本发明实施例提供的一种音频播放方法的流程图二。如图2所示,如上所示的方法中S106中终端根据该待播放信息,在播放该目标音频的过程中播放该预设音频可以包括:
S201、终端在该目标音频开始播放的第一预设时间段后,开始播放该预设音频。
该终端可先开始播放该目标音频,在该目标音频开始播放一段时间,如该第一预设时间段后,则开始播放该预设音频。该第一预设时间段例如可以为3s,当然,也可以为其它长度的时间段,在此不再赘述。
在该预设时间段内,该目标音频的播放音量例如可以为预设音量,该预设音量例如可以为与该终端的预设音量,如该终端的音频类应用程序的播放音量,或者,该终端的播放音量。
示例地,该终端可在该目标音频开始播放的第一预设时间段内,使得该目标音频的音量与该终端的播放音量一致,在该第一时间段如3s后,开始播放该预设音频,降低该目标音频的音量。
需要说明的是,该终端也可在该目标音频开始播放时,便开始播放该预设音频,即该目标音频和该预设音频也可同时开始播放,上述依次开始播放仅为一种可能的示例。
S202、终端在该预设音频开始播放的第二预设时间段内,调节该目标音频的音量至第一预设音量,调节该预设音频的音量至第二预设音量;该第一预设音量小于该第二预设音量。
该终端可在该预设音频开始播放时,便开始调节该目标音频以及该预设音频的音量,可在该预设音频开始播放的第二预设时间段如3s内,使得该预设音频的音量可达到该第二预设音量,而该目标音频可达到该第一预设音量。其中,该第二预设音量例如可以为该终端的预设音量的100%,该第一预设音量例如可以为该终端的预设音量的40%。
也就是说,在该预设音频开始播放的第二预设时间段内,该预设音频的音量可以由0增大至该第二预设音量,当音量达到该第二预设音量后,便可基于该第二预设音量播放该预设音频,直至该预设音频播放结束。
在该预设音频开始播放的第二预设时间段内,该目标音频的音量可调节至该第一预设音量,并基于该第一预设音量播放该目标音频,直至该预设音频播放结束。
该第二预设时间段可小于该预设音频的播放时长。
S203、在该预设音频播放结束后的第三预设时间段内,调节该目标音频的音量至该第二预设音量。
该终端可在该预设音频播放结束时,便开始调节该目标音频的音量,在该第三预设时间段如3s内,使得该目标音频的音量调节至该第二预设音量,继而根据该第二预设音量播放该目标音频,直至该目标音频播放完毕。也就是说,在该第三预设时间段内,该目标音频的音量可由该第一预设音量调节至该第二预设音量。
需要说明的是,上述第一预设时间段、第二预设时间段、第三预设时间段可相同,也可不同,其具体的参数可根据实际需求进行设置或者终端根据历史经验统计得出,对其各自的具体取值本发明不做限制。同时,上述第一预设音量和第二预设音量的具体参数,可不限于上述,还可以为其它的数值,在此不再赘述。
当用户输入播放进度控制指令如拖到进度条的过程中,该预设音频开始播放的时间不变,该预设音频以及目标音频的音量的变化可如上所述。当该播放进度控指令输入完成,如进度条拖到完成后,该终端可根据拖到后的时间点进行目标音频的播放。
该实施例提供的音频播放方法,可通过调节预设音频和目标音频的音量,使得在该预设音频的播放过程中,预设音频大于该目标音频的音量,在该预设音频播放结束后,增大该目标音频的音量,即可避免不同音频的听觉混淆,还可保证音频播放效果。
下述为本发明装置实施例,可以用于执行本发明上述方法实施例,其实现原理和技术效果类似。
图3为本发明实施例提供的一种音频播放装置的结构示意图一。该音频播放装置软件和/或硬件的方式集成在终端中。如图3所示,本实施例的音频播放装置30可以包括:
发送模块31,用于向服务器发送播放请求。
接收模块32,用于接收服务器发送的待播放信息;该待播放信息包括:预设音频的信息和目标音频的信息。
播放模块33,用于根据该待播放信息,在播放该目标音频的过程中播放该预设音频。
可选的,发送模块31,具体用于根据输入的播放需求,向该服务器发送该播放请求;该播放请求包括:该播放需求的信息。
其中,该预设音频和该目标音频可以为该服务器根据该播放需求的信息所确定的。
可选的,该播放需求包括如下任一:点播类播放需求、切换类播放需求、反馈类播放需求。
可选的,该预设音频为该目标音频对应的介绍音频,和/或,广告音频。
可选的,该预设音频为预先录入的真人音频,或者,通过文本语音合成的音频。
可选的,该预设音频的信息包括:该预设音频的资源链接;该目标音频的信息包括:该目标音频的资源链接。
上述播放模块33,具体用于根据该预设音频的资源链接,获取该预设音频;根据该目标音频的资源链接,获取该目标音频;在播放该目标音频的过程中播放该预设音频。
可选的,该预设音频的播放时长小于该目标音频的播放时长。
可选的,如上所示的播放模块33,还可用于在该目标音频开始播放的第一预设时间段后,开始播放该预设音频。
可选的,在该预设音频的播放过程中,该预设音频的音量大于该目标音频的音量。
可选的,如上所示的播放模块33,还可用于在该预设音频开始播放的第二预设时间段内,调节该目标音频的音量至第一预设音量,调节该预设音频的音量至第二预设音量;该第一预设音量小于该第二预设音量;在该预设音频播放结束后的第三预设时间段内,调节该目标音频的音量至该第二预设音量。其中,该第二预设时间段小于该预设音频的播放时长。
本实施例的装置,可执行上述图1或图2所示的终端执行音频播放方法,其具体实现及有益效果参见上述,在此不再赘述。
图4为本发明实施例提供的一种音频播放装置的结构示意图二。该音频播放装置软件和/或硬件的方式集成在服务器中。如图4所示,本实施例的音频播放装置40可以包括:
接收模块41,用于接收终端发送的播放请求。
确定模块42,用于根据该播放请求,确定待播放的预设音频和目标音频。
发送模块43,用于向该终端发送待播放信息;该待播放信息包括:该预设音频的信息,和该目标音频的信息;该待播放信息用于使得该终端在播放该目标音频的过程中播放该预设音频。
可选的,该播放请求包括:播放需求的信息;
确定模块42,具体用于根据该播放需求的信息,确定该预设音频和该目标音频。
可选的,确定模块42,具体用于根据该播放需求的信息,从预设的播报音频库中,确定该预设音频;该播放音频库中包括:至少一个真人音频;根据该播放需求的信息,从预设的音频资源库中,确定该目标音频。
可选的,该播放需求包括如下任一:点播类播放需求、切换类播放需求、反馈类播放需求。
可选的,确定模块42,具体用于根据该播放请求,从预设的话术文本库中,选择目标话术文本;该话术文本库中,包括至少一个话术文本;采用文本语音合成技术,对该目标话术文本进行处理,得到该预设音频;根据该播放请求,从预设的音频资源库中,确定该目标音频。
可选的,该预设音频为该目标音频对应的介绍音频,和/或,广告音频。
本实施例提供的装置可执行上述图1或图2所述的服务器执行的音频播放方法,其具体实现及有效效果,可参见上述,在此不再赘述。
图5为本发明实施例提供的终端的结构示意图。如图5所示,本实施例的终端50包括:存储器51和处理器52。其中,存储器51通过总线与处理器52连接。
存储器51,用于存储程序指令。
处理器52,用于在程序指令被执行时,使得处理器52执行上述图1或图2所述的终端执行的音频播放方法。
本实施例的终端可执行上述图1或图2所述的终端执行的音频播放方法,其具体实现及有效效果,可参见上述,在此不再赘述。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序可被上述图5所述的处理器52执行实现上任一实施例所示的终端执行的音频播放方法,其具体实现及有效效果,可参见上述,在此不再赘述。
图6为本发明实施例提供的服务器的结构示意图。如图6所示,本实施例的服务器60包括:存储器61和处理器62。其中,存储器61通过总线与处理器62连接。
存储器61,用于存储程序指令。
处理器62,用于在程序指令被执行时,使得处理器62执行上述图1或图2所述的服务器执行的音频播放方法。
本实施例的服务器可执行上述图1或图2所述的服务器执行的音频播放方法,其具体实现及有效效果,可参见上述,在此不再赘述。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序可被上述图6所述的处理器62执行实现上任一实施例所示的服务器执行的音频播放方法,其具体实现及有效效果,可参见上述,在此不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的计算机程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:只读内存(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (17)

1.一种音频播放方法,其特征在于,包括:
根据输入的播放需求,向服务器发送播放请求,所述播放请求中包括所述播放需求的信息;
接收服务器发送的待播放信息;所述待播放信息包括:预设音频的信息和待播放列表,所述待播放列表中包括至少一个目标音频的信息,所述预设音频和所述目标音频为所述服务器根据所述播放需求的信息所确定的,所述预设音频为所述服务器从所述播放需求对应的至少一个播报音频中确定的播放频率最高的播放音频;
根据所述待播放信息在播放所述目标音频的过程中播放所述预设音频;
所述在播放所述目标音频的过程中播放所述预设音频,包括:
在所述目标音频开始播放的第一预设时间段后,开始同时播放所述目标音频和所述预设音频;所述预设音频的播放过程中,所述预设音频的音量大于所述目标音频的音量;
在所述预设音频开始播放的第二预设时间段内,调节所述目标音频的音量至第一预设音量,调节所述预设音频的音量至第二预设音量;所述第一预设音量小于所述第二预设音量;所述第二预设时间段小于所述预设音频的播放时长;
在所述预设音频播放结束后的第三预设时间段内,调节所述目标音频的音量至所述第二预设音量。
2.根据权利要求1所述的方法,其特征在于,所述播放需求包括如下任一:点播类播放需求、切换类播放需求、反馈类播放需求。
3.根据权利要求1所述的方法,其特征在于,所述预设音频为所述目标音频对应的介绍音频,和/或,广告音频。
4.根据权利要求1所述的方法,其特征在于,所述预设音频为预先录入的真人音频,或者,通过文本语音合成的音频。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述预设音频的信息包括:所述预设音频的资源链接;所述目标音频的信息包括:所述目标音频的资源链接;
所述根据所述待播放信息,在播放所述目标音频的过程中播放所述预设音频,包括:
根据所述预设音频的资源链接,获取所述预设音频;
根据所述目标音频的资源链接,获取所述目标音频;
在播放所述目标音频的过程中播放所述预设音频。
6.根据权利要求1-4中任一项所述的方法,其特征在于,所述预设音频的播放时长小于所述目标音频的播放时长。
7.一种音频播放方法,其特征在于,包括:
接收终端发送的播放请求,所述播放请求包括:播放需求的信息;
根据所述播放需求的信息,确定待播放的预设音频和目标音频,所述预设音频为从所述播放需求对应的至少一个播放音频中确定的播放频率最高的播放音频;
向所述终端发送待播放信息;所述待播放信息包括:所述预设音频的信息,和,待播放列表,所述待播放列表中包括至少一个所述目标音频的信息;所述待播放信息用于使得所述终端在播放所述目标音频的第一预设时间段后,开始同时播放所述目标音频和所述预设音频;所述预设音频的播放过程中,所述预设音频的音量大于所述目标音频的音量;所述终端用于在所述预设音频开始播放的第二预设时间段内,调节所述目标音频的音量至第一预设音量,调节所述预设音频的音量至第二预设音量;所述第一预设音量小于所述第二预设音量;所述第二预设时间段小于所述预设音频的播放时长;在所述预设音频播放结束后的第三预设时间段内,调节所述目标音频的音量至所述第二预设音量。
8.根据权利要求7所述的方法,其特征在于,根据所述播放需求的信息,确定所述目标音频,包括:
根据所述播放需求的信息,从预设的播报音频库中,确定所述预设音频;所述播放音频库中包括:至少一个真人音频。
9.根据权利要求7所述的方法,其特征在于,所述播放需求包括如下任一:点播类播放需求、切换类播放需求、反馈类播放需求。
10.根据权利要求7所述的方法,其特征在于,所述根据所述播放请求,确定待播放信息,包括:
根据所述播放请求,从预设的话术文本库中,选择目标话术文本;所述话术文本库中,包括至少一个话术文本;
采用文本语音合成技术,对所述目标话术文本进行处理,得到所述预设音频;
根据所述播放请求,从预设的音频资源库中,确定所述目标音频。
11.根据权利要求7-10中任一项所述的方法,其特征在于,所述预设音频为所述目标音频对应的介绍音频,和/或,广告音频。
12.一种音频播放装置,其特征在于,包括:
发送模块,用于根据输入的播放需求,向服务器发送播放请求,所述播放请求中包括所述播放需求的信息;
接收模块,用于接收服务器发送的待播放信息;所述待播放信息包括:预设音频的信息和待播放列表,所述待播放列表中包括至少一个目标音频的信息,所述预设音频和所述目标音频为所述服务器根据所述播放需求的信息所确定的,所述预设音频为所述服务器从所述播放需求对应的至少一个播放音频中确定的播放频率最高的播放音频;
播放模块,用于根据所述待播放信息,在所述目标音频开始播放的第一预设时间段后,开始同时播放所述目标音频和所述预设音频;所述预设音频的播放过程中,所述预设音频的音量大于所述目标音频的音量;
在所述预设音频开始播放的第二预设时间段内,调节所述目标音频的音量至第一预设音量,调节所述预设音频的音量至第二预设音量;所述第一预设音量小于所述第二预设音量;所述第二预设时间段小于所述预设音频的播放时长;
在所述预设音频播放结束后的第三预设时间段内,调节所述目标音频的音量至所述第二预设音量。
13.一种音频播放装置,其特征在于,包括:
接收模块,用于接收终端发送的播放请求,所述播放请求包括:播放需求的信息;
确定模块,用于根据所述播放需求的信息,确定待播放信息;所述待播放信息包括:预设音频的信息和待播放列表,所述待播放列表中包括至少一个目标音频的信息,所述预设音频为从所述播放需求对应的至少一个播放音频中确定的播放频率最高的播放音频;
发送模块,用于向所述终端发送所述待播放信息;所述待播放信息用于使得所述终端根据所述待播放信息,在播放所述目标音频的第一预设时间段后,开始同时播放所述目标音频和所述预设音频;所述预设音频的播放过程中,所述预设音频的音量大于所述目标音频的音量;所述终端用于在所述预设音频开始播放的第二预设时间段内,调节所述目标音频的音量至第一预设音量,调节所述预设音频的音量至第二预设音量;所述第一预设音量小于所述第二预设音量;所述第二预设时间段小于所述预设音频的播放时长;在所述预设音频播放结束后的第三预设时间段内,调节所述目标音频的音量至所述第二预设音量。
14.一种终端,其特征在于,包括:存储器及处理器;所述存储器与所述处理器连接;
所述存储器,用于存储程序指令;
所述处理器,用于在程序指令被执行时,实现权利要求1-6任一项所述的音频播放方法。
15.一种服务器,其特征在于,包括:存储器及处理器;所述存储器与所述处理器连接;
所述存储器,用于存储程序指令;
所述处理器,用于在程序指令被执行时,实现权利要求7-11任一项所述的音频播放方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6任一项所述的音频播放方法。
17.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求7-11任一项所述的音频播放方法。
CN201810873034.XA 2018-08-02 2018-08-02 音频播放方法、装置、设备及存储介质 Active CN109508166B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810873034.XA CN109508166B (zh) 2018-08-02 2018-08-02 音频播放方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810873034.XA CN109508166B (zh) 2018-08-02 2018-08-02 音频播放方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109508166A CN109508166A (zh) 2019-03-22
CN109508166B true CN109508166B (zh) 2022-05-20

Family

ID=65745499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810873034.XA Active CN109508166B (zh) 2018-08-02 2018-08-02 音频播放方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109508166B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110503991B (zh) * 2019-08-07 2022-03-18 Oppo广东移动通信有限公司 语音播报方法、装置、电子设备及存储介质
CN115497475B (zh) * 2022-09-21 2023-07-28 深圳市人马互动科技有限公司 一种基于语音交互系统的信息推荐方法及相关装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105827825A (zh) * 2016-02-29 2016-08-03 维沃移动通信有限公司 一种音频数据的处理方法及移动终端
CN106162446A (zh) * 2016-06-28 2016-11-23 乐视控股(北京)有限公司 音频播放方法、装置及耳机
CN106331841A (zh) * 2016-09-19 2017-01-11 海信集团有限公司 网速信息指示方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105244048B (zh) * 2015-09-25 2017-12-05 小米科技有限责任公司 音频播放控制方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105827825A (zh) * 2016-02-29 2016-08-03 维沃移动通信有限公司 一种音频数据的处理方法及移动终端
CN106162446A (zh) * 2016-06-28 2016-11-23 乐视控股(北京)有限公司 音频播放方法、装置及耳机
CN106331841A (zh) * 2016-09-19 2017-01-11 海信集团有限公司 网速信息指示方法及装置

Also Published As

Publication number Publication date
CN109508166A (zh) 2019-03-22

Similar Documents

Publication Publication Date Title
JP6294887B2 (ja) プレイリストを生成及び修正するために入力を合成するシステム及び方法
US20190147052A1 (en) Method and apparatus for playing multimedia
CN109273001B (zh) 一种语音播报方法、装置、计算装置和存储介质
JP5829000B2 (ja) 会話シナリオ編集装置
CN108962233A (zh) 用于语音对话平台的语音对话处理方法及系统
CN115329206B (zh) 语音外呼处理方法及相关装置
CN108885869A (zh) 控制包含语音的音频数据的回放
CN109508166B (zh) 音频播放方法、装置、设备及存储介质
CN109671429B (zh) 语音交互方法及设备
JP7342286B2 (ja) ヒューマンマシン対話のための音声機能ジャンプ方法、電子機器及び記憶媒体
WO2018076664A1 (zh) 一种语音播报的方法和装置
WO2008042511A2 (en) Personalizing a voice dialogue system
JP2020003774A (ja) 音声を処理する方法及び装置
CN104361897B (zh) 一种制作铃音的方法及装置
CN103177743A (zh) 一种歌曲播放方法及装置
WO2023207472A1 (zh) 一种音频合成方法、电子设备及可读存储介质
JP2020009440A (ja) 情報を生成するための方法と装置
WO2020135773A1 (zh) 数据处理方法、装置及计算机可读存储介质
CN106201425A (zh) 一种智能终端音频输出的方法及装置
JP2006050563A (ja) 携帯端末機のベル音再生方法
CN110797001B (zh) 电子书语音音频的生成方法、装置及可读存储介质
CN104851436A (zh) 一种用于移动终端的声控音乐播放系统及其播放方法
CN103700381A (zh) 一种终端放音管理系统及方法
CN111161734A (zh) 基于指定场景的语音交互方法及装置
KR102574294B1 (ko) 인공지능 플랫폼 제공 장치 및 이를 이용한 컨텐츠 서비스 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210518

Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Applicant after: Shanghai Xiaodu Technology Co.,Ltd.

Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant