CN110299130A - 一种基于寄宿应用的语音播放方法及设备 - Google Patents
一种基于寄宿应用的语音播放方法及设备 Download PDFInfo
- Publication number
- CN110299130A CN110299130A CN201910344729.3A CN201910344729A CN110299130A CN 110299130 A CN110299130 A CN 110299130A CN 201910344729 A CN201910344729 A CN 201910344729A CN 110299130 A CN110299130 A CN 110299130A
- Authority
- CN
- China
- Prior art keywords
- application
- boarding application
- boarding
- voice
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000015572 biosynthetic process Effects 0.000 claims description 25
- 238000003786 synthesis reaction Methods 0.000 claims description 25
- 230000000694 effects Effects 0.000 abstract description 8
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 210000003462 vein Anatomy 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请的目的是提供一种基于寄宿应用的语音播放方法及设备,本申请通过基于用户对浏览器中当前文本的预设操作调用控制面板,所述控制面板中包含至少一个寄宿应用的入口,其中,所述寄宿应用用于对文本进行语音播放;获取所述用户从所述至少一个寄宿应用中确定的目标寄宿应用,将所述当前文本发送至所述目标寄宿应用;接收所述目标寄宿应用返回的语音信息,所述语音信息由所述目标寄宿应用对应的网络设备根据所述目标寄宿应用关联的语音播放方式及所述当前文本进行合成确定;通过所述浏览器的播放接口播放所述语音信息。从而实现通过寄宿应用的展现方式选择朗读的模式,通过网络设备对语音进行合成,以达到语音朗读的最佳组合效果。
Description
技术领域
本申请涉及计算机领域,尤其涉及一种基于寄宿应用的语音播放方法及设备。
背景技术
伴随着移动网络的下调以及深度学习的规模使用,人们的阅读方式已不再局限于用眼阅读内容。目前已开发出语音朗读功能,可通过语音播放阅读浏览器中的内容,来提供另一种阅读体验。语音朗读可使得阅读用户在走路或做其他事情时也可以获取到浏览器内容,但其内置的语音朗读程序被固化,语音朗读的效果和音质需要通过程序更新来迭代。
发明内容
本申请的一个目的是提供一种基于寄宿应用的语音播放方法及设备,解决现有技术中语音朗读的效果和音质迭代复杂、语音朗读程序被固化的问题。
根据本申请的一个方面,提供了一种基于寄宿应用的语音播放方法,该方法包括:
终端基于用户对浏览器中当前文本的预设操作调用控制面板,所述控制面板中包含至少一个寄宿应用的入口,其中,所述寄宿应用用于对文本进行语音播放;
所述终端获取所述用户从所述至少一个寄宿应用中确定的目标寄宿应用,将所述当前文本发送至所述目标寄宿应用;
所述终端接收所述目标寄宿应用返回的语音信息,所述语音信息由所述目标寄宿应用对应的网络设备根据所述目标寄宿应用关联的语音播放方式及所述当前文本进行合成确定;
所述终端通过所述浏览器的播放接口播放所述语音信息。
进一步地,所述至少一个寄宿应用包括两个以上寄宿应用,其中,各寄宿应用的语音播放方式不同。
进一步地,所述各寄宿应用的语音播放方式是由文本的播放场景、播放声线、播放语速、播放音调及播放音量中的至少一项确定的。
进一步地,所述方法还包括:
所述终端将所述至少一个寄宿应用及关联的语音播放方式存储至所述网络设备中,以及确定由所述至少一个寄宿应用及对应关联的语音播放方式组成的关联信息。
进一步地,所述方法包括:
所述终端记录所述用户使用寄宿应用进行语音朗读的历史播放信息,将所述历史播放信息存储至所述网络设备中,其中,所述历史播放信息包括所述用户的历史选择的目标寄宿应用以及使用该目标寄宿应用进行语音播放的文本。
进一步地,所述终端基于用户对浏览器中当前文本的预设操作调用控制面板之后,所述方法还包括:
所述终端接收所述网络设备发送的有关目标寄宿应用的推荐信息,其中,所述推荐信息为所述网络设备根据所述历史播放信息确定的适应于播放所述当前文本的目标寄宿应用的推荐信息;
所述终端根据所述推荐信息使用所述目标寄宿应用播放所述当前文本。
根据本申请又一个方面,还提供了一种基于寄宿应用的语音播放方法,该方法包括:
目标寄宿应用对应的网络设备接收终端通过所述目标寄宿应用发送的当前文本;
所述网络设备根据所述目标寄宿应用以及所述网络设备中的关联信息为所述目标寄宿应用匹配关联的语音播放方式;
所述网络设备将所述关联的语音播放方式与所述当前文本进行合成以确定语音信息;
所述网络设备将所述语音信息返回至所述终端,以使得所述终端通过所述浏览器的播放接口播放所述语音信息。
进一步地,所述方法还包括:
接收并存储所述终端发送的至少一个寄宿应用及关联的语音播放方式,其中,所述至少一个寄宿应用包括所述目标寄宿应用;
将所述至少一个寄宿应用添加至所述控制面板中。
进一步地,所述方法还包括:
接收并存储所述终端发送的所述用户使用寄宿应用进行语音播放的历史播放信息,其中,所述历史播放信息包括所述用户的选择的历史寄宿应用以及使用所述历史寄宿应用进行语音播放的文本。
进一步地,所述方法还包括:
所述网络设备向所述终端发送有关所述目标寄宿应用的推荐信息,其中,所述推荐信息为所述网络设备根据所述历史播放信息确定的适用于播放所述当前文本的所述目标寄宿应用的推荐信息。
根据本申请另一个方面,还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现前述所述的方法。
根据本申请再一个方面,还提供了一种基于寄宿应用的语音播放的设备,其中,所述设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行前述的方法的操作。
与现有技术相比,本申请通过终端基于用户对浏览器中当前文本的预设操作调用控制面板,其中,所述控制面板中包含至少一个寄宿应用的入口,其中,所述寄宿应用用于对文本进行语音播放;所述终端获取所述用户从所述至少一个寄宿应用中确定的目标寄宿应用,将所述当前文本发送至所述目标寄宿应用;所述终端接收所述目标寄宿应用返回的语音信息,所述语音信息由所述目标寄宿应用对应的网络设备根据所述目标寄宿应用关联的语音播放方式及所述当前文本进行合成确定;所述终端通过所述浏览器的播放接口播放所述语音信息。从而实现通过寄宿应用的展现方式选择朗读的模式,通过寄宿应用对应的网络设备对语音进行合成,以达到语音朗读的最佳组合效果,语音朗读的效果和音质的迭代简单。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出根据本申请的一个方面提供的一种基于寄宿应用的语音播放方法流程示意图;
图2示出根据本申请又一个方面提供的一种基于寄宿应用的语音播放方法流程示意图;
图3示出本申请一实施例中基于寄宿应用播放文本的界面示意图;
图4示出本申请一实施例中通过小程序方式选择朗读模式的流程示意图;
图5示出根据本申请的另一个方面提供的终端的结构示意图;
图6示出本申请又一个方面提供的网络设备的结构示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本申请作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(例如中央处理器(Central Processing Unit,CPU))、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RandomAccess Memory,RAM)和/或非易失性内存等形式,如只读存储器(Read Only Memory,ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(Phase-Change RAM,PRAM)、静态随机存取存储器(Static Random Access Memory,SRAM)、动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、数字多功能光盘(Digital Versatile Disk,DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
图1示出根据本申请的一个方面提供的一种基于寄宿应用的语音播放方法流程示意图,该方法包括:步骤S11~步骤S14,
在步骤S11中,终端基于用户对浏览器中当前文本的预设操作调用控制面板,所述控制面板中包含至少一个寄宿应用的入口,其中,所述寄宿应用用于对文本进行语音播放。
在此,预设操作为可进行调用出寄宿应用入口的操作,比如分享操作、发布操作、预先设置的滑动操作等,在本申请一实施例中,优选为分享操作,浏览器中当前文本可为阅读应用程序或其他交互式应用程序中的电子书、资讯内容等,当用户想对当前文本进行分享操作时可调用出控制面板,控制面板中包括可进行分享的触控按钮、收藏、复制链接等,还包括至少一个寄宿应用的入口,寄宿应用用于对文本进行语音播放,比如包括寄宿应用A和寄宿应用B,可供用户选择其中一个进行语音朗读。其中,寄宿应用可为小程序、快应用、小应用等。需要说明的是,终端包括但不限于任何一种可与用户通过触摸板进行人机交互的移动电子产品,例如智能手机、个人数字助理(Personal Digital Assistant,PDA)等,所述移动电子产品可以采用任意操作系统,如安卓(android)操作系统、苹果(iOS)操作系统等。
在步骤S12中,所述终端获取所述用户从所述至少一个寄宿应用中确定的目标寄宿应用,将所述当前文本发送至所述目标寄宿应用。
在此,调用出控制面板后,获取用户在控制面板中的操作,从而确定目标寄宿应用,当控制面板中包括至少两个寄宿应用时,根据用户从至少两个寄宿应用中的选择确定目标寄宿应用,如用户选择寄宿应用A作为实现语音朗读,将当前浏览器,即目标寄宿应用所在的宿主应用的当前文本发送至寄宿应用A,以使寄宿应用A将该当前文本进行上报至对应的服务器以完成语音合成。
在步骤S13中,所述终端接收所述目标寄宿应用返回的语音信息,所述语音信息由所述目标寄宿应用对应的网络设备根据所述目标寄宿应用关联的语音播放方式及所述当前文本进行合成确定。
在此,目标寄宿应用对应的网络设备根据目标寄宿应用关联的语音播放方式对目标寄宿应用上报的当前文本进行语音合成,每个寄宿应用对应的语音播放方式不同,当选定目标寄宿应用后,对应的语音播放方式也确定下来。网络设备根据目标寄宿应用的信息匹配到对应的语音播放方式,根据该匹配到的语音播放方式对当前文本进行合成,合成后的语音信息为用户所需的语音朗读方式,将该合成后的语音信息返回至目标寄宿应用,从而通过寄宿应用返回至浏览器。
随后,在步骤S14中,所述终端通过所述浏览器的播放接口播放所述语音信息。在此,浏览器接收到目标寄宿应用返回的合成后的语音信息后,通过播放接口将该合成后的语音信息进行播放,实现语音朗读。
在本申请一实施例中,所述各寄宿应用的语音播放方式是由文本的播放场景、播放声线、播放语速、播放音调及播放音量中的至少一项确定的。在此,语音播放方式可由文本的播放场景、播放声线、播放语速、播放音调以及播放音量确定,比如使用主持人的、男明星的、女明星的、幽默风格的、柔和细腻场景的等等播放声线,正常朗读、平稳语调、快速语调等。通过寄宿应用设置需要的语音播放方式,根据多种语音播放方式为用户提供丰富的语音朗读方式,提高用户体验。
在本申请一实施例中,所述终端可以将至少一个寄宿应用及关联的语音播放方式存储至网络设备中,以及确定由所述至少一个寄宿应用及对应关联的语音播放方式组成的关联信息。在此,预先为寄宿应用配置关联的语音播放方式,将寄宿应用与配置的对应的语音播放方式一一对应的存储至网络设备中,确定关联信息,从而方便所述网络设备接收所述目标寄宿应用发送的当前文本,根据所述目标寄宿应用以及所述网络设备中的关联信息为所述目标寄宿应用匹配关联的语音播放方式;所述网络设备将所述关联的语音播放方式与所述当前文本进行合成,合成后的语音信息返回至所述目标寄宿应用,通过所述目标寄宿应用返回至所述浏览器。在此,网络设备接收到目标寄宿应用发送的当前文本后,根据所述目标寄宿应用以及存储的关联信息查找对应的语音播放方式,从而根据查找到语音播放方式对当前文本进行合成,将合成后的语音信息返回至目标寄宿应用,以通过目标寄宿应用返回至浏览器,从而进行语音朗读的播放。另外,将寄宿应用及关联的语音播放方式存储至网络设备,使得语音朗读的效果和音质的更新无需依赖于终端,进行更新迭代时内置的程序不会被固化,实际是由寄宿应用对应的网络设备进行语音合成,为用户提供了更多朗读模式的选择,达到语音朗读的最佳组合效果。
在本申请一实施例中,所述方法包括:步骤S15,所述终端记录所述用户使用寄宿应用进行语音朗读的历史播放信息,将所述历史播放信息存储至所述网络设备中,其中,所述历史播放信息包括所述用户的历史选择的目标寄宿应用以及使用该目标寄宿应用进行语音播放的文本。在此,还可以对用户使用过的寄宿应用以及播放的历史文本进行记录,将记录信息存储至网络设备中,从而可以根据存储的历史播放信息为用户推荐进行语音朗读的寄宿应用。
接上述实施例,所述终端上的浏览器可以接收所述网络设备发送的有关目标寄宿应用的推荐信息,其中,所述推荐信息为所述网络设备根据所述历史播放信息确定的适应于播放所述当前文本的目标寄宿应用的推荐信息;根据所述推荐信息使用所述目标寄宿应用播放所述当前文本。在此,当用户需要进行语音朗读时,可为用户发送推荐信息,该推荐信息由网络设备根据历史播放信息进行确定的目标寄宿应用的信息,适用于播放浏览器当前文本,根据推荐的目标寄宿应用进行播放当前文本。例如,用户正在浏览某武侠小说,根据历史播放信息,为用户推荐寄宿应用A,网络设备将寄宿应用A对应的语音播放方式与该武侠小说的内容进行合成,合成后的语音信息返回至寄宿应用A,通过寄宿应用A返回至浏览器,进行播放出来。通过推荐信息为用户推荐符合需求的寄宿应用,节约用户选择语音播放方式的时间,提高用户使用寄宿应用进行语音朗读的体验。
图2示出根据本申请又一个方面提供的一种基于寄宿应用的语音播放方法流程示意图,该方法包括:步骤S21~步骤S24,
在步骤S21中,目标寄宿应用对应的网络设备接收终端通过所述目标寄宿应用发送的当前文本。
在此,终端可为客户端,客户端上安装目标寄宿应用所在的宿主应用。目标寄宿应用的代码进行更新时依赖其对应的网络设备,而不依赖于客户端,比如小程序有其对应的服务器,更新目标寄宿应用内的程序时不会被固化,而是在对应的服务器上进行更新后发送至客户端。目标寄宿应用对应的网络设备接收客户端发送来的文本,该文本是展现在宿主应用的界面上,选择目标寄宿应用进行语音朗读时,被发送至目标寄宿应用以通过目标寄宿应用传送至网络设备。
从而在步骤S22中,所述网络设备根据所述目标寄宿应用以及所述网络设备中的关联信息为所述目标寄宿应用匹配关联的语音播放方式。
在此,当网络设备接收到目标寄宿应用发送的文本时,根据目标寄宿应用以及存储的关联信息为该目标寄宿应用匹配关联的语音播放方式。每个寄宿应用对应的语音播放方式不同,当选定目标寄宿应用后,对应的语音播放方式也确定下来。
随后,在步骤S23中,所述网络设备将所述关联的语音播放方式与所述当前文本进行合成以确定语音信息;在此,网络设备根据目标寄宿应用以及关联信息匹配到对应的语音播放方式,根据该匹配到的语音播放方式对当前文本进行合成,合成后的语音信息为用户所需的语音朗读方式。
在步骤S24中,所述网络设备将所述语音信息返回至所述终端,以使得所述终端通过所述浏览器的播放接口播放所述语音信息。在此,将合成后的语音信息返回至目标寄宿应用,从而通过寄宿应用返回至浏览器,通过播放接口将该合成后的语音信息进行播放,实现语音朗读。
在本申请一实施例中,所述方法还包括:步骤S20,接收并存储所述终端发送的至少一个寄宿应用及关联的语音播放方式,其中,所述至少一个寄宿应用包括所述目标寄宿应用;将所述至少一个寄宿应用添加至所述控制面板中。在此,预先为寄宿应用配置关联的语音播放方式,将寄宿应用与配置的对应的语音播放方式一一对应的存储至网络设备中,确定关联信息。所述至少一个寄宿应用包括两个以上寄宿应用,其中,各寄宿应用的语音播放方式不同。在控制面板中的寄宿应用包括两个或者更多,以供用户选择更多不同的语音播放方式,将不同的寄宿应用关联不同的语音播放方式,如寄宿应用A的语音播放方式为L形式,寄宿应用B的语音播放方式为P形式,将寄宿应用A和寄宿应用B添加至浏览器的控制面板中,以供用户通过选择不同的寄宿应用实现用不同语音播放方式进行播放当前文本。其中,语音播放方式可由文本的播放场景、播放声线、播放语速、播放音调以及播放音量确定,比如使用主持人的、男明星的、女明星的、幽默风格的、柔和细腻场景的等等播放声线,正常朗读、平稳语调、快速语调等。通过寄宿应用设置需要的语音播放方式,根据多种语音播放方式为用户提供丰富的语音朗读方式,提高用户体验。
在本申请一实施例中,所述方法还包括:步骤S25,接收并存储所述终端发送的所述用户使用寄宿应用进行语音播放的历史播放信息,其中,所述历史播放信息包括所述用户的选择的历史寄宿应用以及使用所述历史寄宿应用进行语音播放的文本。在此,网络设备接收并存储终端发送的用户使用过的寄宿应用以及播放的历史文本,从而根据存储的历史播放信息分析用户使用朗读功能时的喜好,以及根据历史播放信息对语音播放方式进行优化。
在本申请一实施例中,网络设备可以向所述终端发送有关所述目标寄宿应用的推荐信息,其中,所述推荐信息为所述网络设备根据所述历史播放信息确定的适用于播放所述当前文本的所述目标寄宿应用的推荐信息。在此,当用户需要进行语音朗读时,网络设备可为用户发送推荐信息,该推荐信息由网络设备根据历史播放信息进行确定的目标寄宿应用的信息,适用于播放浏览器当前文本,从而使得在终端上可以根据推荐的目标寄宿应用进行播放当前文本。为用户推荐符合需求的寄宿应用,节约用户选择语音播放方式的时间,提高用户使用寄宿应用进行语音朗读的体验。
在本申请一实施例中,如图3所示,比如播放浏览器上文本,当用户阅读浏览器上的文本内容时,通过浏览器调起小程序服务,在调起的控制面板中展现一个或多个小程序,供用户选择,由用户在控制面板中选择需要使用的小程序,通过小程序对应的服务器合成后返回合成后的语音信息,通过界面上的“朗读”按钮接口进行播放合成后的语音信息。需要说明的是,图3中所示的“朗读”按钮接口仅为小程序入口的一种示例,实践中,小程序入口在控制面板中的展现形式可以其它形式,例如,当有多个小程序时,多个小程序的入口可以集成在一个“朗读”按钮接口中,或者,多个小程序的入口也可以分别单独配置在控制面板中。
其中,具体地合成过程示例如图4所示的流程示意图:用户在浏览器上打开文章,浏览器将该文章的正文正本发送至朗读小程序,由朗读小程序向该朗读小程序服务端上传该正文正本,通过该朗读小程序服务端语音合成后返回合成语音,朗读小程序将合成语音返回至浏览器,通过浏览器的播放接口向用户播放合成语音。从而实现通过小程序的展现方式选择朗读的模式,实际由小程序的服务端语音合成,以达到语音朗读的最佳组合效果。此外,本申请实施例还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现前述的一种基于寄宿应用的语音播放方法。
与上文所述的方法相对应的,本申请还提供一种设备,其包括能够执行上述图1或图2或各个实施例所述的方法步骤的模块或单元,这些模块或单元可以通过硬件、软件或软硬结合的方式来实现,本申请并不限定。例如,在本申请一实施例中,一种基于寄宿应用的语音播放的终端,该终端包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行前述的基于寄宿应用的语音朗读播放的方法的操作。
例如,计算机可读指令在被执行时使所述一个或多个处理器:
终端基于用户对浏览器中当前文本的预设操作调用控制面板,所述控制面板中包含至少一个寄宿应用的入口,其中,所述寄宿应用用于对文本进行语音播放;
所述终端获取所述用户从所述至少一个寄宿应用中确定的目标寄宿应用,将所述当前文本发送至所述目标寄宿应用;
所述终端接收所述目标寄宿应用返回的语音信息,,所述语音信息由所述目标寄宿应用对应的网络设备根据所述目标寄宿应用关联的语音播放方式及所述当前文本进行合成确定;
所述终端通过所述浏览器的播放接口播放所述的语音信息。
图5示出根据本申请的另一个方面提供的终端的结构示意图,该终端包括:调用装置11、获取装置12、接收装置13及播放装置14,其中,所述调用装置11用于基于用户对浏览器中当前文本的预设操作调用控制面板,其中,所述控制面板中包含至少一个的寄宿应用的入口,其中,所述寄宿应用用于对文本进行语音播放;获取装置12用于获取所述用户从所述至少一个寄宿应用中确定的目标寄宿应用,将所述当前文本发送至所述目标寄宿应用;接收装置13用于接收所述目标寄宿应用返回的语音信息,所述语音信息由所述目标寄宿应用对应的网络设备根据所述目标寄宿应用关联的语音播放方式及所述当前文本进行合成确定;播放装置14用于通过所述浏览器的播放接口播放所述语音信息。
需要说明的是,调用装置11、获取装置12、接收装置13及播放装置14执行的内容分别与上述步骤S11、S12、S13和S14中的内容相同或相应相同,为简明起见,在此不再赘述。
在本申请又一个实施例中,还提供了基于寄宿应用的语音播放的网络设备,该网络设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如前述所述方法的操作。
例如,计算机可读指令在被执行时使所述一个或多个处理器:
目标寄宿应用对应的网络设备接收终端通过所述目标寄宿应用发送的当前文本;
所述网络设备根据所述目标寄宿应用以及所述网络设备中的关联信息为所述目标寄宿应用匹配关联的语音播放方式;
所述网络设备将所述关联的语音播放方式与所述当前文本进行合成以确定语音信息;
所述网络设备将所述语音信息返回至所述终端,以使得所述终端通过所述浏览器的播放接口播放所述语音信息。
图6示出本申请又一个方面提供的网络设备的结构示意图,所述网络设备包括接收文本装置21、匹配装置22、合成装置23及返回装置24,其中,所述接收文本装置21用于接收终端通过所述目标寄宿应用发送的当前文本;所述匹配装置22用于根据所述目标寄宿应用以及所述网络设备中的关联信息为所述目标寄宿应用匹配关联的语音播放方式;所述合成装置23用于将所述关联的语音播放方式与所述当前文本进行合成以确定语音信息;所述返回装置24用于将所述语音信息返回至所述终端,以使得所述终端通过所述浏览器的播放接口播放所述语音信息。
需要说明的是,接收文本装置21、匹配装置22、合成装置23及返回装置24执行的内容分别与上述步骤S21~S24中的内容相同或相应相同,为简明起见,在此不再赘述。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
Claims (12)
1.一种基于寄宿应用的语音播放方法,其特征在于,所述方法包括:
终端基于用户对浏览器中当前文本的预设操作调用控制面板,所述控制面板中包含至少一个寄宿应用的入口,其中,所述寄宿应用用于对文本进行语音播放;
所述终端获取所述用户从所述至少一个寄宿应用中确定的目标寄宿应用,将所述当前文本发送至所述目标寄宿应用对应的网络设备;
所述终端接收所述网络设备返回的语音信息,所述语音信息由所述网络设备根据所述目标寄宿应用关联的语音播放方式及所述当前文本进行合成确定;
所述终端通过所述浏览器的播放接口播放所述语音信息。
2.根据权利要求1所述的方法,其特征在于,所述至少一个寄宿应用包括两个以上寄宿应用,其中,各寄宿应用的语音播放方式不同。
3.根据权利要求2所述的方法,其特征在于,所述各寄宿应用的语音播放方式是由文本的播放场景、播放声线、播放语速、播放音调及播放音量中的至少一项确定的。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:
所述终端将所述至少一个寄宿应用及关联的语音播放方式存储至所述网络设备中,以使得所述网络设备将所述至少一个寄宿应用添加至所述控制面板中;以及确定由所述至少一个寄宿应用及对应关联的语音播放方式组成的关联信息。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
所述终端记录所述用户使用寄宿应用进行语音播放的历史播放信息,将所述历史播放信息存储至所述网络设备中,其中,所述历史播放信息包括所述用户的选择的历史寄宿应用以及使用所述历史寄宿应用进行语音播放的文本。
6.根据权利要求5所述的方法,其特征在于,所述终端基于用户对浏览器中当前文本的预设操作调用控制面板之后,所述方法还包括:
所述终端接收所述网络设备发送的有关所述目标寄宿应用的推荐信息,其中,所述推荐信息为所述网络设备根据所述历史播放信息确定的适用于播放所述当前文本的所述目标寄宿应用的推荐信息;
所述终端根据所述推荐信息使用所述目标寄宿应用播放所述当前文本。
7.一种基于寄宿应用的语音播放方法,其特征在于,所述方法包括:
目标寄宿应用对应的网络设备接收终端通过所述目标寄宿应用发送的当前文本;
所述网络设备根据所述目标寄宿应用以及所述网络设备中的关联信息为所述目标寄宿应用匹配关联的语音播放方式;
所述网络设备将所述关联的语音播放方式与所述当前文本进行合成以确定语音信息;
所述网络设备将所述语音信息返回至所述终端,以使得所述终端通过所述浏览器的播放接口播放所述语音信息。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
接收并存储所述终端发送的至少一个寄宿应用及关联的语音播放方式,其中,所述至少一个寄宿应用包括所述目标寄宿应用;
将所述至少一个寄宿应用添加至所述控制面板中。
9.根据权利要求7或8所述的方法,其特征在于,所述方法还包括:
接收并存储所述终端发送的所述用户使用寄宿应用进行语音播放的历史播放信息,其中,所述历史播放信息包括所述用户的选择的历史寄宿应用以及使用所述历史寄宿应用进行语音播放的文本。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
所述网络设备向所述终端发送有关所述目标寄宿应用的推荐信息,其中,所述推荐信息为所述网络设备根据所述历史播放信息确定的适用于播放所述当前文本的所述目标寄宿应用的推荐信息。
11.一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至10中任一项所述的方法。
12.一种基于寄宿应用的语音播放的设备,其特征在于,所述设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如权利要求1至10中任一项所述方法的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910344729.3A CN110299130A (zh) | 2019-04-26 | 2019-04-26 | 一种基于寄宿应用的语音播放方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910344729.3A CN110299130A (zh) | 2019-04-26 | 2019-04-26 | 一种基于寄宿应用的语音播放方法及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110299130A true CN110299130A (zh) | 2019-10-01 |
Family
ID=68026664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910344729.3A Pending CN110299130A (zh) | 2019-04-26 | 2019-04-26 | 一种基于寄宿应用的语音播放方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110299130A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111312280A (zh) * | 2020-01-16 | 2020-06-19 | 北京百度网讯科技有限公司 | 用于控制语音的方法和装置 |
CN111754974A (zh) * | 2020-06-24 | 2020-10-09 | 华人运通(上海)云计算科技有限公司 | 信息处理方法、装置、设备和计算机存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006109767A1 (ja) * | 2005-04-12 | 2006-10-19 | Sharp Kabushiki Kaisha | 音声再生方法、文字コード利用装置、配信サービスシステム、及び文字コード管理方法 |
US20130238339A1 (en) * | 2012-03-06 | 2013-09-12 | Apple Inc. | Handling speech synthesis of content for multiple languages |
CN106384586A (zh) * | 2016-09-07 | 2017-02-08 | 北京小米移动软件有限公司 | 朗读文本信息的方法及装置 |
CN108847214A (zh) * | 2018-06-27 | 2018-11-20 | 北京微播视界科技有限公司 | 语音处理方法、客户端、装置、终端、服务器和存储介质 |
-
2019
- 2019-04-26 CN CN201910344729.3A patent/CN110299130A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006109767A1 (ja) * | 2005-04-12 | 2006-10-19 | Sharp Kabushiki Kaisha | 音声再生方法、文字コード利用装置、配信サービスシステム、及び文字コード管理方法 |
US20130238339A1 (en) * | 2012-03-06 | 2013-09-12 | Apple Inc. | Handling speech synthesis of content for multiple languages |
CN106384586A (zh) * | 2016-09-07 | 2017-02-08 | 北京小米移动软件有限公司 | 朗读文本信息的方法及装置 |
CN108847214A (zh) * | 2018-06-27 | 2018-11-20 | 北京微播视界科技有限公司 | 语音处理方法、客户端、装置、终端、服务器和存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111312280A (zh) * | 2020-01-16 | 2020-06-19 | 北京百度网讯科技有限公司 | 用于控制语音的方法和装置 |
CN111312280B (zh) * | 2020-01-16 | 2023-11-07 | 北京百度网讯科技有限公司 | 用于控制语音的方法和装置 |
CN111754974A (zh) * | 2020-06-24 | 2020-10-09 | 华人运通(上海)云计算科技有限公司 | 信息处理方法、装置、设备和计算机存储介质 |
CN111754974B (zh) * | 2020-06-24 | 2021-08-10 | 华人运通(上海)云计算科技有限公司 | 信息处理方法、装置、设备和计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10334384B2 (en) | Scheduling playback of audio in a virtual acoustic space | |
CN106373580B (zh) | 基于人工智能的合成歌声的方法和装置 | |
AU2014290246B2 (en) | Game clip popularity based control | |
US10523722B1 (en) | System and method for shared media session creation | |
CN108847249A (zh) | 声音转换优化方法和系统 | |
CN110784768B (zh) | 一种多媒体资源播放方法、存储介质及电子设备 | |
US20210335364A1 (en) | Computer program, server, terminal, and speech signal processing method | |
US11849160B2 (en) | Image analysis system | |
CN113316015B (zh) | 弹幕处理方法、装置及系统 | |
CN112185363B (zh) | 音频处理方法及装置 | |
KR20140056616A (ko) | 콘텐츠 재생 속도 테이블 생성 서버, 디바이스 및 방법 | |
CN110299130A (zh) | 一种基于寄宿应用的语音播放方法及设备 | |
CN104464743B (zh) | 一种在语音聊天室中播放背景音乐的方法及移动终端 | |
CN115691544A (zh) | 虚拟形象口型驱动模型的训练及其驱动方法、装置和设备 | |
US20120109654A1 (en) | Methods and apparatuses for facilitating speech synthesis | |
KR101874441B1 (ko) | 음악제공방법 및 음악제공시스템 | |
CN111862933A (zh) | 用于生成合成语音的方法、装置、设备和介质 | |
CN106653003A (zh) | 语音识别方法及装置 | |
KR20220135203A (ko) | 스트리밍 방송에서의 자동 추천 음악 지원 시스템 | |
Gopalakrishnan et al. | Fine tuning and comparing tacotron 2, deep voice 3, and fastspeech 2 tts models in a low resource environment | |
CN114356068A (zh) | 一种数据处理方法、装置和电子设备 | |
CN112349271A (zh) | 语音信息处理方法、装置、电子设备及存储介质 | |
CN111863026A (zh) | 键盘乐器弹奏音乐的处理方法、装置、电子装置 | |
CN114177621B (zh) | 数据处理方法及装置 | |
CN112634919B (zh) | 语音转换方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |