WO2022247267A1

WO2022247267A1 - 语音播放系统、语音播放音色配置方法及相关装置

Info

Publication number: WO2022247267A1
Application number: PCT/CN2021/141962
Authority: WO
Inventors: 王中一
Original assignee: 北京百度网讯科技有限公司
Priority date: 2021-05-25
Filing date: 2021-12-28
Publication date: 2022-12-01
Also published as: CN113257223A

Abstract

一种语音播放系统、语音播放音色配置方法、装置、电子设备、计算机可读存储介质及计算机程序产品，涉及语音播放、近场通信技术领域。语音播放系统（100）包括：近场通信信息存储器（102），用于存储可通过近场通信机制读取的音色配置信息；设置有近场通信扫描器的语音播放本体（101），用于通过该近场通信扫描器读取近场通信信息存储器（102）中的音色配置信息，并根据该音色配置信息对应的音色播放语音内容。该系统可实现灵活的音色配置，提升用户与智能设备之间的交互效率。

Description

语音播放系统、语音播放音色配置方法及相关装置

相关申请的交叉引用

本专利申请要求于2021年05月25日提交的、申请号为202110570865.1、发明名称为“语音播放系统、语音播放音色配置方法及相关装置”的中国专利申请的优先权，该申请的全文以引用的方式并入本申请中。

技术领域

本公开涉及数据处理技术领域，具体涉及语音播放、近场通信技术领域，尤其涉及一种语音播放系统、一种语音播放音色配置方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

背景技术

现有智能语音播放设备基于人机交互方式获取配置信息的方式较为单一。这种方式通常为：根据用户的语音指示、按键指示等方式从服务器下载或从其他存储设备中接收相应的配置信息。

如何进一步丰富用户与智能设备之间的交互方式和提升交互效率，是本领域技术人员的研究重点。

发明内容

本公开实施例提出了一种语音播放系统、一种语音播放音色配置方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

第一方面，本公开实施例提出了一种语音播放系统，包括：近场通信信息存储器，用于存储可通过近场通信机制读取的音色配置信息；设置有近场通信扫描器的语音播放本体，用于通过该近场通信扫描器读取该近场通信信息存储器中的音色配置信息，并根据该音色配置信息对应的音色播放语音内容。

第二方面，本公开实施例提供了一种应用于如第一方面任一实现方式描述的语音播放系统的语音播放音色配置方法，包括：响应于在预设时间段内读取到多个不同的音色配置信息，基于多个该音色配置信息生成融合音色配置信息；根据该融合音色配置信息对应的融合音色播放语音内容。

第三方面，本公开实施例提出了一种应用于如第一方面任一实现方式描述的语音播放系统中的语音播放本体的语音播放音色配置装置，包括：音色融合单元，被配置成响应于在预设时间段内读取到多个不同的音色配置信息，基于多个该音色配置信息生成融合音色配置信息；语音播放单元，被配置成根据该融合音色配置信息对应的融合音色播放语音内容。

第四方面，本公开实施例提供了一种电子设备，该电子设备包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，该指令被至少一个处理器执行，以使至少一个处理器执行时能够实现如第二方面中任一实现方式描述的语音播放音色配置方法。

第五方面，本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行时能够实现如第二方面中任一实现方式描述的语音播放音色配置方法。

第六方面，本公开实施例提供了一种包括计算机程序的计算机程序产品，该计算机程序在被处理器执行时能够实现如第二方面中任一实现方式描述的语音播放音色配置方法。

本公开实施例提供的语音播放系统包括：近场通信信息存储器，用于存储可通过近场通信机制读取到的音色配置信息；设置有近场通信扫描器的语音播放本体，用于通过近场通信扫描器读取近场通信信息存储器中的音色配置信息，并呈现与音色配置信息相对应的语音播放。

本公开实施例所提供的语音播放系统将音色配置信息独立存储至近场通信信息存储器中，使得语音播放本体可以通过近场识别机制隔空从近场通信信息存储器中读取到音色配置信息，进而根据音色配置信息对用于播放语音内容的音色进行配置，并根据配置后的音色播放语音内容，以实现通过更换存储有不同音色配置信息的存储器来实现对用于播放语音内容的音色进行灵活配置。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本公开的其它特征、目的和优点将会变得更明显：

图1是本公开实施例提供的一种语音播放系统的结构示意图；

图2是本公开实施例提供的另一种语音播放系统的示例性示意图；

图3为本公开实施例提供的一种语音播放音色配置方法的流程图；

图4为本公开实施例提供的一种语音播放音色配置装置的结构框图；

图5为本公开实施例提供的一种适用于执行语音播放音色配置方法的电子设备的结构示意图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。需要说明的是，在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。

本公开的技术方案中，所涉及的用户个人信息(例如音色配置信息对应的音色为用户的个人音色)的获取，存储和应用等，均符合相关法律法规的规定，采取了必要的保密措施，且不违背公序良俗。

图1示出了一种语音播放系统100的结构示意图。

语音播放系统100中包括有：语音播放本体101、近场通信信息存储器102。其中，近场通信信息存储器102用于存储可通过近场通信机制读取到的音色配置信息；语音播放本体101上设置有近场通信扫描器，用于通过该近场通信扫描器读取该近场通信信息存储器中的音色配置信息，并根据该音色配置信息对应的音色播放语音内容。

其中，音色配置信息为用于指示语音播放本体101将后续用于播放语音内容的音色调整为目标音色的配置信息，例如当用于播放语音内容的音色为卡通人物A的音色时，可根据与该卡通人物A的音色对应的音色配置进行配置，即将声音输出参数调整为与该卡通人物A的声音参数相同，以还原该卡通人物A的音色，通常该声音参数包括：高音幅度、低音幅度、音频的振动频率等信息。当然，音色的种类通常并不局限于真人音色，还可以包括虚拟音色、合成音色等。

其中，语音播放本体所播放的语音内容，可以为实时获取的由用户传入的语音内容，也可以为预先通过网络传输等方式从服务器、非本地终端的存储介质中获取的语音内容，也可以是通过上述方式获取到的文本信息，以通过文本-语音技术(Text To Speech，简称TTS)等方式将文本信息转换得到的语音内容。

示例性的，用户可以预先通过终端设备向语音播放本地发出指令、直接操作语音播放本体101以获取到待播放语音内容的文本信息后，在用户使用用于存储有可通过近场通信机制读取的音色配置信息的进场语音信息存储器向该语音播放本体101发送语音配置信息后，该语音播放本体101通过近场通信扫描器读取该近场通信信息存储器中的音色配置信息，并根据该音色配置信息对应的音色，然后将上述文本信息通过TTS转化得到语音内容，最终通过配置好的音色完成对该语音内容的播放。

在一些可选的实施例中，该语音播放系统中还包括语音包存储服务器，该语音包存储服务器与语音播放本体通信相连，可以根据该语音播放本体的下载请求返回与该下载请求对应的语音包，以扩充语音内容的多样性，贴合用户的需求。

另外，考虑到近场通信信息存储器102的信息存储容量普遍偏小，若具体的音色配置信息的数据量较大、超出了近场通信信息存储器102的有效存储上限，还可以控制仅将能够进一步查询到具体的音色配置信息的索引或链接存储至语音播放本体101设置的近场通信扫描器中，充当能够帮忙获取到真正的音色配置信息的“伪音色配置信息”。

近场通信，英文全称为Near Field Communication，英文简称为NFC，是一种新兴的技术，使用了NFC技术的设备(例如移动电话)可以在彼此靠近的情况下进行数据交换，是由非接触式射频识别(RFID)及互连互通技术整合演变而来的，通过在单一芯片上集成感应式读卡器、感应式卡片和点对点通信的功能，利用移动终端实现移动支付、电子票务、门禁、移动身份识别、防伪等应用。除借助介于RFID的NFC外，红外、蓝牙等可在近距离进行数据交换的技术也属于一种近场通信方式。相比蓝牙、红外，基于NFC芯片的近场通信方式，成本相对较低。此时，近场通信信息存储器即为存储有音色配置信息的近场通信芯片(NFC芯片)。

本公开就是将近场通信技术应用在了语音播放领域，借助独立存储有音色配置信息的近场通信信息存储器来便捷的调整语音播放本体所呈现的用于播放语音内容的音色。

具体的，语音播放本体101可具体表现为不带其它功能的语音播放装置，也可以表现为集成有语音播放功能组件的智能音箱、智能移动终端等。

本实施例所提供的语音播放系统，将音色配置信息独立存储至近场通信信息存储器中，使得语音播放本体可以通过近场识别机制隔空从近场通信信息存储器中读取到音色配置信息，进而根据音色配置信息配置对应的音色，并以该音色完成语音内容的播放，并可通过更换存储有不同音色配置信息的存储器来实现对音色进行灵活的变更。

在上述实施例的基础上，本公开还通过图2提供了另一种语音播放系统的示意图。

如图2所示，考虑到近场通信信息存储器的可用性，结合实际情况还为其设置了多种多样的载体，例如图2所示的瓶盖1021、徽章1022、卡牌1023，以NFC芯片作为具体的近场通信信息存储器为例，存储有音色配置信息的NFC芯片可内嵌于瓶盖1021、徽章1022、或卡牌1023中，以借助具有更大表面积、更结实的材料特性的载体保护NFC芯片中存储的数据。除瓶盖、徽章、卡牌、勋章等几种尺寸较小的载体外，也可以选用一些尺寸较大的载体，例如玩具、盒子、底座等等，此处不限定载体的尺寸、形态，可根据实际需求灵活选择。

需要说明的是，当近场通信信息存储器具体为NFC芯片时，无需向NFC芯片供电即可由相应的扫描器从NFC芯片中读取到其中的信息，因此其相应的载体中无需设置相应的供电组件。但若近场通信信息存储器所采用的技术为蓝牙或红外等技术时，还需要结合实际需求增设相应的供电组件。

此外，图2中还增设了音色存储服务器103，该音色存储服务器103与语音播放本体101通信连接，用于根据语音播放本体的下载请求返回与下载请求对应的目标音色配置信息。即该音色存储服务器103的作用是在语音播放本体无法直接从近场通信信息存储器102中读取到完整的音色配置信息时，根据读取到的“伪音色配置信息”来从中获取到真实、完整的音色配置信息，进而根据接收到的目标音色配置信息完成音色配置，并进行相应的语音播放。

在上述任意实施例的基础上，为便于存放近场通信信息存储器102以及保持需要的近场通信距离，语音播放本体101上还可以设置有用于放置、容纳或包裹近场通信信息存储器102的开口，该开口的形状与内嵌有近场通信信息存储器102的载体的形状相对应。例如当近场通信信息存储器102的载体为硬币状的塑料勋章时，语音播放本体101上可设置有硬币状态的栅格来放置该硬币状的塑料勋章，或者设置有供硬币状的塑料勋章投入的内部空间等。

除上述开口式设计外，还可以设置近场通信信息存储器102通过磁吸方式吸附于语音播放本体101的外表面，即分别在语音播放本体101和近场通信信息存储器102上设置有不同且可以互相吸引的磁极，以利用磁力将近场通信信息存储器102吸附在语音播放本体101的外表面。根据磁极的设置位置，也可以将近场通信信息存储器102吸附在语音播放本体101的内部。

在上述任意实施例的基础上，为避免在近场通信距离下可能同时存在多个近场通信信息存储器102所导致的配置信息读取干扰，还可以在语音播放本体101上设置有屏蔽收纳盒(图1和图2均未示出)，该屏蔽收纳盒用于阻断近场通信扫描器对处于盒内空间的近场通信信息存储器中存储的音色配置信息的读取，例如采用可阻断信号传输的特定材料或材料的特定编织方式来制作该屏蔽收纳盒。

上一设置屏蔽收纳盒的实施例所针对的是在近场通信距离下仅存在读取一个近场通信信息存储器102中的配置信息的场景，即在此场景下不支持处理分别从不同的近场通信信息存储器102读取到不同的配置信息的能力。但在某些支持处理从不同的近场通信信息存储器102读取到不同的配置信息的能力的场景下时，还可以对分别从不同的近场通信信息存储器102中读取到的不同的音色配置信息进行融合，以得到融合音色配置信息，该融合音色配置信息可以是基于不用的音色配置信息进行叠加、替换等操作生成的完全不同于任何一个音色配置信息的融合音色配置信息，也可以是根据预设的配置规则对获取到的多个音色配置信息进行配置，分别使用不同的音色配置信息对应的音色播放完整的语音内容中的一部分。

示例性的，第一近场通信信息存储器中存储的音色配置信息对应有女高音音色、第二近场通信信息存储器中存储的音色配置信息对应有女低音音色时，可以将女高音音色和女低音音色进行融合，以得到全新的融合音色，在融合过程中，也可以按照预先确定的权重规则进行配置，以得到多种不同的融合音色，该权重规则可以根据实际的需求进行配比性调整，即在同种音色组合下，可以根据融合时所对应的权重规则不同得到不同的融合音色结果，从而可以获得更丰富的音色。

示例性的，待播放的语音内容为故事话本，该故事话本中设置有多个不同的角色A、B、C，在第一近场通信信息存储器中存储的音色配置信息对应有女高音音色，第二近场通信信息存储器中存储的音色配置信息对应有女低音音色，第三近场通信信息存储器中存储的音色配置信息对应有男低音音色，对应的为上述角色A、B、C所对应的台词分配女高音音色、女低音音色、男低音音色后，完成该故事话本的完整播放，以在同一段语音内容中利用不同的播放音色达到诸如多角色、多场景的效果，提升语音内容的播放效果。

一种具体的实现方式可参见如图3所示的流程图，图3为本公开实施例提供的一种语音播放音色配置方法的流程图，其中流程300包括以下步骤：

步骤301：响应于在预设时间段内读取到多个不同的音色配置信息，基于多个音色配置信息生成融合音色配置信息；

本步骤旨在由语音播放音色配置方法的执行主体(例如图1所示的语音播放本体101)在预设时间段内读取到多个不同的音色配置信息，融合获取到的多个音色配置信息，得到融合音色配置信息，以便根据该融合音色配置信息得到对应的融合音色，利用该融合音色播放语音内容。

其中，多个不同的音色配置信息通常分别来自于不同的近场通信信息存储器102，但也不排除一个近场通信信息存储器102中存储有多个不同的音色配置信息的特殊情况；预设时间段可以设置为5秒、10秒或自定义时长，还可以预先设置不同时长的预设时间段，并根据与上一个音色配置信息的读取时刻的间隔时长不同，确定上述的权重规则，得到相应的融合机制。例如连续获取到两个不同的音色配置信息，在读取间隔时间小于5秒时，确定在生成融合音色配置信息时，第一音色配置信息与第二音色配置信息之间的融合权重关系为2:1，在读取间隔时间大于5秒时、小于10秒时，确定在生成融合音色配置信息时，第一音色配置信息与第二音色配置信息之间的融合权重关系为1:1，在读取间隔时间大于10秒时，确定在生成融合音色配置信息时，第一音色配置信息与第二音色配置信息之间的融合权重关系为1:2。

步骤302：根据融合音色配置信息对应的融合音色播放语音内容。

另外，为提升用户不断获取到存储有新的音色配置信息的近场通信信息存储器的主动性，还可以在上述执行主体(例如图1所示的语音播放本体101)连续预设时长未读取到音色配置信息的情况下(即存储有音色配置信息的近场通信信息存储器102不在近场通信距离内)，就呈现与默认音色配置信息相对应的语音播放，不再继续基于从之前的近场通信信息存储器102中读取到的音色配置信息对应的音色播放语音播放。

例如用户之前获得限量版发售的某款动漫人物的纪念徽章N，该纪念徽章N中记录有该动漫人物对应的声优A的音色配置信息的网络链接。用户在获取该徽章N后，可通过将其放置在其家中支持语音播放的智能音箱的旁边的方式，使该智能音箱通过近场通信技术从徽章N中读取到了获取到与声优A的音色对应的音色配置信息的链接，该智能音箱根据该链接从存储服务器中下载到了声优A的音色对应的音色配置信息，并控制语音播放的功能组件根据该音色配置信息进行配置后，利用声优A的音色来播放语音内容。

但在之后的某一天徽章N被用户不小心丢弃，智能音箱在连续的两周内未能在近场通信距离内持续检测到徽章N，就不再继续根据声优A的音色来播放语音内容，转而将音色配置成默认的音色。

进一步的，为了防止用户通过非法手段私自篡改该智能音箱(语音播放本体)的本地数据，以通过修改默认音色对应的音色配置信息为其他历史获取到的音色配置信息的方式，将本地的默认音色篡改为其他历史获取到的音色配置信息，还可以设置智能音箱在预设时间内后自行删去历史数据中配置过的音色配置信息，或者设置智能音箱的数据写入权限为特定用户。

作为对图3所示方法的实现，本公开还通过图4提供了一种语音播放音色配置装置的一个实施例，该装置实施例与图3所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图4所示，本实施例的语音播放音色配置装置400可以包括：音色融合单元401、语音播放单元402。其中音色融合单元401，被配置成响应于在预设时间段内读取到多个不同的音色配置信息，基于多个该音色配置信息生成融合音色配置信息；语音播放单元402，被配置成根据该融合音色配置信息对应的融合音色播放语音内容。

在本实施例中，语音播放音色配置装置400中：音色融合单元401、语音播放单元402的具体处理及其所带来的技术效果可分别参考图3对应实施例中的步骤301-302的相关说明，在此不再赘述。

在本实施例的一些可选的实现方式中，语音播放音色配置装置400中还可以包括：

失效恢复默认单元，被配置成响应于连续预设时长未读取到音色配置信息，修正播放音色为默认音色。

根据本公开的实施例，本公开还提供了一种电子设备，该电子设备包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，该指令被至少一个处理器执行，以使至少一个处理器执行时能够实现上述任一内容的语音播放音色配置方法。

根据本公开的实施例，本公开还提供了一种可读存储介质，该可读存储介质存储有计算机指令，该计算机指令用于使计算机执行时能够实现上述任一内容的语音播放音色配置方法。

本公开实施例提供了一种计算机程序产品，该计算机程序在被处理器执行时能够实现上述任一内容的语音播放音色配置方法。

图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图5所示，设备500包括计算单元501，其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序，来执行各种适当的动作和处理。在RAM 503中，还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

设备500中的多个部件连接至I/O接口505，包括：输入单元506，例如键盘、鼠标等；输出单元507，例如各种类型的显示器、扬声器等；存储单元508，例如磁盘、光盘等；以及通信单元509，例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理，例如语音播放音色配置方法。例如，在一些实施例中，语音播放音色配置方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元508。在一些实施例中，计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时，可以执行上文描述的语音播放音色配置方法的一个或多个步骤。备选地，在其他实施例中，计算单元501可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行语音播放音色配置方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决传统物理主机与虚拟专用服务器(VPS，Virtual Private Server)服务中存在的管理难度大，业务扩展性弱的缺陷。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

一种语音播放系统，包括：

近场通信信息存储器，用于存储可通过近场通信机制读取的音色配置信息；

设置有近场通信扫描器的语音播放本体，用于通过所述近场通信扫描器读取所述近场通信信息存储器中的音色配置信息，并根据所述音色配置信息对应的音色播放语音内容。
根据权利要求1所述的语音播放系统，其中，所述近场通信信息存储器为存储有所述音色配置信息的近场通信芯片。
根据权利要求2所述的语音播放系统，其中，所述近场通信芯片内嵌于勋章、徽章、卡片或瓶盖。
根据权利要求1所述的语音播放系统，其中，所述语音播放本体上设置有用于放置、容纳或包裹所述近场通信信息存储器的开口，所述开口的形状与内嵌有所述近场通信信息存储器的载体的形状相对应。
根据权利要求1所述的语音播放系统，其中，所述近场通信信息存储器通过磁吸方式吸附于所述语音播放本体的外表面。
根据权利要求1所述的语音播放系统，其中，所述语音播放本体上设置有屏蔽收纳盒，所述屏蔽收纳盒用于阻断所述近场通信扫描器对处于盒内空间的近场通信信息存储器中存储的音色配置信息的读取。
根据权利要求1-6中任一项所述的语音播放系统，还包括：

语音包存储服务器，与所述语音播放本体通信连接，用于根据所述语音播放本体的下载请求返回与所述下载请求对应的语音包。
一种语音播放音色配置方法，应用于如权利要求1-7任一项所述的语音播放系统，包括：

响应于在预设时间段内读取到多个不同的音色配置信息，基于多个所述音色配置信息生成融合音色配置信息；

根据所述融合音色配置信息对应的融合音色播放语音内容。
根据权利要求8所述的方法，还包括：

响应于连续预设时长未读取到音色配置信息，修正播放音色为默认音色。
一种语音播放音色配置装置，应用于如权利要求1-7任一项所述的语音播放系统中的语音播放本体，包括：

音色融合单元，被配置成响应于在预设时间段内读取到多个不同的音色配置信息，基于多个所述音色配置信息生成融合音色配置信息；

语音播放单元，被配置成根据所述融合音色配置信息对应的融合音色播放语音内容。
根据权利要求10所述的装置，还包括：

失效恢复默认单元，被配置成响应于连续预设时长未读取到音色配置信息，修正播放音色为默认音色。
一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求8或9所述的语音播放音色配置方法。
一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求8或9所述的语音播放音色配置方法。
一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求8或9所述的语音播放音色配置方法。