CN114489559B

CN114489559B - 音频播放方法、音频播放的处理方法及装置

Info

Publication number: CN114489559B
Application number: CN202210078101.5A
Authority: CN
Inventors: 李芳�
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2022-01-24
Filing date: 2022-01-24
Publication date: 2023-11-28
Anticipated expiration: 2042-01-24
Also published as: CN114489559A

Abstract

本公开关于一种音频播放方法、音频播放的处理方法及装置，该音频播放方法包括：响应于文本内容的呈现事件，确定与所呈现的所述文本内容关联的当前语义信息；确定关联于所呈现的文本内容的语义匹配信息；获取音频推荐信息，其中，音频推荐信息用于表征音频库中与语义匹配信息的匹配度最高的音频内容；在文本内容的呈现期间内播放音频内容。本公开所得到的音频内容与所呈现的文本内容具有较高的匹配度，使得在呈现的文本内容期间播放的音频内容能够辅助引导阅读文本内容的用户沉浸于所阅读的文本内容之中，从而提升了对文本内容阅读过程中的阅读体验，在用户阅读文章时实现了个性化的音乐推荐，极大地提升了浏览体验。

Description

音频播放方法、音频播放的处理方法及装置

技术领域

本公开涉及多媒体技术领域，尤其涉及一种音频播放方法、音频播放的处理方法及装置。

背景技术

随着互联网和移动通讯技术的发展和应用的普及，在移动终端进行文本内容的阅读已经成为一种普遍存在的阅读方式。

然而，在文本内容的呈现期间，终端往往是静音的模式，而不能进一步带来良好的阅读体验。

发明内容

本公开提供一种音频播放方法、音频播放的处理方法及装置，以至少解决相关技术中在文本阅读过程中提升阅读体验的技术问题。

根据本公开实施例的一方面，提供一种音频播放方法，包括：

响应于文本内容的呈现事件，确定与所呈现的所述文本内容关联的当前语义信息；

确定关联于所呈现的所述文本内容的语义匹配信息；

获取音频推荐信息，其中，所述音频推荐信息用于表征音频库中与所述语义匹配信息的匹配度最高的音频内容；

在所述文本内容的呈现期间内播放所述音频内容。

在一种可能实施方式中，所述确定与所呈现的所述文本内容关联的当前语义信息，包括：

根据所呈现的所述文本内容，获得与所呈现的所述文本内容关联的当前语义标签，其中，所述当前语义标签用于表征所述当前语义信息。

在一种可能实施方式中，所述确定关联于所述文本内容的语义匹配信息，包括：

若不存在关联于历史文本内容浏览记录的历史语义信息，则，将所述当前语义信息确定为所述语义匹配信息；

若存在所述历史语义信息，则：

响应于不与历史文本内容浏览记录关联的音频播放触发事件，将所述当前语义信息确定为所述语义匹配信息；

响应于与历史文本内容浏览记录关联的音频播放触发事件，根据所述历史语义信息，确定所述语义匹配信息。

在一种可能实施方式中，所述根据所述历史语义信息，确定所述语义匹配信息，包括：

获取每一条所述历史语义信息以及各条历史语义信息所对应的权重；

根据各条历史语义信息所对应的权重，整合所述历史语义信息，得到所述语义匹配信息。

在一种可能实施方式中，所述权重包括分别关联于每一条所述历史语义信息的：文本内容呈现时长分值、评论分值、互动分值中的至少之一。

对所呈现的所述文本内容进行语义识别，得到所述当前语义信息。

在一种可能实施方式中，所述关联于历史文本内容浏览记录的历史语义信息存储于呈现所述文本内容的设备本地。

根据本公开实施例的另一方面，提供一种音频播放的处理方法，包括：

获取语义匹配信息，所述语义匹配信息是响应于文本内容的呈现事件而确定的关联于所呈现的所述文本内容的语义匹配信息；

根据所述语义匹配信息，确定音频推荐信息，所述音频推荐信息用于表征音频库中与所述语义匹配信息的匹配度最高的音频内容；

其中，所述音频内容用于在所述文本内容的呈现期间内播放。

在一种可能实施方式中，所述根据所述语义匹配信息，确定音频推荐信息，包括：

将所述语义匹配信息与所述音频库中的每个音频内容的音频属性进行匹配，获得所述语义匹配信息与所述音频库中的每个音频内容的匹配度；

将所述匹配度最高的音频内容，确定为推荐音频；

根据所述推荐音频，生成所述音频推荐信息。

在一种可能实施方式中，所述将所述语义匹配信息与所述音频库中的每个音频内容的音频属性进行匹配，获得所述语义匹配信息与所述音频库中的每个音频内容的匹配度，包括：

将表征所述语义匹配信息的语义标签中的各个标签值与表征所述音频属性的属性标签中的各个标签值进行计算以获得所述匹配度。

根据本公开实施例的另一方面，提供一种音频播放装置，包括：

语义信息确定模块，被配置为执行响应于文本内容的呈现事件，确定与所呈现的所述文本内容关联的当前语义信息；

匹配信息确定模块，被配置为执行确定关联于所呈现的所述文本内容的语义匹配信息；

音频推荐信息获取模块，被配置为执行获取音频推荐信息，其中，所述音频推荐信息用于表征音频库中与所述语义匹配信息的匹配度最高的音频内容；

音频播放模块，被配置为执行在所述文本内容的呈现期间内播放所述音频内容。

在一种可能实施方式中，所述语义信息确定模块进一步被配置为执行：

根据所述文本内容，获得与所呈现的所述文本内容关联的当前语义标签，其中，所述当前语义标签用于表征所述当前语义信息。

在一种可能实施方式中，所述匹配信息确定模块进一步被配置为执行：

若存在所述历史语义信息，则：

根据本公开实施例的另一方面，提供一种音频播放的处理装置，包括：

匹配信息获取模块，被配置为执行获取语义匹配信息，所述语义匹配信息是响应于文本内容的呈现事件而确定的关联于所呈现的所述文本内容的语义匹配信息；

音频推荐信息确定模块，被配置为执行根据所述语义匹配信息，确定音频推荐信息，所述音频推荐信息用于表征音频库中与所述语义匹配信息的匹配度最高的音频内容；

在一种可能实施方式中，所述音频推荐信息确定模块包括：

匹配度获取子模块，被配置为执行将所述语义匹配信息与所述音频库中的每个音频内容的音频属性进行匹配，获得所述语义匹配信息与所述音频库中的每个音频内容的匹配度；

推荐音频获取子模块，被配置为执行将所述匹配度最高的音频内容，确定为推荐音频；

推荐信息生成子模块，被配置为执行根据所述推荐音频，生成所述音频推荐信息。

在一种可能实施方式中，所述匹配度获取子模块进一步被配置为执行：

根据本公开实施例的另一方面，提供一种电子设备，包括：

处理器；

用于存储所述处理器的可执行指令的存储器；

其中，所述处理器被配置为执行所述可执行指令，以实现上述任一实施方式所述的音频播放方法和/或上述任一实施方式所述的音频播放的处理方法。

根据本公开实施例的另一方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的至少一条指令被电子设备的处理器执行时，使得所述电子设备能够实现上述任一实施方式所述的音频播放方法和/或上述任一实施方式所述的音频播放的处理方法。

根据本公开实施例的另一方面，提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现上述任一实施方式所述的音频播放方法和/或上述任一实施方式所述的音频播放的处理方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

根据所呈现的文本内容得到相关联的当前语义信息，进而根据当前语义信息得到语义匹配信息，使得语义匹配信息与所呈现的文本内容相关联，在此基础上，将语义匹配信息与音频库中的音频内容进行匹配以获得匹配度最高的音频内容音频推荐信息，并在文本内容的呈现期间播放所获得的音频内容，由于音频内容与语义匹配信息的匹配度最高，并且语义匹配信息与所呈现的文本内容相关联，进而音频内容与所呈现的文本内容具有较高的匹配度，使得在呈现的文本内容期间播放的音频内容能够辅助引导阅读文本内容的用户沉浸于所阅读的文本内容之中，从而提升了对文本内容阅读过程中的阅读体验，在用户阅读文章时实现了个性化的音乐推荐，极大地提升了浏览体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种音频播放方法和音频播放的处理方法的实施环境示意图；

图2是根据一示意性实施例示出的一种音频播放方法的流程图；

图3是根据一示意性实施例示出的确定关联于所呈现的文本内容的语义匹配信息的流程图；

图4是根据一示例性实施例示出的一种音频播放方法的应用场景流程图；

图5是根据一示意性实施例示出的一种音频播放的处理方法的流程图；

图6是根据一示意性实施例示出的确定音频推荐信息的流程图；

图7是根据一示意性实施例示出的一种音频播放的处理方法的应用场景流程图；

图8是根据一示意性实施例示出的一种音频播放方法和音频播放的处理方法的应用场景流程图；

图9是根据一示意性实施例示出的一种音频播放及处理方法的应用场景流程图；

图10是根据一示意性实施例示出的一种音频播放装置的逻辑结构框图；

图11是根据一示意性实施例示出的一种音频播放的处理装置的逻辑结构框图；

图12是本公开一个示意性实施例提供的一种终端的结构框图；

图13是本公开实施例提供的一种电子设备的结构示意图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

为了获得良好的阅读体验，在文本内容的呈现期间，终端可同时播放音频内容，如音乐等，但是，终端所播放的音频内容无法做到与文本内容的良好匹配，并且通过人工方式来选择播放音频内容也很难真正达到所期待的提高阅读体验的效果，并且人工方式由于效率低下而占用大量时间，进而仍然会影响到对阅读的体验。

有鉴于此，本公开实施例提供一种音频播放方法和音频播放的处理方法，能够获得表征与呈现的文本内容相匹配的音频内容的音频推荐信息，进而可在文本内容的呈现期间内播放与呈现的文本内容相匹配的音频内容，使得用户在阅读文本内容的过程中能够在所播放的音频内容的引导下沉浸于所阅读的文本内容之中，从而提升了对文本内容阅读过程中的阅读体验。

图1是根据一示例性实施例示出的一种音频播放方法和音频播放的处理方法的实施环境示意图，参见图1，在该实施环境中可以包括至少一个终端101和服务器102，下面进行详述。

至少一个终端101用于浏览多媒体资源，在该至少一个终端101中每个终端上都可以安装有应用程序，该应用程序可以是任一能够提供多媒体资源浏览服务的客户端，用户可以通过启动该应用程序来浏览多媒体资源，该应用程序可以是短视频应用、音视频应用、购物应用、外卖应用、旅行应用、游戏应用或者社交应用中至少一项，该多媒体资源可以包括视频资源、音频资源、图片资源、文本资源或者网页资源中至少一项。

至少一个终端101可以通过有线或无线通信方式与服务器102进行直接或间接地连接，本公开实施例对此不进行限定。

服务器102也即是一种计算机设备，用于向该至少一个终端101提供多媒体资源搜索服务。服务器102可以包括一台服务器、多台服务器、云计算平台或者虚拟化中心中的至少一项。可选地，服务器102可以承担主要计算工作，该至少一个终端101可以承担次要计算工作；或者，服务器102可以承担次要计算工作，该至少一个终端101可以承担主要计算工作；或者，服务器102和该至少一个终端101之间采用分布式计算架构进行协同计算。

需要说明的是，该至少一个终端101中任一终端的设备类型可以包括：智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group AudioLayerIV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机或者台式计算机中的至少一种。例如，该任一终端可以是智能手机，或者其他手持便携式电子设备。以下实施例，以终端包括智能手机来举例说明。

本领域技术人员可以知晓，上述终端的数量可以更多或更少。比如上述终端可以仅为一个，或者上述终端为几十个或几百个，或者更多数量。本公开实施例对终端的数量和设备类型不加以限定。

图2是根据一示意性实施例示出的一种音频播放方法的流程图，参见图2所示，该音频播放方法应用于计算机设备，下面以计算机设备为终端为例进行说明。

步骤201、响应于文本内容的呈现事件，确定与所呈现的文本内容关联的当前语义信息。

在一些实施例中，当前语义信息是根据所呈现的文本内容的内容数据进行分析而获得，当前语义信息可以是以语义标签的形式表达，并且，可基于现有的语义识别等人工智能技术实现。在这种情况下，步骤201中的确定与所呈现的文本内容关联的当前语义信息，可以包括：

根据所呈现的文本内容，获得与所呈现的文本内容关联的当前语义标签，其中，当前语义标签用于表征当前语义信息。

其中，语义标签可以采用语义识别等人工智能技术对文本内容进行分析推理而获得。

在这种情况下，步骤201中的确定与所呈现的文本内容关联的当前语义信息，可以包括：

对所呈现的所述文本内容进行语义识别，得到当前语义信息。

步骤202、确定关联于所呈现的文本内容的语义匹配信息。

在一些实施例中，在文本内容的呈现之前，终端已经记录了历史浏览数据，即曾经呈现的文本内容，也就是说，用户在阅读当前文本内容以前已经有了历史阅读记录，在另一些实施例中，终端没有历史浏览数据的记录，在这些不同的实施例中，本公开实施例的音频播放方法可以根据需要而基于当前呈现的文本内容获得相匹配的音频内容，或者基于历史浏览数据的记录获得相匹配的音频内容。其中，在基于所呈现的文本内容获得相匹配的音频内容的方案中，所获得的音频内容仅与所呈现的文本内容相关而可能与历史阅读记录的文本内容无关，所以所得到的音频内容与所呈现的文本内容之间的关联大，使得用户在阅读所呈现的文本内容期间，播放的音频内容更加能够将用户带入正在阅读的文本内容的情节当中，使得用户能够获得对应于正在阅读的文本内容的最佳沉浸体验。在基于历史阅读记录的文本内容获得相匹配的音频内容的方案中，所获得的音频内容会关联于历史阅读记录的文本内容，使得用户在阅读所呈现的文本内容期间，播放的音频内容与历史阅读记录的文本内容相关，进而用户在阅读所呈现的文本内容时易于回忆起历史阅读时的体验，从而在阅读呈现的文本内容时能够从历史阅读的体验开始进行体验的过渡，增强了用户阅读体验的延续性。

在这种情况下，为了实现上述效果，步骤202可进一步包括：

若不存在关联于历史文本内容浏览记录的历史语义信息，则，将当前语义信息确定为语义匹配信息；

若存在历史语义信息，则：

响应于不与历史文本内容浏览记录关联的音频播放触发事件，将当前语义信息确定为语义匹配信息；

响应于与历史文本内容浏览记录关联的音频播放触发事件，根据历史语义信息，确定语义匹配信息。

在一些实施例中，所述关联于历史文本内容浏览记录的历史语义信息存储于呈现文本内容的设备本地。在一些实施例中，呈现文本内容的设备包括终端。

上述步骤以流程方式的呈现，可参见图3所示的确定关联于所呈现的文本内容的语义匹配信息的流程图，参见图3所示，该过程包括以下步骤。

步骤301、判断是否存在关联于历史文本内容浏览记录的历史语义信息，如果是则执行步骤302，否者执行步骤303或者步骤304。

步骤302、将当前语义信息确定为语义匹配信息。

步骤303、响应于不与历史文本内容浏览记录关联的音频播放触发事件，将当前语义信息确定为语义匹配信息。

步骤304、响应于与历史文本内容浏览记录关联的音频播放触发事件，根据历史语义信息，确定语义匹配信息。

其中，不与历史文本内容浏览记录关联的音频播放触发事件关联于仅需要针对当前呈现的文本内容得到音频内容进行播放的需求，与历史文本内容浏览记录关联的音频播放触发事件关联于针对终端记录的历史文本内容浏览记录综合得到的音频内容进行播放的需求。

本公开实施例的音频播放方法，针对上述两种需求而确定相应的音频内容，满足了用户的对文本内容阅读过程中的音频信息的不同体验需求。

在一些实施例中，步骤304具体包括：

获取每一条历史语义信息以及各条历史语义信息所对应的权重；

根据各条历史语义信息所对应的权重，整合历史语义信息，得到语义匹配信息。

采用上述方式，所得到的语义匹配信息中，包含了具有权重的历史语义信息，由于权重的影响，使得各条历史语义信息对所获得的音频内容具有不同程度的贡献，从而对所获的音频内容来说，达到了从曾经呈现过的文本内容获得的体验以辅助用户快速进入曾经的阅读状态的效果。

在一些实施例中，权重包括分别关联于每一条历史语义信息的：文本内容呈现时长分值、评论分值、互动分值中的至少之一。

步骤203、获取音频推荐信息，其中，音频推荐信息用于表征音频库中与语义匹配信息的匹配度最高的音频内容。

步骤204、在文本内容的呈现期间内播放音频内容。

在一些实施例中，音频内容为音乐。

在一些实施例中，文本内容为文章。

本公开实施例的音频播放方法，根据所呈现的文本内容得到相关联的当前语义信息，进而根据当前语义信息得到语义匹配信息，使得语义匹配信息与所呈现的文本内容相关联，在此基础上，将语义匹配信息与音频库中的音频内容进行匹配以获得匹配度最高的音频内容音频推荐信息，并在文本内容的呈现期间播放所获得的音频内容，由于音频内容与语义匹配信息的匹配度最高，并且语义匹配信息与所呈现的文本内容相关联，进而音频内容与所呈现的文本内容具有较高的匹配度，使得在呈现的文本内容期间播放的音频内容能够辅助引导阅读文本内容的用户沉浸于所阅读的文本内容之中，从而提升了对文本内容阅读过程中的阅读体验，在用户阅读文章时实现了个性化的音乐推荐，极大地提升了浏览体验。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

图4是根据一示例性实施例示出的一种音频播放方法的应用场景流程图，如图4所示，该音频播放方法应用于计算机设备，以计算机设备为终端为例进行说明，该实施例包括以下步骤。

步骤401、响应于文本内容的呈现事件，确定与所呈现的文本内容关联的当前语义标签，之后执行步骤402。

其中，当前语义标签表征当前语义信息。在一些实施例中，语义标签的表现形式例如[tag₁,tag₂,…,tag_n]，其中，tag_i为语义标签中的第i个标签元素，语义标签中共包含n个标签元素。

其中，除确定当前语义标签以外，还确定当前语义标签的权重。在一些实施例中，语义标签的权重包括：文本内容呈现时长分值(stay_time)、评论分值(comment)、互动分值(interaction)中的至少之一。例如，语义标签的权重可由下式确定：

f＝stay_time×a+comment×b+interaction×c

其中，a、b、c分别为在权重当中stay_time、comment、interaction各自所占的比重，例如，若a＝0.4、b＝0.2、c＝0.2，则

f＝stay_time×0.4+comment×0.2+interaction×0.2

从上式可以看出，若将a设置为0，则等同于语义标签的权重中不包含文本内容呈现时长分值(stay_time)，若将b设置为0，则等同于语义标签的权重中不包含评论分值(comment)，若将c设置为0，则则等同于语义标签的权重中不包含互动分值(interaction)。

其中，stay_time、comment、interaction各自的取值可以根据需求进行设置，例如，可以文本内容呈现时长本身作为stay_time的取值，可以根据评论的数量确定comment的取值，可以根据互动的数量(如点赞的数量、收藏的数量、转发的数量等)确定为interaction的取值。也可以根据设定的阈值范围对stay_time、comment、interaction进行取值，例如在文本内容呈现时长落入某个阈值范围区间的情况下，stay_time的取值设定为对应于该阈值范围区间的取值，在评论的数量落入某个阈值范围区间的情况下，comment的取值设定为对应于该阈值范围区间的取值，在互动的数量落入某个阈值范围区间的情况下，interaction的取值设定为对应于该阈值范围区间的取值。

在一些实施例中，在确定每一次呈现文本内容的语义标签[tag₁,tag₂,…,tag_n]的同时，均确定对应于该语义标签的权重，语义标签及其权重的记录数据形式例如：

{tag:[tag₁,…,tag_n],stay_time:time,comment:c_value,interaction:i_value}

其中，c_value表示comment的取值，i_value表示interaction的取值。

采用这种方式，对于每一条历史语义标签，可以立即根据上式得到相应的权重，并在后续响应于与历史文本内容浏览记录关联的音频播放触发事件的情况下，能够方便快速地根据历史语义标签，得到语义匹配标签。

其中，历史语义标签用于表征历史语义信息。

本实施例中，上述步骤401是在终端执行。除此以外，在服务器具有确定与所呈现的文本内容关联的当前语义标签能力的情况下，步骤401中的确定与所呈现的文本内容关联的当前语义标签也可以由服务器实现，其中，终端响应于文本内容的呈现事件，将呈现的文本内容发送给服务器，由服务器确定与所呈现的文本内容关联的当前语义标签。

步骤402、判断是否存储有关联于历史文本内容浏览记录的历史语义标签，如果有则执行步骤403，否则执行步骤404。

本实施例中，上述步骤401是在终端执行，历史语义标签存储于终端。除此以外，在服务器具有判断是否存储有关联于历史文本内容浏览记录的历史语义标签能力的情况下，步骤402也可以由服务器实现，其中，历史语义标签可以存储于服务器，历史语义标签也可由终端发送至服务器。

步骤403、呈现播放选项，之后执行步骤405或者步骤406。

其中，播放选项包括：是否播放与历史文本内容浏览记录关联的音频内容。

步骤404、将当前语义标签确定为语义匹配标签，之后执行步骤409。

例如，若当前语义标签为[tag₁,tag₂,…,tag_n]，则将[tag₁,tag₂,…,tag_n]确定为语义匹配标签。

步骤405、响应于不与历史文本内容浏览记录关联的音频播放触发事件，将当前语义标签确定为语义匹配标签，之后执行步骤409。

本实施例中，步骤405是在终端执行。除此以外，在服务器具有将当前语义标签确定为语义匹配标签的能力的情况下，步骤405中的将当前语义标签确定为语义匹配标签也可以由服务器执行，在此情况下，步骤405中，终端可以将仅与所呈现的文本内容关联的音频播放触发事件的信息发送给服务器，在服务器收到仅与所呈现的文本内容关联的音频播放触发事件的信息的情况下，将当前语义标签确定为语义匹配标签。

步骤406、响应于与历史文本内容浏览记录关联的音频播放触发事件，获取历史语义标签，之后执行步骤407。

本实施例中，步骤406是在终端执行。除此以外，在服务器具有获取历史语义标签的能力的情况下，步骤406中的获取历史语义标签也可以由服务器执行，在此情况下，步骤406中，终端可以将与历史文本内容浏览记录关联的音频播放触发事件的信息发送给服务器，在服务器收到与历史文本内容浏览记录关联的音频播放触发事件的信息的情况下，获取历史语义标签。

步骤407、获取各条历史语义标签所对应的权重，之后执行步骤408。

在一些实施例中，历史语义标签以以下的形式记录或存储：

{tag:[tag₁,…,tag_n],stay_time:time,comment:c_value,interaction:i_value}

在此情况下，步骤406和步骤407可以同步执行。

其中，当前语义标签在随后的下一次文本内容的呈现时，便成为历史语义标签。每一次文本内容的呈现均对应一条语义标签，对应于当前呈现的文本内容的语义标签为当前语义标签，对应于曾经每一次呈现过的文本内容的语义标签为历史语义标签，在一些实施例中，无论是当前语义标签还是历史语义标签，每一条语义标签均分别对应一次文本内容的呈现。

如上述语义标签的记录或存储的形式，每一条语义标签的权重与该条语义标签一同存储。在此情况下，本实施例中，步骤407是在终端执行。除此以外，在语义标签及其权重存储于服务器的情况下，步骤407也可以在服务器执行。

步骤408、根据历史语义标签各自的权重，整合历史语义标签，得到语义匹配标签，之后执行步骤409。

本实施例中，步骤408是在终端执行。除此以外，在服务器具备执行步骤408的能力的情况下，步骤408也可以在服务器执行。

在一些实施例中，整合历史语义标签，得到语义匹配标签，包括：

将每条历史语义标签与各自的权重相乘并求和得到语义匹配标签。

例如，设历史语义标签中的第i个语义标签为[tag_i1,…,tag_in]，对应于第i个语义标签的权重为f_i，则在一些实施例中，步骤408中，将第i个语义标签与其权重相乘，即f_i×[tag_i1,…,tag_in]，得到带有权重的第i个语义标签，之后将所有带有权重的语义标签相加获得语义匹配标签。

步骤409、发送语义匹配标签，之后执行步骤410。

在一些实施例中，语义匹配标签信息可以是发送至服务器，由服务器获取音频推荐信息。除此以外，在另外一些实施例中，在终端具有获取音频推荐信息能力的情况下，语义匹配标签信息也可以发送至终端，并由终端获取音频推荐信息。

步骤410、获取音频推荐信息，之后执行步骤411。

在一些实施例中，语义匹配标签信息可以是从服务器获取。除此以外，在另外一些实施例中，在终端具有获取音频推荐信息能力的情况下，语义匹配标签信息也可以从终端获取。

步骤411、在文本内容的呈现期间内播放音频推荐信息所表征的音频内容。

在一些实施例中，音频内容可以是从服务器获取的音频内容。

上述过程仅以在终端为例进行说明，在其它一些可选实施例中，上述过程中的部分步骤也可以在服务器执行，例如步骤401中的确定当前语义标签的过程可以在服务器执行，例如历史语义标签也可以存储于服务器，例如语义匹配标签的确定也可以在服务器执行等。

图5是根据一示意性实施例示出的一种音频播放的处理方法的流程图，参见图5所示，该音频播放的处理方法应用于计算机设备，下面以计算机设备为服务器为例进行说明。

步骤501、获取语义匹配信息，其中，语义匹配信息是响应于文本内容的呈现事件而确定的关联于所呈现的文本内容的语义匹配信息。

步骤502、根据语义匹配信息，确定音频推荐信息，其中，音频推荐信息用于表征音频库中与语义匹配信息的匹配度最高的音频内容。

其中，音频内容用于在文本内容的呈现期间内播放。

在一些实施例中，音频推荐信息的还需要结合于音频内容的音频属性进行获取，在语义匹配信息与音频属性之间的契合度(匹配度)较高时，才能保证音频内容能够与呈现的文本内容之间具有良好的匹配度，也就是说，在呈现文本内容期间所播放的音频内容所表的含义(如情感、气氛等)能够与所呈现的文本内容相一致。在这种情况下，参见图6所示的确定音频推荐信息的流程，步骤502中的根据语义匹配信息，确定音频推荐信息，可以包括：

步骤601、将语义匹配信息与音频库中的每个音频内容的音频属性进行匹配，获得语义匹配信息与音频库中的每个音频内容的匹配度。

在一些实施例中，语义匹配信息可以是以语义标签的形式表达，音频属性可以是以属性标签的形式表达，在这种情况下，步骤601具体包括：

将表征语义匹配信息的语义标签中的各个标签值与表征音频属性的属性标签中的各个标签值进行计算以获得匹配度。

在一些实施例中，语义标签的表现形式例如[tag₁,tag₂,…,tag_n]，其中tag₁、tag₂、tag_n为语义标签中的各个标签值，表征音频属性的属性标签的表现形式例如[Tag₁,Tag₂,…,Tag_m]，其中，Tag₁、Tag₂、Tag_m为属性标签中的各个标签值。

基于此，在一些实施例中，可以通过如下过程获得语义标签与任意一个属性标签之间的匹配度：

获得语义标签中的各个标签值与属性标签中的各个标签值之间的差的绝对值，将得到的所有差的绝对值求和得到差值总值，将差值总值与语义标签和属性标签的标签值的总数量的比值作为语义标签与该任意一个属性标签之间的匹配度，采用公式表示为：

其中，M为表征匹配度的匹配值。

通过上述方式获得语义匹配信息与音频库中的每个音频内容的匹配度，采用上述公式获得的匹配值中，匹配值越小代表了语义标签与属性标签之间越相近，进而匹配度越高，即匹配值M越小则其所表征的匹配度越高。

步骤602、将匹配度最高的音频内容，确定为推荐音频。

结合与上述匹配值M的实施例，是将匹配值M最小的音频内容确定为推荐音频。

步骤603、根据推荐音频，生成音频推荐信息。

在一些实施例中，音频推荐信息可包括推荐音频的标识号、名称、作者中的至少之一，在一些实施例中，音频推荐信息可包括推荐音频的音频内容本身。

在一些实施例中，属性标签是通过对音频内容的推理分析得到的，对音频内容的推理分析可采用人工智能技术实现。

本公开实施例的音频播放的处理方法，将关联于所呈现的文本内容的语义匹配信息与音频库中的音频内容进行匹配以获得匹配度最高的音频内容音频推荐信息，并在文本内容的呈现期间播放所获得的音频内容，由于音频内容与语义匹配信息的匹配度最高，并且语义匹配信息与所呈现的文本内容相关联，进而音频内容与所呈现的文本内容具有较高的匹配度，使得在呈现的文本内容期间播放的音频内容能够辅助引导阅读文本内容的用户沉浸于所阅读的文本内容之中，从而提升了对文本内容阅读过程中的阅读体验，在用户阅读文章时实现了个性化的音乐推荐，极大地提升了浏览体验。

图7是根据一示意性实施例示出的一种音频播放的处理方法的应用场景流程图，参见图7所示，该音频播放的处理方法应用于计算机设备，下面以计算机设备为服务器为例进行说明。

步骤701、获取语义匹配信息。

其中，语义匹配信息是响应于文本内容的呈现事件而确定的关联于所呈现的文本内容的语义匹配信息。在一些实施例中，文本内容的呈现事件可以是发生于终端的事件，语义匹配信息是由终端生成。在一些实施例中，语义匹配信息也可以是由服务器生成，在此情况下，终端可以响应于文本内容的呈现事件，将呈现的文本内容发送给服务器，由服务器获取语义匹配信息，其中根据呈现的文本内容得到语义匹配信息的过程可参照上述音频播放方法实施例的相关步骤实现。

步骤702、将语义匹配信息与音频库中的每个音频内容的音频属性进行匹配，获得语义匹配信息与音频库中的每个音频内容的匹配度。

在一些实施例中，音频库可以是存储于服务器，音频属性可以是存储于服务器。除此以外，在一些实施例中，在终端具有存储音频库、音频属性以及执行步骤702的能力的情况下，步骤702也可以由终端执行。

步骤703、将匹配度最高的音频内容，确定为推荐音频。

步骤704、根据推荐音频，生成音频推荐信息。

步骤705、发送音频推荐信息。

在本实施例中，音频推荐信息是由服务器发送。在其它一些实施例中，在终端具备执行上述各步骤的能力并且已经由终端执行了上述各个步骤的情况下，本步骤可以延续上述步骤而由终端执行。

在一些实施例中，音频推荐信息是发送给呈现文本内容的终端，结合与上述各项实施例的说明，在呈现文本内容的终端收到音频推荐信息的情况下便可以在文本内容的呈现期间播放音频推荐信息所表征的音频内容。

图8是根据一示意性实施例示出的一种音频播放方法和音频播放的处理方法的应用场景流程图，参见图8所示，该音频播放方法和音频播放的处理方法应用于计算机设备，该音频播放方法和音频播放的处理方法由终端和服务器共同完成，下面以计算机设备为终端和服务器为例进行说明。

步骤801、终端响应于文本内容的呈现事件，确定与所呈现的文本内容关联的当前语义标签，之后执行步骤802。

步骤802、终端判断是否存储有关联于历史文本内容浏览记录的历史语义标签，如果有则执行步骤803，否则执行步骤804。

步骤803、终端呈现播放选项，之后执行步骤805或者步骤806。

步骤804、终端将当前语义标签确定为语义匹配标签，之后执行步骤809。

步骤805、终端响应于不与历史文本内容浏览记录关联的音频播放触发事件，将当前语义标签确定为语义匹配标签，之后执行步骤809。

步骤806、终端响应于与历史文本内容浏览记录关联的音频播放触发事件，获取历史语义标签，之后执行步骤807。

步骤807、终端获取各条历史语义标签所对应的权重，之后执行步骤808。

步骤808、终端根据历史语义标签各自的权重，整合历史语义标签，得到语义匹配标签，之后执行步骤809。

步骤809、终端发送语义匹配标签给服务器，之后执行步骤810。

步骤810、服务器将语义匹配信息与音频库中的每个音频内容的音频属性进行匹配，获得语义匹配信息与音频库中的每个音频内容的匹配度，之后执行步骤811。

步骤811、服务器将匹配度最高的音频内容，确定为推荐音频，之后执行步骤812。

步骤812、服务器根据推荐音频，生成音频推荐信息，之后执行步骤813。

步骤813、服务器发送音频推荐信息给终端，之后执行步骤814。

步骤814、终端在文本内容的呈现期间内播放音频推荐信息所表征的音频内容。

图9是根据一示意性实施例示出的一种音频播放及处理方法的应用场景流程图，参见图9所示，该音频播放及处理方法根据上述实施例的音频播放方法和音频播放的处理方法实现，该音频播放及处理方法应用于计算机设备，该音频播放方法和音频播放的处理方法由终端和服务器共同完成，下面以计算机设备为终端和服务器为例进行说明。

步骤901、监控文本呈现触发事件，并在监控到文本呈现触发事件的情况下，执行步骤902。

步骤902、判断是否有历史浏览数据的记录，若是则执行步骤903，否则执行步骤904。

步骤903、询问是否需要根据历史文本内容浏览记录进行音频信息推荐，如果反馈的为是则执行步骤906，否则执行步骤904。

步骤904、对当前呈现的文本内容进行语义识别，之后执行步骤905。

步骤905、得到当前语义标签并确定为语义匹配标签，之后执行步骤908。

步骤906、获取历史语义标签以及各条历史语义标签所对应的权重，之后执行步骤907。

步骤907、根据历史语义标签各自的权重，整合历史语义标签，得到语义匹配标签，之后执行步骤908。

步骤908、将语义匹配标签与音频库中的每个音频内容的音频属性进行匹配，得到用于表征匹配度最高的音频内容的音频推荐信息，之后执行步骤909。

步骤909、在文本内容的呈现期间内播放音频推荐信息所表征的音频内容。

图10是根据一示意性实施例示出的一种音频播放装置的逻辑结构框图，参见图10所示，该装置包括语义信息确定模块1001、匹配信息确定模块1002、音频推荐信息获取模块1003和音频播放模块1004。

语义信息确定模块1001，被配置为执行响应于文本内容的呈现事件，确定与所呈现的文本内容关联的当前语义信息；

匹配信息确定模块1002，被配置为执行确定关联于所呈现的文本内容的语义匹配信息；

音频推荐信息获取模块1003，被配置为执行获取音频推荐信息，其中，音频推荐信息用于表征音频库中与语义匹配信息的匹配度最高的音频内容；

音频播放模块1004，被配置为执行在文本内容的呈现期间内播放音频内容。

本公开实施例的音频播放装置，根据所呈现的文本内容得到相关联的当前语义信息，进而根据当前语义信息得到语义匹配信息，使得语义匹配信息与所呈现的文本内容相关联，在此基础上，将语义匹配信息与音频库中的音频内容进行匹配以获得匹配度最高的音频内容音频推荐信息，并在文本内容的呈现期间播放所获得的音频内容，由于音频内容与语义匹配信息的匹配度最高，并且语义匹配信息与所呈现的文本内容相关联，进而音频内容与所呈现的文本内容具有较高的匹配度，使得在呈现的文本内容期间播放的音频内容能够辅助引导阅读文本内容的用户沉浸于所阅读的文本内容之中，从而提升了对文本内容阅读过程中的阅读体验，在用户阅读文章时实现了个性化的音乐推荐，极大地提升了浏览体验。

在一些实施例中，该语义信息确定模块1001进一步被配置为执行：

根据文本内容，获得与所呈现的文本内容关联的当前语义标签，其中，当前语义标签用于表征当前语义信息。

在一些实施例中，该匹配信息确定模块1002进一步被配置为执行：

若存在历史语义信息，则：

对所呈现的文本内容进行语义识别，得到当前语义信息。

在一些实施例中，关联于历史文本内容浏览记录的历史语义信息存储于呈现文本内容的设备本地。

关于上述实施例中的音频播放装置，其中各个单元执行操作的具体方式已经在有关该音频播放方法的实施例中进行了详细描述，此处将不作详细阐述说明。

需要说明的是：上述实施例仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

图11是根据一示意性实施例示出的一种音频播放的处理装置的逻辑结构框图，参见图11所示，该装置包括匹配信息获取模块1101和音频推荐信息确定模块1102。

匹配信息获取模块1101，被配置为执行获取语义匹配信息，语义匹配信息是响应于文本内容的呈现事件而确定的关联于所呈现的文本内容的语义匹配信息；

音频推荐信息确定模块1102，被配置为执行根据语义匹配信息，确定音频推荐信息，音频推荐信息用于表征音频库中与语义匹配信息的匹配度最高的音频内容；

其中，音频内容用于在文本内容的呈现期间内播放。

本公开实施例的音频播放的处理装置，将关联于所呈现的文本内容的语义匹配信息与音频库中的音频内容进行匹配以获得匹配度最高的音频内容音频推荐信息，并在文本内容的呈现期间播放所获得的音频内容，由于音频内容与语义匹配信息的匹配度最高，并且语义匹配信息与所呈现的文本内容相关联，进而音频内容与所呈现的文本内容具有较高的匹配度，使得在呈现的文本内容期间播放的音频内容能够辅助引导阅读文本内容的用户沉浸于所阅读的文本内容之中，从而提升了对文本内容阅读过程中的阅读体验，在用户阅读文章时实现了个性化的音乐推荐，极大地提升了浏览体验。

在一些实施例中，基于图11的装置组成，该音频推荐信息确定模块1102包括：

匹配度获取子模块，被配置为执行将语义匹配信息与音频库中的每个音频内容的音频属性进行匹配，获得语义匹配信息与音频库中的每个音频内容的匹配度；

推荐音频获取子模块，被配置为执行将匹配度最高的音频内容，确定为推荐音频；

推荐信息生成子模块，被配置为执行根据推荐音频，生成音频推荐信息。

在一些实施例中，该匹配度获取子模块进一步被配置为执行：

关于上述实施例中的音频播放的处理装置，其中各个单元执行操作的具体方式已经在有关该音频播放的处理方法的实施例中进行了详细描述，此处将不作详细阐述说明。

图12示出了本公开一个示意性实施例提供的一种终端的结构框图，该终端也即是计算机设备的一种示例性说明。该终端1200可以是：智能手机、平板电脑、MP3播放器(MovingPicture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1200还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端1200包括有：处理器1201和存储器1202。

处理器1201可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1201可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1201也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(CentralProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1201可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1201还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1202可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1202还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。

在一些实施例中，存储器1202中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器1201所执行以实现本公开中各个实施例提供的音频播放方法。

在一些实施例中，终端1200还可选包括有：外围设备接口1203和至少一个外围设备。处理器1201、存储器1202和外围设备接口1203之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1203相连。具体地，外围设备包括：射频电路1204、触摸显示屏1205、摄像头组件1206、音频电路1207、定位组件1208和电源1209中的至少一种。

外围设备接口1203可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器1201和存储器1202。在一些实施例中，处理器1201、存储器1202和外围设备接口1203被集成在同一芯片或电路板上；在一些其他实施例中，处理器1201、存储器1202和外围设备接口1203中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路1204用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路1204通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1204将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1204包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1204可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路1204还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本公开对此不加以限定。

显示屏1205用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1205是触摸显示屏时，显示屏1205还具有采集在显示屏1205的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1201进行处理。此时，显示屏1205还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1205可以为一个，设置终端1200的前面板；在另一些实施例中，显示屏1205可以为至少两个，分别设置在终端1200的不同表面或呈折叠设计；在再一些实施例中，显示屏1205可以是柔性显示屏，设置在终端1200的弯曲表面上或折叠面上。甚至，显示屏1205还可以设置成非矩形的不规则图形，也即异形屏。显示屏1205可以采用LCD(LiquidCrystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode，有机发光二极管)等材质制备。

摄像头组件1206用于采集图像或视频。可选地，摄像头组件1206包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件1206还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路1207可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1201进行处理，或者输入至射频电路1204以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端1200的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1201或射频电路1204的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1207还可以包括耳机插孔。

定位组件1208用于定位终端1200的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件1208可以是基于美国的GPS(GlobalPositioning System，全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。

电源1209用于为终端1200中的各个组件进行供电。电源1209可以是交流电、直流电、一次性电池或可充电电池。当电源1209包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端1200还包括有一个或多个传感器1210。该一个或多个传感器1210包括但不限于：加速度传感器1211、陀螺仪传感器1212、压力传感器1213、指纹传感器1214、光学传感器1215以及接近传感器1216。

加速度传感器1211可以检测以终端1200建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器1211可以用于检测重力加速度在三个坐标轴上的分量。处理器1201可以根据加速度传感器1211采集的重力加速度信号，控制触摸显示屏1205以横向视图或纵向视图进行用户界面的显示。加速度传感器1211还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器1212可以检测终端1200的机体方向及转动角度，陀螺仪传感器1212可以与加速度传感器1211协同采集用户对终端1200的3D动作。处理器1201根据陀螺仪传感器1212采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器1213可以设置在终端1200的侧边框和/或触摸显示屏1205的下层。当压力传感器1213设置在终端1200的侧边框时，可以检测用户对终端1200的握持信号，由处理器1201根据压力传感器1213采集的握持信号进行左右手识别或快捷操作。当压力传感器1213设置在触摸显示屏1205的下层时，由处理器1201根据用户对触摸显示屏1205的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器1214用于采集用户的指纹，由处理器1201根据指纹传感器1214采集到的指纹识别用户的身份，或者，由指纹传感器1214根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器1201授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1214可以被设置终端1200的正面、背面或侧面。当终端1200上设置有物理按键或厂商Logo时，指纹传感器1214可以与物理按键或厂商Logo集成在一起。

光学传感器1215用于采集环境光强度。在一个实施例中，处理器1201可以根据光学传感器1215采集的环境光强度，控制触摸显示屏1205的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏1205的显示亮度；当环境光强度较低时，调低触摸显示屏1205的显示亮度。在另一个实施例中，处理器1201还可以根据光学传感器1215采集的环境光强度，动态调整摄像头组件1206的拍摄参数。

接近传感器1216，也称距离传感器，通常设置在终端1200的前面板。接近传感器1216用于采集用户与终端1200的正面之间的距离。在一个实施例中，当接近传感器1216检测到用户与终端1200的正面之间的距离逐渐变小时，由处理器1201控制触摸显示屏1205从亮屏状态切换为息屏状态；当接近传感器1216检测到用户与终端1200的正面之间的距离逐渐变大时，由处理器1201控制触摸显示屏1205从息屏状态切换为亮屏状态。

本领域技术人员可以理解，上述的结构并不构成对终端1200的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

图13是本公开实施例提供的一种电子设备的结构示意图。在一些实施例中，该电子设备为服务器。该电子设备1300可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(Central Processing Units，CPU)1301和一个或一个以上的存储器1302，其中，该存储器1302中存储有至少一条程序代码，该至少一条程序代码由该处理器1301加载并执行以实现上述各个实施例提供的音频播放的处理方法。当然，该电子设备1300还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该电子设备1300还可以包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种包括至少一条指令的计算机可读存储介质，例如包括至少一条指令的存储器，上述至少一条指令可由计算机设备中的处理器执行以完成上述实施例中的音频播放方法和/或音频播放的处理方法。

可选地，上述计算机可读存储介质可以是非临时性计算机可读存储介质，例如，该非临时性计算机可读存储介质可以包括ROM(Read-Only Memory，只读存储器)、RAM(Random-Access Memory，随机存取存储器)、CD-ROM(Compact Disc Read-Only Memory，只读光盘)、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品，包括一条或多条指令，该一条或多条指令可以由计算机设备的处理器执行，以完成上述各个实施例提供的音频播放方法和/或音频播放的处理方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种音频播放方法，其特征在于，包括：

确定关联于所呈现的所述文本内容的语义匹配信息；

在所述文本内容的呈现期间内播放所述音频内容；

其中，所述确定关联于所述文本内容的语义匹配信息，包括：

若存在关联于历史文本内容浏览记录的历史语义信息，则：响应于与历史文本内容浏览记录关联的音频播放触发事件，根据所述历史语义信息，确定所述语义匹配信息。

2.根据权利要求1所述的音频播放方法，其特征在于，所述确定与所呈现的所述文本内容关联的当前语义信息，包括：

3.根据权利要求1所述的音频播放方法，其特征在于，所述确定关联于所述文本内容的语义匹配信息，还包括：

若不存在所述历史语义信息，则，将所述当前语义信息确定为所述语义匹配信息；

若存在所述历史语义信息，则：

响应于不与历史文本内容浏览记录关联的音频播放触发事件，将所述当前语义信息确定为所述语义匹配信息。

4.根据权利要求3所述的音频播放方法，其特征在于，所述根据所述历史语义信息，确定所述语义匹配信息，包括：

5.根据权利要求4所述的音频播放方法，其特征在于：

所述权重包括分别关联于每一条所述历史语义信息的：文本内容呈现时长分值、评论分值、互动分值中的至少之一。

6.根据权利要求1所述的音频播放方法，其特征在于，所述确定与所呈现的所述文本内容关联的当前语义信息，包括：

7.根据权利要求3所述的音频播放方法，其特征在于：

所述关联于历史文本内容浏览记录的历史语义信息存储于呈现所述文本内容的设备本地。

8.一种音频播放的处理方法，其特征在于，包括：

其中，所述音频内容用于在所述文本内容的呈现期间内播放；

其中，确定关联于所述文本内容的语义匹配信息，包括：

9.根据权利要求8所述的音频播放的处理方法，其特征在于，所述根据所述语义匹配信息，确定音频推荐信息，包括：

将所述匹配度最高的音频内容，确定为推荐音频；

根据所述推荐音频，生成所述音频推荐信息。

10.根据权利要求9所述的音频播放的处理方法，其特征在于，所述将所述语义匹配信息与所述音频库中的每个音频内容的音频属性进行匹配，获得所述语义匹配信息与所述音频库中的每个音频内容的匹配度，包括：

11.一种音频播放装置，其特征在于，包括：

音频播放模块，被配置为执行在所述文本内容的呈现期间内播放所述音频内容；

其中，所述匹配信息确定模块进一步被配置为执行：

12.根据权利要求11所述的音频播放装置，其特征在于，所述语义信息确定模块进一步被配置为执行：

13.根据权利要求11所述的音频播放装置，其特征在于，所述匹配信息确定模块进一步被配置为执行：

若存在所述历史语义信息，则：

14.根据权利要求13所述的音频播放装置，其特征在于，所述匹配信息确定模块进一步被配置为执行：

15.根据权利要求14所述的音频播放装置，其特征在于：

16.根据权利要求11所述的音频播放装置，其特征在于，所述语义信息确定模块进一步被配置为执行：

17.根据权利要求13所述的音频播放装置，其特征在于：

18.一种音频播放的处理装置，其特征在于，包括：

其中，确定关联于所述文本内容的语义匹配信息，包括：

19.根据权利要求18所述的音频播放的处理装置，其特征在于，所述音频推荐信息确定模块包括：

20.根据权利要求19所述的音频播放的处理装置，其特征在于，所述匹配度获取子模块进一步被配置为执行：

21.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器的可执行指令的存储器；

其中，所述处理器被配置为执行所述可执行指令，以实现如权利要求1至7任一项所述的音频播放方法和/或如权利要求8至10任一项所述的音频播放的处理方法。

22.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的至少一条指令被电子设备的处理器执行时，使得所述电子设备能够实现如权利要求1至7任一项所述的音频播放方法和/或如权利要求8至10任一项所述的音频播放的处理方法。