CN113450762B

CN113450762B - 文字朗读方法、装置、终端及存储介质

Info

Publication number: CN113450762B
Application number: CN202110697342.3A
Authority: CN
Inventors: 刘德幸
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2021-06-23
Filing date: 2021-06-23
Publication date: 2024-05-14
Anticipated expiration: 2041-06-23
Also published as: CN113450762A

Abstract

本申请涉及计算机技术领域，尤其涉及一种文字朗读方法、装置、终端及存储介质。其中，一种文字朗读方法，包括：获取当前屏幕中的多媒体信息，采用无障碍服务获取所述多媒体信息对应的无障碍节点；遍历所述无障碍节点所在的节点树，获取所述节点树中与所述无障碍节点相关联的所有文字节点；基于文字属性对所述所有文字节点进行优先级排序，将优先级最高的文字节点确定为目标节点；获取所述目标节点对应的第一文字信息，获取第一文字信息对应的第一语音信息，播放所述第一语音信息。采用本申请，可以提高文字朗读的准确性和文字朗读体验。

Description

文字朗读方法、装置、终端及存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种文字朗读方法、装置、终端及存储介质。

背景技术

随着科学技术的发展，终端的发展也越来越迅速，因此提高用户使用终端的便利性成为用户关注的焦点。其中，朗读功能的出现极大地方便了用户的生活。朗读功能的出现可以帮助用户更高的操作。例如，用户在双手被占用时，用户可以开启终端的朗读功能。终端例如可以朗读新闻资讯。

发明内容

本申请实施例提供了一种文字朗读方法、装置、终端及存储介质，可以提高文字朗读的准确性和文字朗读体验。本申请实施例的技术方案如下：

第一方面，本申请实施例提供了一种文字朗读方法，所述方法包括：

获取当前屏幕中的多媒体信息，采用无障碍服务获取所述多媒体信息对应的无障碍节点；

遍历所述无障碍节点所在的节点树，获取所述节点树中与所述无障碍节点相关联的所有文字节点；

基于文字属性对所述所有文字节点进行优先级排序，将优先级最高的文字节点确定为目标节点；

获取所述目标节点对应的第一文字信息，获取第一文字信息对应的第一语音信息，播放所述第一语音信息。

第二方面，本申请实施例提供了一种文字朗读装置，所述装置包括：

信息获取单元，用于获取当前屏幕中的多媒体信息，采用无障碍服务获取所述多媒体信息对应的无障碍节点；

节点获取单元，用于遍历所述无障碍节点所在的节点树，获取所述节点树中与所述无障碍节点相关联的所有文字节点；

节点确定单元，用于基于文字属性对所述所有文字节点进行优先级排序，将优先级最高的文字节点确定为目标节点；

信息播放单元，用于获取所述目标节点对应的第一文字信息，获取第一文字信息对应的第一语音信息，播放所述第一语音信息。

第三方面，本申请实施例提供一种终端，可包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行上述的方法步骤。

第四方面，本申请实施例提供一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行上述的方法步骤。

本申请一些实施例提供的技术方案带来的有益效果至少包括：

在本申请一个或者多个实施例中，通过获取当前屏幕中的多媒体信息，采用无障碍服务获取多媒体信息对应的无障碍节点，遍历无障碍节点所在的节点树，获取节点树中与无障碍节点相关联的所有文字节点，基于文字属性对所有文字节点进行优先级排序，将优先级最高的文字节点确定为目标节点，获取目标节点对应的第一文字信息，获取第一文字信息对应的第一语音信息，播放第一语音信息。由于终端基于无障碍服务可以获取到目标节点对应的第一文字信息，无需获取图像信息，可以减少内存占用，并且基于文字信息获取语音信息，可以减少语音信息获取的时长，提高语音信息获取的准确性，进而可以提高文字朗读的准确性和文字朗读体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出本申请实施例提供的一种文字朗读方法的背景示意图；

图2示出本申请实施例提供的一种文字朗读方法的系统架构图；

图3示出本申请实施例提供的一种文字朗读方法的流程示意图；

图4示出本申请实施例提供的一种节点树的举例示意图；

图5示出本申请实施例提供的一种文字朗读方法的流程示意图；

图6示出本申请实施例提供的一种终端当前屏幕的举例示意图；

图7示出本申请实施例提供的一种节点树的举例示意图；

图8示出本申请实施例提供的一种文字朗读方法的流程示意图；

图9示出本申请实施例提供的一种终端当前屏幕的举例示意图；

图10示出本申请实施例提供的一种终端界面的举例示意图；

图11示出本申请实施例提供的一种文字朗读方法的流程示意图；

图12示出本申请实施例提供的一种文字朗读方法的流程时序图；

图13示出本申请实施例提供的一种文字朗读装置的结构示意图；

图14示出本申请实施例提供的一种文字朗读装置的结构示意图；

图15示出本申请实施例提供的一种文字朗读装置的结构示意图；

图16示出本申请实施例提供的一种文字朗读装置的结构示意图；

图17示出本申请实施例提供的一种文字朗读装置的结构示意图；

图18是本申请实施例提供的一种终端的结构示意图；

图19是本申请实施例提供的操作系统和用户空间的结构示意图；

图20是图18中安卓操作系统的架构图；

图21是图18中IOS操作系统的架构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在本申请的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。在本申请的描述中，需要说明的是，除非另有明确的规定和限定，“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本申请中的具体含义。此外，在本申请的描述中，除非另有说明，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

随着科学技术的发展，终端支持的功能越来越多，极大地方便了用户的生活。例如终端可以支持朗读功能，朗读功能成为资讯场景下重要的阅读辅助手段。图1示出本申请实施例提供的一种文字朗读方法的背景示意图。如图1所示，例如终端1开启朗读功能后，终端1可以采用光学识别方式(Optical Character Recognition，OCR)识别文字信息，然后输出该文字信息对应的语音信息。

可选的，图2示出本申请实施例提供的一种文字朗读方法的系统架构图。如图2所示，文字朗读装置包括但不限于终端10和可穿戴设备11。例如终端10可以获取用户输入的朗读指令。当终端获取到朗读指令时，终端10可以采用OCR识别方式对文字进行拍照或者截图，获取到文字对应的图像信息。当终端采用在线方式获取语音信息时，终端需要将文字对应的图像信息经网络12发送至服务器13，由于OCR识别方式发送图像信息，需要占用较大内存，并且图像传输速度较慢，出现文字朗读的时间较长的问题。

下面结合具体的实施例对本申请进行详细说明。

在一个实施例中，如图3所示，提出了一种文字朗读方法，该方法可依赖于计算机程序实现，可运行于包括文字朗读功能的装置上。该计算机程序可集成在应用中，也可作为独立的工具类应用运行。

其中，所述文字朗读装置可以是具有无障碍服务功能的第一终端，该第一终端包括但不限于：可穿戴设备、手持设备、个人电脑、平板电脑、车载设备、智能手机、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中终端设备可以叫做不同的名称，例如：用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personal digital assistant，PDA)、5G网络或未来演进网络中的终端设备等。

具体的，该文字朗读方法包括：

S101，获取当前屏幕中的多媒体信息，采用无障碍服务获取多媒体信息对应的无障碍节点；

根据一些实施例，屏幕是终端中用于显示信息及色彩的器件。当前屏幕是指在执行文字朗读操作时终端的显示屏幕。该当前屏幕并不特指某一固定屏幕。当触发文字朗读的屏幕发生变化时，该当前屏幕也会相应变化。

易于理解的是，多媒体(Multimedia)是多种媒体的综合，多媒体的形式包括但不限于文本、声音和图像等多种媒体形式。本申请实施例的多媒体信息包括但不限于音频信息、视频信息、文档信息和图片信息等。

可选的，无障碍服务(Accessibility Service)是一套可以模拟操作的系统级别的应用程序接口(Application Programming Interface，API)。无障碍服务可以进行模拟操作以控制终端，以便帮助身体不便或者操作不灵活的人来辅助操作终端。无障碍节点是指与多媒体信息对应的节点。无障碍节点的数量为至少一个。

根据一些实施例，当终端在进行文字朗读操作时，终端可以获取当前屏幕中的多媒体信息。若终端获取到当前屏幕的多媒体信息，则终端可以采用无障碍服务获取多媒体信息对应的无障碍节点。

S102，遍历无障碍节点所在的节点树，获取节点树中与无障碍节点相关联的所有文字节点；

根据一些实施例，节点树是一种数据结构，节点树是由n个无障碍节点组合的具有层次关系的集合。其中，n为大于等于1的自然数。本申请实施例节点树中的n个无障碍节点是指终端中所有显示界面的多媒体信息对应的无障碍节点。图4示出本申请实施例提供的一种节点树的举例示意图。如图4所示，每个无障碍及节点包括零个或者多个子节点，没有父节点的节点叫做根节点，每个非根节点有且只有一个父节点。每个无障碍节点具有属性。该属性是与无障碍节点对应的属性。例如无障碍节点为文字节点时，该文字节点具有的属性为文字属性。当无障碍节点为视频节点时，该视频节点具有的属性为视频属性。

易于理解的是，文字节点只是仅包括文字信息的节点，所有文字节点是指与无障碍节点相关联的文字节点。所有文字节点并不特指固定的文字节点。当终端获取到的当前屏幕发生变化时，终端获取到的多媒体信息对应的无障碍节点也会相应变化，终端获取到的与无障碍节点相关联的所有文字节点也会相应变化。

根据一些实施例，当终端获取到当前屏幕中的多媒体信息，并采用无障碍服务获取多媒体信息对应的无障碍节点时，终端可以遍历无障碍节点所在的节点树。终端遍历的节点树是无障碍节点所在的节点树。终端遍历完成无障碍节点所在的节点树，终端可以获取节点树中与无障碍节点相关联的所有文字节点。所有的文字节点的数量为至少一个。

S103，基于文字属性对所有文字节点进行优先级排序，将优先级最高的文字节点确定为目标节点；

根据一些实施例，属性用于表示一个事物的性质与关系。文字属性用于表示文字本身的性质与关系。文字属性并不特指某一种文字属性。本申请实施例的文字属性可以是文字属性中的一种或者多种。

易于理解的是，优先级是用于表示所有文字节点优先等级的参数。每个文字节点对应一个优先级参数。每个文字节点对应的优先级参数并不特指某一固定参数。当文字属性发生变化时，每个文字对应的优先级参数也会相应变化。

可选的，优先级排序是终端基于文字属性对所有文字节点进行排序。该优先级排序并不特指某一固定排序。当文字属性发生变化时，该优先级排序也会相应变化。当无障碍节点相关联的所有文字节点发生变化时，该优先级排序也会相应变化。

根据一些实施例，目标节点是指所有文字节点中优先级最高的文字节点。该目标节点并不特指某一固定文字节点。当文字属性发生变化时，该优先级排序也会相应变化，即优先级最高的文字节点也会相应变化，也就是说目标节点也会相应变化。

根据一些实施例，当终端获取到当前屏幕中的多媒体信息，并采用无障碍服务获取多媒体信息对应的无障碍节点时，终端可以遍历无障碍节点所在的节点树。终端遍历的节点树是无障碍节点所在的节点树。终端遍历完成无障碍节点所在的节点树，终端可以获取节点树中与无障碍节点相关联的所有文字节点。终端可以基于文字属性对所有文字节点进行优先级排序。当终端对所有文字节点的优先级排序完成时，终端可以将优先级最高的文字节点确定为目标节点。

S104，获取目标节点对应的第一文字信息，获取第一文字信息对应的第一语音信息，播放第一语音信息。

根据一些实施例，由于目标节点为所有文字节点中优先级最高的节点，文字节点为包括文字信息的节点，因此目标节点包括第一文字信息。第一文字信息仅仅是指与目标节点对应的文字信息。该第一文字信息并不也指某一固定文字信息。当目标节点发生变化时，该目标节点对应的第一文字信息也会相应变化。

易于理解的是，第一语音信息是与第一文字信息对应的语音信息。该第一语音信息并不也指某一固定语音信息。当目标节点发生变化时，该目标节点对应的第一文字信息也会相应变化，第一文字信息对应的第一语音信息也会相应变化。

根据一些实施例，当终端获取到节点树中与无障碍节点相关联的所有文字节点时，终端可以基于文字属性对所有文字节点进行优先级排序。当终端对所有文字节点的优先级排序完成时，终端可以将优先级最高的文字节点确定为目标节点。终端可以获取该目标节点对应的第一文字信息。当终端获取到第一文字信息时，终端可以获取该第一文字信息对应的第一语音信息。当终端获取到第一语音信息时，终端可以播放该第一语音信息。

请参见图5，图5示出本申请实施例提供的一种文字朗读方法的流程示意图。具体的：

S201，获取当前屏幕中的多媒体信息，采用无障碍服务获取多媒体信息对应的无障碍节点；

具体过程如上所述，此处不再赘述。

根据一些实施例，图6示出本申请实施例提供的一种终端当前屏幕的举例示意图。如图6所示，终端获取到当前屏幕中的多媒体信息例如可以是A文档的第五段文字。终端采用无障碍服务获取该A文档的第五段文字对应的无障碍节点例如可以是Q1节点。

易于理解的是，本申请实施例的技术方案不仅可以应用于网页场景，还可以应用于其他场景，其他场景包括但不限于图片识别场景、视频保存场景、文字朗读场景。

可选的，终端在获取当前屏幕中的多媒体信息之前，终端可以接收针对文字朗读申请无障碍权限。当终端接收到针对无障碍权限的确定指令时，终端可以获取到文字朗读指令。终端可以基于该文字朗读指令获取当前屏幕中的多媒体信息。

根据一些实施例，终端响应触发文字朗读的触发操作，获取触发操作在屏幕上的触发位置，以从触发位置上的确定多媒体信息。该触发位置例如可以是用户在终端屏幕上触发文字朗读操作时用户手指在当前屏幕的接触位置，还可以是终端基于预先位置设置指令设置的预设位置。当终端获取到该触发位置时，终端可以获取该触发位置对应的多媒体信息，并将该多媒体信息确定为终端获取到的当前屏幕中的多媒体信息。

易于理解的是，当终端的当前屏幕中显示的多媒体信息例如有文档标题、文档第一段、文档第二段和文档第一张附图，且终端获取到文字朗读触发操作时，终端可以获取该触发操作对应的触发位置，并获取该触发位置对应的多媒体信息。终端获取到触发位置对应的多媒体信息例如可以是文档第一段。

S202，遍历无障碍节点所在的节点树，获取节点树中与无障碍节点相关的所有节点；

根据一些实施例，当终端采用无障碍服务获取到多媒体信息对应的无障碍节点时，终端可以获取无障碍节点所在的节点树，该节点树例如可以是View Tree。终端获取到无障碍节点所在的节点树时，终端可以遍历无障碍节点所在的节点树。终端遍历无障碍节点所在的节点树的顺序包括但不限于先向下遍历后向上遍历、先向上遍历后向下遍历、同时向下遍历和向上遍历等。向下遍历即终端从该无障碍节点开始向该无障碍节点的子节点方向进行遍历。向上遍历即终端从该无障碍节点开始向该无障碍节点的父节点方向进行遍历。

可选的，当终端获取到当前屏幕上触发文字朗读的触发位置，且获取到该触发位置对应的多媒体信息时，终端可以采用无障碍服务获取多媒体信息对应的无障碍节点。当终端获取到该无障碍节点时，终端可以遍历该无障碍节点所在的节点树，获取节点树中与该无障碍节点相关的所有节点。例如，终端可以获取无障碍节点所在的节点树，并以该无障碍节点为起点，先向下遍历后向上遍历该节点树，获取节点树中与无障碍节点相关的所有节点。

易于理解的是，当终端遍历完成无障碍节点所在的节点树时，终端可以获取节点树中与无障碍节点相关的所有节点。

可选的，终端获取到当前屏幕中的多媒体信息例如可以是A文档的第五段文字。终端采用无障碍服务获取该A文档的第五段文字对应的无障碍节点例如可以是Q1节点。终端遍历Q1节点所在的节点树，获取节点树中与Q1节点相关的所有节点例如可以是Q2节点、Q3节点、Q4节点、Q5节点、Q6节点、Q7节点、Q8节点、Q9节点和Q10节点。

S203，基于节点属性信息对所有节点进行筛选，得到无障碍节点相关联的所有文字节点；

根据一些实施例，节点属性用于表示节点本身的性质与关系。节点属性信息是用于对所有节点进行筛选的属性信息。该节点属性信息并不特指某一固定属性信息。例如终端接收到针对节点属性信息的修改指令时，终端可以基于该修改指令修改该节点属性信息。该节点属性信息包括但不限于节点名称、资源类别信息、层级信息等等。

易于理解的是，当终端获取到节点属性信息时，终端可以基于节点属性信息对所有节点进行筛选，终端可以得到无障碍节点相关联的所有文字节点。

根据一些实施例，终端获取的节点属性信息例如可以是节点名称。终端基于节点属性信息对所有节点进行筛选时，终端可以获取所有节点的节点名称。终端获取到所有节点的节点名称时，终端可以判断该节点名称是否属于目标名称。终端可以将节点名称属于目标名称的节点确定为无障碍节点相关联的所有文字节点。终端基于节点名称获取所有文字节点，无需与服务器进行通信，即可直接对节点名称进行判断获取到所有文字节点，可以减少文字节点的获取步骤，可以提高文字朗读的效率。

易于理解的是，终端遍历Q1节点所在的节点树，获取节点树中与Q1节点相关的所有节点例如可以是Q2节点、Q3节点、Q4节点、Q5节点、Q6节点、Q7节点、Q8节点、Q9节点和Q10节点。其中Q2节点的节点名称例如可以是A文档的第六段文字、Q3节点的节点名称例如可以是A文档的第一个插图、Q4节点的节点名称例如可以是A文档的第四段文字、Q5节点的节点名称例如可以是A文档的第二个插图、Q6节点的节点名称例如可以是A文档的第七段文字、Q7节点的节点名称例如可以是A文档的第八段文字、Q8节点的节点名称例如可以是A文档的第九段文字、Q9节点的节点名称例如可以是A文档的第三段文字和Q10节点的节点名称例如可以是A文档的第三个插图。

可选的，目标名称例如可以是包括“文字”的名称。终端获取到所有节点的节点名称，将节点名称属于目标名称的节点确定为无障碍节点相关联的所有文字节点例如可以是Q2节点、Q4节点、Q6节点、Q7节点、Q8节点和Q9节点。

根据一些实施例，终端获取的节点属性信息例如可以是资源类别信息。终端基于节点属性信息对所有节点进行筛选时，终端可以获取所有节点的资源类别信息。终端获取到所有节点的资源类别信息时，终端可以将资源类别信息为文字类型的节点确定为所有文字节点。终端无需与服务器进行通信，直接基于节点的资源类别信息即可获取到所有文字节点，可以减少文字节点的获取步骤，可以提高文字朗读的效率。

易于理解的是，当终端生成节点树时，终端可以设置每个节点的资源类别信息。该资源类别信息包括但不限于文字类型、视频类型、音频类型、图像类型等等。

可选的，终端遍历Q1节点所在的节点树，获取节点树中与Q1节点相关的所有节点例如可以是Q2节点、Q3节点、Q4节点、Q5节点、Q6节点、Q7节点、Q8节点、Q9节点和Q10节点。其中Q2节点的资源类别信息例如可以是文字类型、Q3节点的资源类别信息例如可以是图像类型、Q4节点的资源类别信息例如可以是文字类型、Q5节点的资源类别信息例如可以是图像类型、Q6节点的资源类别信息例如可以是文字类型、Q7节点的资源类别信息例如可以是文字类型、Q8节点的资源类别信息例如可以是文字类型、Q9节点的资源类别信息例如可以是文字类型和Q10节点的资源类别信息例如可以是图像类型。

可选的，终端获取到所有节点的资源类别信息，将资源类别信息为文字类型的节点确定为所有文字节点例如可以是Q2节点、Q4节点、Q6节点、Q7节点、Q8节点和Q9节点。

根据一些实施例，终端基于节点属性信息对所有节点进行筛选，得到无障碍节点相关联的所有文字节点时，终端可以获取所有节点的层级信息。其中，终端生成节点树时，终端可以设置每个节点的层级信息。层级信息包括但不限于层级数、层级类别信息等等。

易于理解的是，终端到所有节点的层级信息时，终端可以判断该层级信息是否指示节点为父文字节点。若层级信息指示节点为父文字节点，则终端可以获取父文字节点对应的子文字节点。当终端获取到父文字节点和该父文字节点对应的子文字节点时，终端可以将父文字节点和子文字节点确定为无障碍节点相关联的所有文字节点。终端无需与服务器进行通信，直接基于节点的层级信息即可获取到所有文字节点，可以减少文字节点的获取步骤，可以提高文字朗读的效率。其次，也无需对文字进行拍照和截图，可以减少终端获取文字节点所占的内存，减少图像识别导致的文字获取不准确的情况，可以在减少文字节点的获取时长的同时提高文字获取的准确性。

可选的，终端遍历Q1节点所在的节点树，获取节点树中与Q1节点相关的所有节点例如可以是Q2节点、Q3节点、Q4节点、Q5节点、Q6节点、Q7节点、Q8节点、Q9节点和Q10节点。如图6所示，其中，Q2节点的层级信息例如可以是父文字节点、Q3节点的层级信息例如可以是父视频节点、Q4节点的层级信息例如可以是父文字节点、Q5节点的层级信息例如可以是父音频节点、和Q10节点的层级信息例如可以是父图像节点。终端获取到的父文字节点例如可以是Q2节点和Q4节点。终端获取到的Q2节点的子文字节点例如可以是Q6节点和Q7节点，终端获取到的Q4节点的子文字节点例如可以是Q8节点和Q9节点。终端将父文字节点和子文字节点确定为无障碍节点相关联的所有文字节点例如可以是Q2节点、Q4节点、Q6节点、Q7节点、Q8节点和Q9节点。

S204，基于文字属性对所有文字节点进行优先级排序，将优先级最高的文字节点确定为目标节点：

具体过程如上所述，此处不再赘述。

根据一些实施例，终端确定目标节点时，终端可以获取所有文字节点的文字节点展示信息和文字节点内容属性。文字节点展示信息用于表示文字节点在节点树中的展示信息，该展示信息包括但不限于展示位置信息、展示层级信息、展示距离信息等等。该展示距离信息例如可以表示节点树中各个文字节点与无障碍节点的距离。文字节点内容属性用于表示文字节点的属性信息。该文字节点内容属性包括但不限于标题文字属性、文档文字属性、评论文字属性、批注文字属性等等。

易于理解的是，当终端获取到所有文字节点的文字节点展示信息和文字节点内容属性时，终端可以基于文字节点展示信息，对所有文字节点进行第一优先级排序，获取所有文字节点中的初始节点。初始节点为终端对所有文字节点进行第一优先级排序之后获取到的节点。该初始节点可以是第一优先级排序中预设数量的文字节点，还可以是优先级高于预设优先级的文字节点等等。终端对所有文字节点进行第一优先级排序，可以对不同位置的文字进行区分，减少不同段落的文字识别为一段的情况，提高文字识别的准确性，提高文字朗读的准确性。

可选的，当终端基于文字节点展示信息对所有的文字节点进行第一优先级排序，可以获取到所有文字节点中的初始节点时，终端可以基于文字节点内容属性，对初始节点进行第二优先级排序，并将第二优先级排序中优先级最高的文字节点确定为目标节点。

易于理解的是，当终端可以基于文字节点的文字节点内容属性，对初始节点进行第二优先级排序时，终端可以依据用户所触发的多媒体信息确定文字朗读场景。当终端获取到文字朗读场景时，终端可以获取文字朗读场景对应的文字节点内容属性。当终端获取到文字节点内容属性时，终端可以对初始节点中与文字节点内容属性对应的节点进行第二优先级排序，将第二优先级排序中优先级最高的文字节点确定为目标节点。

可选的，终端依据用户所触发的多媒体信息确定文字朗读场景时，终端获取到的用户所处触发的多媒体信息例如可以是文档内容对应的文档信息。终端获取到的文字朗读场景即为文档内容场景。终端可以获取到文字朗读场景对应的文字节点内容属性为文档文字属性。终端可以基于文档文字属性对初始节点进行第二优先级排序，并将第二优先级排序中优先级最高的文字节点确定为目标节点。

易于理解的是，终端依据用户所触发的多媒体信息确定文字朗读场景时，终端获取到的用户所处触发的多媒体信息例如可以是评论内容对应的评论信息。终端获取到的文字朗读场景即为评论内容场景。终端可以获取到文字朗读场景对应的文字节点内容属性为评论文字属性。终端可以基于评论文字属性对初始节点进行第二优先级排序，并将第二优先级排序中优先级最高的文字节点确定为目标节点。

根据一些实施例，终端获取文字朗读场景和对所有文字节点进行第一优先级排序可以是同时进行的，也可以是先获取文字朗读场景后对所有文字节点进行第一优先级排序，还可以是先对所有文字节点进行第一优先级排序后获取文字朗读场景。

易于理解的是，文字节点展示信息例如可以是展示距离信息。该展示距离信息例如可以表示节点树中各个文字节点与无障碍节点的距离。当终端获取到所有文字节点的展示位置信息时，可以确定所有文字节点的展示距离信息，即终端可以获取所有文字节点与无障碍节点的展示距离信息。其中，展示距离信息越小，优先级越高。

可选的，图7示出本申请实施例提供的一种节点树的举例示意图。如图7所示，终端获取到的无障碍节点相关联的所有文字节点例如可以是Q2节点、Q4节点、Q6节点、Q7节点、Q8节点和Q9节点。基于展示位置信息，终端对所有文字节点按照优先级由高到低的顺序进行第一优先级排序，得到的第一排序结果例如可以是Q2节点、Q4节点、Q6节点、Q7节点、Q8节点和Q9节点。终端获取所有文字节点中的初始节点例如可以是Q2节点、Q4节点、Q6节点和Q7节点。终端获取文字朗读场景例如可以是文档内容朗读场景，即在文档内容朗读场景中终端不朗读文档标题。终端获取到文档内容朗读场景对应的文字节点内容属性为文档内容属性。终端可以对Q2节点、Q4节点、Q6节点和Q7节点进行第二优先级排序，将第二优先级排序中优先级最高的文字节点确定为目标节点，该目标节点例如可以是Q4节点。

S205，获取目标节点对应的第一文字信息，获取第一文字信息对应的第一语音信息；

具体过程如上所述，此处不再赘述。

根据一些实施例，终端获取到目标节点例如可以是Q4节点。当终端获取到Q4节点时，终端获取到Q4节点对应的第一文字信息例如可以是“金色的阳光如同美酒。树叶的颜色越发深沉了。在那漏进我的空旷地来的下午的温暖阳光中，山毛榉和菩提矗立在那儿，又是黄色的，又是褐色的，倒象有个看不见的画家，在我熟睡的当儿把它们变成了一个个火炬，在纹丝儿不动的阳光里纹丝儿不动地矗立着。没有一片树叶在飘拂。”终端可以获取第一文字信息对应的第一语音信息。

S206，采用神经网络模型对第一语音信息添加语音效果，得到第三语音信息；

根据一些实施例，当终端获取到第一语音信息时，终端可以直接播放第一语音信息。终端还可以采用对神经网络模型对第一语音信息添加语音效果。该语音效果包括但不限于语速效果、语调效果、音量效果、音色效果、背景音频效果、相位延时效果等。终端对第一语音信息添加语音效果可以得到第三语音信息，可以改善语音信息的播放生硬的情况，提高文字朗读时用户的使用体验。

易于理解的是，终端采用神经网络模型对第一语音信息添加音色效果可以得到第三语音信息。

S207，播放第三语音信息。

根据一些实施例，当终端采用神经网络模型对第一语音信息添加语音效果，得到第三语音信息时，终端可以播放第三语音信息。终端播放第三语音信息时，终端可以直接基于终端的扬声器播放该第三语音信息，还可以基于与终端连接的播放设备播放该语音信息。与终端连接的播放设备包括但不限于有线连接的播放设备和无线连接的播放设备等等。

在本申请一个或者多个实施例中，获取当前屏幕中的多媒体信息，采用无障碍服务获取多媒体信息对应的无障碍节点，可以遍历无障碍节点所在的节点树，获取节点树中与无障碍节点相关的所有节点，基于节点属性信息对所有节点进行筛选，得到无障碍节点相关联的所有文字节点，可以提高文字节点获取的准确性。其次，终端基于节点名称获取所有文字节点，无需与服务器进行通信，即可直接对节点名称进行判断获取到所有文字节点，可以减少文字节点的获取步骤，提高文字节点的获取速度，可以提高文字朗读的效率。另外，终端可以获取目标节点对应的第一文字信息，获取第一文字信息对应的第一语音信息，采用神经网络模型对第一语音信息添加语音效果，得到第三语音信息，播放第三语音信息，可以改善语音信息的播放生硬的情况，提高文字朗读时用户的使用体验。最后，终端基于节点树获取文字信息，减少DOM Tree(文档对象化模型)只能针对网页进行解析的情况，可以扩大文字朗读的使用范围，提高文字朗读的使用便利性。

请参见图8，图8示出本申请实施例提供的一种文字朗读方法的流程示意图。具体的：

S301，获取当前屏幕中的多媒体信息，采用无障碍服务获取多媒体信息对应的无障碍节点；

根据一些实施例，图9示出本申请实施例提供的一种终端当前屏幕的举例示意图。如图9所示，终端获取到当前屏幕中的多媒体信息例如可以是B视频。终端采用无障碍服务获取该B视频对应的无障碍节点例如可以是W1节点。

S302，若无障碍节点为非文字节点，则发出针对非文字节点的朗读提示信息；

根据一些实施例，非文字节点即为除文字节点之外的节点，即非文字节点可以仅包括非文字信息或者同时包括非文字信息和文字信息。非文字节点包括视频节点、音频节点、图像节点等等。其中视频节点中例如可以同时包括视频信息和文字信息。

易于理解的是，若终端获取到无障碍节点，且终端确定无障碍节点为非文字节点，则终端可以发出针对非文字节点的朗读提示信息。该朗读提示信息是针对非文字节点发出的，当非文字节点发生变化时，该朗读提示信息也会相应变化。

可选的，终端采用无障碍服务获取该B视频对应的无障碍节点例如可以是W1节点。若终端确定W1节点是非文字节点，则终端发出针对非文字节点的朗读提示信息例如可以是：“是否针对W1节点进行文字朗读？”。此时，终端界面的举例示意图可以如图10所示。

S303，若获取到针对朗读提示信息的确认指令，则采用文字识别方式获取非文字节点对应的第二文字信息；

根据一些实施例，若无障碍节点为非文字节点，则终端发出针对非文字节点的朗读提示信息后，终端可以检测是否获取到针对朗读提示信息的确认指令。该确认指令包括但不限于语音确认指令、点击确认指令、延时确认指令等等。延时确认指令例如可以是发出针对非文字节点的朗读提示信息预设时长后，自动获取到确认指令。

易于理解的是，若终端获取到针对朗读提示信息的确认指令，则终端可以采用文字识别方式获取非文字节点对应的第二文字信息。非文字识别方式包括但不限于光学方式识别方式(Optical Character Recognition，OCR)、射频(RFID)识别方式等。其中，光学方式识别方式是指终端(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。

S304，获取并播放第二文字信息对应的第二语音信息。

根据一些实施例，第二文字信息仅仅是指与非文字节点对应的文字信息。该第二文字信息并不也指某一固定文字信息。当非文字节点发生变化时，该非文字节点对应的第二文字信息也会相应变化。

易于理解的是，第二语音信息是与第二文字信息对应的语音信息。该第二语音信息并不也指某一固定语音信息。当非文字节点发生变化时，该非文字节点对应的第二文字信息也会相应变化，第二文字信息对应的第二语音信息也会相应变化。

根据一些实施例，当终端获取到非文字对应的第二文字信息。当终端获取到第二文字信息时，终端可以获取该第二文字信息对应的第二语音信息。当终端获取到第二语音信息时，终端可以播放该第二语音信息。

可选的，终端获取到W1节点对应的第二文字信息例如可以是“今天阳光灿烂，地面温度为25～30摄氏度”。当终端获取到第二文字信息对应的第二语音信息时，终端可以通过终端的扬声器播放该第二语音信息。

在本申请一个或者多个实施例中，通过获取当前屏幕中的多媒体信息，采用无障碍服务获取多媒体信息对应的无障碍节点，若无障碍节点为非文字节点，则发出针对非文字节点的朗读提示信息，若获取到针对朗读提示信息的确认指令，则采用文字识别方式获取非文字节点对应的第二文字信息，获取并播放第二文字信息对应的第二语音信息，因此在无障碍节点为非文字节点时，可以基于用户的确认指令进行文字朗读，减少非文字节点中包括文字信息直接不朗读的情况，提高文字朗读体验。

请参见图11，图11示出本申请实施例提供的一种文字朗读方法的流程示意图。具体的：

S401，获取当前屏幕中的多媒体信息，采用无障碍服务获取多媒体信息对应的无障碍节点；

具体过程如上所述，此处不再赘述。

S402，获取无障碍节点的节点属性信息；

根据一些实施例，节点属性信息是用于对所有节点进行筛选的属性信息。该节点属性信息并不特指某一固定属性信息。当终端采用无障碍服务获取多媒体信息对应的无障碍节点时，终端可以获取该无障碍节点的节点属性信息。该无障碍节点例如可以是Q1节点，节点属性信息例如可以是节点名称，该Q1节点的节点名称例如可以是A文档的第五段。

S403，若节点属性信息指示无障碍节点为文字节点，则遍历无障碍节点所在的节点树，获取目标文档相关联的所有文字节点；

根据一些实施例，当终端获取到无障碍节点的节点属性信息时，终端可以检测节点属性信息是否指示无障碍节点为文字节点。若节点属性信息指示无障碍节点为文字节点，则终端可以获取无障碍节点所在的节点树，并遍历无障碍节点所在的节点树。终端遍历无障碍节点所在的节点树，终端可以获取到目标文档相关联的所有文字节点。由于目标文档为当前屏幕所展示的文档对应的全文文档，因此终端可以获取到当前屏幕未展示的文档对应的文字节点，可以提高文字节点获取的准确性，可以提高文字朗读的准确性，提高文字朗读体验。

易于理解的是，该无障碍节点例如可以是Q1节点，节点属性信息例如可以是节点名称，该Q1节点的节点名称例如可以是A文档的第五段。若A文档的第五段息指示Q1节点为文字节点，则终端可以遍历Q1节点所在的节点树，获取A文档相关联的所有文字节点。

S404，基于文字属性对所有文字节点进行优先级排序，将优先级最高的文字节点确定为目标节点；

具体过程如上所述，此处不再赘述。

S405，获取目标节点对应的第一文字信息；

具体过程如上所述，此处不再赘述。

S406，将第一文字信息发送至服务器；

根据一些实施例，当终端后取到目标节点对应的第一文字信息时，终端可以将第一文字信息发送服务器。第一文字信息用于指示服务器获取第一文字信息对应的第一语音信息。即服务器检测到针对发送第一文字信息时，服务器可以获取该第一文字信息，并获取第一文字信息对应的第一语音信息。

易于理解的是，服务器获取第一语音信息时，服务器可以采用文本转语音技术(Text To Speech，TTS)获取第一文字信息对应的第一语音信息。服务器获取第一语音信息时，服务器还可以在文本转语音技术人添加神经网络模型，获取第一语音信息中添加语音效果，提高文字朗读体验。

S407，获取服务器发送的第一语音信息，并播放第一语音信息。

根据一些实施例，当服务器获取到第一文字信息对应的第一语音信息时，服务器可以发送第一语音信息至终端。当终端检测到服务器发送第一语音信息时，终端可以获取服务器发送的第一语音信息，并播放第一语音信息。

易于理解的是，图12示出本申请实施例提供的一种文字朗读方法的流程时序图。如图12所示，终端获取当前屏幕中的多媒体信息，采用无障碍服务获取多媒体信息对应的无障碍节点，并获取无障碍节点的节点属性信息。若节点属性信息指示无障碍节点为文字节点，则终端遍历无障碍节点所在的节点树，获取目标文档相关联的所有文字节点。终端可以基于文字属性对所有文字节点进行优先级排序，将优先级最高的文字节点确定为目标节点，并获取目标节点对应的第一文字信息。终端可以将第一文字信息发送至服务器，服务器检测到针对发送第一文字信息时，服务器可以获取该第一文字信息，并获取第一文字信息对应的第一语音信息。当服务器获取到第一文字信息对应的第一语音信息时，服务器可以发送第一语音信息至终端。终端可以获取服务器发送的第一语音信息，并播放第一语音信息。

根据一些实施例，当终端获取到目标文档相关联的所有文字节点时，终端可以仅获取与目标文档对应的语音信息，无需获取与目标文档无关的多媒体信息，无需获取与目标文档无关的多媒体信息对应的语音信息，可以提高目标文档的朗读体验。

易于理解的是，当终端显示的多媒体信息为一则新闻的最后一段文档以及该则新闻的评论信息时，终端可以仅获取该则新闻的全部文档相关联的语音信息，即终端仅朗读该则新闻，而不对该则新闻的评论信息进行朗读，可以提高目标文档的朗读体验。

根据一些实施例，当终端确定当前屏幕中文字朗读的触发位置对应的多媒体信息为评论区展示的评论信息时，终端可以获取该评论信息对应的语音信息，终端可以仅朗读该评论信息对应的语音信息，而无需朗读该评论信息对应的文档信息，可以提高文字朗读的准确性，提高文字朗读体验。终端仅朗读该评论信息对应的语音信息时，终端可以获取该评论信息的无障碍节点，并遍历该无障碍节点所在的节点树，获取评论信息相关联的所有文字节点。终端可以基于文字属性对所有文字节点进行优先级排序，将优先级最高的文字节点确定为目标节点，获取到目标节点对应的语音信息时，播放该语音信息。

可选的，当终端当前屏幕中展示的多媒体信息包括一则新闻的最后一段文档以及该则新闻对应的点击次数排名前5的评论信息，终端获取到文字朗读的触发位置对应的多媒体信息为排名第1的评论信息时，终端可以获取该排名第1的评论信息的无障碍节点，并遍历该无障碍节点所在的节点树，获取评论信息相关联的所有文字节点。终端可以基于文字属性对所有文字节点进行优先级排序，将优先级最高的文字节点确定为目标节点，获取到目标节点对应的语音信息时，播放该语音信息。

在本申请一个或者多个实施例中，通过获取当前屏幕中的多媒体信息，采用无障碍服务获取多媒体信息对应的无障碍节点，获取无障碍节点的节点属性信息，若节点属性信息指示无障碍节点为文字节点，则遍历无障碍节点所在的节点树，获取目标文档相关联的所有文字节点，因此终端可以获取到当前屏幕未展示的文档对应的文字节点，可以提高文字节点获取的准确性，可以提高文字朗读的准确性，提高文字朗读体验。其次，终端获取到第一文字信息时，可以将第一文字信息发送至服务器，获取服务器发送的第一语音信息，并播放第一语音信息，由于仅发送文字信息，因此可以提高语音获取速度，提高文字朗读效率，提高文字朗读体验。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

请参见图13，其示出了本申请一个示例性实施例提供的文字朗读装置的结构示意图。该文字朗读装置可以通过软件、硬件或者两者的结合实现成为装置的全部或一部分。该文字朗读装置1300包括信息获取单元1301、节点获取单元1302、节点确定单元1303和信息播放单元1304，其中：

信息获取单元1301，用于获取当前屏幕中的多媒体信息，采用无障碍服务获取所述多媒体信息对应的无障碍节点；

节点获取单元1302，用于遍历所述无障碍节点所在的节点树，获取所述节点树中与所述无障碍节点相关联的所有文字节点；

节点确定单元1303，用于基于文字属性对所述所有文字节点进行优先级排序，将优先级最高的文字节点确定为目标节点；

信息播放单元1304，用于获取所述目标节点对应的第一文字信息，获取第一文字信息对应的第一语音信息，播放所述第一语音信息。

根据一些实施例，节点获取单元1302，用于遍历无障碍节点所在的节点树，获取节点树中与无障碍节点相关联的所有文字节点时，具体用于：

遍历无障碍节点所在的节点树，获取节点树中与无障碍节点相关的所有节点；

基于节点属性信息对所有节点进行筛选，得到无障碍节点相关联的所有文字节点。

根据一些实施例，图14示出本申请实施例提供的一种文字朗读装置的结构示意图。如图11所示，节点获取单元1302包括名称获取子单元1312和类别信息获取子单元1322，节点获取单元1302，用于基于节点属性信息对所有节点进行筛选，得到无障碍节点相关联的所有文字节点时，具体用于以下至少一种：

名称获取子单元1312，用于获取所有节点的节点名称，将节点名称属于目标名称的节点确定为无障碍节点相关联的所有文字节点；

类别信息获取子单元1322，用于获取所有节点的资源类别信息，将资源类别信息为文字类型的节点确定为所有文字节点。

根据一些实施例，图15示出本申请实施例提供的一种文字朗读装置的结构示意图。如图12所示，节点属性信息包括节点名称以及资源类别信息，节点获取单元1302包括层级信息获取子单元1332、子文字节点获取子单元1342和文字节点获取子单元1352，节点获取单元1302，用于基于节点属性信息对所有节点进行筛选，得到无障碍节点相关联的所有文字节点时：

层级信息获取子单元1332，用于获取所有节点的层级信息；

子文字节点获取子单元1342，用于若层级信息指示节点为父文字节点，则获取父文字节点对应的子文字节点；

文字节点获取子单元1352，用于将父文字节点和子文字节点确定为无障碍节点相关联的所有文字节点。

根据一些实施例，图16示出本申请实施例提供的一种文字朗读装置的结构示意图。如图13所示，节点属性信息包括层级信息，节点确定单元1303包括属性获取子单元1313、初始节点获取子单元1323和目标节点确定子单元1333，节点确定单元1303，用于基于文字属性对所有文字节点进行优先级排序，将优先级最高的文字节点确定为目标节点时：

属性获取子单元1313，用于获取所有文字节点的文字节点展示信息和文字节点内容属性；

初始节点获取子单元1323，用于基于文字节点展示信息，对所有文字节点进行第一优先级排序，获取所有文字节点中的初始节点；

目标节点确定子单元1343，用于基于文字节点内容属性，对初始节点进行第二优先级排序，将第二优先级排序中优先级最高的文字节点确定为目标节点。

根据一些实施例，图17示出本申请实施例提供的一种文字朗读装置的结构示意图。如图17所示，文字朗读装置1300包括提示信息发出单元1305，用于获取当前屏幕中的多媒体信息，采用无障碍服务获取多媒体信息对应的无障碍节点之后，若无障碍节点为非文字节点，则发出针对非文字节点的朗读提示信息；

若获取到针对朗读提示信息的确认指令，则采用文字识别方式获取非文字节点对应的第二文字信息；

获取并播放第二文字信息对应的第二语音信息。

根据一些实施例，信息播放单元1304，用于获取第一文字信息对应的第一语音信息，播放第一语音信息时，具体用于：

将第一文字信息发送至服务器，第一文字信息用于指示服务器获取第一文字信息对应的第一语音信息；

获取服务器发送的第一语音信息，并播放第一语音信息。

根据一些实施例，信息播放单元1304，用于播放第一语音信息时，具体用于：

采用神经网络模型对第一语音信息添加语音效果，得到第三语音信息；

播放第三语音信息。

获取无障碍节点的节点属性信息；

若节点属性信息指示无障碍节点为文字节点，则遍历无障碍节点所在的节点树，获取目标文档相关联的所有文字节点，

目标文档为当前屏幕所展示的文档对应的全文文档。

需要说明的是，上述实施例提供的文字朗读装置在执行文字朗读方法时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的文字朗读装置与文字朗读方法实施例属于同一构思，其体现实现过程详见方法实施例，这里不再赘述。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

在本申请一个或多个实施例中，通过获取当前屏幕中的多媒体信息，采用无障碍服务获取多媒体信息对应的无障碍节点，遍历无障碍节点所在的节点树，获取节点树中与无障碍节点相关联的所有文字节点，基于文字属性对所有文字节点进行优先级排序，将优先级最高的文字节点确定为目标节点，获取目标节点对应的第一文字信息，获取第一文字信息对应的第一语音信息，播放第一语音信息。由于文字朗读装置基于无障碍服务可以获取到目标节点对应的第一文字信息，无需获取图像信息，可以减少内存占用，并且基于文字信息获取语音信息，可以减少语音信息获取的时长，提高语音信息获取的准确性，进而可以提高文字朗读的准确性和文字朗读体验。

本申请实施例还提供了一种计算机存储介质，所述计算机存储介质可以存储有多条指令，所述指令适于由处理器加载并执行如上述图3-图12所示实施例的所述文字朗读方法，具体执行过程可以参见图3-图12所示实施例的具体说明，在此不进行赘述。

本申请还提供了一种计算机程序产品，该计算机程序产品存储有至少一条指令，所述至少一条指令由所述处理器加载并执行如上述图3-图12所示实施例的所述文字朗读方法，具体执行过程可以参见图3-图12所示实施例的具体说明，在此不进行赘述。

请参考图18，其示出了本申请一个示例性实施例提供的终端的结构方框图。本申请中的终端可以包括一个或多个如下部件：处理器110、存储器120、输入装置130、输出装置140和总线150。处理器110、存储器120、输入装置130和输出装置140之间可以通过总线150连接。所述处理器加载并执行如上述图3-图12所示实施例的所述文字朗读方法，具体执行过程可以参见图3-图12所示实施例的具体说明，在此不进行赘述。

处理器110可以包括一个或者多个处理核心。处理器110利用各种接口和线路连接整个终端内的各个部分，通过运行或执行存储在存储器120内的指令、程序、代码集或指令集，以及调用存储在存储器120内的数据，执行终端100的各种功能和处理数据。可选地，处理器110可以采用数字信号处理(digital signal processing，DSP)、现场可编程门阵列(field－programmable gate array，FPGA)、可编程逻辑阵列(programmable logicArray，PLA)中的至少一种硬件形式来实现。处理器110可集成中央处理器(centralprocessing unit，CPU)、图像处理器(graphics processing unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器110中，单独通过一块通信芯片进行实现。

存储器120可以包括随机存储器(random Access Memory，RAM)，也可以包括只读存储器(read-only memory，ROM)。可选地，该存储器120包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等，该操作系统可以是安卓(Android)系统，包括基于Android系统深度开发的系统、苹果公司开发的IOS系统，包括基于IOS系统深度开发的系统或其它系统。存储数据区还可以存储终端在使用中所创建的数据比如电话本、音视频数据、聊天记录数据，等。

参见图19所示，存储器120可分为操作系统空间和用户空间，操作系统即运行于操作系统空间，原生及第三方应用程序即运行于用户空间。为了保证不同第三方应用程序均能够达到较好的运行效果，操作系统针对不同第三方应用程序为其分配相应的系统资源。然而，同一第三方应用程序中不同应用场景对系统资源的需求也存在差异，比如，在本地资源加载场景下，第三方应用程序对磁盘读取速度的要求较高；在动画渲染场景下，第三方应用程序则对GPU性能的要求较高。而操作系统与第三方应用程序之间相互独立，操作系统往往不能及时感知第三方应用程序当前的应用场景，导致操作系统无法根据第三方应用程序的具体应用场景进行针对性的系统资源适配。

为了使操作系统能够区分第三方应用程序的具体应用场景，需要打通第三方应用程序与操作系统之间的数据通信，使得操作系统能够随时获取第三方应用程序当前的场景信息，进而基于当前场景进行针对性的系统资源适配。

以操作系统为Android系统为例，存储器120中存储的程序和数据如图20所示，存储器120中可存储有Linux内核层320、系统运行时库层340、应用框架层360和应用层380，其中，Linux内核层320、系统运行库层340和应用框架层360属于操作系统空间，应用层380属于用户空间。Linux内核层320为终端的各种硬件提供了底层的驱动，如显示驱动、音频驱动、摄像头驱动、蓝牙驱动、Wi-Fi驱动、电源管理等。系统运行库层340通过一些C/C++库来为Android系统提供了主要的特性支持。如SQLite库提供了数据库的支持，OpenGL/ES库提供了3D绘图的支持，Webkit库提供了浏览器内核的支持等。在系统运行时库层340中还提供有安卓运行时库(Android runtime)，它主要提供了一些核心库，能够允许开发者使用Java语言来编写Android应用。应用框架层360提供了构建应用程序时可能用到的各种API，开发者也可以通过使用这些API来构建自己的应用程序，比如活动管理、窗口管理、视图管理、通知管理、内容提供者、包管理、通话管理、资源管理、定位管理。应用层380中运行有至少一个应用程序，这些应用程序可以是操作系统自带的原生应用程序，比如联系人程序、短信程序、时钟程序、相机应用等；也可以是第三方开发者所开发的第三方应用程序，比如游戏类应用程序、即时通信程序、相片美化程序、文字朗读程序等。

以操作系统为IOS系统为例，存储器120中存储的程序和数据如图21所示，IOS系统包括：核心操作系统层420(Core OS layer)、核心服务层440(Core Services layer)、媒体层460(Media layer)、可触摸层480(Cocoa Touch Layer)。核心操作系统层420包括了操作系统内核、驱动程序以及底层程序框架，这些底层程序框架提供更接近硬件的功能，以供位于核心服务层440的程序框架所使用。核心服务层440提供给应用程序所需要的系统服务和/或程序框架，比如基础(Foundation)框架、账户框架、广告框架、数据存储框架、网络连接框架、地理位置框架、运动框架等等。媒体层460为应用程序提供有关视听方面的接口，如图形图像相关的接口、音频技术相关的接口、视频技术相关的接口、音视频传输技术的无线播放(AirPlay)接口等。可触摸层480为应用程序开发提供了各种常用的界面相关的框架，可触摸层480负责用户在终端上的触摸交互操作。比如本地通知服务、远程推送服务、广告框架、游戏工具框架、消息用户界面接口(User Interface，UI)框架、用户界面UIKit框架、地图框架等等。

在图19所示出的框架中，与大部分应用程序有关的框架包括但不限于：核心服务层440中的基础框架和可触摸层480中的UIKit框架。基础框架提供许多基本的对象类和数据类型，为所有应用程序提供最基本的系统服务，和UI无关。而UIKit框架提供的类是基础的UI类库，用于创建基于触摸的用户界面，iOS应用程序可以基于UIKit框架来提供UI，所以它提供了应用程序的基础架构，用于构建用户界面，绘图、处理和用户交互事件，响应手势等等。

其中，在IOS系统中实现第三方应用程序与操作系统数据通信的方式以及原理可参考Android系统，本申请在此不再赘述。

其中，输入装置130用于接收输入的指令或数据，输入装置130包括但不限于键盘、鼠标、摄像头、麦克风或触控设备。输出装置140用于输出指令或数据，输出装置140包括但不限于显示设备和扬声器等。在一个示例中，输入装置130和输出装置140可以合设，输入装置130和输出装置140为触摸显示屏，该触摸显示屏用于接收用户使用手指、触摸笔等任何适合的物体在其上或附近的触摸操作，以及显示各个应用程序的用户界面。触摸显示屏通常设置在终端的前面板。触摸显示屏可被设计成为全面屏、曲面屏或异型屏。触摸显示屏还可被设计成为全面屏与曲面屏的结合，异型屏与曲面屏的结合，本申请实施例对此不加以限定。

除此之外，本领域技术人员可以理解，上述附图所示出的终端的结构并不构成对终端的限定，终端可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。比如，终端中还包括射频电路、输入单元、传感器、音频电路、无线保真(wirelessfidelity，WiFi)模块、电源、蓝牙模块等部件，在此不再赘述。

在本申请实施例中，各步骤的执行主体可以是上文介绍的终端。可选地，各步骤的执行主体为终端的操作系统。操作系统可以是安卓系统，也可以是IOS系统，或者其它操作系统，本申请实施例对此不作限定。

本申请实施例的终端，其上还可以安装有显示设备，显示设备可以是各种能实现显示功能的设备，例如：阴极射线管显示器(cathode ray tubedisplay，简称CR)、发光二极管显示器(light-emitting diode display，简称LED)、电子墨水屏、液晶显示屏(liquidcrystal display，简称LCD)、等离子显示面板(plasma display panel，简称PDP)等。用户可以利用终端100上的显示设备，来查看显示的文字、图像、视频等信息。所述终端可以是智能手机、平板电脑、游戏设备、AR(Augmented Reality，增强现实)设备、汽车、数据存储装置、音频播放装置、视频播放装置、笔记本、桌面计算设备、可穿戴设备诸如电子手表、电子眼镜、电子头盔、电子手链、电子项链、电子衣物等设备。

本领域的技术人员可以清楚地了解到本申请的技术方案可借助软件和/或硬件来实现。本说明书中的“单元”和“模块”是指能够独立完成或与其他部件配合完成特定功能的软件和/或硬件，其中硬件例如可以是现场可编程门阵列(Field－ProgrammaBLE GateArray，FPGA)、集成电路(Integrated Circuit，IC)等。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些服务接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通进程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random AccessMemory，RAM)、磁盘或光盘等。

以上所述者，仅为本公开的示例性实施例，不能以此限定本公开的范围。即但凡依本公开教导所作的等效变化与修饰，皆仍属本公开涵盖的范围内。本领域技术人员在考虑说明书及实践这里的公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未记载的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的范围和精神由权利要求限定。

Claims

1.一种文字朗读方法，其特征在于，所述方法包括：

获取所述所有文字节点的文字节点展示信息和文字节点内容属性；

基于所述文字节点展示信息，对所述所有文字节点进行第一优先级排序，获取所述所有文字节点中的初始节点；

基于所述文字节点内容属性，对所述初始节点进行第二优先级排序，将第二优先级排序中优先级最高的文字节点确定为目标节点；

2.根据权利要求1所述的方法，其特征在于，所述遍历所述无障碍节点所在的节点树，获取所述节点树中与所述无障碍节点相关联的所有文字节点，包括：

遍历所述无障碍节点所在的节点树，获取所述节点树中与所述无障碍节点相关的所有节点；

基于节点属性信息对所述所有节点进行筛选，得到所述无障碍节点相关联的所有文字节点。

3.根据权利要求2所述的方法，其特征在于，所述节点属性信息包括节点名称以及资源类别信息；所述基于节点属性信息对所述所有节点进行筛选，得到所述无障碍节点相关联的所有文字节点，包括以下至少一种：

获取所述所有节点的所述节点名称，将所述节点名称属于目标名称的节点确定为所述无障碍节点相关联的所有文字节点；

获取所述所有节点的资源类别信息，将所述资源类别信息为文字类型的节点确定为所有文字节点。

4.根据权利要求2所述的方法，其特征在于，所述节点属性信息包括层级信息；所述基于节点属性信息对所述所有节点进行筛选，得到所述无障碍节点相关联的所有文字节点，包括：

获取所述所有节点的所述层级信息；

若所述层级信息指示所述节点为父文字节点，则获取所述父文字节点对应的子文字节点；

将所述父文字节点和所述子文字节点确定为所述无障碍节点相关联的所有文字节点。

5.根据权利要求1所述的方法，其特征在于，所述获取当前屏幕中的多媒体信息，采用无障碍服务获取所述多媒体信息对应的无障碍节点之后，还包括：

若所述无障碍节点为非文字节点，则发出针对所述非文字节点的朗读提示信息；

若获取到针对所述朗读提示信息的确认指令，则采用文字识别方式获取所述非文字节点对应的第二文字信息；

获取并播放所述第二文字信息对应的第二语音信息。

6.根据权利要求1所述的方法，其特征在于，所述获取第一文字信息对应的第一语音信息，播放所述第一语音信息，包括：

将所述第一文字信息发送至服务器，所述第一文字信息用于指示所述服务器获取所述第一文字信息对应的第一语音信息；

获取所述服务器发送的所述第一语音信息，并播放所述第一语音信息。

7.根据权利要求1或6所述的方法，其特征在于，所述播放所述第一语音信息，包括：

采用神经网络模型对所述第一语音信息添加语音效果，得到第三语音信息；

播放所述第三语音信息。

8.根据权利要求1所述的方法，其特征在于，所述遍历所述无障碍节点所在的节点树，获取所述节点树中与所述无障碍节点相关联的所有文字节点，包括：

获取所述无障碍节点的节点属性信息；

若所述节点属性信息指示所述无障碍节点为文字节点，则遍历所述无障碍节点所在的节点树，获取目标文档相关联的所有文字节点，

所述目标文档为所述当前屏幕所展示的文档对应的全文文档。

9.一种文字朗读装置，其特征在于，所述装置包括：

节点确定单元，用于获取所述所有文字节点的文字节点展示信息和文字节点内容属性，基于所述文字节点展示信息，对所述所有文字节点进行第一优先级排序，获取所述所有文字节点中的初始节点，基于所述文字节点内容属性，对所述初始节点进行第二优先级排序，将第二优先级排序中优先级最高的文字节点确定为目标节点；

10.一种终端，其特征在于，包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行如权利要求1～8任意一项的方法步骤。

11.一种计算机存储介质，其特征在于，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行如权利要求1～8任意一项的方法步骤。