CN114461171A

CN114461171A - 网上银行页面的朗读方法及系统

Info

Publication number: CN114461171A
Application number: CN202210105501.0A
Authority: CN
Inventors: 杨建福; 王向东; 李扬; 王月亭; 张帅; 袁明杰
Original assignee: Shandong City Commercial Banks Alliance Co ltd
Current assignee: Shandong City Commercial Banks Alliance Co ltd
Priority date: 2022-01-27
Filing date: 2022-01-27
Publication date: 2022-05-10
Anticipated expiration: 2042-01-27
Also published as: CN114461171B

Abstract

本发明提供了网上银行页面的朗读方法及系统，方法包括获取页面上的鼠标悬停事件，根据所述鼠标悬停事件获取页面要素，并确定朗读对象；对所述朗读对象进行文字处理，将处理后的文字上传至后端语音合成服务区，进行浏览器语音播报。本发明通过对鼠标悬停事件设置拦截，得到需朗读的对象，并进行文字处理后上传至后端语音合成服务，实现浏览器的语音播报，整个工程无需依赖三方设计，简化操作流程，且在对悬停事件设置防抖处理，保证朗读对象的准确性且避免无效操作，提高工作效率。

Description

网上银行页面的朗读方法及系统

技术领域

本发明涉及人工智能技术领域，尤其是一种网上银行页面的朗读方法及系统。

背景技术

随着电子产品及业务的普及，针对电子银行的无障碍提出了要求，尤其是针对视觉障碍群体要求实现页面要素朗读辅助功能。

目前实现页面朗读借助市面三方的读屏软件进行定制化开发实现。

适配三方的读屏设计有的页面去逐一修改，增加指定标签，整体页面都需要去调整适配，对于已经生产稳定运行的系统改造影响较大，网上银行页面数量多达几千个页面，逐一修改的工作量也非常大。

发明内容

本发明提供了网上银行页面的朗读方法及系统，用于解决现有借助三方应用实现读屏时工作量大的问题。

为实现上述目的，本发明采用下述技术方案：

本发明第一方面提供了网上银行页面的朗读方法，所述方法包括以下步骤：

获取页面上的鼠标悬停事件，根据所述鼠标悬停事件获取页面要素，并确定朗读对象；

对所述朗读对象进行文字处理，将处理后的文字上传至后端语音合成服务区，进行浏览器语音播报。

进一步地，所述获取页面上的鼠标悬停事件之前包括步骤：

解析页面元素，将鼠标悬停事件设置为拦截事件。

进一步地，对所述鼠标悬停事件设置防抖处理，具体为：

增加鼠标悬停的延迟时间，若在所述延迟时间内，对同一元素出现多次悬停操作，则将所述多次悬停操作绑定为一次拦截事件。

进一步地，所述获取页面要素的具体过程为：

获取当前鼠标悬停事件触发的事件元素，若所述事件元素的父级元素中包含预设属性，则所述页面要素含有所述预设属性的元素；

若事件元素的父级元素中不包含所述预设属性，则获取当前鼠标悬停事件触发的事件对象，遍历事件对象的子节点，得到页面要素。

进一步地，对所述朗读对象进行文字处理包括：

识别所述文字对应的dom对象，根据dom对象的类型进行对应描述。

进一步地，所述dom对象包括按钮、输入框、图片、文本域、下拉框和标题。

进一步地，所述将处理后的文字上传至后端语音合成服务区后，包括：

后端返回语音文件流；

接收所述语音文件流，并转化为Blob对象，获取所述Blob对象在内存中的URL地址，将所述URL地址发送给Audio对象的src属性。

本发明第二方面提供了网上银行页面的朗读系统，所述系统包括：

对象获取单元，用于获取页面上的鼠标悬停事件，根据所述鼠标悬停事件获取页面要素，并确定朗读对象；

朗读处理单元，用于对所述朗读对象进行文字处理，将处理后的文字上传至后端语音合成服务区，进行浏览器语音播报。

进一步地，所述系统还包括预处理单元，所述预处理单元用于解析页面元素，将鼠标悬停事件设置为拦截事件。

本发明第三方面提供了一种计算机存储介质，所述计算机存储介质中存储有计算机指令，所述计算机指令在所述的朗读系统上运行时，使所述朗读系统执行所述朗读方法的步骤。

本发明第二方面的所述网上银行页面的朗读系统能够实现第一方面及第一方面的各实现方式中的方法，并取得相同的效果。

发明内容中提供的效果仅仅是实施例的效果，而不是发明所有的全部效果，上述技术方案中的一个技术方案具有如下优点或有益效果：

本发明通过对鼠标悬停事件设置拦截，得到需朗读的对象，并进行文字处理后上传至后端语音合成服务，实现浏览器的语音播报，整个工程无需依赖三方设计，简化操作流程，且在对悬停事件设置防抖处理，保证朗读对象的准确性且避免无效操作，提高工作效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明所述方法实施例的流程示意图；

图2是本发明所述系统实施例的结构示意图。

具体实施方式

为能清楚说明本方案的技术特点，下面通过具体实施方式，并结合其附图，对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开，下文中对特定例子的部件和设置进行描述。此外，本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的，其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意，在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。

考虑到通用修改方案的影响范围较大同时依赖系统读屏技术，语音朗读环节不可控。本发明实施例设计了针对页面操作事件的统一监听、拦截，页面要素的自动捕获、自动添加标签，再结合浏览器已具备的语音合成服务，捕获页面朗读文本信息后调用语音合成引擎实现语音合成，再返回播放，从而整体实现了页面朗读的功能。

如图1所示，本发明实施例提供了网上银行页面的朗读方法，该方法包括以下步骤：

S1,获取页面上的鼠标悬停事件，根据所述鼠标悬停事件获取页面要素，并确定朗读对象；

S2,对所述朗读对象进行文字处理，将处理后的文字上传至后端语音合成服务区，进行浏览器语音播报。

本发明所述方法的其一实现方式中，所述获取页面上的鼠标悬停事件之前包括步骤：

解析页面元素，将鼠标悬停事件设置为拦截事件。建立跨浏览器事件处理单元，EventUtil对象，用于视情况分别使用DOM0级方法、DOM2级方法或IE方法来添加事件。这里通过给需要捕获的Html的body元素添加事件委托方式来拦截用户在页面上的mouseover(鼠标悬停事件)事件。并且对用户触发mouseover事件的捕获做了防抖处理，因为用户在页面上任意移动下鼠标都会触发mouseover。这样触发过于频繁，无法准确的捕获用户真正想要的dom元素，所以这里增加了防抖机制。

对所述鼠标悬停事件设置防抖处理，具体为：

所述获取页面要素的具体过程为：判断需要使用的焦点对焦模式，这里定义了两种对焦模式。自动对焦和手动对焦，区分的主要原则是，用户mouseover触发的事件元素中的父级中是否包含aria-atomic＝'true'属性。如果父元素中包含该属性，则焦点会捕获到含有此属性的元素上，则所述页面要素含有所述预设属性的元素。如果不包含上述规则则，执行自动对焦方案。自动对焦具体为当捕获到用户mouseover事件对象，会遍历整个对象的dom子节点，得到页面要素，这里为了保证效率和接下来文字信息处理的准确率规定子节点2个以上的dom不予处理。

Aria是“Accessiable Rich Internet Applications“的缩写。它是W3C(Web无障碍推进组织)发布的针对残障人士访问互联网应用的一套开发标准规范。

aria-atomic＝“true”是无障碍标准规范中的标签属性，作用是表示区域内容是否完整播报。指可以为true和false。当为true时，表示辅助设备需要把整个区域内容都通报给使用者。

所以包含该标签的情况即不区分子元素全部朗读，不包含的情况根据鼠标悬停的具体要素进行朗读。例如：页面上转账功能，实际页面要素链接包含转账文字、点击按钮、跳转链接三个要素，增加该aria-atomic＝“true”标签即朗读为“链接-转账-提交按钮”，不包含该标签的情况会朗读为”转账“。

两个子节点以内的会遍历朗读。例如：理财产品列表功能页，选中列表会依次朗读展示的理财产品名称，理财产品下点击还会有利率等信息，如果选中是列表层只朗读到理财产品名称不朗读利率，选中单个产品的话会朗读名称和利率。

对所述朗读对象进行文字处理包括：

识别所述文字对应的dom对象，根据dom对象的类型进行对应描述。比如a标签需要描述为链接XXX，button需要描述为XXX按钮。

dom对象包含：BUTTON-按钮、INPUT-输入框、IMG-图片、TEXTAREA-文本域、SELECT-下拉框、TITLE-标题等。

步骤S2中，所述将处理后的文字上传至后端语音合成服务区后，包括：

后端返回语音文件流；接收所述语音文件流，并转化为Blob对象，获取所述Blob对象在内存中的URL地址，将所述URL地址发送给Audio对象的src属性。

如图2所示，本发明实施例提供了网上银行页面的朗读系统，所述系统包括对象获取单元1和朗读处理单元2。

对象获取单元1用于获取页面上的鼠标悬停事件，根据所述鼠标悬停事件获取页面要素，并确定朗读对象；朗读处理单元2用于对所述朗读对象进行文字处理，将处理后的文字上传至后端语音合成服务区，进行浏览器语音播报。

本发明系统实施例的其一实现方式中，所述系统还包括预处理单元3，所述预处理单元3用于解析页面元素，将鼠标悬停事件设置为拦截事件。

本发明实施例还提供了一种计算机存储介质，所述计算机存储介质中存储有计算机指令，所述计算机指令在所述的朗读系统上运行时，使所述朗读系统执行所述朗读方法的步骤。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims

1.网上银行页面的朗读方法，其特征是，所述方法包括以下步骤：

2.根据权利要求1所述网上银行页面的朗读方法，其特征是，所述获取页面上的鼠标悬停事件之前包括步骤：

解析页面元素，将鼠标悬停事件设置为拦截事件。

3.根据权利要求2所述网上银行页面的朗读方法，其特征是，对所述鼠标悬停事件设置防抖处理，具体为：

4.根据权利要求1所述网上银行页面的朗读方法，其特征是，所述获取页面要素的具体过程为：

5.根据权利要求1所述网上银行页面的朗读方法，其特征是，对所述朗读对象进行文字处理包括：

6.根据权利要求5所述网上银行页面的朗读方法，其特征是，所述dom对象包括按钮、输入框、图片、文本域、下拉框和标题。

7.根据权利要求1所述网上银行页面的朗读方法，其特征是，所述将处理后的文字上传至后端语音合成服务区后，包括：

后端返回语音文件流；

8.网上银行页面的朗读系统，其特征是，所述系统包括：

9.根据权利要求8所述网上银行页面的朗读系统，其特征是，所述系统还包括预处理单元，所述预处理单元用于解析页面元素，将鼠标悬停事件设置为拦截事件。

10.一种计算机存储介质，所述计算机存储介质中存储有计算机指令，其特征是，所述计算机指令在权利要求8或9所述的朗读系统上运行时，使所述朗读系统执行权利要求1-7任一项所述朗读方法的步骤。