CN111124229B

CN111124229B - 通过语音交互实现网页动画控制的方法、系统及浏览器

Info

Publication number: CN111124229B
Application number: CN201911348778.0A
Authority: CN
Inventors: 韩强; 许海振; 陈坤; 赵杰; 李滨; 张一飞
Original assignee: Shandong Shunnet Media Co ltd
Current assignee: Shandong Shunnet Media Co ltd
Priority date: 2019-12-24
Filing date: 2019-12-24
Publication date: 2022-03-11
Anticipated expiration: 2039-12-24
Also published as: CN111124229A

Abstract

本发明公开了通过语音交互实现网页动画控制的方法、系统及浏览器，包括：服务器对终端中浏览器的声音对象和动画对象分别进行初始化；服务器获取麦克风的使用权限；服务器监听麦克风输入音量；将监听到声音的音量与设定阈值进行比较，如果大于设定阈值，则开始对监听到的声音进行录制；当录制结束时，将录制好的音频转换成文字，根据转换后的文字触发对应的动画对象进行动画显示；播放完毕后返回服务器获取终端中的麦克风的使用权限步骤。

Description

通过语音交互实现网页动画控制的方法、系统及浏览器

技术领域

本公开涉及网页动画控制技术领域，特别是涉及通过语音交互实现网页动画控制的方法、系统及浏览器。

背景技术

本部分的陈述仅仅是提到了与本公开相关的背景技术，并不必然构成现有技术。

在实现本公开的过程中，发明人发现现有技术中存在以下技术问题：

目前用户与网页浏览器交互控制的实现方式有鼠标、键盘等物理设备，用户无法通过麦克风与网页浏览器进行交互。

发明内容

为了解决现有技术的不足，本公开提供了通过语音交互实现网页动画控制的服务器、系统及浏览器；实现对通过在HTML中创建麦克风对象，通过语音交互实现语义分析并控制动画的播放事件。

第一方面，本公开提供了通过语音交互实现网页动画控制的方法；

通过语音交互实现网页动画控制的方法，包括：

服务器对终端中浏览器的声音对象和动画对象分别进行初始化；

服务器获取麦克风的使用权限；

服务器监听麦克风输入音量；将监听到声音的音量与设定阈值进行比较，如果大于设定阈值，则开始对监听到的声音进行录制；

当录制结束时，将录制好的音频转换成文字，根据转换后的文字触发对应的动画对象进行动画显示；播放完毕后返回服务器获取终端中的麦克风的使用权限步骤。

第二方面，本公开还提供了通过语音交互实现网页动画控制的系统；

通过语音交互实现网页动画控制的系统，包括：

彼此连接的服务器和终端；所述终端，包括：浏览器；

服务器，用于对终端中浏览器的声音对象和动画对象分别进行初始化；服务器还用于获取麦克风的使用权限；服务器还用于监听麦克风输入音量；将监听到声音的音量与设定阈值进行比较，如果大于设定阈值，则开始对监听到的声音进行录制；当录制结束时，将录制好的音频转换成文字，根据转换后的文字触发对应的动画对象，将含有动画对象的网页发送给浏览器；

浏览器，用于对服务器发送过来的含有动画对象的网页进行动画显示。

第三方面，本公开还提供了一种浏览器；

一种浏览器，包括：

获取模块，用于获取麦克风的输入音量，并将输入音量上传给服务器；

发送模块，用于向服务器发送输入音量和动画播放请求消息；

接收模块，用于接收服务器反馈的预设网页；所述预测网页中设有动画对象；

显示模块，用于根据服务器反馈的结果，在多个预设网页之间进行切换。

与现有技术相比，本公开的有益效果是：

1、在HTML页面中，在展台等特定条件下，要实现智能无痕迹化的网页交互效果，我们选择了语音交互，通过监听HTML的麦克风对象，来实现事件触发的控制，实现交互效果。

2、在智能语音交互中，通过设置语音分贝的阈值，将语音存储为WAV格式语音文件，通过语音处理后台，进行语音和文字互转，通过转换后结果，进行问题检索和智能语音问答。

3、本方案可以实现在浏览器，通过声音输入进行语音唤醒的交互控制，并控制播放SVG的动画，满足了演示效果的需求。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。

图1为第一个实施例的方法流程图；

图2为第二个实施例的系统架构示意图。

具体实施方式

应该指出，以下详细说明都是示例性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

实施例一，本实施例提供了通过语音交互实现网页动画控制的方法；

如图1所示，通过语音交互实现网页动画控制的方法，包括：

S1：服务器对终端中浏览器的声音对象和动画对象分别进行初始化；

S2：服务器获取麦克风的使用权限；

S3：服务器监听麦克风输入音量；将监听到声音的音量与设定阈值进行比较，如果大于设定阈值，则开始对监听到的声音进行录制；

进一步地，所述方法还包括：

如果监听到声音的音量小于设定阈值，则返回服务器监听麦克风输入音音量步骤，重新监听。

上述方案的有益效果是，可以避免小音量的噪音被录制。

进一步地，录制结束的判断标准是：

如果录制过程中，监听到声音的音量大于设定阈值，则继续声音录制；

如果录制过程中，监听到声音的音量小于设定阈值且录制时间小于设定时间间隔，则继续声音录制；

如果录制过程中，监听到声音的音量小于设定阈值且录制时间大于等于设定时间间隔，则停止声音录制。

进一步地，所述根据转换后的文字触发对应的动画对象进行动画显示，具体步骤包括：

如果转换后的文字没有对应的动画对象，则返回录制声音无效所对应的动画对象；

如果转换后的文字有对应的动画对象，则返回录制声音有效所对应的动画对象。

在HTML页面中，简单的动画效果的实现可以通过CSS、Canvas、Gif图片等技术。实现复杂动画，只能借助AE等专业的视频制作软件，但这种软件制作的动画均以视频格式导出，不仅体积大占用系统资源巨大，且无法进行交互。将AE做成动画，使用bodymovin插件导出成SVG格式图片文件，把动画转成json文件，通过JS交互，在HTML中对动画进行播放。

实施例二，本实施例还提供了通过语音交互实现网页动画控制的系统；

如图2所示，通过语音交互实现网页动画控制的系统，包括：

彼此连接的服务器和终端；所述终端，包括：浏览器；

实施例三，本实施例还提供了一种浏览器。

一种浏览器，包括：

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.通过语音交互实现网页动画控制的方法，其特征是，包括：

服务器对终端中浏览器的声音对象和动画对象分别进行初始化；在HTML中创建麦克风对象，通过语音交互实现语义分析并控制动画播放；通过监听HTML的麦克风对象，来实现事件触发的控制；通过语音交互实现无痕迹化的网页交互；

服务器获取麦克风的使用权限；

当录制结束时，将录制好的音频转换成文字，根据转换后的文字触发对应的动画对象进行动画显示；将AE做成动画，使用bodymovin插件导出成SVG格式图片文件，把动画转成json文件，通过JS交互，在HTML中对动画进行播放；

播放完毕后返回服务器获取终端中的麦克风的使用权限步骤；

通过设置语音分贝的阈值，将语音存储为WAV格式语音文件，通过语音处理后台，进行语音和文字互转，通过转换后结果，进行问题检索和智能语音问答；

所述根据转换后的文字触发对应的动画对象进行动画显示，具体步骤包括：

如果转换后的文字有对应的动画对象，则返回录制声音有效所对应的动画对象；

录制结束的判断标准是：

如果监听到声音的音量小于设定阈值，则返回服务器监听麦克风输入音音量步骤，重新监听；

2.应用如权利要求1所述通过语音交互实现网页动画控制的方法的通过语音交互实现网页动画控制的系统，其特征是，包括：

彼此连接的服务器和终端；所述终端，包括：浏览器；

服务器，用于对终端中浏览器的声音对象和动画对象分别进行初始化；在HTML中创建麦克风对象，通过语音交互实现语义分析并控制动画播放；

服务器还用于获取麦克风的使用权限；服务器还用于监听麦克风输入音量；将监听到声音的音量与设定阈值进行比较，如果大于设定阈值，则开始对监听到的声音进行录制；当录制结束时，将录制好的音频转换成文字，根据转换后的文字触发对应的动画对象，将含有动画对象的网页发送给浏览器；

录制结束的判断标准是：

如果录制过程中，监听到声音的音量小于设定阈值且录制时间大于等于设定时间间隔，则停止声音录制；