CN111124229B - 通过语音交互实现网页动画控制的方法、系统及浏览器 - Google Patents
通过语音交互实现网页动画控制的方法、系统及浏览器 Download PDFInfo
- Publication number
- CN111124229B CN111124229B CN201911348778.0A CN201911348778A CN111124229B CN 111124229 B CN111124229 B CN 111124229B CN 201911348778 A CN201911348778 A CN 201911348778A CN 111124229 B CN111124229 B CN 111124229B
- Authority
- CN
- China
- Prior art keywords
- animation
- sound
- recording
- volume
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- User Interface Of Digital Computer (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了通过语音交互实现网页动画控制的方法、系统及浏览器,包括:服务器对终端中浏览器的声音对象和动画对象分别进行初始化;服务器获取麦克风的使用权限;服务器监听麦克风输入音量;将监听到声音的音量与设定阈值进行比较,如果大于设定阈值,则开始对监听到的声音进行录制;当录制结束时,将录制好的音频转换成文字,根据转换后的文字触发对应的动画对象进行动画显示;播放完毕后返回服务器获取终端中的麦克风的使用权限步骤。
Description
技术领域
本公开涉及网页动画控制技术领域,特别是涉及通过语音交互实现网页动画控制的方法、系统及浏览器。
背景技术
本部分的陈述仅仅是提到了与本公开相关的背景技术,并不必然构成现有技术。
在实现本公开的过程中,发明人发现现有技术中存在以下技术问题:
目前用户与网页浏览器交互控制的实现方式有鼠标、键盘等物理设备,用户无法通过麦克风与网页浏览器进行交互。
发明内容
为了解决现有技术的不足,本公开提供了通过语音交互实现网页动画控制的服务器、系统及浏览器;实现对通过在HTML中创建麦克风对象,通过语音交互实现语义分析并控制动画的播放事件。
第一方面,本公开提供了通过语音交互实现网页动画控制的方法;
通过语音交互实现网页动画控制的方法,包括:
服务器对终端中浏览器的声音对象和动画对象分别进行初始化;
服务器获取麦克风的使用权限;
服务器监听麦克风输入音量;将监听到声音的音量与设定阈值进行比较,如果大于设定阈值,则开始对监听到的声音进行录制;
当录制结束时,将录制好的音频转换成文字,根据转换后的文字触发对应的动画对象进行动画显示;播放完毕后返回服务器获取终端中的麦克风的使用权限步骤。
第二方面,本公开还提供了通过语音交互实现网页动画控制的系统;
通过语音交互实现网页动画控制的系统,包括:
彼此连接的服务器和终端;所述终端,包括:浏览器;
服务器,用于对终端中浏览器的声音对象和动画对象分别进行初始化;服务器还用于获取麦克风的使用权限;服务器还用于监听麦克风输入音量;将监听到声音的音量与设定阈值进行比较,如果大于设定阈值,则开始对监听到的声音进行录制;当录制结束时,将录制好的音频转换成文字,根据转换后的文字触发对应的动画对象,将含有动画对象的网页发送给浏览器;
浏览器,用于对服务器发送过来的含有动画对象的网页进行动画显示。
第三方面,本公开还提供了一种浏览器;
一种浏览器,包括:
获取模块,用于获取麦克风的输入音量,并将输入音量上传给服务器;
发送模块,用于向服务器发送输入音量和动画播放请求消息;
接收模块,用于接收服务器反馈的预设网页;所述预测网页中设有动画对象;
显示模块,用于根据服务器反馈的结果,在多个预设网页之间进行切换。
与现有技术相比,本公开的有益效果是:
1、在HTML页面中,在展台等特定条件下,要实现智能无痕迹化的网页交互效果,我们选择了语音交互,通过监听HTML的麦克风对象,来实现事件触发的控制,实现交互效果。
2、在智能语音交互中,通过设置语音分贝的阈值,将语音存储为WAV格式语音文件,通过语音处理后台,进行语音和文字互转,通过转换后结果,进行问题检索和智能语音问答。
3、本方案可以实现在浏览器,通过声音输入进行语音唤醒的交互控制,并控制播放SVG的动画,满足了演示效果的需求。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为第一个实施例的方法流程图;
图2为第二个实施例的系统架构示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一,本实施例提供了通过语音交互实现网页动画控制的方法;
如图1所示,通过语音交互实现网页动画控制的方法,包括:
S1:服务器对终端中浏览器的声音对象和动画对象分别进行初始化;
S2:服务器获取麦克风的使用权限;
S3:服务器监听麦克风输入音量;将监听到声音的音量与设定阈值进行比较,如果大于设定阈值,则开始对监听到的声音进行录制;
当录制结束时,将录制好的音频转换成文字,根据转换后的文字触发对应的动画对象进行动画显示;播放完毕后返回服务器获取终端中的麦克风的使用权限步骤。
进一步地,所述方法还包括:
如果监听到声音的音量小于设定阈值,则返回服务器监听麦克风输入音音量步骤,重新监听。
上述方案的有益效果是,可以避免小音量的噪音被录制。
进一步地,录制结束的判断标准是:
如果录制过程中,监听到声音的音量大于设定阈值,则继续声音录制;
如果录制过程中,监听到声音的音量小于设定阈值且录制时间小于设定时间间隔,则继续声音录制;
如果录制过程中,监听到声音的音量小于设定阈值且录制时间大于等于设定时间间隔,则停止声音录制。
进一步地,所述根据转换后的文字触发对应的动画对象进行动画显示,具体步骤包括:
如果转换后的文字没有对应的动画对象,则返回录制声音无效所对应的动画对象;
如果转换后的文字有对应的动画对象,则返回录制声音有效所对应的动画对象。
在HTML页面中,简单的动画效果的实现可以通过CSS、Canvas、Gif图片等技术。实现复杂动画,只能借助AE等专业的视频制作软件,但这种软件制作的动画均以视频格式导出,不仅体积大占用系统资源巨大,且无法进行交互。将AE做成动画,使用bodymovin插件导出成SVG格式图片文件,把动画转成json文件,通过JS交互,在HTML中对动画进行播放。
实施例二,本实施例还提供了通过语音交互实现网页动画控制的系统;
如图2所示,通过语音交互实现网页动画控制的系统,包括:
彼此连接的服务器和终端;所述终端,包括:浏览器;
服务器,用于对终端中浏览器的声音对象和动画对象分别进行初始化;服务器还用于获取麦克风的使用权限;服务器还用于监听麦克风输入音量;将监听到声音的音量与设定阈值进行比较,如果大于设定阈值,则开始对监听到的声音进行录制;当录制结束时,将录制好的音频转换成文字,根据转换后的文字触发对应的动画对象,将含有动画对象的网页发送给浏览器;
浏览器,用于对服务器发送过来的含有动画对象的网页进行动画显示。
实施例三,本实施例还提供了一种浏览器。
一种浏览器,包括:
获取模块,用于获取麦克风的输入音量,并将输入音量上传给服务器;
发送模块,用于向服务器发送输入音量和动画播放请求消息;
接收模块,用于接收服务器反馈的预设网页;所述预测网页中设有动画对象;
显示模块,用于根据服务器反馈的结果,在多个预设网页之间进行切换。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (2)
1.通过语音交互实现网页动画控制的方法,其特征是,包括:
服务器对终端中浏览器的声音对象和动画对象分别进行初始化;在HTML中创建麦克风对象,通过语音交互实现语义分析并控制动画播放;通过监听HTML的麦克风对象,来实现事件触发的控制;通过语音交互实现无痕迹化的网页交互;
服务器获取麦克风的使用权限;
服务器监听麦克风输入音量;将监听到声音的音量与设定阈值进行比较,如果大于设定阈值,则开始对监听到的声音进行录制;
当录制结束时,将录制好的音频转换成文字,根据转换后的文字触发对应的动画对象进行动画显示;将AE做成动画,使用bodymovin插件导出成SVG格式图片文件,把动画转成json文件,通过JS交互,在HTML中对动画进行播放;
播放完毕后返回服务器获取终端中的麦克风的使用权限步骤;
通过设置语音分贝的阈值,将语音存储为WAV格式语音文件,通过语音处理后台,进行语音和文字互转,通过转换后结果,进行问题检索和智能语音问答;
所述根据转换后的文字触发对应的动画对象进行动画显示,具体步骤包括:
如果转换后的文字没有对应的动画对象,则返回录制声音无效所对应的动画对象;
如果转换后的文字有对应的动画对象,则返回录制声音有效所对应的动画对象;
录制结束的判断标准是:
如果监听到声音的音量小于设定阈值,则返回服务器监听麦克风输入音音量步骤,重新监听;
如果录制过程中,监听到声音的音量大于设定阈值,则继续声音录制;
如果录制过程中,监听到声音的音量小于设定阈值且录制时间小于设定时间间隔,则继续声音录制;
如果录制过程中,监听到声音的音量小于设定阈值且录制时间大于等于设定时间间隔,则停止声音录制。
2.应用如权利要求1所述通过语音交互实现网页动画控制的方法的通过语音交互实现网页动画控制的系统,其特征是,包括:
彼此连接的服务器和终端;所述终端,包括:浏览器;
服务器,用于对终端中浏览器的声音对象和动画对象分别进行初始化;在HTML中创建麦克风对象,通过语音交互实现语义分析并控制动画播放;
服务器还用于获取麦克风的使用权限;服务器还用于监听麦克风输入音量;将监听到声音的音量与设定阈值进行比较,如果大于设定阈值,则开始对监听到的声音进行录制;当录制结束时,将录制好的音频转换成文字,根据转换后的文字触发对应的动画对象,将含有动画对象的网页发送给浏览器;
通过设置语音分贝的阈值,将语音存储为WAV格式语音文件,通过语音处理后台,进行语音和文字互转,通过转换后结果,进行问题检索和智能语音问答;
所述根据转换后的文字触发对应的动画对象进行动画显示,具体步骤包括:
如果转换后的文字没有对应的动画对象,则返回录制声音无效所对应的动画对象;
如果转换后的文字有对应的动画对象,则返回录制声音有效所对应的动画对象;
录制结束的判断标准是:
如果录制过程中,监听到声音的音量大于设定阈值,则继续声音录制;
如果录制过程中,监听到声音的音量小于设定阈值且录制时间小于设定时间间隔,则继续声音录制;
如果录制过程中,监听到声音的音量小于设定阈值且录制时间大于等于设定时间间隔,则停止声音录制;
浏览器,用于对服务器发送过来的含有动画对象的网页进行动画显示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911348778.0A CN111124229B (zh) | 2019-12-24 | 2019-12-24 | 通过语音交互实现网页动画控制的方法、系统及浏览器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911348778.0A CN111124229B (zh) | 2019-12-24 | 2019-12-24 | 通过语音交互实现网页动画控制的方法、系统及浏览器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111124229A CN111124229A (zh) | 2020-05-08 |
CN111124229B true CN111124229B (zh) | 2022-03-11 |
Family
ID=70502008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911348778.0A Active CN111124229B (zh) | 2019-12-24 | 2019-12-24 | 通过语音交互实现网页动画控制的方法、系统及浏览器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111124229B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112419471B (zh) * | 2020-11-19 | 2024-04-26 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置及智能设备、存储介质 |
CN112700779A (zh) * | 2020-12-29 | 2021-04-23 | 南方电网深圳数字电网研究院有限公司 | 语音交互方法、系统、浏览器及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750125A (zh) * | 2011-04-19 | 2012-10-24 | 无锡天堂软件技术有限公司 | 基于语音的控制方法与控制系统 |
CN102981738A (zh) * | 2012-10-31 | 2013-03-20 | 北京百度网讯科技有限公司 | 通过麦克风与网页进行交互的方法、系统及浏览器 |
CN105957530A (zh) * | 2016-04-28 | 2016-09-21 | 海信集团有限公司 | 一种语音控制方法、装置和终端设备 |
CN106095905A (zh) * | 2016-06-08 | 2016-11-09 | 上海未达数码科技有限公司 | 基于ppt播放的互联网交互平台 |
CN109857352A (zh) * | 2017-11-30 | 2019-06-07 | 富泰华工业(深圳)有限公司 | 动画显示方法及人机交互装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103034695A (zh) * | 2012-12-03 | 2013-04-10 | 北京奇虎科技有限公司 | 浏览器中进行声音控制的方法及装置 |
CN104123085B (zh) * | 2014-01-14 | 2015-08-12 | 腾讯科技(深圳)有限公司 | 通过语音访问多媒体互动网站的方法和装置 |
CN104133847B (zh) * | 2014-07-01 | 2018-04-24 | 北京奇虎科技有限公司 | 一种浏览器中进行声音控制的方法和装置 |
CN113794800B (zh) * | 2018-11-23 | 2022-08-26 | 华为技术有限公司 | 一种语音控制方法及电子设备 |
CN110503942A (zh) * | 2019-08-29 | 2019-11-26 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的语音驱动动画方法和装置 |
CN110534108A (zh) * | 2019-09-25 | 2019-12-03 | 北京猎户星空科技有限公司 | 一种语音交互方法及装置 |
-
2019
- 2019-12-24 CN CN201911348778.0A patent/CN111124229B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750125A (zh) * | 2011-04-19 | 2012-10-24 | 无锡天堂软件技术有限公司 | 基于语音的控制方法与控制系统 |
CN102981738A (zh) * | 2012-10-31 | 2013-03-20 | 北京百度网讯科技有限公司 | 通过麦克风与网页进行交互的方法、系统及浏览器 |
CN105957530A (zh) * | 2016-04-28 | 2016-09-21 | 海信集团有限公司 | 一种语音控制方法、装置和终端设备 |
CN106095905A (zh) * | 2016-06-08 | 2016-11-09 | 上海未达数码科技有限公司 | 基于ppt播放的互联网交互平台 |
CN109857352A (zh) * | 2017-11-30 | 2019-06-07 | 富泰华工业(深圳)有限公司 | 动画显示方法及人机交互装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111124229A (zh) | 2020-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110460872B (zh) | 视频直播的信息显示方法、装置、设备和存储介质 | |
CN111669623B (zh) | 视频特效的处理方法、装置以及电子设备 | |
JP2023553101A (ja) | ライブストリーミングインタラクション方法、装置、デバイス及び媒体 | |
CN107040452B (zh) | 一种信息处理方法、装置和计算机可读存储介质 | |
CN111124229B (zh) | 通过语音交互实现网页动画控制的方法、系统及浏览器 | |
CN113873195B (zh) | 视频会议控制方法、装置和存储介质 | |
CN105122353A (zh) | 用于虚拟个人助理系统的自然人-计算机交互 | |
CN109360567A (zh) | 可定制唤醒的方法和装置 | |
JP2007180828A5 (zh) | ||
CN109728994B (zh) | 通话方法、装置及计算机可读存储介质 | |
CN111524516A (zh) | 一种基于语音交互的控制方法、服务器及显示设备 | |
CN110221759A (zh) | 一种元素拖拽方法、装置、存储介质及交互智能平板 | |
CN114244821B (zh) | 数据处理方法、装置、设备、电子设备和存储介质 | |
CN114339069A (zh) | 视频处理方法、装置、电子设备及计算机存储介质 | |
CN111312243B (zh) | 设备交互方法和装置 | |
CN104702758B (zh) | 一种终端及其管理多媒体记事本的方法 | |
CN110196900A (zh) | 用于终端的交互方法和装置 | |
CN114125498B (zh) | 视频数据处理方法、装置、设备以及存储介质 | |
CN106547731B (zh) | 在直播间发言的方法及装置 | |
KR20220041791A (ko) | 생방송 정보 처리 방법, 장치, 기기, 저장 매체 및 컴퓨터 프로그램 | |
Wang | Application of android system software in English listening and speaking teaching | |
CN112786031B (zh) | 人机对话方法及系统 | |
JP2022091933A (ja) | 音声応答速度確定方法、装置、コンピュータ読み取り可能な記憶媒体及びコンピュータプログラム | |
CN117319340A (zh) | 语音消息的播放方法、装置、终端及存储介质 | |
CN111652344A (zh) | 用于呈现信息的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |