CN112419471A - 一种数据处理方法、装置及智能设备、存储介质 - Google Patents
一种数据处理方法、装置及智能设备、存储介质 Download PDFInfo
- Publication number
- CN112419471A CN112419471A CN202011305109.8A CN202011305109A CN112419471A CN 112419471 A CN112419471 A CN 112419471A CN 202011305109 A CN202011305109 A CN 202011305109A CN 112419471 A CN112419471 A CN 112419471A
- Authority
- CN
- China
- Prior art keywords
- data
- target
- dimensional object
- audio
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 33
- 238000009877 rendering Methods 0.000 claims abstract description 89
- 238000012545 processing Methods 0.000 claims abstract description 82
- 238000000034 method Methods 0.000 claims description 61
- 238000012544 monitoring process Methods 0.000 claims description 41
- 230000008569 process Effects 0.000 claims description 31
- 230000015654 memory Effects 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 18
- 230000000694 effects Effects 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000012550 audit Methods 0.000 claims description 9
- 238000012986 modification Methods 0.000 claims description 8
- 230000004048 modification Effects 0.000 claims description 8
- 230000001133 acceleration Effects 0.000 claims description 4
- 230000001739 rebound effect Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 25
- 238000005516 engineering process Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 11
- 230000002452 interceptive effect Effects 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 208000002173 dizziness Diseases 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 241000820057 Ithone Species 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/50—Lighting effects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
Landscapes
- Engineering & Computer Science (AREA)
- Computer Graphics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请实施例公开了一种数据处理方法、装置及智能设备、存储介质,该数据处理方法包括:通过浏览器调用多媒体获取接口创建的音频处理节点获取音频数据;获取音频数据对应的文本数据,文本数据是对音频数据进行语音识别后确定的;通过浏览器的图像渲染元素对文本数据进行渲染,生成目标三维对象,文本数据显示于目标三维对象的表面;在浏览器的浏览页面中显示目标三维对象。采用本申请实施例,可以在浏览器中对文本数据进行三维展示。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理方法、装置及智能设备、存储介质。
背景技术
目前,文本数据一般按照文字形态在浏览器中进行展示,在浏览器中按照文字形态展示文本数据可以是指在浏览器中展示文本数据的具体内容。例如,文本数据是通过浏览器的搜索功能搜索到的,在浏览器中展示搜索到的文本数据的具体内容;或者,文本数据是输入至浏览器中的(例如输入至浏览器中的弹幕数据、输入至浏览器中的会话数据等等),在浏览器中展示输入的文本数据的具体内容。实际应用中,在浏览器中按照文字形态展示文本数据比较单一、展示效果较差。
发明内容
本申请实施例提供了一种数据处理方法、装置及智能设备、存储介质,可以在浏览器中对文本数据进行三维展示。
一方面,本申请实施例提供一种数据处理方法,该数据处理方法包括:
通过浏览器调用多媒体获取接口创建的音频处理节点获取音频数据;
获取音频数据对应的文本数据,文本数据是对音频数据进行语音识别后确定的;
通过浏览器的图像渲染元素对文本数据进行渲染,生成目标三维对象,文本数据显示于目标三维对象的表面;
在浏览器的浏览页面中显示目标三维对象。
另一方面,本申请实施例提供一种数据处理装置,该数据处理装置包括:
获取单元,用于通过浏览器调用多媒体获取接口创建的音频处理节点获取音频数据;
获取单元,还用于获取音频数据对应的文本数据,文本数据是对音频数据进行语音识别后确定的;
处理单元,用于通过浏览器的图像渲染元素对文本数据进行渲染,生成目标三维对象,文本数据显示于目标三维对象的表面;
显示单元,用于在浏览器的浏览页面中显示目标三维对象。
另一方面,本申请实施例提供一种智能设备,该智能设备包括:
处理器,适于实现计算机程序;以及,
存储器,存储器存储有计算机程序,计算机程序由处理器加载并运行时,实现上述的数据处理方法。
另一方面,本申请实施例提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被计算机设备的处理器读取并执行时,使得计算机设备执行上述的数据处理方法。
另一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的数据处理方法。
本申请实施例中,针对文本数据,浏览器的图像渲染元素可以用于对文本数据进行三维渲染,可以通过浏览器的图像渲染元素将文本数据渲染至目标三维对象(例如球体、长方体、正方体等三维对象)的表面;在浏览器的浏览页面中显示对文本数据进行三维渲染后得到的目标三维对象,提升了浏览器对文本数据的展示效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种数据处理系统的架构示意图;
图2是本申请实施例提供的一种数据处理方法的流程示意图;
图3是本申请实施例提供的一种浏览页面的示意图;
图4是本申请实施例提供的另一种浏览页面的示意图;
图5是本申请实施例提供的另一种浏览页面的示意图;
图6是本申请实施例提供的一种多功能展台的结构示意图;
图7是本申请实施例提供的另一种数据处理方法的流程示意图;
图8是本申请实施例提供的一种速度数据设置过程的示意图;
图9是本申请实施例提供的一种移动轨迹设置过程的示意图;
图10是本申请实施例提供的一种实时控制目标三维对象的移动轨迹的示意图;
图11是本申请实施例提供的一种三维对象接触方式的示意图;
图12是本申请实施例提供的另一种数据处理方法的流程示意图;
图13是本申请实施例提供的一种设置页面的示意图;
图14是本申请实施例提供的一种数据处理装置的结构示意图;
图15是本申请实施例提供的一种智能设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种数据处理方案,在该数据处理方案中可以获取音频数据对应的文本数据,并对获取到的文本数据进行三维渲染,生成目标三维对象;文本数据是对音频数据进行语音识别后确定得到的,音频数据的语音识别过程涉及人工智能的语音技术。其中:
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
语音技术(Speech Technology)的关键技术有自动语音识别技术(Automa ticSpeech Recognition,ASR)和语音合成技术(Text to Speech,TTS)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。
本申请实施例涉及浏览器(Web Browser),浏览器可以是指用于检索、展示以及传递Web(World Wide Web,全球广域网)信息资源的应用程序,Web信息资源由统一资源标识符(Uniform Resource Identifier,URI)所标记,Web信息资源可以是文本数据、网页数据、图片数据、视频数据或者任何可以在We b上所呈现的内容。针对Web信息资源是文本数据的情况,本申请实施例对文本数据在浏览器中的展现形态进行创新,打破文本数据在浏览器中的常规展现形态,提出了一种可以在浏览器中对文本数据进行三维渲染并展示的数据处理方案。在该数据处理方案中,可以通过浏览器的图像渲染元素将文本数据渲染至目标三维对象的表面,并采用渲染得到的目标三维对象在浏览器中展示文本数据,有效提升了浏览器对文本数据的展示效果。
其中,目标三维对象可以包括但不限于以下任一种:球体、正方体、长方体、圆柱体、圆锥体等等,本申请实施例以目标三维对象是球体为例进行说明。图像渲染元素(Canvas)是HTML5(Hyper Text Markup Language 5,超文本标记语言5.0)中的一个元素,图像渲染元素可以采用JavaScript脚本语言进行图像动态渲染。
图1是本申请实施例提供的一种数据处理系统的架构示意图,如图1所示,该数据处理系统包括N个终端设备(例如第一终端设备101、第二终端设备102)和服务器103,N为正整数。其中,N个终端设备中的任一个终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能可穿戴设备等具备显示功能的设备,但并不局限于此。N个终端设备中的任一个终端设备可以支持浏览器的运行。服务器103可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器,本申请实施例在此不作限制。N个终端设备与服务器103可以通过有线通信或者无线通信方式进行直接或间接地连接,本申请实施例在此不做限制。
图2是本申请实施例提供的一种数据处理方法的流程示意图,图2所示的数据处理方法由图1所示的数据处理系统中的第一终端设备101、第二终端设备102以及服务器103交互执行,数据处理方法由第一终端设备101、第二终端设备102以及服务器103交互执行仅用于示例,并不构成对本申请实施例的限定。下面将结合图1以及图2所示实施例对本申请实施例提供的数据处理方法进行介绍,该数据处理方法可以包括以下步骤S201至步骤S210:
S201:第一终端设备获取音频数据。
第一终端设备是N个终端设备中的任一个终端设备。可以采用第一终端设备中的多媒体采集设备(例如第一终端设备中的麦克风)采集录音音频,音频数据是对录音音频进行处理得到的。对录音音频的具体处理过程可参见图12所示实施例中步骤S1202的描述。
S202:第一终端设备将音频数据发送至服务器。
在一个实施例中,第一终端设备可以将音频数据发送至服务器,由服务器对音频数据进行识别处理;在此实施例中,步骤S202执行结束后执行步骤S203。在另一个实施例中,第一终端设备获取到音频数据后,可以直接对音频数据进行识别处理,得到音频数据对应的文本数据;在此实施例中,步骤S202执行结束后执行步骤S206。
S203:服务器对音频数据进行识别处理,得到音频数据对应的文本数据。
S204:服务器将文本数据发送至第一终端设备。
S205:第一终端设备接收服务器返回的文本数据。
第一终端设备可以通过Ajax(Asynchronous JavaScript And XML(Extensi bleMarkup Language,可扩展标记语言))方式将音频数据发送至服务器,并通过Ajax方式接受服务器返回的音频数据对应的文本数据。Ajax是一种创建交互式、快速动态网页应用的网页开发技术,由于服务器不能主动向第一终端设备返回数据,因此第一终端设备需要通过Ajax方式向服务器发起请求,请求服务器返回对音频数据进行语音识别得到的文本数据。
S206:第一终端设备将文本数据发送至服务器。
S207:服务器将文本数据发送至第二终端设备。
第二终端设备是N个终端设备中除第一终端设备之外的任一个终端设备。本申请实施例中服务器将文本数据发送至第二终端设备仅用于举例,实际应用中,服务器可以将文本数据分别发送至N个终端设备中除第一终端设备之外的其他终端设备,从而实现文本数据在N个终端设备中的实时同步。
本申请实施例可以通过WebSocket(基于TCP(Transmission Control Proto col,传输控制协议)的全双工通信协议)技术实现文本数据在N个终端设备中的实时同步。WebSocket技术可以在终端设备与服务器之间打开交互式通信会话,使得终端设备和服务器之间的数据交换变得更加简单,WebSocket技术允许服务器主动向终端设备推送数据。具体地,N个终端设备分别通过WebSocket API(Application Programming Interface,应用程序编程接口)访问服务器,并通过WebSocket API接收服务器返回的文本数据,通过WebSocket API,终端设备和服务器只需要完成一次握手,两者之间就可以创建持久性的连接,并可以进行双向数据传输。
S208:第二终端设备接收服务器发送的文本数据。
S209:第一终端设备(第二终端设备)通过浏览器的图像渲染元素对文本数据进行渲染,得到目标三维对象。
S210:第一终端设备(第二终端设备)在第一终端设备(第二终端设备)的浏览器的浏览页面中显示目标三维对象。
本申请实施例中,文本数据可以通过WebSocket技术在N个终端设备中实现实时同步;N个终端设备中的任一个终端设备可以通过浏览器的图像渲染元素将文本数据渲染至目标三维对象的表面,并在浏览器的浏览页面中显示目标三维对象,即目标三维对象可以显示于N个终端设备的浏览器的浏览页面中,对文本数据进行丰富有趣的视觉转换,丰富了文本数据在浏览器中的展现形态,实现了文本数据在N个终端设备之间的互动,有效提升了浏览器对文本数据的展示效果。
可以理解的是,本申请实施例描述的数据处理系统是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着系统架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
本申请实施例提供的数据处理方案以及数据处理系统可以应用于多个应用场景,例如应用于游戏互动场景、应用于社交会话场景以及应用于互动展台场景等等,下面对本申请实施例提供的数据处理方案以及数据处理系统的具体应用场景进行介绍:
(1)游戏互动场景
N个用户分别通过N个终端设备中运行的浏览器参与游戏,例如用户1通过第一终端设备中运行的浏览器参与游戏,用户2通过第二终端设备中运行的浏览器参与游戏等等,浏览器的浏览页面分别显示于参与游戏的N个终端设备中。参与游戏的N个用户分别通过N个终端设备中的麦克风向浏览器的浏览页面输入录音音频,N个终端设备从录音音频中获取音频数据,并对音频数据对应的文本数据进行三维渲染,得到目标三维对象以及M个共享三维对象,M为正整数;目标三维对象以及M个共享三维对象可以动态显示于浏览页面中,例如目标三维对象以及M个共享三维对象可以按照各个三维对象生成时间的先后顺序从浏览页面的底部加速上升至浏览页面的顶部,或者目标三维对象以及M个共享三维对象可以从浏览页面的四周向浏览页面的中心移动等等。
图3是本申请实施例提供的一种浏览页面的示意图,如图3所示,4个用户分别通过4个终端设备中运行的浏览器参与游戏,浏览页面30中显示有参与游戏的4个用户的虚拟形象。浏览页面30中还显示有目标三维对象301以及M(图3中以M=3为例)个共享三维对象(分别是第一共享三维对象302、第二共享三维对象303、第三共享三维对象304);目标三维对象301、第一共享三维对象302、第二共享三维对象303以及第三共享三维对象304均为球体(例如气泡),目标三维对象301、第一共享三维对象302、第二共享三维对象303以及第三共享三维对象304被赋予随机颜色、随机光线。目标三维对象301、第一共享三维对象302、第二共享三维对象303以及第三共享三维对象304按照各个三维对象生成时间的先后顺序从浏览页面30的底部加速上升至浏览页面30的顶部。
如图3所示,若目标三维对象301的球心与第一共享三维对象302的球心之间的距离小于或等于距离阈值(例如距离阈值可以是目标三维对象301的半径与第一共享三维对象302的半径之和),则目标三维对象301与第一共享三维对象302处于碰撞状态,目标三维对象301与第一共享三维对象302在浏览页面30中产生反弹效果(例如目标三维对象301与第一共享三维对象302产生形变并产生反弹)。
图4是本申请实施例提供的另一种浏览页面的示意图,如图4所示,若目标三维对象301的表面、第一共享三维对象302的表面与第二共享三维对象303的表面两两相互接触,则目标三维对象301、第一共享三维对象302、第二共享三维对象303产生接触;若目标三维对象301、第一共享三维对象302、第二共享三维对象303具有相同的颜色,则在浏览页面30中对目标三维对象301、第一共享三维对象302、第二共享三维对象303进行消除处理,即目标三维对象301、第一共享三维对象302与第二共享三维对象303在浏览页面30中产生消失效果,目标三维对象301、第一共享三维对象302与第二共享三维对象303在浏览页面30中破裂消失。若目标三维对象301、第一共享三维对象302、第二共享三维对象303的颜色不相同,则如图3所示实施例,目标三维对象301、第一共享三维对象302以及第二共享三维对象302在浏览页面30中产生反弹效果。
图3及图4所示实施例中,游戏玩家输入至浏览器的音频数据被渲染在三维对象的表面上,通过设置反弹条件(例如两个三维对象的球心之间的距离小于或等于两个三维对象的半径之和)以及消除条件(例如三个三维对象相互接触且三个三维对象具备相同的颜色),在浏览器的浏览页面中实现了多人多端的三维互动游戏,并且采用三维对象这一展现形态在浏览页面中显示游戏中涉及的音频数据对应的文本数据,使得浏览页面中文本数据的展现形态更加生动形象。
(2)社交会话场景
N个用户分别通过N个终端设备中运行的浏览器参与社交会话,例如用户1通过第一终端设备中运行的浏览器参与社交会话,用户2通过第二终端设备中运行的浏览器参与社交会话,浏览器的浏览页面(即社交会话场景中的会话页面)分别显示于参与社交会话的N个终端设备中。参与社交会话的N个用户分别通过N个终端设备中的麦克风向浏览页面输入录音音频,N个终端设备从录音音频中获取音频数据,并对音频数据对应的文本数据进行三维渲染,得到N个终端设备中每个终端设备对应的三维对象。N个终端设备中每个终端设备对应的三维对象是指对通过该终端设备输入的音频数据对应的文本数据进行三维渲染得到的三维对象,例如第一终端设备对应的三维对象是指对通过第一终端设备输入的音频数据对应的文本数据进行三维渲染得到的三维对象,第二终端设备对应的三维对象是指对通过第二终端设备输入的音频数据对应的文本数据进行三维渲染得到的三维对象等等。N个终端设备中的每个终端设备对应的三维对象可以动态显示于浏览页面中。
以第一终端设备和第二终端设备参与社交会话为例,请参见图5,图5是本申请实施例提供的另一种浏览页面的示意图。浏览页面30中包含第一终端设备的对象展示区域501和第二终端设备的对象展示区域502,第一终端设备的对象展示区域501用于展示至少一个第一终端设备对应的三维对象503,第二终端设备的对象展示区域502用于展示至少一个第二终端设备对应的三维对象504。至少一个第一终端设备对应的三维对象503可以按照各个三维对象生成时间的先后顺序,从第一终端设备的对象展示区域501的底部加速上升至第一终端设备的对象展示区域501的顶部,至少一个第二终端设备对应的三维对象504可以按照各个三维对象生成时间的先后顺序,从第二终端设备的对象展示区域502的底部加速上升至第二终端设备的对象展示区域502的顶部。第一终端设备对应的三维对象503的颜色与第二终端设备对应的三维对象504的颜色可以不相同,例如第一终端设备对应的三维对象503的颜色为第一颜色(例如灰色),第二终端设备对应的三维对象504的颜色为第二颜色(例如黑色)。浏览页面30中还可以包含第一终端设备对应的虚拟形象505(即用户1的虚拟形象)和第二终端设备对应的虚拟形象506(即用户2的虚拟形象)。
在一个实施例中,可以根据文本数据的语义对虚拟形象的表情进行调整。如图5所示,第一终端设备对应的三维对象503中显示的文本数据是“开心”,可以根据文本数据“开心”的语义对第一终端设备对应的虚拟形象505的表情进行调整,调整为开心的表情;第二终端设备对应的三维对象504中显示的文本数据是“头晕”,可以根据文本数据“头晕”的语义对第二终端设备对应的虚拟形象506的表情进行调整,调整为头晕的表情。
图5所示实施例中,参与社交会话的多个用户输入至浏览器的音频数据对应的文本数据被渲染在三维对象的表面上,每个用户对应的三维对象显示于浏览页面中该用户对应的对象展示区域中,在浏览器的浏览页面中实现了多人参与的社交会话,采用三维对象这一展现形态在浏览页面中显示社交会话中涉及的音频数据对应的文本数据,使得浏览页面中文本数据的展现形态更加生动丰富。并且,多人参与社交会话的浏览页面中还可以包括多个用户的虚拟形象,还可以根据每个用户对应的三维对象中显示的文本数据的语义对该用户的虚拟形象的表情进行调整,增加了社交会话过程的趣味性。
(3)互动展台场景
在互动展台场景中,N个终端设备中的任一个终端设备可以是由显示器、麦克风组成的多功能展台。图6是本申请实施例提供的一种多功能展台的结构示意图,如图6所示,多功能展台可以包括显示器601,麦克风602,以及音频采集区域604,麦克风602中设置有录音控制开关603。麦克风602用于采集录音音频,用户可以在音频采集区域604中通过麦克风602输入录音音频,当录音控制开关603被开启时,麦克风602开始采集录音音频,当录音控制开关603被关闭时,麦克风602停止采集录音音频。浏览页面30显示于显示器601中,显示器601用于对录音音频中包含的音频数据对应的文本数据进行渲染,得到目标三维对象,并在浏览页面30中显示目标三维对象。通过该多功能展台也可以实现多人互动游戏以及多人社交会话,具体可参见图3至图5所示实施例的描述,在此不再赘述。
图6所示实施例中,多功能展台可以设置于博物馆、展览馆、体育馆等场馆内,参观场馆的用户可以通过多功能展台与其他场馆中的用户进行互动,实现了多个场馆之间的互动,增加了趣味性。
请参见图7,图7是本申请实施例提供的另一种数据处理方法的流程示意图,该数据处理方法可以由一个智能设备来执行,该智能设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能可穿戴设备等具备显示功能的设备;例如,该智能设备可以是图1所示的数据处理系统中的任一个终端设备。该数据处理方法包括以下步骤S701至步骤S704:
S701:通过浏览器调用多媒体获取接口创建的音频处理节点获取音频数据。
通过浏览器的多媒体获取接口可以获取录音音频,通过调用多媒体获取接口创建的音频处理节点可以对录音音频进行处理,得到音频数据。具体可参见图12所示实施例步骤S1202的描述。
S702:获取音频数据对应的文本数据。
在一个实施例中,可以将音频数据发送至服务器,并接收服务器对音频数据进行语音识别得到的语音识别结果,语音识别结果包括文本数据。在另一个实施例中,还可以直接对音频数据进行语音识别处理,得到语音识别结果,语音识别结果包括文本数据。具体可参见图12所示实施例中步骤S1203的描述。
S703:通过浏览器的图像渲染元素对文本数据进行渲染,生成目标三维对象。
图像渲染元素可以包括二维图像渲染元素和三维图像渲染元素,可通过二维图像渲染元素和三维图像渲染元素对文本数据进行渲染,生成目标三维对象。在一个实施例中,可以通过二维图像渲染元素的文字绘制接口(canvas API co ntext)按照排版规则将文本数据绘制到画布上,得到目标画布;通过二维图像渲染元素的图片转换接口(toDataURLAPI)对目标画布进行转换,生成目标图片;通过三维图像渲染元素调用的三维绘图接口(WebGL API)将目标图片渲染到原始三维对象上,得到目标三维对象,文本数显示于目标三维对象的表面。通过二维图像渲染元素对文本数据进行渲染,生成目标图片的过程可参见如下述代码段:
var canvas=document.getElementById('canvasWord');
var context=canvas.getContext('2d');
context.fillStyle=color;
context.fillText(word,x,y);
var dataUri=canvas.toDataURL();
如上述代码段所示,代码段中的第一行代码的含义是获取二维图像渲染元素;代码段中的第二行代码的含义是获取二维图像渲染元素的画布;代码段中的第三行代码含义是向画布中填充颜色;代码段中的第四行代码的含义是通过二维图像渲染元素的文字绘制接口将文本数据绘制到画布上,得到目标画布;代码段中的第五行代码的含义是通过二维图像渲染元素的图片转换接口对目标画布进行转换,得到目标图片。
其中,WebGL是一种三维绘图标准,可以把JavaScript脚本语言和OpenGL ES 2.0(OpenGL for Embedded Systems 2.0)结合在一起;OpenGL ES 2.0是OpenGL(OpenGraphics Library,开放图形库)三维图形API的子集;Web GL API是JavaScript脚本语言操作OpenGL的接口;OpenGL是用于渲染二维、三维矢量图形的跨语言、跨平台的应用程序编程接口;WebGL可以为三维图像渲染元素提供硬件加速渲染能力,加快对文本数据的渲染过程,从而提升文本数据在浏览页面中的展现效率。WebGL的着色器(Shader)可以将颜色数据渲染至目标三维对象的表面,从而目标三维对象被赋予颜色。
目标三维对象的体积可以与文本数据的数据量相关;文本数据的数据量越大,目标三维对象的体积越大,文本数据的数据量越小,目标三维对象的体积越小。例如,第一文本数据中包含3个字符,第二文本数据中包含5个字符,第二文本数据的数据量大于第一文本数据的数据量,那么对第一文本数据渲染得到的目标三维对象的体积小于对第二文本数据渲染得到的目标三维对象的体积。
S704:在浏览器的浏览页面中显示目标三维对象。
目标三维对象在浏览页面中动态显示,可以获取目标三维对象的速度数据,并按照速度数据在浏览页面中动态显示目标三维对象。其中,速度数据是三维数据(Vertory3D),速度数据用于控制目标三维对象在浏览页面上的运动速度;速度数据可以包括用于控制目标三维对象在浏览页面中向上移动或向下移动的纵轴速度、用于控制目标三维对象在浏览页面中向左移动或向右移动的横轴速度。在一个实施例中,速度数据可以是浏览器中默认设置的。在另一个实施例中,速度数据可以是在浏览器的设置页面或设置窗口中预先设置的。浏览页面中包含设置访问入口,若设置访问入口被选中,在浏览器中显示设置页面;设置页面中包括纵轴速度设置项和横轴速度设置项;纵轴速度设置项用于设置纵轴速度,可以将纵轴速度设置项中设置的值确定为纵轴速度;横轴速度设置项用于设置横轴速度,可以将横轴速度设置项中设置的值确定为横轴速度。或者,浏览页面中包含设置访问入口,若设置访问入口被选中,在浏览页面中显示设置窗口;设置窗口中包括纵轴速度设置项和横轴速度设置项;纵轴速度设置项用于设置纵轴速度,可以将纵轴速度设置项中设置的值确定为纵轴速度;横轴速度设置项用于设置横轴速度,可以将横轴速度设置项中设置的值确定为横轴速度。
图8是本申请实施例提供的一种速度数据设置过程的示意图,如图8所示,浏览页面30中包含设置访问入口801,若设置访问入口801被选中,在浏览页面30中显示设置窗口804;设置窗口804中包括纵轴速度设置项802和横轴速度设置项803;纵轴速度设置项802用于设置纵轴速度,横轴速度设置项803用于设置横轴速度。
目标三维对象在浏览页面中动态显示,可以通过移动操作对目标三维对象的在浏览页面中的移动轨迹进行控制。可以响应于对目标三维对象的移动操作,并按照移动操作指示的移动轨迹,在浏览页面中动态显示目标三维对象;其中,目标三维对象在浏览页面中的移动轨迹与移动操作指示的移动轨迹相匹配。在一个实施例中,可以在浏览页面的轨迹设置窗口中预先设置目标三维对象的移动轨迹,浏览页面中包含轨迹设置入口,当轨迹设置入口被选中时,在浏览页面中显示轨迹设置窗口,轨迹设置窗口用于设置目标三维对象的移动轨迹。在另一种实现方式中,还可以通过移动操作对目标三维对象的移动轨迹进行实时控制,实时控制可以是指目标三维对象的移动轨迹与移动操作指示的移动轨迹实时同步。
图9是本申请实施例提供的一种移动轨迹设置过程的示意图,如图9所示,浏览页面30中包含轨迹设置入口901,当轨迹设置入口901被选中时,在浏览页面30中显示轨迹设置窗口902,轨迹设置窗口902用于设置目标三维对象的移动轨迹,设置的目标三维对象的一条移动轨迹903显示于轨迹设置窗口902中。图10是本申请实施例提供的一种实时控制目标三维对象的移动轨迹的示意图,如图10所示,通过移动操作(例如使用手指、鼠标等拖动目标三维对象移动)对目标三维对象的移动轨迹进行实时控制,目标三维对象的移动轨迹1001与移动操作指示的移动轨迹1002实时同步。
浏览页面中显示有目标三维对象和M个共享三维对象,M为正整数。若目标三维对象与M个共享三维对象中的第i个共享三维对象处于碰撞状态,获取目标三维对象的弹性数据,以及获取第i个共享三维对象的弹性数据;第i个共享三维对象是M个共享三维对象中的任一个,i为正整数且i∈[1,M];按照目标三维对象的弹性数据在浏览页面中动态显示所述目标三维对象,以及按照第i个共享三维对象的弹性数据在浏览页面中动态显示第i个共享三维对象;其中,弹性数据可以包括:用于产生反弹效果的反弹加速度、用于产生形变效果的形变参数。在一个实施例中,目标三维对象与M个共享三维对象中的第i个共享三维对象处于碰撞状态可以是指:目标三维对象与第i个共享三维对象之间的像素距离小于或等于距离阈值,例如图3所示实施例中,目标三维对象与第i个共享三维对象均为球体,像素距离可以是指目标三维对象的球心与第i个共享三维对象的球心之间的距离,距离阈值可以是指目标三维对象的半径与第i个共享三维对象的半径之和。
浏览页面中显示有目标三维对象和M个共享三维对象,M为正整数。若目标三维对象与M个共享三维对象中的P个共享三维对象产生接触,则获取目标三维对象的属性数据,以及获取P个共享三维对象的属性数据,P为小于或等于M的正整数;若目标三维对象的属性数据与P个共享三维对象的属性数据相匹配,则在浏览页面中对目标三维对象与P个共享三维对象进行消除处理。其中属性数据可以包括颜色数据或文本数据中的任意一种或两种。目标三维对象的属性数据与P个共享三维对象的属性数据相匹配可以是指:目标三维对象的颜色数据与P个共享三维对象的颜色数据相同;或者,目标三维对象的文本数据与P个共享三维对象的文本数据相同;或者,目标三维对象的文本数据与P个共享三维对象的文本数据相似;或者,目标三维对象的颜色数据与P个共享三维对象的颜色数据相同且目标三维对象的文本数据与P个共享三维对象的文本数据相同;或者,目标三维对象的颜色数据与P个共享三维对象的颜色数据相同且目标三维对象的文本数据与P个共享三维对象的文本数据相似。目标三维对象的文本数据与P个共享三维对象的文本数据相似可以是指:目标三维对象的文本数据与P个共享三维对象的文本数据中包含的相同字符的数量超过数量阈值。
目标三维对象与M个共享三维对象中的P个共享三维对象产生接触可以包括但不限于以下任一种情况:链状接触、块状接触、环状接触。所谓链状接触可以是指多个三维对象按照链状排列,除位于链首的三维对象和位于链尾的三维对象之外,其他三维对象均存在两个相邻的三维对象。所谓块状接触可以是指多个三维对象按照块状排列,除位于块周围的三维对象之外,其他三维对象均存在多个相邻的三维对象。所谓环状接触可以是指多个三维对象按照环状排列,每一个三维对象均存在两个相邻的三维对象。图11是本申请实施例提供的一种三维对象接触方式的示意图,以目标三维对象与7个共享三维对象产生接触(即8个三维对象产生接触)为例,目标三维对象与7个共享三维对象均是球体;链状接触1101可以是指8个三维对象按照链状排列,除位于链首的三维对象和位于链尾的三维对象之外,其他6个三维对象均存在两个相邻的三维对象;环状接触1102可以是指8个三维对象按照环状排列,每一个三维对象均存在两个相邻的三维对象;块状接触1103可以是指8个三维对象按照块状排列,除位于块周围的三维对象之外,其他三维对象均存在多个相邻的三维对象。
本申请是实施例中,针对文本数据,浏览器的图像渲染元素可以用于对文本数据进行三维渲染,可以通过浏览器的图像渲染元素将文本数据渲染至目标三维对象(例如球体、长方体、正方体等三维对象)的表面;在浏览器的浏览页面中显示对文本数据进行三维渲染后得到的目标三维对象,提升了浏览器对文本数据的展示效果。此外,本申请实施例还提供了多种在浏览页面中控制目标三维对象的移动轨迹的方式(例如,在浏览页面中通过速度数据控制目标三维对象的移动轨迹、在浏览页面中通过移动操作控制目标三维对象的移动轨迹等等),增加了互动性、进一步提升文本数据在浏览器中的展示效果。
请参见图12,图12是本申请实施例提供的另一种数据处理方法的流程示意图,该数据处理方法可以由一个智能设备来执行,该智能设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能可穿戴设备等具备显示功能的设备;例如,该智能设备可以是图1所示的数据处理系统中的任一个终端设备。该数据处理方法包括以下步骤S1201至步骤S1205:
S1201:显示浏览器的设置页面。
浏览页面是浏览器中显示的一个页面,设置页面是浏览器中显示的除浏览页面之外的另一个页面;通过设置页面可以对本申请实施例涉及的一些参数(例如速度数据、音量开始识别阈值、音量结束识别阈值等等)进行设置。本申请实施例不对步骤S1201的执行顺序进行限定,步骤S1201可以在步骤S1202至步骤S1205中的任一个步骤之前执行,步骤S1201也可以在步骤S1202至步骤S1205中的任一个步骤之后执行,步骤S1201还可以在步骤S1202至步骤S1205中的任一个步骤的执行过程中执行。
在一个实施例中,浏览页面中包含设置访问入口,通过设置访问入口可以触发在浏览器中显示设置页面。
图13是本申请实施例提供的一种设置页面的示意图,如图13所示,设置页面130中可以包括但不限于以下至少一个选项或开关:音量开始识别设置项1301、音量结束识别设置项1302、审核开关选项1303、文本输入框1304、文本展示区域1305、时长阈值设置项1306、多媒体采集开关选项1307、监听状态栏1308、连接开关选项1312;监听状态栏1308中可以包括但不限于:监听状态参数1309、多媒体采集设备的音量参数1310、录音音频的音量参数1311中的任意一个或多个。
其中,时长阈值设置项1306中设置的值用于指示音频数据的时长阈值,即音频数据的时长不能超过时长阈值设置项1306中设置的时长阈值。多媒体采集开关选项1307用于开启或关闭多媒体采集设备,多媒体采集设备用于采集录音音频,当多媒体采集开关选项1307被开启时,多媒体采集设备开始采集录音音频,当多媒体采集开关选项1307被关闭时,多媒体采集设备停止采集录音音频。
监听状态参数1309可以用于指示对录音音频的监听状态,监听状态包括正在监听状态或等待监听状态;若监听状态参数1309指示对录音音频的监听状态为正在监听状态,则多媒体采集设备的音量参数1310用于指示多媒体采集设备的监听音量(例如麦克风音量),录音音频的音量参数1311用于指示正在采集的录音音频的音量信息(即录音音频的音量数据,录音音频的音量数据用于指示录音过程中录音音频的音量)。文本展示区域1305用于展示文本数据。
S1202:通过浏览器调用多媒体获取接口创建的音频处理节点获取音频数据。
多媒体获取接口(Navigator.getUserMedia)是浏览器支持的一个多媒体采集接口,通过多媒体获取接口可以访问多媒体采集设备(例如麦克风、相机等等),从而可以通过多媒体获取接口获取录音音频。还可以通过多媒体获取接口在浏览器中向用户输出多媒体采集设备使用提示,多媒体采集设备使用提示可以用于提醒用户需要使用多媒体采集设备采集录音音频。
通过多媒体获取接口可以调用音频操作节点创建方法(createMediaStreamSource)创建的音频操作节点(MediaStreamAudioSourceNode),音频操作节点可以对输入的录音音频进行播放等处理。通过多媒体获取接口还可以调用音频处理节点创建方法(createScriptProcessor)创建的音频处理节点(ScriptProcessorNode),通过音频处理节点可以调用JavaScript音频处理脚本,从而可以通过JavaScript音频处理脚本对通过多媒体获取接口采集到的录音音频进行处理,得到音频数据
在一个实施例中,对录音音频的处理过程可以包括:通过音频处理节点调用的JavaScript音频处理脚本对录音音频进行解析,得到录音音频的音频信息,音频信息包括音量数据,音量数据用于指示录音过程中录音音频的音量;若检测到录音过程中第一时刻对应的音量数据指示的音量大于音量开始识别阈值,则将第一时刻确定为所音频数据的起始时刻;若检测到录音过程中第二时刻对应的音量数据指示的音量小于音量结束识别阈值,则将第二时刻确定为音频数据的终止时刻;根据起始时刻和终止时刻在录音音频中确定音频数据,第一时刻早于第二时刻。
在另一个实施例中,对录音音频的处理过程可以包括:通过音频处理节点调用的JavaScript音频处理脚本对录音音频进行解析,得到录音音频的音频信息,音频信息包括音量数据,音量数据用于指示录音过程中录音音频的音量;若检测到录音过程中第一时刻对应的音量数据指示的音量大于音量开始识别阈值,则将第一时刻确定为所音频数据的起始时刻;若检测到第二时刻与第一时刻之间的时间差值大于或等于时长阈值,则将第二时刻确定为音频数据的终止时刻;根据起始时刻和终止时刻在录音音频中确定音频数据,第一时刻早于第二时刻。
音量开始识别阈值和音量结束识别阈值是在浏览器的设置页面中设置的。如图13所示,设置页面130中可以包含音量开始识别设置项1301和音量结束识别设置项1302;音量开始识别设置项1301可以用于设置音量开始识别阈值,可以将在音量开始识别设置项1301中设置的值作为音量开始识别阈值;音量结束识别设置项1302可以用于设置音量结束识别阈值,可以将在音量结束识别设置项1302中设置的值作为音量结束识别阈值。
S1203:获取音频数据对应的文本数据。
在一个实施例中,在对音频数据进行语音识别处理之前,需要对音频数据进行格式转换,得到目标音频数据,目标音频数据的数据格式为标准数据格式(例如WAV格式(一种音频文件标准格式))。如图13所示,设置页面130中还可以包括连接开关选项1312,若连接开关选项1312被开启,则可以将目标音频数据上传至服务器,并接收服务器返回的对目标音频数据的语音识别结果,语音识别结果包括文本数据;或者,若连接开关选项1312被关闭,则可以调用服务器的语音识别接口对目标音频数据进行语音识别处理,得到语音识别结果,语音识别结果包括文本数据。
在一个实施例中,对音频数据进行语音识别处理得到初始文本数据。设置页面130中可以包括审核开关选项1303和文本输入框1304,文本输入框1304可以用于对语音识别处理得到的初始文本数据进行修改,文本输入框1304还可以用于输入文本数据。若审核开关选项1303被开启,则可以在文本输入框1304中显示初始文本数据;响应于对初始文本数据的修改操作,在文本输入框1304中按照修改操作对初始文本数据进行修改,得到文本数据。
S1204:通过浏览器的图像渲染元素对文本数据进行渲染,生成目标三维对象。
S1205:在浏览器的浏览页面中显示目标三维对象。
本申请实施例中步骤S1204的执行过程与图7所示实施例中步骤S703的执行过程相同,步骤S1205的执行过程与图7所示实施例中步骤S704的执行过程相同,具体执行过程可参见图7所示实施例的描述,在此不再赘述。
本申请实施例中,通过浏览页面中的设置访问入口可以触发显示浏览器的设置页面,通过设置页面可以对录音音频的处理过程进行管理,例如通过设置页面可以设置音量开始识别阈值、音量结束识别阈值、时长阈值等与录音音频的处理过程相关的参数。另外,录音音频的处理过程是通过音频处理节点调用的JavaScript音频处理脚本实现的,通过JavaScript音频处理脚本对录音音频录制过程中的音量进行监控,能够较为准确地确定出录音音频中的音频数据。通过设置页面对录音音频的处理过程进行管理,通过JavaScript音频处理脚本对录音音频录制过程中的音量进行监控,能够提升对录音音频的处理效率,提升确定得到的音频数据的准确率。
请参见图14,图14是本申请实施例提供的一种数据处理装置的结构示意图,本申请实施例提供的数据处理装置140可以设置在智能设备中,该智能设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能可穿戴设备等具备显示功能的设备。该数据处理装置140可以用于执行图2所示的数据处理方法中终端设备执行的相应步骤,该数据处理装置140还可以用于执行图7或图12所示的数据处理方法中的相应步骤,该数据处理装置140可以包括如下单元:
获取单元1401,用于通过浏览器调用多媒体获取接口创建的音频处理节点获取音频数据;
获取单元1401,还用于获取音频数据对应的文本数据,文本数据是对音频数据进行语音识别后确定的;
处理单元1402,用于通过浏览器的图像渲染元素对文本数据进行渲染,生成目标三维对象,文本数据显示于目标三维对象的表面;
显示单元1403,用于在浏览器的浏览页面中显示目标三维对象。
在一个实施例中,图像渲染元素包括:二维图像渲染元素和三维图像渲染元素;处理单元1402,具体用于:
通过二维图像渲染元素的文字绘制接口将文本数据绘制到画布上,得到目标画布;
通过二维图像渲染元素的图片转换接口对目标画布进行转换,生成目标图片;
通过三维图像渲染元素调用的三维绘图接口将目标图片渲染到原始三维对象上,得到目标三维对象。
在一个实施例中,显示单元1403,具体用于:
获取目标三维对象的速度数据;
按照速度数据在浏览页面中动态显示目标三维对象;
其中,速度数据用于控制目标三维对象在浏览页面上的运动速度;速度数据包括:用于控制目标三维对象在浏览页面中向上移动或向下移动的纵轴速度、用于控制目标三维对象在浏览页面中向左移动或向右移动的横轴速度。
在一个实施例中,显示单元1403,具体用于:
响应于对目标三维对象的移动操作,并按照移动操作指示的移动轨迹,在浏览页面中动态显示目标三维对象;
其中,目标三维对象在浏览页面中的移动轨迹与移动操作指示的移动轨迹相匹配。
在一个实施例中,浏览页面显示有目标三维对象和M个共享三维对象,M为正整数;显示单元1403,具体用于:
若目标三维对象与M个共享三维对象中的第i个共享三维对象处于碰撞状态,获取目标三维对象的弹性数据,以及获取第i个共享三维对象的弹性数据;第i个共享三维对象是M个共享三维对象中的任一个,i为正整数且i∈[1,M];
按照目标三维对象的弹性数据在浏览页面中动态显示目标三维对象,以及按照第i个共享三维对象的弹性数据在浏览页面中动态显示第i个共享三维对象;
其中,弹性数据包括:用于产生反弹效果的反弹加速度、用于产生形变效果的形变参数。
在一个实施例中,浏览页面显示有目标三维对象和M个共享三维对象,M为正整数;显示单元1403,还用于:
若目标三维对象与M个共享三维对象中的P个共享三维对象产生接触,则获取目标三维对象的属性数据,以及获取P个共享三维对象的属性数据,P为小于或等于M的正整数;属性数据包括颜色数据或文本数据;
若目标三维对象的属性数据与P个共享三维对象的属性数据相匹配,则在浏览页面中对目标三维对象与P个共享三维对象进行消除处理。
在一个实施例中,获取单元1401,具体用于:
通过多媒体获取接口获取录音音频;
通过音频处理节点对录音音频进行解析,得到录音音频的音频信息,音频信息包括音量数据,音量数据用于指示录音过程中录音音频的音量;
若检测到录音过程中第一时刻对应的音量数据指示的音量大于音量开始识别阈值,则将第一时刻确定为音频数据的起始时刻;
若检测到录音过程中第二时刻对应的音量数据指示的音量小于音量结束识别阈值,则将第二时刻确定为音频数据的终止时刻;
根据起始时刻和终止时刻在录音音频中确定音频数据,第一时刻早于第二时刻。
在一个实施例中,音量开始识别阈值和音量结束识别阈值是在浏览器的设置页面中设置的;显示单元1403,还用于:
显示设置页面,设置页面中包括识别音量开始识别设置项和音量结束识别设置项;
将在音量开始识别设置项中设置的值作为音量开始识别阈值,以及将在音量结束识别设置项中设置的值作为音量结束识别阈值。
在一个实施例中,浏览器的设置页面包括审核开关选项和文本输入框;获取单元1401,具体用于:
获取初始文本数据,初始文本数据是对音频数据进行语音识别后确定的;
若审核开关选项被开启,则在文本输入框中显示初始文本数据;
响应于对初始文本数据的修改操作,在文本输入框中按照修改操作对初始文本数据进行修改,得到文本数据;
其中,设置页面中还包括文本展示区域,文本展示区域用于显示文本数据。
在一个实施例中,浏览器的设置页面中包括时长阈值设置项,时长阈值设置项中设置的值用于指示音频数据的时长阈值;
设置页面中还包括多媒体采集开关选项,多媒体采集开关选项用于开启或关闭多媒体采集设备,多媒体采集设备用于采集录音音频;
设置页面中还包括监听状态栏,监听状态栏中包括监听状态参数、多媒体采集设备的音量参数、录音音频的音量参数中的任意一个或多个;
其中,监听状态参数用于指示对录音音频的监听状态,监听状态包括正在监听状态或等待监听状态;若监听状态参数指示对录音音频的监听状态为正在监听状态,则多媒体采集设备的音量参数用于指示多媒体采集设备的监听音量,录音音频的音量参数用于指示录音音频的音量信息。
在一个实施例中,浏览器的设置页面包括连接开关选项;获取单元1401,具体用于:
对音频数据进行格式转换,得到目标音频数据,目标音频数据的数据格式为标准数据格式;
若连接开关选项被开启,则将目标音频数据上传至服务器,并接收服务器返回的对目标音频数据的语音识别结果,语音识别结果包括文本数据;或者,
若连接开关选项被关闭,则调用语音识别接口对目标音频数据进行语音识别处理,得到语音识别结果,语音识别结果包括文本数据。
根据本申请的一个实施例,图14所示的数据处理装置140中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本申请的其它实施例中,该数据处理装置140也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。根据本申请的另一个实施例,可以通过在包括例如中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的通用计算机的通用计算设备上运行能够执行如图2所示的数据处理方法中终端设备所涉及的各步骤的计算机程序(包括程序代码)、执行如图7或图12所示的数据处理方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图14中所示的数据处理装置140,以及来实现本申请实施例的数据处理方法。计算机程序可以记载于例如计算机可读存储介质上,并通过计算机可读存储介质装载于智能设备中,并在其中运行。
本申请实施例中,针对文本数据,浏览器的图像渲染元素可以用于对文本数据进行三维渲染,可以通过浏览器的图像渲染元素将文本数据渲染至目标三维对象(例如球体、长方体、正方体等三维对象)的表面;在浏览器的浏览页面中显示对文本数据进行三维渲染后得到的目标三维对象,提升了浏览器对文本数据的展示效果。
请参见图15,图15是本申请实施例提供的一种智能设备的结构示意图,该智能设备150至少包括处理器1501以及存储器1502。其中,处理器1501以及存储器1502可通过总线或者其它方式连接。
处理器1501可以是中央处理器(Central Processing Unit,CPU)。处理器1501还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(Application-SpecificIntegrated Circuit,ASIC),可编程逻辑器件(Programmable Logic Device,PLD)等。上述PLD可以是现场可编程逻辑门阵列(Field-Programmable Gate Array,FPGA),通用阵列逻辑(Generic Array Logic,GAL)等。
存储器1502可以包括易失性存储器(Volatile Memory),例如随机存取存储器(Random-Access Memory,RAM);存储器1502也可以包括非易失性存储器(Non-VolatileMemory),例如快闪存储器(Flash Memory),固态硬盘(Solid-State Drive,SSD)等;存储器1502还可以包括上述种类的存储器的组合。
存储器1502用于存储计算机程序,计算机程序包括计算机指令,处理器1501用于执行计算机指令。处理器1501(或称CPU(Central Processing Unit,中央处理器))是智能设备150的计算核心以及控制核心,其适于实现一条或多条计算机指令,具体适于加载并执行一条或多条计算机指令从而实现相应方法流程或相应功能。
该智能设备150可以是图1所示的数据处理系统中的任一个终端设备(例如第一终端设备101或第二终端设备102等等);该存储器1502中存储有计算机程序,计算机程序包括一条或多条计算机指令;由处理器1501加载并执行一条或多条计算机指令,以实现图2所示方法实施例中终端设备的相应步骤、图7或图12所示方法实施例中的相应步骤;具体实现中,存储器1502中的计算机指令由处理器1501加载并执行如下步骤:
通过浏览器调用多媒体获取接口创建的音频处理节点获取音频数据;
获取音频数据对应的文本数据,文本数据是对音频数据进行语音识别后确定的;
通过浏览器的图像渲染元素对文本数据进行渲染,生成目标三维对象,文本数据显示于目标三维对象的表面;
在浏览器的浏览页面中显示目标三维对象。
在一个实施例中,图像渲染元素包括:二维图像渲染元素和三维图像渲染元素;存储器1502中的计算机指令由处理器1501加载时具体用于执行如下步骤:
通过二维图像渲染元素的文字绘制接口将文本数据绘制到画布上,得到目标画布;
通过二维图像渲染元素的图片转换接口对目标画布进行转换,生成目标图片;
通过三维图像渲染元素调用的三维绘图接口将目标图片渲染到原始三维对象上,得到目标三维对象。
在一个实施例中,存储器1502中的计算机指令由处理器1501加载时具体用于执行如下步骤:
获取目标三维对象的速度数据;
按照速度数据在浏览页面中动态显示目标三维对象;
其中,速度数据用于控制目标三维对象在浏览页面上的运动速度;速度数据包括:用于控制目标三维对象在浏览页面中向上移动或向下移动的纵轴速度、用于控制目标三维对象在浏览页面中向左移动或向右移动的横轴速度。
在一个实施例中,存储器1502中的计算机指令由处理器1501加载时具体用于执行如下步骤:
响应于对目标三维对象的移动操作,并按照移动操作指示的移动轨迹,在浏览页面中动态显示目标三维对象;
其中,目标三维对象在浏览页面中的移动轨迹与移动操作指示的移动轨迹相匹配。
在一个实施例中,浏览页面显示有目标三维对象和M个共享三维对象,M为正整数;存储器1502中的计算机指令由处理器1501加载时具体用于执行如下步骤:
若目标三维对象与M个共享三维对象中的第i个共享三维对象处于碰撞状态,获取目标三维对象的弹性数据,以及获取第i个共享三维对象的弹性数据;第i个共享三维对象是M个共享三维对象中的任一个,i为正整数且i∈[1,M];
按照目标三维对象的弹性数据在浏览页面中动态显示目标三维对象,以及按照第i个共享三维对象的弹性数据在浏览页面中动态显示第i个共享三维对象;
其中,弹性数据包括:用于产生反弹效果的反弹加速度、用于产生形变效果的形变参数。
在一个实施例中,浏览页面显示有目标三维对象和M个共享三维对象,M为正整数;存储器1502中的计算机指令由处理器1501加载时还用于执行如下步骤:
若目标三维对象与M个共享三维对象中的P个共享三维对象产生接触,则获取目标三维对象的属性数据,以及获取P个共享三维对象的属性数据,P为小于或等于M的正整数;属性数据包括颜色数据或文本数据;
若目标三维对象的属性数据与P个共享三维对象的属性数据相匹配,则在浏览页面中对目标三维对象与P个共享三维对象进行消除处理。
在一个实施例中,存储器1502中的计算机指令由处理器1501加载时具体用于执行如下步骤:
通过多媒体获取接口获取录音音频;
通过音频处理节点对录音音频进行解析,得到录音音频的音频信息,音频信息包括音量数据,音量数据用于指示录音过程中录音音频的音量;
若检测到录音过程中第一时刻对应的音量数据指示的音量大于音量开始识别阈值,则将第一时刻确定为音频数据的起始时刻;
若检测到录音过程中第二时刻对应的音量数据指示的音量小于音量结束识别阈值,则将第二时刻确定为音频数据的终止时刻;
根据起始时刻和终止时刻在录音音频中确定音频数据,第一时刻早于第二时刻。
在一个实施例中,音量开始识别阈值和音量结束识别阈值是在浏览器的设置页面中设置的;存储器1502中的计算机指令由处理器1501加载时还用于执行如下步骤:
显示设置页面,设置页面中包括识别音量开始识别设置项和音量结束识别设置项;
将在音量开始识别设置项中设置的值作为音量开始识别阈值,以及将在音量结束识别设置项中设置的值作为音量结束识别阈值。
在一个实施例中,浏览器的设置页面包括审核开关选项和文本输入框;存储器1502中的计算机指令由处理器1501加载时具体用于执行如下步骤:
获取初始文本数据,初始文本数据是对音频数据进行语音识别后确定的;
若审核开关选项被开启,则在文本输入框中显示初始文本数据;
响应于对初始文本数据的修改操作,在文本输入框中按照修改操作对初始文本数据进行修改,得到文本数据;
其中,设置页面中还包括文本展示区域,文本展示区域用于显示文本数据。
在一个实施例中,浏览器的设置页面中包括时长阈值设置项,时长阈值设置项中设置的值用于指示音频数据的时长阈值;
设置页面中还包括多媒体采集开关选项,多媒体采集开关选项用于开启或关闭多媒体采集设备,多媒体采集设备用于采集录音音频;
设置页面中还包括监听状态栏,监听状态栏中包括监听状态参数、多媒体采集设备的音量参数、录音音频的音量参数中的任意一个或多个;
其中,监听状态参数用于指示对录音音频的监听状态,监听状态包括正在监听状态或等待监听状态;若监听状态参数指示对录音音频的监听状态为正在监听状态,则多媒体采集设备的音量参数用于指示多媒体采集设备的监听音量,录音音频的音量参数用于指示录音音频的音量信息。
在一个实施例中,浏览器的设置页面包括连接开关选项;存储器1502中的计算机指令由处理器1501加载时具体用于执行如下步骤:
对音频数据进行格式转换,得到目标音频数据,目标音频数据的数据格式为标准数据格式;
若连接开关选项被开启,则将目标音频数据上传至服务器,并接收服务器返回的对目标音频数据的语音识别结果,语音识别结果包括文本数据;或者,
若连接开关选项被关闭,则调用语音识别接口对目标音频数据进行语音识别处理,得到语音识别结果,语音识别结果包括文本数据。
本申请实施例中,针对文本数据,浏览器的图像渲染元素可以用于对文本数据进行三维渲染,可以通过浏览器的图像渲染元素将文本数据渲染至目标三维对象(例如球体、长方体、正方体等三维对象)的表面;在浏览器的浏览页面中显示对文本数据进行三维渲染后得到的目标三维对象,提升了浏览器对文本数据的展示效果。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选方式中提供的数据处理方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,计算机可读存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
以上所揭露的仅为本申请一种较佳实施例而已,当然不能以此来限定本申请之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本申请权利要求所作的等同变化,仍属于本申请所涵盖的范围。
Claims (14)
1.一种数据处理方法,其特征在于,所述方法包括:
通过浏览器调用多媒体获取接口创建的音频处理节点获取音频数据;
获取所述音频数据对应的文本数据,所述文本数据是对所述音频数据进行语音识别后确定的;
通过所述浏览器的图像渲染元素对所述文本数据进行渲染,生成目标三维对象,所述文本数据显示于所述目标三维对象的表面;
在所述浏览器的浏览页面中显示所述目标三维对象。
2.如权利要求1所述的方法,其特征在于,所述图像渲染元素包括:二维图像渲染元素和三维图像渲染元素;所述通过所述浏览器的图像渲染元素对所述文本数据进行渲染,生成目标三维对象,包括:
通过所述二维图像渲染元素的文字绘制接口将所述文本数据绘制到画布上,得到目标画布;
通过所述二维图像渲染元素的图片转换接口对所述目标画布进行转换,生成目标图片;
通过所述三维图像渲染元素调用的三维绘图接口将所述目标图片渲染到原始三维对象上,得到所述目标三维对象。
3.如权利要求1所述的方法,其特征在于,所述在所述浏览器的浏览页面中显示所述目标三维对象,包括:
获取所述目标三维对象的速度数据;
按照所述速度数据在所述浏览页面中动态显示所述目标三维对象;
其中,所述速度数据用于控制所述目标三维对象在所述浏览页面上的运动速度;所述速度数据包括:用于控制所述目标三维对象在所述浏览页面中向上移动或向下移动的纵轴速度、用于控制所述目标三维对象在所述浏览页面中向左移动或向右移动的横轴速度。
4.如权利要求1所述的方法,其特征在于,所述在所述浏览器的浏览页面中显示所述目标三维对象,包括:
响应于对所述目标三维对象的移动操作,并按照所述移动操作指示的移动轨迹,在所述浏览页面中动态显示所述目标三维对象;
其中,所述目标三维对象在所述浏览页面中的移动轨迹与所述移动操作指示的移动轨迹相匹配。
5.如权利要求1所述的方法,其特征在于,所述浏览页面显示有所述目标三维对象和M个共享三维对象,M为正整数;所述在所述浏览器的浏览页面中显示所述目标三维对象,包括:
若所述目标三维对象与所述M个共享三维对象中的第i个共享三维对象处于碰撞状态,获取所述目标三维对象的弹性数据,以及获取所述第i个共享三维对象的弹性数据;所述第i个共享三维对象是所述M个共享三维对象中的任一个,i为正整数且i∈[1,M];
按照所述目标三维对象的弹性数据在所述浏览页面中动态显示所述目标三维对象,以及按照所述第i个共享三维对象的弹性数据在所述浏览页面中动态显示所述第i个共享三维对象;
其中,所述弹性数据包括:用于产生反弹效果的反弹加速度、用于产生形变效果的形变参数。
6.如权利要求1所述的方法,其特征在于,所述浏览页面显示有所述目标三维对象和M个共享三维对象,M为正整数;所述方法还包括:
若所述目标三维对象与所述M个共享三维对象中的P个共享三维对象产生接触,则获取所述目标三维对象的属性数据,以及获取所述P个共享三维对象的属性数据,P为小于或等于M的正整数;所述属性数据包括颜色数据或所述文本数据;
若所述目标三维对象的属性数据与所述P个共享三维对象的属性数据相匹配,则在所述浏览页面中对所述目标三维对象与所述P个共享三维对象进行消除处理。
7.如权利要求1所述的方法,其特征在于,所述通过浏览器调用多媒体获取接口创建的音频处理节点获取音频数据,包括:
通过所述多媒体获取接口获取录音音频;
通过所述音频处理节点对所述录音音频进行解析,得到所述录音音频的音频信息,所述音频信息包括音量数据,所述音量数据用于指示录音过程中所述录音音频的音量;
若检测到所述录音过程中第一时刻对应的音量数据指示的音量大于音量开始识别阈值,则将所述第一时刻确定为所述音频数据的起始时刻;
若检测到所述录音过程中第二时刻对应的音量数据指示的音量小于音量结束识别阈值,则将所述第二时刻确定为所述音频数据的终止时刻;
根据所述起始时刻和所述终止时刻在所述录音音频中确定所述音频数据,所述第一时刻早于所述第二时刻。
8.如权利要求7所述的方法,其特征在于,所述音量开始识别阈值和所述音量结束识别阈值是在所述浏览器的设置页面中设置的;所述方法还包括:
显示所述设置页面,所述设置页面中包括识别音量开始识别设置项和所述音量结束识别设置项;
将在所述音量开始识别设置项中设置的值作为所述音量开始识别阈值,以及将在所述音量结束识别设置项中设置的值作为所述音量结束识别阈值。
9.如权利要求1所述的方法,其特征在于,所述浏览器的设置页面包括审核开关选项和文本输入框;所述获取所述音频数据对应的文本数据,包括:
获取初始文本数据,所述初始文本数据是对所述音频数据进行语音识别后确定的;
若所述审核开关选项被开启,则在所述文本输入框中显示所述初始文本数据;
响应于对所述初始文本数据的修改操作,在所述文本输入框中按照所述修改操作对所述初始文本数据进行修改,得到所述文本数据;
其中,所述设置页面中还包括文本展示区域,所述文本展示区域用于显示所述文本数据。
10.如权利要求1所述的方法,其特征在于,所述浏览器的设置页面中包括时长阈值设置项,所述时长阈值设置项中设置的值用于指示所述音频数据的时长阈值;
所述设置页面中还包括多媒体采集开关选项,所述多媒体采集开关选项用于开启或关闭多媒体采集设备,所述多媒体采集设备用于采集录音音频;
所述设置页面中还包括监听状态栏,所述监听状态栏中包括监听状态参数、所述多媒体采集设备的音量参数、所述录音音频的音量参数中的任意一个或多个;
其中,所述监听状态参数用于指示对所述录音音频的监听状态,所述监听状态包括正在监听状态或等待监听状态;若所述监听状态参数指示对所述录音音频的监听状态为所述正在监听状态,则所述多媒体采集设备的音量参数用于指示所述多媒体采集设备的监听音量,所述录音音频的音量参数用于指示所述录音音频的音量信息。
11.如权利要求1所述的方法,其特征在于,所述浏览器的设置页面包括连接开关选项;所述获取所述音频数据对应的文本数据,包括:
对所述音频数据进行格式转换,得到目标音频数据,所述目标音频数据的数据格式为标准数据格式;
若所述连接开关选项被开启,则将所述目标音频数据上传至服务器,并接收所述服务器返回的对所述目标音频数据的语音识别结果,所述语音识别结果包括所述文本数据;或者,
若所述连接开关选项被关闭,则调用语音识别接口对所述目标音频数据进行语音识别处理,得到语音识别结果,所述语音识别结果包括所述文本数据。
12.一种数据处理装置,其特征在于,所述数据处理装置包括:
获取单元,用于通过浏览器调用多媒体获取接口创建的音频处理节点获取音频数据;
所述获取单元,还用于获取所述音频数据对应的文本数据,所述文本数据是对所述音频数据进行语音识别后确定的;
处理单元,用于通过所述浏览器的图像渲染元素对所述文本数据进行渲染,生成目标三维对象,所述文本数据显示于所述目标三维对象的表面;
显示单元,用于在所述浏览器的浏览页面中显示所述目标三维对象。
13.一种智能设备,其特征在于,所述智能设备包括:
处理器,适于实现计算机程序;以及,
存储器,所述存储器存储有计算机程序,所述计算机程序被所述处理器运行时,实现如权利要求1至11任一项所述的数据处理方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器读取并运行时,实现如权利要求1至11任一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011305109.8A CN112419471B (zh) | 2020-11-19 | 2020-11-19 | 一种数据处理方法、装置及智能设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011305109.8A CN112419471B (zh) | 2020-11-19 | 2020-11-19 | 一种数据处理方法、装置及智能设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112419471A true CN112419471A (zh) | 2021-02-26 |
CN112419471B CN112419471B (zh) | 2024-04-26 |
Family
ID=74774762
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011305109.8A Active CN112419471B (zh) | 2020-11-19 | 2020-11-19 | 一种数据处理方法、装置及智能设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112419471B (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050117365A (ko) * | 2004-06-10 | 2005-12-14 | 서민철 | 인터넷을 이용한 화투패 퍼즐게임 제공 시스템 및 그화투패 퍼즐게임 방법 |
CN1853157A (zh) * | 2003-09-24 | 2006-10-25 | 诺基亚公司 | 改善大物体在小显示器上的显示 |
JP2007079413A (ja) * | 2005-09-16 | 2007-03-29 | Yamaha Corp | オーディオ再生装置、オーディオ配信システム、オーディオ再生プログラムおよびオーサリングプログラム |
CN104871213A (zh) * | 2012-11-13 | 2015-08-26 | 谷歌公司 | 对于对象的全方位视图的视频编码 |
CN104933753A (zh) * | 2015-07-09 | 2015-09-23 | 上海苗实信息科技有限公司 | 一种基于互联网的三维虚拟漫游场景构建平台 |
CN108597522A (zh) * | 2018-05-10 | 2018-09-28 | 北京奇艺世纪科技有限公司 | 一种语音处理方法及装置 |
CN108888950A (zh) * | 2018-06-15 | 2018-11-27 | 腾讯科技(深圳)有限公司 | 终端中的对局界面显示方法、装置、设备及存储介质 |
CN108959392A (zh) * | 2018-05-31 | 2018-12-07 | 阿里巴巴集团控股有限公司 | 在3d模型上展示富文本的方法、装置及设备 |
CN108984087A (zh) * | 2017-06-02 | 2018-12-11 | 腾讯科技(深圳)有限公司 | 基于三维虚拟形象的社交互动方法及装置 |
CN109189365A (zh) * | 2018-08-17 | 2019-01-11 | 平安普惠企业管理有限公司 | 一种语音识别方法、存储介质和终端设备 |
CN111124229A (zh) * | 2019-12-24 | 2020-05-08 | 山东舜网传媒股份有限公司 | 通过语音交互实现网页动画控制的方法、系统及浏览器 |
US20200167589A1 (en) * | 2018-11-26 | 2020-05-28 | Canon Kabushiki Kaisha | Image processing apparatus, method of controlling the same, and storage medium |
CN111312219A (zh) * | 2020-01-16 | 2020-06-19 | 上海携程国际旅行社有限公司 | 电话录音标注方法、系统、存储介质和电子设备 |
CN111672111A (zh) * | 2020-05-28 | 2020-09-18 | 腾讯科技(深圳)有限公司 | 界面显示方法、装置、设备及存储介质 |
CN111680694A (zh) * | 2020-05-28 | 2020-09-18 | 中国工商银行股份有限公司 | 文字图像中有色印章的滤除方法及装置 |
CN111949904A (zh) * | 2019-05-16 | 2020-11-17 | 腾讯科技(深圳)有限公司 | 一种基于浏览器的数据处理方法、装置以及终端 |
-
2020
- 2020-11-19 CN CN202011305109.8A patent/CN112419471B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1853157A (zh) * | 2003-09-24 | 2006-10-25 | 诺基亚公司 | 改善大物体在小显示器上的显示 |
KR20050117365A (ko) * | 2004-06-10 | 2005-12-14 | 서민철 | 인터넷을 이용한 화투패 퍼즐게임 제공 시스템 및 그화투패 퍼즐게임 방법 |
JP2007079413A (ja) * | 2005-09-16 | 2007-03-29 | Yamaha Corp | オーディオ再生装置、オーディオ配信システム、オーディオ再生プログラムおよびオーサリングプログラム |
CN104871213A (zh) * | 2012-11-13 | 2015-08-26 | 谷歌公司 | 对于对象的全方位视图的视频编码 |
CN104933753A (zh) * | 2015-07-09 | 2015-09-23 | 上海苗实信息科技有限公司 | 一种基于互联网的三维虚拟漫游场景构建平台 |
CN108984087A (zh) * | 2017-06-02 | 2018-12-11 | 腾讯科技(深圳)有限公司 | 基于三维虚拟形象的社交互动方法及装置 |
CN108597522A (zh) * | 2018-05-10 | 2018-09-28 | 北京奇艺世纪科技有限公司 | 一种语音处理方法及装置 |
CN108959392A (zh) * | 2018-05-31 | 2018-12-07 | 阿里巴巴集团控股有限公司 | 在3d模型上展示富文本的方法、装置及设备 |
CN108888950A (zh) * | 2018-06-15 | 2018-11-27 | 腾讯科技(深圳)有限公司 | 终端中的对局界面显示方法、装置、设备及存储介质 |
CN109189365A (zh) * | 2018-08-17 | 2019-01-11 | 平安普惠企业管理有限公司 | 一种语音识别方法、存储介质和终端设备 |
US20200167589A1 (en) * | 2018-11-26 | 2020-05-28 | Canon Kabushiki Kaisha | Image processing apparatus, method of controlling the same, and storage medium |
CN111949904A (zh) * | 2019-05-16 | 2020-11-17 | 腾讯科技(深圳)有限公司 | 一种基于浏览器的数据处理方法、装置以及终端 |
CN111124229A (zh) * | 2019-12-24 | 2020-05-08 | 山东舜网传媒股份有限公司 | 通过语音交互实现网页动画控制的方法、系统及浏览器 |
CN111312219A (zh) * | 2020-01-16 | 2020-06-19 | 上海携程国际旅行社有限公司 | 电话录音标注方法、系统、存储介质和电子设备 |
CN111672111A (zh) * | 2020-05-28 | 2020-09-18 | 腾讯科技(深圳)有限公司 | 界面显示方法、装置、设备及存储介质 |
CN111680694A (zh) * | 2020-05-28 | 2020-09-18 | 中国工商银行股份有限公司 | 文字图像中有色印章的滤除方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112419471B (zh) | 2024-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3758364A1 (en) | Dynamic emoticon-generating method, computer-readable storage medium and computer device | |
CN110769302B (zh) | 直播互动方法、装置、系统、终端设备、存储介质 | |
JP2021192222A (ja) | 動画インタラクティブ方法と装置、電子デバイス、コンピュータ可読記憶媒体、及び、コンピュータプログラム | |
EP4235491A1 (en) | Method and apparatus for obtaining virtual image, computer device, computer-readable storage medium, and computer program product | |
CN112333179A (zh) | 虚拟视频的直播方法、装置、设备及可读存储介质 | |
CN111491208B (zh) | 视频处理方法、装置、电子设备及计算机可读介质 | |
US20180143741A1 (en) | Intelligent graphical feature generation for user content | |
CN114401443B (zh) | 特效视频处理方法、装置、电子设备及存储介质 | |
CN112785669B (zh) | 一种虚拟形象合成方法、装置、设备及存储介质 | |
CN109343695A (zh) | 基于虚拟人行为标准的交互方法及系统 | |
KR102620284B1 (ko) | 메타버스 기반 교육 플랫폼 서비스 제공 시스템 | |
CN114529635B (zh) | 一种图像生成方法、装置、存储介质及设备 | |
CN114095744A (zh) | 视频直播方法、装置、电子设备及可读存储介质 | |
CN116152416A (zh) | 基于扩展现实的画面渲染方法、装置及存储介质 | |
CN113573128B (zh) | 一种音频处理方法、装置、终端以及存储介质 | |
CN114139491A (zh) | 一种数据处理方法、装置及存储介质 | |
US12058410B2 (en) | Information play control method and apparatus, electronic device, computer-readable storage medium and computer program product | |
CN112419471B (zh) | 一种数据处理方法、装置及智能设备、存储介质 | |
CN116233532A (zh) | 视频播放方法、装置、计算机设备及计算机可读存储介质 | |
CN116843802A (zh) | 虚拟形象的处理方法及相关产品 | |
CN117319340A (zh) | 语音消息的播放方法、装置、终端及存储介质 | |
CN113569167A (zh) | 资源处理方法、装置、终端设备及存储介质 | |
CN113938739A (zh) | 信息显示方法、装置、电子设备及存储介质 | |
CN111079051A (zh) | 一种展示内容的播放方法及装置 | |
CN115499672B (zh) | 图像显示方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40038854 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |