CN109448709A - 一种终端投屏的控制方法和终端 - Google Patents

一种终端投屏的控制方法和终端 Download PDF

Info

Publication number
CN109448709A
CN109448709A CN201811204521.3A CN201811204521A CN109448709A CN 109448709 A CN109448709 A CN 109448709A CN 201811204521 A CN201811204521 A CN 201811204521A CN 109448709 A CN109448709 A CN 109448709A
Authority
CN
China
Prior art keywords
terminal
voice
result
recognition processing
application program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811204521.3A
Other languages
English (en)
Inventor
夏少华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201811204521.3A priority Critical patent/CN109448709A/zh
Publication of CN109448709A publication Critical patent/CN109448709A/zh
Priority to PCT/CN2019/110926 priority patent/WO2020078300A1/zh
Priority to US17/285,563 priority patent/US20210398527A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • G06F3/1423Digital output to display device ; Cooperation and interconnection of the display device with other functional units controlling a plurality of local displays, e.g. CRT and flat panel display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • G06F3/1454Digital output to display device ; Cooperation and interconnection of the display device with other functional units involving copying of the display data of a local workstation or window to a remote workstation or window so that an actual copy of the data is displayed simultaneously on two or more displays, e.g. teledisplay
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例公开了一种终端投屏的控制方法和终端,用于提高在终端连接大屏幕场景下的应用程序处理效率。本申请实施例提供一种终端投屏的控制方法,所述方法应用于终端,所述终端与显示设备连接,所述方法包括:所述终端采集第一语音数据;所述终端对所述第一语音数据进行语音识别处理;所述终端根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。

Description

一种终端投屏的控制方法和终端
技术领域
本申请涉及通信技术领域,尤其涉及一种终端投屏的控制方法和终端。
背景技术
目前移动终端已经广泛应用,用户经常会遇到一些场景,例如想把移动终端里的照片、视频、文档等内容分享给身边的朋友。现有技术常用的方式是打开移动终端上的小屏幕来分享给别的用户,从用户体验上讲,移动终端这块“小屏幕”绝对不能令人满意。
现有技术中出现了采用移动终端投屏的方式,即为移动终端连接一个大屏幕,用户可以操作移动终端的应用程序,通过移动终端连接大屏幕来显示用户的操作内容,从而实现基于大屏幕的内容分享。
现有技术中,需要用户手持终端,或者为终端外接鼠标、键盘来对应用程序进行控制。由于现有技术中需要用户手动的控制终端在大屏幕上显示应用程序,因此无法解放用户的双手,降低了在终端连接大屏幕场景下的应用程序处理效率。
发明内容
本申请实施例提供了一种终端投屏的控制方法和终端,用于提高在终端连接大屏幕场景下的应用程序处理效率。
为解决上述技术问题,本申请实施例提供以下技术方案:
第一方面,本申请实施例提供一种终端投屏的控制方法,所述方法应用于终端,所述终端与显示设备连接,所述方法包括:所述终端采集第一语音数据;所述终端对所述第一语音数据进行语音识别处理;所述终端根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。
在本申请实施例中,终端与显示设备连接,该终端采集第一语音数据,然后终端对第一语音数据进行语音识别处理,生成语音识别处理的结果,接下来终端根据语音识别处理的结果控制终端的应用程序,最后终端在显示设备上显示应用程序的控制过程。本申请实施例中用户可以通过语音交流的方式,直接向终端下达语音的命令,终端就可以采集用户发出的第一语音数据,终端可以根据语音识别处理的结果控制应用程序,从而应用程序的执行过程可以在终端设备连接的显示设备上显示控制过程,不需要用户来手动的操作终端,因此提高了在终端连接大屏幕场景下的应用程序处理效率。
在第一方面的一种可能实现中,所述终端根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容,包括:所述终端识别出与所述语音识别处理的结果对应的应用程序接口;所述终端通过所述应用程序接口控制应用程序,并在所述显示设备上显示相关内容。其中,终端根据语音识别处理的结果来识别用户需要控制的应用程序,例如终端识别出与语音识别处理的结果对应的应用程序接口,不同的应用程序配置有不同的应用程序接口,终端在识别出应用程序接口之后,终端通过应用程序接口就可以确定出用户需要控制的应用程序。
在第一方面的一种可能实现中,所述终端识别出与所述语音识别处理的结果对应的应用程序接口,包括:所述终端对所述语音识别处理的结果进行语义解析,生成语义解析结果;所述终端从所述语义解析结果中提取出指令;所述终端根据所述指令识别出所述应用程序接口。其中,终端生成的语音识别处理的结果可以是文本信息,终端对该文本信息进行语义解析,生成语义解析结果,终端从语义解析结果中提取出指令,例如终端根据预置的指令格式生成指令,最后终端根据所提取出的指令来识别出应用程序接口。本申请实施例中,终端中可以配置语义解析功能,即终端可以学习与理解一段文本所表示的语义内容,最终转换成机器能识别的命令和参数。
在第一方面的一种可能实现中,所述终端识别出与所述语音识别处理的结果对应的应用程序接口,包括:所述终端将所述语音识别处理的结果发送给云端服务器,由所述云端服务器对所述语音识别处理的结果进行语义解析;所述终端接收所述云端服务器进行语义解析后反馈的解析结果;所述终端根据所述解析结果识别出所述应用程序接口。其中,终端生成的语音识别处理的结果可以是文本信息,终端与云端服务器建立有通信连接,例如终端可以将文本信息发送给云端服务器,由云端服务器对文本信息进行语义解析,云端服务器在语义解析完成之后生成指令,云端服务器发送指令,终端可以接收云端服务器进行语义解析后反馈的解析结果,最后终端根据所提取出的指令来识别出应用程序接口。
在第一方面的一种可能实现中,所述终端根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容之后,所述方法还包括:所述终端获取所述应用程序的反馈结果;所述终端将所述反馈结果转换成第二语音数据,并播放所述第二语音数据;或者,所述终端在所述显示设备上显示所述反馈结果。其中,终端在执行应用程序时,应用程序还可以生成反馈结果,该反馈结果可以指示应用程序成功响应用户的语音命令,也可以指示应用程序响应该语音命令失败。终端在获取到该反馈结果之后,终端可以将反馈结果转换成第二语音数据,并播放第二语音数据,例如终端内配置有播放器,终端可以通过该播放器播放第二语音数据,从而用户可以听到该第二语音数据。终端除了使用语音的方式播放反馈结果对应的第二语音数据之外,终端还可以在显示设备上显示反馈结果,使得用户可以从终端连接显示设备上确定出语音命令执行成功或者失败。
在第一方面的一种可能实现中,所述终端采集第一语音数据,包括:所述终端通过免唤醒词的方式调起语音助手,由所述语音助手对所述第一语音数据进行语音采集。其中,终端中可以配置语音助手,通过该语音助手可以进行语音采集,为了提高语音采集的效率,终端可以使用免唤醒词的方式来调起语音助手,免唤醒词是相对于语音助手而言的,不需要先打开语音助手这个应用,用户可以直接对着终端说某句话,终端就可以自动的调起语音助手,并执行语音命令。
第二方面,本申请实施例提供一种终端,所述终端与显示设备连接,所述终端包括:语音采集器、处理器;所述处理器和所述语音采集器之间进行相互的通信;所述语音采集器,用于采集第一语音数据;所述处理器,用于对所述第一语音数据进行语音识别处理;根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。
在第二方面的一种可能实现中,所述处理器,还用于识别出与所述语音识别处理的结果对应的应用程序接口;通过所述应用程序接口控制所述应用程序,并在所述显示设备上显示相关内容。
在第二方面的一种可能实现中,所述处理器,还用于通过所述应用程序接口调用管理服务功能模块;通过所述管理服务功能模块对所述应用程序进行控制。
在第二方面的一种可能实现中,所述处理器,还用于对所述语音识别处理的结果进行语义解析,生成语义解析结果;从所述语义解析结果中提取出指令;根据所述指令识别出所述应用程序接口。
在第二方面的一种可能实现中,所述处理器,还用于将所述语音识别处理的结果发送给云端服务器,由所述云端服务器对所述语音识别处理的结果进行语义解析;接收所述云端服务器进行语义解析后反馈的解析结果;根据所述解析结果识别出所述应用程序接口。
在第二方面的一种可能实现中,所述终端还包括:播放器,所述播放器和所述处理器相连接;所述处理器,还用于根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容之后,获取所述应用程序的反馈结果;将所述反馈结果转换成第二语音数据,控制所述播放器播放所述第二语音数据;或者,控制所述显示设备显示所述反馈结果。
在第二方面的一种可能实现中,所述处理器,还用于通过免唤醒词的方式调起语音助手;所述语音采集器,用于在所述语音助手的控制下对所述第一语音数据进行语音采集。
在本申请的第二方面中,终端的组成模块还可以执行前述第一方面以及各种可能的实现方式中所描述的步骤,详见前述对第一方面以及各种可能的实现方式中的说明。
第三方面,本申请实施例还提供一种终端,所述终端与显示设备连接,所述终端包括:
采集模块,用于采集第一语音数据;
语音识别模块,用于对所述第一语音数据进行语音识别处理;
显示模块,用于根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。
在第三方面的一种可能的实现方式中,所述显示模块,包括:接口识别单元,用于识别出与所述语音识别处理的结果对应的应用程序接口;控制单元,用于通过所述应用程序接口控制应用程序,并在所述显示设备上显示相关内容。
在第三方面的一种可能的实现方式中,所述接口识别单元,用于对所述语音识别处理的结果进行语义解析,生成语义解析结果;从所述语义解析结果中提取出指令;根据所述指令识别出所述应用程序接口。
在第三方面的一种可能的实现方式中,所述接口识别单元,用于将所述语音识别处理的结果发送给云端服务器,由所述云端服务器对所述语音识别处理的结果进行语义解析;接收所述云端服务器进行语义解析后反馈的解析结果;根据所述解析结果识别出所述应用程序接口。
在第三方面的一种可能的实现方式中,所述终端,还包括:获取模块和播放模块,其中,所述获取模块,用于所述显示模块在根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容之后,获取所述应用程序的反馈结果;所述播放模块,用于将所述反馈结果转换成第二语音数据,并播放所述第二语音数据;或者,所述显示模块,还用于在所述显示设备上显示所述反馈结果。
在第三方面的一种可能的实现方式中,所述采集模块,还用于通过免唤醒词的方式调起语音助手,由所述语音助手对所述第一语音数据进行语音采集。
第三方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面所述的方法。
第四方面,本申请实施例提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面所述的方法。
第五方面,本申请实施例提供一种通信装置,该通信装置可以包括终端或者芯片等实体,所述通信装置包括:处理器、存储器;所述存储器用于存储指令;所述处理器用于执行所述存储器中的所述指令,使得所述通信装置执行如前述第一方面中任一项所述的方法。
第六方面,本申请提供了一种芯片系统,该芯片系统包括处理器,用于支持终端实现上述方面中所涉及的功能,例如,发送或处理上述方法中所涉及的数据和/或信息。在一种可能的设计中,所述芯片系统还包括存储器,所述存储器,用于保存终端必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包括芯片和其他分立器件。
附图说明
图1为本申请实施例提供的一种终端投屏的控制方法应用的通信系统的组成结构示意图;
图2为本申请实施例提供的一种终端投屏的控制方法的流程方框示意图;
图3为本申请实施例提供的对文档应用程序进行终端投屏控制的实现架构示意图;
图4为本申请实施例提供的对文档应用程序进行语音控制的流程示意图;
图5为本申请实施例提供的一种终端的组成结构示意图;
图6-a为本申请实施例提供的另一种终端的组成结构示意图;
图6-b为本申请实施例提供的一种显示模块的组成结构示意图;
图6-c为本申请实施例提供的另一种终端的组成结构示意图;
图7为本申请实施例提供的另一种终端的组成结构示意图。
具体实施方式
本申请实施例提供了一种终端投屏的控制方法和终端,用于提高在终端连接大屏幕场景下的应用程序处理效率。
下面结合附图,对本申请的实施例进行描述。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本申请的实施例中对相同属性的对象在描述时所采用的区分方式。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。
本申请实施例的技术方案可以应用于各种数据处理的通信系统,如图1所示,该通信系统中包括有终端,该终端与显示设备连接,该显示设备可以是一个用于显示的大屏幕,终端可以通过有线或者无线的方式连接该显示设备,例如终端通过高清晰度多媒体接口(high definition multimedia interface,HDMI)和显示设备连接,或者终端通过type-c接口和显示设备连接。其中,终端又称之为用户设备(user equipment,UE)、移动台(mobilestation,MS)、移动终端(mobile terminal,MT)等,是一种向用户提供语音和/或数据连通性的设备,或,设置于该设备内的芯片,例如,具有无线连接功允许的手持式设备、车载设备等。目前,一些终端的举例为:手机(mobile phone)、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internet device,MID)、可穿戴设备,虚拟现实(virtual reality,VR)设备、增强现实(augmented reality,AR)设备、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程手术(remote medical surgery)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等。本申请实施例提供的终端只需要连接一显示设备,就可以执行本申请实施例提供的终端投屏的控制方法。
本申请实施例提出终端投屏的控制方法,该方法应用于终端,该终端与显示设备连接,请参阅图2所示,为本申请实施例提供的终端投屏的控制方法,主要包括如下步骤:
201、终端采集第一语音数据。
在本申请实施例中,用户可以通过终端来操作应用程序,应用程序的类型不做限定,例如该应用程序可以是文档应用程序,也可以是游戏应用程序,或者音视频应用程序等。在该终端连接显示设备上显示该应用程序,当用户需要操作该应用程序时采用语音控制的方式,即用户发出语音命令,终端中内置有语音采集器,终端通过该语音采集器来采集用户发出的语音命令。例如终端在一段时间内采集到第一语音数据。后续实施例中以对第一语音数据的终端投屏控制过程为例说明,终端采集到的其它语音数据,也可以按照该第一语音数据的处理过程进行终端投屏控制,此处仅作说明。
在本申请的一些实施例中,步骤201终端采集第一语音数据,包括:
终端通过免唤醒词的方式调起语音助手,由语音助手对第一语音数据进行语音采集。
其中,终端中可以配置语音助手,通过该语音助手可以进行语音采集,为了提高语音采集的效率,终端可以使用免唤醒词的方式来调起语音助手,免唤醒词是相对于语音助手而言的,不需要先打开语音助手这个应用,用户可以直接对着终端说某句话,终端就可以自动的调起语音助手,并执行语音命令。
202、终端对第一语音数据进行语音识别处理。
在本申请实施例中,终端在采集到第一语音数据之后,终端对该第一语音数据进行语音识别处理,以识别出该第一语音数据对应的文本信息,终端生成的语音识别处理的结果可以包括该文本信息。
本申请实施例中,终端可以通过自然语音理解(natural languageunderstanding,NLU)工具对第一语音数据进行语音识别处理,其中,语音识别是指让机器通过识别和理解过程把第一语音数据转变为相应的文本信息的过程,终端生成的语音识别处理的结果可以用于控制终端的应用程序。
203、终端根据语音识别处理的结果控制显示设备上显示与第一语音数据关联的内容。
在本申请实施例中,终端在对第一语音数据进行语音识别处理之后,终端可以使用该语音识别处理的结果进行应用程序的控制,终端可以直接以该语音识别处理的结果作为命令来控制应用程序,终端也可以获取语音识别处理的结果对应的指令,根据该指令来控制应用程序。其中,对应用程序进行控制的方式取决于终端生成的语音识别处理的结果。以应用程序为文档应用程序为例,若用户发出打开文档A的语音命令,则终端可以控制文档应用程序打开该文档A。
在本申请的一些实施例中,步骤203终端根据语音识别处理的结果控制显示设备上显示与第一语音数据关联的内容,包括:
终端识别出与语音识别处理的结果对应的应用程序接口;
终端通过应用程序接口控制应用程序,并在显示设备上显示相关内容。
其中,终端根据语音识别处理的结果来识别用户需要控制的应用程序。例如终端识别出与语音识别处理的结果对应的应用程序接口,不同的应用程序配置有不同的应用程序接口,终端在识别出应用程序接口之后,终端通过应用程序接口就可以确定出用户需要控制的应用程序。在实际应用中,终端中可以设置管理服务功能模块,通过管理服务功能模块对所述应用程序进行控制,例如该管理服务功能模块具体可以是个人电脑(personalcomputer,PC)管理服务模块,通过PC管理服务模块来识别出应用程序接口,通过应用程序接口来控制用户需要控制的应用程序。
进一步的,在本申请的一些实施例中,终端识别出与语音识别处理的结果对应的应用程序接口,包括:
终端对语音识别处理的结果进行语义解析,生成语义解析结果;
终端从语义解析结果中提取出指令;
终端根据指令识别出应用程序接口。
其中,终端生成的语音识别处理的结果可以是文本信息,终端对该文本信息进行语义解析,生成语义解析结果,终端从语义解析结果中提取出指令,例如终端根据预置的指令格式生成指令,最后终端根据所提取出的指令来识别出应用程序接口。本申请实施例中,终端中可以配置语义解析功能,即终端可以学习与理解一段文本所表示的语义内容,最终转换成机器能识别的命令和参数。
在本申请的另一些实施例中,终端识别出与语音识别处理的结果对应的应用程序接口,包括:
终端将语音识别处理的结果发送给云端服务器,由云端服务器对语音识别处理的结果进行语义解析;
终端接收云端服务器进行语义解析后反馈的解析结果;
终端根据解析结果识别出应用程序接口
其中,终端生成的语音识别处理的结果可以是文本信息,终端与云端服务器建立有通信连接,例如终端可以将文本信息发送给云端服务器,由云端服务器对文本信息进行语义解析,云端服务器在语义解析完成之后生成指令,云端服务器发送指令,终端可以接收云端服务器进行语义解析后反馈的解析结果,最后终端根据所提取出的指令来识别出应用程序接口。
在本申请实施例中,根据语音识别处理的结果控制显示设备上显示与第一语音数据关联的内容,终端在控制应用程序时,终端生成与第一语音数据关联的内容,基于该相关内容在终端连接的显示设备上显示应用程序的控制过程,由于用户使用语音来下发应用程序的语音命令,因此用户不需要手持终端进行触摸操作,也不需要使用鼠标键盘来操作应用程序,提高了在终端连接大屏幕场景下的应用程序处理效率。
在本申请的一些实施例中,步骤203终端根据语音识别处理的结果控制显示设备上显示与第一语音数据关联的内容之后,本申请实施例提供的终端投屏的控制方法除了执行前述步骤之外,终端还可以执行如下步骤:
终端获取应用程序的反馈结果;
终端将反馈结果转换成第二语音数据,并播放第二语音数据;或者,
终端在显示设备上显示反馈结果。
其中,终端在执行应用程序时,应用程序还可以生成反馈结果,该反馈结果可以指示应用程序成功响应用户的语音命令,也可以指示应用程序响应该语音命令失败。举说明如下,以应用程序为文档应用程序为例,若用户发出打开文档A的语音命令,则终端可以控制文档应用程序打开该文档A,文档应用程序可以根据文档A的执行情况生成反馈结果,该反馈结果可以是文档A打开成功或者打开失败。终端在获取到该反馈结果之后,终端可以将反馈结果转换成第二语音数据,并播放第二语音数据,例如终端内配置有播放器,终端可以通过该播放器播放第二语音数据,从而用户可以听到该第二语音数据。终端除了使用语音的方式播放反馈结果对应的第二语音数据之外,终端还可以在显示设备上显示反馈结果,使得用户可以从终端连接显示设备上确定出语音命令执行成功或者失败。
在本申请的一些实施例中,应用程序还可以只在执行失败的情况下生成反馈结果,并向用户提示执行失败,而在执行成功的情况下应用程序可以不生成反馈结果,从而减少了终端对用户的打扰。
通过前述实施例对本申请的举例说明可知,终端与显示设备连接,该终端采集第一语音数据,然后终端对第一语音数据进行语音识别处理,生成语音识别处理的结果,接下来终端根据语音识别处理的结果控制终端的应用程序,最后终端在显示设备上显示应用程序的控制过程。本申请实施例中用户可以通过语音交流的方式,直接向终端下达语音的命令,终端就可以采集用户发出的第一语音数据,终端可以根据语音识别处理的结果控制应用程序,从而应用程序的执行过程可以在终端设备连接显示设备上显示控制过程,不需要用户来手动的操作终端,因此提高了在终端连接大屏幕场景下的应用程序处理效率。
为便于更好的理解和实施本申请实施例的上述方案,下面举例相应的应用场景来进行具体说明。
本申请实施例提供的终端投屏的控制方法中,终端连接有一个大屏幕(简称为大屏)。终端首先进行语音识别,用户发出指令后终端把采集到用户的声音转换成文本,然后终端发送文本给云端服务器,由云端服务器进行语义解析,即云端服务器将识别到的文本进行解析,转换成机器能识别的指令和参数。终端最后进行命令的执行,即终端可以根据指令和参数,在大屏上执行识别后的各种命令。其中,在大屏上执行各种命令是指用户感觉是在大屏上操作应用程序,但实际执行中,应用程序还是运行在终端上,只是将这终端的控制过程投射到大屏上,而且大屏上显示的东西与终端不一样,即终端执行的是异源模式。
如图3所示,为本申请实施例提供的对文档应用程序进行终端投屏控制的实现架构示意图。以应用程序为文档应用程序、终端为手机为例,该文档应用程序可以是WPS文档,也可以是DOC文档。在一种实际应用场景中,讲师在进行文档(例如PPT)讲解,使用手机进行投屏,并且手机处于异源模式,如果讲师离手机较远,那么按照现有技术中采用鼠标点击的方式是无法控制大屏上的应用程序。本申请实施例中,讲师可以通过语音的方式来控制文档应用程序。
采用本申请实施例的操作流程如下:
步骤1、讲师可以向手机发出事先训练好的“免唤醒词”命令调起语音助手,比如通过对手机发送“小艺小艺”的语音,就可以调起语音助手并进入聆听状态。
步骤2、讲师说“打开WPS”。
语音助手会录音,剩下的过程由语音控制模块执行,语音助手的作用就是将采集的用户语音数据转化成文本。
例如,语音助手接收到命令之后,会把录音数据发给NLU模块,对语音进行识别,成为文本信息。然后语音助手会把文本信息发给云端服务器的语义解析模块,例如语音助手发送命令语料给云端服务器,云端服务器解析文本,云端服务器解析出文本后,形成手机能识别的指令和参数,发送命令语义给语音助手。然后语音助手发给手机。手机执行对应的命令,WPS被打开,手机连接显示器或者电视上显示手机投射过去文档应用程序的操作过程。接下来手机向语音助手发送命令的反馈。最后语音助手播报反馈给讲师。
接下来,讲师可以继续说下面的命令,进行一次完整的PPT讲解。例如,讲师可以发出如下语音命令:“打开第二个文档”、“播放”、“下一页”、“上一页”、“退出”、“关闭”。当然,讲师还可以说“最大化”、“最小化”、“全屏”等,对WPS或者其它应用的窗口进行相应控制。
接下来对本申请实施例提供的系统架构进行说明,以Android系统为例。该系统架构由如下典型模块组成:
首先对语音助手进行说明,该语音助手可以接收用户语音输入,然后通过NLU进行语音识别成文本,再发给云端服务器进行语义识别。云端服务器识别后通过手机上的语音助手发给手机的PC管理服务模块(例如PC Service)执行,PC Service是手机中新加的一个系统服务,是手机上的管理异源模式投射的服务端。语音助手还可以播报由PC Service发送执行的结果的反馈。
云端服务器解析文本,形成PC Service可以识别的命令和参数。
手机中的窗口管理系统对窗口大小进行控制,例如,窗口管理系统可以包括:动态管理服务模块(ActivityManagerService),还可以包括窗口管理服务(WindowManagerService)模块,例如使用动态管理服务模块控制窗口大小,如最大化、最小化、全屏、关闭等。其中,ActivityManagerService和WindowManagerService都是手机上的android的应用、窗口管理模块。PC Service调用这两个服务的应用程序编程接口(application programming interface,API)对窗口进行控制。
接下来对管理服务的实现过程进行说明,PC Service、ActivityManagerService、WindowManagerService都在Android系统服务里,PC Service可以调用ActivityManagerService、WindowManagerService。PC Service对于所有命令进行映射,然后选择合适对象模块的接口运行。根据命令执行的结果,形成反馈发给语音助手。举例说明如下,窗口最大化、最小化,这些是ActivityManagerService、WindowManagerService能做的,那么PC Service就调用它们的API。但是打开WPS中的第N个文档,那就需要PC Service和WPS模块进行合作,PC Service给WPS模块发命令,然后它们执行,执行完通知结果。
最后说明本申请实施例中的应用程序,该应用程序可以是文档应用程序(例如WPS应用程序),或者游戏应用程序,或者音视频应用程序等。
如图4所示,为本申请实施例提供的对文档应用程序进行语音控制的流程示意图。用户在使用一段时间大屏时,可能需要解放双手,期望通过语音交流的方式,本申请实施例中用户可以直接向手机下达命令,在大屏上执行指令,必要的时候进行适当的反馈。比如说:用户要打开一个PPT文档进行浏览,浏览后关闭。用户可以手机发送一系列命令。手机中的语音助手将语音命令转换成文本,然后发给云端服务器,云端服务器在进行语义解析后生成格式化的命令和参数,然后发送给手机的PC管理服务模块,然后PC管理服务模块将命令和参数发送给手机的窗口管理系统,窗口管理系统对文档等应用程序进行最大化、最小化等控制,窗口管理系统还可以生成执行结果发送给PC管理服务模块,PC管理服务模块发送执行结果给语音助手,由语音助手进行播报反馈。
例如,该命令可以在手机上打开语音助手,手机通过免唤醒词打开语音助手,并自动进入聆听状态。例如用户需要在大屏上打开办公应用,用户发出如下语音命令:打开WPS,则手机在大屏上打开WPS,进入文档列表。例如用户需要打开文档列表某个PPT文档,用户发出如下语音命令:打开第二个文档,则手机打开列表上第二个PPT。例如用户需要播放PPT,用户发出如下语音命令:播放,则手机大屏上的PPT进入播放状态。例如用户需要进入下一页,用户发出如下语音命令:下一页,则手机将PPT翻到下一页。例如用户需要回看上一页,用户发出如下的语音命令:上一页,则手机将PPT翻到上一页。例如用户需要结束播放,用户发出如下的语音命令:退出,则手机将PPT返回到未播放状态。例如用户需要关闭PPT,用户发出如下的语音命令:关闭WPS,则手机将WPS应用关闭。
通过本申请实施例提供的终端投屏的控制方法,可以通过语音控制大屏进行移动办公。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
为便于更好的实施本申请实施例的上述方案,下面还提供用于实施上述方案的相关装置。
请参阅如图5所示,为本申请实施例中终端的组成结构示意图,所述终端与显示设备连接,终端500可以包括:语音采集器501、处理器502;所述处理器502和所述语音采集器501之间进行相互的通信;
所述语音采集器501,用于采集第一语音数据;
所述处理器502,用于对所述第一语音数据进行语音识别处理;根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。
在本申请的一些实施例中,所述处理器502,还用于识别出与所述语音识别处理的结果对应的应用程序接口;通过所述应用程序接口控制所述应用程序,并在所述显示设备上显示相关内容。
在本申请的一些实施例中,所述处理器502,还用于通过所述应用程序接口调用管理服务功能模块;通过所述管理服务功能模块对所述应用程序进行控制。
在本申请的一些实施例中,所述处理器502,还用于对所述语音识别处理的结果进行语义解析,生成语义解析结果;从所述语义解析结果中提取出指令;根据所述指令识别出所述应用程序接口。
在本申请的一些实施例中,所述处理器502,还用于将所述语音识别处理的结果发送给云端服务器,由所述云端服务器对所述语音识别处理的结果进行语义解析;接收所述云端服务器进行语义解析后反馈的解析结果;根据所述解析结果识别出所述应用程序接口。
在本申请的一些实施例中,如图5所示,所述终端500还包括:播放器503,所述播放器503和所述处理器502相连接;
所述处理器502,还用于在所述显示设备上显示所述应用程序的控制过程之后,获取所述应用程序的反馈结果;将所述反馈结果转换成第二语音数据,控制所述播放器503播放所述第二语音数据;或者,控制所述显示设备显示所述反馈结果。
在本申请的一些实施例中,所述处理器502,还用于通过免唤醒词的方式调起语音助手;
所述语音采集器501,用于在所述语音助手的控制下对所述第一语音数据进行语音采集。
在本申请实施例中,终端与显示设备连接,该终端采集第一语音数据,然后终端对第一语音数据进行语音识别处理,生成语音识别处理的结果,接下来终端根据语音识别处理的结果控制终端的应用程序,最后终端在显示设备上显示应用程序的控制过程。本申请实施例中用户可以通过语音交流的方式,直接向终端下达语音的命令,终端就可以采集用户发出的第一语音数据,终端可以根据语音识别处理的结果控制应用程序,从而应用程序的执行过程可以在终端设备连接显示设备上显示控制过程,不需要用户来手动的操作终端,因此提高了在终端连接大屏幕场景下的应用程序处理效率。
如图6-a所示,本申请实施例还提供一种终端600,所述终端600与显示设备连接,所述终端600包括:
采集模块601,用于采集第一语音数据;
语音识别模块602,用于对所述第一语音数据进行语音识别处理;
显示模块603,用于根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。
在本申请的一些实施例中,如图6-b所示,所述显示模块603,包括:
接口识别单元6031,用于识别出与所述语音识别处理的结果对应的应用程序接口;
控制单元6032,用于通过所述应用程序接口控制所述应用程序,并在所述显示设备上显示相关内容。
在本申请的一些实施例中,所述接口识别单元6031,用于对所述语音识别处理的结果进行语义解析,生成语义解析结果;从所述语义解析结果中提取出指令;根据所述指令识别出所述应用程序接口。
在本申请的一些实施例中,所述接口识别单元6031,用于将所述语音识别处理的结果发送给云端服务器,由所述云端服务器对所述语音识别处理的结果进行语义解析;接收所述云端服务器进行语义解析后反馈的解析结果;根据所述解析结果识别出所述应用程序接口。
在本申请的一些实施例中,如图6-c所示,所述终端600,还包括:获取模块604和播放模块605,其中,
所述获取模块604,用于所述显示模块603在所述显示设备上显示所述应用程序的控制过程之后,获取所述应用程序的反馈结果;
所述播放模块605,用于将所述反馈结果转换成第二语音数据,并播放所述第二语音数据;或者,
所述显示模块603,还用于在所述显示设备上显示所述反馈结果。
需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其带来的技术效果与本申请方法实施例相同,具体内容可参见本申请前述所示的方法实施例中的叙述,此处不再赘述。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储有程序,该程序执行包括上述方法实施例中记载的部分或全部步骤。
如图7所示,为本申请实施例的又一种终端的结构示意图,该终端可以包括:处理器131(例如CPU)、存储器132、发送器134和接收器133;发送器134和接收器133耦合至处理器131,处理器131控制发送器134的发送动作和接收器133的接收动作。存储器132可能包含高速RAM存储器,也可能还包括非易失性存储器NVM,例如至少一个磁盘存储器,存储器132中可以存储各种指令,以用于完成各种处理功能以及实现本申请实施例的方法步骤。可选的,本申请实施例涉及的终端还可以包括:电源135、通信总线136以及通信端口137中的一个或多个。接收器133和发送器134可以集成在终端的收发器中,也可以为终端上分别独立的收、发天线。通信总线136用于实现元件之间的通信连接。上述通信端口137用于实现终端与其他外设之间进行连接通信。
在本申请实施例中,上述存储器132用于存储计算机可执行程序代码,程序代码包括指令;当处理器131执行指令时,指令使处理器131执行上述方法实施例中终端的处理动作,使发送器134执行上述方法实施例中终端的发送动作,其实现原理和技术效果类似,在此不再赘述。
在另一种可能的设计中,当该终端为芯片时,芯片包括:处理单元和通信单元,所述处理单元例如可以是处理器,所述通信单元例如可以是输入/输出接口、管脚或电路等。该处理单元可执行存储单元存储的计算机执行指令,以使该终端内的芯片执行上述第一方面任意一项的无线通信方法。可选地,所述存储单元为所述芯片内的存储单元,如寄存器、缓存等,所述存储单元还可以是所述终端内的位于所述芯片外部的存储单元,如只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)等。
其中,上述任一处提到的处理器,可以是一个通用中央处理器(CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制上述第一方面无线通信方法的程序执行的集成电路。
另外需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本申请提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘、U盘、移动硬盘、ROM、RAM、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(Solid State Disk,SSD))等。

Claims (15)

1.一种终端投屏的控制方法,其特征在于,所述方法应用于终端,所述终端与显示设备连接,所述方法包括:
所述终端采集第一语音数据;
所述终端对所述第一语音数据进行语音识别处理;
所述终端根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。
2.根据权利要求1所述的方法,其特征在于,所述终端根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容,包括:
所述终端识别出与所述语音识别处理的结果对应的应用程序接口;
所述终端通过所述应用程序接口控制应用程序,并在所述显示设备上显示相关内容。
3.根据权利要求2所述的方法,其特征在于,所述终端识别出与所述语音识别处理的结果对应的应用程序接口,包括:
所述终端对所述语音识别处理的结果进行语义解析,生成语义解析结果;
所述终端根据所述语义解析结果识别出所述应用程序接口。
4.根据权利要求2所述的方法,其特征在于,所述终端识别出与所述语音识别处理的结果对应的应用程序接口,包括:
所述终端将所述语音识别处理的结果发送给云端服务器,由所述云端服务器对所述语音识别处理的结果进行语义解析;
所述终端接收所述云端服务器进行语义解析后反馈的解析结果;
所述终端根据所述解析结果识别出所述应用程序接口。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述终端根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容之后,所述方法还包括:
所述终端获取所述应用程序的反馈结果;
所述终端将所述反馈结果转换成第二语音数据,并播放所述第二语音数据;或者,
所述终端在所述显示设备上显示所述反馈结果。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述终端采集第一语音数据,包括:
所述终端通过免唤醒词的方式调起语音助手,由所述语音助手对所述第一语音数据进行语音采集。
7.一种终端,其特征在于,所述终端与显示设备连接,所述终端包括:语音采集器、处理器;所述处理器和所述语音采集器之间进行相互的通信;
所述语音采集器,用于采集第一语音数据;
所述处理器,用于对所述第一语音数据进行语音识别处理;根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容。
8.根据权利要求7所述的终端,其特征在于,所述处理器,还用于识别出与所述语音识别处理的结果对应的应用程序接口;通过所述应用程序接口控制所述应用程序,并在所述显示设备上显示相关内容。
9.根据权利要求8所述的终端,其特征在于,所述处理器,还用于通过所述应用程序接口调用管理服务功能模块;通过所述管理服务功能模块对所述应用程序进行控制。
10.根据权利要求8或9所述的终端,其特征在于,所述处理器,还用于对所述语音识别处理的结果进行语义解析,生成语义解析结果;根据所述语义解析结果识别出所述应用程序接口。
11.根据权利要求8或9所述的终端,其特征在于,所述处理器,还用于将所述语音识别处理的结果发送给云端服务器,由所述云端服务器对所述语音识别处理的结果进行语义解析;接收所述云端服务器进行语义解析后反馈的解析结果;根据所述解析结果识别出所述应用程序接口。
12.根据权利要求7至11中任一项所述的终端,其特征在于,所述终端还包括:播放器,所述播放器和所述处理器相连接;
所述处理器,还用于根据所述语音识别处理的结果控制显示设备上显示与所述第一语音数据关联的内容之后,获取所述应用程序的反馈结果;将所述反馈结果转换成第二语音数据,控制所述播放器播放所述第二语音数据;或者,控制所述显示设备显示所述反馈结果。
13.根据权利要求7至12中任一项所述的终端,其特征在于,所述处理器,还用于通过免唤醒词的方式调起语音助手;
所述语音采集器,用于在所述语音助手的控制下对所述第一语音数据进行语音采集。
14.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-6任意一项所述的方法。
15.一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行如权利要求1-6任意一项所述的方法。
CN201811204521.3A 2018-10-16 2018-10-16 一种终端投屏的控制方法和终端 Pending CN109448709A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201811204521.3A CN109448709A (zh) 2018-10-16 2018-10-16 一种终端投屏的控制方法和终端
PCT/CN2019/110926 WO2020078300A1 (zh) 2018-10-16 2019-10-14 一种终端投屏的控制方法和终端
US17/285,563 US20210398527A1 (en) 2018-10-16 2019-10-14 Terminal screen projection control method and terminal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811204521.3A CN109448709A (zh) 2018-10-16 2018-10-16 一种终端投屏的控制方法和终端

Publications (1)

Publication Number Publication Date
CN109448709A true CN109448709A (zh) 2019-03-08

Family

ID=65546682

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811204521.3A Pending CN109448709A (zh) 2018-10-16 2018-10-16 一种终端投屏的控制方法和终端

Country Status (3)

Country Link
US (1) US20210398527A1 (zh)
CN (1) CN109448709A (zh)
WO (1) WO2020078300A1 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110060678A (zh) * 2019-04-16 2019-07-26 深圳欧博思智能科技有限公司 一种基于智能设备的虚拟角色控制方法及智能设备
CN110310638A (zh) * 2019-06-26 2019-10-08 芋头科技(杭州)有限公司 投屏方法、装置、电子设备和计算机可读存储介质
WO2020078300A1 (zh) * 2018-10-16 2020-04-23 华为技术有限公司 一种终端投屏的控制方法和终端
CN111341315A (zh) * 2020-03-06 2020-06-26 腾讯科技(深圳)有限公司 语音控制方法、装置、计算机设备和存储介质
CN111524516A (zh) * 2020-04-30 2020-08-11 青岛海信网络科技股份有限公司 一种基于语音交互的控制方法、服务器及显示设备
CN112331202A (zh) * 2020-11-04 2021-02-05 北京奇艺世纪科技有限公司 一种语音投屏方法及装置、电子设备和计算机可读存储介质
CN112351315A (zh) * 2019-08-07 2021-02-09 厦门强力巨彩光电科技有限公司 无线投屏方法以及led显示器
CN113129202A (zh) * 2020-01-10 2021-07-16 华为技术有限公司 数据传输方法、装置及数据处理系统、存储介质
WO2021164313A1 (zh) * 2020-02-20 2021-08-26 华为技术有限公司 界面布局方法、装置及系统
CN114090166A (zh) * 2021-11-29 2022-02-25 云知声智能科技股份有限公司 一种交互的方法和装置
WO2022088875A1 (zh) * 2020-10-28 2022-05-05 华为技术有限公司 信息处理方法、终端设备及分布式网络

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107978316A (zh) * 2017-11-15 2018-05-01 西安蜂语信息科技有限公司 控制终端的方法及装置
CN108012169A (zh) * 2017-11-30 2018-05-08 百度在线网络技术(北京)有限公司 一种语音交互投屏方法、装置和服务器
US9996310B1 (en) * 2016-09-15 2018-06-12 Amazon Technologies, Inc. Content prioritization for a display array
CN108520743A (zh) * 2018-02-02 2018-09-11 百度在线网络技术(北京)有限公司 智能设备的语音控制方法、智能设备及计算机可读介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4230487B2 (ja) * 1997-10-07 2009-02-25 雅信 鯨田 Webページ連動型の複数連携型表示システム
KR100441743B1 (ko) * 2001-10-23 2004-07-27 한국전자통신연구원 원격 가전 제어 시스템 및 그 방법
US9542956B1 (en) * 2012-01-09 2017-01-10 Interactive Voice, Inc. Systems and methods for responding to human spoken audio
KR101944414B1 (ko) * 2012-06-04 2019-01-31 삼성전자주식회사 음성 인식 서비스를 제공하기 위한 방법 및 그 전자 장치
KR101330671B1 (ko) * 2012-09-28 2013-11-15 삼성전자주식회사 전자장치, 서버 및 그 제어방법
KR101759009B1 (ko) * 2013-03-15 2017-07-17 애플 인크. 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것
US9431008B2 (en) * 2013-05-29 2016-08-30 Nuance Communications, Inc. Multiple parallel dialogs in smart phone applications
JP5955299B2 (ja) * 2013-11-08 2016-07-20 株式会社ソニー・インタラクティブエンタテインメント 表示制御装置、表示制御方法、プログラム及び情報記憶媒体
KR102261552B1 (ko) * 2014-06-30 2021-06-07 삼성전자주식회사 음성 명령어 제공 방법 및 이를 지원하는 전자 장치
US9767794B2 (en) * 2014-08-11 2017-09-19 Nuance Communications, Inc. Dialog flow management in hierarchical task dialogs
CN106653011A (zh) * 2016-09-12 2017-05-10 努比亚技术有限公司 一种语音控制方法、装置及终端
CN106847284A (zh) * 2017-03-09 2017-06-13 深圳市八圈科技有限公司 电子设备、计算机可读存储介质及语音交互方法
CN106993211A (zh) * 2017-03-24 2017-07-28 百度在线网络技术(北京)有限公司 基于人工智能的网络电视控制方法及装置
CN108538291A (zh) * 2018-04-11 2018-09-14 百度在线网络技术(北京)有限公司 语音控制方法、终端设备、云端服务器及系统
CN108597511A (zh) * 2018-04-28 2018-09-28 深圳市敢为特种设备物联网技术有限公司 基于物联网的信息展示方法、控制终端及可读存储介质
CN109117233A (zh) * 2018-08-22 2019-01-01 百度在线网络技术(北京)有限公司 用于处理信息的方法和装置
CN109448709A (zh) * 2018-10-16 2019-03-08 华为技术有限公司 一种终端投屏的控制方法和终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9996310B1 (en) * 2016-09-15 2018-06-12 Amazon Technologies, Inc. Content prioritization for a display array
CN107978316A (zh) * 2017-11-15 2018-05-01 西安蜂语信息科技有限公司 控制终端的方法及装置
CN108012169A (zh) * 2017-11-30 2018-05-08 百度在线网络技术(北京)有限公司 一种语音交互投屏方法、装置和服务器
CN108520743A (zh) * 2018-02-02 2018-09-11 百度在线网络技术(北京)有限公司 智能设备的语音控制方法、智能设备及计算机可读介质

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020078300A1 (zh) * 2018-10-16 2020-04-23 华为技术有限公司 一种终端投屏的控制方法和终端
CN110060678A (zh) * 2019-04-16 2019-07-26 深圳欧博思智能科技有限公司 一种基于智能设备的虚拟角色控制方法及智能设备
CN110060678B (zh) * 2019-04-16 2021-09-14 深圳欧博思智能科技有限公司 一种基于智能设备的虚拟角色控制方法及智能设备
CN110310638A (zh) * 2019-06-26 2019-10-08 芋头科技(杭州)有限公司 投屏方法、装置、电子设备和计算机可读存储介质
CN112351315B (zh) * 2019-08-07 2022-08-19 厦门强力巨彩光电科技有限公司 无线投屏方法以及led显示器
CN112351315A (zh) * 2019-08-07 2021-02-09 厦门强力巨彩光电科技有限公司 无线投屏方法以及led显示器
CN113129202B (zh) * 2020-01-10 2023-05-09 华为技术有限公司 数据传输方法、装置及数据处理系统、存储介质
CN113129202A (zh) * 2020-01-10 2021-07-16 华为技术有限公司 数据传输方法、装置及数据处理系统、存储介质
WO2021164313A1 (zh) * 2020-02-20 2021-08-26 华为技术有限公司 界面布局方法、装置及系统
CN111341315A (zh) * 2020-03-06 2020-06-26 腾讯科技(深圳)有限公司 语音控制方法、装置、计算机设备和存储介质
CN111341315B (zh) * 2020-03-06 2023-08-04 腾讯科技(深圳)有限公司 语音控制方法、装置、计算机设备和存储介质
CN111524516A (zh) * 2020-04-30 2020-08-11 青岛海信网络科技股份有限公司 一种基于语音交互的控制方法、服务器及显示设备
WO2022088875A1 (zh) * 2020-10-28 2022-05-05 华为技术有限公司 信息处理方法、终端设备及分布式网络
CN112331202A (zh) * 2020-11-04 2021-02-05 北京奇艺世纪科技有限公司 一种语音投屏方法及装置、电子设备和计算机可读存储介质
CN112331202B (zh) * 2020-11-04 2024-03-01 北京奇艺世纪科技有限公司 一种语音投屏方法及装置、电子设备和计算机可读存储介质
CN114090166A (zh) * 2021-11-29 2022-02-25 云知声智能科技股份有限公司 一种交互的方法和装置

Also Published As

Publication number Publication date
US20210398527A1 (en) 2021-12-23
WO2020078300A1 (zh) 2020-04-23

Similar Documents

Publication Publication Date Title
CN109448709A (zh) 一种终端投屏的控制方法和终端
CN104995865B (zh) 基于声音和/或面部辨识的服务提供
US11227598B2 (en) Method for controlling terminal by voice, terminal, server and storage medium
CN107844586A (zh) 新闻推荐方法和装置
CN104954354A (zh) 数字内容的上下文感知流式传送
WO2021175007A1 (zh) 在线客服咨询方法、装置、介质及电子设备
CN106789543A (zh) 会话中实现表情图像发送的方法和装置
CN108470034A (zh) 一种智能设备服务提供方法及系统
CN104918105B (zh) 媒体文件的多屏播放方法、设备及系统
JP2015517709A (ja) コンテキストに基づくメディアを適応配信するシステム
CN105590491A (zh) 一种基于app的学习系统及学习方法
CN105302925A (zh) 推送语音搜索数据的方法和装置
US20170168660A1 (en) Voice bullet screen generation method and electronic device
CN109151565A (zh) 播放语音的方法、装置、电子设备及存储介质
WO2020055156A1 (en) System and method for a scene builder
CN107733876A (zh) 一种流媒体字幕显示方法、移动终端及存储装置
CN106921865A (zh) 视频处理方法及装置
US20230298628A1 (en) Video editing method and apparatus, computer device, and storage medium
CN112581965A (zh) 转写方法、装置、录音笔和存储介质
CN107073333A (zh) 简档驱动的化身会话
CN113315979A (zh) 数据处理方法、装置、电子设备和存储介质
CN110418181A (zh) 对智能电视的业务处理方法、装置、智能设备及存储介质
CN104820662A (zh) 业务服务器装置
US9906485B1 (en) Apparatus and method for coordinating live computer network events
CN103685491B (zh) 一种应用服务提供方法、系统及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination