CN113490041A - 语音功能切换方法及显示设备 - Google Patents

语音功能切换方法及显示设备 Download PDF

Info

Publication number
CN113490041A
CN113490041A CN202110738814.5A CN202110738814A CN113490041A CN 113490041 A CN113490041 A CN 113490041A CN 202110738814 A CN202110738814 A CN 202110738814A CN 113490041 A CN113490041 A CN 113490041A
Authority
CN
China
Prior art keywords
application
instruction
channel
voice
display device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110738814.5A
Other languages
English (en)
Other versions
CN113490041B (zh
Inventor
陈琪
鲁亚凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vidaa Netherlands International Holdings BV
Vidaa USA Inc
Original Assignee
Vidaa Netherlands International Holdings BV
Vidaa USA Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vidaa Netherlands International Holdings BV, Vidaa USA Inc filed Critical Vidaa Netherlands International Holdings BV
Priority to CN202110738814.5A priority Critical patent/CN113490041B/zh
Publication of CN113490041A publication Critical patent/CN113490041A/zh
Priority to EP22772086.9A priority patent/EP4309031A1/en
Priority to PCT/US2022/020435 priority patent/WO2022197737A1/en
Priority to US18/278,537 priority patent/US20240053957A1/en
Application granted granted Critical
Publication of CN113490041B publication Critical patent/CN113490041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • H04N21/4383Accessing a communication channel
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供了一种语音功能切换方法及显示设备。用户向显示设备输入语音内容之后,显示设备会将语音内容发送到服务器进行语义识别等操作。服务器根据识别出的内容生成对应类型的语音指令,并下发至显示设备。显示设备在语音指令为频道切换指令的情况下,检测当前是否有应用正在运行,如果有,则将频道切换指令切换为频道搜索指令,并响应于频道搜索指令,在当前运行的应用内搜索目标频道;如果没有,则直接切换至目标频道。可见,本申请的技术方案能够根据显示设备当前的应用运行情况,对应地调整频道切换和频道搜索的操作,而不是统一响应于服务器下发的频道切换指令,从而提高显示设备响应用户真实意图的准确性,保证用户的使用体验。

Description

语音功能切换方法及显示设备
技术领域
本申请涉及显示技术领域,尤其涉及一种语音功能切换方法及显示设备。
背景技术
随着智能时代的来临和网络技术的不断发展,用户更青睐于在显示设备上进行语音功能的交互体验,同时,显示设备上的语音功能也越来越丰富。显示设备可以通过语音服务商等识别用户输入的语音内容,并使用语音技术对识别到的内容进行分析,理解用户的真实目的,进而实现非手动式控制显示设备,提升用户的体验感受。
目前,显示设备上的语音功能可以实现搜索内容、切换频道、控制音量等操作,但在频道处理上,显示设备所支持的语音解析技术相对单一,当输入的语音内容中含有频道名称时,用于识别语音内容的服务器会统一向显示设备下发频道切换指令,控制显示设备直接切换至目标频道,而不会考虑到用户输入语音内容的目的是切换频道还是搜索频道。例如,用户向显示设备输入语音内容为“搜索tv1”,由于语音内容中包含“tv1”,显示设备受服务器的控制会直接将显示内容切换至“tv1”频道的内容,而不是按照用户的需求去搜索“tv1”。
可见,目前基于服务器进行语义识别后产生的频道切换指令并不会完全符合用户的真正意图,进而显示设备响应于该频道切换指令所执行的动作也难以满足完全用户需求,影响用户的使用体验。
发明内容
本申请提供了一种语音功能切换方法及显示设备,以解决目前显示设备根据服务器下发的频道切换指令进行的操作难以满足用户真实意图的问题。
第一方面,本申请提供了一种显示设备,包括:
显示器;
控制器,被配置为:
获取服务器下发的语音指令;
检测所述语音指令的类型;
在所述语音指令为频道切换指令的情况下,检测显示设备当前是否运行应用;
在显示设备当前运行应用的情况下,将所述频道切换指令切换为频道搜索指令;
响应于所述频道搜索指令,在所述应用内搜索目标频道。
在一些实施例中,所述控制器,还被配置为:
在所述语音指令为频道切换指令,以及显示设备当前未运行应用的情况下,控制显示设备直接切换至目标频道,同时播放所述目标频道的内容。
在一些实施例中,所述控制器,还被配置为:
在所述语音指令为资源搜索指令的情况下,检测显示设备当前是否运行应用;
在显示设备当前运行应用的情况下,在所述应用内搜索目标资源。
在一些实施例中,所述控制器,还被配置为:
在所述语音指令为资源搜索指令,以及显示设备当前未运行应用的情况下,检测所述语音指令中是否包含目标应用的应用名称;
在所述语音指令中包含目标应用的应用名称的情况下,运行所述目标应用;
在所述目标应用内搜索目标资源。
在一些实施例中,所述控制器,还被配置为:
在所述语音指令中不包含目标应用的应用名称的情况下,在显示设备自身提供的待选资源中搜索目标资源。
在一些实施例中,所述控制器,还被配置为:
将用户向显示设备输入的语音内容发送至服务器;所述服务器用于根据所述语音内容生成不同类型的语音指令,将所述语音指令下发至所述显示设备;以及,所述服务器还用于在所述语音内容中包括频道名称的情况下,生成用于指示显示设备切换频道的频道切换指令。
第二方面,本申请提供了一种语音功能切换方法,包括:
获取服务器下发的语音指令;
检测所述语音指令的类型;
在所述语音指令为频道切换指令的情况下,检测显示设备当前是否运行应用;
在显示设备当前运行应用的情况下,将所述频道切换指令切换为频道搜索指令;
响应于所述频道搜索指令,在所述应用内搜索目标频道。
在一些实施例中,所述方法还包括:
在所述语音指令为频道切换指令,以及显示设备当前未运行应用的情况下,控制显示设备直接切换至目标频道,同时播放所述目标频道的内容。
在一些实施例中,所述方法还包括:
在所述语音指令为资源搜索指令的情况下,检测显示设备当前是否运行应用;
在显示设备当前运行应用的情况下,在所述应用内搜索目标资源。
在一些实施例中,所述方法还包括:
在所述语音指令为资源搜索指令,以及显示设备当前未运行应用的情况下,检测所述语音指令中是否包含目标应用的应用名称;
在所述语音指令中包含目标应用的应用名称的情况下,运行所述目标应用;
在所述目标应用内搜索目标资源。
由上述内容可知,本申请中提供了一种语音功能切换方法及显示设备。用户向显示设备输入用于进行语音控制的语音内容之后,显示设备会将语音内容发送到服务器进行语义识别等操作。服务器根据识别出的内容生成对应类型的语音指令,并下发至显示设备。显示设备在语音指令为频道切换指令的情况下,检测当前是否有应用正在运行,如果有,则将频道切换指令切换为频道搜索指令,并响应于频道搜索指令,在当前运行的应用内搜索目标频道;如果没有,则直接切换至目标频道。可见,本申请的技术方案能够根据显示设备当前的应用运行情况,对应地调整频道切换和频道搜索的操作,而不是统一响应于服务器下发的频道切换指令,从而提高显示设备响应用户真实意图的准确性,保证用户的使用体验。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据一些实施例的显示设备的使用场景的示意图;
图2示出了根据一些实施例的控制装置100的硬件配置框图;
图3示出了根据一些实施例的显示设备200的硬件配置框图;
图4示出了根据一些实施例的显示设备200中软件配置图;
图5示出了根据一些实施例的具有语音模块的显示设备200与用户的交互示意图;
图6示出了根据一些实施例的具有语音模块的控制装置100与显示设备200和用户的交互示意图;
图7示出了根据一些实施例的显示设备200与服务器400之间的交互示意图;
图8示出了根据一些实施例的应用A显示页面的示意图;
图9示出了根据一些实施例的频道搜索结果的一种示意图;
图10示出了根据一些实施例的频道搜索结果的另一种示意图;
图11示出了根据一些实施例的显示设备200搜索目标频道的流程图;
图12示出了根据一些实施例的显示设备200搜索目标资源的流程图。
具体实施方式
为使本申请的目的和实施方式更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。
术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的所有组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
术语“模块”是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
图1示出了根据一些实施例的显示设备的使用场景的示意图。如图1所示,显示设备200还与服务器400进行数据通信,用户可通过智能设备300或控制装置100操作显示设备200。
在一些实施例中,控制装置100可以是遥控器,遥控器和显示设备的通信包括红外协议通信或蓝牙协议通信,及其他短距离通信方式中的至少一种,通过无线或有线方式来控制显示设备200。用户可以通过遥控器上按键、语音输入、控制面板输入等至少一种输入用户指令,来控制显示设备200。
在一些实施例中,智能设备300可以包括移动终端、平板电脑、计算机、笔记本电脑,AR/VR设备等中的任意一种。
在一些实施例中,也可以使用智能设备300以控制显示设备200。例如,使用在智能设备上运行的应用程序控制显示设备200。
在一些实施例中,也可以使用智能设备300和显示设备进行数据的通信。
在一些实施例中,显示设备200还可以采用除了控制装置100和智能设备300之外的方式进行控制,例如,可以通过显示设备200设备内部配置的获取语音指令的模块直接接收用户的语音指令控制,也可以通过显示设备200设备外部设置的语音控制装置来接收用户的语音指令控制。
在一些实施例中,显示设备200还与服务器400进行数据通信。可允许显示设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器400可以向显示设备200提供各种内容和互动。服务器400可以是一个集群,也可以是多个集群,可以包括一类或多类服务器。
在一些实施例中,一个步骤执行主体执行的软件步骤可以随需求迁移到与之进行数据通信的另一步骤执行主体上进行执行。示例性的,服务器执行的软件步骤可以随需求迁移到与之数据通信的显示设备上执行,反之亦然。
图2示出了根据一些实施例的控制装置100的硬件配置框图。如图2所示,控制装置100包括控制器110、通信接口130、用户输入/输出接口140、存储器、供电电源。控制装置100可接收用户的输入操作指令,且将操作指令转换为显示设备200可识别和响应的指令,起用用户与显示设备200之间交互中介作用。
在一些实施例中,通信接口130用于和外部通信,包含WIFI芯片,蓝牙模块,NFC或可替代模块中的至少一种。
在一些实施例中,用户输入/输出接口140包含麦克风,触摸板,传感器,按键或可替代模块中的至少一种。
图3示出了根据一些实施例的显示设备200的硬件配置框图。
在一些实施例中,显示设备200包括调谐解调器210、通信器220、检测器230、外部装置接口240、控制器250、显示器260、音频输出接口270、存储器、供电电源、用户接口中的至少一种。
在一些实施例中控制器包括中央处理器,视频处理器,音频处理器,图形处理器,RAM,ROM,用于输入/输出的第一接口至第n接口。
在一些实施例中,显示器260包括用于呈现画面的显示屏组件,以及驱动图像显示的驱动组件,用于接收源自控制器输出的图像信号,进行显示视频内容、图像内容以及菜单操控界面的组件以及用户操控UI界面等。
在一些实施例中,显示器260可为液晶显示器、OLED显示器、以及投影显示器中的至少一种,还可以为一种投影装置和投影屏幕。
在一些实施例中,调谐解调器210通过有线或无线接收方式接收广播电视信号,以及从多个无线或有线广播电视信号中解调出音视频信号,如以及EPG数据信号。
在一些实施例中,通信器220是用于根据各种通信协议类型与外部设备或服务器进行通信的组件。例如:通信器可以包括Wifi模块,蓝牙模块,有线以太网模块等其他网络通信协议芯片或近场通信协议芯片,以及红外接收器中的至少一种。显示设备200可以通过通信器220与控制装置100或服务器400建立控制信号和数据信号的发送和接收。
在一些实施例中,检测器230用于采集外部环境或与外部交互的信号。例如,检测器230包括光接收器,用于采集环境光线强度的传感器;或者,检测器230包括图像采集器,如摄像头,可以用于采集外部环境场景、用户的属性或用户交互手势,再或者,检测器230包括声音采集器,如麦克风等,用于接收外部声音。
在一些实施例中,外部装置接口240可以包括但不限于如下:高清多媒体接口(HDMI)、模拟或数据高清分量输入接口(分量)、复合视频输入接口(CVBS)、USB输入接口(USB)、RGB端口等任一个或多个接口。也可以是上述多个接口形成的复合性的输入/输出接口。
在一些实施例中,控制器250和调谐解调器210可以位于不同的分体设备中,即调谐解调器210也可在控制器250所在的主体设备的外置设备中,如外置机顶盒等。
在一些实施例中,控制器250,通过存储在存储器上中各种软件控制程序,来控制显示设备的工作和响应用户的操作。控制器250控制显示设备200的整体操作。例如:响应于接收到用于选择在显示器260上显示UI对象的用户命令,控制器250便可以执行与由用户命令选择的对象有关的操作。
在一些实施例中,所述对象可以是可选对象中的任何一个,例如超链接、图标或其他可操作的控件。与所选择的对象有关操作有:显示连接到超链接页面、文档、图像等操作,或者执行与所述图标相对应程序的操作。
在一些实施例中控制器包括中央处理器(Central Processing Unit,CPU),视频处理器,音频处理器,图形处理器(Graphics Processing Unit,GPU),RAM Random AccessMemory,RAM),ROM(Read-Only Memory,ROM),用于输入/输出的第一接口至第n接口,通信总线(Bus)等中的至少一种。
CPU处理器。用于执行存储在存储器中操作系统和应用程序指令,以及根据接收外部输入的各种交互指令,来执行各种应用程序、数据和内容,以便最终显示和播放各种音视频内容。CPU处理器,可以包括多个处理器。如,包括一个主处理器以及一个或多个子处理器。
在一些实施例中,图形处理器,用于产生各种图形对象,如:图标、操作菜单、以及用户输入指令显示图形等中的至少一种。图形处理器包括运算器,通过接收用户输入各种交互指令进行运算,根据显示属性显示各种对象;还包括渲染器,对基于运算器得到的各种对象,进行渲染,上述渲染后的对象用于显示在显示器上。
在一些实施例中,视频处理器,用于将接收外部视频信号,根据输入信号的标准编解码协议,进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等视频处理中的至少一种,可得到直接可显示设备200上显示或播放的信号。
在一些实施例中,视频处理器,包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等中的至少一种。其中,解复用模块,用于对输入音视频数据流进行解复用处理。视频解码模块,用于对解复用后的视频信号进行处理,包括解码和缩放处理等。图像合成模块,如图像合成器,其用于将图形生成器根据用户输入或自身生成的GUI信号,与缩放处理后视频图像进行叠加混合处理,以生成可供显示的图像信号。帧率转换模块,用于对转换输入视频帧率。显示格式化模块,用于将接收帧率转换后视频输出信号,改变信号以符合显示格式的信号,如输出RGB数据信号。
在一些实施例中,音频处理器,用于接收外部的音频信号,根据输入信号的标准编解码协议,进行解压缩和解码,以及降噪、数模转换、和放大处理等处理中的至少一种,得到可以在扬声器中播放的声音信号。
在一些实施例中,用户可在显示器260上显示的图形用户界面(GUI)输入用户命令,则用户输入接口通过图形用户界面(GUI)接收用户输入命令。或者,用户可通过输入特定的声音或手势进行输入用户命令,则用户输入接口通过传感器识别出声音或手势,来接收用户输入命令。
在一些实施例中,“用户界面”,是应用程序或操作系统与用户之间进行交互和信息交换的介质接口,它实现信息的内部形式与用户可以接受形式之间的转换。用户界面常用的表现形式是图形用户界面(Graphic User Interface,GUI),是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的一个图标、窗口、控件等界面元素,其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素中的至少一种。
在一些实施例中,用户接口280,为可用于接收控制输入的接口(如:显示设备本体上的实体按键,或其他等)。
在一些实施例中,显示设备的系统可以包括内核(Kernel)、命令解析器(shell)、文件系统和应用程序。内核、shell和文件系统一起组成了基本的操作系统结构,它们让用户可以管理文件、运行程序并使用系统。上电后,内核启动,激活内核空间,抽象硬件、初始化硬件参数等,运行并维护虚拟内存、调度器、信号及进程间通信(IPC)。内核启动后,再加载Shell和用户应用程序。应用程序在启动后被编译成机器码,形成一个进程。
如图4所示,显示设备的系统可以包括内核(Kernel)、命令解析器(shell)、文件系统和应用程序。内核、shell和文件系统一起组成了基本的操作系统结构,它们让用户可以管理文件、运行程序并使用系统。上电后,内核启动,激活内核空间,抽象硬件、初始化硬件参数等,运行并维护虚拟内存、调度器、信号及进程间通信(IPC)。内核启动后,再加载Shell和用户应用程序。应用程序在启动后被编译成机器码,形成一个进程。
如图4所示,将显示设备的系统分为三层,从上至下分别为应用层、中间件层和硬件层。
应用层主要包含电视上的常用应用,以及应用框架(Application Framework),其中,常用应用主要是基于浏览器Browser开发的应用,例如:HTML5 APPs;以及原生应用(Native APPs);
应用框架(Application Framework)是一个完整的程序模型,具备标准应用软件所需的一切基本功能,例如:文件存取、资料交换…,以及这些功能的使用接口(工具栏、状态列、菜单、对话框)。
原生应用(Native APPs)可以支持在线或离线,消息推送或本地资源访问。
中间件层包括各种电视协议、多媒体协议以及系统组件等中间件。中间件可以使用系统软件所提供的基础服务(功能),衔接网络上应用系统的各个部分或不同的应用,能够达到资源共享、功能共享的目的。
硬件层主要包括HAL接口、硬件以及驱动,其中,HAL接口为所有电视芯片对接的统一接口,具体逻辑由各个芯片来实现。驱动主要包含:音频驱动、显示驱动、蓝牙驱动、摄像头驱动、WIFI驱动、USB驱动、HDMI驱动、传感器驱动(如指纹传感器,温度传感器,压力传感器等)、以及电源驱动等。
随着智能时代的来临和网络技术的不断发展,用户更青睐于在显示设备200上进行语音功能的交互体验,同时,显示设备200上的语音功能也越来越丰富。显示设备200可以通过语音服务商等识别用户输入的语音内容,并使用语音技术对识别到的内容进行分析,理解用户的真实目的,进而实现非手动式控制显示设备200,提升用户的体验感受。
目前,显示设备200上的语音功能可以实现搜索内容、切换频道、控制音量等操作,但在频道处理上,显示设备200所支持的语音解析技术相对单一,当输入的语音内容中含有频道名称时,用于识别语音内容的服务器400会统一向显示设备200下发频道切换指令,控制显示设备200直接切换至目标频道,而不会考虑到用户输入语音内容的目的是切换频道还是搜索频道。例如,用户向显示设备200输入语音内容为“搜索tv1”,由于语音内容中包含“tv1”,显示设备200受服务器400的控制会直接将显示内容切换至“tv1”频道的内容,而不是按照用户的需求去搜索“tv1”。
可见,目前基于服务器400进行语义识别后产生的频道切换指令并不会完全符合用户的真正意图,进而显示设备200响应于该频道切换指令所执行的动作也难以完全满足用户需求,影响用户的使用体验。
基于上述内容,本申请实施例中提供了一种显示设备200,即使服务器400统一下发了频道切换指令,显示设备200也可以根据自身的应用运行情况,对应调整频道切换操作和频道搜索操作,而不会仅仅响应于频道切换指令,进而避免频道切换指令与用户意图不相符的情况。
本申请实施例的显示设备200中,可以设有用于收集语音内容的语音模块或者拾音装置等。参见图5,图5示出了根据一些实施例的具有语音模块的显示设备200与用户的交互示意图,用户可以直接向显示设备200输入语音内容,例如,向显示设备200说出“电视剧《XX》”等。
或者,本申请实施例的显示设备200还可以与遥控器等控制装置100蓝牙连接,在控制装置100上设有用于收集语音内容的语音模式或者拾音装置等。参见图6,图6示出了根据一些实施例的具有语音模块的控制装置100与显示设备200和用户的交互示意图,用户可以向控制装置100输入语音内容,通过控制装置100将语音内容发送给显示设备200。
显示设备200在接收到用户输入的语音内容后,会将语音内容先发送给服务器400进行内容识别,进而由服务器400分析出用户的意图,从而生成对显示设备200的控制指令,即语音指令。
例如,用户输入的语音内容为“电视剧《XXX》”,那么服务器400通过内容识别和语义分析,可能判断出用户的意图为搜索电视剧《XXX》的相关资源;或者,用户输入的语音内容为“音量调整为10”,那么服务器400通过内容识别和语义分析,可能判断出用户的意图为调整音量。
服务器400生成语音指令后,再将语音指令下发至显示设备200,用于控制显示设备200执行具体的操作。例如,控制显示设备200在当前所有的资源中搜索与电视剧《XXX》相关的资源;或者,控制显示设备200将当前的音量调整到10。
参见图7,图7示出了根据一些实施例的显示设备200与服务器400之间的交互示意图,在显示设备200中由控制器250执行具体的操作过程,进而,在上述显示设备200与服务器400交互的过程中,显示设备200的控制器250可以被配置为:将用户向显示设备200输入的语音内容发送至服务器400。以及,获取服务器400下发的语音指令。
由前述内容可知,服务器400在识别出语音内容中包括频道名称时,无论用户的意图如何,都会统一生成频道切换指令。而对于包含其他内容的语音内容,服务器400则会正常生成对应的语音指令。基于此,在本申请实施例中,可以将服务器400所生成的语音指令进行分类,大致可分为频道切换指令、参数调整指令和资源搜索指令等。其中,服务器400在识别出语音内容中包括频道名称时,即可根据该语音内容生成用于切换至目标频道的频道切换指令。
由于服务器400可以根据语音内容准确地生成参数调整指令和资源搜索指令等,因此显示设备200可根据参数调整指令或者资源搜索指令准确地进行参数调整或者相关资源的搜索等。
而无论用户输入的关于频道的语音内容是希望切换频道还是希望搜索频道,服务器400都是统一生成频道切换指令。频道切换指令并不会完全符合用户的真正意图,特别是在显示设备200正在运行某个应用时,用户想要搜索目标频道,显示设备200仍会响应于频道切换指令,在该应用内切换至目标频道;如果该应用不提供目标频道,那么显示设备200和应用都不会作出任何反应,用户难以得到是否搜索到目标频道的反馈。
因此,本申请实施例中,显示设备200在检测出接收到的语音指令为频道切换指令后,还需要对自身的应用运行情况进行检测,即检测当前是否在运行应用。如果有应用在运行,则显示设备200需要将频道切换指令切换为频道搜索指令,而后,响应于频道搜索指令,在当前运行的应用内搜索目标频道。如果没有应用在运行,显示设备200则可以直接在自身提供的所有频道中找到目标频道,并切换至目标频道进行播放。
例如,用户向显示设备200输入语音指令“搜索频道a”,服务器400会根据该“搜索频道a”的内容生成用于切换频道a的频道切换指令1,并将该频道切换指令1下发给显示设备200。如果显示设备200检测出当前正在运行应用A,那么,显示设备200会将频道切换指令1切换为用于搜索频道a的频道搜索指令1,而后响应于频道搜索指令1,在应用A内搜索频道a;如果显示设备200未检测出当前正在运行任何应用,那么,显示设备200直接切换至频道a并播放频道a提供的内容。
或者,用户向显示设备200输入语音指令“切换频道a”,服务器400会根据该“切换频道a”的内容生成用于切换频道a的频道切换指令2,并将该频道切换指令2下发给显示设备200。如果显示设备200检测出当前正在运行应用A,那么,显示设备200会将频道切换指令2切换为用于搜索频道a的频道搜索指令2,而后响应于频道搜索指令2,在应用A内搜索频道a;如果显示设备200未检测出当前正在运行任何应用,那么,显示设备200直接切换至频道a并播放频道a提供的内容。
在本申请实施例中,显示设备200自身提供的频道可以包括通过各个信号源提供的频道或者一些应用可共享给显示设备200使用的频道等。
显示设备200在运行应用时,如果执行搜索频道的操作,那么显示设备200还需在搜索操作执行时向用户显示提示信息,以便用户了解到显示设备200当前的处理的过程。
参见图8,图8示出了根据一些实施例的应用A显示页面的示意图,在显示设备200正在运行应用A时,如果显示设备200响应了频道搜索指令1,那么在执行搜索操作的同时,在应用A的显示页面上会同时显示“正在搜索中”的提示信息。
显示设备200在应用中搜索目标频道时,还可以同时搜索目标频道相关的内容,例如目标频道曾经播放过的节目、视频内容等,并且为了给用户提供更多的选择,显示设备200可以将搜索到的目标频道和与目标频道相关的内容都显示在应用的页面上。
参见图9,图9示出了根据一些实施例的频道搜索结果的一种示意图,显示设备200在如图8所示的应用A的显示页面上进行搜索操作之后,会将频道搜索结果显示在应用A的一个页面上,频道搜索结果可以是频道a、与频道a上播放过的视频资源等。
在一些实施例中,显示设备200正在运行的应用中可能无法提供目标频道或者不存在目标频道,此时显示设备200需要在应用上提示用户未搜索到相关内容或者无搜索结果等,以便用户了解当前的搜索情况。
参见图10,图10示出了根据一些实施例的频道搜索结果的另一种示意图,在一些实施例中,如果应用A中并不存在频道a和与频道a相关的内容等,此时,显示设备200会在应用A的一个页面上显示例如“无相关搜索结果”的提示。
参见图11,图11示出了根据一些实施例的显示设备200搜索目标频道的流程图,在显示设备200搜索目标频道的过程中,显示设备200的控制器250还可以被配置为:检测语音指令的类型,以及,在语音指令为频道切换指令的情况下,检测显示设备200当前是否运行应用。在显示设备200当前运行应用的情况下,将频道切换指令切换为频道搜索指令,而后,响应于频道搜索指令,在应用内搜索目标频道。而在显示设备200当前未运行应用的情况下,控制显示设备200直接切换至目标频道,同时播放目标频道的内容。
前述实施例的显示设备200,即使接收到的频道切换指令与用户的真实意图不相符,也可以根据当前自身的应用运行情况,自动将频道切换指令重新调整为频道搜索指令,进而实现语音功能的切换;或者仍响应频道切换指令。而不会仅仅响应于服务器400下发的频道切换指令,进而避免频道切换指令与用户意图不相符的情况。
如前述实施例所述,如果用户向显示设备200输入的语音内容为搜索资源等非频道相关的内容时,服务器400可以根据该内容生成资源搜索指令,并将该资源搜索指令下发至显示设备200。这里所说的资源可以是指视频资源、电视剧资源、电影资源、图片资源、应用资源等。
并且,在一些实施例中,用户在向显示设备200输入语音内容时,还可以指定用以搜索内容的目标应用,例如用户输入的语音内容为“在应用B上搜索电影《YY》”。服务器400在识别内容同时也会将目标应用识别出来,并且生成的语音指令中也会包含目标应用的应用名称,用以指示显示设备200使用目标应用搜索目标资源。
资源搜索指令在显示设备200中可以正常被响应或者被执行,但是显示设备200仍需要判断当前是否有应用正在运行,如果有,则显示设备200在当前正在运行的应用内搜索目标资源;如果没有,则显示设备200进一步检测用户在语音指令中是否指定了用以搜索目标资源的目标应用,如果未指定,那么显示设备200会在自身可提供的所有待选资源中搜索目标资源,如果指定了目标应用,那么显示设备200启动目标应用,并在目标应用内搜索目标资源。
本申请实施例中,显示设备200自身可以供的待选资源可以包括通过各个信号源提供的各种视频资源、电视剧资源、电影资源、图片资源、应用资源等,也可以包括一些应用共享给显示设备200使用的视频资源、电视剧资源、电影资源、图片资源等。
例如,显示设备200当前并未运行任何应用,但是语音指令中指定了目标应用B,那么显示设备200会先启动应用B,而后在应用B内搜索电影《YY》;或者,显示设备200当前并未运行任何应用,而语音指令中也未指定目标应用,那么显示设备200需要在自身可提供的所有待选资源中搜索电影《YY》。
参见图12,图12示出了根据一些实施例的显示设备200搜索目标资源的流程图,在显示设备200搜索目标资源的过程中,显示设备200的控制器250还可以被配置为:在语音指令为资源搜索指令的情况下,检测显示设备200当前是否运行应用。在显示设备200当前运行应用的情况下,在应用内搜索目标资源。以及,在显示设备200当前未运行应用的情况下,检测语音指令中是否包含目标应用的应用名称。在语音指令中包含目标应用的应用名称的情况下,运行所目标应用;而后,在目标应用内搜索目标资源。而在语音指令中不包含目标应用的应用名称的情况下,在显示设备200自身提供的待选资源中搜索目标资源。
如前述实施例所述,如果用户向显示设备200输入的语音内容为调整或者设置参数等非频道相关的内容时,服务器400可以根据该内容生成参数调整指令,并将该参数调整指令下发至显示设备200。这里所说的参数可以是指显示设备200的音量、图像的亮度、对比度、图像的模式、声音的模式等系统相关的音量参数、显示参数或者模式。
在显示设备200上调整上述参数可以对所有应用都适用,因此,无论显示设备200当前是否有应用在运行,显示设备200在接收到参数调整指令后,只需响应于该指令调整显示设备200对应的参数即可。
例如,用户向显示设备200输入的语音内容为“调高亮度”,服务器400针对该语音内容生成参数调整指令后,显示设备200响应于该参数调整指令,将系统设置项中的图像亮度参数进行调整,以使图像的亮度增加;或者,用户向显示设备200输入的语音内容为“切换图像模式为电影模式”,服务器400针对该语音内容生成参数调整指令后,显示设备200响应于该参数调整指令,将系统设置项中的图像模式由当前选中的模式切换为电影模式。
由上述内容可知,本申请实施例的显示设备200,不仅可以处理服务器400下发的频道切换指令,还可以处理服务器400下发的参数调整指令和资源搜索指令等一些非频道相关的指令,在保证显示设备200对于频道的处理操作符合用户的真实意图的同时,也可以保证显示设备200处于其他内容的处理也符合用户的真实意图。从而保证用户使用显示设备200的体验效果较好。
为了解决上述显示设备根据服务器下发的频道切换指令进行的操作难以满足用户真实意图的问题,本申请实施例还提供了一种语音功能切换方法,可以应用于前述实施例的显示设备200中。该方法具体可以包括如下步骤:获取服务器400下发的语音指令;检测语音指令的类型;在语音指令为频道切换指令的情况下,检测显示设备200当前是否运行应用;在显示设备200当前运行应用的情况下,将频道切换指令切换为频道搜索指令;响应于频道搜索指令,在应用内搜索目标频道。其中,将频到切换指令切换为频道搜索指令的操作,由于实现的功能不同,进而也实现了语音功能的切换。
在一些实施例中,所述方法还可以包括:在语音指令为频道切换指令,以及显示设备200当前未运行应用的情况下,控制显示设备200直接切换至目标频道,同时播放目标频道的内容。
在一些实施例中,所述方法还可以包括:在语音指令为资源搜索指令的情况下,检测显示设备200当前是否运行应用;在显示设备200当前运行应用的情况下,在应用内搜索目标资源。
在一些实施例中,所述方法还可以包括:在语音指令为资源搜索指令,以及显示设备200当前未运行应用的情况下,检测语音指令中是否包含目标应用的应用名称;在语音指令中包含目标应用的应用名称的情况下,运行目标应用;在目标应用内搜索目标资源。
在一些实施例中,所述方法还可以包括:在语音指令中不包含目标应用的应用名称的情况下,在显示设备200自身提供的待选资源中搜索目标资源。
由于本申请实施例中的语音功能切换方法可以应用于如前述实施例所述的显示设备200中,因此,关于本申请实施例中语音功能切换方法的其他内容可以参照前述实施例的内容,在此不再赘述。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
为了方便解释,已经结合具体的实施方式进行了上述说明。但是,上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导,可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用,从而使得本领域技术人员更好的使用所述实施方式以及适于具体使用考虑的各种不同的变形的实施方式。

Claims (10)

1.一种显示设备,其特征在于,包括:
显示器;
控制器,被配置为:
获取服务器下发的语音指令;
检测所述语音指令的类型;
在所述语音指令为频道切换指令的情况下,检测显示设备当前是否运行应用;
在显示设备当前运行应用的情况下,将所述频道切换指令切换为频道搜索指令;
响应于所述频道搜索指令,在所述应用内搜索目标频道。
2.根据权利要求1所述的显示设备,其特征在于,所述控制器,还被配置为:
在所述语音指令为频道切换指令,以及显示设备当前未运行应用的情况下,控制显示设备直接切换至目标频道,同时播放所述目标频道的内容。
3.根据权利要求1所述的显示设备,其特征在于,所述控制器,还被配置为:
在所述语音指令为资源搜索指令的情况下,检测显示设备当前是否运行应用;
在显示设备当前运行应用的情况下,在所述应用内搜索目标资源。
4.根据权利要求1所述的显示设备,其特征在于,所述控制器,还被配置为:
在所述语音指令为资源搜索指令,以及显示设备当前未运行应用的情况下,检测所述语音指令中是否包含目标应用的应用名称;
在所述语音指令中包含目标应用的应用名称的情况下,运行所述目标应用;
在所述目标应用内搜索目标资源。
5.根据权利要求4所述的显示设备,其特征在于,所述控制器,还被配置为:
在所述语音指令中不包含目标应用的应用名称的情况下,在显示设备自身提供的待选资源中搜索目标资源。
6.根据权利要求1所述的显示设备,其特征在于,所述控制器,还被配置为:
将用户向显示设备输入的语音内容发送至服务器;所述服务器用于根据所述语音内容生成不同类型的语音指令,将所述语音指令下发至所述显示设备;以及,所述服务器还用于在所述语音内容中包括频道名称的情况下,生成用于指示显示设备切换频道的频道切换指令。
7.一种语音功能切换方法,其特征在于,包括:
获取服务器下发的语音指令;
检测所述语音指令的类型;
在所述语音指令为频道切换指令的情况下,检测显示设备当前是否运行应用;
在显示设备当前运行应用的情况下,将所述频道切换指令切换为频道搜索指令;
响应于所述频道搜索指令,在所述应用内搜索目标频道。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
在所述语音指令为频道切换指令,以及显示设备当前未运行应用的情况下,控制显示设备直接切换至目标频道,同时播放所述目标频道的内容。
9.根据权利要求7所述的方法,其特征在于,所述方法还包括:
在所述语音指令为资源搜索指令的情况下,检测显示设备当前是否运行应用;
在显示设备当前运行应用的情况下,在所述应用内搜索目标资源。
10.根据权利要求7所述的方法,其特征在于,所述方法还包括:
在所述语音指令为资源搜索指令,以及显示设备当前未运行应用的情况下,检测所述语音指令中是否包含目标应用的应用名称;
在所述语音指令中包含目标应用的应用名称的情况下,运行所述目标应用;
在所述目标应用内搜索目标资源。
CN202110738814.5A 2021-03-15 2021-06-30 语音功能切换方法及显示设备 Active CN113490041B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202110738814.5A CN113490041B (zh) 2021-06-30 2021-06-30 语音功能切换方法及显示设备
EP22772086.9A EP4309031A1 (en) 2021-03-15 2022-03-15 Display apparatus and display method
PCT/US2022/020435 WO2022197737A1 (en) 2021-03-15 2022-03-15 Display apparatus and display method
US18/278,537 US20240053957A1 (en) 2021-03-15 2022-03-15 Display apparatus and display method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110738814.5A CN113490041B (zh) 2021-06-30 2021-06-30 语音功能切换方法及显示设备

Publications (2)

Publication Number Publication Date
CN113490041A true CN113490041A (zh) 2021-10-08
CN113490041B CN113490041B (zh) 2023-05-05

Family

ID=77937134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110738814.5A Active CN113490041B (zh) 2021-03-15 2021-06-30 语音功能切换方法及显示设备

Country Status (1)

Country Link
CN (1) CN113490041B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100313219A1 (en) * 2009-06-09 2010-12-09 Samsung Electronics Co. Ltd. Method and apparatus for previewing broadcast channel in portable terminal
US20140052451A1 (en) * 2012-08-16 2014-02-20 Nuance Communications, Inc. User interface for entertainment systems
CN103634644A (zh) * 2013-12-09 2014-03-12 乐视致新电子科技(天津)有限公司 通过语音进行智能电视频道切换的方法和系统
US20160007083A1 (en) * 2010-11-07 2016-01-07 Symphony Advanced Media, Inc. Audience Content Exposure Monitoring Apparatuses, Methods and Systems
WO2018121767A1 (zh) * 2016-12-31 2018-07-05 深圳市优必选科技有限公司 应用切换方法和装置
CN109547840A (zh) * 2018-12-03 2019-03-29 深圳创维数字技术有限公司 影视作品搜索引导方法、电视及计算机可读存储介质
CN110737840A (zh) * 2019-10-22 2020-01-31 青岛海信电器股份有限公司 语音控制方法及显示设备
CN111526402A (zh) * 2020-05-06 2020-08-11 海信电子科技(武汉)有限公司 多屏显示设备的语音搜索视频资源的方法及显示设备
CN111726673A (zh) * 2020-06-22 2020-09-29 青岛海信传媒网络技术有限公司 一种频道切换方法及显示设备
US20200341730A1 (en) * 2018-01-08 2020-10-29 Lg Electronics Inc. Display device and system comprising same
CN112153440A (zh) * 2020-10-10 2020-12-29 Vidaa美国公司 一种显示设备及显示系统
CN112165641A (zh) * 2020-09-22 2021-01-01 Vidaa美国公司 一种显示设备
CN112435665A (zh) * 2020-11-23 2021-03-02 深圳Tcl新技术有限公司 语音的控制方法、装置、终端设备及计算机可读存储介质
CN112905149A (zh) * 2021-04-06 2021-06-04 Vidaa美国公司 显示设备上语音指令的处理方法、显示设备及服务器
CN113038217A (zh) * 2021-03-19 2021-06-25 海信电子科技(武汉)有限公司 一种显示设备、服务器及应答语生成方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100313219A1 (en) * 2009-06-09 2010-12-09 Samsung Electronics Co. Ltd. Method and apparatus for previewing broadcast channel in portable terminal
US20160007083A1 (en) * 2010-11-07 2016-01-07 Symphony Advanced Media, Inc. Audience Content Exposure Monitoring Apparatuses, Methods and Systems
US20140052451A1 (en) * 2012-08-16 2014-02-20 Nuance Communications, Inc. User interface for entertainment systems
CN103634644A (zh) * 2013-12-09 2014-03-12 乐视致新电子科技(天津)有限公司 通过语音进行智能电视频道切换的方法和系统
WO2018121767A1 (zh) * 2016-12-31 2018-07-05 深圳市优必选科技有限公司 应用切换方法和装置
US20200341730A1 (en) * 2018-01-08 2020-10-29 Lg Electronics Inc. Display device and system comprising same
CN109547840A (zh) * 2018-12-03 2019-03-29 深圳创维数字技术有限公司 影视作品搜索引导方法、电视及计算机可读存储介质
CN110737840A (zh) * 2019-10-22 2020-01-31 青岛海信电器股份有限公司 语音控制方法及显示设备
CN111526402A (zh) * 2020-05-06 2020-08-11 海信电子科技(武汉)有限公司 多屏显示设备的语音搜索视频资源的方法及显示设备
CN111726673A (zh) * 2020-06-22 2020-09-29 青岛海信传媒网络技术有限公司 一种频道切换方法及显示设备
CN112165641A (zh) * 2020-09-22 2021-01-01 Vidaa美国公司 一种显示设备
CN112153440A (zh) * 2020-10-10 2020-12-29 Vidaa美国公司 一种显示设备及显示系统
CN112435665A (zh) * 2020-11-23 2021-03-02 深圳Tcl新技术有限公司 语音的控制方法、装置、终端设备及计算机可读存储介质
CN113038217A (zh) * 2021-03-19 2021-06-25 海信电子科技(武汉)有限公司 一种显示设备、服务器及应答语生成方法
CN112905149A (zh) * 2021-04-06 2021-06-04 Vidaa美国公司 显示设备上语音指令的处理方法、显示设备及服务器

Also Published As

Publication number Publication date
CN113490041B (zh) 2023-05-05

Similar Documents

Publication Publication Date Title
CN112672195A (zh) 遥控器按键设置方法及显示设备
CN112653906B (zh) 显示设备上视频热点播放方法及显示设备
CN112887778A (zh) 显示设备上视频资源播放模式的切换方法及显示设备
CN112905149A (zh) 显示设备上语音指令的处理方法、显示设备及服务器
CN113490024A (zh) 控制装置按键设置方法及显示设备
CN113301405A (zh) 一种显示设备及虚拟键盘的显示控制方法
CN112733050A (zh) 显示设备上搜索结果的展示方法及显示设备
CN113064691B (zh) 一种开机用户界面的显示方法及显示设备
CN112882780A (zh) 设置页面显示方法及显示设备
CN113490041B (zh) 语音功能切换方法及显示设备
CN113542901A (zh) 一种显示设备、及网络频道的快速切换显示方法
CN112732396A (zh) 一种媒资数据的展示方法及显示设备
CN113014979A (zh) 一种内容显示方法和显示设备
CN113573112A (zh) 一种显示设备及遥控器
CN112817556A (zh) 显示设备上语音方案的切换方法、显示设备及控制装置
CN112882631A (zh) 显示设备上电子说明书的显示方法及显示设备
CN112911371A (zh) 双路视频资源播放方法及显示设备
CN113784222B (zh) 应用和数字电视节目的交互方法及显示设备
CN113676782B (zh) 显示设备及多应用共存时的交互方法
CN113490013B (zh) 一种服务器及数据请求方法
WO2022174751A1 (zh) 一种显示方法和显示设备
WO2022160911A1 (zh) 显示设备上语音方案的切换方法、显示设备及控制装置
CN113038193B (zh) 一种自动修复音视频不同步的方法及显示设备
CN113342305B (zh) 功放设备的音频状态显示方法、显示设备及功放设备
CN113350781B (zh) 一种显示设备及游戏模式切换方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant