CN117812422A - 显示设备及语音搜索方法 - Google Patents

显示设备及语音搜索方法 Download PDF

Info

Publication number
CN117812422A
CN117812422A CN202311551549.5A CN202311551549A CN117812422A CN 117812422 A CN117812422 A CN 117812422A CN 202311551549 A CN202311551549 A CN 202311551549A CN 117812422 A CN117812422 A CN 117812422A
Authority
CN
China
Prior art keywords
film
cinema
search result
target
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311551549.5A
Other languages
English (en)
Inventor
刘蔚
王娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Visual Technology Co Ltd
Original Assignee
Hisense Visual Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Visual Technology Co Ltd filed Critical Hisense Visual Technology Co Ltd
Priority to CN202311551549.5A priority Critical patent/CN117812422A/zh
Publication of CN117812422A publication Critical patent/CN117812422A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4826End-user interface for program selection using recommendation lists, e.g. of programs or channels sorted out according to their score
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供了一种显示设备及语音搜索方法,显示设备包括:显示器;控制器,控制器被配置为:接收搜索目标影片的语音指令;响应于语音指令,获取目标影片的视频搜索结果;在视频搜索结果不包括目标影片的第一类型正片,包括目标影片的第二类型正片时,获取目标影片对应的影院搜索结果,在第一搜索结果页面展示第二类型正片和影院搜索结果,第一类型正片包括符合预设播放规则的正片,第二类型正片包括不符合预设播放规则的正片;在视频搜索结果不包括目标影片的第一类型正片,也不包括目标影片的第二类型正片时,获取目标影片对应的影院搜索结果,在第二搜索结果页面展示影院搜索结果。本申请提升了语音搜索体验。

Description

显示设备及语音搜索方法
技术领域
本申请涉及语音交互技术领域,尤其涉及一种显示设备及语音搜索方法。
背景技术
智能电视是用户在家观看影片的重要显示设备之一。随着语音交互技术的普及,用户在智能电视上经常使用语音搜索的方式搜索想要观看的影片。智能电视上的影片资源来自于互联网,用户在智能电视上搜索往年在影院上映的影片时,搜索到影片资源的概率较高,然而,若用户在智能电视上搜索的是正在影院上映的影片时,搜索到影片资源的概率将会较低,用户无法观看搜索的影片,搜索体验欠佳。
发明内容
为提升语音搜索体验,本申请提供了一种显示设备及语音搜索方法。
第一方面,本申请提供了一种显示设备,该显示设备包括:
显示器;
控制器,与所述显示器通信连接,被配置为:
接收搜索目标影片的语音指令;
响应于所述语音指令,获取所述目标影片的视频搜索结果;
在所述视频搜索结果不包括所述目标影片的第一类型正片,包括所述目标影片的第二类型正片时,获取所述目标影片对应的影院搜索结果,控制所述显示器在第一搜索结果页面展示所述第二类型正片和影院搜索结果,所述第一类型正片包括符合预设播放规则的正片,所述第二类型正片包括不符合所述预设播放规则的正片;
在所述视频搜索结果不包括所述目标影片的第一类型正片,也不包括所述目标影片的第二类型正片时,获取所述目标影片对应的影院搜索结果,控制所述显示器在第二搜索结果页面展示所述影院搜索结果。
在一些实施例中,所述控制器被配置为:控制所述显示器在第一搜索结果页面展示所述第二类型正片和影院搜索结果,包括:
获取第二类型正片的历史点播记录和历史影院搜索记录;
根据所述历史点播记录和历史影院搜索记录,确定对所述第二类型正片和影院搜索结果的偏好顺序;
若对所述第二类型正片的偏好顺序位于所述影院搜索结果之前,控制所述显示器在第一搜索结果页面展示所述第二类型正片和影院搜索结果,且将所述第二类型正片展示在所述影院搜索结果之前;
若对所述影院搜索结果的偏好顺序位于所述第二类型正片之前,控制所述显示器在第一搜索结果页面展示所述第二类型正片和影院搜索结果,且将所述影院搜索结果展示在所述第二类型正片之前。
在一些实施例中,所述控制器被配置为:获取第二类型正片的历史点播记录和历史影院搜索记录,包括:
从历史语音交互数据中获取第一目标多轮语音交互数据,得到所述第二类型正片的点播次数,其中,所述第一目标多轮语音交互数据包括在相邻两轮对话中分别包含影片搜索指令和所述第二类型正片的播放指令的数据,所述第二类型正片的历史点播记录包括所述点播次数;
从所述历史语音交互数据中获取第二目标多轮语音交互数据,得到影院搜索次数,其中,所述第二目标多轮语音交互数据包括在相邻两轮对话中分别包含所述影片搜索指令和影院搜索指令的数据,所述历史影院搜索记录包括所述影院搜索次数。
在一些实施例中,所述控制器被配置为:获取所述目标影片对应的影院搜索结果,包括:
获取所述显示设备的定位信息;
获取所述定位信息对应范围内的影院信息,所述影院信息包括排片信息;
根据所述排片信息包含所述目标影片的影院信息,生成所述目标影片对应的影院搜索结果。
在一些实施例中,所述控制器被配置为:获取所述定位信息对应范围内的影院信息,包括:
从影片映射库中获取所述定位信息对应范围内的影院信息,其中,所述影片映射库根据影院知识图谱生成,所述影院知识图谱设置有影院名称、影院地址和排片信息。
在一些实施例中,所述影院搜索结果包括多个排片信息对应所述目标影片的影院控件,所述控制器被配置为:
接收所述影院控件的触发指令;
响应于所述触发指令,控制所述显示器展示所述影院控件对应影院的所述目标影片的购票页面。
在一些实施例中,所述预设播放规则包括:所述第一类型正片的视频来源标识为预设来源标识,且所述第一类型正片未设置有单片付费标识。
在一些实施例中,所述控制器被配置为:获取所述目标影片的视频搜索结果,包括:
在第一视频库搜索所述目标影片的影片信息,其中,所述第一视频库包括所述预设来源标识对应的视频库;
若所述第一视频库中的影片信息不包括所述目标影片的第一类型正片,在第二视频库搜索所述目标影片的影片信息,其中,所述第二视频库包括所述视频来源标识为除所述预设来源标识之外的标识对应的视频库。
在一些实施例中,所述控制器被配置为:控制所述显示器在第二搜索结果页面展示所述影院搜索结果,包括:
在所述视频搜索结果包括所述目标影片的关联视频时,控制所述显示器在第二搜索结果页面展示所述影院搜索结果和关联视频。
第二方面,本申请提供了一种语音搜索方法,该方法包括:
接收搜索目标影片的语音指令;
响应于所述语音指令,获取所述目标影片的视频搜索结果;
在所述视频搜索结果不包括所述目标影片的第一类型正片,包括所述目标影片的第二类型正片时,获取所述目标影片对应的影院搜索结果,在第一搜索结果页面展示所述第二类型正片和影院搜索结果,所述第一类型正片包括符合预设播放规则的正片,所述第二类型正片包括不符合所述预设播放规则的正片;
在所述视频搜索结果不包括所述目标影片的第一类型正片,也不包括所述目标影片的第二类型正片时,获取所述目标影片对应的影院搜索结果,在第二搜索结果页面展示所述影院搜索结果。
本申请提供的显示设备及语音搜索方法的有益效果包括:
本申请实施例在接收到用户搜索目标影片的语音指令后,若搜索不到目标影片的第一类型正片,搜索到目标影片的第二类型正片,还进行影院搜索,使用户可选择观看第二类型正片或去影院观看目标影片,在搜索不到目标影片的第一类型正片和第二类型正片时,展示影院搜索结果,使用户可选择去影院观看目标影片,解决了用户搜索不到想要观看的目标影片的问题,提升了语音搜索体验。
附图说明
为了更清楚地说明本申请实施例或相关技术中的实施方式,下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1中示例性示出了根据一些实施例的语音识别装置的系统架构示意图;
图2中示例性示出了根据一些实施例的智能设备200的硬件配置框图;
图3中示例性示出了根据一些实施例的智能设备200的硬件配置框图;
图4中示例性示出了根据一些实施例的智能电视200-1的逻辑架构示意图;
图5中示例性示出了根据一些实施例的语音搜索方法的流程示意图;
图6中示例性示出了根据一些实施例的语音交互界面的示意图;
图7中示例性示出了根据一些实施例的第三搜索结果页面的示意图;
图8中示例性示出了根据一些实施例的第一搜索结果页面的示意图;
图9中示例性示出了根据又一些实施例的第一搜索结果页面的示意图;
图10中示例性示出了根据另一些实施例的第一搜索结果页面的示意图;
图11中示例性示出了根据一些实施例的购票页面的示意图。
具体实施方式
为使本申请的目的和实施方式更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。
图1示出了可以应用本申请的语音识别方法和语音识别装置的示例性系统架构。如图1所示,其中,10为服务器,200为终端设备,示例性包括(智能电视200a,移动设备200b,智能音箱200c)。
本申请中服务器10与终端设备200通过多种通信方式进行数据通信。可允许终端设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器10可以向终端设备20提供各种内容和互动。示例性的,终端设备200与服务器10可以通过发送和接收信息,以及接收软件程序更新。
服务器10可以是提供各种服务的服务器,例如对终端设备200采集的音频数据提供支持的后台服务器。后台服务器可以对接收到的音频等数据进行分析等处理,并将处理结果(例如端点信息)反馈给终端设备。服务器10可以是一个服务器集群,也可以是多个服务器集群,可以包括一类或多类服务器。
终端设备200可以是硬件,也可以是软件。当终端设备200为硬件时,可以是具有声音采集功能的各种电子设备,包括但不限于智能音箱、智能手机、电视、平板电脑、电子书阅读器、智能手表、播放器、计算机、AI设备、机器人、智能车辆等等。当终端设备200、201、202为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供声音采集服务),也可以实现成单个软件或软件模块。在此不做具体限定。
在一些实施例中,本申请实施例所提供的语音搜索方法中的部分步骤可以通过服务器10执行。
图2示出了根据示例性实施例中智能设备200的硬件配置框图。如图2所示智能设备200包括通信器220、检测器230、外部装置接口240、控制器250、显示器260、音频输出接口270、存储器、供电电源、用户接口280中的至少一种。控制器包括中央处理器,音频处理器,RAM,ROM,用于输入/输出的第一接口至第n接口。
通信器220是用于根据各种通信协议类型与外部设备或服务器进行通信的组件。例如:通信器可以包括Wifi模块,蓝牙模块,有线以太网模块等其他网络通信协议芯片或近场通信协议芯片,以及红外接收器中的至少一种。智能设备200可以通过通信器220服务器10建立控制信号和数据信号的发送和接收。
用户接口,可用于接收外部的控制信号。
检测器230用于采集外部环境或与外部交互的信号。例如,检测器230包括光接收器,用于采集环境光线强度的传感器;或者,检测器230包括图像采集器,如摄像头,可以用于采集外部环境场景、用户的属性或用户交互手势,再或者,检测器230包括声音采集器,如麦克风等,用于接收外部声音。
声音采集器可以是麦克风,也称“话筒”,“传声器”,可以用于接收用户的声音,将声音信号转换为电信号。智能设备200可以设置至少一个麦克风。在另一些实施例中,智能设备200可以设置两个麦克风,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,智能设备200还可以设置三个,四个或更多麦克风,实现采集声音信号,降噪,还可以识别声音提供方,实现定向录音功能等。
此外,麦克风可以是内置在智能设备200上,或者麦克风通过有线或者无线的方式与智能设备200相连接。当然,本申请实施例对麦克风在智能设备200上的位置不作限定。或者,智能设备200可以不包括麦克风,即上述麦克风并未设置于智能设备200中。智能设备200可以通过接口(如USB接口130)外接麦克风(也可以称为话筒)。该外接的话筒可以通过外部固定件(如带夹子的摄像头支架)固定在智能设备200上。
控制器250,通过存储在存储器上中各种软件控制程序,来控制显示设备的工作和响应用户的操作。控制器250控制智能设备200的整体操作。
示例性的,控制器包括中央处理器(Central Processing Unit,CPU),音频处理器,RAM Random Access Memory,RAM),ROM(Read-Only Memory,ROM),用于输入/输出的第一接口至第n接口,通信总线(Bus)等中的至少一种。
在一些示例中,智能设备的操作系统为Android系统为例,如图3所示,智能电视200-1从逻辑上可以分为应用程序(Applications)层(简称“应用层”)21,内核层22和硬件层23。
其中,如图3所示,硬件层可包括图2所示的控制器250、通信器220、检测器230等。应用层21包括一个或多个应用。应用可以为系统应用,也可以为第三方应用。如,应用层21包括语音识别应用,语音识别应用可以提供语音交互界面和服务,用于实现智能电视200-1与服务器10的连接。
内核层22作为硬件层和应用层21之间的软件中间件,用于管理和控制硬件与软件资源。
在一些示例中,内核层22包括检测器驱动,检测器驱动用于将检测器230采集的语音数据发送至语音识别应用。示例性的,智能设备200中的语音识别应用启动,智能设备200与服务器10建立了通信连接的情况下,检测器驱动用于将检测器230采集的用户输入的语音数据发送至语音识别应用。之后,语音识别应用将包含该语音数据的查询信息发送至服务器中的意图识别模块202。意图识别模块202用于将智能设备200发送的语音数据输入至意图识别模型。
为清楚说明本申请的实施例,下面结合图4对本申请实施例提供的一种语音识别网络架构进行描述。
参见图4,图4为本申请实施例提供的一种语音交互网络架构示意图。图4中,智能设备用于接收输入的信息以及输出对该信息的处理结果。语音识别模块部署有语音识别服务,用于将音频识别为文本;语义理解模块部署有语义理解服务,用于对文本进行语义解析;业务管理模块部署有业务指令管理服务,用于提供业务指令;语言生成模块部署有语言生成服务(NLG),用于将指示智能设备执行的指令转化为文本语言;语音合成模块部署有语音合成(TTS)服务,用于将指令对应的文本语言处理后发送至扬声器进行播报。在一个实施例中,图4所示架构中可存在部署有不同业务服务的多个实体服务设备,也可以一个或多个实体服务设备中集合一项或多项功能服务。
一些实施例中,下面对基于图4所示架构处理输入智能设备的信息的过程进行举例描述,以输入智能设备的信息为通过语音输入的查询语句为例:
[语音识别]
智能设备可在接收到通过语音输入的查询语句后,智能设备可对查询语句的音频进行降噪处理和特征抽取,这里的去噪处理可包括去除回声和环境噪声等步骤。
[语义理解]
利用声学模型和语言模型,对识别出的候选文本和相关联的上下文信息进行自然语言理解,将文本解析为结构化的、机器可读的信息,业务领域、意图、词槽等信息以表达语义等。得到可执行意图确定意图置信度得分,语义理解模块基于所确定的意图置信度得分选择一个或者多个候选可执行意图。
[业务管理]
语义理解模块根据对查询语句的文本的语义解析结果,向相应的业务管理模块下发查询指令以获取业务服务给出的查询结果,以及执行“完成”用户最终请求所需的动作,并将查询结果对应的设备执行指令进行反馈。
[语言生成]
自然语言生成(NLG)被配置为将信息或者指令生成语言文本。具体可分为闲聊型、任务型、知识问答型和推荐型。其中,闲聊型对话中的NLG就是根据上下文进行意图识别、情感分析等,然后生成开放性回复;任务型对话中需根据学习到的策略来生成对话回复,一般回复包括澄清需求、引导用户、询问、确认、对话结束语等;知识问答型对话中根据问句类型识别与分类、信息检索或文本匹配而生成用户需要的知识(知识、实体、片段等);推荐型对话系统中根据用户的爱好来进行兴趣匹配以及候选推荐内容排序,然后生成给用户推荐的内容。
[语音合成]
语音合被配置为呈现给用户的语音输出。语音合成处理模块基于数字助理提供的文本来合成语音输出。例如,所生成的对话响应是文本串的形式。语音合成模块将文本串转换成可听语音输出。
需要说明的是,图4所示架构只是一种示例,并非对本申请保护范围的限定。本申请实施例中,也可采用其他架构来实现类似功能,例如:上述过程全部或部分可以由智能终端来完成,在此不做赘述。
在一些实施例中,用户可通过语音输入的方式在显示设备上搜索想要观看的影片,若用户搜索的是还在影院上映的影片,则在显示设备上搜索到该影片的概率较低,这会给用户带来不好的用户体验。
为解决上述技术问题,本申请提供了一种语音搜索方法,该方法通过在搜索结果页面展示用户搜索的影片对应的影院搜索结果,能为用户提供去影院观看该影片的选择,提升了用户的搜索提体验。
参见图5,为根据一些实施例的语音搜索方法的流程示意图,如图5所示,该方法可包括如下步骤:
步骤S101:接收搜索目标影片的语音指令。
在一些实施例中,用户可向显示设备发出搜索目标影片的语音指令,该目标影片为用户想要观看的影片,该语音指令可包括目标影片的指定信息,如影片名称、影片主演、导演等信息。
步骤S102:响应于所述语音指令,获取所述目标影片的视频搜索结果。
在一些实施例中,显示设备在接收到语音指令后,显示设备的处理器可对该语音指令进行语音识别,得到该语音指令对应的文本,然后生成包含该文本的语音交互请求,将该语音交互请求发送至服务器进行处理,使服务器根据该语音交互请求,在互联网上的视频库进行视频搜索,得到视频搜索结果,将视频搜索结果反馈给显示设备。
在一些实施例中,显示设备接收到语音指令后,也可直接生成包含该语音指令的语音交互请求,将该语音交互请求发送至服务器进行处理,使服务器根据该语音交互请求,将语音指令转换为文本,再在视频库进行视频搜索,得到视频搜索结果,将视频搜索结果反馈给显示设备。
在一些实施例中,若用户搜索的目标影片是影院近期上映的影片,如上映一周内的影片,则视频库内有该目标影片的第一类型正片的概率较低。其中,第一类型正片是指符合预设播放规则的正片,该预设播放规则的正片是指播放参数达到指定要求的正片,例如,分辨率在720p及以上,总时长与影片的指定时长的偏差在阈值范围内,会员可以免费观看等等。符合预设播放规则的正片,播放效果通常能满足用户的观看需求。
在一些实施例中,指定媒资提供商提供的会员免费观看的影片符合预设播放规则,其中,免费观看的影片未设置单片付费标识,只要是该指定媒资提供商的会员,即可免费观看该影片,因此,为快速判断正片的类型,可通过判断正片的视频来源标识是否为预设视频来源标识,即指定媒资提供商的视频来源标识,以及正片是否设置有单片付费标识,来确定视频库的正片是否为第一类型正片。若正片的视频来源标识是对应指定媒资提供商的视频来源标识,且正片未设置有单片付费标识,可判定来确定视频库的正片为第一类型正片,若正片的视频来源标识不是对应指定媒资提供商的视频来源标识,或者正片设置有单片付费标识,可判定来确定视频库的正片不是第一类型正片。
在一些实施例中,非指定媒资提供商可包括个人用户,例如,个人用户可在服务器上传一些影片的正片,这些正片可能是个人用户原创的影片,也可能是个人用户对指定媒资提供商的影片进行加工、编辑等二次创作的影片,这些个人用户上传到服务器的正片可称为第二类型正片,与第一类型正片相比,第二类型正片被认定为不符合预设播放规则。在视频库搜索到一个正片后,若该正片的来源是个人用户,可立刻判定该正片是第二类型正片。
在一些实施例中,指定媒资提供商的视频与非指定媒资提供商的视频可存储在服务器的不同视频库中,其中,存储指定媒资提供商的视频的视频库可称为第一视频库,存储非指定媒资提供商的视频库可称为第二视频库。服务器在进行视频搜索时,可分别在第一视频库和第二视频库进行搜索,或者,也可先在第一视频库进行搜索,若搜索到目标影片的第一类型正片,则无需再在第二视频库进行搜索。
在一些实施例中,指定媒资提供商的视频与非指定媒资提供商的视频可存储在服务器的同一视频库中,例如,显示设备方的服务器可将指定媒资提供商的视频与非指定媒资提供商的视频抓取到自己的视频库内。服务器在进行视频搜索时,可直接搜索不同来源标识的目标影片对应的视频。
在一些实施例中,指定媒资提供商提供的会员不能免费观看的影片设置有单片付费标识,用户需要单独为该影片进行付费操作后,才能观看该影片。虽然用户进行付费操作后,该影片的播放效果也较佳,但是由于不同用户进行付费操作的意愿不同,因此,本申请实施例中,将指定媒资提供商提供的设置有单片付费标识的正片分类为第二类型正片,以确保用户对第一类型正片的观看体验。
在一些实施例中,在视频库内,可能包含了目标影片的关联视频,如预告片、片花、纪录片等视频,服务器可将这些关联视频的数据反馈给显示设备。
在一些实施例中,若一个影片是影院近期上映的影片,如上映一周内的影片,则视频库内通常不存在该影片的第一类型正片和第二类型正片,可能存在该影片的关联视频。
在一些实施例中,若一个影片是影院近期上映的影片,如上映了一个月的影片,则视频库内通常不存在该影片的第一类型正片,可能存在该影片的第二类型正片。例如,一个影片是上映一个月的影片,在大部分影院该影片已经下映,在个别影院该影片仍在上映。
在一些实施例中,若一个影片是影院已下映的影片,则视频库内可能存在该影片的第一类型正片,还可能存在该影片的第二类型正片。
步骤S103:在所述视频搜索结果不包括所述目标影片的第一类型正片,包括所述目标影片的第二类型正片时,获取所述目标影片对应的影院搜索结果,在第一搜索结果页面展示所述第二类型正片和影院搜索结果,所述第一类型正片包括符合预设播放规则的正片,所述第二类型正片包括不符合所述预设播放规则的正片。
在一些实施例中,若视频搜索结果不包括目标影片的第一类型正片,包括目标影片的第二类型正片,则可向用户推荐该第二类型正片。然而,由于第二类型正片不符合预设播放规则,部分用户可能不喜欢观看第二类型正片。
为了提升搜索体验,在视频搜索结果为不包括目标影片的第一类型正片,包括目标影片的第二类型正片时,本申请实施例中的显示设备还可向服务器发送影院搜索请求,该影院搜索请求可包括显示设备的定位信息,显示设备可通过联网获取显示设备的定位信息,将该定位信息添加到影院搜索请求中,将影院搜索请求发送给服务器,使服务器查询该定位信息对应范围内的影院信息,将该影院信息反馈给显示设备。该定位信息对应范围可为以定位信息对应的地址为原点,附近5km或附近10kn的区域范围。影院信息包括排片信息,排片信息可包括电影名称、电影导演、电影主演等影片信息,显示设备在获取到影院信息后,根据排片信息筛选出正在上映目标影片的影院,生成影院搜索结果。
在一些实施例中,除了定位信息,显示设备向服务器发送的影院搜索请求还可包括语音指令中的目标影片的信息,如目标影片的影片名称等等,使服务器筛选出定位信息对应范围内正在上映目标影片的影院,生成影院搜索结果,将影院搜索结果反馈给显示设备。
在一些实施例中,显示设备在步骤S102中向服务器发送的语音交互请求可包括显示设备的定位信息,使服务器根据视频搜索结果为不包括目标影片的第一类型正片,包括目标影片的第二类型正片,自动进行影院搜索,生成影院搜索结果,将视频搜索结果和影院搜索结果反馈给显示设备,无需显示设备向服务器发送影院搜索请求。
在一些实施例中,显示设备在得到视频搜索结果和影院搜索结果后,可生成用于展示该视频搜索结果中的第二类型正片和影院搜索结果的第一搜索结果页面。
在该第一搜索结果页面,第二类型正片以及关联视频可通过媒资控件展示,影院搜索结果可通过影院控件展示。用户若触发媒资控件,显示设备可进入第二类型正片或关联视频的详情页,在该详情页,用户可输入全屏播放指令以全屏播放该第二类型正片或关联视频;用户若触发影院控件,显示设备可进入影院控件对应影院的目标影片的购票页面。
在一些实施例中,该购票页面可展示一个二维码,用户可通过移动设备扫描该二维码,使移动终端跳转至目标影片的购票页面,从而方便地在移动终端上进行购票操作。
步骤S104:在所述视频搜索结果不包括所述目标影片的第一类型正片,也不包括所述目标影片的第二类型正片时,获取所述目标影片对应的影院搜索结果,在第二搜索结果页面展示所述影院搜索结果。
在一些实施例中,若视频搜索结果不包括目标影片的第一类型正片,也不包括目标影片的第二类型正片,则用户不能在显示设备上观看该目标影片的正片。
为了提升搜索体验,在视频搜索结果为不包括目标影片的第一类型正片,也不包括目标影片的第二类型正片时,本申请实施例中的显示设备还可向服务器发送影院搜索请求,以获取影院搜索结果,或者,接收服务器针对语音交互请求反馈的影院搜索结果。
显示设备在获取到影院搜索结果后,可生成用于展示影院搜索结果的第二搜索结果页面。
在该第二搜索结果页面,影院搜索结果可通过影院控件展示。用户若触发影院控件,显示设备可进入影院控件对应影院的目标影片的购票页面。
在一些实施例中,显示设备获取到的视频搜索结果包括目标影片的关联视频,显示设可在第二搜索结果页面展示关联视频对应的媒资控件,用户若触发媒资控件,显示设备可进入关联视频的详情页,在该详情页,用户可输入全屏播放指令以全屏播放该关联视频。
由上述实施例可见,本申请实施例在接收到用户搜索目标影片的语音指令后,若搜索不到目标影片的第一类型正片,搜索到目标影片的第二类型正片,还进行影院搜索,使用户可选择观看第二类型正片或去影院观看目标影片,在搜索不到目标影片的第一类型正片和第二类型正片时,展示影院搜索结果,使用户可选择去影院观看目标影片,解决了用户搜索不到想要观看的目标影片的问题,提升了语音搜索体验。
为对本申请实施例提供的语音搜索方法做进一步说明,下面结合显示设备的界面图进行介绍。
参见图6,为根据一些实施例的显示设备的语音交互界面的示意图,如图6所示,用户可向显示设备输入搜索目标影片的语音指令,显示设备的语音识别应用可在语音交互界面展示用户输入的语音指令。示例性的,用户输入的语音指令对应的文本为:“搜索电影A”。
在一些实施例中,显示设备在接收到语音指令后,将该语音指令对应的语音交互请求发送至服务器,使服务器反馈语音交互结果,其中,服务器根据视频搜索结果,确定是否进行影院搜索。该视频搜索结果可包括flag(标示)值。flag值为0时,表示该视频搜索结果包括目标影片的第一类型正片的数据,如影片名称、影片海报、详情页地址、播放地址等数据,服务器根据flag值为0,不进行影院搜索;flag值为1时,表示该视频搜索结果包括目标影片的第二类型正片的数据,如影片名称、影片海报、详情页地址、播放地址等数据,不包含目标影片的第一类型正片的数据;flag值为2时,表示该视频搜索结果不包括目标影片的第一类型正片的数据,也不包括目标影片的第二类型正片的数据,包括目标影片的关联视频的数据。服务器根据flag值为1或为2,进行影院搜索。
在一些实施例中,该语音交互结果包括视频搜索结果,不包括影院搜索结果,显示设备接收到该语音交互结果后,生成第三搜索结果页面。
参见图7,为根据一些实施例的第三搜索结果页面的示意图,如图7所示,该第三搜索结果页面可包括媒资控件301,媒资控件301用于展示目标影片,即电影A的媒资海报,用户可触发该媒资控件301进入电影A的详情页。
在一些实施例中,除了目标影片的第一类型正片的数据,该视频搜索结果包括目标影片的关联视频的数据。显示设备根据视频搜索结果包括该关联视频的数据,在第三搜索结果页面展示关联视频,图7中,关联视频对应的控件为媒资控件302。
在一些实施例中,若服务器在视频库搜索不到目标影片的第一类型正片,则可继续搜索目标影片的第二类型正片以及目标影片的关联视频,并进行影院搜索。
在一些实施例中,服务器也可同时搜索目标影片的第一类型正片、第二类型正片和关联视频。
在一些实施例中,为实现快速进行影院搜索,服务器上可预先构建有影院知识图谱,该影院知识图谱可设置有多个影院的影院名称、影院地址和排片信息等影院信息,其中,这些影院信息可来自第三方影片购票程序。在排片信息发生变更时,服务器可更新该影院知识图谱,以确保知识图谱中的排片信息的准确性。
基于该影院知识图谱,服务器可构建影片映射库。对于一部影片,服务器可从影院知识图谱中获取上映该影片的影院的影院信息,建立该影片与影院之间的映射关系,多个影片与影院之间的映射关系,构成影片映射库。从而在进行影院搜索时,服务器可基于影片映射库,快速搜索到上映目标影片的影院。
在一些实施例中,若在显示设备的定位信息对应范围内,服务器搜索到正在上映目标影片的影院,则生成影院搜索结果,若搜索不到正在上映目标影片的影院,则不生成影院搜索结果,仅向显示设备反馈视频搜索结果。
服务器将如下语音交互结果:仅包含视频搜索结果,不包含影院搜索结果,且视频搜索结果仅包括目标影片的第二类型正片和/或关联视频,反馈给显示设备后,显示设备可生成用于展示上述视频搜索结果的搜索结果页面,该搜索结果页面与图7类似,区别在于该搜索结果页面的展示内容为目标影片的第二类型正片和/或关联视频,而不是图7中展示的目标影片的第一类型正片和/或关联视频。
服务器将包含视频搜索结果和影院搜索结果的语音交互结果反馈给显示设备后,显示设备可基于接收到的视频搜索结果和影院搜索结果,生成第一搜索结果页面。
参见图8,为根据一些实施例的第一搜索结果页面的示意图,如图8示,该第一搜索结果页面可包括媒资控件303、媒资控件302和影院控件304,其中,媒资控件303用于展示目标影片的第二类型正片,示例性的,该第二类型正片为单片付费的影片,如图8所示,该媒资控件303上可设置有单片付费标识3031,表示该正片不是会员免费观看的正片。媒资控件303、媒资控件302展示在影院控件304之前,便于用户优先选择在显示设备上观看该目标影片。参见图9,为根据又一些实施例的第一搜索结果页面的示意图,如图9所示,影院控件304展示在媒资控件303、媒资控件302之前,便于用户优先选择去影院观看该目标影片。
在一些实施例中,多个影院控件304按照对应的影院与用户的定位信息之间的距离由近到远进行排序,便于用户选择最近的影院观看目标影片。
在一些实施例中,对于存在目标影片的第二类型正片,且存在影院正在上映该目标影片的情形,部分用户可能偏好去影院观看该影片,部分用户可能偏好在显示设备上观看该影片。为进一步提升语音搜索体验,本申请实施例中,还可对用户的偏好进行分析,根据用户的偏好确定影院搜索结果与视频搜索结果的展示顺序。
在一些实施例中,对用户的偏好分析如下:显示设备可获取用户对第二类型正片的历史点播记录和历史影院搜索记录,根据历史点播记录和历史影院搜索记录,确定用户对第二类型正片和影院搜索结果的偏好顺序。
若用户对第二类型正片的偏好顺序位于影院搜索结果之前,则如图8所示,在第一搜索结果页面展示所述第二类型正片和影院搜索结果,且将第二类型正片展示在所述影院搜索结果之前;
若用户对影院搜索结果的偏好顺序位于第二类型正片之前,则如图9所示,在第一搜索结果页面展示所述第二类型正片和影院搜索结果,且将影院搜索结果展示在第二类型正片之前。
在一些实施例中,用户对第二类型正片的历史点播记录和历史影院搜索记录可从用户的历史语音交互数据中获取。
显示设备可从历史语音交互数据中获取第一目标多轮语音交互数据,得到第二类型正片的点播次数,其中,第一目标多轮语音交互数据包括在相邻两轮对话中分别包含影片搜索指令和第二类型正片的播放指令的数据,第二类型正片的历史点播记录包括点播次数;从历史语音交互数据中获取第二目标多轮语音交互数据,得到影院搜索次数,其中,第二目标多轮语音交互数据包括在相邻两轮对话中分别包含影片搜索指令和影院搜索指令的数据,历史影院搜索记录包括影院搜索次数。
例如,在历史语音交互数据中包括如下两轮语音交互数据,第一轮语音交互数据为:用户输入了语音指令:“搜索电影B”,显示设备给出了电影B的搜索结果,该搜索结果包括电影B的第二类型正片;第二轮语音交互数据为,用户输入了语音指令:“播放电影B”,显示设备给出了上映电影B的电影院的搜索结果,则这两轮语音交互数据为第一目标多轮语音交互数据。在一些实施例中,也可扩大对用户数据的分析范围,例如,分析范围可包括历史语音交互数据和用户在输入语音指令后输入的操作指令。从而在用户输入的语音指令为影片搜索指令后,若用户没有继续输入语音指令,但通过遥控器点播了搜索结果中的电影B的第二类型正片,也将第二类型正片的点播次数加1。
再例如,在历史语音交互数据中包括如下两轮语音交互数据,第一轮语音交互数据为:用户输入了语音指令:“搜索电影B”,显示设备给出了电影B的搜索结果;第二轮语音交互数据为,用户输入了语音指令:“搜索上映电影B的电影院”,显示设备给出了上映电影B的电影院的搜索结果,则这两轮语音交互数据为第二目标多轮语音交互数据。
基于上述对用户数据的分析,得到用户在之前与显示设备的语音交互过程中,点播了第二类型正片的次数和搜索电影院的次数,若点播第二类型正片的次数大于搜索电影院的次数,则确定用户对第二类型正片的偏好顺序位于影院搜索结果之前,若点播第二类型正片的次数小于搜索电影院的次数,则确定用户对第二类型正片的偏好顺序位于影院搜索结果之后,若点播第二类型正片的次数等于搜索电影院的次数,则可确定用户对第二类型正片的偏好顺序位于影院搜索结果之前,也可确定用户对第二类型正片的偏好顺序位于影院搜索结果之后。
在一些实施例中,由于历史语音交互数据的数据量较大,上述对历史语音交互数据的分析可由服务器执行,服务器在确定出用户对第二类型正片和影院搜索结果的偏好顺序后,除了向显示设备反馈目标影片的视频搜索结果和影院搜索结果,还向显示设备反馈偏好标识,该偏好标识的不同取值用于表征用户的偏好顺序,示例性的,偏好标识为0,表征用户偏好影院搜索结果,偏好标识为1,表征用户偏好第二类型影片。显示设备可根据偏好标识,确定生成图8或图9所示的第一搜索结果页面。
在一些实施例中,若视频搜索结果不包括目标影片的第二类型正片,仅包括目标影片的关联视频,则参见图10,显示设备可直接将影院搜索结果展示在视频搜索结果之前,便于使用户直接选择去影院观看该目标影片。
在一些实施例中,若用户点击了影院控件304,参见图11,显示设备可跳转至购票页面,在该页面展示二维码控件305,方便用户扫码后在移动终端上进行购票,利用移动终端方便进行操作的优势,给用户带来良好的购票体验。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
为了方便解释,已经结合具体的实施方式进行了上述说明。但是,上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导,可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用,从而使得本领域技术人员更好的使用所述实施方式以及适于具体使用考虑的各种不同的变形的实施方式。

Claims (10)

1.一种显示设备,其特征在于,包括:
显示器;
控制器,与所述显示器连接,所述控制器被配置为:
接收搜索目标影片的语音指令;
响应于所述语音指令,获取所述目标影片的视频搜索结果;
在所述视频搜索结果不包括所述目标影片的第一类型正片,包括所述目标影片的第二类型正片时,获取所述目标影片对应的影院搜索结果,控制所述显示器在第一搜索结果页面展示所述第二类型正片和影院搜索结果,所述第一类型正片包括符合预设播放规则的正片,所述第二类型正片包括不符合所述预设播放规则的正片;
在所述视频搜索结果不包括所述目标影片的第一类型正片,也不包括所述目标影片的第二类型正片时,获取所述目标影片对应的影院搜索结果,控制所述显示器在第二搜索结果页面展示所述影院搜索结果。
2.根据权利要求1所述的显示设备,其特征在于,所述控制器被配置为:控制所述显示器在第一搜索结果页面展示所述第二类型正片和影院搜索结果,包括:
获取第二类型正片的历史点播记录和历史影院搜索记录;
根据所述历史点播记录和历史影院搜索记录,确定对所述第二类型正片和影院搜索结果的偏好顺序;
若对所述第二类型正片的偏好顺序位于所述影院搜索结果之前,控制所述显示器在第一搜索结果页面展示所述第二类型正片和影院搜索结果,且将所述第二类型正片展示在所述影院搜索结果之前;
若对所述影院搜索结果的偏好顺序位于所述第二类型正片之前,控制所述显示器在第一搜索结果页面展示所述第二类型正片和影院搜索结果,且将所述影院搜索结果展示在所述第二类型正片之前。
3.根据权利要求2所述的显示设备,其特征在于,所述控制器被配置为:获取第二类型正片的历史点播记录和历史影院搜索记录,包括:
从历史语音交互数据中获取第一目标多轮语音交互数据,得到所述第二类型正片的点播次数,其中,所述第一目标多轮语音交互数据包括在相邻两轮对话中分别包含影片搜索指令和所述第二类型正片的播放指令的数据,所述第二类型正片的历史点播记录包括所述点播次数;
从所述历史语音交互数据中获取第二目标多轮语音交互数据,得到影院搜索次数,其中,所述第二目标多轮语音交互数据包括在相邻两轮对话中分别包含所述影片搜索指令和影院搜索指令的数据,所述历史影院搜索记录包括所述影院搜索次数。
4.根据权利要求1所述的显示设备,其特征在于,所述控制器被配置为:获取所述目标影片对应的影院搜索结果,包括:
获取所述显示设备的定位信息;
获取所述定位信息对应范围内的影院信息,所述影院信息包括排片信息;
根据所述排片信息包含所述目标影片的影院信息,生成所述目标影片对应的影院搜索结果。
5.根据权利要求4所述的显示设备,其特征在于,所述控制器被配置为:获取所述定位信息对应范围内的影院信息,包括:
从影片映射库中获取所述定位信息对应范围内的影院信息,其中,所述影片映射库根据影院知识图谱生成,所述影院知识图谱设置有影院名称、影院地址和排片信息。
6.根据权利要求1所述的显示设备,其特征在于,所述影院搜索结果包括多个排片信息对应所述目标影片的影院控件,所述控制器被配置为:
接收所述影院控件的触发指令;
响应于所述触发指令,控制所述显示器展示所述影院控件对应影院的所述目标影片的购票页面。
7.根据权利要求1所述的显示设备,其特征在于,所述预设播放规则包括:所述第一类型正片的视频来源标识为预设来源标识,且所述第一类型正片未设置有单片付费标识。
8.根据权利要求7所述的显示设备,其特征在于,所述控制器被配置为:获取所述目标影片的视频搜索结果,包括:
在第一视频库搜索所述目标影片的影片信息,其中,所述第一视频库包括所述预设来源标识对应的视频库;
若所述第一视频库中的影片信息不包括所述目标影片的第一类型正片,在第二视频库搜索所述目标影片的影片信息,其中,所述第二视频库包括所述视频来源标识为除所述预设来源标识之外的标识对应的视频库。
9.根据权利要求1所述的显示设备,其特征在于,所述控制器被配置为:控制所述显示器在第二搜索结果页面展示所述影院搜索结果,包括:
在所述视频搜索结果包括所述目标影片的关联视频时,控制所述显示器在第二搜索结果页面展示所述影院搜索结果和关联视频。
10.一种语音搜索方法,其特征在于,包括:
接收搜索目标影片的语音指令;
响应于所述语音指令,获取所述目标影片的视频搜索结果;
在所述视频搜索结果不包括所述目标影片的第一类型正片,包括所述目标影片的第二类型正片时,获取所述目标影片对应的影院搜索结果,在第一搜索结果页面展示所述第二类型正片和影院搜索结果,所述第一类型正片包括符合预设播放规则的正片,所述第二类型正片包括不符合所述预设播放规则的正片;
在所述视频搜索结果不包括所述目标影片的第一类型正片,也不包括所述目标影片的第二类型正片时,获取所述目标影片对应的影院搜索结果,在第二搜索结果页面展示所述影院搜索结果。
CN202311551549.5A 2023-11-20 2023-11-20 显示设备及语音搜索方法 Pending CN117812422A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311551549.5A CN117812422A (zh) 2023-11-20 2023-11-20 显示设备及语音搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311551549.5A CN117812422A (zh) 2023-11-20 2023-11-20 显示设备及语音搜索方法

Publications (1)

Publication Number Publication Date
CN117812422A true CN117812422A (zh) 2024-04-02

Family

ID=90430735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311551549.5A Pending CN117812422A (zh) 2023-11-20 2023-11-20 显示设备及语音搜索方法

Country Status (1)

Country Link
CN (1) CN117812422A (zh)

Similar Documents

Publication Publication Date Title
CN111752442B (zh) 显示操作引导信息的方法、装置、终端及存储介质
US20180322870A1 (en) Performing tasks and returning audio and visual feedbacks based on voice command
US10311877B2 (en) Performing tasks and returning audio and visual answers based on voice command
RU2614137C2 (ru) Способ и устройство для получения информации
WO2020010818A1 (zh) 视频拍摄方法、装置、终端、服务器和存储介质
US11409817B2 (en) Display apparatus and method of controlling the same
CN109474843B (zh) 语音操控终端的方法、客户端、服务器
CN104170397A (zh) 用于娱乐系统的用户界面
CN109597929A (zh) 搜索结果的展示方法、装置、终端及可读介质
CN110992937A (zh) 语言离线识别方法、终端及可读存储介质
US10826961B2 (en) Multimedia player device automatically performs an operation triggered by a portable electronic device
CN102707914B (zh) 信息处理设备及方法
US11153651B2 (en) Method, apparatus, and device for obtaining play data, and storage medium
CN109792502A (zh) 信息处理设备、信息处理方法、程序和信息处理系统
WO2020010817A1 (zh) 视频处理方法、装置、终端和存储介质
US8965870B2 (en) Method and apparatus for exchanging media service queries
KR101511311B1 (ko) 셋탑박스 제어 기록 및 콘텐츠 검색 기록을 이용한 사용자 맞춤형 광고 제공 시스템 및 방법
CN114627864A (zh) 显示设备与语音交互方法
CN117812422A (zh) 显示设备及语音搜索方法
CN116320564A (zh) 显示设备、终端设备和设备控制方法
CN112447174B (zh) 服务提供方法、装置和系统、计算设备和存储介质
CN114566144A (zh) 一种语音识别方法、装置、服务器和电子设备
CN115240665A (zh) 显示设备、控制方法和存储介质
CN113207042B (zh) 一种媒资播放方法及显示设备
CN115396709B (zh) 显示设备、服务器及免唤醒语音控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination