CN113076427A - 一种媒资资源搜索方法、显示设备及服务器 - Google Patents
一种媒资资源搜索方法、显示设备及服务器 Download PDFInfo
- Publication number
- CN113076427A CN113076427A CN202110281021.5A CN202110281021A CN113076427A CN 113076427 A CN113076427 A CN 113076427A CN 202110281021 A CN202110281021 A CN 202110281021A CN 113076427 A CN113076427 A CN 113076427A
- Authority
- CN
- China
- Prior art keywords
- homophonic
- text
- basic
- voice text
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000010410 layer Substances 0.000 description 27
- 238000010586 diagram Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 210000001747 pupil Anatomy 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 206010016766 flatulence Diseases 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 241000282994 Cervidae Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/441—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
- H04N21/4415—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本实施例提供一种视频资源搜索方法、显示设备及服务器。方法包括:从语音数据中识别基础语音文本。根据基础语音文本在预设知识图谱中查找同音语音文本。如果预设知识图谱中存在同音语音文本,则在显示器同时显示基础语音文本相关的媒资资源和同音语音文本相关的媒资资源。如果预设知识图谱中不存在同音语音文本,则仅在显示器上显示基础语音文本相关的媒资资源。本申请实施例不仅能够显示在目前识别语料中覆盖比较广或者权重较高词汇相关的媒资资源,还能够显示与上述词汇同音不同字词汇的相关媒资资源。从而为用户展示多样化的搜索结果,避免搜索后呈现的内容并不是用户实际想要搜索内容的情况发生,提升用户搜索体验。
Description
技术领域
本申请涉及声音处理技术领域,尤其涉及一种媒资资源搜索方法、显示设备及服务器。
背景技术
随着语音识别技术的不断发展及智能家居的不断发展,语音识别技术被广泛应用。用户可利用语音识别技术,在智能电视上搜索媒资资源。
传统的智能电视,基于语音识别技术,搜索媒资资源的过程为:获取用户输入语音数据,生成语音文本,将语音文本输入语言模型,识别出相关的关键词后,在搜索引擎中搜索关键词相关的媒资资源。例如,输入某演员的名称,搜索该演员参演的电视剧资源。
然而,当前演员的名字、影视资源的名称存在很多同音不同字的情况,例如四大名助和四大名著。上述方案中的语言模型是一种概率模型,识别的结果通常是目前识别语料中覆盖比较广的或者权重较高的词汇(热词)。因此存在搜索后得到的内容,是同音不同字的热词相关内容,但并不是用户实际想要搜索的内容的情况,造成用户搜索体验较差。
发明内容
本申请提供了一种媒资资源搜索方法、显示设备及服务器,用于解决现有的显示设备在基于语音识别搜索媒资资源时,搜索后得到的内容,是同音不同字的热词相关内容,但并不是用户实际想要搜索的内容的情况,造成用户搜索体验较差的问题。
第一方面,本实施例提供一种服务器,用于执行,
接收显示设备发送的语音数据,从所述语音数据中识别基础语音文本,以及在预设知识图谱中根据所述基础语音文本查找同音语音文本,其中所述基础语音文本在语言模型中匹配分值最高,所述同音语音文本和所述基础语音文本在所述预设知识图谱中具有同音关系;
在所述预设知识图谱中存在所述同音语音文本时,向所述显示设备反馈所述基础语音文本对应的媒资资源和所述同音语音文本对应的媒资资源;
在所述预设知识图谱中不存在所述同音语音文本时,向所述显示设备反馈所述基础语音文本对应的媒资资源。
第二方面,本实施例提供一种显示设备,包括:
接收显示设备发送的语音数据,从所述语音数据中识别基础语音文本,以及在预设知识图谱中根据所述基础语音文本查找同音语音文本,其中所述基础语音文本在语言模型中匹配分值最高,所述同音语音文本和所述基础语音文本在所述预设知识图谱中具有同音关系;
在所述预设知识图谱中存在所述同音语音文本时,向所述显示设备反馈所述基础语音文本对应的媒资资源和所述同音语音文本对应的媒资资源;
在所述预设知识图谱中不存在所述同音语音文本时,向所述显示设备反馈所述基础语音文本对应的媒资资源。
第三方面,本实施例提供一种媒资资源搜索方法,应用于服务器,包括:
接收显示设备发送的语音数据,从所述语音数据中识别基础语音文本,以及在预设知识图谱中根据所述基础语音文本查找同音语音文本,其中所述基础语音文本在语言模型中匹配分值最高,所述同音语音文本和所述基础语音文本在所述预设知识图谱中具有同音关系;
在所述预设知识图谱中存在所述同音语音文本时,向所述显示设备反馈所述基础语音文本对应的媒资资源和所述同音语音文本对应的媒资资源;
在所述预设知识图谱中不存在所述同音语音文本时,向所述显示设备反馈所述基础语音文本对应的媒资资源。
第四方面,本实施例提供一种媒资资源搜索方法,应用于显示设备,包括:
将语音数据发送至服务器,以使在所述服务器中的预设知识图谱中,根据基础语音文本查找同音语音文本,其中所述基础语音文本为从所述语音数据中识别出的,所述基础语音文本在语言模型中匹配分值最高,所述同音语音文本和所述基础语音文本在所述预设知识图谱中具有同音关系;
在所述预设知识图谱中存在所述同音语音文本时,接收所述服务器反馈的,所述基础语音文本对应的媒资资源和所述同音语音文本对应的媒资资源;
在所述预设知识图谱中不存在所述同音语音文本时,接收所述服务器反馈的,所述基础语音文本对应的媒资资源。
本申请实施例提供的显示设备在接收到用户输入的语音数据之后,从语音数据中识别基础语音文本,其中基础语音文本为在语言模型中匹配分值最高的语音文本。根据基础语音文本在预设知识图谱中查找同音语音文本,其中,同音语音文本和基础语音文本在预设知识图谱中具有同音关系。如果预设知识图谱中存在同音语音文本,则在显示器同时显示基础语音文本相关的媒资资源和同音语音文本相关的媒资资源。如果预设知识图谱中不存在同音语音文本,则仅在显示器上显示基础语音文本相关的媒资资源。本申请实施例不仅能够显示在目前识别语料中覆盖比较广或者权重较高词汇相关的媒资资源,还能够显示与上述词汇同音不同字词汇的相关媒资资源。从而为用户展示多样化的搜索结果,避免搜索后呈现的内容并不是用户实际想要搜索内容的情况发生,提升用户搜索体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据一些实施例的显示设备的使用场景;
图2示出了根据一些实施例的控制装置100的硬件配置框图;
图3示出了根据一些实施例的显示设备200的硬件配置框图;
图4示出了根据一些实施例的显示设备200中软件配置图;
图5示出了根据一些实施例的显示设备200中应用程序的图标控件界面显示图;
图6示出了根据一些实施例的媒资资源搜索系统的硬件配置示意图;
图7示出了根据一些实施例中显示设备200中的用户界面示意图;
图8示出了根据一些实施例中电视领域关系指示图谱构建流程示意图;
图9示出了根据一些实施例中基础语音文本识别原理示意图;
图10示出了根据一些实施例中又一种显示设备200中的用户界面示意图;
图11示出了根据一些实施例中又一种显示设备200中的用户界面示意图;
图12示出了根据一些实施例中显示设备显示媒资资源数据原理示意图;
图13示出了根据一些实施例的媒资资源搜索方法信令图;
图14示出了根据一些实施例的又一种媒资资源搜索方法信令图。
具体实施方式
为使本申请的目的和实施方式更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
本申请中说明书和权利要求书及上述附图中的术语〞第一″、〞第二″、″第三″等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。
术语〞包括″和″具有″以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的所有组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
术语〞模块″是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
图1为根据实施例中显示设备的使用场景的示意图。如图1所示,显示设备200还与服务器400进行数据通信,用户可通过智能设备300或控制装置100操作显示设备200。
在一些实施例中,控制装置100可以是遥控器,遥控器和显示设备的通信包括红外协议通信或蓝牙协议通信,及其他短距离通信方式中的至少一种,通过无线或有线方式来控制显示设备200。用户可以通过遥控器上按键、语音输入、控制面板输入等至少一种输入用户指令,来控制显示设备200。
在一些实施例中,智能设备300可以包括移动终端300A、平板电脑、计算机、笔记本电脑,AR/VR设备等中的任意一种。
在一些实施例中,也可以使用智能设备300以控制显示设备200。例如,使用在智能设备上运行的应用程序控制显示设备200。
在一些实施例中,也可以使用智能设备300和显示设备进行数据的通信。
在一些实施例中,显示设备200还可以采用除了控制装置100和智能设备300之外的方式进行控制,例如,可以通过显示设备200设备内部配置的获取语音指令的模块直接接收用户的语音指令控制,也可以通过显示设备200设备外部设置的语音控制装置来接收用户的语音指令控制。
在一些实施例中,显示设备200还与服务器400进行数据通信。可允许显示设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器400可以向显示设备200提供各种内容和互动。服务器400可以是一个集群,也可以是多个集群,可以包括一类或多类服务器。
在一些实施例中,一个步骤执行主体执行的软件步骤可以随需求迁移到与之进行数据通信的另一步骤执行主体上进行执行。示例性的,服务器执行的软件步骤可以随需求迁移到与之数据通信的显示设备上执行,反之亦然。
图2示例性示出了根据示例性实施例中控制装置100的配置框图。如图2所示,控制装置100包括控制器110、通信接口130、用户输入/输出接口140、存储器、供电电源。控制装置100可接收用户的输入操作指令,且将操作指令转换为显示设备200可识别和响应的指令,起用用户与显示设备200之间交互中介作用。
在一些实施例中,通信接口130用于和外部通信,包含WIFI芯片,蓝牙模块,NFC或可替代模块中的至少一种。
在一些实施例中,用户输入/输出接口140包含麦克风,触摸板,传感器,按键或可替代模块中的至少一种。
图3示出了根据示例性实施例中显示设备200的硬件配置框图。
在一些实施例中,显示设备200包括调谐解调器210、通信器220、检测器230、外部装置接口240、控制器250、显示器260、音频输出接口270、存储器、供电电源、用户接口中的至少一种。
在一些实施例中控制器包括中央处理器,视频处理器,音频处理器,图形处理器,RAM,ROM,用于输入/输出的第一接口至第n接口。
在一些实施例中,显示器260包括用于呈现画面的显示屏组件,以及驱动图像显示的驱动组件,用于接收源自控制器输出的图像信号,进行显示视频内容、图像内容以及菜单操控界面的组件以及用户操控UI界面等。
在一些实施例中,显示器260可为液晶显示器、OLED显示器、以及投影显示器中的至少一种,还可以为一种投影装置和投影屏幕。
在一些实施例中,调谐解调器210通过有线或无线接收方式接收广播电视信号,以及从多个无线或有线广播电视信号中解调出音视频信号,如以及EPG数据信号。
在一些实施例中,通信器220是用于根据各种通信协议类型与外部设备或服务器进行通信的组件。例如:通信器可以包括Wifi模块,蓝牙模块,有线以太网模块等其他网络通信协议芯片或近场通信协议芯片,以及红外接收器中的至少一种。显示设备200可以通过通信器220与控制装置100或服务器400建立控制信号和数据信号的发送和接收。
在一些实施例中,检测器230用于采集外部环境或与外部交互的信号。例如,检测器230包括光接收器,用于采集环境光线强度的传感器;或者,检测器230包括图像采集器,如摄像头,可以用于采集外部环境场景、用户的属性或用户交互手势,再或者,检测器230包括声音采集器,如麦克风等,用于接收外部声音。
在一些实施例中,外部装置接口240可以包括但不限于如下:高清多媒体接口接口(HDMI)、模拟或数据高清分量输入接口(分量)、复合视频输入接口(CVBS)、USB输入接口(USB)、RGB端口等任一个或多个接口。也可以是上述多个接口形成的复合性的输入/输出接口。
在一些实施例中,控制器250和调谐解调器210可以位于不同的分体设备中,即调谐解调器210也可在控制器250所在的主体设备的外置设备中,如外置机顶盒等。
在一些实施例中,控制器250,通过存储在存储器上中各种软件控制程序,来控制显示设备的工作和响应用户的操作。控制器250控制显示设备200的整体操作。例如:响应于接收到用于选择在显示器260上显示UI对象的用户命令,控制器250便可以执行与由用户命令选择的对象有关的操作。
在一些实施例中,所述对象可以是可选对象中的任何一个,例如超链接、图标或其他可操作的控件。与所选择的对象有关操作有:显示连接到超链接页面、文档、图像等操作,或者执行与所述图标相对应程序的操作。
在一些实施例中控制器包括中央处理器(Central Processing Unit,CPU),视频处理器,音频处理器,图形处理器(Graphics Processing Unit,GPU),RAM Random AccessMemory,RAM),ROM(Read-Only Memory,ROM),用于输入/输出的第一接口至第n接口,通信总线(Bus)等中的至少一种。
CPU处理器。用于执行存储在存储器中操作系统和应用程序指令,以及根据接收外部输入的各种交互指令,来执行各种应用程序、数据和内容,以便最终显示和播放各种音视频内容。CPU处理器,可以包括多个处理器。如,包括一个主处理器以及一个或多个子处理器。
在一些实施例中,图形处理器,用于产生各种图形对象,如:图标、操作菜单、以及用户输入指令显示图形等中的至少一种。图形处理器包括运算器,通过接收用户输入各种交互指令进行运算,根据显示属性显示各种对象;还包括渲染器,对基于运算器得到的各种对象,进行渲染,上述渲染后的对象用于显示在显示器上。
在一些实施例中,视频处理器,用于将接收外部视频信号,根据输入信号的标准编解码协议,进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等视频处理中的至少一种,可得到直接可显示设备200上显示或播放的信号。
在一些实施例中,视频处理器,包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等中的至少一种。其中,解复用模块,用于对输入音视频数据流进行解复用处理。视频解码模块,用于对解复用后的视频信号进行处理,包括解码和缩放处理等。图像合成模块,如图像合成器,其用于将图形生成器根据用户输入或自身生成的GUI信号,与缩放处理后视频图像进行叠加混合处理,以生成可供显示的图像信号。帧率转换模块,用于对转换输入视频帧率。显示格式化模块,用于将接收帧率转换后视频输出信号,改变信号以符合显示格式的信号,如输出RGB数据信号。
在一些实施例中,音频处理器,用于接收外部的音频信号,根据输入信号的标准编解码协议,进行解压缩和解码,以及降噪、数模转换、和放大处理等处理中的至少一种,得到可以在扬声器中播放的声音信号。
在一些实施例中,用户可在显示器260上显示的图形用户界面(GUI)输入用户命令,则用户输入接口通过图形用户界面(GUI)接收用户输入命令。或者,用户可通过输入特定的声音或手势进行输入用户命令,则用户输入接口通过传感器识别出声音或手势,来接收用户输入命令。
在一些实施例中,〞用户界面″,是应用程序或操作系统与用户之间进行交互和信息交换的介质接口,它实现信息的内部形式与用户可以接受形式之间的转换。用户界面常用的表现形式是图形用户界面(Graphic User Interface,GUI),是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的一个图标、窗口、控件等界面元素,其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素中的至少一种。
在一些实施例中,用户接口280,为可用于接收控制输入的接口(如:显示设备本体上的实体按键,或其他等)。
在一些实施例中,显示设备的系统可以包括内核(Kernel)、命令解析器(shell)、文件系统和应用程序。内核、shell和文件系统一起组成了基本的操作系统结构,它们让用户可以管理文件、运行程序并使用系统。上电后,内核启动,激活内核空间,抽象硬件、初始化硬件参数等,运行并维护虚拟内存、调度器、信号及进程间通信(IPC)。内核启动后,再加载Shell和用户应用程序。应用程序在启动后被编译成机器码,形成一个进程。
参见图4,在一些实施例中,将系统分为四层,从上至下分别为应用程序(Applications)层(简称〞应用层″),应用程序框架(Application Framework)层(简称″框架层″),安卓运行时(Android runtime)和系统库层(简称″系统运行库层″),以及内核层。
在一些实施例中,应用程序层中运行有至少一个应用程序,这些应用程序可以是操作系统自带的窗口(Window)程序、系统设置程序或时钟程序等;也可以是第三方开发者所开发的应用程序。在具体实施时,应用程序层中的应用程序包不限于以上举例。
框架层为应用程序层的应用程序提供应用编程接口(application programminginterface,API)和编程框架。应用程序框架层包括一些预先定义的函数。应用程序框架层相当于一个处理中心,这个中心决定让应用层中的应用程序做出动作。应用程序通过API接口,可在执行中访问系统中的资源和取得系统的服务。
如图4所示,本申请实施例中应用程序框架层包括管理器(Managers),内容提供者(Content Provider)等,其中管理器包括以下模块中的至少一个:活动管理器(ActivityManager)用与和系统中正在运行的所有活动进行交互;位置管理器(Location Manager)用于给系统服务或应用提供了系统位置服务的访问;文件包管理器(Package Manager)用于检索当前安装在设备上的应用程序包相关的各种信息;通知管理器(NotificationManager)用于控制通知消息的显示和清除;窗口管理器(Window Manager)用于管理用户界面上的括图标、窗口、工具栏、壁纸和桌面部件。
在一些实施例中,活动管理器用于管理各个应用程序的生命周期以及通常的导航回退功能,比如控制应用程序的退出、打开、后退等。窗口管理器用于管理所有的窗口程序,比如获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕,控制显示窗口变化(例如将显示窗口缩小显示、抖动显示、扭曲变形显示等)等。
在一些实施例中,系统运行库层为上层即框架层提供支撑,当框架层被使用时,安卓操作系统会运行系统运行库层中包含的C/C++库以实现框架层要实现的功能。
在一些实施例中,内核层是硬件和软件之间的层。如图4所示,内核层至少包含以下驱动中的至少一种:音频驱动、显示驱动、蓝牙驱动、摄像头驱动、WIFI驱动、USB驱动、HDMI驱动、传感器驱动(如指纹传感器,温度传感器,压力传感器等)、以及电源驱动等。
在一些实施例中,显示设备启动后可以直接进入预置的视频点播程序的界面,视频点播程序的界面可以如图5中所示,至少包括导航栏510和位于导航栏510下方的内容显示区,内容显示区中显示的内容会随导航栏中被选中控件的变化而变化。应用程序层中的程序可以被集成在视频点播程序中通过导航栏的一个控件进行展示,也可以在导航栏中的应用控件被选中后进行进一步显示。
在一些实施例中,显示设备启动后可以直接进入上次选择的信号源的显示界面,或者信号源选择界面,其中信号源可以是预置的视频点播程序,还可以是HDMI接口,直播电视接口等中的至少一种,用户选择不同的信号源后,显示器可以显示从不同信号源获得的内容。
为清楚说明本申请的实施例,下面给出一些相关名称的解释。
实体:是指客观存在并可互相区别的事务,包括具体的人、事、物、机构、抽象的概念等。
知识图谱:本质上是一种语义网络,能够代表实体之间的语义关系。知识图谱中以实体为顶点或节点,以关系为边。知识图谱的架构主要包括自身的逻辑结构以及体系架构,知识图谱在逻辑结构上可分为模式层与数据层两个层次,数据层主要由一系列的事实组成,而知识将以事实为单位进行存储。如果用(实体1,关系,实体2)、(实体、属性,属性值)这样的三元组来表达事实,可选择图数据库作为存储介质。
随着语音识别技术在显示设备上的广泛应用,用户可利用语音识别技术,在显示设备上搜索媒资资源。例如,通过麦克风输入某演员的名称,搜索该演员参演的电视剧资源。
然而,当前演员和影视资源的名字存在很多同音不同字的情况。例如,四大名著和四大名助,前者是我国的传统文学作品的统称,后者是现代电影的名称。陆垚知马俐和路遥知马力,前者是现代电影的名称,后者出自古诗文。还有一些同音不同字的演员名字,例如,张萌和张檬。
语音识别处理同音字时,通常是根据上下文关系,例如一段语音〞五仁月饼″,对该语音的识别过程是:
首先根据发音〞wǔ″识别第一个字,可以得出很多结果:{五、舞、午、武、吾、伍}等等。
之后接收待第二个发音后,语音变成〞wǔ rén″,同样也可以得出很多结果,其中根据常用语料,可以排出很多未出现过的组合,得到可能的组合{五人、武人、舞人、五仁}等等。
紧接着接收第三个发音后,语音变成″wǔ rén yuè″,仍然可以得到很多组合结果。同样的根据常用语料,排出很多未出现过的组合,得到可能的组合{舞人月、五人月、无人约、武人月、伍仁月}等等。有一些仅有音调变化的组合也可以不被排出。
最后该段语音所有的字都接收到后,语音变成〞wǔ rén yuèbǐng″。最后根据常用语料,得到可能性最大的组合〞五仁月饼″。
上述方式是利用语言模型,从语音数据中识别用户意图。该语言模型是一种概率模型,即如果存在同音不同字的识别文本时,通常是将目前识别语料中覆盖比较广的或者权重较高的词汇(热词)作为识别结果,进而显示该识别结果相关的媒资资源。例如,四大名著可能比四大名助权重更高,则在显示器上显示的是四大名著相关视频。而此时用户实际可能想要搜索的是四大名助相关视频,这就导致展示的内容并不是用户实际想要搜索的内容,造成用户搜索体验较差。
为了解决上述问题,本申请提供一种媒资资源搜索系统,如图6所示的根据实施例中媒资资源搜索系统的硬件配置示意图。图6所示的实施例为显示设备200和服务器400交互的场景。用户可以利用本申请的显示设备,从服务器搜索得到具有同音关系的多个语音文本对应的媒资资源。
显示设备200包括声音采集器230A和显示器260,声音采集器用于采集用户的声音。服务器400具体为语义后台服务器,服务器中存储有语言模型、声学模型、知识图谱等。显示器至少用于显示媒资资源。
显示设备200中配置有媒体应用程序,例如视频播放程序。
在一些实施例中,用户可以通过操作控制装置100,在显示设备200的用户界面上调出视频播放程序的搜索栏,如图7所示的显示设备200的用户界面,图7所示的用户界面上不仅包括搜索栏,还包括提示语〞你可以说电影白鹿原中白嘉轩是谁演的″。
本实施例的预设知识图谱为在已有的知识图谱基础上进一步增加关联关系之后得到的知识图谱。
具体的,已有的知识图谱是在信息的基础上,建立实体之间的联系,从而形成知识(事实)。知识图谱是由大量的知识组成的,每条知识用SPO(Subject-Predicate-Object,实体-关系-实体)三元组表示。大多数的知识图谱都是采用自底向上的构建方式。自底向上指的是从一些开放链接数据(信息)中提取出实体,选择其中置信度较高的加入到知识库,再构建实体与实体之间的联系。
如图8所示的电视领域关系知识图谱构建流程示意图。一方面,主要利用电视领域(影视、音乐等)有关数据,构建包含多数据源的关系图谱,实现原二维表结构到图结构的转换。具体的,将新增关系数据添加到关系数据库,知识图谱从关系数据库中获取新增关系数据。另一方面,自定义推理规则(即同音关系),将该推理规则转换为图数据库系统的操作语言,将该操作语言添加到推理机。之后将图数据库中的数据利用推理机进行推理,利用推理程序控制规则的调用执行,自动发现实体之间的同音关系,并将同音关系再添加到图数据库中,从而补全电视领域的知识图谱。
在一些实施例中,在创建电视领域知识图谱过程中,添加实体间同音关系之后,需要对实体的属性值进行检测。属性值不一致的实体之间的同音关系予以删除。
示例性的,〞视频″和〞饰品″虽然具有同音关系,但是〞视频″为媒资类别属性,而〞饰品″为物品属性,〞视频″和〞饰品″属性不一致,则在构建的知识图谱中将〞视频″和〞饰品″之间的同音关系删除。〞林珊″和〞临山″虽然具有同音关系,但是如果〞林珊″为演员属性,但是〞临山″为地名属性,〞林珊″和〞临山″属性不一致,则在构建的知识图谱中将〞林珊″和〞临山″之间的同音关系删除,使得媒资资源搜索过程更简洁。
在一些实施例中,当用户通过麦克风输入语音数据,显示设备接收到语音数据后,将该语音数据发送至服务器。服务器根据语言模型和声学模型,从该语音数据中识别基础语音文本,基础语音文本为在语言模型中匹配分值最高的语音文本,即语料库中覆盖最广的语音文本。之后,根据基础语音文本在预设知识图谱中查找同音语音文本,同音语音文本和基础语音文本具有同音关系,并且同音语音文本的属性和基础语音文本的属性相同。
示例性,用户发出声音〞liu yi tong″,显示设备采集用户发出的声音,用户发出的声音经过处理为语音数据,发送至服务器。服务器首先对该语音数据进行语音识别。
语音识别的具体过程为:根据语音数据中每个字的语音识别候选字,如图9所示,〞liu″可以对应〞刘,六,流,留″等候选字,〞yi″可以对应〞一、奕、宜、怡″等候选字,〞tong″可以对应〞同、彤、童、潼″等候选字。根据得到的这些候选字可以拼接出多个字符序列,例如〞刘奕彤、刘艺同、刘一瞳″等字符序列。提取各个字符序列的声学特征,利用语言模型和声学模型,得到初步的语音识别结果。即得到匹配分值最高的字符序列,将该字符序列确定为基础语音文本。匹配分值最高的字符序列即为语料覆盖最多或者权重最高的词汇。例如,〞刘怡潼″的热度最高,计算得到匹配分值最高,因此将〞刘怡潼″确定为基础语音文本。
之后将〞刘怡潼″语音文本输入上述实施例创建好的电视领域知识图谱中,查找与〞刘怡潼″具有同音的关系的其他语音文本。
在一些实施例中,经过查找,如果在知识图谱中不存在与基础语音文本具有同音关系的其他语音文本,服务器则仅向显示设备反馈与基础语音文本对应的媒资资源。
示例性的,如果知识图谱中不存在与〞刘怡潼″具有同音关系的其他语音文本,服务器仅向显示设备反馈与〞刘怡潼″对应的媒资资源。在显示器上仅展示与〞刘怡潼″对应的媒资资源。如图7所示,在显示器上仅展示〞刘怡潼″标签和刘怡潼参演的影视剧。
在一些实施例中,经过查找,如果在知识图谱中存在一个与基础语音文本具有同音关系的同音语音文本,服务器则同时向显示设备反馈与基础语音文本对应的媒资资源和与同音语音文本对应的媒资资源。
示例性的,如果知识图谱中存在与〞刘怡潼″具有同音关系的其他语音文本,服务器向显示设备同时反馈与〞刘怡潼″对应的媒资资源和其他同音语音文本对应的媒资资源。例如在知识图谱中存在与〞刘怡潼″具有同音关系的〞刘艺彤″,服务器向显示设备同时反馈与〞刘怡潼″对应的媒资资源和与〞刘艺彤″对应的媒资资源。在显示器上则同时显示〞刘怡潼″的标签和〞刘艺彤″的标签。这里,如果焦点移动到〞刘怡潼″标签上,在显示器上显示刘怡潼参演的影视剧。如果焦点移动到〞刘艺彤″标签上,在显示器上显示〞刘艺彤″参演的影视剧。
在一些实施例中,经过查找,如果在知识图谱中存在多个与基础语音文本具有同音关系的同音语音文本,服务器则向显示设备反馈与基础语音文本对应的媒资资源和所有同音语音文本对应的媒资资源。
示例性的,如果知识图谱中存在多个与〞刘怡潼″具有同音关系的同音语音文本:〞刘奕彤″、〞刘艺彤″、〞刘钇彤″以及〞刘一瞳″。服务器则同时向显示设备反馈〞刘怡潼″、〞刘奕彤″、〞刘艺彤″、〞刘钇彤″以及〞刘一瞳″出演的影视剧。显示设备接收到反馈的媒资资源后,在显示器上显示〞刘怡潼″、〞刘奕彤″、〞刘艺彤″、〞刘钇彤″以及〞刘一瞳″的标签。同样的,在显示器上同时显示当前焦点位于的标签对应的媒资资源。
在一些实施例中,显示设备在接收到基础语音文本对应的媒资资源和所有同音语音文本对应的媒资资源时,按照所有语音文本在语言模型中的匹配分值,由高到低在显示器上显示基础语音文本对应的媒资资源和所有同音语音文本对应的媒资资源。
示例性的,如图10所示,显示设备在从服务器接收到〞刘怡潼″、〞刘奕彤″、〞刘艺彤″、〞刘钇彤″以及〞刘一瞳″出演的影视剧资源后,基于用户大数据分析或匹配分值排序后,排序结果为分值由高到低为:刘怡潼>刘奕彤>刘艺彤>刘钇彤>刘一瞳。说明电视影视领域的热度由高到低的顺序为:刘怡潼>刘奕彤>刘艺彤>刘钇彤>刘一瞳,则按照该顺序在显示器上依次显示〞刘怡潼″、〞刘奕彤″、〞刘艺彤″、〞刘钇彤″以及〞刘一瞳″的标签。
图10所示的用户界面上展示的是刘怡潼相关的媒资资源,当焦点从标签〞刘怡潼″移动至标签〞刘艺彤″,如图11所示,在用户界面上显示更新显示刘艺彤相关的媒资资源。
在一些实施例中,服务器在从语音数据中识别出基础语音文本后,还将基础语音文本反馈至显示设备,以使在显示设备显示所述基础语音文本,从而为用户提供更丰富的交互体验。
示例性的,服务器在从语音数据中识别出〞刘怡潼″基础语音文本之后,将〞刘怡潼″基础语音文本反馈至显示设备。如图7所示,显示设备接收到〞刘怡潼″基础语音文本后,在显示器上显示〞刘怡潼″。
在一些实施例中,如图12所示,显示设备显示语音文本对应的媒资资源的具体过程为:服务器(语义后台)将TAB数据(属性数据)和搜索结果数据(媒资资源数据)封装为JSON格式,将封装后的数据包下发至显示设备。显示设备接收到封装后的数据包后,解析出TAB数据和搜索结果数据,以及将TAB数据和搜索结果数据绘制在用户界面上。
上述实施例的语音数据中只包括名称文本,该名称文本为媒资资源的名称。这里的媒资资源名称包括人名、地名、机构名、影视名等词汇。例如,人名〞刘怡潼″,影视名〞四大名著″和〞四大名助″。
在一些实施例中,语音数据中还可以同时包含名称文本和基本文本,这里的基本文本包括媒资资源的类别,例如音乐、视频、电影等词汇。当语音数据中同时包含名称文本和基本文本时,在知识图谱中同时查找与名称文本具有同音关系的其他名称文本,与基本文本具有同音关系的其他基本文本。根据得到的同音名称文本和同音基本文本确定最后的同音语音文本。在本申请实施例中,基本文本和查找出的同音基本文本的属性相同。
示例性的,如果用户发出的语音为〞刘怡潼的视频″,包括名称文本〞刘怡潼″和基本文本〞视频″,则根据名称文本〞刘怡潼″在知识图谱中查找同音名称文本,同时根据基本文本〞视频″在知识图谱中查找同音基本文本。例如,查找到同音名称文本〞刘艺彤″和同音基本文本〞饰品″。由于同音基本文本〞饰品″的属性和基本文本〞视频″的属性不一致,则忽略同音基本文本〞饰品″。只得到最后的同音语音文本〞刘艺彤的视频″。因此,服务器根据基础语音文本〞刘怡潼的视频″和同音语音文本〞刘艺彤的视频″,向显示设备反馈刘艺彤的视频资源和刘艺彤的视频资源。
本申请实施例提供一种媒资资源搜索方法,如图13所示的声音输出方法的信令图,所述方法包括以下步骤:
步骤一、服务器接收显示设备发送的语音数据。服务器从语音数据中识别基础语音文本后,判断预设知识图谱中是否存在与基础语音文本具有同音关系的同音语音文本。
步骤二、如果预设知识图谱中存在与基础语音文本具有同音关系的同音语音文本,服务器则向显示设备同时反馈基础语音文本对应的媒资资源和同音语音文本对应的媒资资源。
步骤三、如果预设知识图谱中不存在与基础语音文本具有同音关系的同音语音文本,服务器则只向显示设备反馈基础语音文本对应的媒资资源。
本申请实施例的媒资资源搜索方法,根据语音数据,不仅能够搜索在目前识别语料中覆盖比较广或者权重较高词汇相关的媒资资源,还能够搜索与上述词汇同音不同字词汇的相关媒资资源。从而为用户展示多样化的搜索结果,避免搜索后呈现的内容并不是用户实际想要搜索内容的情况发生,提升用户搜索体验。
基于上述方法实施例,本申请实施例提供又一种媒资资源搜索方法,如图14所示的媒资资源搜索方法的信令图,所述方法包括以下步骤:
步骤一、声音采集器将语音数据发送至语音识别模块,语音识别模块从语音数据中识别及基础语音文本,以及将该基础语音文本发送至知识图谱分析模块。
步骤二、知识图谱分析模块中包含预设知识图谱(实体之间添加有同音关系的知识图谱),知识图谱分析模块判断预设知识图谱中是否存在与基础语音文本具有同音关系的同音语音文本。
步骤三、如果预设知识图谱中存在与基础语音文本具有同音关系的同音语音文本,知识图谱分析模块则将基础语音文本和查找到的同音语音文本发送至资源搜索模块。资源搜索模块在媒资资源数据库中搜索基础语音文本对应的媒资资源和同音语音文本对应的媒资资源,以及将基础语音文本对应的媒资资源和同音语音文本对应的媒资资源发送至显示设备,以使在显示器上显示基础语音文本对应的媒资资源和同音语音文本对应的媒资资源。
步骤四、如果预设知识图谱中不存在与基础语音文本具有同音关系的同音语音文本,知识图谱分析模块则仅将基础语音文本发送至资源搜索模块。资源搜索模块在媒资资源数据库中只搜索基础语音文本对应的媒资资源,以及将基础语音文本对应的媒资资源发送至显示设备,以使在显示器上只显示基础语音文本对应的媒资资源。
在一些实施例中,如果在知识图谱中仅存在一个与基础语音文本具有同音关系的同音语音文本,资源搜索模块则只向显示设备反馈基础语音文本对应的媒资资源和一个同音语音文本对应的媒资资源。
示例性的,如果知识图谱中存在与〞刘怡潼″具有同音关系的其他语音文本,服务器向显示设备同时反馈与〞刘怡潼″对应的媒资资源和其他同音语音文本对应的媒资资源。例如在知识图谱中存在与〞刘怡潼″具有同音关系的″刘艺彤″,服务器向显示设备同时反馈与〞刘怡潼″对应的媒资资源和与〞刘艺彤″对应的媒资资源。在显示器上则同时显示〞刘怡潼″的标签和〞刘艺彤″的标签。这里,如果焦点移动到〞刘怡潼″标签上,在显示器上显示刘怡潼参演的影视剧。如果焦点移动到〞刘艺彤″标签上,在显示器上显示〞刘艺彤″参演的影视剧。
在一些实施例中,如果在知识图谱中存在多个与基础语音文本具有同音关系的同音语音文本,则资源搜索模块搜索多个同音语音文本对应的媒资资源,以及向显示设备反馈多个同音语音文本对应的媒资资源。
在一些实施例中,显示设备在获取到多个语音文本对应的媒资资源后,首先按照所有语音文本在语言模型中的匹配分值,由高到低在显示器上依次显示语音文本标签。同时在显示设备上显示当前标签位于的语音文本对应的媒资资源。
示例性的,如图10所示,按照在语言模型中的匹配分值,由高到低依次显示语音文本标签〞刘怡潼″、〞刘奕彤″、〞刘艺彤″、〞刘钇彤″以及〞刘一瞳″。图10所示的用户界面中,焦点位于标签〞刘怡潼″上,则在显示器上显示刘怡潼相关的媒资资源。如图11所示的用户界面中,焦点位于标签″刘艺彤″上,则在显示器上显示刘艺彤相关的媒资资源。
本申请各个实施例之间相同或相似的内容可相互参照,相关实施例不再赘述。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
为了方便解释,已经结合具体的实施方式进行了上述说明。但是,上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导,可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用,从而使得本领域技术人员更好的使用所述实施方式以及适于具体使用考虑的各种不同的变形的实施方式。
Claims (10)
1.一种服务器,其特征在于,所述服务器,用于执行:
接收显示设备发送的语音数据,从所述语音数据中识别基础语音文本,以及在预设知识图谱中根据所述基础语音文本查找同音语音文本,其中所述基础语音文本在语言模型中匹配分值最高,所述同音语音文本和所述基础语音文本在所述预设知识图谱中具有同音关系;
在所述预设知识图谱中存在所述同音语音文本时,向所述显示设备反馈所述基础语音文本对应的媒资资源和所述同音语音文本对应的媒资资源;
在所述预设知识图谱中不存在所述同音语音文本时,向所述显示设备反馈所述基础语音文本对应的媒资资源。
2.根据权利要求1所述的服务器,其特征在于,从所述语音数据中识别基础语音文本的具体步骤包括:
从所述语音数据中根据每个字的语音识别候选字,根据所述候选字拼接出多个字符序列,将多个所述字符序列输入所述语言模型,将匹配分值最高的所述字符序列确定为所述基础语音文本。
3.根据权利要求1所述的服务器,其特征在于,在所述基础语音文本只包含名称文本时,在预设知识图谱中根据所述基础语音文本查找同音语音文本的具体步骤包括:
在所述预设知识图谱中查找与所述名称文本具有同音关系的同音名称文本,将所述同音名称文本确定为所述同音语音文本,其中,所述名称文本和所述同音名称文本为所述媒资资源的名称。
4.根据权利要求3所述的服务器,其特征在于,在所述基础语音文本同时包含名称文本和基本文本时,在预设知识图谱中根据所述基础语音文本查找同音语音文本的具体步骤包括:
在所述预设知识图谱中查找与所述名称文本具有同音关系的同音名称文本,以及在所述预设知识图谱中查找与所述基本文本具有同音关系的同音基本文本,将所述同音名称文本和所述同音基本文本组合后确定为所述同音语音文本,其中,所述基本文本和所述同音基本文本为所述媒资资源的类别,所述基本文本和所述同音基本文本的属性相同。
5.一种显示设备,其特征在于,包括,
显示器;
控制器,用于执行:
将语音数据发送至服务器,以使在所述服务器中的预设知识图谱中,根据基础语音文本查找同音语音文本,其中所述基础语音文本为从所述语音数据中识别出的,所述基础语音文本在语言模型中匹配分值最高,所述同音语音文本和所述基础语音文本在所述预设知识图谱中具有同音关系;
在所述预设知识图谱中存在所述同音语音文本时,接收所述服务器反馈的,所述基础语音文本对应的媒资资源和所述同音语音文本对应的媒资资源;
在所述预设知识图谱中不存在所述同音语音文本时,接收所述服务器反馈的,所述基础语音文本对应的媒资资源。
6.根据权利要求5所述的显示设备,其特征在于,所述控制器,还用于执行:
从所述服务器接收反馈的所述基础语音文本,以及在所述显示器上显示所述基础语音文本。
7.根据权利要求5所述的显示设备,其特征在于,在所述预设知识图谱中存在多个所述同音语音文本时,所述控制器,用于执行:
接收所述服务器反馈的所述基础语音文本对应的媒资资源,以及多个所述同音语音文本对应的多个媒资资源。
8.根据权利要求7所述的显示设备,其特征在于,在接收所述服务器反馈的所述基础语音文本对应的媒资资源,以及多个所述同音语音文本对应的多个媒资资源之后,所述控制器,还用于执行:
按照所述基础语音文本和多个所述同音语音文本在所述语言模型中的匹配分值,由高到低排列所述基础语音文本对应的媒资资源和多个所述同音语音文本对应的多个媒资资源。
9.一种媒资资源搜索方法,所述方法应用于服务器,其特征在于,包括:
接收显示设备发送的语音数据,从所述语音数据中识别基础语音文本,以及在预设知识图谱中根据所述基础语音文本查找同音语音文本,其中所述基础语音文本在语言模型中匹配分值最高,所述同音语音文本和所述基础语音文本在所述预设知识图谱中具有同音关系;
在所述预设知识图谱中存在所述同音语音文本时,向所述显示设备反馈所述基础语音文本对应的媒资资源和所述同音语音文本对应的媒资资源;
在所述预设知识图谱中不存在所述同音语音文本时,向所述显示设备反馈所述基础语音文本对应的媒资资源。
10.一种媒资资源搜索方法,所述方法应用于显示设备,其特征在于,包括:
将语音数据发送至服务器,以使在所述服务器中的预设知识图谱中,根据基础语音文本查找同音语音文本,其中所述基础语音文本为从所述语音数据中识别出的,所述基础语音文本在语言模型中匹配分值最高,所述同音语音文本和所述基础语音文本在所述预设知识图谱中具有同音关系;
在所述预设知识图谱中存在所述同音语音文本时,接收所述服务器反馈的,所述基础语音文本对应的媒资资源和所述同音语音文本对应的媒资资源;
在所述预设知识图谱中不存在所述同音语音文本时,接收所述服务器反馈的,所述基础语音文本对应的媒资资源。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110281021.5A CN113076427B (zh) | 2021-03-16 | 2021-03-16 | 一种媒资资源搜索方法、显示设备及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110281021.5A CN113076427B (zh) | 2021-03-16 | 2021-03-16 | 一种媒资资源搜索方法、显示设备及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113076427A true CN113076427A (zh) | 2021-07-06 |
CN113076427B CN113076427B (zh) | 2023-02-28 |
Family
ID=76612611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110281021.5A Active CN113076427B (zh) | 2021-03-16 | 2021-03-16 | 一种媒资资源搜索方法、显示设备及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113076427B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109885828A (zh) * | 2019-01-14 | 2019-06-14 | 平安科技(深圳)有限公司 | 基于语言模型的词语纠错方法、装置、计算机设备及介质 |
US20200168216A1 (en) * | 2018-11-27 | 2020-05-28 | Lg Electronics Inc. | Multimedia device for processing voice command |
CN111526402A (zh) * | 2020-05-06 | 2020-08-11 | 海信电子科技(武汉)有限公司 | 多屏显示设备的语音搜索视频资源的方法及显示设备 |
CN112242143A (zh) * | 2019-07-19 | 2021-01-19 | 北京字节跳动网络技术有限公司 | 一种语音交互方法、装置、终端设备及存储介质 |
CN112259102A (zh) * | 2020-10-29 | 2021-01-22 | 适享智能科技(苏州)有限公司 | 基于知识图谱的零售场景语音交互优化方法 |
-
2021
- 2021-03-16 CN CN202110281021.5A patent/CN113076427B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200168216A1 (en) * | 2018-11-27 | 2020-05-28 | Lg Electronics Inc. | Multimedia device for processing voice command |
CN109885828A (zh) * | 2019-01-14 | 2019-06-14 | 平安科技(深圳)有限公司 | 基于语言模型的词语纠错方法、装置、计算机设备及介质 |
CN112242143A (zh) * | 2019-07-19 | 2021-01-19 | 北京字节跳动网络技术有限公司 | 一种语音交互方法、装置、终端设备及存储介质 |
CN111526402A (zh) * | 2020-05-06 | 2020-08-11 | 海信电子科技(武汉)有限公司 | 多屏显示设备的语音搜索视频资源的方法及显示设备 |
CN112259102A (zh) * | 2020-10-29 | 2021-01-22 | 适享智能科技(苏州)有限公司 | 基于知识图谱的零售场景语音交互优化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113076427B (zh) | 2023-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021103398A1 (zh) | 一种智能电视以及服务器 | |
CN112163086B (zh) | 多意图的识别方法、显示设备 | |
CN112000820A (zh) | 一种媒资推荐方法及显示设备 | |
CN112885354B (zh) | 一种显示设备、服务器及基于语音的显示控制方法 | |
CN112182196A (zh) | 应用于多轮对话的服务设备及多轮对话方法 | |
CN111866568B (zh) | 一种显示设备、服务器及基于语音的视频集锦获取方法 | |
CN112804567A (zh) | 一种显示设备、服务器及视频推荐的方法 | |
CN111914134A (zh) | 一种关联推荐方法、智能设备及服务设备 | |
CN113938755A (zh) | 服务器、终端设备以及资源推荐方法 | |
CN113722542A (zh) | 视频推荐方法及显示设备 | |
CN113490057B (zh) | 显示设备和媒资推荐方法 | |
CN113593559B (zh) | 一种内容显示方法、显示设备及服务器 | |
CN113076427B (zh) | 一种媒资资源搜索方法、显示设备及服务器 | |
CN113038217A (zh) | 一种显示设备、服务器及应答语生成方法 | |
CN115273848A (zh) | 一种显示设备及显示设备的控制方法 | |
CN115270808A (zh) | 显示设备和语义理解方法 | |
CN113079400A (zh) | 显示设备、服务器及语音交互方法 | |
CN114627864A (zh) | 显示设备与语音交互方法 | |
CN112601116A (zh) | 一种显示设备及内容显示方法 | |
CN112885347A (zh) | 一种显示设备的语音控制方法、显示设备及服务器 | |
CN114155846A (zh) | 一种语义槽提取方法及显示设备 | |
CN115150673B (zh) | 显示设备及媒资展示方法 | |
CN113207042B (zh) | 一种媒资播放方法及显示设备 | |
CN113035194B (zh) | 一种语音控制方法、显示设备及服务器 | |
CN113849664A (zh) | 显示设备、服务器和媒资搜索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |