CN109255053B - 资源搜索方法、装置、终端、服务器、计算机可读存储介质 - Google Patents
资源搜索方法、装置、终端、服务器、计算机可读存储介质 Download PDFInfo
- Publication number
- CN109255053B CN109255053B CN201811076667.4A CN201811076667A CN109255053B CN 109255053 B CN109255053 B CN 109255053B CN 201811076667 A CN201811076667 A CN 201811076667A CN 109255053 B CN109255053 B CN 109255053B
- Authority
- CN
- China
- Prior art keywords
- age
- user
- candidate
- video
- videos
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种资源搜索方法和装置、终端、服务器、计算机可读存储介质。该方法包括:接收用户语音;根据所述用户语音确定检索词;根据所述用户语音识别与用户年龄相关的属性;确定与所述属性匹配的候选视频;根据检索词在候选视频中检索目标视频;输出目标视频。本发明对与用户年龄相关的属性预先配置了与该属性的年龄相适应的候选视频,那么在用户使用语音来搜索视频时,则可以通过对用户语音来识别与用户年龄相关的属性,进而将视频检索范围缩小至于该用户年龄相匹配的候选视频中,使得视频内容与用户年龄不符的视频不会被检索到。
Description
技术领域
本发明涉及资源搜索技术领域,特别是涉及一种资源搜索方法和装置、一种终端、一种服务器,以及一种计算机可读存储介质。
背景技术
随着终端设备(例如,智能电视/盒子、平板电脑、手机等)的发展和普及,越来越多的家庭使用终端设备来收看资源(例如视频、音频、图片等)。但是,目前的资源分级机制薄弱,使得有些并不适用于年龄较小的用户查看的资源,仍会被用户从资源库中搜索到,影响青少年的心理成长。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:如何使得用户检索的资源能够与其年龄相适应。
发明内容
本发明提供了一种资源搜索方法和装置、一种终端、一种服务器,以及一种计算机可读存储介质,以解决相关技术中无法使得用户检索的资源与该用户的年龄相适应的问题。
为了解决上述问题,根据本发明的第一方面,本发明公开了一种资源搜索方法,包括:
接收用户语音;
根据所述用户语音确定检索词;
根据所述用户语音识别与用户年龄相关的属性;
确定与所述属性匹配的候选视频;
根据所述检索词在所述候选视频中检索目标视频;
输出所述目标视频。
可选地,所述根据所述用户语音识别与用户年龄相关的属性,包括:
根据所述用户语音识别用户年龄类型;
所述确定与所述属性匹配的候选视频,包括:
确定与所述用户年龄类型匹配的候选视频。
可选地,所述根据所述用户语音识别与用户年龄相关的属性,包括:
根据所述用户语音识别用户年龄段;
所述确定与所述属性匹配的候选视频,包括:
确定与所述用户年龄段匹配的候选视频。
可选地,所述根据所述用户语音识别用户年龄段,包括:
提取所述用户语音的声纹特征;
将所述声纹特征输入至预先训练的年龄分段模型;
根据所述年龄分段模型,确定所述声纹特征对应的用户年龄段。
可选地,所述接收用户语音之前,所述方法还包括:
设置不同优先级的多个年龄段,其中,对于任意两个优先级的年龄段,优先级高的第一年龄段的最小年龄大于优先级低的第二年龄段的最大年龄;
为每个优先级的年龄段配置对应的候选视频,以生成年龄段与候选视频之间的对应关系,其中,所述多个年龄段中任意一个年龄段的候选视频包括多个视频,其中,所述多个视频具有分类标签,且所述分类标签与该年龄段相匹配;以及,为所述多个年龄段配置对应的年龄类型,以生成年龄类型与候选视频之间的对应关系;
当所述属性包括用户年龄段时,所述确定与所述属性匹配的候选视频,包括:在所述年龄段与候选视频之间的对应关系中查找与所述用户年龄段匹配的候选视频;和/或,当所述属性包括用户年龄类型时,所述确定与所述属性匹配的候选视频,包括:在所述年龄类型与候选视频之间的对应关系中查找与所述用户年龄段匹配的候选视频。
可选地,对于任意两个优先级的年龄段,优先级高的第一年龄段对应的候选视频还包括优先级低的第二年龄段对应的候选视频。
可选地,所述根据所述用户语音确定检索词,包括:
对所述用户语音进行语义分析,确定语义文本;
对所述语义文本作分词处理,得到至少一个分词;
根据所述至少一个分词,确定检索词。
根据本发明的第二方面,本发明公开了一种资源搜索方法,包括:
采集用户生物特征;
根据所述用户生物特征识别与用户年龄相关的属性;
确定与所述属性匹配的候选资源;
接收用户输入的检索词;
根据所述检索词在所述候选资源中检索目标资源;
输出所述目标资源。
可选地,所述根据所述用户生物特征识别与用户年龄相关的属性,包括:
根据所述用户生物特征识别用户年龄类型;
所述确定与所述属性匹配的候选资源,包括:
确定与所述用户年龄类型匹配的候选资源。
可选地,所述根据所述用户生物特征识别与用户年龄相关的属性,包括:
根据所述用户生物特征识别用户年龄段;
所述确定与所述属性匹配的候选资源,包括:
确定与所述用户年龄段匹配的候选资源。
可选地,所述用户生物特征包括以下至少之一:
人脸特征、声纹特征、指纹特征、虹膜特征。
可选地,所述接收用户语音之前,所述方法还包括:
设置不同优先级的多个年龄段,其中,对于任意两个优先级的年龄段,优先级高的第一年龄段的最小年龄大于优先级低的第二年龄段的最大年龄;
为每个优先级的年龄段配置对应的候选资源,以生成年龄段与候选资源之间的对应关系,其中,所述多个年龄段中任意一个年龄段的候选资源包括多个资源,其中,所述多个资源具有分类标签,且所述分类标签与该年龄段相匹配;以及,为所述多个年龄段配置对应的年龄类型,以生成年龄类型与候选资源之间的对应关系;
当所述属性包括用户年龄段时,所述确定与所述属性匹配的候选资源,包括:在所述年龄段与候选资源之间的对应关系中查找与所述用户年龄段匹配的候选资源;和/或,当所述属性包括用户年龄类型时,所述确定与所述属性匹配的候选资源,包括:在所述年龄类型与候选资源之间的对应关系中查找与所述用户年龄段匹配的候选资源。
可选地,对于任意两个优先级的年龄段,优先级高的第一年龄段对应的候选资源还包括优先级低的第二年龄段对应的候选资源。
根据本发明的第三方面,本发明还公开了一种资源搜索装置,包括:
接收模块,用于接收用户语音;
第一确定模块,用于根据所述用户语音确定检索词;
识别模块,用于根据所述用户语音识别与用户年龄相关的属性;
第二确定模块,用于确定与所述属性匹配的候选视频;
检索模块,用于根据所述检索词在所述候选视频中检索目标视频;
输出模块,用于输出所述目标视频。
可选地,所述识别模块,还用于根据所述用户语音识别用户年龄类型;
所述第二确定模块,还用于确定与所述用户年龄类型匹配的候选视频。
可选地,所述识别模块,还用于根据所述用户语音识别用户年龄段;
所述第二确定模块,还用于确定与所述用户年龄段匹配的候选视频。
可选地,所述识别模块包括:
提取子模块,用于提取所述用户语音的声纹特征;
输入子模块,用于将所述声纹特征输入至预先训练的年龄分段模型;
确定子模块,用于根据所述年龄分段模型,确定所述声纹特征对应的用户年龄段。
可选地,所述装置还包括:
第一设置模块,用于设置不同优先级的多个年龄段,其中,对于任意两个优先级的年龄段,优先级高的第一年龄段的最小年龄大于优先级低的第二年龄段的最大年龄;
第二设置模块,用于为每个优先级的年龄段配置对应的候选视频,以生成年龄段与候选视频之间的对应关系,其中,所述多个年龄段中任意一个年龄段的候选视频包括多个视频,其中,所述多个视频具有分类标签,且所述分类标签与该年龄段相匹配;
第三设置模块,用于为所述多个年龄段配置对应的年龄类型,以生成年龄类型与候选视频之间的对应关系;
所述第二确定模块包括:
第一查找子模块,用于当所述属性包括用户年龄段时,在所述年龄段与候选视频之间的对应关系中查找与所述用户年龄段匹配的候选视频;
和/或,
第二查找子模块,用于当所述属性包括用户年龄类型时,在所述年龄类型与候选视频之间的对应关系中查找与所述用户年龄段匹配的候选视频。
可选地,对于任意两个优先级的年龄段,优先级高的第一年龄段对应的候选视频还包括优先级低的第二年龄段对应的候选视频。
可选地,所述第一确定模块包括:
分析子模块,用于对所述用户语音进行语义分析,确定语义文本;
分词子模块,用于对所述语义文本作分词处理,得到至少一个分词;
分词确定子模块,用于根据所述至少一个分词,确定检索词。
根据本发明的第四方面,本发明还公开了一种资源搜索装置,包括:
采集模块,用于采集用户生物特征;
识别模块,用于根据所述用户生物特征识别与用户年龄相关的属性;
确定模块,用于确定与所述属性匹配的候选资源;
接收模块,用于接收用户输入的检索词;
检索模块,用于根据所述检索词在所述候选资源中检索目标资源;
输出模块,用于输出所述目标资源。
可选地,所述识别模块,还用于根据所述用户生物特征识别用户年龄类型;
所述确定模块,还用于确定与所述用户年龄类型匹配的候选资源。
可选地,所述识别模块,还用于根据所述用户生物特征识别用户年龄段;
所述确定模块,还用于确定与所述用户年龄段匹配的候选资源。
可选地,所述用户生物特征包括以下至少之一:
人脸特征、声纹特征、指纹特征、虹膜特征。
可选地,所述装置还包括:
第一设置模块,用于设置不同优先级的多个年龄段,其中,对于任意两个优先级的年龄段,优先级高的第一年龄段的最小年龄大于优先级低的第二年龄段的最大年龄;
第二设置模块,用于为每个优先级的年龄段配置对应的候选资源,以生成年龄段与候选资源之间的对应关系,其中,所述多个年龄段中任意一个年龄段的候选资源包括多个资源,其中,所述多个资源具有分类标签,且所述分类标签与该年龄段相匹配;
第三设置模块,用于为所述多个年龄段配置对应的年龄类型,以生成年龄类型与候选资源之间的对应关系;
所述确定模块包括:
第一确定子模块,用于当所述属性包括用户年龄段时,在所述年龄段与候选资源之间的对应关系中查找与所述用户年龄段匹配的候选资源;
和/或,
第二确定子模块,用于当所述属性包括用户年龄类型时,在所述年龄类型与候选资源之间的对应关系中查找与所述用户年龄段匹配的候选资源。
可选地,对于任意两个优先级的年龄段,优先级高的第一年龄段对应的候选资源还包括优先级低的第二年龄段对应的候选资源。
根据本发明的另一方面,本发明还公开了一种终端,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述第一方面中任一项所述的资源搜索方法的步骤。
根据本发明的另一方面,本发明还公开了一种服务器,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述第一方面中任一项所述的资源搜索方法的步骤。
根据本发明的另一方面,本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述的资源搜索方法中的步骤。
根据本发明的另一方面,本发明还公开了一种终端,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述第二方面中任一项所述的资源搜索方法的步骤。
根据本发明的另一方面,本发明还公开了一种服务器,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述第二方面中任一项所述的资源搜索方法的步骤。
根据本发明的另一方面,本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第二方面中任一项所述的资源搜索方法中的步骤。
与现有技术相比,本发明包括以下优点:
这样,本发明实施例考虑到不同年龄的用户查看视频需要与其年龄适应,因此对与用户年龄相关的属性预先配置了与该属性的年龄相适应的候选视频,那么在用户使用语音来搜索视频时,则可以通过对用户语音来识别与用户年龄相关的属性,进而将视频检索范围缩小至与该属性相匹配的候选视频中,而并非全部视频库,并从候选视频中检索目标视频并显示,使得视频内容与用户年龄不符的视频不会被检索到,相反,用户检索到的视频能够与该用户的年龄相适应,实现了视频的年龄分级搜索。
附图说明
图1是本发明的一种资源搜索方法实施例的步骤流程图;
图2是本发明的另一种资源搜索方法实施例的步骤流程图;
图3是本发明的一种资源搜索方法实施例的示意图;
图4是本发明的一种资源搜索方法实施例的步骤流程图;
图5是本发明的一种资源搜索装置实施例的结构框图;
图6是本发明的另一种资源搜索装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种资源搜索方法实施例的步骤流程图,其中,该方法可以应用于客户端(其中,客户端可以安装在任意终端设备上,该终端设备包括但不限于电视机、电脑、平板电脑、手机等),也可以应用于服务器,还可以同时应用于客户端以及服务器,即执行主体包括客户端以及服务器。该方法具体可以包括如下步骤:
步骤101,接收用户语音;
其中,当该方法应用于服务器时,用户在客户端侧发出用户语音(例如我想看大头儿子和小头爸爸),客户端接收到该用户语音后会转发给服务器,则本步骤中,服务器就可以从客户端接收到该用户语音。
当该方法应用于客户端时,则该步骤是由客户端接收用户发出的语音(例如我想看大头儿子和小头爸爸)。
当该方法应用于客户端和服务器时,本步骤则是由客户端接收来自用户的语音(例如我想看大头儿子和小头爸爸),并转发给服务器,然后,服务器接收来自客户端的用户语音。
步骤102,根据所述用户语音确定检索词;
其中,本发明实施例的方法可以采用例如图谱分类、机器学习等方法或未来开发的方法来确定用户语音中的检索词,所谓检索词,即对于视频搜索有用的查询词。
可选地,在一个实施例中,在执行步骤102时,可以通过对所述用户语音进行语义分析,确定语义文本;然后,对所述语义文本作分词处理,得到至少一个分词;最后,根据所述至少一个分词,确定检索词。
其中,在对所述用户语音进行语义分析,确定语义文本时,可以采用语义分析技术来对一段语音(即这里的用户语音)进行语义分析,从而确定该用户语音的语义,即语义文本。
继续以用户语音为上述“我想看大头儿子和小头爸爸”为例进行说明,对其进行语音分析,语义文本为“大头儿子和小头爸爸”。然后,可以采用分词方法来对语义文本进行分词,从而得到多个分词,这里分词可以包括“大头儿子”、“小头爸爸”、“大头儿子和小头爸爸”。其中,当对语义文本进行分词处理之后,得到的分词的数量为一个时,该分词即为检索词,当得到分词的数量为多个时,则可以根据得到的多个分词来确定检索词。
这里以分类图谱匹配的方法来确定多个分词中的一个或多个分词为检索词。例如语义文本为“孙俪演过的电视剧”,则分词包括孙俪、电视剧,那么可以在分类图谱中查找与实体演员中查找是否存在孙俪,如果存在,则“孙俪”为一个检索词,且实体中还存在电视剧,则“电视剧”也是一个检索词。
而具体在利用检索词检索目标视频的后续步骤中,则可以在分类图谱中查找与实体演员孙俪存在演绎的关系的所有电视剧实体(例如“玉观音”、“甄嬛传”、“血色浪漫”等等),然后,在候选视频中查找这些电视剧的视频,即为目标视频。
这样,本发明实施例通过对用户输入的语音进行语义分析的方式来确定用户想要表达的语义,并利用语义的分词来确定检索词,使用户能够无需使用虚拟键盘,使用语音搜索的方式就可以传达对目标视频的搜索请求,提升了视频的搜索效率,并简化了视频搜索步骤。
步骤103,根据所述用户语音识别与用户年龄相关的属性;
步骤104,确定与所述属性匹配的候选视频;
其中,可以确定与步骤103中识别到的与用户年龄相关的属性相匹配的候选视频。
其中,本发明实施例可以预先对与用户年龄相关的属性的不同取值,分别设置与其匹配的候选视频。
可选地,在一个实施例中,在执行步骤103时,可以根据所述用户语音识别用户年龄类型。
也就是说,本实施例中的与用户年龄相关的属性为用户年龄类型。
其中,用户年龄类型包括但不限于儿童类型、青年类型、中年类型、老年类型等。用户年龄类型是根据用户年龄而定义的用户类型。
相应的,在执行步骤104时,则可以确定与所述用户年龄类型匹配的候选视频。
其中,本发明实施例可以预先针对不同的用户年龄类型分别配置一个视频集合,使得每个用户年龄类型均对应有与其匹配的候选视频。
或者,本发明实施例也预先可以对不同年龄段分别配置与其年龄段相匹配的候选视频,并对每个年龄段设置用户年龄类型,从而使得每个用户年龄类型具有与之匹配的候选视频;
这样,本发明实施例通过对用户语音进行用户年龄类型的识别,从而可以将与该用户年龄类型匹配的候选视频输出,使得视频检索范围缩小至与该用户年龄类型相匹配的候选视频中,而并非全部视频库,能够使用户检索的视频资源与该用户的年龄类型相适应。
可选地,在另一个实施例中,在执行步骤103时,还可以根据所述用户语音识别用户年龄段。
也就是说,本实施例中的与用户年龄相关的属性为用户年龄段。
其中,用户年龄段可以分别为1岁~12岁、13岁~17岁、18岁~40岁、41岁以上等等,本步骤主要是依据用户语音来识别该用户的年龄所属的年龄段。当然,年龄段并不限于上述举例。
相应的,在执行步骤104时,则可以确定与所述用户年龄段匹配的候选视频。
其中,本发明实施例预先可以对不同年龄段分别配置与其年龄段相匹配的候选视频,从而使得每个用户年龄段具有与之匹配的候选视频。
这样,本发明实施例通过对用户语音进行用户年龄段的识别,从而可以将与该用户年龄段匹配的候选视频输出,使得视频检索范围缩小至与该用户年龄段相匹配的候选视频中,而并非全部视频库,能够使用户检索的视频资源与该用户的年龄所属的年龄段相适应。
需要说明的是,一种用户年龄类型可以包括多个用户年龄段,例如老年类型包括50岁~60岁,61岁以上;一个用户年龄段也可以包括多种用户年龄类型,例如18岁~40岁包括青年类型和中年类型。因此,本发明的用户年龄类型与用户年龄段之间的关系并不具体限制,可以灵活配置。
此外,对于与用户年龄类型匹配的视频集合,以及与用户年龄段匹配的视频集合,这两个视频集合之间可以存在视频交集、或无视频交集,或完全相同,本发明对此并不做具体限制。
可选地,在一个实施例中,在执行上述根据所述用户语音识别用户年龄段的步骤时,可以通过提取所述用户语音的声纹特征;然后将所述声纹特征输入至预先训练的年龄分段模型;最后,根据所述年龄分段模型,确定所述声纹特征对应的用户年龄段。
其中,本发明实施例可以预先训练年龄分段模型,其中,该年龄分段模型可以是任意一种神经网络模型,本发明对此并不限定。在预先训练时,训练样本包括不同年龄段的多组声纹样本,例如年龄段包括1岁~12岁、13岁~17岁、18岁~40岁、41岁以上这四个年龄段,其中,每个年龄段的声纹样本都包括年龄属于该年龄段范围内的多个用户的声纹样本。
那么利用这四组年龄段的声纹样本对该年龄分段模型进行训练,使其训练后能够对输入的任意一个用户的声纹特征进行年龄段的判别,使得该年龄分段模型可以输出该声纹特征所属的年龄段(即上述四个年龄段中的一个)。其中,这里的声纹样本,即为对用户的声音样本提取的声纹特征。
那么在本实施例中,由于年龄分段模型已经预先训练完成,因此,可以对请求搜索视频的用户的语音提取声纹特征,并将该声纹特征输入至该训练完成的年龄分段模型。其中,年龄分段模型通过对输入的声纹特征进行年龄段分类处理,可以将概率最高的年龄段输出,即所述声纹特征对应的用户年龄段。
这样,本发明实施例通过将请求检索视频的用户的声纹特征输入到预先训练的年龄分段模型,通过年龄分段模型对该声纹特征的分类处理,从而能够准确的确定出该用户的年龄属于预先配置的哪个年龄段,提升对用户年龄判断的准确度。
需要注意的是,本发明实施例预先配置的不同年龄段并不限于上述举例,而可以根据实际应用场景进行灵活配置。
另外,本发明根据用户语音来识别用户年龄段的方式也并不限于上述实施例的模型分类方式,还可以包括其他借助于其他对语音识别年龄段的方法,或未来开发的任意一种能够利用用户语音,或用户语音的声纹特征来确定用户年龄段的方法。
可选地,在一个实施例中,在执行上述根据所述用户语音识别用户年龄类型的步骤时,可以通过提取所述用户语音的声纹特征;然后将所述声纹特征输入至预先训练的年龄分类模型;最后,根据所述年龄分类模型,确定所述声纹特征对应的用户年龄类型。
其中,本发明实施例可以预先训练年龄分类模型,其中,该年龄分类模型可以是任意一种神经网络模型,本发明对此并不限定。在预先训练时,训练样本包括标注有不同年龄类型的多组声纹样本,例如年龄在1岁~12岁范围内的声纹样本标注“儿童类型”,年龄在13岁~17岁范围内的声纹样本标注“少年类型”,年龄在18岁~40岁范围内的声纹样本标注“成年类型”,年龄在41岁以上的声纹样本标注“中老年类型”,其中,每个用户年龄类型的声纹样本都包括年龄属于该年龄类型的多个用户的声纹样本。
那么利用这四组声纹样本对该年龄分类模型进行训练,使其训练后能够对输入的任意一个用户的声纹特征进行年龄类型的判别,使得该年龄分类模型可以输出该声纹特征所属的用户年龄类型(即上述四个用户年龄类型中的一个)。其中,这里的声纹样本,即为对用户的声音样本提取的声纹特征。
那么在本实施例中,由于年龄分类模型已经预先训练完成,因此,可以对请求搜索视频的用户的语音提取声纹特征,并将该声纹特征输入至该训练完成的年龄分类模型。其中,年龄分类模型通过对输入的声纹特征进行年龄段分类处理,可以将概率最高的用户年龄类型输出,即所述声纹特征对应的用户年龄类型。
这样,本发明实施例通过将请求检索视频的用户的声纹特征输入到预先训练的年龄分类模型,通过年龄分类模型对该声纹特征的分类处理,从而能够准确的确定出该用户的年龄属于预先配置的哪个用户年龄类型,提升对用户年龄判断的准确度。
需要注意的是,本发明实施例预先配置的不同用户年龄类型并不限于上述举例,且每个年龄类型所包括的年龄范围也不限于上述举例,而可以根据实际应用场景进行灵活配置。
另外,本发明根据用户语音来识别用户年龄类型的方式也并不限于上述实施例的模型分类方式,还可以包括其他借助于其他对语音识别年龄类型的方法,或未来开发的任意一种能够利用用户语音,或用户语音的声纹特征来确定用户年龄类型的方法。
步骤105,根据所述检索词在所述候选视频中检索目标视频;
例如,输入语音的用户的年龄为7岁,则经过步骤103可以确定该用户的用户年龄类型为儿童,那么步骤104就可以将视频内容与“儿童”相匹配的候选视频,确定为检索的视频范围1。
再如,输入语音的用户的年龄为7岁,则经过步骤103可以确定该用户的年龄的年龄段为1岁~12岁,那么步骤104就可以将视频内容与年龄段“1岁~12岁”相匹配的候选视频,确定为检索的视频范围2。
其中,既采用了用户年龄类型确定候选视频的方式,又采用了用户年龄段来确定候选视频的方式时,则本步骤中的候选视频为上述视频范围1和视频范围2的并集。
例如,该检索词为“大头儿子和小头爸爸”,那么本发明实施例的方法可以在确定的候选视频中查找片名、或别名为“大头儿子和小头爸爸”的目标视频。
步骤106,输出所述目标视频。
其中,当该方法应用于服务器时,则本步骤中由服务器将该目标视频输出至客户端。
当该方法应用于客户端时,则本步骤中由客户端输出目标视频,以便用户查看。
当方法应用于客户端以及服务器时,则本步骤中由服务器将目标视频输出至客户端,再由客户端将该目标视频输出,以便用户查看。
另外,需要说明的是,对于上述步骤102~步骤105,当本发明实施例的方法应用于服务器时,则上述步骤102~步骤105由服务器执行;当本发明实施例的方法应用于客户端时,则上述步骤102~步骤105由客户端执行;当本发明实施例的方法应用于客户端以及服务器时,则上述步骤102~步骤105也是由服务器执行。
这样,本发明实施例考虑到不同年龄的用户查看视频需要与其年龄适应,因此对与用户年龄相关的属性预先配置了与该属性的年龄相适应的候选视频,那么在用户使用语音来搜索视频时,则可以通过对用户语音来识别与用户年龄相关的属性,进而将视频检索范围缩小至与该属性相匹配的候选视频中,而并非全部视频库,并从候选视频中检索目标视频并显示,使得视频内容与用户年龄不符的视频不会被检索到,相反,用户检索到的视频能够与该用户的年龄相适应,实现了视频的年龄分级搜索。
那么在儿童使用语音进行资源搜索的场景下,本发明实施例的方法支持视频过滤,从而可以仅显示适合儿童观看的视频结果。
可选地,在一个实施例中,参照图2,在步骤101之前,根据本发明实施例的方法还可以包括:
步骤301,设置不同优先级的多个年龄段,其中,对于任意两个优先级的年龄段,优先级高的第一年龄段的最小年龄大于优先级低的第二年龄段的最大年龄;
也就是说,本发明在预先配置多个年龄段时,原则是不同年龄段之间不存在重叠的年龄。
而不同年龄段之间可以是年龄连续的,和/或年龄不连续的。
其中,当不同年龄段之间全部为年龄连续时,优先级由低到高的4个年龄段可以分别为1岁~12岁、13岁~17岁、18岁~40岁、41岁以上;
当不同年龄段之间全部为年龄不连续时,优先级由低到高的4个年龄段可以分别为1岁~12岁、14岁~17岁、19岁~40岁、42岁以上;
当不同年龄段之间包括年龄连续以及年龄不连续的情况时,优先级由低到高的4个年龄段可以分别为1岁~12岁、14岁~18岁、19岁~40岁、41岁以上;
当然,当不同年龄段之间包括年龄连续以及年龄不连续的情况时,年龄段的举例也不限于此,这里不再赘述。
步骤302,为每个优先级的年龄段配置对应的候选视频,以生成年龄段与候选视频之间的对应关系,其中,所述多个年龄段中任意一个年龄段的候选视频包括多个视频,其中,所述多个视频具有分类标签,且所述分类标签与该年龄段相匹配;
其中,对于不同优先级的多个年龄段而言,可以对多个年龄段中的每个年龄段分别设置候选视频,其中,每个年龄段的候选视频可以是一个视频集合,也可以是一个视频库(这个视频库不同于上述实施例中的整个视频库,而是从整个视频库中选出的一部分视频构成的库)。
这里以视频库为例进行说明。
本实施例中,在对每个年龄段设置视频库时,不同年龄段的视频库之间可以具有相同的视频,也可以完全不同。
目前已有视频库中的视频都可以具有分类标签,那么为了提升对不同年龄段配置候选视频的效率,可以参考整个视频库中各个视频的分类标签来对不同年龄段分别配置各自的候选视频。
因此,本发明实施例在对每个年龄段配置对应的候选视频时,可以参考整个视频库的多个分类标签,将多个视频配置给一个年龄段,其中,该多个视频所具有的分类标签与该年龄段相匹配。
所以,本发明实施例中所述多个年龄段中任意一个年龄段的候选视频包括多个视频,该多个视频所具有的分类标签与该年龄段相匹配。
具体而言,视频的分类标签与视频内容相关,分类标签可以包括但不限于儿童、言情、动漫、恐怖、动作、喜剧、旅游、时尚、养生等等。
在一个示例中,以优先级由低到高的4个年龄段分别为1岁~12岁、13岁~17岁、18岁~40岁、41岁以上为例进行说明。
可以从整个视频库中选择将分类标签为“儿童”的所有视频设置为与1岁~12岁年龄段相匹配的视频。即1岁~12岁年龄段的候选视频包括分类标签为“儿童”的多个视频。
可以从整个视频库中选择将分类标签为“动漫”、“言情”、“喜剧”的所有视频设置为与13岁~17岁年龄段相匹配的视频。
可以从整个视频库中选择将分类标签为“动作”、“恐怖”、“旅游”、“时尚”的所有视频作为与18岁~40岁年龄段相匹配的视频。
可以从整个视频库中选择将分类标签为“动作”、“恐怖”、“旅游”、“养生”的所有视频作为与40岁以上年龄段相匹配的视频。
这样,就对多个年龄段分别设置了不同的视频集合,其中,每个年龄段的视频集合包括多个视频,该多个视频的分类标签能够与该年龄段相匹配。
如上述举例也可以发现,在本发明实施例中,不同年龄段对应的候选视频之间可以包括分类标签相同的视频资源,例如18岁~40岁年龄段对应的候选视频和40岁以上年龄段对应的候选视频,这两组候选视频均包括分类标签为“动作”、“恐怖”、“旅游”的视频。
步骤303,为所述多个年龄段配置对应的年龄类型,以生成年龄类型与候选视频之间的对应关系。
其中,可以对上述4个年龄段1岁~12岁、13岁~17岁、18岁~40岁、41岁以上分别设置年龄类型,这里对1岁~12岁年龄段设置的年龄类型为儿童;对13岁~17岁年龄段设置的年龄类型为少年;对18岁~40岁年龄段设置的年龄类型为成年;对40岁以上年龄段设置的年龄类型为中老年。
那么由于步骤302已经对每个优先级的年龄段分别设置了候选视频,而本步骤又对每个年龄段分别设置了年龄类型,因此,可以生成年龄类型与候选视频之间的对应关系,使得每个年龄类型均具有与之匹配的候选视频。
需要说明的是,一个年龄类型可以对应一个或多个年龄段;而不同年龄类型之间也可以对应有相同的一个或多个年龄段,但是不同年龄类型对应的年龄段并不完全相同。
那么在一个实施例中,如果步骤103识别的与用户年龄相关的属性包括用户年龄段,那么在执行步骤104时,可以在步骤302中的所述年龄段与候选视频之间的对应关系中查找与识别到的所述用户年龄段相匹配的候选视频。
和/或,在另一个实施例中,如果步骤103识别的与用户年龄相关的属性包括用户年龄类型,那么在执行步骤104时,可以在步骤303中的所述年龄类型与候选视频之间的对应关系中查找与识别到的所述用户年龄类型相匹配的候选视频。
这样,本发明实施例在划分各个年龄段时,划分原则为不同年龄段之间不包含重复的年龄,从而可以较为准确的对各个年龄段设置分类标签与其年龄段相匹配的候选视频,避免某些年龄的用户搜索到与其年龄不匹配的视频资源,例如为了使1~12岁的用户的心里健康成长,其对应的候选视频不可以包括分类标签为“动作”、“恐怖”等不适宜其身心发展的视频。并且,对多个年龄段分别设置用户年龄类型,从而可以使每个用户年龄类型都对应有候选视频,从而能够在年龄为不同年龄类型或者属于不用年龄段的用户发起的视频搜索请求进行视频检索时,将视频搜索范围缩小为分类标签与该用户的年龄类型或年龄段相匹配的候选视频。
此外,目前的视频搜索方式主要采用虚拟键盘的方式,但是,有些年龄较小的用户群以及年龄较大的用户群以及文化程度有限的用户群并不会使用虚拟键盘,所以,通过语音搜索目标视频,能够便于不同用户群的视频搜索,简化视频搜索步骤。
可选地,在一个实施例中,在执行步骤302对每个优先级的年龄段设置候选视频,生成年龄段与候选视频之间的对应关系时,还可以使每个年龄段对应的候选视频不仅可以包含分类标签与该年龄段匹配的视频资源,还可以较低优先级的年龄段所对应的候选视频。
也就是说,对于上述年龄段与候选视频之间的对应关系中,任意两个优先级的年龄段,优先级高的第一年龄段对应的候选视频还包括优先级低的第二年龄段对应的候选视频。
继续以上述示例来举例:优先级由低到高的4个年龄段分别为1岁~12岁(优先级1)、13岁~17岁(优先级2)、18岁~40岁(优先级3)、41岁以上(优先级4)。
分类标签可以包括但不限于儿童、言情、动漫、恐怖、动作、喜剧、旅游、时尚等等。
可以从整个视频库中选择将分类标签为“儿童”的所有视频设置为与1岁~12岁年龄段相匹配的视频。即1岁~12岁年龄段的候选视频包括分类标签为“儿童”的多个视频。
可以从整个视频库中选择将分类标签为“动漫”、“言情”、“喜剧”以及“儿童”的所有视频设置为与13岁~17岁年龄段相匹配的视频。
其中,该优先级2的年龄段设置的候选视频不仅包括分类标签与该年龄段匹配的“动漫”、“言情”、“喜剧”的所有视频资源,还包括优先级1的年龄段的分类标签为“儿童”的所有视频资源。
可以从整个视频库中选择将分类标签为“动作”、“恐怖”、“旅游”、“时尚”、“动漫”、“言情”、“喜剧”以及“儿童”的所有视频设置为与18岁~40岁年龄段相匹配的视频。
其中,该优先级3的年龄段设置的候选视频不仅包括分类标签与该年龄段匹配的“动作”、“恐怖”、“旅游”、“时尚”的所有视频资源,还包括优先级1、优先级2的年龄段分别对应的候选视频。
可以从整个视频库中选择将分类标签为“动作”、“恐怖”、“旅游”、“养生”、“时尚”、“动漫”、“言情”、“喜剧”以及“儿童”的所有视频设置为与40岁以上年龄段相匹配的视频。
其中,该优先级4的年龄段设置的候选视频不仅包括分类标签与该年龄段匹配的“动作”、“恐怖”、“旅游”、“养生”的所有视频资源,还包括优先级1、优先级2、优先级3的年龄段分别对应的候选视频。
在本发明实施例中,对较高优先级的年龄段设置的候选视频中不仅包括分类标签与其年龄段匹配的视频资源,还可以包括较低优先级的年龄段对应的候选视频。由于优先级较高的年龄段的年龄更大,因此,可以对其扩大视频搜索范围,将年龄小于该年龄段的其他年龄段的视频搜索范围也加入至该年龄更大的用户的视频搜索范围内。这样,较高优先级的用户也可以帮助较低优先级的用户进行视频搜索,例如18岁的用户可以为其弟弟妹妹搜索儿童视频。
参照图3,示出了本发明的一种资源搜索方法实施例的示意图。
如图3所示,当用户想要搜索视频时,可以对智能电视进行语音控制,发出检索视频的语音对应的文本为“我想看大头儿子和小头爸爸”,那么智能电视可以接收到用户语音;
智能电视可以对该用户语音进行以下两种操作:
操作一:对用户语音提取用于检索视频的检索词,这里为“大头儿子和小头爸爸”。
操作二,对用户语音进行用户年龄类型的分类。
例如可以将对用户语音提取声纹特征,并将声纹特征输入至预先经过训练的预设年龄分类模型,从而确定出发出该用户语音的用户的年龄所属于的用户年龄类型;
对于操作二的结果(即,识别到的用户年龄类型,例如儿童),智能电视可以确定视频库中与该用户年龄类型(即儿童)相匹配的候选视频。
最后,利用操作一得到的检索词,以及利用操作二的后续步骤得到的候选视频信息(例如候选视频的标识),来视频内容与儿童类型匹配的候选视频中查找与检索词“大头儿子和小头爸爸”匹配的目标视频并播放或输出目标视频给该用户。
相反,如果用户发出检索视频的语音对应的文本为“我想看死神来了”,则检索词为“死神来了”,经过用户年龄类型的分类确定该用户为儿童,那么由于本发明实施例预先设置的视频内容与儿童类型匹配的候选视频中并不包括“死神来了”的相关视频,因此,虽然视频库中具有名称为“死神来了”的相关影片,但是由于该影片内容不适宜儿童观看,所以,儿童在检索视频时,并不会检索到该“死神来了”的相关影片,这里,输出的目标视频不会包括“死神来了”的相关影片。
这样,本发明实施例通过对接收到的用户语音提取检索词,以及对用户语音进行用户年龄类型的分类,从而确定用户年龄类型,并在与该用户年龄类型匹配的候选视频中查找与检索词相关的目标视频,从而将视频检索范围缩小到与用户年龄类型匹配的范围之内,不会将视频内容与用户年龄类型不适合不匹配的视频内容检索出来。
参照图4,示出了本发明的一种资源搜索方法实施例的步骤流程图,其中,该方法可以应用于客户端(其中,客户端可以安装在任意终端设备上,该终端设备包括但不限于电视机、电脑、平板电脑、手机等),也可以应用于服务器,还可以同时应用于客户端以及服务器,即执行主体包括客户端以及服务器。该方法具体可以包括如下步骤:
步骤501,采集用户生物特征;
其中,可以对输入检索词的用户采集生物特征。
其中,所述用户生物特征包括以下至少之一:
人脸特征、声纹特征、指纹特征、虹膜特征。
步骤502,根据所述用户生物特征识别与用户年龄相关的属性;
步骤503,确定与所述属性匹配的候选资源;
其中,可以确定与步骤502中识别到的与用户年龄相关的属性相匹配的候选资源。
其中,本发明实施例可以预先对与用户年龄相关的属性的不同取值,分别设置与其匹配的候选资源。
可选地,在一个实施例中,在执行步骤502时,可以根据所述用户生物特征识别用户年龄类型。
也就是说,本实施例中的与用户年龄相关的属性为用户年龄类型。
其中,用户年龄类型包括但不限于儿童类型、青年类型、中年类型、老年类型等。用户年龄类型是根据用户年龄而定义的用户类型。
相应的,在执行步骤503时,则可以确定与所述用户年龄类型匹配的候选资源。
其中,本发明实施例可以预先针对不同的用户年龄类型分别配置一个资源集合,使得每个用户年龄类型均对应有与其匹配的候选资源。
或者,本发明实施例也预先可以对不同年龄段分别配置与其年龄段相匹配的候选资源,并对每个年龄段设置用户年龄类型,从而使得每个用户年龄类型具有与之匹配的候选资源;
这样,本发明实施例通过对用户生物特征进行用户年龄类型的识别,从而可以将与该用户年龄类型匹配的候选资源输出,使得资源检索范围缩小至与该用户年龄类型相匹配的候选资源中,而并非全部资源库,能够使用户检索的资源与该用户的年龄类型相适应。
可选地,在另一个实施例中,在执行步骤502时,还可以根据所述用户生物特征识别用户年龄段。
也就是说,本实施例中的与用户年龄相关的属性为用户年龄段。
其中,用户年龄段可以分别为1岁~12岁、13岁~17岁、18岁~40岁、41岁以上等等,本步骤主要是依据用户生物特征来识别该用户的年龄所属的年龄段。当然,年龄段并不限于上述举例。
相应的,在执行步骤503时,则可以确定与所述用户年龄段匹配的候选资源。
其中,本发明实施例预先可以对不同年龄段分别配置与其年龄段相匹配的候选资源,从而使得每个用户年龄段具有与之匹配的候选资源。
这样,本发明实施例通过对用户生物特征进行用户年龄段的识别,从而可以将与该用户年龄段匹配的候选资源输出,使得资源检索范围缩小至与该用户年龄段相匹配的候选资源中,而并非全部资源库,能够使用户检索的资源与该用户的年龄所属的年龄段相适应。
需要说明的是,一种用户年龄类型可以包括多个用户年龄段,例如老年类型包括50岁~60岁,61岁以上;一个用户年龄段也可以包括多种用户年龄类型,例如18岁~40岁包括青年类型和中年类型。因此,本发明的用户年龄类型与用户年龄段之间的关系并不具体限制,可以灵活配置。
此外,对于与用户年龄类型匹配的资源集合,以及与用户年龄段匹配的资源集合,这两个资源集合之间可以存在资源交集、或无资源交集,或完全相同,本发明对此并不做具体限制。
在执行上述根据用户生物特征识别用户年龄段的步骤时,
可选地,当用户生物特征包括声纹特征时,则用户输入检索词的方式为语音,那么可以根据上述方法实施例列举的根据用户语音识别用户年龄段的具体方法来实现,这里不再赘述。
可选地,当用户生物特征包括人脸特征时,则可以将采集的人脸特征输入至预先训练的年龄分段模型;然后,根据所述年龄分段模型,确定所述人脸特征对应的用户年龄段。其中,这里的年龄分段模型在预先训练时的训练样本为人脸特征样本,并非上述实施例的声纹样本,因此,这里训练后的年龄分段模型仍旧可以对输入的人脸特征识别用户年龄段。
可选地,当用户生物特征包括指纹特征,和/或,虹膜特征时,则可以利用公安系统来确定指纹特征、虹膜特征对应的用户的年龄,从而确定用户年龄段,最终确定与用户年龄段匹配的用户年龄类型。
这样,本发明实施例通过采集进行资源搜索的用户的生物特征,从而可以确定其用户年龄段,对用户的年龄的判断较为准确。
在执行上述根据用户生物特征识别用户年龄类型的步骤时,
可选地,当用户生物特征包括声纹特征时,则用户输入检索词的方式为语音,可以根据上述实施例列举的根据所述用户语音识别用户年龄类型的具体方法来实现所述根据用户生物特征识别用户年龄类型的步骤,这里不再赘述。
可选地,当用户生物特征包括人脸特征时,则可以将采集的人脸特征输入至预先训练的年龄分类模型;然后,根据所述年龄分类模型,确定所述人脸特征对应的用户年龄类型。其中,这里的年龄分类模型在预先训练时的训练样本为人脸特征样本,并非上述实施例的声纹样本,因此,这里训练后的年龄分类模型仍旧可以对输入的人脸特征识别用户年龄类型。
可选地,当用户生物特征包括指纹特征,和/或,虹膜特征时,则可以利用公安系统来确定指纹特征、虹膜特征对应的用户的年龄,从而确定用户年龄段,最终确定与用户年龄段匹配的用户年龄类型。
这样,本发明实施例通过采集进行资源搜索的用户的生物特征,从而可以确定其用户年龄类型,对用户的年龄类型的判断较为准确。
步骤504,接收用户输入的检索词;
其中,用户输入的检索词的方式可以是语音输入、文本输入或者其他操作方式的输入。
当用户采用语音输入的方式时,则本发明实施例的方法可以接收用户语音,然后根据用户语音确定检索词。具体实现可以参照上述实施例的步骤101和步骤102,这里不再赘述。
当用户采用文本输入的方式时,则根据本发明实施例的方法可以接收用户输入的文本,然后根据接收的文本确定检索词。
具体而言,可以对接收的文本做语义分析,确定语义文本;然后对语义文本作分词处理,得到至少一个分词;最后,根据所述至少一个分词,确定检索词。具体操作详见上述实施例的步骤102的详细实施例,这里不再赘述。
需要说明的是,由于本发明实施例的方法是对资源的检索,因此,该资源并不限于视频,还可以包括音频、文档(例如小说)、图片等等。那么这里确定的检索词则是对于资源搜索有用的查询词。
步骤505,根据所述检索词在所述候选资源中检索目标资源;
步骤506,输出所述目标资源。
这样,本发明实施例考虑到不同年龄的用户查看资源需要与其年龄适应,因此对与用户年龄相关的属性预先配置了与该属性的年龄相适应的候选资源,那么在用户使用语音来搜索资源时,则可以通过对用户语音来识别与用户年龄相关的属性,进而将资源检索范围缩小至与该属性相匹配的候选资源中,而并非全部资源库,并从候选资源中检索目标资源并显示,使得资源内容与用户年龄不符的资源不会被检索到,相反,用户检索到的资源能够与该用户的年龄相适应,实现了资源的年龄分级搜索。
可选地,在步骤501之前,根据本发明实施例的方法还包括:首先,设置不同优先级的多个年龄段,其中,对于任意两个优先级的年龄段,优先级高的第一年龄段的最小年龄大于优先级低的第二年龄段的最大年龄;然后,为每个优先级的年龄段配置对应的候选资源,以生成年龄段与候选资源之间的对应关系,其中,所述多个年龄段中任意一个年龄段的候选资源包括多个资源,其中,所述多个资源具有分类标签,且所述分类标签与该年龄段相匹配;以及,为所述多个年龄段配置对应的年龄类型,以生成年龄类型与候选资源之间的对应关系。
当所述属性包括用户年龄段时,那么在执行步骤503时,则在所述年龄段与候选资源之间的对应关系中查找与所述用户年龄段匹配的候选资源;
当所述属性包括用户年龄类型时,那么在执行步骤503时,在所述年龄类型与候选资源之间的对应关系中查找与所述用户年龄段匹配的候选资源。
本实施例的具体实现可以参照上述资源搜索方法实施例的图2实施例,区别在于图2实施例搜索的是视频资源,而本发明实施例搜索的是任意类型的资源,因此,这里不再赘述。
这样,本发明实施例在划分各个年龄段时,划分原则为不同年龄段之间不包含重复的年龄,从而可以较为准确的对各个年龄段设置分类标签与其年龄段相匹配的候选资源,避免某些年龄的用户搜索到与其年龄不匹配的资源,例如为了使1~12岁的用户的心里健康成长,其对应的候选资源不可以包括分类标签为“动作”、“恐怖”等不适宜其身心发展的资源。并且,对多个年龄段分别设置用户年龄类型,从而可以使每个用户年龄类型都对应有候选资源,从而能够在年龄为不同年龄类型的用户发起的资源搜索请求进行资源检索时,将资源搜索范围缩小为分类标签与该用户的年龄类型相匹配的候选资源。
可选地,在一个实施例中,对于任意两个优先级的年龄段,优先级高的第一年龄段对应的候选资源还包括优先级低的第二年龄段对应的候选资源。
本实施例的具体原理可以参照上述资源搜索方法实施例的步骤302的具体实施例,这里不再赘述。
在本发明实施例中,对较高优先级的年龄段设置的候选资源中不仅包括分类标签与其年龄段相匹配的资源,还可以包括较低优先级的年龄段对应的候选资源。由于优先级较高的年龄段的年龄更大,因此,可以对其扩大资源搜索范围,将年龄小于该年龄段的其他年龄段的资源搜索范围也加入至该年龄更大的用户的资源搜索范围内。这样,较高优先级的用户也可以帮助较低优先级的用户进行资源搜索,例如18岁的用户可以为其弟弟妹妹搜索儿童资源。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图5,示出了本发明一种资源搜索装置实施例的结构框图,具体可以包括如下模块:
接收模块601,用于接收用户语音;
第一确定模块602,用于根据所述用户语音确定检索词;
识别模块603,用于根据所述用户语音识别与用户年龄相关的属性;
第二确定模块604,用于确定与所述属性匹配的候选视频;
检索模块605,用于根据所述检索词在所述候选视频中检索目标视频;
输出模块606,用于输出所述目标视频。
可选地,所述识别模块603,还用于根据所述用户语音识别用户年龄类型;所述第二确定模块604,还用于确定与所述用户年龄类型匹配的候选视频。
可选地,所述识别模块603,还用于根据所述用户语音识别用户年龄段;所述第二确定模块604,还用于确定与所述用户年龄段匹配的候选视频。
可选地,所述识别模块603包括:
提取子模块,用于提取所述用户语音的声纹特征;
输入子模块,用于将所述声纹特征输入至预先训练的年龄分段模型;
确定子模块,用于根据所述年龄分段模型,确定所述声纹特征对应的用户年龄段。
可选地,所述装置还包括:
第一设置模块,用于设置不同优先级的多个年龄段,其中,对于任意两个优先级的年龄段,优先级高的第一年龄段的最小年龄大于优先级低的第二年龄段的最大年龄;
第二设置模块,用于为每个优先级的年龄段配置对应的候选视频,以生成年龄段与候选视频之间的对应关系,其中,所述多个年龄段中任意一个年龄段的候选视频包括多个视频,其中,所述多个视频具有分类标签,且所述分类标签与该年龄段相匹配;
第三设置模块,用于为所述多个年龄段配置对应的年龄类型,以生成年龄类型与候选视频之间的对应关系;
所述第二确定模块604包括:
第一查找子模块,用于当所述属性包括用户年龄段时,在所述年龄段与候选视频之间的对应关系中查找与所述用户年龄段匹配的候选视频;
和/或,
第二查找子模块,用于当所述属性包括用户年龄类型时,在所述年龄类型与候选视频之间的对应关系中查找与所述用户年龄段匹配的候选视频。
可选地,对于任意两个优先级的年龄段,优先级高的第一年龄段对应的候选视频还包括优先级低的第二年龄段对应的候选视频。
可选地,所述第一确定模块602包括:
分析子模块,用于对所述用户语音进行语义分析,确定语义文本;
分词子模块,用于对所述语义文本作分词处理,得到至少一个分词;
分词确定子模块,用于根据所述至少一个分词,确定检索词。
这样,本发明实施例考虑到不同年龄的用户查看视频需要与其年龄适应,因此对与用户年龄相关的属性预先配置了与该属性的年龄相适应的候选视频,那么在用户使用语音来搜索视频时,则可以通过对用户语音来识别与用户年龄相关的属性,进而将视频检索范围缩小至与该属性相匹配的候选视频中,而并非全部视频库,并从候选视频中检索目标视频并显示,使得视频内容与用户年龄不符的视频不会被检索到,相反,用户检索到的视频能够与该用户的年龄相适应,实现了视频的年龄分级搜索。
对于资源搜索装置实施例而言,由于其与资源搜索方法实施例基本相似,所以描述的比较简单,相关之处参见图1至图3方法实施例以及与图1至图3方法实施例相关的方法实施例的部分说明即可。
参照图6,示出了本发明一种资源搜索装置实施例的结构框图,具体可以包括如下模块:
采集模块701,用于采集用户生物特征;
识别模块702,用于根据所述用户生物特征识别与用户年龄相关的属性;
确定模块703,用于确定与所述属性匹配的候选资源;
接收模块704,用于接收用户输入的检索词;
检索模块705,用于根据所述检索词在所述候选资源中检索目标资源;
输出模块706,用于输出所述目标资源。
可选地,所述识别模块702,还用于根据所述用户生物特征识别用户年龄类型;所述确定模块703,还用于确定与所述用户年龄类型匹配的候选资源。
可选地,所述识别模块702,还用于根据所述用户生物特征识别用户年龄段;所述确定模块703,还用于确定与所述用户年龄段匹配的候选资源。
可选地,所述用户生物特征包括以下至少之一:
人脸特征、声纹特征、指纹特征、虹膜特征。
可选地,所述装置还包括:
第一设置模块,用于设置不同优先级的多个年龄段,其中,对于任意两个优先级的年龄段,优先级高的第一年龄段的最小年龄大于优先级低的第二年龄段的最大年龄;
第二设置模块,用于为每个优先级的年龄段配置对应的候选资源,以生成年龄段与候选资源之间的对应关系,其中,所述多个年龄段中任意一个年龄段的候选资源包括多个资源,其中,所述多个资源具有分类标签,且所述分类标签与该年龄段相匹配;
第三设置模块,用于为所述多个年龄段配置对应的年龄类型,以生成年龄类型与候选资源之间的对应关系;
所述确定模块703包括:
第一确定子模块,用于当所述属性包括用户年龄段时,在所述年龄段与候选资源之间的对应关系中查找与所述用户年龄段匹配的候选资源;
和/或,
第二确定子模块,用于当所述属性包括用户年龄类型时,在所述年龄类型与候选资源之间的对应关系中查找与所述用户年龄段匹配的候选资源。
可选地,对于任意两个优先级的年龄段,优先级高的第一年龄段对应的候选资源还包括优先级低的第二年龄段对应的候选资源。
这样,本发明实施例考虑到不同年龄的用户查看资源需要与其年龄适应,因此对与用户年龄相关的属性预先配置了与该属性的年龄相适应的候选资源,那么在用户使用语音来搜索资源时,则可以通过对用户语音来识别与用户年龄相关的属性,进而将资源检索范围缩小至与该属性相匹配的候选资源中,而并非全部资源库,并从候选资源中检索目标资源并显示,使得资源内容与用户年龄不符的资源不会被检索到,相反,用户检索到的资源能够与该用户的年龄相适应,实现了资源的年龄分级搜索。
对于资源搜索装置实施例而言,由于其与资源搜索方法实施例基本相似,所以描述的比较简单,相关之处参见图4方法实施例以及与图4方法实施例相关的方法实施例的部分说明即可。
本发明实施例还提供了一种终端,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述任意一个实施例(图1至图3方法实施例以及与图1至图3方法实施例相关的方法实施例中的任意一个实施例)所述的资源搜索方法的步骤。
本发明实施例还提供了一种服务器,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述任意一个实施例(图1至图3方法实施例以及与图1至图3方法实施例相关的方法实施例中的任意一个实施例)所述的资源搜索方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一个实施例(图1至图3方法实施例以及与图1至图3方法实施例相关的方法实施例中的任意一个实施例)所述的资源搜索方法中的步骤。
本发明实施例还提供了一种终端,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述任意一个实施例(图4方法实施例以及与图4方法实施例相关的方法实施例中的任意一个实施例)所述的资源搜索方法的步骤。
本发明实施例还提供了一种服务器,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述任意一个实施例(图4方法实施例以及与图4方法实施例相关的方法实施例中的任意一个实施例)所述的资源搜索方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一个实施例(图4方法实施例以及与图4方法实施例相关的方法实施例中的任意一个实施例)所述的资源搜索方法中的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种资源搜索方法和装置、一种终端、一种服务器以及一种计算机可读存储介质,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (13)
1.一种资源搜索方法,其特征在于,包括:
设置不同优先级的多个年龄段,其中,对于任意两个优先级的年龄段,优先级高的第一年龄段的最小年龄大于优先级低的第二年龄段的最大年龄;
为每个优先级的年龄段配置对应的候选视频;其中,对于任意两个优先级的年龄段,优先级高的第一年龄段对应的候选视频还包括优先级低的第二年龄段对应的候选视频;
在儿童使用语音进行资源搜索的场景下,接收用户语音,所述用户的年龄类型为儿童类型;
根据所述用户语音确定检索词;
根据所述用户语音识别与用户年龄相关的属性,其中,所述用户年龄相关的属性是通过所述用户语音的声纹特征确定的用户年龄段;
确定与所述属性匹配的所述候选视频;
根据所述检索词在所述候选视频中检索目标视频;
输出所述目标视频;
其中,当所述检索词所对应的目标视频不存在于所述候选视频中时,将无法检索到所述目标视频。
2.根据权利要求1所述的方法,其特征在于,
所述根据所述用户语音识别与用户年龄相关的属性,包括:
根据所述用户语音识别用户年龄类型;
所述确定与所述属性匹配的候选视频,包括:
确定与所述用户年龄类型匹配的候选视频。
3.根据权利要求1所述的方法,其特征在于,
所述根据所述用户语音识别与用户年龄相关的属性,包括:
根据所述用户语音识别用户年龄段;
所述确定与所述属性匹配的候选视频,包括:
确定与所述用户年龄段匹配的候选视频。
4.根据权利要求3所述的方法,其特征在于,所述根据所述用户语音识别用户年龄段,包括:
提取所述用户语音的声纹特征;
将所述声纹特征输入至预先训练的年龄分段模型;
根据所述年龄分段模型,确定所述声纹特征对应的用户年龄段。
5.根据权利要求1所述的方法,其特征在于,所述接收用户语音之前,所述方法还包括:
生成年龄段与候选视频之间的对应关系,其中,所述多个年龄段中任意一个年龄段的候选视频包括多个视频,其中,所述多个视频具有分类标签,且所述分类标签与该年龄段相匹配;以及,为所述多个年龄段配置对应的年龄类型,以生成年龄类型与候选视频之间的对应关系;
当所述属性包括用户年龄段时,所述确定与所述属性匹配的候选视频,包括:在所述年龄段与候选视频之间的对应关系中查找与所述用户年龄段匹配的候选视频;和/或,当所述属性包括用户年龄类型时,所述确定与所述属性匹配的候选视频,包括:在所述年龄类型与候选视频之间的对应关系中查找与所述用户年龄段匹配的候选视频。
6.根据权利要求1所述的方法,其特征在于,所述根据所述用户语音确定检索词,包括:
对所述用户语音进行语义分析,确定语义文本;
对所述语义文本作分词处理,得到至少一个分词;
根据所述至少一个分词,确定检索词。
7.一种资源搜索装置,其特征在于,包括:
第一设置模块,用于设置不同优先级的多个年龄段,其中,对于任意两个优先级的年龄段,优先级高的第一年龄段的最小年龄大于优先级低的第二年龄段的最大年龄;
第二设置模块,用于为每个优先级的年龄段配置对应的候选视频;其中,对于任意两个优先级的年龄段,优先级高的第一年龄段对应的候选视频还包括优先级低的第二年龄段对应的候选视频;
接收模块,用于在儿童使用语音进行资源搜索的场景下,接收用户语音,所述用户的年龄类型为儿童类型;
第一确定模块,用于根据所述用户语音确定检索词;
识别模块,用于根据所述用户语音识别与用户年龄相关的属性,其中,所述用户年龄相关的属性是通过所述用户语音的声纹特征确定的用户年龄段;
第二确定模块,用于确定与所述属性匹配的所述候选视频;
检索模块,用于根据所述检索词在所述候选视频中检索目标视频;
输出模块,用于输出所述目标视频;其中,当所述检索词所对应的目标视频不存在于所述候选视频中时,将无法检索到所述目标视频。
8.根据权利要求7所述的装置,其特征在于,
所述识别模块,还用于根据所述用户语音识别用户年龄类型;
所述第二确定模块,还用于确定与所述用户年龄类型匹配的候选视频。
9.根据权利要求7所述的装置,其特征在于,
所述识别模块,还用于根据所述用户语音识别用户年龄段;
所述第二确定模块,还用于确定与所述用户年龄段匹配的候选视频。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二设置模块,还用于生成年龄段与候选视频之间的对应关系,其中,所述多个年龄段中任意一个年龄段的候选视频包括多个视频,其中,所述多个视频具有分类标签,且所述分类标签与该年龄段相匹配;
第三设置模块,用于为所述多个年龄段配置对应的年龄类型,以生成年龄类型与候选视频之间的对应关系;
所述第二确定模块包括:
第一查找子模块,用于当所述属性包括用户年龄段时,在所述年龄段与候选视频之间的对应关系中查找与所述用户年龄段匹配的候选视频;
和/或,
第二查找子模块,用于当所述属性包括用户年龄类型时,在所述年龄类型与候选视频之间的对应关系中查找与所述用户年龄段匹配的候选视频。
11.一种终端,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的资源搜索方法的步骤。
12.一种服务器,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的资源搜索方法的步骤。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的资源搜索方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811076667.4A CN109255053B (zh) | 2018-09-14 | 2018-09-14 | 资源搜索方法、装置、终端、服务器、计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811076667.4A CN109255053B (zh) | 2018-09-14 | 2018-09-14 | 资源搜索方法、装置、终端、服务器、计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109255053A CN109255053A (zh) | 2019-01-22 |
CN109255053B true CN109255053B (zh) | 2021-08-20 |
Family
ID=65048429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811076667.4A Active CN109255053B (zh) | 2018-09-14 | 2018-09-14 | 资源搜索方法、装置、终端、服务器、计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109255053B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110047493A (zh) * | 2019-03-13 | 2019-07-23 | 深圳市酷开网络科技有限公司 | 基于声纹识别优先级的控制方法、装置及存储介质 |
CN110046305A (zh) * | 2019-04-23 | 2019-07-23 | 江西财经大学 | 一种人工智能深度学习的方法 |
CN113077790B (zh) * | 2019-12-17 | 2023-05-26 | 阿里巴巴集团控股有限公司 | 多语言配置方法、多语音交互方法、装置及电子设备 |
CN113495976A (zh) * | 2020-04-03 | 2021-10-12 | 百度在线网络技术(北京)有限公司 | 内容显示方法、装置、设备以及存储介质 |
CN112333550B (zh) * | 2020-06-19 | 2024-01-19 | 深圳Tcl新技术有限公司 | 节目查询方法、装置、设备及计算机存储介质 |
CN111862947A (zh) * | 2020-06-30 | 2020-10-30 | 百度在线网络技术(北京)有限公司 | 用于控制智能设备的方法、装置、电子设备和计算机存储介质 |
CN111782878B (zh) * | 2020-07-06 | 2023-09-19 | 聚好看科技股份有限公司 | 服务器、显示设备及其视频搜索排序方法 |
CN112437333B (zh) * | 2020-11-10 | 2024-02-06 | 深圳Tcl新技术有限公司 | 节目播放方法、装置、终端设备以及存储介质 |
CN115269889A (zh) * | 2021-04-30 | 2022-11-01 | 北京字跳网络技术有限公司 | 剪辑模板搜索方法及装置 |
CN113254708A (zh) * | 2021-06-28 | 2021-08-13 | 北京乐学帮网络技术有限公司 | 一种视频搜索方法、装置、计算机设备及存储介质 |
CN115695860A (zh) * | 2021-07-21 | 2023-02-03 | 华为技术有限公司 | 一种推荐视频片段的方法、电子设备及服务器 |
CN113596602A (zh) * | 2021-07-28 | 2021-11-02 | 深圳创维-Rgb电子有限公司 | 智能匹配方法、电视和计算机可读存储介质 |
CN116055818A (zh) * | 2022-12-22 | 2023-05-02 | 北京奇艺世纪科技有限公司 | 视频播放方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105677787A (zh) * | 2015-12-29 | 2016-06-15 | 广州神马移动信息科技有限公司 | 信息搜索装置及信息搜索方法 |
CN105959806A (zh) * | 2016-05-25 | 2016-09-21 | 乐视控股(北京)有限公司 | 节目推荐方法及装置 |
CN107483723A (zh) * | 2017-07-31 | 2017-12-15 | 广东欧珀移动通信有限公司 | 移动终端及其操作过程记录方法、计算机可读存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140067935A1 (en) * | 2012-08-31 | 2014-03-06 | Philip Hewinson | Movie finding |
CN107704816A (zh) * | 2017-09-27 | 2018-02-16 | 珠海格力电器股份有限公司 | 食物的蒸煮方法及装置 |
CN107622573B (zh) * | 2017-10-26 | 2023-07-14 | 衢州龙瀚计算机科技有限公司 | 一种消费权限自动识别与控制的售货机及其售货方法 |
-
2018
- 2018-09-14 CN CN201811076667.4A patent/CN109255053B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105677787A (zh) * | 2015-12-29 | 2016-06-15 | 广州神马移动信息科技有限公司 | 信息搜索装置及信息搜索方法 |
CN105959806A (zh) * | 2016-05-25 | 2016-09-21 | 乐视控股(北京)有限公司 | 节目推荐方法及装置 |
CN107483723A (zh) * | 2017-07-31 | 2017-12-15 | 广东欧珀移动通信有限公司 | 移动终端及其操作过程记录方法、计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109255053A (zh) | 2019-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109255053B (zh) | 资源搜索方法、装置、终端、服务器、计算机可读存储介质 | |
US10965999B2 (en) | Systems and methods for multimodal multilabel tagging of video | |
US9449271B2 (en) | Classifying resources using a deep network | |
CN106227815B (zh) | 一种多模态线索的个性化应用程序功能推荐方法及其系统 | |
US20190377956A1 (en) | Method and apparatus for processing video | |
TWI553494B (zh) | 基於多模態融合之智能高容錯視頻識別系統及其識別方法 | |
US8930288B2 (en) | Learning tags for video annotation using latent subtags | |
US10032465B2 (en) | Systems and methods for manipulating electronic content based on speech recognition | |
US20150074112A1 (en) | Multimedia Question Answering System and Method | |
US20150255066A1 (en) | Metadata extraction of non-transcribed video and audio streams | |
US8126897B2 (en) | Unified inverted index for video passage retrieval | |
US20150019206A1 (en) | Metadata extraction of non-transcribed video and audio streams | |
WO2019137391A1 (zh) | 对视频进行分类匹配的方法、装置和挑选引擎 | |
WO2015188719A1 (zh) | 结构化数据与图片的关联方法与关联装置 | |
KR102334236B1 (ko) | 음성 변환 Text Data에서 의미있는 키워드 추출 방법과 활용 | |
CN113806588B (zh) | 搜索视频的方法和装置 | |
CN108710653B (zh) | 一种绘本朗读点播方法、装置及系统 | |
CN107145509B (zh) | 一种信息搜索方法及其设备 | |
TW200834355A (en) | Information processing apparatus and method, and program | |
US20190082236A1 (en) | Determining Representative Content to be Used in Representing a Video | |
US20210151038A1 (en) | Methods and systems for automatic generation and convergence of keywords and/or keyphrases from a media | |
CN111324768A (zh) | 一种视频搜索系统和方法 | |
KR102196764B1 (ko) | 화자 분류 장치 및 화자 식별 장치 | |
CN112417174A (zh) | 一种数据处理的方法和装置 | |
EP3905060A1 (en) | Artificial intelligence for content discovery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |