CN110990598A - 资源检索方法、装置、电子设备及计算机可读存储介质 - Google Patents
资源检索方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110990598A CN110990598A CN201911128396.7A CN201911128396A CN110990598A CN 110990598 A CN110990598 A CN 110990598A CN 201911128396 A CN201911128396 A CN 201911128396A CN 110990598 A CN110990598 A CN 110990598A
- Authority
- CN
- China
- Prior art keywords
- resource
- resources
- user instruction
- user
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000004044 response Effects 0.000 claims abstract description 22
- 239000013598 vector Substances 0.000 claims description 49
- 238000012163 sequencing technique Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 239000013307 optical fiber Substances 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/438—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/487—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例公开了一种资源检索方法、装置、电子设备和计算机可读存储介质。其中该资源检索方法包括:将用户指令输入命名实体识别模型,所述命名实体识别模型用于识别所述用户指令中的资源关键字以及资源类型;响应于识别出所述资源类型,根据所述资源关键字在所述资源类型所对应的资源库中检索资源并返回检索到的资源;响应于未识别出所述资源类型,获取所述用户指令的意图信息;根据所述资源关键字在所述意图信息所对应的资源库中检索资源并返回检索到的资源。通过上述方法,首先识别出用户想要的资源的类型,之后对资源进行较为精确的检索,解决了现有技术中返回的资源检索结果不准确的技术问题。
Description
技术领域
本公开涉及资源检索领域,尤其涉及一种资源检索方法、装置、电子设备及计算机可读存储介质。
背景技术
智能音箱是一种支持语音交互的音箱产品,用户通过语音对音箱发出指令,音箱根据指令进行相应操作。在智能音箱场景下,最常见的指令就是资源点播。当接收到用户点播资源的指令时,云端会进行语义理解,并根据结果检索资源。因为语义的多样性,就会存在很多可以匹配的资源。(例子:“播放盗墓笔记”,针对盗墓笔记这个资源,有小说、有声书、电影、电视剧等多种资源)这时候如果准确的召回资源就成为了一个重要的问题。
现有技术中召回资源时,一般是预设几个资源库,当接收到用户的指令之后分析出指令中的语义信息,根据语义信息在多个资源库中检索并返回检索结果。这样所有用户接受到的结果是一样的,返回的检索结果精确度不高,如有时用户仅仅是想检索视频资源,但是返回的结果中却包括了音频、文本等多种资源。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开实施例提供一种资源检索方法,包括:
将用户指令输入命名实体识别模型,所述命名实体识别模型用于识别所述用户指令中的资源关键字以及资源类型;
响应于识别出所述资源类型,根据所述资源关键字在所述资源类型所对应的资源库中检索资源并返回检索到的资源;
响应于未识别出所述资源类型,获取所述用户指令的意图信息;
根据所述资源关键字在所述意图信息所对应的资源库中检索资源并返回检索到的资源。
进一步的,在获取所述用户指令的意图信息之前,还包括:
将用户指令输入第一分类器,得到所述用户指令的第一分类结果;
响应于所述用户指令的第一分类结果为播放意图类,将所述用户指令输入第二分类器得到所述用户指令的意图信息。
进一步的,所述方法还包括:
响应于所述检索到的资源为多个,对于多个资源中的每一个,获取所述资源的资源信息、用户信息以及环境信息;
根据所述资源的资源信息、用户信息、环境信息以及推荐模型得到所述资源的排序结果。
进一步的,所述根据所述资源的资源信息、用户信息、环境信息以及推荐模型得到所述资源的排序结果,包括:
将所述资源的资源信息、用户信息以及环境信息按照预定规则转换为对应的三个向量;
将所述三个向量拼接为一个拼接向量;
将所述拼接向量输入所述推荐模型得到所述资源的排序结果。
进一步的,所述将所述拼接向量输入所述推荐模型得到所述资源的排序结果,包括:
将所述拼接向量输入点击率预估模型,得到用户点击所述资源的概率预估值;
将所述拼接向量输入停留时间预估模型,得到用户在所述资源上的停留时间预估值;
将所述拼接向量输入收藏预估模型,得到用户收藏所述资源的收藏预估值;
根据所述概率预估值、停留时间预估值以及所述收藏预估值计算所述资源的得分;
根据所述得分得到所述资源的排序结果。
进一步的,所述根据所述概率预估值、停留时间预估值以及所述收藏预估值计算所述资源的得分,包括:
根据公式:score=ctr*Σ(α*M+β*N),
计算所述资源得分,其中score为资源得分,ctr为所述概率预估值,α为停留时间预估值的权重值,M为停留时间预估值,β为收藏预估值的权重值,N为收藏预估值。
进一步的,所述方法还包括:
响应于所述用户指令的发送终端为有屏终端,则返回所述资源的排序结果;
响应于所述用户指令的发送终端为无屏终端,则返回所述资源的排序结果中排在第一位的资源。
第二方面,本公开实施例提供一种资源检索装置,包括:
第一用户指令输入模块,用于将用户指令输入命名实体识别模型,所述命名实体识别模型用于识别所述用户指令中的资源关键字以及资源类型;
第一资源检索模块,用于响应于识别出所述资源类型,根据所述资源关键字在所述资源类型所对应的资源库中检索资源并返回检索到的资源;
用户指令意图信息获取模块,用于响应于未识别出所述资源类型,获取所述用户指令的意图信息;
第二资源检索模块,用于根据所述资源关键字在所述意图信息所对应的资源库中检索资源并返回检索到的资源。进一步的,所述资源检索装置还包括:
第一分类模块,用于将用户指令输入第一分类器,得到所述用户指令的第一分类结果;
第二分类模块,用于响应于所述用户指令的第一分类结果为播放意图类,将所述用户指令输入第二分类器得到所述用户指令的意图信息。
进一步的,所述资源检索装置还包括:
信息获取模块,用于响应于所述检索到的资源为多个,对于多个资源中的每一个,获取所述资源的资源信息、用户信息以及环境信息;
排序模块,用于根据所述资源的资源信息、用户信息、环境信息以及推荐模型得到所述资源的排序结果。
进一步的,所述排序模块还包括:
信息转换模块,用于将所述资源的资源信息、用户信息以及环境信息按照预定规则转换为对应的三个向量;
向量拼接模块,用于将所述三个向量拼接为一个拼接向量;
向量输入模块,用于将所述拼接向量输入所述推荐模型得到所述资源的排序结果。
进一步的,所述向量输入模块,还包括:
第一输入模块,用于将所述拼接向量输入点击率预估模型,得到用户点击所述资源的概率预估值;
第二输入模块,用于将所述拼接向量输入停留时间预估模型,得到用户在所述资源上的停留时间预估值;
第三输入模块,用于将所述拼接向量输入收藏预估模型,得到用户收藏所述资源的收藏预估值;
得分计算模块,用于根据所述概率预估值、停留时间预估值以及所述收藏预估值计算所述资源的得分;
得分排序模块,用于根据所述得分得到所述资源的排序结果。
进一步的,所述得分计算模块还用于:
根据公式:score=ctr*Σ(α*M+β*N),
计算所述资源得分,其中score为资源得分,ctr为所述概率预估值,α为停留时间预估值的权重值,M为停留时间预估值,β为收藏预估值的权重值,N为收藏预估值。
进一步的,所述资源检索装置还包括:
第一返回模块,用于响应于所述用户指令的发送终端为有屏终端,则返回所述资源的排序结果;
第二返回模块,用于响应于所述用户指令的发送终端为无屏终端,则返回所述资源的排序结果中排在第一位的资源。
第三方面,本公开实施例提供一种电子设备,包括:至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有能被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述第一方面中的任一所述资源检索方法。
第四方面,本公开实施例提供一种非暂态计算机可读存储介质,其特征在于,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行前述第一方面中的任一所述资源检索方法。
本公开实施例公开了一种资源检索方法、装置、电子设备和计算机可读存储介质。其中该资源检索方法包括:将用户指令输入命名实体识别模型,所述命名实体识别模型用于识别所述用户指令中的资源关键字以及资源类型;响应于识别出所述资源类型,根据所述资源关键字在所述资源类型所对应的资源库中检索资源并返回检索到的资源;响应于未识别出所述资源类型,获取所述用户指令的意图信息;根据所述资源关键字在所述意图信息所对应的资源库中检索资源并返回检索到的资源。通过上述方法,首先识别出用户想要的资源的类型,之后对资源进行较为精确的检索,解决了现有技术中返回的资源检索结果不准确的技术问题。
上述说明仅是本公开技术方案的概述,为了能更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为让本公开的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例的应用场景示意图;
图2为本公开实施例提供的资源检索方法的流程示意图;
图3为本公开实施例中的资源检索方法中获取用户指令的意图信息的流程示意图;
图4为本公开实施例提供的资源检索方法中获取资源排序结果的流程示意图;
图5为本公开实施例提供的资源检索装置的实施例的结构示意图;
图6为根据本公开实施例提供的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
图1为本公开实施例的应用场景示意图。如图1所示,用户101向终端设备102输入语音,终端设备102可以为智能手机、智能音箱、智能家电等任何可以接收所述自然语言输入的终端装置,终端装置102与语音识别设备103通过网络连接,其中,语音识别设备103可以是计算机或者智能终端等等;其中,终端设备102与语音识别设备103进行通信所依赖的网络可以是无线网络,例如5G网络和wifi网络等,还可以是有线网络,例如光纤网络。在该应用场景下,用户101说出语音,终端设备102采集语音并将语音发送至语音识别设备103,如果语音识别设备103识别出目标语音,则终端设备102执行所述目标语音所对应的功能。
可以理解的,上述语音识别设备103和所述终端设备102可以设置在一起,即终端设备102可以集成语音识别功能,这样用户的语音输入可以直接在终端设备102中识别。当语音被识别出来之后,根据所述语音,所述终端设备102可以执行与所述语音相关的功能。
图2为本公开实施例提供的资源检索方法实施例的流程图,本实施例提供的该资源检索方法可以由一资源检索装置来执行,该资源检索装置可以实现为软件,或者实现为软件和硬件的组合,该资源检索装置可以集成设置在资源检索系统中的某设备中,比如资源检索服务器或者资源检索终端设备中。如图2所示,该方法包括如下步骤:
步骤S201,将用户指令输入命名实体识别模型;
示例性的,所述用户指令为用户的语音指令,所述语音指令由终端设备102接收并发送至语音识别设备103识别出语音的文本。
在本公开中,所述用户指令为用户输入语音之后识别出的语音文本,如用户对着终端设备102说出“我想看成龙的电影红番区”,语音识别设备识别出用户所说的指令为“我想看成龙的电影红番区”并输出文本。
在该步骤中,所述命名实体识别模型用于识别所述用户指令中的资源关键字以及资源类型。示例性的,所述资源关键字包括artist(人名)、title(资源名),所述资源类型包括type(资源类型)。所述命名实体模型为预先训练好的识别模型,示例性的,所述命名实体模型使用BiLSTM(双向长短记忆网络)加crf(条件随机场)层作为待训模型,使用标注了人名、资源名以及资源类型的用户指令作为训练集合对所述命名实体模型进行训练,以使输入用户指令之后,所述命名实体模型可以输出资源的关键字(人名、资源名)以及资源类型。所述命名实体模型需要至少识别出资源的关键字,否则即识别失败,无法进行资源检索。
步骤S202,响应于识别出所述资源类型,根据所述资源关键字在所述资源类型所对应的资源库中检索资源并返回检索到的资源;
该步骤对应于识别出所述资源类型以及资源关键字的情况。当所述命名实体识别模型识别出所述资源的资源类型,则可以根据预先设置的关联关系来确定资源类型对应的资源库,如资源类型为“电影”,电影对应的资源库为资源库1,则以识别出的关键字为检索词在所述资源库1中进行检索,并返回检索的到资源;在另一种情况下,资源类型为一种更大的类型,如资源类型为“视频”,其对应的资源库为两个,资源库1和资源库2,其中资源库1为电影资源库,资源库2为电视剧资源库,此时需要使识别出的关键字在资源库1和资源库2中均进行检索。在上述示例中,用户指令为“我要看成龙的电影红番区”,则命名实体识别模型识别出关键字为“成龙”(人名)、“红番区”(资源名)、“电影”(资源类型),则将“成龙”和“红番区”输出“电影”资源库中进行检索,这样可以得到精确的检索结果。
步骤S203,响应于未识别出所述资源类型,获取所述用户指令的意图信息;
该步骤对应于识别出资源关键字但是未能识别出所述资源类型的情况。在该情况下,系统无法确定在哪个资源库中进行检索,如果在全部的资源库中进行检索,则无法得到准确的检索结果。示例性的,所述用户指令为“我想看红番区”,则在步骤S201中,只能识别出资源名为“红番区”,但是无法知道红番区到底是什么类型的资源,因此在该步骤中需要获取所述用户指令的意图信息。所述意图信息为预先获取并存储在预定的位置上的信息。
可选的,在所述获取所述用户指令的意图信息之前,还包括:
步骤S301,将用户指令输入第一分类器,得到所述用户指令的第一分类结果;
步骤S302,响应于所述用户指令的第一分类结果为播放意图类,将所述用户指令输入第二分类器得到所述用户指令的意图信息。
在所述步骤S301中,所述第一分类器为一个二分类的分类器,示例性的,其可以通过LSTM网络实现。通过将训练集合中的用户指令进行标记,标记为有播放意图的用户指令,如用户指令中包括看、听、来、播、放等字或词,和没有播放意图的用户指令来对网络进行训练得到第一分类器,所述用户指令经过第一分类器之后,如果被判断为没有播放意图,则不进行后续的资源检索操作。
在所述步骤S302中,当所述用户指令被分类为有播放意图的用户指令,则进一步将所述用户指令输入第二分类器以得到所述用户指令的意图信息。示例性的,所述第二分类器使用textcnn(文本分类卷积神经网络)模型实现,其使用标记了播放意图类型的用户指令作为训练集合对所述textcnn模型进行训练,示例性的,所述播放意图的类型分为三类:视频类(我想看)、音频类(我想听、来一首)、unclear(来一个、播放)。所述播放意图信息中包含了用户想要检索的资源的类型。示例性的,所述用户指令为“我想看红番区”,通过第一分类器,所述用户指令被分类为有播放意图,将所述用户指令输入第二分类器,由于用户指令中包括“我想看”,第二分类器得到所述用户指令的意图信息为“视频类”。
在得到上述用户指令的用户意图信息之后,将所述意图信息存储到预定的存储位置上,以备后续步骤S203中从该预定的存储位置上获取所述意图信息。
可以理解的,所述步骤S301-步骤S302可以与所述步骤S201并行执行,只要在所述步骤S203之前即可。
步骤S204,根据所述资源关键字在所述意图信息所对应的资源库中检索资源并返回检索到的资源。
在该步骤中,通过获取到的意图信息确定需要检索的资源库。如在上述示例中,得到用户指令的意图信息为“视频类”,则在资源库1和资源库2中检索在步骤S201中得到的资源关键字“红番区”(资源名),其中资源库1为电影资源库,资源库2为电视剧资源库,则返回电影名称为“红番区”以及电视剧名称为“红番区”的视频。
在一种情况下,所述步骤S202或者所述步骤S204的检索结果为一个或者无结果,此时直接返回检索结果即可;
在另一种情况下,所述步骤S202或者所述步骤S204的检索结果为多个,此时需要对检索到的多个资源进行进一步的排序返回最符合发出指令的用户的资源排序结果。在这种情况下,所述的资源检索方法,还包括:
步骤S401,响应于所述检索到的资源为多个,对于多个资源中的每一个,获取所述资源的资源信息、用户信息以及环境信息;
步骤S402,根据所述资源的资源信息、用户信息、环境信息以及推荐模型得到所述资源的排序结果。
在上述步骤S401中,检索出来的资源为多个,如用户的指令为“我想看成龙的电影”,则系统会从电影资源库中检索到多个演员中包括“成龙”的电影,此时如果直接反馈给用户,很有可能排在前边的并非用户想要的电影。在该步骤中,对于所述多个资源中的每一个,获取资源的资源信息,所述资源信息为资源本身的属性,示例性的,所述资源为电影,则所述资源信息包括电影的年代、时间长度、类型(爱情、动作、喜剧等等),用户信息包括用户的性别、年龄、职业和/或其他标签,环境信息包括用户当前所在的位置、当前的时间等等。在步骤S402中,根据所述资源的资源信息、用户信息、环境信息以及推荐模型得到所述资源的排序结果。所述推荐模型将资源信息、用户信息以及环境信息转换成资源对应的得分,根据所述多个资源的得分将所述多个资源进行排序得到排序结果并反馈给用户。
可选的,所述根据所述资源的资源信息、用户信息、环境信息以及推荐模型得到所述资源的排序结果,包括:将所述资源的资源信息、用户信息以及环境信息按照预定规则转换为对应的三个向量;将所述三个向量拼接为一个拼接向量;将所述拼接向量输入所述推荐模型得到所述资源的排序结果。在该可选实施例中,将上述资源信息、用户信息以及环境信息分别换转为推荐模型可以使用的向量的形式,示例性的,将上述信息映射成3个one-hot向量,将3个one-hot向量首位拼接成一个向量并输入所述推荐模型,推荐模型中的模型使用上述向量计算所述资源对所述用户的排序分数。
可选的,所述将所述拼接向量输入所述推荐模型得到所述资源的排序结果,包括:
将所述拼接向量输入点击率预估模型,得到用户点击所述资源的概率预估值;
将所述拼接向量输入停留时间预估模型,得到用户在所述资源上的停留时间预估值;
将所述拼接向量输入收藏预估模型,得到用户收藏所述资源的收藏预估值;
根据所述概率预估值、停留时间预估值以及所述收藏预估值计算所述资源的得分;
根据所述得分得到所述资源的排序结果。
在该可选实施例中,所述推荐模型中包括三个子模型:点击率预估模型、停留时间预估模型、收藏预估模型,其中点击率预估模型用于预估所述用户点击所述资源的概率、停留时间预估模型用于预估所述用户在所述资源上的停留时长、所述收藏预估模型用于预估所述用户是否会收藏所述资源。在得到三个子模型的预估值之后,将所述预估值按照预定的方式进行计算,得到所述资源相对于发出所述用户指令的用户的得分,之后可以根据每个资源的得分高低进行排序得到资源的排序结果。
可选的,所述根据所述概率预估值、停留时间预估值以及所述收藏预估值计算所述资源的得分,包括:根据公式:score=ctr*Σ(α*M+β*N)计算所述资源得分,其中score为资源得分,ctr为所述概率预估值,α为停留时间预估值的权重值,M为停留时间预估值,β为收藏预估值的权重值,N为收藏预估值。其中权重值α和β的值可以根据需要任意设置。
进一步的,由于用户的终端设备102的类型是多样的,如带屏幕的智能手机、不带屏幕的智能音箱等,因此在返回检索结果的时候需要进行进一步的处理。所述资源检索方法还包括:响应于所述用户指令的发送终端为有屏终端,则返回所述资源的排序结果;响应于所述用户指令的发送终端为无屏终端,则返回所述资源的排序结果中排在第一位的资源。在该实施例中,示例性的,返回结果有3个,分别为资源1、资源2和资源3,其资源排序结果为资源3、资源1、资源2,则当发出用户指令的终端有屏幕(如智能手机)时,将包括资源3、资源1和资源2的资源列表返回到终端上并显示,以使用户选择其感兴趣的资源进行播放;当发出用户指令的终端没有屏幕(如没有屏幕的智能音箱),则直接返回资源3并播放;或者当发出用户指令的终端没有屏幕(如没有屏幕的智能音箱),返回资源列表并使用语音播报所述资源列表中的资源,并等待用户的进一步选择指令。
本公开实施例公开了一种资源检索方法、装置、电子设备和计算机可读存储介质。其中该资源检索方法包括:将用户指令输入命名实体识别模型,所述命名实体识别模型用于识别所述用户指令中的资源关键字以及资源类型;响应于识别出所述资源类型,根据所述资源关键字在所述资源类型所对应的资源库中检索资源并返回检索到的资源;响应于未识别出所述资源类型,获取所述用户指令的意图信息;根据所述资源关键字在所述意图信息所对应的资源库中检索资源并返回检索到的资源。通过上述方法,首先识别出用户想要的资源的类型,之后对资源进行较为精确的检索,解决了现有技术中返回的资源检索结果不准确的技术问题。
在上文中,虽然按照上述的顺序描述了上述方法实施例中的各个步骤,本领域技术人员应清楚,本公开实施例中的步骤并不必然按照上述顺序执行,其也可以倒序、并行、交叉等其他顺序执行,而且,在上述步骤的基础上,本领域技术人员也可以再加入其他步骤,这些明显变型或等同替换的方式也应包含在本公开的保护范围之内,在此不再赘述。
图5为本公开实施例提供的资源检索装置实施例的结构示意图,如图5所示,该装置500包括:第一用户指令输入模块501、第一资源检索模块502、用户指令意图信息获取模块503和第二资源检索模块504。其中,
第一用户指令输入模块501,用于将用户指令输入命名实体识别模型,所述命名实体识别模型用于识别所述用户指令中的资源关键字以及资源类型;
第一资源检索模块502,用于响应于识别出所述资源类型,根据所述资源关键字在所述资源类型所对应的资源库中检索资源并返回检索到的资源;
用户指令意图信息获取模块503,用于响应于未识别出所述资源类型,获取所述用户指令的意图信息;
第二资源检索模块504,用于根据所述资源关键字在所述意图信息所对应的资源库中检索资源并返回检索到的资源。
进一步的,所述资源检索装置500还包括:
第一分类模块,用于将用户指令输入第一分类器,得到所述用户指令的第一分类结果;
第二分类模块,用于响应于所述用户指令的第一分类结果为播放意图类,将所述用户指令输入第二分类器得到所述用户指令的意图信息。
进一步的,所述资源检索装置500还包括:
信息获取模块,用于响应于所述检索到的资源为多个,对于多个资源中的每一个,获取所述资源的资源信息、用户信息以及环境信息;
排序模块,用于根据所述资源的资源信息、用户信息、环境信息以及推荐模型得到所述资源的排序结果。
进一步的,所述排序模块还包括:
信息转换模块,用于将所述资源的资源信息、用户信息以及环境信息按照预定规则转换为对应的三个向量;
向量拼接模块,用于将所述三个向量拼接为一个拼接向量;
向量输入模块,用于将所述拼接向量输入所述推荐模型得到所述资源的排序结果。
进一步的,所述向量输入模块,还包括:
第一输入模块,用于将所述拼接向量输入点击率预估模型,得到用户点击所述资源的概率预估值;
第二输入模块,用于将所述拼接向量输入停留时间预估模型,得到用户在所述资源上的停留时间预估值;
第三输入模块,用于将所述拼接向量输入收藏预估模型,得到用户收藏所述资源的收藏预估值;
得分计算模块,用于根据所述概率预估值、停留时间预估值以及所述收藏预估值计算所述资源的得分;
得分排序模块,用于根据所述得分得到所述资源的排序结果。
进一步的,所述得分计算模块还用于:
根据公式:score=ctr*Σ(α*M+β*N),
计算所述资源得分,其中score为资源得分,ctr为所述概率预估值,α为停留时间预估值的权重值,M为停留时间预估值,β为收藏预估值的权重值,N为收藏预估值。
进一步的,所述资源检索装置500还包括:
第一返回模块,用于响应于所述用户指令的发送终端为有屏终端,则返回所述资源的排序结果;
第二返回模块,用于响应于所述用户指令的发送终端为无屏终端,则返回所述资源的排序结果中排在第一位的资源。
图5所示装置可以执行图1-图4所示实施例的方法,本实施例未详细描述的部分,可参考对图1-图4所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1-图4所示实施例中的描述,在此不再赘述。
下面参考图6,其示出了适于用来实现本公开实施例的电子设备600的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:将用户指令输入命名实体识别模型,所述命名实体识别模型用于识别所述用户指令中的资源关键字以及资源类型;响应于识别出所述资源类型,根据所述资源关键字在所述资源类型所对应的资源库中检索资源并返回检索到的资源;响应于未识别出所述资源类型,获取所述用户指令的意图信息;根据所述资源关键字在所述意图信息所对应的资源库中检索资源并返回检索到的资源。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种资源检索方法,包括:
将用户指令输入命名实体识别模型,所述命名实体识别模型用于识别所述用户指令中的资源关键字以及资源类型;
响应于识别出所述资源类型,根据所述资源关键字在所述资源类型所对应的资源库中检索资源并返回检索到的资源;
响应于未识别出所述资源类型,获取所述用户指令的意图信息;
根据所述资源关键字在所述意图信息所对应的资源库中检索资源并返回检索到的资源。
2.如权利要求1所述的资源检索方法,其特征在于,在获取所述用户指令的意图信息之前,还包括:
将用户指令输入第一分类器,得到所述用户指令的第一分类结果;
响应于所述用户指令的第一分类结果为播放意图类,将所述用户指令输入第二分类器得到所述用户指令的意图信息。
3.如权利要求1所述的资源检索方法,其特征在于,所述方法还包括:
响应于所述检索到的资源为多个,对于多个资源中的每一个,获取所述资源的资源信息、用户信息以及环境信息;
根据所述资源的资源信息、用户信息、环境信息以及推荐模型得到所述资源的排序结果。
4.如权利要求3所述的资源检索方法,其特征在于,所述根据所述资源的资源信息、用户信息、环境信息以及推荐模型得到所述资源的排序结果,包括:
将所述资源的资源信息、用户信息以及环境信息按照预定规则转换为对应的三个向量;
将所述三个向量拼接为一个拼接向量;
将所述拼接向量输入所述推荐模型得到所述资源的排序结果。
5.如权利要求4所述的资源检索方法,其特征在于,所述将所述拼接向量输入所述推荐模型得到所述资源的排序结果,包括:
将所述拼接向量输入点击率预估模型,得到用户点击所述资源的概率预估值;
将所述拼接向量输入停留时间预估模型,得到用户在所述资源上的停留时间预估值;
将所述拼接向量输入收藏预估模型,得到用户收藏所述资源的收藏预估值;
根据所述概率预估值、停留时间预估值以及所述收藏预估值计算所述资源的得分;
根据所述得分得到所述资源的排序结果。
6.如权利要求5所述的资源检索方法,其特征在于,所述根据所述概率预估值、停留时间预估值以及所述收藏预估值计算所述资源的得分,包括:
根据公式:score=ctr*Σ(α*M+β*N),
计算所述资源得分,其中score为资源得分,ctr为所述概率预估值,α为停留时间预估值的权重值,M为停留时间预估值,β为收藏预估值的权重值,N为收藏预估值。
7.如权利要求3所述的资源检索方法,其特征在于,所述方法还包括:
响应于所述用户指令的发送终端为有屏终端,则返回所述资源的排序结果;
响应于所述用户指令的发送终端为无屏终端,则返回所述资源的排序结果中排在第一位的资源。
8.一种资源检索装置,包括:
第一用户指令输入模块,用于将用户指令输入命名实体识别模型,所述命名实体识别模型用于识别所述用户指令中的资源关键字以及资源类型;
第一资源检索模块,用于响应于识别出所述资源类型,根据所述资源关键字在所述资源类型所对应的资源库中检索资源并返回检索到的资源;
用户指令意图信息获取模块,用于响应于未识别出所述资源类型,获取所述用户指令的意图信息;
第二资源检索模块,用于根据所述资源关键字在所述意图信息所对应的资源库中检索资源并返回检索到的资源。
9.一种电子设备,包括:
存储器,用于存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,使得所述处理器运行时实现根据权利要求1-7中任意一项所述的资源检索方法。
10.一种非暂态计算机可读存储介质,用于存储计算机可读指令,当所述计算机可读指令由计算机执行时,使得所述计算机执行权利要求1-7中任意一项所述的资源检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911128396.7A CN110990598B (zh) | 2019-11-18 | 2019-11-18 | 资源检索方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911128396.7A CN110990598B (zh) | 2019-11-18 | 2019-11-18 | 资源检索方法、装置、电子设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110990598A true CN110990598A (zh) | 2020-04-10 |
CN110990598B CN110990598B (zh) | 2020-11-27 |
Family
ID=70085046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911128396.7A Active CN110990598B (zh) | 2019-11-18 | 2019-11-18 | 资源检索方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110990598B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111723289A (zh) * | 2020-06-08 | 2020-09-29 | 北京声智科技有限公司 | 信息推荐方法及装置 |
CN112000820A (zh) * | 2020-08-10 | 2020-11-27 | 海信电子科技(武汉)有限公司 | 一种媒资推荐方法及显示设备 |
CN112242140A (zh) * | 2020-10-13 | 2021-01-19 | 中移(杭州)信息技术有限公司 | 智能设备控制方法、装置、电子设备及存储介质 |
CN114390137A (zh) * | 2020-10-20 | 2022-04-22 | 阿里巴巴集团控股有限公司 | 短信的处理方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102332025A (zh) * | 2011-09-29 | 2012-01-25 | 奇智软件(北京)有限公司 | 一种智能垂直搜索方法和系统 |
CN102622417A (zh) * | 2012-02-20 | 2012-08-01 | 北京搜狗信息服务有限公司 | 对信息记录进行排序的方法和装置 |
CN102955798A (zh) * | 2011-08-25 | 2013-03-06 | 腾讯科技(深圳)有限公司 | 一种基于搜索引擎的搜索方法及搜索服务器 |
CN103021403A (zh) * | 2012-12-31 | 2013-04-03 | 威盛电子股份有限公司 | 基于语音识别的选择方法及其移动终端装置及信息系统 |
CN106649694A (zh) * | 2016-12-19 | 2017-05-10 | 北京云知声信息技术有限公司 | 语音交互中确定用户意图的方法及装置 |
IN201811034489A (zh) * | 2018-09-13 | 2018-09-28 | ||
CN109871489A (zh) * | 2019-03-06 | 2019-06-11 | 网宿科技股份有限公司 | 一种智能识别系统中的资源检索方法及智能识别系统 |
-
2019
- 2019-11-18 CN CN201911128396.7A patent/CN110990598B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102955798A (zh) * | 2011-08-25 | 2013-03-06 | 腾讯科技(深圳)有限公司 | 一种基于搜索引擎的搜索方法及搜索服务器 |
CN102332025A (zh) * | 2011-09-29 | 2012-01-25 | 奇智软件(北京)有限公司 | 一种智能垂直搜索方法和系统 |
CN102622417A (zh) * | 2012-02-20 | 2012-08-01 | 北京搜狗信息服务有限公司 | 对信息记录进行排序的方法和装置 |
CN103021403A (zh) * | 2012-12-31 | 2013-04-03 | 威盛电子股份有限公司 | 基于语音识别的选择方法及其移动终端装置及信息系统 |
CN106649694A (zh) * | 2016-12-19 | 2017-05-10 | 北京云知声信息技术有限公司 | 语音交互中确定用户意图的方法及装置 |
IN201811034489A (zh) * | 2018-09-13 | 2018-09-28 | ||
CN109871489A (zh) * | 2019-03-06 | 2019-06-11 | 网宿科技股份有限公司 | 一种智能识别系统中的资源检索方法及智能识别系统 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111723289A (zh) * | 2020-06-08 | 2020-09-29 | 北京声智科技有限公司 | 信息推荐方法及装置 |
CN111723289B (zh) * | 2020-06-08 | 2024-02-02 | 北京声智科技有限公司 | 信息推荐方法及装置 |
CN112000820A (zh) * | 2020-08-10 | 2020-11-27 | 海信电子科技(武汉)有限公司 | 一种媒资推荐方法及显示设备 |
CN112242140A (zh) * | 2020-10-13 | 2021-01-19 | 中移(杭州)信息技术有限公司 | 智能设备控制方法、装置、电子设备及存储介质 |
CN114390137A (zh) * | 2020-10-20 | 2022-04-22 | 阿里巴巴集团控股有限公司 | 短信的处理方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110990598B (zh) | 2020-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6708717B2 (ja) | ニュース推薦方法及び装置 | |
CN107833574B (zh) | 用于提供语音服务的方法和装置 | |
CN110990598B (zh) | 资源检索方法、装置、电子设备及计算机可读存储介质 | |
CN109165302B (zh) | 多媒体文件推荐方法及装置 | |
CN113806588B (zh) | 搜索视频的方法和装置 | |
CN110059172B (zh) | 基于自然语言理解的推荐答案的方法和装置 | |
CN111324700A (zh) | 资源召回方法、装置、电子设备及计算机可读存储介质 | |
CN112364829B (zh) | 一种人脸识别方法、装置、设备及存储介质 | |
CN112328889A (zh) | 推荐搜索词确定方法、装置、可读介质及电子设备 | |
CN113343069B (zh) | 用户信息的处理方法、装置、介质及电子设备 | |
CN113033707B (zh) | 视频分类方法、装置、可读介质及电子设备 | |
CN114357325A (zh) | 内容搜索方法、装置、设备及介质 | |
US20240070171A1 (en) | Systems and methods for predicting where conversations are heading and identifying associated content | |
CN112148962B (zh) | 用于推送信息的方法和装置 | |
CN117809651A (zh) | 语音交互设备和语音交互方法 | |
CN112446214A (zh) | 广告关键词的生成方法、装置、设备及存储介质 | |
CN112309387A (zh) | 用于处理信息的方法和装置 | |
CN111382262A (zh) | 用于输出信息的方法和装置 | |
CN110797013A (zh) | 语音直播间的直播入口显示方法、相关设备及存储介质 | |
CN110765357A (zh) | 在线文档的搜索方法、装置、设备及存储介质 | |
CN112214695A (zh) | 信息处理方法、装置和电子设备 | |
CN111339770B (zh) | 用于输出信息的方法和装置 | |
CN114625876A (zh) | 作者特征模型的生成方法、作者信息处理方法和装置 | |
CN113420723A (zh) | 获取视频热点的方法、装置、可读介质和电子设备 | |
CN112256719A (zh) | 实体查询方法、装置、可读介质与电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |