CN111488506B - 资源信息的处理方法、装置、设备及存储介质 - Google Patents

资源信息的处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111488506B
CN111488506B CN201910075696.7A CN201910075696A CN111488506B CN 111488506 B CN111488506 B CN 111488506B CN 201910075696 A CN201910075696 A CN 201910075696A CN 111488506 B CN111488506 B CN 111488506B
Authority
CN
China
Prior art keywords
resources
resource
information
characteristic parameter
parameter value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910075696.7A
Other languages
English (en)
Other versions
CN111488506A (zh
Inventor
李冬白
宋俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Orion Star Technology Co Ltd
Original Assignee
Beijing Orion Star Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Orion Star Technology Co Ltd filed Critical Beijing Orion Star Technology Co Ltd
Priority to CN201910075696.7A priority Critical patent/CN111488506B/zh
Publication of CN111488506A publication Critical patent/CN111488506A/zh
Application granted granted Critical
Publication of CN111488506B publication Critical patent/CN111488506B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种资源信息的处理方法、装置、设备及存储介质,通过基于搜索引擎,获取已有数据库中资源的特征信息,所述特征信息包括用于表征所述资源热度的热度信息;根据获取到的热度信息,对每一资源的热度信息进行归一化处理,得到每一资源对应的特征参数值;在所述数据库中,保存每一资源对应的特征参数值。通过对资源的热度信息进行处理获取资源的特征参数值,避免了资源的热度信息存在较大数量级差距,可提高对资源分级的准确性,从而可将不同等级的资源提供给不同的业务,可以满足接待服务型机器人、儿童陪伴性机器人、AI音箱等设备搜索引擎的业务需求,在用户搜索资源时也可为更准确快速的为用户提供高特征参数值的资源,提高用户体验。

Description

资源信息的处理方法、装置、设备及存储介质
技术领域
本发明涉及信息技术领域,尤其涉及一种资源信息的处理方法、装置、设备及存储介质。
背景技术
随着大数据时代的到来,数据作为重要的资源成为人工智能各个领域发展的主要驱动力。目前,作用于机器人工智能领域的数据资源,都需要进行一定的预处理,才能被语音交互技术、智能音箱的搜索技术、自然语言理解过程中的信息抽取等技术所应用。
现有技术中,在从网络或第三方等获取到数据资源后,一般直接将获取到的数据资源存储于数据库中。为了充分发挥数据资源在人工智能领域的优势,需要尽可能多的获取资源的信息,以将优质的资源提供给机器人工智能领域,进而提升机器智能的性能。其中资源信息包括资源的播放量、点击量等,而在基于资源的播放量、点击量的高低直接将资源提供给机器人工智能领域时,通常会存在很多问题,例如无法满足搜索引擎的业务需求或者无法为用户推荐最优资源。
发明内容
本发明提供一种资源信息的处理方法、装置、设备及存储介质,以提供一种对于资源热度信息的处理方法,以更好的实现对资源的分级,可以满足各设备的搜索引擎的业务需求,也可以在用户搜索资源时为更准确快速的为用户提供所需的资源,提高用户体验。
本发明的第一方面是提供一种资源信息的处理方法,包括:
基于搜索引擎,获取已有数据库中资源的特征信息,所述特征信息包括用于表征所述资源热度的热度信息;
根据获取到的热度信息,对每一资源的热度信息进行归一化处理,得到每一资源对应的特征参数值;
在所述数据库中,保存每一资源对应的特征参数值。
本发明的第二方面是提供一种资源信息的处理装置,包括:
获取模块,用于基于搜索引擎,获取已有数据库中资源的特征信息,所述特征信息包括用于表征所述资源热度的热度信息;
处理模块,用于根据获取到的热度信息,对每一资源的热度信息进行归一化处理,得到每一资源对应的特征参数值;
存储模块,用于在所述数据库中,保存每一资源对应的特征参数值。
本发明的第三方面是提供一种电子设备,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面所述的方法。
本发明的第四方面是提供一种计算机可读存储介质,其上存储有计算机程序;
所述计算机程序被处理器执行时实现如第一方面所述的方法。
本发明提供的资源信息的处理方法、装置、设备及存储介质,通过基于搜索引擎,获取已有数据库中资源的特征信息,所述特征信息包括用于表征所述资源热度的热度信息;根据获取到的热度信息,对每一资源的热度信息进行归一化处理,得到每一资源对应的特征参数值;在所述数据库中,保存每一资源对应的特征参数值。本实施例通过对资源的热度信息进行处理获取资源的特征参数值,避免了资源的热度信息存在较大数量级差距,可提高对资源分级的准确性,从而可将不同等级的资源提供给不同的业务,可以满足接待服务型机器人、儿童陪伴性机器人、AI音箱等设备搜索引擎的业务需求,此外在用户搜索资源时也可为更准确快速的为用户提供高特征参数值的资源,提高用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的资源信息的处理方法流程图;
图2为本发明另一实施例提供的资源信息的处理方法流程图;
图3为本发明另一实施例提供的资源信息的处理方法流程图;
图4为本发明实施例提供的资源信息的处理装置的结构图;
图5为本发明实施例提供的电子设备的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的资源信息的处理方法流程图。本实施例提供了一种资源信息的处理方法,该方法具体步骤如下:
S101、基于搜索引擎,获取已有数据库中资源的特征信息,所述特征信息包括用于表征所述资源热度的热度信息。
在本实施例中,资源可以为音频资源,其中音频资源可以包括音乐资源以及有声资源(如有声读物等),当然资源也可以为视频资源、图片资源、或者文本资源等。对已有数据库中每一资源,可以获取资源的特征信息,具体可包括资源的热度信息,其中资源的热度信息从搜索引擎中获取,例如资源的播放量、点击量、收藏量等,可用于表征资源的热度。
此外,资源的特征信息还可包括但不限于:资源的标识信息(如资源名称、ID)、资源类别、资源来源、资源描述、资源图片、作者/歌手/艺术家、资源别名等。需要说明的是,数据库中资源的特征信息可从同一搜索引擎获取,当然也可分别从多个搜索引擎获取同一个资源的热度信息,若从多个搜索引擎获取同一个资源的热度信息,进一步还需要对这些热度信息进行处理(如取最大值,平均值,加权求平均等)后得到该资源对应的热度信息。
S102、根据获取到的热度信息,对每一资源的热度信息进行归一化处理,得到每一资源对应的特征参数值。
本实施例中将资源的热度信息进行归一化处理得到特征参数值,特征参数值在0-1的范围内,避免了资源播放量、点击量等热度信息存在较大的数量级差距,从而导致资源推荐和资源分级的不准确。
S103、在所述数据库中,保存每一资源对应的特征参数值。
在本实施例中,获取了数据库中每一资源的特征参数值后,可将特征参数值存储到数据库中,并将特征参数值和资源的标识信息(例如资源的名称信息、ID等)进行关联,以便于在后续进行资源推荐或资源分级时直接根据特征参数值和标识信息的关联关系,进行资源推荐或资源分级。
在本实施例中,资源的特征参数值可以用于向用户推荐资源或对资源进行分级,其中向用户推荐资源,例如接收到请求信息,从数据库中获取备选资源为多个时,选择特征参数值高的资源输出;再如对于名称信息相同但资源内容不同的资源,可根据特征参数值进行分级,具体可分为优质资源等级、劣质资源等级以及中间等级等,其中各资源等级用于使用者(开发者)根据需求更好的选择合适等级的资源进行使用,例如NLU(NaturalLanguage Understanding,自然语言理解)技术开发者希望拿到比较好的资源应用到自己的业务中,则可选择优质资源等级的资源进行使用。
在具体实施过程中,作为一种可能的实现方式,所述根据所述数据库中所有资源的热度信息对每一资源的热度信息进行归一化,获取每一资源的特征参数值,可包括:
S1021、根据所述数据库中所有资源按照热度信息由高到低进行排序;
S1022、将排序在前第一预设百分比的第一类资源的特征参数值设置为1,将排序在最后第二预设百分比的第二类资源的特征参数值设置为0;
S1023、对所述数据库中除所述第一类资源和所述第二类资源外的第三类资源,将所述第三类资源中各资源的热度信息进行归一化处理,确定出所述第三类资源中各资源的特征参数值,其中,所述第三类资源中各资源的特征参数值大于0,且小于1。
在本实施例中,通过统计发现,在对资源根据播放量等热度信息由高到低进行排序后排序在前第一百分比的资源为用户比较关注的资源,而排序在最后第二百分比的资源为用户关注不多的资源,因此在归一化时将排序在前第一百分比的资源定义为第一类资源,并将第一类资源的特征参数值设置为1;将排序在最后第二百分比的资源定义为第二类资源,并将第二类资源的特征参数值设置为0对于用户比较关注的资源和用户关注不多的资源可较准确的进行分级;而对于关注度介于中间的资源定义为第三类资源,可以划分出更好的梯度,便于进行资源分级,避免不同关注度的资源的热度信息数量级相差较大造成分级不准确,从而可以大大提高资源分级的准确度,同时也能够简化特征参数值的计算,节约系统资源。
本发明实施例中不对第一百分比和第二百分比的值进行限定,可根据实际需求或应用场景进行配置,例如,第一百分比配置为1%,第二百分比配置为20%。
在一可选实施例中,根据如下公式对所述第三类资源中各资源的热度信息进行归一化处理:
其中,yi为所述第三类资源中资源i的特征参数值;xi为该资源i的热度信息数值,n为所述第三类资源的个数,i∈[1,n];为所述第三类资源的热度信息数值中的最大热度信息数值;/>为所述第三类资源的热度信息数值中的最小热度信息数值。
本实施例提供的资源信息的处理方法,通过基于搜索引擎,获取已有数据库中资源的特征信息,所述特征信息包括用于表征所述资源热度的热度信息;根据获取到的热度信息,对每一资源的热度信息进行归一化处理,得到每一资源对应的特征参数值;在所述数据库中,保存每一资源对应的特征参数值。本实施例通过对资源的热度信息进行处理获取资源的特征参数值,避免了资源的热度信息存在较大数量级差距,可提高对资源分级的准确性,从而可将不同等级的资源提供给不同的业务,可以满足接待服务型机器人、儿童陪伴性机器人、AI音箱等设备搜索引擎的业务需求,此外在用户搜索资源时也可为更准确快速的为用户提供高特征参数值的资源,提高用户体验。
在一可选实施例中,在上述实施例的基础上,如图2所示,S102所述获取每一资源的特征参数值后,还可包括:
S201、若接收到请求指令,根据所述请求指令和所述数据库中各资源的特征参数值,从所述数据库中选择目标资源;
S202、控制智能设备输出所选择的目标资源。
在本实施例中,当接收到用户通过智能设备发送的请求信息时,可根据请求信息从数据库中获取备选资源,其中请求信息中可包括所请求的资源的标识信息(如名称信息、ID等)、或类别信息,例如“我想听刘德华的歌”、“我想听音乐”等,若备选资源为多个,则可从备选资源选择特征参数值最高的一个或多个,通过智能设备输出,以响应用户的请求信息。
在另一可选实施例中,在上述实施例的基础上,如图3所示,S102所述获取每一资源的特征参数值后,还包括:
S301、获取所述数据库中名称信息相同但资源内容不同的资源,并确定为待分级资源;
S302、根据所述待分级资源的特征参数值对所述待分级资源进行分级,确定所述待分级资源的等级标签,并将所述待分级资源的等级标签存储于所述数据库中。
在本实施例中,当数据库中的资源存在名称信息相同但资源内容不同的情况时,则在用户根据名称信息请求资源时导致无法准确的为用户推荐资源,其中资源内容不同具体可以表现为资源类别不同,例如名称信息为“西游记”的资源,有资源类别为歌曲的资源、有资源类别为儿童故事的资源,当用户搜索“西游记”时若能确定用户期望的资源类别,则返回对应的资源,但很多情况无法确定用户期望的资源类别,故无法确定应该返回哪一资源,因此需要对数据库中名称信息相同但资源内容不同的这类资源进行分级。
本实施例中首先根据资源的名称信息从数据库中查找具有相同名称信息的资源,然后判断资源内容是否相同(具体可以为资源类别是否相同),从而获取数据库中名称信息相同但资源内容不同的待分级资源。进一步的,根据待分级资源的特征参数值对待分级资源进行分级确定待分级资源的等级标签,然后将待分级资源的等级标签存储于数据库中,当然也可进一步根据等级标签将相同等级的资源存储到一个资源集合中。
在一可选实施例中,S302所述根据待分级资源的特征参数值对所述待分级资源进行分级,具体可包括:
若待分级资源有两个,则获取两个待分级资源的特征参数值的第一差值;
若所述第一差值超过预设阈值,则确定两个待分级资源中特征参数值高者的等级标签为优质资源等级,低者的分级为劣质资源等级;
若所述第一差值未超过预设阈值,则确定两个待分级资源的等级标签均为中间等级。
在本实施例中,当数据库中具有某一名称信息但资源内容不同的待分级资源只有两个时,此时可获取该两个待分级资源的特征参数值,然后计算特征参数值的第一差值,若第一差值超过预设阈值,则确定两个待分级资源中特征参数值高者的等级标签为优质资源等级,低者的分级为劣质资源等级,也即两个资源的播放量等热度信息具有较大的差距,热度信息较大的资源为较为优质的资源,当用户根据名称信息请求资源时可返回该资源,更容易命中用户期望的资源;若第一差值未超过预设阈值,确定两个待分级资源分级均为中间等级,也即两个的播放量等热度信息差距不大,当用户根据名称信息请求资源时无法直接确定返回哪一资源,因此可进行二次询问或根据上下文信息,确定用户期望的资源。
本发明实施例中不对预设阈值进行限定,可根据实际需求或应用场景进行配置,例如,预设阈值设置为0.3。
在另一可选实施例中,,S302所述根据待分级资源的特征参数值对所述待分级资源进行分级,具体还可包括:
若待分级资源有至少三个,按特征参数值由高到低,对待分级资源进行排序,确定排序在前两位的待分级资源的特征参数值的第二差值;
若所述第二差值超过预设阈值,则确定特征参数值较高的待分级资源的等级标签为优质资源等级,除特征参数值较高的待分级资源外的其余待分级资源的等级标签均为中间等级;
若所述第二差值未超过预设阈值,则确定各待分级资源的等级标签均为中间等级。
在本实施例中,当数据库中具有某一名称信息但资源内容不同的待分级资源有至少三个时,在获取各待分级资源的特征参数值后,根据特征参数值由高到低对待分级资源进行排序获取特征参数值排序前两个的待分级资源(也即特征参数值最高的资源和第二高的资源)的特征参数值的第二差值,若第二差值超过预设阈值,则确定特征参数值较高的待分级资源(也即特征参数值最高的资源)的等级标签为优质资源等级,而除特征参数值最高的待分级资源外的其余待分级资源相对于特征参数值最高待分级资源,特征参数值则相差不多,因此该些待分级资源的等级标签均为中间等级,可进行二次询问或根据上下文信息,确定用户期望的资源;若第二差值未超过预设阈值,则说明数据库中具有某一名称信息但资源内容不同的待分级资源各资源间的热度信息差距不大,因此确定各待分级资源的等级标签均为中间等级,当用户根据名称信息请求资源时无法直接确定返回哪一资源,因此可进行二次询问或根据上下文信息,确定用户期望的资源。
在上述实施例的基础上,S101所述获取已有数据库中资源的特征信息后,还可包括:
对所述名称信息进行清洗,以清洗后得到的结果作为所述名称信息。
在本实施例中,数据库从搜索引擎爬取资源时,名称信息会带有很多无效字符,因此需要对名称信息进行清洗,去除多余空格、表情符号、标点符号、特殊符号、中文繁体转简体等;同时需要去除名称信息中无意义的词语,例如“求打赏”、“支持”、“订阅”等,其中无意义的词语可预先定义在停用词表中,根据停用词表对名称信息进行清洗,上述实施例中的名称信息均可采用经过清洗的名称信息,从而可避免无意义的词语对资源推荐、资源分级产生的影响,提高资源推荐、资源分级的准确度和处理效率。
图4为本发明实施例提供的资源信息的处理装置的结构图。本实施例提供的资源信息的处理装置可以执行资源信息的处理方法实施例提供的处理流程,如图4所示,所述资源信息的处理装置40包括获取模块41、处理模块42以及存储模块43。
获取模块41,用于基于搜索引擎,获取已有数据库中资源的特征信息,所述特征信息包括用于表征所述资源热度的热度信息;
处理模块42,用于根据获取到的热度信息,对每一资源的热度信息进行归一化处理,得到每一资源对应的特征参数值;
存储模块43,用于在所述数据库中,保存每一资源对应的特征参数值。
可选的,所述处理模块42还用于:
若接收到请求指令,根据所述请求指令和所述数据库中各资源的特征参数值,从所述数据库中选择目标资源;
控制智能设备输出所选择的目标资源。
可选的,所述处理模块42还用于:
获取所述数据库中标识信息相同但资源内容不同的资源,并确定为待分级资源;
根据所述待分级资源的特征参数值对所述待分级资源进行分级,确定所述待分级资源的等级标签,并将所述待分级资源的等级标签存储于所述数据库中。
进一步的,所述处理模块42具体用于:
若待分级资源有两个,则获取两个待分级资源的特征参数值的第一差值;
若所述第一差值超过预设阈值,则确定两个待分级资源中特征参数值高者的等级标签为优质资源等级,低者的分级为劣质资源等级;
若所述第一差值未超过预设阈值,则确定两个待分级资源的等级标签均为中间等级。
进一步的,所述处理模块42具体用于:
若待分级资源有至少三个,按特征参数值由高到低,对待分级资源进行排序,确定排序在前两位的待分级资源的特征参数值的第二差值;
若所述第二差值超过预设阈值,则确定特征参数值较高的待分级资源的等级标签为优质资源等级,除特征参数值较高的待分级资源外的其余待分级资源的等级标签均为中间等级;
若所述第二差值未超过预设阈值,则确定各待分级资源的等级标签均为中间等级。
在上述实施例的基础上,所述处理模块42具体用于:
根据所述数据库中所有资源按照热度信息由高到低进行排序;
将排序在前第一预设百分比的第一类资源的特征参数值设置为1,将排序在最后第二预设百分比的第二类资源的特征参数值设置为0;
对所述数据库中除所述第一类资源和所述第二类资源外的第三类资源,将所述第三类资源中各资源的热度信息进行归一化处理,确定出所述第三类资源中各资源的特征参数值,其中,所述第三类资源中各资源的特征参数值大于0,且小于1。
进一步的,所述处理模块42具体用于:根据如下公式对所述第三类资源中各资源的热度信息进行归一化处理:
其中,yi为所述第三类资源中资源i的特征参数值;xi为该资源i的热度信息数值,n为所述第三类资源的个数,i∈[1,n];为所述第三类资源的热度信息数值中的最大热度信息数值;/>为所述第三类资源的热度信息数值中的最小热度信息数值。
本发明实施例提供的资源信息的处理装置可以具体用于执行上述图1至图3所提供的方法实施例,具体功能此处不再赘述。
本发明实施例提供的资源信息的处理装置,通过基于搜索引擎,获取已有数据库中资源的特征信息,所述特征信息包括用于表征所述资源热度的热度信息;根据获取到的热度信息,对每一资源的热度信息进行归一化处理,得到每一资源对应的特征参数值;在所述数据库中,保存每一资源对应的特征参数值。本实施例通过对资源的热度信息进行处理获取资源的特征参数值,避免了资源的热度信息存在较大数量级差距,可提高对资源分级的准确性,从而可将不同等级的资源提供给不同的业务,可以满足接待服务型机器人、儿童陪伴性机器人、AI音箱等设备搜索引擎的业务需求,此外在用户搜索资源时也可为更准确快速的为用户提供高特征参数值的资源,提高用户体验。
图5为本发明实施例提供的电子设备的结构示意图。本发明实施例提供的电子设备可以执行资源信息的处理方法实施例提供的处理流程,如图5所示,电子设备50包括存储器51、处理器52、计算机程序和通讯接口53;其中,计算机程序存储在存储器51中,并被配置为由处理器52执行以上实施例所述的资源信息的处理方法。
具体的,处理器52运行存储器51中存储的计算机程序以实现:获取已有数据库中资源的特征信息,所述资源的特征信息包括名称信息和从搜索引擎中获取的用于表征所述资源热度的热度信息;根据所述数据库中所有资源的热度信息,对每一资源的热度信息进行归一化处理,得到每一资源的特征参数值;在所述数据库中,保存所述资源的特征参数值,并与所述资源的名称信息建立关联关系。
图5所示实施例的电子设备可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
另外,本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现上述实施例所述的资源信息的处理方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (9)

1.一种资源信息的处理方法,其特征在于,包括:
基于搜索引擎,获取已有数据库中资源的特征信息,所述特征信息包括用于表征所述资源热度的热度信息;
根据获取到的热度信息,对每一资源的热度信息进行归一化处理,得到每一资源对应的特征参数值;
在所述数据库中,保存每一资源对应的特征参数值;
其中,所述根据获取到的热度信息,对每一资源的热度信息进行归一化处理,得到每一资源对应的特征参数值,包括:
根据获取到的热度信息,对所述数据库中的资源进行排序;
将排序在前第一预设百分比的第一类资源的特征参数值设置为1,将排序在最后第二预设百分比的第二类资源的特征参数值设置为0;
对所述数据库中除所述第一类资源和所述第二类资源外的第三类资源,将所述第三类资源中各资源的热度信息进行归一化处理,确定出所述第三类资源中各资源的特征参数值,其中,所述第三类资源中各资源的特征参数值大于0,且小于1。
2.根据权利要求1所述的方法,其特征在于,所述得到每一资源对应的特征参数值后,还包括:
若接收到请求指令,根据所述请求指令和所述数据库中各资源的特征参数值,从所述数据库中选择目标资源;
控制智能设备输出所选择的目标资源。
3.根据权利要求1所述的方法,其特征在于,所述得到每一资源对应的特征参数值后,还包括:
获取所述数据库中名称信息相同但资源内容不同的资源,并确定为待分级资源;
根据所述待分级资源的特征参数值对所述待分级资源进行分级,确定所述待分级资源的等级标签,并将所述待分级资源的等级标签存储于所述数据库中。
4.根据权利要求3所述的方法,其特征在于,所述根据所述待分级资源的特征参数值对所述待分级资源进行分级,包括:
若待分级资源有两个,则获取两个待分级资源的特征参数值的第一差值;
若所述第一差值超过预设阈值,则确定两个待分级资源中特征参数值高者的等级标签为优质资源等级,低者的分级为劣质资源等级;
若所述第一差值未超过预设阈值,则确定两个待分级资源的等级标签均为中间等级。
5.根据权利要求3所述的方法,其特征在于,所述根据所述待分级资源的特征参数值对所述待分级资源进行分级,包括:
若待分级资源有至少三个,按特征参数值由高到低,对待分级资源进行排序,确定排序在前两位的待分级资源的特征参数值的第二差值;
若所述第二差值超过预设阈值,则确定特征参数值较高的待分级资源的等级标签为优质资源等级,除特征参数值较高的待分级资源外的其余待分级资源的等级标签均为中间等级;
若所述第二差值未超过预设阈值,则确定各待分级资源的等级标签均为中间等级。
6.根据权利要求1所述的方法,其特征在于,根据如下公式对所述第三类资源中各资源的热度信息进行归一化处理:
其中,yi为所述第三类资源中资源i的特征参数值;xi为该资源i的热度信息数值,n为所述第三类资源的个数,i∈[1,n];为所述第三类资源的热度信息数值中的最大热度信息数值;/>为所述第三类资源的热度信息数值中的最小热度信息数值。
7.一种资源信息的处理装置,其特征在于,包括:
获取模块,用于基于搜索引擎,获取已有数据库中资源的特征信息,所述特征信息包括用于表征所述资源热度的热度信息;
处理模块,用于根据获取到的热度信息,对每一资源的热度信息进行归一化处理,得到每一资源对应的特征参数值;
存储模块,用于在所述数据库中,保存每一资源对应的特征参数值;
所述处理模块,具体用于根据获取到的热度信息,对所述数据库中的资源进行排序;
将排序在前第一预设百分比的第一类资源的特征参数值设置为1,将排序在最后第二预设百分比的第二类资源的特征参数值设置为0;
对所述数据库中除所述第一类资源和所述第二类资源外的第三类资源,将所述第三类资源中各资源的热度信息进行归一化处理,确定出所述第三类资源中各资源的特征参数值,其中,所述第三类资源中各资源的特征参数值大于0,且小于1。
8.一种电子设备,其特征在于,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-6中任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,其上存储有计算机程序;
所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的方法。
CN201910075696.7A 2019-01-25 2019-01-25 资源信息的处理方法、装置、设备及存储介质 Active CN111488506B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910075696.7A CN111488506B (zh) 2019-01-25 2019-01-25 资源信息的处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910075696.7A CN111488506B (zh) 2019-01-25 2019-01-25 资源信息的处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111488506A CN111488506A (zh) 2020-08-04
CN111488506B true CN111488506B (zh) 2024-03-08

Family

ID=71791264

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910075696.7A Active CN111488506B (zh) 2019-01-25 2019-01-25 资源信息的处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111488506B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102733A (zh) * 2014-07-24 2014-10-15 百度在线网络技术(北京)有限公司 搜索内容提供方法和搜索引擎
CN106294730A (zh) * 2016-08-09 2017-01-04 百度在线网络技术(北京)有限公司 资讯信息的推荐方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10503773B2 (en) * 2014-04-07 2019-12-10 Sony Corporation Tagging of documents and other resources to enhance their searchability
US20160117365A1 (en) * 2014-10-28 2016-04-28 Hewlett-Packard Development Company, L.P. Query hotness and system hotness metrics

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102733A (zh) * 2014-07-24 2014-10-15 百度在线网络技术(北京)有限公司 搜索内容提供方法和搜索引擎
CN106294730A (zh) * 2016-08-09 2017-01-04 百度在线网络技术(北京)有限公司 资讯信息的推荐方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张腾 ; 何丰 ; 陈新德 ; 赵小龙 ; .个性化推荐中标签系统的建设.福建电脑.2018,(07),全文. *
李春 ; 杨明 ; 顾婷婷 ; .基于本体的信息关联搜索.中国新通信.2017,(11),全文. *

Also Published As

Publication number Publication date
CN111488506A (zh) 2020-08-04

Similar Documents

Publication Publication Date Title
US9589208B2 (en) Retrieval of similar images to a query image
CN108804641B (zh) 一种文本相似度的计算方法、装置、设备和存储介质
US8554854B2 (en) Systems and methods for identifying terms relevant to web pages using social network messages
JP6141305B2 (ja) 画像検索
KR101498001B1 (ko) 디스플레이를 위한 고품질 리뷰 선택
US7505956B2 (en) Method for classification
CN103678418B (zh) 信息处理方法和信息处理设备
US20160350434A1 (en) Systems and methods for improved web searching
US20040249808A1 (en) Query expansion using query logs
US20170329782A1 (en) Query result bottom retrieval method and apparatus
US20110093455A1 (en) Search and retrieval methods and systems of short messages utilizing messaging context and keyword frequency
CN110637316B (zh) 用于预期对象识别的系统和方法
EP2774061A1 (en) Method and apparatus of ranking search results, and search method and apparatus
US8521739B1 (en) Creation of inferred queries for use as query suggestions
US20150120708A1 (en) Information aggregation, classification and display method and system
US9721000B2 (en) Generating and using a customized index
US11789946B2 (en) Answer facts from structured content
US9418058B2 (en) Processing method for social media issue and server device supporting the same
US20160267392A1 (en) Providing answers to questions having both rankable and probabilistic components
US9552415B2 (en) Category classification processing device and method
CN115563313A (zh) 基于知识图谱的文献书籍语义检索系统
CN111488453B (zh) 资源分级方法、装置、设备及存储介质
CN116738065A (zh) 一种企业搜索方法、装置、设备及存储介质
US9256671B2 (en) Establishing of a semantic multilayer network
US20150178278A1 (en) Identifying recently submitted query variants for use as query suggestions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant