CN101493836B - 一种资源信息挖掘排序方法、装置及服务器 - Google Patents
一种资源信息挖掘排序方法、装置及服务器 Download PDFInfo
- Publication number
- CN101493836B CN101493836B CN2009100373947A CN200910037394A CN101493836B CN 101493836 B CN101493836 B CN 101493836B CN 2009100373947 A CN2009100373947 A CN 2009100373947A CN 200910037394 A CN200910037394 A CN 200910037394A CN 101493836 B CN101493836 B CN 101493836B
- Authority
- CN
- China
- Prior art keywords
- resource information
- information
- classification
- excavation
- client
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
一种资源信息挖掘排序方法、装置以及服务器,其在发送给服务器的挖掘信息中,除了包含有该资源信息的识别信息,还包括有所选择的挖掘类别信息,服务器根据挖掘信息中的识别信息以及所选择的挖掘类别信息更新该资源信息的该挖掘类别的挖掘次数,根据该资源信息的各个类别的挖掘次数确定该资源信息的排序,即,在向服务器发送挖掘信息时,可以不限定该资源信息当前所在的类别,还可以是选择其他的类别,从而,可以根据各用户对该资源信息的关注角度的不同,对该资源信息进行综合排序,以综合地反映出网络用户对该资源信息的关注度,使得对资源信息的排序更具有灵活性。
Description
技术领域
本发明涉及计算机网络应用技术领域,特别涉及一种资源信息挖掘排序方法、资源信息挖掘排序装置以及服务器。
背景技术
dig(挖)是从论坛中不断回复好的帖子以防止好帖子被淹没的方式演变而来的,它依靠访问者的力量来甄别新闻或者其他信息的好坏或者关注度,当访问者看到新闻后,若觉得好则点击dig图标,向网站的服务器发送一条挖掘信息,该挖掘信息中包括有该新闻的识别信息,例如该新闻的URL(UniformResource Locator,统一资源定位符)或者该新闻的编号等等,服务器根据各新闻被用户dig的次数对新闻进行排序,并将挖掘次数多的新闻排在靠前的位置,以使在后的访问者能够很快甄别当前最重要的新闻或者是当前被关注度最高的新闻,这种排序方式,由于能够很好地反映大多数用户的兴趣、缩短人们寻找信息的时间而广受欢迎。
在现有技术中的这种通过dig进行资源信息挖掘排序的方式中,由于新闻已经被分配在一个固定的类别下,例如财经新闻、体育新闻、社会新闻等等,分类类型很难改变,因此,在客户端向服务器发送挖掘信息时,可以只用发送该新闻的识别信息,例如URL或者编号等等,服务器接收到该挖掘信息后,将该新闻对应的挖掘次数加上1,然后根据更新后的各新闻的挖掘次数进行排序即可,通常是根据各新闻的挖掘次数或者是各新闻的上传时间进行排序,例如将挖掘次数最多的新闻或者是最新上传的新闻排在较前的位置等等,在这种方式中,由于某一个新闻通常只属于一种类别,因此,针对一个新闻而言,只可以针对其所属的固定类别进行排序,但实际上,某些新闻内容可能涉及两个或者两个以上的类别,例如同时涉及经济与生活、同时涉及科技与体育等等,在单一类别上进行排序无法对该新闻进行综合的分析,例如对于同时涉及经济与生活的新闻而言,若该新闻是位于经济类别下,则无法就其在生活类别下进行排序,无法反应出关注生活新闻的用户对该新闻的关注度,无法进行综合分析。
发明内容
针对上述现有技术中存在的问题,本发明的目的在于提供一种资源信息挖掘排序方法、装置以及服务器,其可以根据用户的该资源信息的关注度综合地进行排序,使对资源信息的排序更具灵活性。
为达到上述目的,本发明采用以下技术方案:
一种资源信息挖掘排序方法,包括步骤:
接收客户端的资源信息获取信息,所述资源信息获取信息中包括有资源信息的识别信息;
将所述识别信息对应的资源信息向所述客户端发送,并在发送所述资源信息的同时或者在接收到客户端发送的需要进行挖掘的信息时,将与所述资源信息对应的可选择类别向所述客户端发送;
接收客户端发送的挖掘信息,所述挖掘信息包括所述识别信息、所选择的挖掘类别信息;
根据所述挖掘信息更新所述资源信息的所述挖掘类别的挖掘次数;
根据所述资源信息的各个类别的挖掘次数确定所述资源信息的排序。
一种资源信息挖掘排序装置,包括:
数据收发模块,用于接收客户端的资源信息获取信息,所述资源信息获取信息中包括有资源信息的识别信息,将所述识别信息对应的资源信息向所述客户端发送,并在发送所述资源信息的同时或者在接收到客户端发送的需要进行挖掘的信息时,将与所述资源信息对应的可选择的分类类别向所述客户端发送,并接收客户端发送的挖掘信息,所述挖掘信息包括所述识别信息、所选择的挖掘类别信息;
挖掘信息分析模块,该挖掘信息分析模块与所述数据收发模块连接,用于根据所述挖掘信息统计并更新所述资源信息的所述挖掘类别的挖掘次数;
排序分析模块,用于根据所述资源信息的各个类别的挖掘次数确定所述资源信息的排序。
一种服务器,其包括上述资源信息挖掘排序装置。
根据上述本发明的方案,在发送给服务器的挖掘信息中,除了包含有该资源信息的识别信息,还包括有所选择的挖掘类别信息,服务器根据挖掘信息中的识别信息以及所选择的挖掘类别信息更新该资源信息的该挖掘类别的挖掘次数,并根据该资源信息的各个类别的挖掘次数确定该资源信息的排序,即,在向服务器发送挖掘信息时,可以不限定该资源信息当前所在的类别,还可以是选择其他的类别,从而,可以根据各用户对该资源信息的关注角度的不同,对该资源信息进行综合排序,以综合地反映出网络用户对该资源信息的关注度,使得对资源信息的排序更具有灵活性。
附图说明
图1是本发明的资源信息挖掘排序方法的流程示意图;
图2是应用于本发明的类型树的一种示例图;
图3是本发明的资源信息挖掘排序装置的结构示意图。
具体实施方式
以下针对本发明的各具体实施方式进行详细描述,在下述说明中,涉及资源信息时,该资源信息可以是指新闻、某个多媒体文件内容等等。
参见图1所示,是本发明的资源信息挖掘排序方法的流程示意图,其具体包括步骤:
步骤S101:服务器接收客户端发送的挖掘信息,该挖掘信息包括有资源信息的识别信息、所选择的挖掘类别信息,进入步骤S102;
步骤S102:服务器根据挖掘信息中的识别信息、所选择的挖掘类别信息,更新该识别信息对应的资源信息的该挖掘类别的挖掘次数,进入步骤S103;
步骤S103:服务器根据该资源信息在各个类别的挖掘次数确定该资源信息的排序。
根据本发明的方案,在客户端向服务器发送的挖掘信息中,不仅包含有资源信息的识别信息,还可以包含有用户所选择的类别信息,即在dig时,可以 不限定在该资源信息当前所属的类别,还可以选择其他的类别,从而,服务器在对资源信息进行排序时,不仅仅只是根据该资源信息的挖掘次数进行排序,还同时根据所接收的挖掘信息中的类别信息进行综合排序,从而可以综合地反映出网络用户对该资源信息的关注度,使对资源信息的排序更具有灵活性。
根据上述本发明的方案,在客户端向服务器发送的挖掘信息中,不仅包含有资源信息的识别信息,还包含有所选择的类别信息,即,在客户端向服务器发送挖掘信息时,可以不局限于该资源信息当前所属的类别,还可以根据需要发送所选择的其他类别,因此,在客户端应当可以选择分类,以根据所选择的分类构建挖掘信息,根据应用需要的不同,可以是在服务器向客户端发送资源信息内容时,即同时将可选择的分类类别同时向客户端发送,以供客户端的用户端选择,或者也可以是在客户端需要发送挖掘信息时,先向服务器发送一个需要发送挖掘信息的消息,服务器在接收到该需要发送挖掘信息的消息时再将可选择的分类类别向客户端发送,以下分别针对这两种实现方式,自发布新的资源信息开始详细进行描述。
首先,在应用本发明的方案之前,可预先对资源信息所属的可能的类别进行划分,在具体划分时,可以是根据现有技术中已有的类别进行划分,例如,将新闻的类别划分为科技、体育、生活、文化......等等类别,也可以是采用类型树的方式划分类别,参见图2所示,是其中一种应用于本发明的类型树的示例图,该类型树分为四层,最上面的层为顶层类型,其没有实际含义,主要是作为根节点来形成一棵树,第二层是进行大层面上的粗略划分,其将所有的新闻划分为历史、科技、地理、社会、财经、娱乐等大类,第三层是在第二层的基础上针对各节点进行细分,如图2所示,其可将科技类再次划分为信息、理论学科、航空航天等分类,第四层是在第三层的基础上再次进行细分,例如,可将信息类划分为WEB、无线/3G、骨干网等类别,根据实际应用需要和策略的不同,也可以采用其他的类型划分方式,在此不予多加赘述。
其中,在采用上述类型树的方式对类别进行划分的情况下,在下述对类型树的说明中,相关的根节点称为父节点,该根结点的下属根结点或者叶子节点称为子节点,与该节点相并列的根结点或者叶子节点为兄弟节点,以图2中所示的类型树为例,历史类、科技类、地理类、社会类、财经类、娱乐类互为兄弟节点,科技类是信息类、理论学科类、航空航天类的父节点,信息类、理论学科类、航空航天类是科技类的子节点,且信息类、理论学科类、航空航天类互为兄弟节点,以此类推,信息类是WEB类、无线/3G类、骨干网类的父节点,WEB类、无线/3G类、骨干网类是信息类的子节点,且WEB类、无线/3G类、骨干网类互为兄弟节点。
实施例一:
下面首先针对服务器向客户端发送资源信息内容时,同时将可选择的分类类别向客户端发送、以供客户端进行选择的方式进行说明。
根据本发明的方式,当某个客户端的互联网用户需要发布新的资源信息时,可首先向服务器发送一个需要发布新资源信息的信息,服务器接收到该信息后,将可选择的分类类别向客户端发送,客户端接收服务器发送的该可选择的分类类别后,将这些可选择的分类类别予以显示,以供用户进行选择,并在接收到用户所选择的该资源信息所处的类别后,将该所选择的类别以及用户所输入的需要发布的该资源信息的内容同时向服务器发送,服务器接收后,根据该所选择的类别,为该资源信息确定一个URL,并将该URL与该资源信息的内容相关联后予以储存。
当客户端的用户需要浏览某个资源信息的内容时,输入该资源信息的地址、或者点击该资源信息的链接,客户端向服务器发送资源信息获取信息,该资源信息获取信息中包括有该资源信息的识别信息,例如该资源信息的URL、或者该资源信息的编号等等,服务器接收该资源信息获取信息后,根据该资源信息获取信息中的识别信息,获取对应的资源信息内容,并为该资源信息确定可供选择的相关类别,然后将对应的资源信息内容以及可供选择的相关类别向客户端发送。
其中,在服务器为该资源信息确定可供选择的相关类别时,可以是直接将所有的类别确定为可供选择的相关类别,例如,以图2中预先划分的类型树为例,则可以将该资源信息可供选择的相关类别确定为第二层中的历史、科技、 地理、社会、财经、娱乐等类别,也可以将第二层、第三层、第四层中的所有类别确定为该资源信息可供选择的相关类别,采用这种方式,可以综合地反应出该资源信息在各个方面的被关注度。
鉴于对类型树划分的复杂程度的不同,在类型树的划分较为复杂的情况下,相应地向客户端发送的数据也增多,使得获取资源信息的时延增大,因此,还可以是根据该资源信息当前所属的相关类别为其确定可供选择的相关类别,例如,以图2中的类型树为例,假设该资源信息发布时所选择的类别为第三层中的理论学科类,则可以将其可供选择的类别确定为包括了信息、理论学科、航空航天等第三层中的所有类别,还可以是同时包括了第四层中的WEB、无线/3G、骨干网等第四层中的所有类别,根据具体应用需要及运用策略的不同,可以采用不同的方式为资源信息确定可供选择的相关类别,也可以是采用其他的确定方式,在此不予多加赘述。
在客户端从服务器获得资源信息内容后,将该资源信息内容向用户显示,客户端的用户浏览该资源信息中的相关内容,当该用户觉得该资源信息有意义、或者希望该资源信息能够得到更多人的关注、或者其他尚未列出的原因时,则该用户可以对该资源信息进行挖掘,即进行dig,在进行挖掘时,从获取资源信息内容时已给出的可选择类别中选择一个类别,或者是根据运用策略的不同,手动输入一个该用户认为该资源信息当前所属的类别,然后点击相应的挖掘按钮,根据需要该按钮的显示名称可以是提交、dig、挖、挖掘等等,或者是其他的显示名称,客户端接收到该点击信息后,向服务器发送挖掘信息,该挖掘信息中包括用户选择的挖掘类别、以及该资源信息的识别信息等信息,该资源信息的识别信息可以是该资源信息的URL或者是该资源信息的编号等信息。
当服务器接收到客户端发送的挖掘信息后,对该挖掘信息进行分析处理,获取该挖掘信息中的识别信息以及用户所选择的挖掘类别,对该资源信息的挖掘次数进行统计,将该资源信息的该挖掘类别下的对应的挖掘次数加1,同时还可以将该资源信息的总的挖掘次数加1。以图2中所示的类型树为例,假设该挖掘类别为信息类,则服务器将该资源信息的信息类的挖掘次数加1,同时 可将该资源信息的所有类的挖掘次数的总的和值加1。
在服务器根据挖掘信息更新了资源信息在该挖掘类别下的挖掘次数后,或者是同时更新了该资源信息的总的挖掘次数的和值之后,则可以根据更新后的挖掘次数对资源信息进行排序,具体排序的时刻,可以是每收到一条挖掘信息后都重新进行排序,考虑到操作的复杂性,也可以是每距离预定时间段进行一次排序过程,该预设时间段跟服务器的资源信息的排序的刷新周期有关。
根据各个应用策略的不同,在对资源信息进行排序时,可以有不同的排序方式,以下仅针对其中的几种进行说明:
其一:统计该资源信息在各类别下的挖掘次数,并对该资源信息在各类别下的挖掘次数进行比较,当该资源信息在其中的某一个类别(以下称为第二类别)的挖掘次数大于该资源信息的原主类别的挖掘次数时,则将该第二类别设为该资源信息的新的主类别。例如,假设某资源信息在初始发布时的所选择的类别为财经类,即该资源信息的主类别为财经类,在该资源信息发布一段时间之后,由于有多个不同的用户对该资源信息进行挖掘,且各用户在进行挖掘时所选择的挖掘类别可能不太相同,大多数用户认为该资源信息是属于社会类,即这些用户在进行挖掘时会选择社会类作为所选择的挖掘类别,使得服务器在接收到挖掘信息、并对各个挖掘信息进行统计比较之后,该资源信息在社会类上的挖掘次数大于在财经类上的挖掘次数,则服务器可将该资源信息的主类别更换为社会类,使该资源信息优先在社会类新闻中进行排序,以更合理地反应该资源信息中的内容;
其二:预先设定一个预设差值,统计该资源信息在各类别下的挖掘次数,并对该资源信息在各类别下的挖掘次数进行比较,当该资源信息在第二类别的挖掘次数减去该资源信息的原主类别的挖掘次数的差值大于或者等于该预设差值时,则将该第二类别设为该资源信息的新的主类别。例如,假设某资源信息在初始发布时的所选择的类别为财经类,即该资源信息的主类别为财经类,在该资源信息发布一段时间之后,由于有多个不同的用户对该资源信息进行挖掘,且各用户在进行挖掘时所选择的挖掘类别可能不太相同,大多数用户认为该资 源信息是属于社会类,即这些用户在进行挖掘时会选择社会类作为所选择的挖掘类别,使得服务器在接收到挖掘信息、并进行统计比较之后,该资源信息在社会类上的挖掘次数减去在财经类上的挖掘次数的差值大于或者等于该预设差值,则服务器可将该资源信息的主类别更换为社会类,使得在对该资源信息进行排序时,社会类新闻相对于财经类具有较高的优先级,即挖掘次数最多的类别具有最高的优先级,并将该资源信息优先在社会类新闻中进行排序,以更合理地反应该资源信息中的新闻内容,该方式相对于上述其一中的方式而言,对进行主类别转换时条件进一步进行了限定,可以有效防止个别次数的差异而导致资源信息的主类别来回转换的情况;
其三:统计该资源信息在各个类别的挖掘次数的和值,将该和值与各资源信息的挖掘次数的和值进行比较,然后根据比较结果确定该资源信息的综合排序,例如,将总的挖掘次数的和值较大的资源信息排在靠前的位置,以较好的反应该资源信息被广泛关注的程度等等;
其四:统计该资源信息在各个类别的挖掘次数的加权和值,将该加权和值与各资源信息的挖掘次数的加权和值进行比较,然后根据比较结果确定该资源信息的综合排序,在这种方式中,需要首先设定各类别的加权系数,例如,资源信息的主类别具有较高的优先级,该主类别的加权系数相应较大,其他类别的加权系数相应较小,或者是某些类别具有固定的加权系数等等,例如,对于任意一个资源信息而言,该资源信息的主类别都具有较高的优先级,具有固定的加权系数,且加权系数相对于其他类别的加权系数最大等等,根据需要也可以是采用其他的方式来设定加权系数,在此不予多加赘述;
其五:分别统计该资源信息在各个类别的挖掘次数,分别与各资源信息的相应类别的挖掘次数进行比较,并根据比较结果确定该资源信息在各类别的排序,即将该资源信息在各类别分别进行排序,例如,假设某资源信息在经过一段时间后,服务器统计该资源信息在各类别的挖掘次数,假设该资源信息在科技、社会两个类别均具有挖掘次数,则分别对该资源信息在科技类、社会类上的挖掘次数进行统计,然后分别与其他资源信息在科技类、社会类上的挖掘次 数进行比较,当在财经类上该资源信息的挖掘次数相对于其他资源信息的挖掘次数较大时,则将该资源信息排在相对靠前的位置,当该资源信息在社会类上的挖掘次数相对于其他资源信息的挖掘次数较少时,则可以将该资源信息排列在相对靠后的位置,即针对各资源信息在该单一类别的挖掘次数的排序而言,可以根据各资源信息的挖掘次数进行排序,并将挖掘次数较多的资源信息排列在靠前的位置,以分别反映出该资源信息在各类别的被关注度;
其六:分别统计该资源信息在各个类别的挖掘次数,并针对各个类别,分别与该类别的各资源信息的挖掘次数进行比较,并分别根据比较结果确定该资源信息分别在各类别的排序,并根据该资源信息在各类别的排序,确定该资源信息的综合排序,例如,对于某一个资源信息而言,当其分别在各类别上的挖掘次数都相对较高时,则在资源信息分别在个类别上的排序也会相对靠前,具体的排序位置则跟该资源信息与其他资源信息在该类别上的比较结果有关,从而,在对该资源信息进行综合排序时,该资源信息相应会排列在相对靠前的位置,或者是,当某个资源信息在其中一个类别中的排序排列在该类别的某个预设序列之前的位置时,则在进行综合排序时也将该资源信息排列在靠前的位置等等;
其七:统计该资源信息的挖掘次数最多的两类别,并根据这两个类别确定该资源信息的交叉排行类型以及该资源信息的交叉排行类型的排序,例如,对于某个资源信息而言,其内容在涉及科技的同时涉及生活,在初始发布该资源信息时,可能只将其选择发布在科技类的类别下,即该资源信息的初始分类类别为科技类,在经过一段时间后,该资源信息在生活类的挖掘次数可能会相应增加,使得该资源信息在生活类的挖掘次数与在科技类的挖掘次数较为接近甚至于可能是超过在科技类的挖掘次数,使得该资源信息在科技类、生活类这两个类别的挖掘次数远大于在其他类别的挖掘次数,从而可以确定该资源信息是同时涉及科技、生活这两个类别,并可以将该资源信息确定为是科技影响社会类的交叉排行类型中的资源信息,并将该资源信息优先在科技影响社会的交叉类型中进行排序,然后根据该资源信息在科技、生活这两个类别上的挖掘次数确定该资源信息在科技影响生活类型的这个交叉排行类型中的排序,根据应用 需要,也可以是根据挖掘次数最多的两个或者两个以上的类别的挖掘次数确定该资源信息的交叉排行类型以及该资源信息在交叉排行类别中的排序。
其中,进行交叉排序的方式中,针对不同类型的类别,可以为各类别分别确定不同的优先级,以更为合理地反映出该资源信息的综合排序,例如:
在其中的一种方式中,对于资源信息的主类别而言,在确定该资源信息的交叉排行的排序时,该主类别具有较高的优先级,例如,在上述第二种方式中,挖掘次数最多的类别并不一定是主类别,因此,在使主类别具有较高的优先级的情况下,可将主类别作为交叉排序中的其中一个类别,并根据该主类别以及除了主类别之外的其他类别中挖掘次数最多的类别确定该资源信息的综合排序,从而可以同时反映出该资源信息的所述类别以及所受关注的类别;
或者,在另外的一种方式中,考虑到发布该资源信息的服务器的专业性的不同,例如某些服务器是专门专注于财经类的资源信息,某些服务器则是专门专注于科技类的资源信息,而某些服务器则是专注于生活类的资源信息等等,因此,在对资源信息进行交叉排序时,与该服务器的分类离别对应的分类的优先级最高,例如,对于从财经类服务器所获取的资源信息而言,其财经类的优先级最高,在通过统计一段时间的挖掘次数之后,若该资源信息在财经类上的挖掘次数与在其他某个类别上的挖掘次数相同,则优先将该资源信息在财经类上进行排序,并在进行交叉排序时,可优先将该财经类确定为交叉排序时的其中一个类别等等;
或者是,通过上述的方式,由于发布资源信息的服务器的专业性的不同,因此,从该服务器获取资源信息进行浏览的通常都是与该服务器的分类相关的专业人士,且这些专业人士通常也更希望关注与该服务器的分类有关的专业性内容,因此,在进行具体的排序时,可优先对与该服务器的分类对应的类别的资源信息进行排序,再对交叉类型的资源信息进行排序,例如,可预设一门限值,并优先将在与服务器的分类对应的类别上大于该门限值的资源信息排列在靠前的位置,紧随其后则可以排列交叉排序的资源信息等等。
上述针对其中的几种排序方式进行了举例说明,这种举例说明并非是对排 序方式的穷举,根据应用选择的需要及所采用的策略的不同,也可以是采用其他的排序方式,或者是采用其中的两种或者两种以上的方式进行结合的方式进行排序,在此不予多加赘述。
其中,在上述示例说明中,是以资源信息发布时已将客户端的用户所选择的类别作为该资源信息所处的主类别进行说明,而采用本发明的方案,例如上述其一、其二中的排序方式,在经过一段时间后,可以根据该资源信息的挖掘次数自动对该资源信息所属的主类别进行更换,因此,在发布资源信息时,也可以先不确定资源信息所处的类别,服务器在发布该资源信息时可以以最新的资源信息的方式确定该资源信息的排序位置,即将该资源信息排序在最新资源信息的类别中,在经过一段时间后,由服务器根据该资源信息的挖掘次数来确定该资源信息的类别以及排序。
此外,在发布新的资源信息时,由于客户端的用户通常是在某一类别下进行发布,例如科技、社会等等,因此,在发布新的资源信息时,也可以不由客户端的用户手动设定该资源信息的类别,而可以是由客户端在发布该新的资源信息时自动检测和获取该客户端发布该资源信息时当前所处的类别,并将该类别向服务器发送,由服务器将该类别设为该资源信息的类别。
另外,在上述示例说明中,在服务器向客户端发送可供选择的相关类别时,是将所有可供选择的相关类别同时向客户端发送,这种实现方式,可以是用复选框的方式,根据需要,例如在采用类型树对资源信息的类别进行划分时,也可以是采用下拉菜单或者列表的方式首先给出可选择的父类别,当客户端的用户选择到某个父类别,客户端检测到该信息后,获取该父类别下对应的子类别,并将这些子类别予以显示,以供客户端的用户进行选择,例如,以图2中所示的类型树为例,在服务器发送给客户端显示的可选择的相关类别时,可以是先提供第二层中的历史、科技、地理、社会、财经、娱乐等父类别,客户端的用户从这些类别中进行选择,假设用户选择到科技类别,客户端检测到该信息,从服务器获取科技类下的子类别后显示给用户,以供用户进行选择,客户端的用户从该第三层中的子类别中进行选择,假设用户选择到信息类,客户端检测 到该进行选择的点击或者输入信息,从服务器获取信息类下的子类别后显示给用户,供用户进行选择,假设客户端的用户选择到骨干网类,客户端检测到该信息后,向服务器发送挖掘信息,该挖掘信息中可包括有该客户端检测到的用户所选择的类别、以及该资源信息的识别信息,例如该资源信息的URL。
上述说明中,在发送挖掘信息时,是以客户端的用户从最低一层中选择分类进行说明,根据需要,也可以是从第二层或者第三层中选择分类,在此不予多加赘述。
实施例二:
在上述实施例一中,是针对服务器向客户端发送资源信息的内容时,同时将可选择的分类类别向客户端发送、以供客户端进行选择的方式进行说明,在本实施例中,主要是针对服务器在接收到该客户端需要发送挖掘信息的消息、并向客户端发送资源信息时再将可选择的分类类别向客户端发送的方式进行详细说明。
根据本发明的方式,当某个客户端的互联网用户需要发布新的资源信息时,可首先向服务器发送一个需要发布新资源信息的信息,服务器接收到该信息后,向客户端发送可选择的分类类别,客户端接收后予以显示,以供用户选择该资源信息所处的类别,客户端然后将所选择的类别以及该资源信息的内容同时向服务器发送,服务器接收后,根据所选择的类别,为该资源信息确定一个URL,并将该URL与该资源信息的内容相关联后予以储存。
当客户端的用户需要浏览某个资源信息的内容时,输入该资源信息的地址、或者点击该资源信息的链接,客户端向服务器发送资源信息获取信息,该资源信息获取信息中包括该资源信息的识别信息,例如该资源信息的URL、该资源信息的编号等等,服务器接收后,根据该资源信息获取信息中的识别信息,获取对应的资源信息内容,将对应的资源信息内容向客户端发送。
在客户端从服务器获得资源信息内容后,将该资源信息内容向用户显示,用户浏览该资源信息内容,当该用户觉得该资源信息有意义、或者希望该资源 信息能够得到更多人的关注、或者其他尚未列出的原因时,则该用户需要对该资源信息进行挖掘,点击相应的需要进行挖掘的按钮,根据需要该按钮的显示名称可以是dig等等,或者是其他的显示名称,客户端接收到该点击信息后,向服务器发送需要进行挖掘的信息,服务器接收后,确定与该资源信息对应的可供选择的分类类别,并将可选择的分类类别向客户端发送,客户端接收后进行显示,以供用户进行选择,客户端的用户从给出的可选择类别中选择一个类别,或者是根据运用策略的不同,手动输入一个该用户认为该资源信息应当所属的类别,然后点击相应的挖掘按钮,根据需要该按钮的显示名称可以是提交、dig、挖、挖掘等等,或者是其他的显示名称,客户端接收到该点击信息后,向服务器发送挖掘信息,该挖掘信息中包括用户选择的挖掘类别、以及该资源信息的识别信息等信息,该资源信息的识别信息可以是该资源信息的URL或者该资源信息的编号等信息。
当服务器接收到客户端发送的挖掘信息后,对该挖掘信息进行分析处理,分析出该挖掘信息中的资源信息识别信息以及用户所选择的挖掘类别,对该资源信息的挖掘次数进行统计,将该资源信息的该挖掘类别下的对应的挖掘次数加1,同时还可以将该资源信息的总的挖掘次数加1。以图2中所示的类型树为例,假设该挖掘类别为信息类,则服务器将该资源信息的信息类的挖掘次数加1,同时可将该资源信息的所有的挖掘次数的总的和值加1。
在服务器根据挖掘信息更新了资源信息的在该挖掘类别下的挖掘次数后,或者是同时更新了该资源信息的总的挖掘次数的和值之后,则可以根据更新后的挖掘次数对资源信息进行综合排序,具体排序的时刻,可以是每收到一条挖掘信息后都重新进行排序,考虑到操作的复杂性,也可以是每距离预定时间段进行一次排序过程,根据各个应用策略的不同,可以有不同的排序方式。
本实施例中的其他技术特征与上述实施例一中的相同,在此不予多加赘述。
通过采用上述本发明的资源信息挖掘排序方式,在对资源信息进行排序时,由于服务器所接收的客户端的发送的挖掘信息中包含有用户端所选择的该资源 信息内容应当位于的分类,从而服务器可以根据客户端所发送的挖掘信息获得更多而且更为精细的信息,例如用户的偏好、资源信息的分类是否合理等等。
此外,在本发明的资源信息挖掘排序方式中,经过对挖掘信息中的挖掘类别的次数进行统计后,某个资源信息内容可能同时具有两个甚至于两个以上的类别上具有挖掘次数,因此,在用户对资源信息进行订阅时,可以选择两个或者两个以上的交叉类型进行订阅,例如,假设客户端的用户需要关注同时与科技与生活相关的资源信息,因此,经过订阅选择后,客户端向服务器发送的订阅消息中,包括了科技类、生活类这两个类别,服务器接收到该订阅消息后,搜索并查找同时在科技类、生活类这两个类别中排序靠前的资源信息,并将这些同时在科技类、生活类这两个类别中具有挖掘次数的资源信息的识别信息、或者链接、或者标题、或者同时还包括摘要等信息向客户端发送,其中,在向客户端发送时,服务器可以将在科技类、生活类这两个类别中的挖掘次数相当的资源信息排在靠前的位置,当客户端的用户所订阅的是三个或者三个以上类别的资源信息时,具体的订阅原理与上述相同,在此不予赘述。此外,由于可以采用类型树的方式对资源信息所处的类别进行划分,因此,在用户对资源信息进行订阅时,可以选择类型树中的一个或者几个子树进行订阅,从而使得订阅方式更具灵活性。
根据上述方式,在具体进行订阅时,客户端向服务器端发送的订阅消息中,包含有客户端的用户所选择的一个以上的分类类别,当订阅消息中的分类类别具有两个或者两个以上时,则为交叉订阅,服务器接收到该订阅消息后,根据所采用的策略的不同,可以采用不同的交叉订阅的排序方式:
其一:服务器接收到订阅消息后,查找订阅消息中的各类别下的各个资源信息的挖掘次数,并对这些各类别下的各个资源信息不分类别、按照挖掘次数的大小进行排序;
其二:服务器接收到订阅消息后,查找订阅消息中的各类别下的各个资源信息的挖掘次数,计算各资源信息的挖掘次数在这几个类别上的加权和值,并根据加权和值的大小进行排序,其中,在确定各分类的加权系数时,可以是与 各类别在订阅消息中的位置有关,例如,位于订阅消息中的第一个分类类别具有较高的优先级,具有较大的加权系数等等,或者,各分类的加权系数也可以是与该服务器所处的专业类别有关,或者也可以采用其他的方式确定各分类的加权系统;
在服务器确定了交叉订阅的排序后,即可根据排序位置将资源信息的识别信息、或者链接、或者标题、或者同时还包括摘要等信息向客户端发送。
另外,在上述说明中,是以图2中所示出的类型树进行举例说明,而实际上,根据具体应用需要的不同,该类型树还可以采用其他的划分方式,此外,该类型树可以是不固定的,因为在某些情况下需要在分类中给出新的分类专题,例如举办奥运会时、神七发射时等等,此时,需要给出新的分类专题,且该分类专题可以是临时存在的,因而类型树是可以动态调整的,此时,在具体排序时,可以是增加相应的分类选择项,或者是调整新闻发布、发送挖掘信息时的提交分时等策略即可。
根据上述本发明的资源信息挖掘排序方法,本发明还提供一种资源信息挖掘排序装置,参见图3所示,该装置可具体包括:
数据收发模块301,用于接收从客户端发送的挖掘信息,该挖掘信息中包括所述资源信息的识别信息、所选择的挖掘类别信息;
挖掘信息分析模块302,该挖掘信息分析模块302与数据收发模块301连接,用于根据数据收发模块301所接收的挖掘信息中的资源信息识别信息、所选择的dig类别信息统计并更新该资源信息的所述dig类别的挖掘次数;
存储模块303,该存储模块303与挖掘信息分析模块302连接,用于存储各资源信息的各类别的挖掘次数;
排序分析模块304,该排序分析模块304与存储模块303连接,用于根据所述资源信息的各个类别的挖掘次数确定所述资源信息的排序。
其中,该存储模块303,还可以用于存储各资源信息的内容。且该存储模 块303还可以将排序分析模块304确定的资源信息的排序予以储存。
此外,该存储模块303还与数据收发模块301连接,该数据收发模块301还可以将存储模块303存储的资源信息内容以及资源信息的排序向客户端发送。
本发明的资源信息挖掘排序装置,对资源信息挖掘排序的具体实现方式可如上述资源信息挖掘排序方法中所述,在此不予多加赘述。
此外,根据上述本发明的资源信息挖掘排序装置,本发明还可以提供一种服务器,该服务器包括上述本发明的装置。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的权利要求保护范围之内。
Claims (7)
1.一种资源信息挖掘排序方法,其特征在于,包括步骤:
接收客户端的资源信息获取信息,所述资源信息获取信息中包括有资源信息的识别信息;
将所述识别信息对应的资源信息向所述客户端发送,并在发送所述资源信息的同时或者在接收到客户端发送的需要进行挖掘的信息时,将与所述资源信息对应的可选择类别向所述客户端发送;
接收客户端发送的挖掘信息,所述挖掘信息包括所述识别信息、所选择的挖掘类别信息;
根据所述挖掘信息更新所述资源信息的所述挖掘类别的挖掘次数;
根据所述资源信息的各个类别的挖掘次数确定所述资源信息的排序。
2.根据权利要求1所述的资源信息挖掘排序方法,其特征在于:
将所有的分类类别确定为所述资源信息的可选择类别;
或者是
根据所述识别信息,获取所述资源信息的当前所属类别,并根据所述当前所属类别确定所述资源信息的可选择类别;
或者是
根据所述识别信息,获取所述资源信息的当前所属类别,将所述当前所属类别的所有子类别确定为所述资源信息的可选择类别;
或者是
根据所述识别信息,获取所述资源信息的当前所属类别,将所述当前所属类别的所有兄弟类别确定为所述资源信息的可选择类别。
3.根据权利要求1或2所述的资源信息挖掘排序方法,其特征在于,所述识别信息包括所述资源信息的URL或者所述资源信息的编号。
4.根据权利要求1或2所述的资源信息挖掘排序方法,其特征在于,所述根据资源信息的各个类别的挖掘次数确定所述资源信息的排序方式包括:
当所述资源信息的第二类别的挖掘次数大于主类别的挖掘次数时,将所述第二类别设为所述资源信息的新的主类别;
或者是
当所述资源信息的第二类别的挖掘次数减去所述资源信息的主类别的挖掘次数的差值大于或者等于预设差值时,将所述第二类别设为所述资源信息的新的主类别。
5.根据权利要求1或2所述的资源信息挖掘排序方法,其特征在于,所述根据资源信息的各个类别的挖掘次数确定所述资源信息的排序方式包括:
统计所述资源信息在各个类别的挖掘次数的和值,将该和值与各资源信息的挖掘次数的和值进行比较,并根据比较结果确定该资源信息的综合排序;
或者是
统计所述资源信息在各个类别的挖掘次数的加权和值,将该加权和值与各资源信息的挖掘次数的加权和值进行比较,并根据比较结果确定该资源信息的综合排序;
或者是
分别统计所述资源信息在各个类别的挖掘次数,分别与各类别的资源信息的挖掘次数进行比较,并根据比较结果确定该资源信息在各类别的排序;
或者是
分别统计所述资源信息在各个类别的挖掘次数,分别与各类别的资源信息的挖掘次数进行比较,根据比较结果确定该资源信息在各类别的排序,并根据该资源信息在各类别的排序,确定该资源信息的综合排序;
或者是
统计所述资源信息的挖掘次数最多的两个或者两个以上的类别,确定该资源信息的交叉排行类型以及该资源信息的交叉排行类型的排序。
6.一种资源信息挖掘排序装置,其特征在于,包括:
数据收发模块,用于接收客户端的资源信息获取信息,所述资源信息获取信息中包括有资源信息的识别信息,将所述识别信息对应的资源信息向所述客户端发送,并在发送所述资源信息的同时或者在接收到客户端发送的需要进行挖掘的信息时,将与所述资源信息对应的可选择的分类类别向所述客户端发送,并接收客户端发送的挖掘信息,所述挖掘信息包括所述识别信息、所选择的挖掘类别信息;
挖掘信息分析模块,该挖掘信息分析模块与所述数据收发模块连接,用于根据所述挖掘信息统计并更新所述资源信息的所述挖掘类别的挖掘次数;
排序分析模块,用于根据所述资源信息的各个类别的挖掘次数确定所述资源信息的排序。
7.一种服务器,其特征在于,所述服务器包括权利要求6所述的资源信息挖掘排序装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100373947A CN101493836B (zh) | 2009-02-25 | 2009-02-25 | 一种资源信息挖掘排序方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100373947A CN101493836B (zh) | 2009-02-25 | 2009-02-25 | 一种资源信息挖掘排序方法、装置及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101493836A CN101493836A (zh) | 2009-07-29 |
CN101493836B true CN101493836B (zh) | 2011-08-03 |
Family
ID=40924438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009100373947A Active CN101493836B (zh) | 2009-02-25 | 2009-02-25 | 一种资源信息挖掘排序方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101493836B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102306232B (zh) * | 2011-06-07 | 2013-07-17 | 中国电子科技集团公司第二十八研究所 | 一种针对多类辐射源的电抗特征组合的选择方法 |
CN102750320B (zh) * | 2012-05-18 | 2015-04-15 | 合一网络技术(北京)有限公司 | 一种网络视频实时关注度的计算方法、装置和系统 |
CN103605673B (zh) * | 2013-10-29 | 2017-06-09 | 北京奇虎科技有限公司 | 一种用于分析多个网络资源点的方法和装置 |
CN103761234A (zh) * | 2013-10-29 | 2014-04-30 | 北京奇虎科技有限公司 | 一种用于优化网络资源点的搜索排名的方法和装置 |
CN111654427A (zh) * | 2013-11-22 | 2020-09-11 | 杭州惠道科技有限公司 | 社交媒体系统 |
CN104967555A (zh) * | 2015-05-19 | 2015-10-07 | 小米科技有限责任公司 | 网络社区信息发表时间的更新方法、装置及服务器 |
CN110321884B (zh) * | 2019-06-13 | 2020-11-13 | 贝式计算(天津)信息技术有限公司 | 编号识别的方法及装置 |
CN110442615B (zh) * | 2019-07-15 | 2023-10-10 | 中国平安人寿保险股份有限公司 | 资源信息处理方法、装置、电子设备及存储介质 |
-
2009
- 2009-02-25 CN CN2009100373947A patent/CN101493836B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN101493836A (zh) | 2009-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101493836B (zh) | 一种资源信息挖掘排序方法、装置及服务器 | |
US9946434B2 (en) | System and method for simultaneous display of multiple information sources | |
US7376907B2 (en) | System and method for simultaneous display of multiple information sources | |
US8224711B2 (en) | Method and apparatus for creating contextualized auction feeds | |
EP1486889B1 (en) | Mobile information services based on cached information at the terminal | |
US8769413B2 (en) | System, method and computer program product for a multifunction toolbar for internet browsers | |
CN102473186B (zh) | 标记多个数字图像的系统和方法 | |
US20050097180A1 (en) | System and method for improved customized portal web pages | |
CN103282937A (zh) | 用于在社交网络中共享内容的内容共享接口 | |
CN103238150A (zh) | 由多个用户对博客的实时同步文档编辑 | |
US20090204902A1 (en) | System and interface for co-located collaborative web search | |
US9942359B2 (en) | Method and system for synchronizing software module hosts | |
KR20210090133A (ko) | 검색 서비스와 연결된 메시지 서비스를 위한 메시지 서비스 제공 방법 및 상기 메시지 서비스 제공 방법을 수행하는 메시지 서버 및 사용자 단말 | |
US20040210491A1 (en) | Method for ranking user preferences | |
CN104102733B (zh) | 搜索内容提供方法和搜索引擎 | |
KR101887594B1 (ko) | 클라우드 네트워크 기반 데이터 시각화 방법 및 장치 | |
US7792969B2 (en) | Message interface for configuring web services for remote portlets | |
KR101597843B1 (ko) | 기능 레벨들을 어드레싱하는 컨텐츠 관리 | |
CN105045835A (zh) | 信息搜索方法和装置 | |
CN1524238A (zh) | 用于定义和呈现复合网页的系统及方法 | |
CN114979053B (zh) | 即时通信会话管理方法、装置、系统、设备和介质 | |
KR20210009990A (ko) | 이동통신 단말기의 어플리케이션 데이터 연동을 이용한 개인비서 시스템 | |
CN107562424A (zh) | 一种网页显示方法、客户端及服务器 | |
CN104123057A (zh) | 通信信息获取方法、装置、系统及终端 | |
CN110457547A (zh) | 搜索词推荐和展示方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20151221 Address after: The South Road in Guangdong province Shenzhen city Fiyta building 518000 floor 5-10 Nanshan District high tech Zone Patentee after: Shenzhen Tencent Computer System Co., Ltd. Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403 Patentee before: Tencent Technology (Shenzhen) Co., Ltd. |