CN102970324A - 一种推送微博的方法及装置 - Google Patents
一种推送微博的方法及装置 Download PDFInfo
- Publication number
- CN102970324A CN102970324A CN2012103850352A CN201210385035A CN102970324A CN 102970324 A CN102970324 A CN 102970324A CN 2012103850352 A CN2012103850352 A CN 2012103850352A CN 201210385035 A CN201210385035 A CN 201210385035A CN 102970324 A CN102970324 A CN 102970324A
- Authority
- CN
- China
- Prior art keywords
- microblogging
- user
- keyword
- intention classification
- intention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
本发明公开了一种推送微博的方法及装置,用以解决现有技术中用户获取其需要的微博的效率较低,而且浪费服务器的处理资源的问题。该方法服务器接收用户发布的微博,并确定该微博中的关键词,根据确定出的关键词确定该微博所属的第一意图类别,根据预先设定的各意图类别之间的互补关系,确定与第一意图类别互补的第二意图类别,将属于第二意图类别的微博推送给该用户。通过上述方法,服务器可以根据用户发布的微博,确定出用户发布该微博的意图,并根据该意图,将与该意图互补的其他意图的微博推送给该用户,从而使用户获得其需要的微博,而无需不断的通过关键词进行搜索,因此提高了用户获取其需要的微博的效率,也节省了服务器的处理资源。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种推送微博的方法及装置。
背景技术
目前,微博在社会化媒体中的应用越来越具有影响力,已经成为用户进行信息发布、交流、获取的主要手段之一。
通过微博应用,用户除了可以对诸如好友等其他用户进行关注,以定制关注的其他用户发布的信息之外,还可以通过搜索的方式搜索其感兴趣的微博。
例如,对于用户A和用户B,如果用户B关注了用户A,则可以将用户B称之为用户A的粉丝,用户A发布的微博会自动被推送至用户B。如果用户A发布了一条微博“在哪能买到某品牌正版手机”,则这条微博会被服务器自动的推送到用户B,用户B则可以对该微博进行回复或者评论。
通过上例中用户A发布的微博,可以看出用户A发布的该微博是用于询问如何购买某品牌正版手机的微博,显然,用户A发布该微博的意图是要获得某品牌正版手机的购买渠道,而该用户A的粉丝(用户B)并不一定是能够提供上述购买渠道的用户。
另外,即使将“某品牌正版手机”、“买”作为关键词进行搜索,搜索到的也是包含有这些关键词的微博,也即,搜索到的大多数微博也是同样想要获得某品牌正版手机的购买渠道的用户发布的微博,而并不是提供这个购买渠道的微博。
由上例可见,现有技术中服务器并不能将用户实际需要的微博推送给该用户,导致用户只能不断的变更关键词以搜索其需要的微博,这样不仅降低了用户获取需要的微博的效率,也会浪费服务器的处理资源。
发明内容
本发明实施例提供一种推送微博的方法及装置,用以解决现有技术中用户获取其需要的微博的效率较低,而且浪费服务器的处理资源的问题。
本发明实施例提供的一种推送微博的方法,包括:
接收用户发布的微博,确定接收到的所述微博中的关键词;
根据确定出的关键词,在预设的各意图类别中,确定所述微博所属的第一意图类别;
根据预先设定的各意图类别之间的互补关系,确定与所述第一意图类别互补的第二意图类别;
将属于所述第二意图类别的微博推送给所述用户。
本发明实施例提供的一种推送微博的装置,包括:
接收模块,用于接收用户发布的微博,确定接收到的所述微博中的关键词;
分类模块,用于根据确定出的关键词,在预设的各意图类别中,确定所述微博所属的第一意图类别;
搜索模块,用于根据预先设定的各意图类别之间的互补关系,确定与所述第一意图类别互补的第二意图类别;
推送模块,用于将属于所述第二意图类别的微博推送给所述用户。
本发明实施例提供一种推送微博的方法及装置,该方法服务器接收用户发布的微博,并确定该微博中的关键词,根据确定出的关键词确定该微博所属的第一意图类别,根据预先设定的各意图类别之间的互补关系,确定与第一意图类别互补的第二意图类别,将属于第二意图类别的微博推送给该用户。通过上述方法,服务器可以根据用户发布的微博,确定出用户发布该微博的意图,并根据该意图,将与该意图互补的其他意图的微博推送给该用户,从而使用户获得其需要的微博,而无需不断的通过关键词进行搜索,因此提高了用户获取其需要的微博的效率,也节省了服务器的处理资源。
附图说明
图1为本发明实施例提供的推送微博的过程;
图2为本发明实施例提供的推送微博的装置结构示意图。
具体实施方式
现有技术中用户发布的微博虽然可以被服务器自动推送给该用户的粉丝,但该用户的粉丝不一定能为该用户提供其需要的信息,而即使通过关键词搜索其想要的微博,也要不断的变更关键词进行搜索,再辅以人为的筛选才能得到其想要的微博,显然,现有技术中用户获取需要的微博的效率较低,不断的通过关键词搜索也会浪费服务器的处理资源。本发明实施例为了提高用户获取其需要的微博的效率,节省服务器的处理资源,服务器在接收到用户发布的微博后,确定该微博中的关键词,并根据确定的关键词分析该用户发布该微博的意图,再根据确定的意图,将与该意图互补的其他意图的微博推送给该用户,从而使用户获得其需要的微博,而无需不断的通过关键词进行搜索,因此提高了用户获取其需要的微博的效率,也节省了服务器的处理资源。
下面结合说明书附图,对本发明实施例进行详细描述。
图1为本发明实施例提供的推送微博的过程,具体包括以下步骤:
S101:接收用户发布的微博,确定接收到的该微博中的关键词。
在本发明实施例中,服务器接收到用户发布的一条微博后,可以对该微博进行分词操作和语法分析,将满足预设条件的分词确定为该微博的关键词,例如,将类型为动词类型、状语类型的分词确定为该微博的关键词。
例如,用户发布的一条微博为:在哪能买到品牌A正版手机。将该微博记为微博m,则对该微博m进行分词操作和语法分析后,可以确定“买”为动词类型的分词,“哪”为状语类型的分词,因此该微博m的关键词为“买”和“哪”。
S102:根据确定出的关键词,在预设的各意图类别中,确定该微博所属的第一意图类别。
在本发明实施例中,预先设定了若干个意图类别,例如获取类别、询问类别、提供类别、答复类别等,在通过步骤S101确定出了一条微博的关键词后,则可以确定出的关键词,确定该微博所属的意图类别,记为第一意图类别。
具体的,可以针对每个意图类别都预先设定相应的关键词库,并针对意图类别对应的关键词库中包含的每个关键词,都设定相应的句型模板,则根据确定出的关键词,确定该微博所属的第一意图类别的方法具体为:根据确定出的关键词,以及预先设定的每个意图类别对应的关键词库,确定满足第一指定条件的意图类别,其中,第一指定条件为:对应的关键词库中包含该微博中的关键词;在确定出的意图类别中,确定满足第二指定条件的意图类别,作为该微博所属的第一意图类别,其中,满足第二指定条件的意图类别为:预先为该意图类别对应的关键词库中包含的该微博中的关键词设定的句型模板,与该微博中的关键词所在的分句的句型匹配。
继续沿用上例,假设预先为获取类别设定的关键词库中包含“买”、“获得”、“获取”、“要”、“哪”、“如何”、“怎么”、“想”等关键词,则由于确定的该微博m的关键词为“买”和“哪”,从而该获取类别对应关键词库中包含该微博m的关键词,因此获取类别为满足第一指定条件的意图类别。
进一步的,假设预先为该获取类别对应的关键词库中包含的关键词“买”(关键词“买”是微博m中的关键词)设定的句型模板为以下三种:
第一种、人名类型的分词+状语类型的分词+“买”+名词类型的分词;
第二种、代词类型的分词+状语类型的分词+“买”+名词类型的分词;
第三种、状语类型的分词+“买”+名词类型的分词;
上述三种句型模板中的状语类型的分词具体可以是预设的该获取类别对应的关键词库中包含的状语类型的关键词。
由于该微博m的关键词“买”所在的分句为“在哪能买到品牌A正版手机”,其中,分词“哪”是该获取类别对应的关键词库中包含的状语类型的关键词,分词“品牌A手机”是名词类型的分词,因此该微博m的关键词“买”所在的分句的句型与上述第三种句型模板匹配,从而该获取类别是满足第二指定条件的意图类别,进而,该微博m所属的第一意图类别即为获取类别。
S103:根据预先设定的各意图类别之间的互补关系,确定与第一意图类别互补的第二意图类别。
在本发明实施例中,可以预先设定各意图类别之间的互补关系。继续沿用上例,可以预先将获取类别与提供类别设定为具有互补关系的两个类别,将询问类别与答复类别设定为具有互补关系的两个类别。由于确定的该微博m所属的第一意图类别为获取类别,因此与该第一意图类别具有互补关系的第二意图类别即为提供类别。
S104:将属于第二意图类别的微博推送给该用户。
继续沿用上例,由于确定出的第二意图类别为提供类别,因此将属于该提供类别的微博推送给该用户。
较佳的,服务器在将属于第二意图类别的微博推送给该用户之前,还可以在该微博中的关键词所在的分句中,提取指定类型的分词,将提取的该分词作为该微博的意图对象词。也即,服务器针对接收到的用户发布的微博,除了要确定该微博所属的第一意图类别之外,还要确定该微博的意图对象词。
在向该用户推送微博时,则在属于该第二意图类别的微博中,选择包含的意图对象词与该用户发布的该微博的意图对象词相同的微博,并推送给该用户。其中,该指定类型的分词可以为名词类型的分词。
继续沿用上例,由于该用户发布的微博m的关键词“买”和“哪”所在的分句为“在哪能买到品牌A正版手机”,该分句中名词类型的分词即为“品牌A正版手机”,因此,该微博m的意图对象词为“品牌A正版手机”。至此,服务器可以确定出用户发布该微博m的意图是要获取,意图对象是品牌A正保手机,也即,该用户发布该微博m的目的是要获取品牌A正版手机。
从而,服务器在向该用户推送微博时,向该用户推送属于第二意图类别(提供类别)、且包含的意图对象词与该微博m的意图对象词相同的微博,也即,向该用户推送目的为提供品牌A正版手机的微博。
另外,考虑到对于某些微博而言,上述方法不一定能够确定出这些微博的意图对象词,例如,用户1发布的一条微博为“某餐厅新推出一款XX汉堡很好吃”,用户2对用户1发布的微博的评论为“我也想吃”,则对与用户2发布的这条“我也想吃”的微博(用于评论用户1发布的微博),上述方法则不能确定出该微博的意图对象词。因此,本发明实施例中针对用户发布的微博,如果在该微博的关键词所在的分句中未提取到指定类型的分词,也即采用上述方法不能确定出该微博的意图对象词时,则将该微博所评论的原始微博的意图对象词,作为该微博的意图对象词。
继续以上述用户1和用户2发布的微博为例进行说明,由于用户2发布的微博“我也想吃”中不包含指定类型的分词,因此仅根据用户2发布的该微博,并不能确定出该微博的意图对象词。而用户2发布的该微博所评论的原始微博为用户1发布的微博“某餐厅新推出一款XX汉堡很好吃”,用户1发布的微博的意图对象词为“XX汉堡”,因此直接将该原始微博的意图对象词“XX汉堡”作为用户2发布的微博的意图对象词。
通过上述方法,服务器可以根据用户发布的微博中的关键词,确定出该微博所属的意图类别,也即确定出用户发布该微博的意图,再将与该意图类别具有互补关系的其他意图类别中的微博推送给该用户,从而可以使用户获得其实际想要的微博,从而提高了用户获取其需要的微博的效率。另外,通过上述方法,用户也无需不断的通过关键词搜索其需要的微博,因此也节省了服务器的处理资源。
进一步的,在本发明实施例中,服务器在将属于第二意图类别的微博推送给该用户时,可以分别确定属于第二意图类别的每个微博与该用户发布的该微博的相似度,并将属于第二意图类别、且与该用户发布的微博的相似度最大的微博推送给该用户。其中,确定属于第二意图类别的一个微博与该用户发布的微博的相似度时,可以采用余弦相似度算法或者欧氏距离算法进行确定,下面以采用余弦相似度算法为例进行说明。
采用余弦相似度算法确定属于第二意图类别的一个微博与该用户发布的微博的相似度的方法具体为:根据预设的若干个关键词,确定关键词特征向量,该关键词特征向量中的每个元素与预设的每个关键词一一对应;根据该关键词特征向量,采用第一指定方法确定第一特征向量,该第一指定方法包括:针对该关键词特征向量中的每个元素,根据该元素与对应的关键词在该用户发布的微博中出现的次数,对该元素进行赋值;根据该关键词特征向量,采用第二指定方法确定第二特征向量,该第二指定方法包括:针对该关键词特征向量中的每个元素,根据该元素对应的关键词在属于第二意图类别的微博中出现的次数,对该元素进行赋值;采用公式确定属于第二意图类别的该微博与该用户发布的微博的相似度,其中,Q为第一特征向量,M为第二特征向量,qi为第一特征向量中第i个元素的值,mi为第二特征向量中第i个元素的值,sim(Q,M)为属于第二意图类别的该微博与该用户发布的微博的相似度。
继续以微博m为例,由于微博m属于获取类别,与获取类别具有互补关系的第二意图类别为提供类别,在属于该提供类别的一个微博与该微博m的相似度时,先根据预设的若干个关键词,确定关键词特征向量。其中,预设的若干个关键词可以为第一意图类别(获取类别)对应的关键词库和第二意图类别(提供类别)对应的关键词库中均包含的若干个关键词。
假设第一意图类别对应的关键词库和第二意图类别对应的关键词库中均包含“买”、“获得”、“获取”、“要”这四个关键词,则确定的关键词特征向量为[X1,X2,X3,X4],其中,元素X1对应关键词“买”,元素X2对应关键词“获得”,元素X3对应关键词“获取”,元素X4对应关键词“要”。
由于该微博m为“在哪能买到品牌A正版手机”,关键词“买”在该微博m中出现了1次,其他关键词出现了0次,因此将元素X1赋值为1,其他元素赋值为0,从而,得到的第一特征向量为Q=[q1,q2,q3,q4]=[1,0,0,0]。
类似的,可以根据上述四个关键词在属于第二意图类别的微博中出现的次数,对相应的四个元素也进行赋值,假设得到的第二特征向量为M=[m1,m2,m3,m4],则采用公式确定属于第二意图类别的微博与该微博m的相似度。
采用上述方法确定该微博m与每个属于第二意图类别的微博的相似度后,则可以将属于第二意图类别、且确定的相似度最大的微博推送给发送该微博m的用户。
另外,考虑到实际应用中用户发布微博的意图往往具有较强的时效性,例如用户发布的微博为“北四环堵不堵”,采用上述方法可以确定该微博属于交通情况询问类别,如果直接将与其具有互补关系的交通情况答复类别中的微博推送给该用户,则推送的微博可能并不是描述当前北四环交通情况的微博。因此,在本发明实施例中,在将属于第二意图类别的微博推送给该用户时,可以确定该用户发布该微博的第一时刻,并在属于第二意图类别的微博中,确定发布的时刻与该第一时刻的差值的绝对值不大于设定阈值的微博,并推送给该用户。其中,该设定阈值可以根据需要进行设定,例如设定为30分钟。该设定阈值也可以根据用户发布的微博所属的第一意图类别而设定,不同意图类别的设定阈值可以相同,也可以不同。
进一步的,考虑到实际应用中用户发布微博的意图也可能具有较强的地域性,因此,在将属于第二意图类别的微博推送给该用户时,也可以根据该用户发布该微博时所采用的网络互连协议(Internet Protocol,IP)地址信息,确定该用户的地理位置信息,作为该用户发布的该微博对应的地理位置信息,并在属于第二意图类别的微博中,确定对应的地理位置信息与该用户发布的微博对应的地理位置信息相同的微博,并推送给该用户。
当然,服务器在将属于第二意图类别的微博推送给用户时,也可以采用上述相同的意图对象词、相似度最大、相近的发布时刻、相同的地理位置信息中的一种或几种组合的方法对属于第二意图类别的微博进行筛选并推送。较佳的,可以在属于第二意图类别的微博中,先筛选出意图对象词与该用户发布的微博的意图对象词相同的微博,再从筛选出的微博中进一步筛选出发布时刻相近或者地理位置信息相同的微博,最后从进一步筛选出的微博中确定出与该用户发布的微博的相似度最大的微博推送给该用户。
在本发明实施例中,用户发布了一条微博之后,除了采用上述方法将与该微博的意图互补的其他意图的微博推送给该用户之外,还可以将某些可以为该用户提供相应答复的其他用户的用户信息推送给该用户。具体的,用户发布了一条微博之后,服务器除了将互补的第二意图类别的微博推送给该用户之外,还可以将满足第三指定条件的用户信息推送给该用户,其中,在一个用户发布的所有微博中,如果属于第二意图类别的微博的数量最多,则该用户的用户信息为满足第三指定条件的用户信息。
例如,用户1发布了一条微博“经常失眠,哎!”,则服务器采用上述方法可以确定该微博属于健康咨询类别(第一意图类别),从而,服务器将与该健康咨询类别具有互补关系的健康答复类别(第二意图类别)下的微博推送给用户1之后,如果针对另一个用户,记为用户2,该用户2发布的所有微博中属于健康答复类别的微博的数量最多,则该用户2的用户信息即为满足第三指定条件的用户信息,因此将用户2的用户信息也推送给用户1。
当然,满足第三指定条件的用户信息还可以为:如果一个用户发布属于第二意图类别的微博的频率高于设定频率,则该用户的用户信息满足第三指定条件。
通过上述方法,服务器除了将用户实际需要的微博推送给用户之外,还可以将能够提供该用户所需的信息的其他用户的用户信息推送给该用户,用户如果对服务器推送的微博不满意,则可以直接根据推送的用户信息与相应的用户进行交互,以获得其需要的信息,可以进一步提高用户获取其需要的微博的效率。
另外,在通过如图1所示的方法确定用户发布的微博所属的第一意图类别时,如果确定出该微博所属的第一意图类别为两个以上的意图类别,或者未确定出该微博属于任何意图类别,则可以放弃向该用户推送微博。并且,服务器在向用户推送微博时,可以通过以要推送的微博对该用户发布的微博进行评论的方式,向该用户推送微博。
以上为本发明实施例提供的推送微博的方法,基于同样的思路,本发明实施例还提供一种推送微博的装置,如图2所示。
图2为本发明实施例提供的推送微博的装置结构示意图,具体包括:
接收模块201,用于接收用户发布的微博,确定接收到的所述微博中的关键词;
分类模块202,用于根据确定出的关键词,在预设的各意图类别中,确定所述微博所属的第一意图类别;
搜索模块203,用于根据预先设定的各意图类别之间的互补关系,确定与所述第一意图类别互补的第二意图类别;
推送模块204,用于将属于所述第二意图类别的微博推送给所述用户。
所述分类模块202具体用于,根据确定出的关键词,以及预先设定的每个意图类别对应的关键词库,确定满足第一指定条件的意图类别,其中,所述第一指定条件为:对应的关键词库中包含所述微博中的关键词;在确定出的意图类别中,确定满足第二指定条件的意图类别,作为所述微博所属的第一意图类别,其中,满足第二指定条件的意图类别为:预先为该意图类别对应的关键词库中包含的所述微博中的关键词设定的句型模板,与所述微博中的关键词所在的分句的句型匹配。
所述分类模块202还用于,在所述微博中的关键词所在的分句中,提取指定类型的分词,将提取的所述分词作为所述微博的意图对象词。
所述推送模块204具体用于,在属于所述第二意图类别的微博中,选择包含的意图对象词与所述用户发布的所述微博的意图对象词相同的微博,推送给所述用户。
所述推送模块204具体用于,分别确定属于所述第二意图类别的每个微博与所述用户发布的微博的相似度,将属于所述第二意图类别、且与所述用户发布的微博的相似度最大的微博推送给所述用户。
所述推送模块204具体用于,根据预设的若干个关键词,确定关键词特征向量,所述关键词特征向量中的每个元素与预设的每个关键词一一对应;根据所述关键词特征向量,采用第一指定方法确定第一特征向量,所述第一指定方法包括:针对所述关键词特征向量中的每个元素,根据该元素对应的关键词在所述用户发布的微博中出现的次数,对该元素进行赋值;根据所述关键词特征向量,采用第二指定方法确定第二特征向量,所述第二指定方法包括:针对所述关键词特征向量中的每个元素,根据该元素对应的关键词在属于所述第二意图类别的该微博中出现的次数,对该元素进行赋值;采用公式确定属于所述第二意图类别的该微博与所述用户发布的微博的相似度,其中,Q为所述第一特征向量,M为所述第二特征向量,qi为所述第一特征向量中第i个元素的值,mi为所述第二特征向量中第i个元素的值,sim(Q,M)为属于所述第二意图类别的该微博与所述用户发布的微博的相似度。
所述推送模块204具体用于,确定所述用户发布所述微博的第一时刻,在属于所述第二意图类别的微博中,确定发布的时刻与所述第一时刻的差值的绝对值不大于设定阈值的微博,并推送给所述用户。
所述推送模块204具体用于,根据所述用户发布所述微博时所采用的网络互连协议IP地址信息,确定所述用户的地理位置信息,作为所述用户发布的所述微博对应的地理位置信息;在属于所述第二意图类别的微博中,确定对应的地理位置信息与所述用户发布的所述微博对应的地理位置信息相同的微博,并推送给所述用户。
所述推送模块204还用于,将满足第三指定条件的用户信息推送给所述用户,其中,在一个用户发布的所有微博中,如果属于所述第二意图类别的微博的数量最多,则该用户的用户信息为满足所述第三指定条件的用户信息。
具体的,上述推送微博的装置可以位于服务器中。
本发明实施例提供一种推送微博的方法及装置,该方法服务器接收用户发布的微博,并确定该微博中的关键词,根据确定出的关键词确定该微博所属的第一意图类别,根据预先设定的各意图类别之间的互补关系,确定与第一意图类别互补的第二意图类别,将属于第二意图类别的微博推送给该用户。通过上述方法,服务器可以根据用户发布的微博,确定出用户发布该微博的意图,并根据该意图,将与该意图互补的其他意图的微博推送给该用户,从而使用户获得其需要的微博,而无需不断的通过关键词进行搜索,因此提高了用户获取其需要的微博的效率,也节省了服务器的处理资源。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (18)
1.一种推送微博的方法,其特征在于,包括:
接收用户发布的微博,确定接收到的所述微博中的关键词;
根据确定出的关键词,在预设的各意图类别中,确定所述微博所属的第一意图类别;
根据预先设定的各意图类别之间的互补关系,确定与所述第一意图类别互补的第二意图类别;
将属于所述第二意图类别的微博推送给所述用户。
2.如权利要求1所述的方法,其特征在于,根据确定出的关键词,在预设的各意图类别中,确定所述微博所属的第一意图类别,具体包括:
根据确定出的关键词,以及预先设定的每个意图类别对应的关键词库,确定满足第一指定条件的意图类别,其中,所述第一指定条件为:对应的关键词库中包含所述微博中的关键词;
在确定出的意图类别中,确定满足第二指定条件的意图类别,作为所述微博所属的第一意图类别,其中,满足第二指定条件的意图类别为:预先为该意图类别对应的关键词库中包含的所述微博中的关键词设定的句型模板,与所述微博中的关键词所在的分句的句型匹配。
3.如权利要求2所述的方法,其特征在于,将属于所述第二意图类别的微博推送给所述用户之前,所述方法还包括:
在所述微博中的关键词所在的分句中,提取指定类型的分词,将提取的所述分词作为所述微博的意图对象词。
4.如权利要求3所述的方法,其特征在于,将属于所述第二意图类别的微博推送给所述用户,具体包括:
在属于所述第二意图类别的微博中,选择包含的意图对象词与所述用户发布的所述微博的意图对象词相同的微博,推送给所述用户。
5.如权利要求1所述的方法,其特征在于,将属于所述第二意图类别的微博推送给所述用户,具体包括:
分别确定属于所述第二意图类别的每个微博与所述用户发布的微博的相似度;
将属于所述第二意图类别、且与所述用户发布的微博的相似度最大的微博推送给所述用户。
6.如权利要求5所述的方法,其特征在于,确定属于所述第二意图类别的一个微博与所述用户发布的微博的相似度,具体包括:
根据预设的若干个关键词,确定关键词特征向量,所述关键词特征向量中的每个元素与预设的每个关键词一一对应;
根据所述关键词特征向量,采用第一指定方法确定第一特征向量,所述第一指定方法包括:针对所述关键词特征向量中的每个元素,根据该元素对应的关键词在所述用户发布的微博中出现的次数,对该元素进行赋值;
根据所述关键词特征向量,采用第二指定方法确定第二特征向量,所述第二指定方法包括:针对所述关键词特征向量中的每个元素,根据该元素对应的关键词在属于所述第二意图类别的该微博中出现的次数,对该元素进行赋值;
采用公式确定属于所述第二意图类别的该微博与所述用户发布的微博的相似度,其中,Q为所述第一特征向量,M为所述第二特征向量,qi为所述第一特征向量中第i个元素的值,mi为所述第二特征向量中第i个元素的值,sim(Q,M)为属于所述第二意图类别的该微博与所述用户发布的微博的相似度。
7.如权利要求1所述的方法,其特征在于,将属于所述第二意图类别的微博推送给所述用户,具体包括:
确定所述用户发布所述微博的第一时刻;
在属于所述第二意图类别的微博中,确定发布的时刻与所述第一时刻的差值的绝对值不大于设定阈值的微博,并推送给所述用户。
8.如权利要求1所述的方法,其特征在于,将属于所述第二意图类别的微博推送给所述用户,具体包括:
根据所述用户发布所述微博时所采用的网络互联协议IP地址信息,确定所述用户的地理位置信息,作为所述用户发布的所述微博对应的地理位置信息;
在属于所述第二意图类别的微博中,确定对应的地理位置信息与所述用户发布的所述微博对应的地理位置信息相同的微博,并推送给所述用户。
9.如权利要求1所述的方法,其特征在于,所述方法还包括:
将满足第三指定条件的用户信息推送给所述用户,其中,在一个用户发布的所有微博中,如果属于所述第二意图类别的微博的数量最多,则该用户的用户信息为满足所述第三指定条件的用户信息。
10.一种推送微博的装置,其特征在于,包括:
接收模块,用于接收用户发布的微博,确定接收到的所述微博中的关键词;
分类模块,用于根据确定出的关键词,在预设的各意图类别中,确定所述微博所属的第一意图类别;
搜索模块,用于根据预先设定的各意图类别之间的互补关系,确定与所述第一意图类别互补的第二意图类别;
推送模块,用于将属于所述第二意图类别的微博推送给所述用户。
11.如权利要求10所述的装置,其特征在于,所述分类模块具体用于,根据确定出的关键词,以及预先设定的每个意图类别对应的关键词库,确定满足第一指定条件的意图类别,其中,所述第一指定条件为:对应的关键词库中包含所述微博中的关键词;在确定出的意图类别中,确定满足第二指定条件的意图类别,作为所述微博所属的第一意图类别,其中,满足第二指定条件的意图类别为:预先为该意图类别对应的关键词库中包含的所述微博中的关键词设定的句型模板,与所述微博中的关键词所在的分句的句型匹配。
12.如权利要求11所述的装置,其特征在于,所述分类模块还用于,在所述微博中的关键词所在的分句中,提取指定类型的分词,将提取的所述分词作为所述微博的意图对象词。
13.如权利要求12所述的装置,其特征在于,所述推送模块具体用于,在属于所述第二意图类别的微博中,选择包含的意图对象词与所述用户发布的所述微博的意图对象词相同的微博,推送给所述用户。
14.如权利要求10所述的装置,其特征在于,所述推送模块具体用于,分别确定属于所述第二意图类别的每个微博与所述用户发布的微博的相似度,将属于所述第二意图类别、且与所述用户发布的微博的相似度最大的微博推送给所述用户。
15.如权利要求14所述的装置,其特征在于,所述推送模块具体用于,根据预设的若干个关键词,确定关键词特征向量,所述关键词特征向量中的每个元素与预设的每个关键词一一对应;根据所述关键词特征向量,采用第一指定方法确定第一特征向量,所述第一指定方法包括:针对所述关键词特征向量中的每个元素,根据该元素对应的关键词在所述用户发布的微博中出现的次数,对该元素进行赋值;根据所述关键词特征向量,采用第二指定方法确定第二特征向量,所述第二指定方法包括:针对所述关键词特征向量中的每个元素,根据该元素对应的关键词在属于所述第二意图类别的该微博中出现的次数,对该元素进行赋值;采用公式确定属于所述第二意图类别的该微博与所述用户发布的微博的相似度,其中,Q为所述第一特征向量,M为所述第二特征向量,qi为所述第一特征向量中第i个元素的值,mi为所述第二特征向量中第i个元素的值,sim(Q,M)为属于所述第二意图类别的该微博与所述用户发布的微博的相似度。
16.如权利要求10所述的装置,其特征在于,所述推送模块具体用于,确定所述用户发布所述微博的第一时刻,在属于所述第二意图类别的微博中,确定发布的时刻与所述第一时刻的差值的绝对值不大于设定阈值的微博,并推送给所述用户。
17.如权利要求10所述的装置,其特征在于,所述推送模块具体用于,根据所述用户发布所述微博时所采用的网络互连协议IP地址信息,确定所述用户的地理位置信息,作为所述用户发布的所述微博对应的地理位置信息;在属于所述第二意图类别的微博中,确定对应的地理位置信息与所述用户发布的所述微博对应的地理位置信息相同的微博,并推送给所述用户。
18.如权利要求10所述的装置,其特征在于,所述推送模块还用于,将满足第三指定条件的用户信息推送给所述用户,其中,在一个用户发布的所有微博中,如果属于所述第二意图类别的微博的数量最多,则该用户的用户信息为满足所述第三指定条件的用户信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210385035.2A CN102970324B (zh) | 2012-10-11 | 2012-10-11 | 一种推送微博的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210385035.2A CN102970324B (zh) | 2012-10-11 | 2012-10-11 | 一种推送微博的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102970324A true CN102970324A (zh) | 2013-03-13 |
CN102970324B CN102970324B (zh) | 2016-07-13 |
Family
ID=47800204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210385035.2A Active CN102970324B (zh) | 2012-10-11 | 2012-10-11 | 一种推送微博的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102970324B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103747000A (zh) * | 2014-01-13 | 2014-04-23 | 深圳市深信服电子科技有限公司 | 接入无线网络的认证方法及装置 |
CN104281610A (zh) * | 2013-07-08 | 2015-01-14 | 腾讯科技(深圳)有限公司 | 过滤微博的方法和装置 |
CN106341481A (zh) * | 2016-09-21 | 2017-01-18 | 北京小米移动软件有限公司 | 信息推送的处理方法、装置和设备 |
CN106453528A (zh) * | 2016-09-27 | 2017-02-22 | 北京小米移动软件有限公司 | 推送消息的方法及装置 |
CN108268617A (zh) * | 2018-01-05 | 2018-07-10 | 阿里巴巴集团控股有限公司 | 用户意图确定方法及装置 |
CN109660580A (zh) * | 2017-10-11 | 2019-04-19 | 苏州跃盟信息科技有限公司 | 一种信息推送方法及装置 |
CN109670155A (zh) * | 2018-11-08 | 2019-04-23 | 龙马智声(珠海)科技有限公司 | 一种自动回复通信信息的方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102685675A (zh) * | 2012-06-06 | 2012-09-19 | 北京六所新华科电子技术有限公司 | 基于物联网终端以及门户微博的文化信息推送服务系统 |
-
2012
- 2012-10-11 CN CN201210385035.2A patent/CN102970324B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102685675A (zh) * | 2012-06-06 | 2012-09-19 | 北京六所新华科电子技术有限公司 | 基于物联网终端以及门户微博的文化信息推送服务系统 |
Non-Patent Citations (1)
Title |
---|
张辉丽: "计算机领域中文自动问答系统的研究", 《中国优秀硕士学位论文全文数据库,信息科技辑》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281610A (zh) * | 2013-07-08 | 2015-01-14 | 腾讯科技(深圳)有限公司 | 过滤微博的方法和装置 |
WO2015003607A1 (en) * | 2013-07-08 | 2015-01-15 | Tencent Technology (Shenzhen) Company Limited | Systems and methods for filtering microblogs |
US10204164B2 (en) | 2013-07-08 | 2019-02-12 | Tencent Technology (Shenzhen) Company Limited | Systems and methods for filtering microblogs |
CN104281610B (zh) * | 2013-07-08 | 2019-03-29 | 腾讯科技(深圳)有限公司 | 过滤微博的方法和装置 |
CN103747000A (zh) * | 2014-01-13 | 2014-04-23 | 深圳市深信服电子科技有限公司 | 接入无线网络的认证方法及装置 |
CN103747000B (zh) * | 2014-01-13 | 2017-08-25 | 深信服科技股份有限公司 | 接入无线网络的认证方法及装置 |
CN106341481A (zh) * | 2016-09-21 | 2017-01-18 | 北京小米移动软件有限公司 | 信息推送的处理方法、装置和设备 |
CN106453528A (zh) * | 2016-09-27 | 2017-02-22 | 北京小米移动软件有限公司 | 推送消息的方法及装置 |
CN106453528B (zh) * | 2016-09-27 | 2019-11-01 | 北京小米移动软件有限公司 | 推送消息的方法及装置 |
CN109660580A (zh) * | 2017-10-11 | 2019-04-19 | 苏州跃盟信息科技有限公司 | 一种信息推送方法及装置 |
CN109660580B (zh) * | 2017-10-11 | 2021-06-22 | 苏州跃盟信息科技有限公司 | 一种信息推送方法及装置 |
CN108268617A (zh) * | 2018-01-05 | 2018-07-10 | 阿里巴巴集团控股有限公司 | 用户意图确定方法及装置 |
CN109670155A (zh) * | 2018-11-08 | 2019-04-23 | 龙马智声(珠海)科技有限公司 | 一种自动回复通信信息的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102970324B (zh) | 2016-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102970324A (zh) | 一种推送微博的方法及装置 | |
US11122009B2 (en) | Systems and methods for identifying geographic locations of social media content collected over social networks | |
CN101334773B (zh) | 一种过滤搜索引擎查询结果的方法 | |
US20130297694A1 (en) | Systems and methods for interactive presentation and analysis of social media content collection over social networks | |
CN105931123B (zh) | 基于网络账号的好友推荐方法及装置 | |
CN103997507A (zh) | 一种信息的推送方法及装置 | |
CN102622396A (zh) | 一种基于标签的web服务聚类方法 | |
CN103324645A (zh) | 一种网页推荐方法和装置 | |
CN103838819A (zh) | 一种信息发布方法及系统 | |
CN103744856A (zh) | 联动性扩展搜索方法及装置、系统 | |
CN102752336A (zh) | 基于地理位置服务的ugc的共享方法及系统 | |
CN102236710A (zh) | 一种用于在查询结果中展现新闻信息的方法与设备 | |
CN102456054A (zh) | 一种搜索方法及系统 | |
WO2017114282A1 (zh) | 信息搜索装置及方法、搜索服务器及机器可读存储介质 | |
CN104579912A (zh) | 数据推送的方法及装置 | |
CN102957676A (zh) | 一种基于地理位置的网络信息推送方法及装置 | |
CN105320758A (zh) | 搜索服务平台及其搜索服务的方法 | |
CN102904929A (zh) | 移动终端的背景数据设置方法、装置及系统 | |
CN103905507A (zh) | 一种业务信息推荐系统及业务信息推荐方法 | |
CN103198066A (zh) | 一种基于词表的信息搜索方法及搜索系统 | |
CN103279483B (zh) | 一种面向微博客的话题流行范围评估方法及系统 | |
CN105512300A (zh) | 信息过滤方法及系统 | |
CN106504020A (zh) | 一种基于seo的智能网络营销系统 | |
CN102214227A (zh) | 基于互联网层次结构存储的自动舆情监控方法 | |
CN104537080A (zh) | 资讯推荐方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |