CN103294778B - 一种推送资讯信息的方法及系统 - Google Patents
一种推送资讯信息的方法及系统 Download PDFInfo
- Publication number
- CN103294778B CN103294778B CN201310175119.8A CN201310175119A CN103294778B CN 103294778 B CN103294778 B CN 103294778B CN 201310175119 A CN201310175119 A CN 201310175119A CN 103294778 B CN103294778 B CN 103294778B
- Authority
- CN
- China
- Prior art keywords
- labels
- tag
- text
- label
- occurrence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 239000013598 vector Substances 0.000 claims description 91
- 230000011218 segmentation Effects 0.000 claims description 33
- 238000012163 sequencing technique Methods 0.000 claims 2
- 230000000875 corresponding effect Effects 0.000 description 33
- 101100478633 Escherichia coli O157:H7 stcE gene Proteins 0.000 description 10
- 101150115529 tagA gene Proteins 0.000 description 10
- 101150047697 tagB gene Proteins 0.000 description 7
- 101150009385 tcpI gene Proteins 0.000 description 7
- 230000002596 correlated effect Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 101150109838 tagC gene Proteins 0.000 description 2
- 101150049453 tagD gene Proteins 0.000 description 2
- 101150007587 tpx gene Proteins 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种推送资讯信息的方法,包括:依据预先生成的相关标签及对应的相关强度,在标签的推荐列表中加入所述相关标签的资讯信息,并对所述推荐列表中的资讯信息进行排序,将排序后得到的推荐列表推送给用户;本发明还提供一种推送资讯信息的系统。根据本发明提供的技术方案,能够提高推荐列表中资讯信息的多样性,满足用户的推荐需求。
Description
【技术领域】
本发明涉及互联网应用领域,尤其涉及一种推送资讯信息的方法及系统。
【背景技术】
资讯信息是一种用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯信息主要包括新闻、动态信息、技术信息、政策、评论和学术论文等,资讯信息的时效范围远远大于新闻的时效范围。目前,资讯信息都有对应的标签(tag),tag是一种比分类更具体、更准确,是可以概括资讯信息主要内容的关键词;在多种场景下为了理解tag的含义,并多样性的将tag相关的资讯信息推荐给用户,需要挖掘tag之间的关系,即tag之间的相关强度。
目前,向用户推荐资讯信息的技术中存在以下缺陷:
1、仅将tag相关的资讯信息推荐给用户,导致推荐内容过于单一,且资讯信息的数量较少,同质化比较严重。
2、tag之间的关联关系都是人工依据百科等资源,并结合自身知识进行手动关联得到的,导致tag关系网络受限于个人知识和资源,因此tag关系网络的规模比较小,不利于向用户多样性的推荐资讯信息;例如,非物理专业的用户并不知道“猫”与“薛定谔”存在关联关系。
3、由于知识的有限性,tag关系网络中必然存在一部分的错误关系,从而导致了资讯信息的错误推荐。
4、tag关系网络中有百万个tag,如果进行大规模的tag更新,则需要人工进行所有tag之间关联关系的检查和更新,因此目前无法大规模的进行自动更新。
5、依据百科等资源确定tag之间的关联关系时,会根据资源中tag的共现次数,如果两个tag在文本集合中共现次数较多,则认为这两个tag之间具有较强的关联关系,从而构成tag关系网络;一旦文本集合存在偏差,例如娱乐相关的文本偏多或理论相关的文本偏多等,将直接导致tag之间的关联关系存在偏向。
【发明内容】
本发明提供了一种推送资讯信息的方法及系统,能够提高推荐列表中资讯信息的多样性,满足用户的推荐需求。
本发明的具体技术方案如下:
根据本发明一优选实施例,一种推送资讯信息的方法,包括:
依据预先生成的相关标签及对应的相关强度,在标签的推荐列表中加入所述相关标签的资讯信息,并对所述推荐列表中的资讯信息进行排序,将排序后得到的推荐列表推送给用户。
上述方法中,生成相关标签及对应的相关强度的方法为:
依据标签及对应的相关文本向量,获取包含所述相关文本向量中共现词的标签,计算获取的标签与所述相关文本向量对应的标签的相关强度,将获取的标签中相关强度大于预设相关阈值的标签作为所述相关文本向量对应的标签的相关标签。
上述方法中,生成标签的相关文本向量的方法为:
在互联网网页中抓取包含所述标签的文本,对抓取的文本进行文本切词,统计分词的出现次数,将出现次数大于预设频次阈值的分词作为所述标签的共现词;或从搜索引擎获得所述标签的搜索结果,对排序靠前的搜索结果的文本进行文本切词,统计分词的出现次数,将出现次数大于预设频次阈值的分词作为所述标签的共现词;
从相关强度数据库中获得所述标签与共现词的相关强度,或从搜索引擎中获得标签和共现词组成的查询词的搜索结果,依据搜索结果计算所述标签和共现词的相关强度;
利用共现词及对应的相关强度生成相关文本向量。
上述方法中,所述在标签的推荐列表中加入相关标签的资讯信息具体为:
依据标签与相关标签的相关强度计算出在推荐列表中加入所述相关标签的资讯信息的个数,加入资讯信息的个数等于所述相关标签的相关强度除以所述标签的相关向量文本中所有相关强度的累加和再乘以预设的推荐列表中相关标签的资讯信息的总数。
一种推送资讯信息的系统,包括:处理单元、排序单元、发送单元;其中,
处理单元,用于依据预先生成的相关标签及对应的相关强度,在标签的推荐列表中加入所述相关标签的资讯信息;
排序单元,用于对所述推荐列表中的资讯信息进行排序;
发送单元,用于将排序后得到的推荐列表推送给用户。
上述系统中,该系统还包括标签生成单元,所述标签生成单元进一步包括获取子单元、统计子单元、判断子单元:
获取子单元,用于依据标签及对应的相关文本向量,获取包含所述相关文本向量中共现词的标签;
统计子单元,用于计算获取的标签与所述相关文本向量对应的标签的相关强度;
判断子单元,用于将获取的标签中相关强度大于预设相关阈值的标签作为所述相关文本向量对应的标签的相关标签。
上述系统中,该系统还包括向量生成单元;所述向量生成单元进一步包括第一获取子单元、第二获取子单元、生成子单元:
第一获取子单元,用于在互联网网页中抓取包含所述标签的文本,对抓取的文本进行文本切词,统计分词的出现次数,将出现次数大于预设频次阈值的分词作为所述标签的共现词;或从搜索引擎获得所述标签的搜索结果,对排序靠前的搜索结果的文本进行文本切词,统计分词的出现次数,将出现次数大于预设频次阈值的分词作为所述标签的共现词;
第二获取子单元,用于从相关强度数据库中获得所述标签与共现词的相关强度,或从搜索引擎中获得标签和共现词组成的查询词的搜索结果,依据搜索结果计算所述标签和共现词的相关强度;
生成子单元,用于利用共现词及对应的相关强度生成相关文本向量。
上述系统中,处理单元在标签的推荐列表中加入相关标签的资讯信息时,具体为:
依据标签与相关标签的相关强度计算出在推荐列表中加入所述相关标签的资讯信息的个数,加入资讯信息的个数等于所述相关标签的相关强度除以所述标签的相关向量文本中所有相关强度的累加和再乘以预设的推荐列表中相关标签的资讯信息的总数。
由以上技术方案可以看出,本发明提供的具有以下有益效果:
依据与标签的相关强度,在标签的推荐列表中适当的加入相关标签的资讯信息,能够增加推荐列表中资讯信息的数量,扩大推荐列表的召回数量,提高推荐列表中资讯信息的多样性,用以更好的满足用户的推荐需求。
【附图说明】
图1是本发明实现推送资讯信息的方法的优选实施例的流程示意图;
图2是本发明实现推送资讯信息的系统的优选实施例的结构示意图。
【具体实施方式】
本发明的基本思想是:依据预先生成的相关标签及对应的相关强度,在标签的推荐列表中加入所述相关标签的资讯信息,并对所述推荐列表中的资讯信息进行排序,将排序后得到的推荐列表推送给用户。
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
本发明提供一种推送资讯信息的方法,图1是本发明实现推送资讯信息的方法的优选实施例的流程示意图,如图1所示,该优选实施例包括以下步骤:
步骤S101,依据文本或搜索结果获取标签的共现词,依据共现词生成该标签的相关文本向量。
具体的,将从资讯中提取出的一些tag作为原始的tag,例如在网址为www://baike.baidu.com/view/4559339.htm的资讯中提取出“量子物理”、“薛定谔”和“佯谬”等tag;对于原始的tag,可以从文本或搜索结果中获取这些tag的共现词。
其中,从文本中获取tag的共现词的方法是:依据tag,在互联网网页中抓取一段时间内包含该tag的所有文本,例如,抓取最近3年内包含该tag的所有新闻网站的文本;利用分词词典对抓取的文本进行文本切词处理,得到文本对应的若干分词,然后统计每个分词在该文本中的出现次数,将出现次数大于预设频次阈值的分词作为该tag的共现词;例如,网址为www://baike.baidu.com/view/4559339.htm的资讯中,“量子”的出现次数为45,“物理”的出现次数为19,“理论”的出现次数为15,则“量子”与“物理”的共现次数为19,“量子”与“理论”的共现次数为15,将“物理”和“理论”作为“量子”的共现词。
其中,从搜索结果获取tag的共现词的方法是:将tag作为查询词(query),从搜索引擎中获得tag对应的搜索结果,对排序靠前的若干个搜索结果的文本进行文本切词处理,并统计每个分词在对应的搜索结果中的出现次数,将出现次数大于预设频次阈值的分词作为该tag的共现词。这里,从搜索结果中获取tag的共现词是一种简单的获取共现词的方法,搜索引擎很重要的作用就是依据用户输入的查询词提供与该查询词最相关的搜索结果,因此将tag作为查询词从搜索引擎获得共现词时,搜索引擎能够保证提供的搜索结果与tag的相关性,而且排序越靠前的搜索结果,与tag的相关性越高,因此从排序靠前的若干个搜索结果获得共现词,相当于从整个互联网中获取到与该tag最相关的若干个文本,用以避免在数量巨大的文本中获取tag的共现词的情况,提高共现词的获取效率;同时,由于搜索引擎能够保证tag与搜素结果的相关性,因此搜索结果的文本的分词与tag之间会存在明显关联关系,从而确保共现词的准确性。
在获得tag的共现词后,依据该tag从相关强度数据库中获得该tag与共现词的相关强度,或当相关强度数据库中没有tag与共现词的相关强度时,可以利用tag和共现词组成查询词,在搜索引擎中获得搜索结果,依据搜索结果计算tag和共现词的相关强度;利用共现词及对应的相关强度生成相关文本向量,tag的相关文本向量中包括一个以上元素,每个元素包括该tag的共现词及该共现词与tag的相关强度。
例如,“量子”的相关文本向量为<(物理,0.8)、(理论,0.9)、(相对论,0.5)>,其中,“物理”、“理论”和“相对论”为“量子”的共现词,0.8、0.9和0.5分别为“物理”、“理论”和“相对论”与“量子”的相关强度。
步骤S102,依据标签及对应的相关文本向量,获取包含该相关文本向量中共现词的标签,计算获取的标签与相关文本向量对应的标签之间的相关强度,将获取的标签中相关强度大于预设相关阈值的标签作为所述相关文本向量对应的标签的相关标签。
具体的,通过步骤101后将得到多个tag及对应的相关文本向量,对于其中的每个tag的相关文本向量,获取包含相关文本向量中共现词的tag,计算获取到的tag与该相关文本向量对应的tag的相关强度,并比较相关强度与预设相关阈值的大小,将获取的tag中相关强度大于预设相关阈值的tag作为该相关文本向量对应的tag的相关tag;这里,只计算包含共现词的tag与该共现词对应的tag之间的相关强度,用于减少计算量,提高相关tag的查找效率。
其中,由于在步骤101中获得若干tag及对应的相关文本向量,那么可以在这些tag中查找包含相关文本向量中共现词的tag。例如,“量子”的相关文本向量中有共现词“物理”,在有相关文本向量的多个tag中可以查找到包含该共现词的tag,如“量子物理”、“理论物理”等,计算“量子物理”或“理论物理”与“量子”的相关强度。如果没有查找到包含共现词的tag,则继续查找包含相关文本向量中其他共现词的tag,直到相关文本向量中的最后一个共现词;如果对于一个tag,没有包含该tag的相关文本向量中任意一个共现词的tag,则该tag的推荐列表中仅包含该tag自身的资讯信息,没有该tag的相关tag的资讯信息。
本优选实施例中,利用如下公式计算两个tag之间的相关强度:
该公式中,similarity表示两个tag之间的相关强度,A和B分别表示两个tag的相关文本向量,这两个相关文本向量的维度相同,即两个tag的相关文本向量中,元素的数量相同且元素中包含的共现词都相同,Ai表示tagA的相关文本向量中第i个元素的维度,Bi表示tagB的相关文本向量中第i个元素的维度,n表示tagA的相关文本向量中元素的总数;这里,为了保证两个tag的相关文本向量的元素的数量相同且元素中包含的共现词相同,需要预先对两个tag的相关文本向量进行处理,即:首先,将两个相关文本向量中的共现词合并,得到一个共现词合集,该共现词合集中所有共现词都来源于两个相关文本向量;然后,用共现词合集中的共现词与其中一个相关文本向量中的共现词匹配,如果共现词集合中的共现词没有出现在该相关文本向量中,则在该相关文本向量中增加包含该共现词的元素,在元素中将该共现词与该相关文本向量对应的tag之间的相关强度设置为0,如此,对另一个相关文本向量进行相同的处理,就可以使得两个相关文本向量的元素的数量相同。
例如,tagA的相关文本向量为<(中国,0.8)、(特色,0.8)、(共产主义,0.8)、(人民,0.8)>,tagB的相关文本向量为<(特色,0.8)、(共产主义,0.8)、(人民,0.8)、(苏联,0.8)>,对两个相关文本向量中的共现词进行合并,得到共现词集合<中国、特色、共产主义、人民、苏联>,利用该共现词合集与tagA的相关文本向量进行匹配,判断出“苏联”没有出现在tagA的相关文本向量中,则在tagA的相关文本向量增加一个元素,该元素中的共现词为苏联,该元素中苏联与tagA的相关强度为0.0,处理后得到的tagA的相关文本向量为<(中国,0.8)、(特色,0.8)、(共产主义,0.8)、(人民,0.8)、(苏联,0.0)>,同理,对tagB的相关文本向量进行相同的处理,处理后得到的tagB的相关文本向量为<(中国,0.0)、(特色,0.8)、(共产主义,0.8)、(人民,0.8)、(苏联,0.8)>,这样,tagA与tagB的相关文本向量中元素的数量都为5,且都包含共现词“中国”、“特色”、“共产主义”、“人民”和“苏联”。
步骤S103,依据相关标签及对应的相关强度在标签的推荐列表中加入所述相关标签的资讯信息,并对推荐列表中的资讯信息进行排序,将排序后得到的推荐列表推送给用户。
具体的,依据步骤102中得到的tag的相关tag,以及tag与相关tag的相关强度的大小,在该tag的预设的推荐列表中加入相关tag的资讯信息,然后对推荐列表中的资讯信息按照预设的排序规则进行排序,将排序后得到的推荐列表推送给用户;其中,对于不同类型的资讯信息可以依据不同的排序规则进行排序,如新闻类的资讯信息一般依据时间顺序进行排序,非时效性的资讯信息,如菜谱,可以依据新热度和相关性权重的组合方式进行排序,其他的排序规则,如标题的吸引度、资讯信息的内容丰富度、资讯信息的内容中多媒体数量等。
其中,依据tag与相关tag的相关强度的大小计算出在推荐列表中加入该相关tag的资讯信息的个数,即:加入资讯信息的个数等于相关tag的相关强度除以tag的相关向量文本中所有相关强度的累加和再乘以预设的推荐列表中相关tag的资讯信息的总数。
例如,推荐列表中资讯信息的个数为100,其中80个资讯信息为当前tag的资讯信息,则其余20个资讯信息为当前tag的相关tag的资讯信息;当前tag的相关文本向量为<(相关tagA,0.6)、(相关tagB,0.4)、(相关tagC,0.35)、(相关tagD,0.32)>,则推荐列表中相关tagA的资讯信息的个数为:0.6/(0.6+0.4+0.35+0.32)×20=7,同理,可以计算出相关tagB、相关tagC和相关tagD各自的资讯信息的个数。
例如,用户的兴趣标签为百度,利用上述方法可以得到百度的相关标签包括腾讯、新浪、金山和李彦宏,这样,将这些相关标签的资讯信息也加入到百度对应的推荐列表中,从而增加整个推荐列表的多样性,同时能够较好的满足用户需求。
为实现上述方法,本发明还提供一种推送资讯信息的系统,图2是本发明实现推送资讯信息的系统的优选实施例的结构示意图,如图2所示,该系统包括:处理单元20、排序单元21、发送单元22;其中,
处理单元20,用于依据预先生成的相关标签及对应的相关强度,在标签的推荐列表中加入所述相关标签的资讯信息;
排序单元21,用于对所述推荐列表中的资讯信息进行排序;
发送单元22,用于将排序后得到的推荐列表推送给用户。
该系统还包括标签生成单元23,所述标签生成单元进一步包括获取子单元231、统计子单元232、判断子单元233:
获取子单元231,用于依据标签及对应的相关文本向量,获取包含所述相关文本向量中共现词的标签;
统计子单元232,用于计算获取的标签与所述相关文本向量对应的标签的相关强度;
判断子单元233,用于将获取的标签中相关强度大于预设相关阈值的标签作为所述相关文本向量对应的标签的相关标签。
该系统还包括向量生成单元24;所述向量生成单元24进一步包括第一获取子单元241、第二获取子单元242、生成子单元243:
第一获取子单元241,用于在互联网网页中抓取包含所述标签的文本,对抓取的文本进行文本切词,统计分词的出现次数,将出现次数大于预设频次阈值的分词作为所述标签的共现词;或从搜索引擎获得所述标签的搜索结果,对排序靠前的搜索结果的文本进行文本切词,统计分词的出现次数,将出现次数大于预设频次阈值的分词作为所述标签的共现词;
第二获取子单元242,用于从相关强度数据库中获得所述标签与共现词的相关强度,或从搜索引擎中获得标签和共现词组成的查询词的搜索结果,依据搜索结果计算所述标签和共现词的相关强度;
生成子单元243,用于利用共现词及对应的相关强度生成相关文本向量。
其中,所述统计子单元232利用如下公式得到两个标签的相关强度:
其中,similarity为两个标签之间的相关强度,A和B分别为两个标签的相关文本向量,两个相关文本向量的维度相同,Ai为标签A的相关文本向量中第i个元素的维度,Bi表示标签B的相关文本向量中第i个元素的维度,n表示相关文本向量中元素的总数。
其中,处理单元20在标签的推荐列表中加入相关标签的资讯信息时,具体为:
依据标签与相关标签的相关强度计算出在推荐列表中加入所述相关标签的资讯信息的个数,加入资讯信息的个数等于所述相关标签的相关强度除以所述标签的相关向量文本中所有相关强度的累加和再乘以预设的推荐列表中相关标签的资讯信息的总数。
本发明的上述技术方案具有以下有益效果:
1、依据与tag的相关强度,在tag的推荐列表中适当的加入相关tag的资讯信息,能够增加推荐列表中资讯信息的数量,扩大推荐列表的召回数量,提高推荐列表中资讯信息的多样性,用以更好的满足用户的推荐需求,具有良好的用户体验。
2、tag之间的关联关系依据网页中文本自动生成,使得tag之间的关联关系具有客观性,不受主观因素的影响,保证tag之间关联关系的准确性,从而提高资讯信息的正确推荐;而且可以得到大量的tag之间的关联关系,从而自动更新现有的tag关系网络,有利于向用户多样性的推荐资讯信息,节省人力物力。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (6)
1.一种推送资讯信息的方法,其特征在于,该方法包括:
依据预先生成的相关标签及对应的相关强度,在标签的推荐列表中加入所述相关标签的资讯信息,并对所述推荐列表中的资讯信息进行排序,将排序后得到的推荐列表推送给用户;其中,
所述在标签的推荐列表中加入所述相关标签的资讯信息具体为,依据标签与相关标签的相关强度计算出在推荐列表中加入所述相关标签的资讯信息的个数,加入资讯信息的个数等于所述相关标签的相关强度除以所述标签的相关向量文本中所有相关强度的累加和再乘以预设的推荐列表中相关标签的资讯信息的总数。
2.根据权利要求1所述的方法,其特征在于,生成相关标签及对应的相关强度的方法为:
依据标签及对应的相关文本向量,获取包含所述相关文本向量中共现词的标签,计算获取的标签与所述相关文本向量对应的标签的相关强度,将获取的标签中相关强度大于预设相关阈值的标签作为所述相关文本向量对应的标签的相关标签。
3.根据权利要求2所述的方法,其特征在于,生成标签的相关文本向量的方法为:
在互联网网页中抓取包含所述标签的文本,对抓取的文本进行文本切词,统计分词的出现次数,将出现次数大于预设频次阈值的分词作为所述标签的共现词;或从搜索引擎获得所述标签的搜索结果,对排序靠前的搜索结果的文本进行文本切词,统计分词的出现次数,将出现次数大于预设频次阈值的分词作为所述标签的共现词;
从相关强度数据库中获得所述标签与共现词的相关强度,或从搜索引擎中获得标签和共现词组成的查询词的搜索结果,依据搜索结果计算所述标签和共现词的相关强度;
利用共现词及对应的相关强度生成相关文本向量。
4.一种推送资讯信息的系统,其特征在于,该系统包括:处理单元、排序单元、发送单元;其中,
处理单元,用于依据预先生成的相关标签及对应的相关强度,在标签的推荐列表中加入所述相关标签的资讯信息;
排序单元,用于对所述推荐列表中的资讯信息进行排序;
发送单元,用于将排序后得到的推荐列表推送给用户;其中,
处理单元在标签的推荐列表中加入所述相关标签的资讯信息时,具体为,
依据标签与相关标签的相关强度计算出在推荐列表中加入所述相关标签的资讯信息的个数,加入资讯信息的个数等于所述相关标签的相关强度除以所述标签的相关向量文本中所有相关强度的累加和再乘以预设的推荐列表中相关标签的资讯信息的总数。
5.根据权利要求4所述的系统,其特征在于,该系统还包括标签生成单元,所述标签生成单元进一步包括获取子单元、统计子单元、判断子单元:
获取子单元,用于依据标签及对应的相关文本向量,获取包含所述相关文本向量中共现词的标签;
统计子单元,用于计算获取的标签与所述相关文本向量对应的标签的相关强度;
判断子单元,用于将获取的标签中相关强度大于预设相关阈值的标签作为所述相关文本向量对应的标签的相关标签。
6.根据权利要求4所述的系统,其特征在于,该系统还包括向量生成单元;所述向量生成单元进一步包括第一获取子单元、第二获取子单元、生成子单元:
第一获取子单元,用于在互联网网页中抓取包含所述标签的文本,对抓取的文本进行文本切词,统计分词的出现次数,将出现次数大于预设频次阈值的分词作为所述标签的共现词;或从搜索引擎获得所述标签的搜索结果,对排序靠前的搜索结果的文本进行文本切词,统计分词的出现次数,将出现次数大于预设频次阈值的分词作为所述标签的共现词;
第二获取子单元,用于从相关强度数据库中获得所述标签与共现词的相关强度,或从搜索引擎中获得标签和共现词组成的查询词的搜索结果,依据搜索结果计算所述标签和共现词的相关强度;
生成子单元,用于利用共现词及对应的相关强度生成相关文本向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310175119.8A CN103294778B (zh) | 2013-05-13 | 2013-05-13 | 一种推送资讯信息的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310175119.8A CN103294778B (zh) | 2013-05-13 | 2013-05-13 | 一种推送资讯信息的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103294778A CN103294778A (zh) | 2013-09-11 |
CN103294778B true CN103294778B (zh) | 2019-07-23 |
Family
ID=49095640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310175119.8A Active CN103294778B (zh) | 2013-05-13 | 2013-05-13 | 一种推送资讯信息的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103294778B (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103838877B (zh) * | 2014-03-26 | 2017-04-12 | 北京奇虎科技有限公司 | 基于搜索的时效性信息网页结果的推送方法和装置 |
CN104156391A (zh) * | 2014-07-09 | 2014-11-19 | 北京奇虎科技有限公司 | 一种在移动搜索结果中展现菜谱的装置和方法 |
CN104537065A (zh) * | 2014-12-29 | 2015-04-22 | 北京奇虎科技有限公司 | 一种搜索结果的推送方法及系统 |
CN104809154B (zh) * | 2015-03-19 | 2019-03-08 | 百度在线网络技术(北京)有限公司 | 用于资讯推荐的方法及装置 |
CN105095433B (zh) * | 2015-07-22 | 2019-07-05 | 百度在线网络技术(北京)有限公司 | 实体推荐方法及装置 |
CN106547798B (zh) * | 2015-09-23 | 2020-07-28 | 阿里巴巴集团控股有限公司 | 信息推送方法及装置 |
CN105224642B (zh) * | 2015-09-25 | 2019-03-12 | 百度在线网络技术(北京)有限公司 | 实体标签的抽取方法和装置 |
CN106776808A (zh) * | 2016-11-23 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 基于人工智能的资讯数据提供方法及装置 |
CN107580038B (zh) * | 2017-08-28 | 2021-08-13 | 北京博瑞彤芸科技股份有限公司 | 一种专家推荐方法及系统 |
CN107562857A (zh) * | 2017-08-28 | 2018-01-09 | 江西博瑞彤芸科技有限公司 | 一种资讯管理方法及系统 |
CN108334729A (zh) * | 2017-08-28 | 2018-07-27 | 江西博瑞彤芸科技有限公司 | 健康资讯管理方法及管理系统 |
CN107908654B (zh) * | 2017-10-12 | 2021-12-07 | 广州艾媒数聚信息咨询股份有限公司 | 一种基于知识库的推荐方法、系统及装置 |
CN107844525A (zh) * | 2017-10-12 | 2018-03-27 | 广州艾媒数聚信息咨询股份有限公司 | 一种基于用户行为的资讯个性化推荐方法、系统及装置 |
CN107844526B (zh) * | 2017-10-12 | 2022-04-01 | 广州艾媒数聚信息咨询股份有限公司 | 一种基于知识库的词汇关系链分析方法、系统及装置 |
CN108133011B (zh) * | 2017-12-22 | 2022-05-24 | 新奥(中国)燃气投资有限公司 | 一种资讯推送方法及装置 |
CN108090196B (zh) * | 2017-12-22 | 2021-10-15 | 新奥(中国)燃气投资有限公司 | 一种关键词管理方法和装置 |
CN108241856B (zh) * | 2018-01-12 | 2019-03-01 | 新华智云科技有限公司 | 资讯信息生成方法及设备 |
CN111324753B (zh) * | 2020-01-22 | 2021-09-03 | 天窗智库文化传播(苏州)有限公司 | 一种媒体资讯发布管理方法及系统 |
CN114048374A (zh) * | 2021-10-28 | 2022-02-15 | 盐城金堤科技有限公司 | 待推荐对象的确定方法以及待推荐对象的确定装置 |
CN114117300A (zh) * | 2021-11-19 | 2022-03-01 | 南京一盏神灯网络信息科技有限公司 | 一种主题资讯排序方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101984437A (zh) * | 2010-11-23 | 2011-03-09 | 亿览在线网络技术(北京)有限公司 | 音乐资源个性化推荐方法及系统 |
US8230016B1 (en) * | 2011-10-11 | 2012-07-24 | Google Inc. | Determining intent of a recommendation on a mobile application |
CN102831234A (zh) * | 2012-08-31 | 2012-12-19 | 北京邮电大学 | 基于新闻内容和主题特征的个性化新闻推荐装置和方法 |
-
2013
- 2013-05-13 CN CN201310175119.8A patent/CN103294778B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101984437A (zh) * | 2010-11-23 | 2011-03-09 | 亿览在线网络技术(北京)有限公司 | 音乐资源个性化推荐方法及系统 |
US8230016B1 (en) * | 2011-10-11 | 2012-07-24 | Google Inc. | Determining intent of a recommendation on a mobile application |
CN102831234A (zh) * | 2012-08-31 | 2012-12-19 | 北京邮电大学 | 基于新闻内容和主题特征的个性化新闻推荐装置和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103294778A (zh) | 2013-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103294778B (zh) | 一种推送资讯信息的方法及系统 | |
CN106649818B (zh) | 应用搜索意图的识别方法、装置、应用搜索方法和服务器 | |
CN109885773B (zh) | 一种文章个性化推荐方法、系统、介质及设备 | |
Hoffart et al. | Discovering emerging entities with ambiguous names | |
WO2019091026A1 (zh) | 知识库文档快速检索方法、应用服务器及计算机可读存储介质 | |
US9292877B2 (en) | Methods and systems for generating concept-based hash tags | |
CN103198057B (zh) | 一种自动给文档添加标签的方法和装置 | |
US20090271391A1 (en) | Method and apparatus for rating user generated content in seach results | |
CN103577534B (zh) | 搜索方法和搜索引擎 | |
CN111008321A (zh) | 基于逻辑回归推荐方法、装置、计算设备、可读存储介质 | |
CN106886579B (zh) | 实时流式文本分级监控方法和装置 | |
WO2017113592A1 (zh) | 模型生成方法、词语赋权方法、装置、设备及计算机存储介质 | |
CN107193987A (zh) | 获取与页面相关的搜索词的方法、装置和系统 | |
Man | Feature extension for short text categorization using frequent term sets | |
CN108959329A (zh) | 一种文本分类方法、装置、介质及设备 | |
Rafeeque et al. | A survey on short text analysis in web | |
Gong et al. | Phrase-based hashtag recommendation for microblog posts. | |
CN103544307A (zh) | 一种不依赖文档库的多搜索引擎自动化对比评测方法 | |
Dumani et al. | Quality-aware ranking of arguments | |
CN103425767B (zh) | 一种提示数据的确定方法和系统 | |
Cui et al. | Personalized microblog recommendation using sentimental features | |
CN107908649B (zh) | 一种文本分类的控制方法 | |
CN110427519A (zh) | 视频的处理方法及装置 | |
CN102737045A (zh) | 一种相关度计算方法和装置 | |
CN108509449B (zh) | 一种信息处理的方法及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |