CN105589967B - 多级相关新闻的查找方法及装置 - Google Patents

多级相关新闻的查找方法及装置 Download PDF

Info

Publication number
CN105589967B
CN105589967B CN201510981561.9A CN201510981561A CN105589967B CN 105589967 B CN105589967 B CN 105589967B CN 201510981561 A CN201510981561 A CN 201510981561A CN 105589967 B CN105589967 B CN 105589967B
Authority
CN
China
Prior art keywords
term
retrieval
related news
level
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510981561.9A
Other languages
English (en)
Other versions
CN105589967A (zh
Inventor
张伸正
魏少俊
陈培军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201510981561.9A priority Critical patent/CN105589967B/zh
Publication of CN105589967A publication Critical patent/CN105589967A/zh
Application granted granted Critical
Publication of CN105589967B publication Critical patent/CN105589967B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本申请提供了一种多级相关新闻的查找方法及装置。多级相关新闻的查找方法包括:获取与第一检索词相关的一个或多个第二检索词;获取与一个或多个第二检索词匹配的一个或多个一级相关新闻;从一个或多个一级相关新闻中,确定与第一检索词匹配的二级相关新闻。根据本发明的多级相关新闻的查找方法及装置,利用多级检索词的相似关系,再基于熵的二级推荐方式,能够获取到与用户输入的检索词语义上相似的相关新闻。

Description

多级相关新闻的查找方法及装置
技术领域
本发明涉及网络信息技术领域,特别是多级相关新闻的查找方法及多级相关新闻的查找装置。
背景技术
作为一种新兴的信息传播方式,网络新闻越来越深入到人们的生活中。随着网络新闻的急剧增加,其中包含了大量的信息,用户为了在海量的网络信息中寻找所需的信息,通常使用搜索引擎进行搜索。
当前,用户利用自然语言进行新闻搜索时,主要是基于检索词来获取相关新闻,但是无法找到语义上相关但用词不同的新闻。
发明内容
鉴于上述问题,提出了一种多级相关新闻的查找方法及装置,通过多级相关查找,获得用户所需的更多相关新闻。
根据本发明的一个方面,提供了一种多级相关新闻的查找方法,包括:获取与第一检索词相关的一个或多个第二检索词;获取与一个或多个第二检索词匹配的一个或多个一级相关新闻;从一个或多个一级相关新闻中,确定与第一检索词匹配的二级相关新闻。
可选地,所述从一个或多个一级相关新闻中确定与第一检索词匹配的二级相关新闻,包括:
确定所述一个或多个一级相关新闻的综合权重值;
基于所述综合权重值,从所述一个或多个一级相关新闻中选取二级相关新闻。
可选地,所述确定一个或多个一级相关新闻的综合权重值,包括:
确定由所述第一检索词查找到所述一级相关新闻的第一检索权重;
确定所述第一级相关新闻与所述第一检索词相匹配的第二检索权重;
根据所述第一检索权重和所述第二检索权重,确定一级相关新闻的综合检索权重。
可选地,所述确定由第一检索词查找到一级相关新闻的第一检索权重,包括:
确定由第一检索词经过所述一个或多个第二检索词查找到一级相关新闻的第一检索权重。
可选地,所述确定由第一检索词经过一个或多个第二检索词查找到一级相关新闻的第一检索权重,包括:
根据所述第一检索词与所述一个或多个第二检索词中的一个第二检索词之间的相似度,确定第一检索概率;
确定由所述一个或多个第二检索词中的一个第二检索词获得所述一级相关新闻的第二检索概率;
确定所述第一检索权重为所述第一检索概率与所述第二检索概率的乘积的加和。
可选地,所述第一检索概率为所述第一检索词与所述第二检索词的余弦相似度的平方。
可选地,所述确定第一级相关新闻与第一检索词相匹配的第二检索权重,包括:
根据所述一级相关新闻经由所述一个或多个第二检索词与所述第一检索词相匹配的第二检索词的个数,确定所述一级相关新闻的第二检索权重。
可选地,所述第二检索权重是根据IDF算法获得。
可选地,所述综合检索权重为所述第一检索权重与所述第二检索权重的乘积。
根据本发明的另一个方面,提供了一种多级相关新闻的查找装置,包括:检索词获取模块,用于获取与第一检索词相关的一个或多个第二检索词;相关新闻获取模块,用于获取与所述一个或多个第二检索词匹配的一个或多个一级相关新闻;相关新闻确定模块,用于从所述一个或多个一级相关新闻中,确定与所述第一检索词匹配的二级相关新闻。
可选地,相关新闻获取模块包括确定子模块和选取子模块,确定子模块确定所述一个或多个一级相关新闻的综合权重值,选取子模块基于所述综合权重值,从所述一个或多个一级相关新闻中选取二级相关新闻。
可选地,确定子模块确定由所述第一检索词查找到所述一级相关新闻的第一检索权重;确定所述第一级相关新闻与所述第一检索词相匹配的第二检索权重;根据所述第一检索权重和所述第二检索权重,确定一级相关新闻的综合检索权重。
可选地,确定子模块确定由第一检索词经过所述一个或多个第二检索词查找到一级相关新闻的第一检索权重。
可选地,确定子模块根据所述第一检索词与所述一个或多个第二检索词中的一个第二检索词之间的相似度,确定第一检索概率;确定由所述一个或多个第二检索词中的一个第二检索词获得所述一级相关新闻的第二检索概率;确定所述第一检索权重为所述第一检索概率与所述第二检索概率的乘积的加和。
可选地,确定子模块根据所述一级相关新闻经由所述一个或多个第二检索词与所述第一检索词相匹配的第二检索词的个数,确定所述一级相关新闻的第二检索权重。
可选地,确定子模块确定综合检索权重为所述第一检索权重与所述第二检索权重的乘积。
综上所述,根据本发明的多级相关新闻的查找方法及装置,利用多级检索词的相似关系,再基于熵的二级推荐方式,能够获取到与用户输入的检索词语义上相似的相关新闻。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是根据本发明一个实施方式的多级相关新闻的查找方法的步骤流程图;
图2是根据本发明一个实施方式的确定二级相关新闻的步骤流程图;
图3示出了根据本发明实施例的多级相关新闻的查找方法的流程图;
图4是根据本发明一个实施方式的多级查找的示意图;
图5是根据本发明一个实施方式的多级相关新闻的查找装置的结构示意图。
图6是根据本发明一个实施方式的相关新闻确定模块的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图1,示出的根据本发明的多级相关新闻的查找方法包括以下步骤。
11,获取与第一检索词相关的一个或多个第二检索词;
当采用自然语言输入第一检索词,将获得一个或多个第二检索词。这些第二检索词与输入的第一检索词相关。
第一检索词与第二检索词之间的关系,是通过大量用户的日志数据进行统计获得的。
12,获取与所述一个或多个第二检索词匹配的一个或多个一级相关新闻;
一旦获得一个或多个第二检索词,便能获取与一个或多个第二检索词相匹配的一个或多个一级相关新闻。
容易理解,每个第二检索词都可以匹配出一个或多个一级相关新闻,其中的匹配满足一般规则。例如,若新闻的标题、摘要或文本中含有该第二检索词,则将其作为该第二检索词的一个一级相关新闻。
当确定第一检索词与一个或多个第二检索词之间的对应关系,以及一个或多个第二检索词与一个或多个一级相关新闻的匹配后,通过以下步骤从一级相关新闻中确定一个二级相关新闻作为结果提供。
13,从所述一个或多个一级相关新闻中,确定与所述第一检索词匹配的二级相关新闻。
例如,可以首先确定该一个或多个一级相关新闻的综合权重值;然后,基于所述综合权重值,从所述一个或多个一级相关新闻中选取二级相关新闻。
参加图2,示出了综合权重值的确定步骤:
S131,确定由所述第一检索词查找到所述一级相关新闻的第一检索权重。
也就是,确定由第一检索词经过所述一个或多个第二检索词查找到一级相关新闻的第一检索权重。
因为,第一检索词与一级相关新闻之间可以通过不同的第二检索词相对应。因此第一检索权重就可以通过第一检索词与第二检索词之间的对应以及第二检索词与一级相关新闻之间的对应来确定。
具体地,首先,根据第一检索词与一个或多个第二检索词中的一个第二检索词之间的相似度,确定第一检索概率。可选地,该第一检索概率为所述第一检索词与所述第二检索词的余弦相似度的平方。然后,确定由所述一个或多个第二检索词中的一个第二检索词获得所述一级相关新闻的第二检索概率。最后,确定所述第一检索权重为所述第一检索概率与所述第二检索概率的乘积的加和。
例如,假设从第一检索词qa出发,分别通过第二检索词qb1、qb2和qb3查找到一级相关新闻new1。则,第一检索词qa与第二检索词qb1之间存在第一检索概率为p1,第一检索词qa与第二检索词qb2之间存在第一检索概率为p2,第一检索词qa与第二检索词qb3之间存在第一检索概率为p3,第二检索词qb1与一级相关新闻new1之间存在第二检索概率为c1,第二检索词qb2与一级相关新闻new1之间存在第二检索概率为c2,第二检索词qb3与一级相关新闻new1之间存在第二检索概率为c3。因此,最后确定第一检索权重为p1*c1+p2*c2+P3*c3。
S132,确定所述第一级相关新闻与所述第一检索词相匹配的第二检索权重。
具体而言,可以根据一级相关新闻经由一个或多个第二检索词与第一检索词相匹配的第二检索词的个数,确定一级相关新闻的第二检索权重。例如,第二检索权重是根据IDF算法获得。
由此可以确定,该一级相关新闻与第一检索词的匹配程度。为了降低热门新闻被反复推荐的可能,通过IDF算法可以进行处理。例如,如果该一级相关新闻通过更多的第二检索词能匹配到第一检索词,则通过IDF算法降低该一级相关新闻被提高的可能性。
S133,根据所述第一检索权重和所述第二检索权重,确定一级相关新闻的综合检索权重。
例如,综合检索权重为第一检索权重与第二检索权重的乘积。
通过以上步骤,最终为第一检索词确定二级相关新闻,该二级相关新闻虽然可能用词不同,但是语义却可以很相关。
由此,根据本发明的多级相关新闻的查找方法,利用多级检索词的相似关系,再基于熵的二级推荐方式,能够获取到与用户输入的检索词语义上相似的相关新闻。
例如,用户输入“从昨晚到现在”搜索新闻,通过一篇文章《发生了什么:从昨晚到现在事件全况》和它相关的文章《巴黎恐怖袭击,从昨晚到现在24小时》再经过跳转得到《历史上十大恐怖袭击事件》。
下面将结合图3和图4详细说明根据本发明的多级相关新闻的查找方法。
图3示出了根据本发明实施例的多级相关新闻的查找方法的流程图,包括以下步骤。
Step1:根据大量用户的会话(session)日志统计获得计算query-query(即第一检索词与第二检索词)之间的关系。
(1)搜索第一检索词Qa被搜索session中的分布为向量A,
(2)搜索第二检索词Qb被搜索的session中的分布为向量B,
(3)Qa和Qb的相似度为余弦相似度为
其中,Ai为向量A中的第i个元素,Bi为向量B中的第i个元素,n为向量A或向量B中元素的个数。
Step2:从query-query关系到query-news一级相关新闻
计算得到query-query关系数据后,过滤出至少一个其标题中含query得到query-news直接关联的一级相关新闻。
Step3:参照图4,计算query-news二级关联数据
这里,p(Qa,Qbi,Nj)为从第一检索词Qa通过第二检索词Qbi到达一级相关新闻Nj的1条路径概率。其中,Qbi是第i个第二检索词,Nj是第j个相关新闻。
例如,Qa通过Qb1到达N1的概率为
p(Qa,Qb1,N1)=|W1|*|V11|
这里,||为向量余弦值的平方标准化后的权重。
W1=cos(Qa,Qb1)^2
|W1|+|W2|+|W3|=1
同样
V11=cos(Qb1,N1)^2
|V11|+|V12|+|V13|=1
于是,熵为
其中,计算得到的熵H(Qa,Nj)随Nj的不同而不同。
Step4:计算idf值
从query-news一级相关新闻,计算每个新闻关联的第二检索词的个数。假设共有M个第二检索词Qb,若某一级相关新闻Nj关联到其中的mj条第二检索词Qb,则该相关新闻Nj的idf权重为
Step5:计算综合检索权重
综合检索权重为熵与idf的乘积,即H(Qa,Nj)*IDF(Nj)。
Step6:排序输出推荐结果
由上述步骤可以确定每个一级相关新闻Nj的综合检索权重,从而按照综合检索权重的值的大小确定全部一级相关新闻的排序。综合检索权重的值大的,则对应的一级相关新闻的推荐就考前。
显然,根据本发明的多级相关新闻的查找方法,利用多级检索词的相似关系,再基于熵的二级推荐方式,能够获取到与用户输入的检索词语义上相似的相关新闻。
图5是根据本发明一个实施方式的多级相关新闻的查找装置的结构示意图。
参见图5,多级相关新闻的查找装置50包括检索词获取模块51、相关新闻获取模块52和相关新闻确定模块53。
其中,检索词获取模块51用于获取与第一检索词相关的一个或多个第二检索词,相关新闻获取模块52用于获取与所述一个或多个第二检索词匹配的一个或多个一级相关新闻,相关新闻确定模块53用于从所述一个或多个一级相关新闻中,确定与所述第一检索词匹配的二级相关新闻。
进一步地,相关新闻确定模块53包括确定子模块531和选取子模块532,如图6所示。其中,确定子模块531确定一个或多个一级相关新闻的综合权重值,选取子模块532基于确定子模块531所确定的综合权重值,从一个或多个一级相关新闻中选取二级相关新闻。
可选地,确定子模块531确定由所述第一检索词查找到所述一级相关新闻的第一检索权重;确定所述第一级相关新闻与所述第一检索词相匹配的第二检索权重;根据所述第一检索权重和所述第二检索权重,确定一级相关新闻的综合检索权重。
可选地,确定子模块531确定由第一检索词经过所述一个或多个第二检索词查找到一级相关新闻的第一检索权重。
可选地,确定子模块531根据所述第一检索词与所述一个或多个第二检索词中的一个第二检索词之间的相似度,确定第一检索概率;确定由所述一个或多个第二检索词中的一个第二检索词获得所述一级相关新闻的第二检索概率;确定所述第一检索权重为所述第一检索概率与所述第二检索概率的乘积的加和。
其中,所述第一检索概率为所述第一检索词与所述第二检索词的余弦相似度的平方。
可选地,确定子模块531根据所述一级相关新闻经由所述一个或多个第二检索词与所述第一检索词相匹配的第二检索词的个数,确定所述一级相关新闻的第二检索权重。
其中,所述第二检索权重是根据IDF算法获得。
可选地,确定子模块531确定综合检索权重为所述第一检索权重与所述第二检索权重的乘积。
由此,根据本发明的多级相关新闻的查找装置,利用多级检索词的相似关系,再基于熵的二级推荐方式,能够获取到与用户输入的检索词语义上相似的相关新闻。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的基于评论确定新闻推荐权重的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
此外,还应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (14)

1.一种多级相关新闻的查找方法,包括:
获取与第一检索词相关的一个或多个第二检索词;其中,所述第一检索词与第二检索词之间的关系,是通过大量用户的日志数据进行统计获得的;
获取仅与所述一个或多个第二检索词匹配的一个或多个一级相关新闻;
确定由所述第一检索词查找到所述一级相关新闻的第一检索权重;
确定所述一级相关新闻与所述第一检索词相匹配的第二检索权重;
根据所述第一检索权重和所述第二检索权重,确定一级相关新闻的综合检索权重;
基于所述综合权重,从所述一个或多个一级相关新闻中选取二级相关新闻。
2.根据权利要求1所述的查找方法,其中所述确定由第一检索词查找到一级相关新闻的第一检索权重,包括:
确定由第一检索词经过所述一个或多个第二检索词查找到一级相关新闻的第一检索权重。
3.根据权利要求2所述的查找方法,其中所述确定由第一检索词经过一个或多个第二检索词查找到一级相关新闻的第一检索权重,包括:
根据所述第一检索词与所述一个或多个第二检索词中的一个第二检索词之间的相似度,确定第一检索概率;
确定由所述一个或多个第二检索词中的一个第二检索词获得所述一级相关新闻的第二检索概率;
确定所述第一检索权重为所述第一检索概率与所述第二检索概率的乘积的加和。
4.根据权利要求3所述的查找方法,其中所述第一检索概率为所述第一检索词与所述第二检索词的余弦相似度的平方。
5.根据权利要求1-4中任一项所述的查找方法,其中所述确定一级相关新闻与第一检索词相匹配的第二检索权重,包括:
根据所述一级相关新闻经由所述一个或多个第二检索词与所述第一检索词相匹配的第二检索词的个数,确定所述一级相关新闻的第二检索权重。
6.根据权利要求5所述的查找方法,其中所述第二检索权重是根据IDF算法获得。
7.根据权利要求1所述的查找方法,其中所述综合检索权重为所述第一检索权重与所述第二检索权重的乘积。
8.一种多级相关新闻的查找装置,包括:
检索词获取模块,用于获取与第一检索词相关的一个或多个第二检索词;其中,所述第一检索词与第二检索词之间的关系,是通过大量用户的日志数据进行统计获得的;
相关新闻获取模块,用于获取仅与所述一个或多个第二检索词匹配的一个或多个一级相关新闻;
相关新闻确定模块包括:确定子模块和选取子模块;
其中,所述确定子模块,用于确定由所述第一检索词查找到所述一级相关新闻的第一检索权重;确定所述一级相关新闻与所述第一检索词相匹配的第二检索权重;根据所述第一检索权重和所述第二检索权重,确定一级相关新闻的综合检索权重;
所述选取子模块,用于基于由所述确定子模块确定的所述综合权重值,从所述一个或多个一级相关新闻中选取二级相关新闻。
9.根据权利要求8所述的查找装置,其中所述确定子模块通过以下步骤确定第一检索权重:
确定由第一检索词经过所述一个或多个第二检索词查找到一级相关新闻的第一检索权重。
10.根据权利要求9所述的查找装置,其中所述确定子模块通过以下方式确定第一检索权重:
根据所述第一检索词与所述一个或多个第二检索词中的一个第二检索词之间的相似度,确定第一检索概率;
确定由所述一个或多个第二检索词中的一个第二检索词获得所述一级相关新闻的第二检索概率;
确定所述第一检索权重为所述第一检索概率与所述第二检索概率的乘积的加和。
11.根据权利要求10所述的查找装置,其中所述第一检索概率为所述第一检索词与所述第二检索词的余弦相似度的平方。
12.根据权利要求8-11中任一项所述的查找装置,其中所述确定子模块通过以下步骤确定第二检索权重:
根据所述一级相关新闻经由所述一个或多个第二检索词与所述第一检索词相匹配的第二检索词的个数,确定所述一级相关新闻的第二检索权重。
13.根据权利要求12所述的查找装置,其中所述第二检索权重是根据IDF算法获得。
14.根据权利要求8所述的查找装置,其中所述综合检索权重为所述第一检索权重与所述第二检索权重的乘积。
CN201510981561.9A 2015-12-23 2015-12-23 多级相关新闻的查找方法及装置 Active CN105589967B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510981561.9A CN105589967B (zh) 2015-12-23 2015-12-23 多级相关新闻的查找方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510981561.9A CN105589967B (zh) 2015-12-23 2015-12-23 多级相关新闻的查找方法及装置

Publications (2)

Publication Number Publication Date
CN105589967A CN105589967A (zh) 2016-05-18
CN105589967B true CN105589967B (zh) 2019-08-09

Family

ID=55929546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510981561.9A Active CN105589967B (zh) 2015-12-23 2015-12-23 多级相关新闻的查找方法及装置

Country Status (1)

Country Link
CN (1) CN105589967B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101241512A (zh) * 2008-03-10 2008-08-13 北京搜狗科技发展有限公司 一种重新定义查询词的搜索方法及装置
CN101251844A (zh) * 2007-02-21 2008-08-27 富士胶片株式会社 用于检索内容的设备和方法
CN101872351A (zh) * 2009-04-27 2010-10-27 阿里巴巴集团控股有限公司 识别同义词的方法、装置及利用其进行搜索的方法和装置
CN103207881A (zh) * 2012-01-17 2013-07-17 阿里巴巴集团控股有限公司 查询方法和装置
CN103425687A (zh) * 2012-05-21 2013-12-04 阿里巴巴集团控股有限公司 一种基于关键词的检索方法和系统
CN103544267A (zh) * 2013-10-16 2014-01-29 北京奇虎科技有限公司 一种基于搜索建议词进行搜索的方法以及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080195601A1 (en) * 2005-04-14 2008-08-14 The Regents Of The University Of California Method For Information Retrieval

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101251844A (zh) * 2007-02-21 2008-08-27 富士胶片株式会社 用于检索内容的设备和方法
CN101241512A (zh) * 2008-03-10 2008-08-13 北京搜狗科技发展有限公司 一种重新定义查询词的搜索方法及装置
CN101872351A (zh) * 2009-04-27 2010-10-27 阿里巴巴集团控股有限公司 识别同义词的方法、装置及利用其进行搜索的方法和装置
CN103207881A (zh) * 2012-01-17 2013-07-17 阿里巴巴集团控股有限公司 查询方法和装置
CN103425687A (zh) * 2012-05-21 2013-12-04 阿里巴巴集团控股有限公司 一种基于关键词的检索方法和系统
CN103544267A (zh) * 2013-10-16 2014-01-29 北京奇虎科技有限公司 一种基于搜索建议词进行搜索的方法以及装置

Also Published As

Publication number Publication date
CN105589967A (zh) 2016-05-18

Similar Documents

Publication Publication Date Title
AU2014201827B2 (en) Scoring concept terms using a deep network
KR101994987B1 (ko) 관련 엔티티들
KR101775061B1 (ko) 엔티티들과 연관된 애스펙트들을 식별하기 위한 시스템들 및 방법들
US9703891B2 (en) Hybrid and iterative keyword and category search technique
CN105095474B (zh) 建立搜索词与应用数据推荐关系的方法及装置
CN104036009B (zh) 一种搜索匹配图片的方法、图片搜索方法及装置
CN107145496A (zh) 基于关键词将图像与内容项目匹配的方法
CN103412881B (zh) 提供搜索结果的方法及系统
CN107683471A (zh) 索引具有深度链接的网页
CN107291699A (zh) 一种句子语义相似度计算方法
CN103617213B (zh) 识别新闻网页属性特征的方法和系统
US20150294018A1 (en) Method and apparatus for recommending keywords
US9251274B2 (en) Grouping search results into a profile page
CN104008180B (zh) 结构化数据与图片的关联方法与关联装置
WO2014185834A1 (en) Search engine for textual content and non-textual content
CN107291939A (zh) 酒店信息的聚类匹配方法及系统
CN106557476A (zh) 相关信息的获取方法及装置
CN103942264B (zh) 推送包含新闻信息的网页的方法和装置
Vesdapunt et al. Identifying users in social networks with limited information
CN106603490A (zh) 一种钓鱼网站的检测方法和系统
CN104854588B (zh) 用于搜索标记的主要为非文本的项目的系统和方法
CN106294358A (zh) 一种信息的检索方法及系统
Mottin et al. Searching with xq: the exemplar query search engine
US10521461B2 (en) System and method for augmenting a search query
CN105589967B (zh) 多级相关新闻的查找方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220725

Address after: Room 801, 8th floor, No. 104, floors 1-19, building 2, yard 6, Jiuxianqiao Road, Chaoyang District, Beijing 100015

Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee before: Qizhi software (Beijing) Co.,Ltd.