CN101211368A - 一种对查询词分类的方法、装置及搜索引擎系统 - Google Patents

一种对查询词分类的方法、装置及搜索引擎系统 Download PDF

Info

Publication number
CN101211368A
CN101211368A CNA2007103041821A CN200710304182A CN101211368A CN 101211368 A CN101211368 A CN 101211368A CN A2007103041821 A CNA2007103041821 A CN A2007103041821A CN 200710304182 A CN200710304182 A CN 200710304182A CN 101211368 A CN101211368 A CN 101211368A
Authority
CN
China
Prior art keywords
classification
webpage
query word
web page
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007103041821A
Other languages
English (en)
Other versions
CN101211368B (zh
Inventor
张智敏
张阔
茹立云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN2007103041821A priority Critical patent/CN101211368B/zh
Publication of CN101211368A publication Critical patent/CN101211368A/zh
Application granted granted Critical
Publication of CN101211368B publication Critical patent/CN101211368B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种对查询词分类的方法,包括:获取用户输入的查询词,记录用户利用该查询词点击的网页,获取所述网页的分类信息,依据分类参数确定所述查询词的分类结果,所述分类参数包括网页的分类信息。本发明通过对查询词对应的网页分类确定查询词的分类,提高了查询词分类的效率,节约了资源。本发明还提供了一种对查询词分类的装置以及包含该装置的搜索引擎系统。

Description

一种对查询词分类的方法、装置及搜索引擎系统
技术领域
本发明涉及搜索查询领域,特别是涉及一种对查询词分类的方法、装置及包含该装置的搜索引擎系统。
背景技术
随着计算机技术、互联网技术的飞速发展,互联网带给人们生活的改变越来越大,越来越多人的生活离不开计算机、离不开互联网络。搜索引擎就是伴随着互联网的发展而发展起来的,使用搜索引擎,人们可以很方便的获取其想要知道的信息。在使用搜索引擎查询信息之前,首先得输入查询词。通过对查询词进行定位分析,才能定位至与查询词有关的信息,再提供给用户。查询词的分类对于搜索引擎非常重要,比如“苹果”这个词,既属于水果,又是一种电脑。确定一个查询词都属于哪些类别,一方面可以使搜索结果趋于多样化,另一方面可以避免出现无关的结果,更精确的定位查询消息,提高查询效率。并且,可以根据查询词的分类及各分类所占的比例搜索出对应的网页内容信息,从而提高搜索查询效率。对用户输入的查询词进行分类是一项非常复杂的技术。现有的查询词分类一般是使用人工的方式,确定某一个词属于哪一个类别,但是互联网用户的查询词数量极大,每天需要处理的查询词可能上千万,对这么大数量的查询词进行人工分类显然是不可能的,因此现在进行的手动查询词分类针对仅仅能满足小范围的分类,并且进行手动查询词分类,会造成资源的大量浪费,成本高、并且效率非常低,不能充分的发挥计算机、互联网的优势。因此,迫切需要一种自动对用户的查询词进行分类的方法。
发明内容
本发明所要解决的技术问题是提供一种对查询词分类的方法及装置,本发明还提供一种包括所述装置的搜索引擎系统。
为了解决上述问题,本发明公开了一种对查询词分类的方法,包括:
获取用户输入的查询词;
记录用户利用该查询词点击的网页;
获取所述网页的分类信息;
依据分类参数确定所述查询词的分类结果,所述分类参数包括网页的分类信息。
其中,所述网页的分类信息包括网页的简单分类或者网页分类的比例,所述查询词的分类结果对应包括简单分类或分类比例。
其中,所述分类参数还包括所述查询词指向所述网页的访问次数或者访问比例。
进一步,还包括:
对网页进行分类,创建网页分类库。
进一步,还包括:
用户输入查询词时,根据所述查询词的分类结果确定搜索网页内容信息。
本发明还公开了一种对查询词分类的装置,包括:
接收单元,用于获取用户输入的查询词;
记录单元,用于记录用户利用查询词点击的网页;
获取单元,用于获取所述网页的分类信息;
确定单元,用于依据分类参数确定所述查询词的分类结果,所述分类参数包括网页的分类信息。
其中,所述网页的分类信息包括网页的简单分类或者网页分类的比例,所述查询词的分类结果对应包括简单分类或分类比例。
其中,所述分类参数还包括所述查询词指向所述网页的访问次数或者访问比例。
进一步,还包括:
创建单元,用于对网页进行分类,创建网页分类库。
进一步,还包括:
第二确定单元,用于根据所述查询词的分类结果确定搜索网页内容信息。
本发明还公开了一种搜索引擎系统。
与现有技术相比,本发明具有以下优点:
本发明通过对查询词对应的网页分类确定查询词的分类,提高了查询词分类的效率,节约了资源;当用户利用查询词搜索网页信息时,根据本发明确定的查询词的分类以及各分类所占的比例,能够更加准确的定位到用户想获取的网页内容信息,避免了无关网页内容信息的产生,节约了网络资源,提高了查询效率。
附图说明
图1是本发明一种对查询词分类的方法第一实施例的流程图;
图2是本发明一种对查询词分类的方法第二实施例的流程图;
图3是本发明一种对查询词分类的方法第三实施例的流程图;
图4是本发明一种对查询词分类的装置第一实施例的结构框图;
图5是本发明一种对查询词分类的装置第二实施例的结构框图;
图6是本发明一种对查询词分类的装置第三实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、以及包括以上任何系统或设备的分布式计算环境等等。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本发明中并没有对查询词及网页的分类有一个明确的限定,其可以根据实际的需要进行不同的划分,如可以有娱乐类、体育类、科技类、电影类等等。
参照图1,示出了本发明一种对查询词分类的方法第一实施例的流程图,包括步骤:
步骤101、获取用户输入的查询词。
当用户在使用搜索引擎获取网页内容信息时,其首先在搜索引擎上输入查询词,当用户输入查询词时,获取用户输入的查询词。进入步骤102。
步骤102、记录用户利用该查询词点击的网页。
用户在搜索引擎上输入一个查询词,搜索引擎根据用户的查询词,返回与查询词对应的网页。
搜索引擎中通常都有一个日志系统,所述日志系统用来记录用户在搜索引擎上的行为,包含两个方面:
1、记录用户在搜索引擎上进行的查询。
2、记录用户在进行一次查询时,点击的网页。比如:用户在www.sogou.com上搜索sohu时,点击的网页有:http://www.sohu.com、http://news.sohu.com...
步骤103、获取所述网页的分类。
要获取网页的分类,首先要存在网页分类库。因此,本实施例还可以包括步骤:通过对网页进行分类,创建网页分类库。再从所述网页的分类库中获取所述网页的分类。可以得知,如果已经存在网页分类库,则创建网页分类库的步骤并不是所述实施例的必要步骤。
对于网页的分类,现在已有许多方法可以实现,以下介绍几种网页分类的方法:
贝叶斯分类算法:贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。贝叶斯决策理论方法是统计模型决策中的一个基本方法,其基本思想是已知类条件概率密度参数表达式和先验概率;利用贝叶斯公式转换成后验概率;根据后验概率大小进行决策分类。它对统计推理的主要贡献是使用了″逆概率″这个概念,并把它作为一种普遍的推理方法。
SVM分类算法:SVM分类法是一种支持向量机方法,对线性分类器提出了另一种设计最佳准则,从线性可分的情况扩展到线性不可分的情况,甚至扩展到使用非线性函数中去,这种分类器被称为支持向量机(Support VectorMachine,简称SVM)。
当然,在创建网页分类库的步骤中还可以通过对网页进行手动分类,对网站网页手动分类,虽然成本高,效率低,但却可以得到比较准确的分类结果,因为网页并不像查询词那样数据巨大,因此对网页进行手动分类也是可行的。
步骤104、根据所述网页的分类确定所述查询词的分类。
参照图2,示出了本发明一种对查询词分类的方法第二实施例的流程图,包括步骤:
步骤201、获取用户输入的查询词。
当用户在使用搜索引擎获取网页内容信息时,其首先在搜索引擎上输入查询词,当用户输入查询词时,获取用户输入的查询词。进入步骤202。
步骤202、记录用户利用该查询词点击的网页。
搜索引擎中通常都有一个日志系统,所述日志系统用来记录用户在搜索引擎上的行为。根据一个查询词获取用户在查这个查询词时点击了哪些网页,以及每个网页被访问了多少次。
步骤203、获取所述网页的分类信息。
将获取的网页到网页分类库中查找对应的分类和属于这个分类的比例。
要获取网页的分类,首先要存在网页分类库。因此,本实施例还可以包括步骤:通过对网页进行分类,创建网页分类库。再从所述网页分类库中获取所述网页的分类。可以得知,如果已经存在网页分类库,则所述创建网页分类库的步骤并不是所述实施例的必要步骤。
由于网页分类库中存在多种类型的网页,因此,每种类的网页都占有一个比例,通过网页分类库获取所述网页的分类占网页所有类的比例。
步骤204、根据所述网页的分类分类信息确定所述查询词的分类结果。
所述查询词的分类结果包括查询词的分类比例。查询词对应的网页可能属于不同的分类,因此查询词也可能属于不同的分类。属于每个分类的比例可以用网址的访问次数和这个网页属于的那个分类的比例计算确定。所述确定方法可以根据实际需要附上不同的权重确定,也可以直接相乘得出,本发明实施例对此不进行限定。
参照图3,示出了本发明一种对查询词分类的方法第三实施例的流程图,包括步骤:
步骤301、获取用户输入的查询词。
当用户在使用搜索引擎获取网页内容信息时,其首先在搜索引擎上输入查询词,当用户输入查询词时,获取用户输入的查询词。进入步骤302。
步骤302、记录用户利用该查询词点击的网页。
搜索引擎中通常都有一个日志系统,所述日志系统用来记录用户在搜索引擎上的行为。根据一个查询词获取用户在查这个查询词时点击了哪些网页,以及每个网页被访问了多少次。
步骤303、获取所述网页的分类信息。
将获取的网页到网页分类库中查找对应的分类和属于这个分类的比例。
要获取网页的分类,首先要存在网页分类库。因此,本实施例还可以包括步骤:通过对网页进行分类,创建网页分类库。再从所述网页分类库中获取所述网页的分类。可以得知,如果已经存在网页分类库,则所述创建网页分类库的步骤并不是所述实施例的必要步骤。
由于网页分类库中存在多种类型的网页,因此,每种类的网页都占有一个比例,通过网页分类库获取所述网页的分类占网页所有类的比例。
步骤304、根据所述网页的分类信息确定所述查询词的分类结果。
所述查询词的分类结果对应网页的分类信息,如只获取网页的简单分类,则根据网页的分类信息确定的查询词的分类结果也是简单分类,即属于什么类别的查询词;如获取网页的简单分类及分类比例,则也可确定查询词的分类比例。
步骤305、根据所述查询词的分类结果确定搜索网页的内容信息。
确定所述查询词的各分类及各分类所占的比例,可以更为准确的定位网页内容信息。比如,确定“苹果”属于IT类的比例占有60%,属于水果内的比例占有20%,则用户输入查询词“苹果”时,搜索引擎可以更多的提供与IT有关的网页。
本发明通过对查询词对应的网页分类确定查询词的分类,提高了查询词分类的效率,节约了资源;当用户利用查询词搜索网页信息时,根据本发明确定的查询词的分类以及各分类所占的比例,能够更加准确的定位到用户想获取的网页内容信息,避免了无关网页内容信息的产生,节约了网络资源,提高了查询效率。
在本发明所述方法的第四实施例中,还可以根据查询词指向所述网页的访问次数或者访问比例确定查询词的分类结果。
在本发明所述方法的第五实施例中,根据网页的访问次数及网页的分类信息确定查询词的分类比例。
假如:输入“太阳”作为查询词,返回出若干个结果,搜索引擎日志系统将用户点击的网页和每个网页访问的次数将其记录,例如用户点击http://sun.sohu.com/M次,点击http://zhidao.baidu.com/question/16657628N次,其中http://sun.sohu.com/在网页分类库中的分类属于影视娱乐类的概率为A%,那么“太阳”这个查询词属于影视娱乐类的概率为M÷(M+N)×A%;http://zhidao.baidu.com/question/16657628在网页分类库中的分类属于科技类的概率为B%,那么“太阳”这个查询词属于科技类的概率为N÷(M+N)×B%。
参照图4,示出了本发明一种对查询词分类的装置第一实施例的结构框图,包括:
接收单元401、用于获取用户输入的查询词。
记录单元402、用于记录用户利用查询词点击的网页。
获取单元403、用于获取所述网页的分类。
确定单元404、用于依据网页的分类确定所述查询词的分类。
下面对所述装置的工作过程及工作原理进行介绍:
接收单元接收用户输入的查询词,返回若干个与查询词有关的网页供用户选择,当用户点击所感兴趣的网页时,记录单元记录用户点击的网页,获取单元根据所述点击的网页从网页分类库中获取所述网页的分类,获取网页的分类后,确定单元根据所述网页的分类确定所述查询词的分类。
在本实施例中,以已经存在网页分类库为前提,如果不存在网页分类库,则还包括创建单元,用于对网页进行分类,创建网页分类库,所述原理在前面已经进行了详细描述,为了篇幅考虑,在此不再详述。
参照图5,示出了本发明一种对查询词分类的装置第二实施例的结构框图,包括:
接收单元501、用于获取用户输入的查询词。
记录单元502、用于记录用户利用该查询词点击的网页。
获取单元503、用于获取所述网页的分类信息。
确定单元504、用于根据所述网页的分类信息确定所述查询词的分类结果。
下面对所述装置的工作过程及工作原理进行介绍:
接收单元接收用户输入的查询词,返回若干个与查询词有关的网页供用户选择,当用户点击所感兴趣的网页时,记录单元记录用户点击的网页及该网页的访问次数,获取单元根据所述点击的网页从网页分类库中获取所述网页的分类以及所述网页的分类所占的比例,确定单元根据所述网页的分类以及所述网页的分类所占的比例确定所述查询词的分类。
在本实施例中,以已经存在网页分类库为前提,如果不存在网页分类库,则还包括创建单元,用于对网页进行分类,创建网页分类库,所述原理在前面已经进行了详细描述,为了篇幅考虑,在此不再详述。
参照图6,示出了本发明一种对查询词分类的装置第三实施例的结构框图,所述实施例中的装置除了包括接收单元501、记录单元502、获取单元503、确定单元504外,还包括:
第二确定单元601、用于根据所述查询词的分类及各分类的比例确定搜索网页的内容信息。
本发明还公开了一种搜索引擎系统,所述系统包含图4或图5或图6所描述的装置。该搜索引擎系统通过图4或图5或图6所描述的装置对查询词进行分类后,当用户利用某一查询词进行搜索时可向用户提供更多的属于该查询词所属类别的相关内容;或当用户利用某一查询词进行搜索时可向用户推荐更多的属于该查询词所属类别的相关查询词。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图4、图5、图6是与图1、图2、图3所示方法实施例对应的装置实施例,因此,在装置实施例中未详细描述的部分,参照图1、图2、图3所示方法实施例中相应部分即可。
以上对本发明所提供的对查询词分类的方法及装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (13)

1.一种对查询词分类的方法,其特征在于,包括:
获取用户输入的查询词;
记录用户利用该查询词点击的网页;
获取所述网页的分类信息;
依据分类参数确定所述查询词的分类结果,所述分类参数包括网页的分类信息。
2.如权利要求1所述的方法,其特征在于:
所述网页的分类信息包括网页的简单分类或者网页分类的比例,所述查询词的分类结果对应包括简单分类或分类比例。
3.如权利要求1或2所述的方法,其特征在于:
所述分类参数还包括所述查询词指向所述网页的访问次数或者访问比例。
4.如权利要求1或2所述的方法,其特征在于,还包括:
对网页进行分类,创建网页分类库。
5.如权利要求1或2所述的方法,其特征在于,还包括:
用户输入查询词时,根据所述查询词的分类结果确定搜索网页内容信息。
6.如权利要求3所述的方法,其特征在于,还包括:
用户输入查询词时,根据所述查询词的分类结果确定搜索网页内容信息。
7.一种对查询词分类的装置,其特征在于,包括:
接收单元,用于获取用户输入的查询词;
记录单元,用于记录用户利用查询词点击的网页;
获取单元,用于获取所述网页的分类信息;
确定单元,用于依据分类参数确定所述查询词的分类结果,所述分类参数包括网页的分类信息。
8.如权利要求1所述的装置,其特征在于:
所述网页的分类信息包括网页的简单分类或者网页分类的比例,所述查询词的分类结果对应包括简单分类或分类比例。
9.如权利要求7或8所述的装置,其特征在于:
所述分类参数还包括所述查询词指向所述网页的访问次数或者访问比例。
10.如权利要求7或8所述的装置,其特征在于,还包括:
创建单元,用于对网页进行分类,创建网页分类库。
11.如权利要求7或8所述的装置,其特征在于,还包括:
第二确定单元,用于根据所述查询词的分类结果确定搜索网页内容信息。
12.如权利要求9所述的装置,其特征在于,还包括:
第二确定单元,用于根据所述查询词的分类结果确定搜索网页内容信息。
13.一种搜索引擎系统,其特征在于,所搜索引擎系统包括如权利要求7至12任一权利要求所述对查询词分类的装置。
CN2007103041821A 2007-12-25 2007-12-25 一种对查询词分类的方法、装置及搜索引擎系统 Active CN101211368B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007103041821A CN101211368B (zh) 2007-12-25 2007-12-25 一种对查询词分类的方法、装置及搜索引擎系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007103041821A CN101211368B (zh) 2007-12-25 2007-12-25 一种对查询词分类的方法、装置及搜索引擎系统

Publications (2)

Publication Number Publication Date
CN101211368A true CN101211368A (zh) 2008-07-02
CN101211368B CN101211368B (zh) 2011-08-03

Family

ID=39611393

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007103041821A Active CN101211368B (zh) 2007-12-25 2007-12-25 一种对查询词分类的方法、装置及搜索引擎系统

Country Status (1)

Country Link
CN (1) CN101211368B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101984423A (zh) * 2010-10-21 2011-03-09 百度在线网络技术(北京)有限公司 一种热搜词生成方法及系统
CN102222072A (zh) * 2010-04-19 2011-10-19 腾讯科技(深圳)有限公司 一种信息分类的方法和装置
CN102737029A (zh) * 2011-04-02 2012-10-17 腾讯科技(深圳)有限公司 搜索方法及系统
CN104199822A (zh) * 2014-07-11 2014-12-10 五八同城信息技术有限公司 一种识别搜索对应的需求分类的方法和系统
CN105335449A (zh) * 2014-08-15 2016-02-17 北京奇虎科技有限公司 基于搜索引擎数据库的样本自动挖掘方法及装置
CN105630827A (zh) * 2014-11-05 2016-06-01 阿里巴巴集团控股有限公司 一种信息处理方法、系统及辅助系统
CN106708901A (zh) * 2015-11-17 2017-05-24 北京国双科技有限公司 网站内搜索词的聚类方法及装置
CN107423304A (zh) * 2016-05-24 2017-12-01 百度在线网络技术(北京)有限公司 检索词分类方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1932817A (zh) * 2006-09-15 2007-03-21 陈远 通用互联网内容关键词交互系统
CN101038596A (zh) * 2007-04-29 2007-09-19 北京搜狗科技发展有限公司 一种网站分类方法及系统

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222072A (zh) * 2010-04-19 2011-10-19 腾讯科技(深圳)有限公司 一种信息分类的方法和装置
CN101984423A (zh) * 2010-10-21 2011-03-09 百度在线网络技术(北京)有限公司 一种热搜词生成方法及系统
CN101984423B (zh) * 2010-10-21 2012-07-04 百度在线网络技术(北京)有限公司 一种热搜词生成方法及系统
CN102737029A (zh) * 2011-04-02 2012-10-17 腾讯科技(深圳)有限公司 搜索方法及系统
CN104199822A (zh) * 2014-07-11 2014-12-10 五八同城信息技术有限公司 一种识别搜索对应的需求分类的方法和系统
CN104199822B (zh) * 2014-07-11 2018-05-18 五八同城信息技术有限公司 一种识别搜索对应的需求分类的方法和系统
CN105335449A (zh) * 2014-08-15 2016-02-17 北京奇虎科技有限公司 基于搜索引擎数据库的样本自动挖掘方法及装置
CN105335449B (zh) * 2014-08-15 2019-03-01 北京奇虎科技有限公司 基于搜索引擎数据库的样本自动挖掘方法及装置
CN105630827A (zh) * 2014-11-05 2016-06-01 阿里巴巴集团控股有限公司 一种信息处理方法、系统及辅助系统
CN105630827B (zh) * 2014-11-05 2019-04-02 阿里巴巴集团控股有限公司 一种信息处理方法、系统及辅助系统
CN106708901A (zh) * 2015-11-17 2017-05-24 北京国双科技有限公司 网站内搜索词的聚类方法及装置
CN107423304A (zh) * 2016-05-24 2017-12-01 百度在线网络技术(北京)有限公司 检索词分类方法及装置

Also Published As

Publication number Publication date
CN101211368B (zh) 2011-08-03

Similar Documents

Publication Publication Date Title
US11100178B2 (en) Method and device for pushing information
US7685091B2 (en) System and method for online information analysis
CN101211368B (zh) 一种对查询词分类的方法、装置及搜索引擎系统
CN109885773B (zh) 一种文章个性化推荐方法、系统、介质及设备
CN102760138B (zh) 用户网络行为的分类方法和装置及对应的搜索方法和装置
US7421429B2 (en) Generate blog context ranking using track-back weight, context weight and, cumulative comment weight
US7949643B2 (en) Method and apparatus for rating user generated content in search results
CN102831199B (zh) 建立兴趣模型的方法及装置
CN102054003B (zh) 网络信息推荐、建立网络资源索引的方法及系统
US20110264651A1 (en) Large scale entity-specific resource classification
CN106202514A (zh) 基于Agent的突发事件跨媒体信息的检索方法及系统
CN101621391A (zh) 基于概率主题进行短文本分类的方法及系统
CN109947902B (zh) 一种数据查询方法、装置和可读介质
CN103399891A (zh) 网络内容自动推荐方法、装置和系统
CN103177090A (zh) 一种基于大数据的话题检测方法及装置
CN112508609B (zh) 人群扩量的预测方法、装置、设备及存储介质
JP2013534334A (ja) 照会結果をソートするための方法および装置
Capelle et al. Semantic news recommendation using wordnet and bing similarities
Costa et al. Learning temporal-dependent ranking models
CN111061954B (zh) 搜索结果排序方法、装置及存储介质
CN104361037A (zh) 微博分类方法及装置
Chen et al. Recommending software features for mobile applications based on user interface comparison
CN104615723B (zh) 查询词权重值的确定方法和装置
CN105159898A (zh) 一种搜索的方法和装置
Garcia et al. Comparative evaluation of link-based approaches for candidate ranking in link-to-wikipedia systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant