CN102253943A - 一种网页评级方法和网页评级系统 - Google Patents
一种网页评级方法和网页评级系统 Download PDFInfo
- Publication number
- CN102253943A CN102253943A CN 201010179138 CN201010179138A CN102253943A CN 102253943 A CN102253943 A CN 102253943A CN 201010179138 CN201010179138 CN 201010179138 CN 201010179138 A CN201010179138 A CN 201010179138A CN 102253943 A CN102253943 A CN 102253943A
- Authority
- CN
- China
- Prior art keywords
- webpage
- keyword
- weight
- scoring
- getting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及网页过滤技术,针对现有网站过滤机制效率不高导致大量非法信息得以绕过防范措施而进入公众信息传播渠道的缺陷,提供一种网页评级方法和网页评级系统。网页评级方法包括读取至少一个关键词;爬取包含读取的该至少一个关键词的至少一个网页;对于爬取的每一网页,基于预先设置的评级模型来计算该网页的评分;在判定评级表中不包含该网页时,将该网页的地址及评分写入评级表中;基于评分定期对评级表中的网页进行排序,并输出排序结果。本发明还提供了一种网页评级系统。本发明提供的技术方案可基于预设的过滤标准来自动判定哪些网页属于非法网页。此外,还可进一步基于评分来对网页进行分类以便工作人员基于归类来手动认定非法网页。
Description
技术领域
本发明涉及网页过滤技术,更具体地说,涉及一种网站评级方法和网站评级系统。
背景技术
互联网的出现大大改变了人们的生活,巨大的信息量使得互联网日益成为人们获取信息的最主要来源。
然而,在向人们提供有用信息的同时,非法组织也在利用互联网来传播非法信息。更为严重的是,随着移动互联网的日渐流行,非法信息在移动互联网上的传播也正在加速进行。尽管采取了网站过滤等一些防范措施,但这些措施的处理效率十分有限。例如调整面对互联网每日巨大的信息增量,大量非法信息得以绕过防范措施而进入公众信息传播渠道。
因此,需要一种网站过滤机制,可有效克服现有网站信息过滤方案之中存在的上述缺陷。
发明内容
本发明要解决的技术问题在于,针对现有网站过滤机制效率不高导致大量非法信息得以绕过防范措施而进入公众信息传播渠道的缺陷,提供一种网站评级方法和网站评级系统。
本发明解决其技术问题所采用的技术方案是:
一种网页评级方法,用于对网页内容进行评级,包括:
评分步骤,包括:
读取至少一个关键词;
爬取包含读取的该至少一个关键词的至少一个网页;
对于爬取的每一网页:
基于预先设置的评级模型来计算该网页的评分;
在判定评级表中不包含该网页时,将该网页的地址及评分写入评级表中;
排序步骤,包括:
基于评分定期对评级表中的网页进行排序,并输出排序结果。
在本发明提供的网页评级方法中,对于爬取的每一网页,在算得其评分之后,所述评分步骤进一步包括,在判定评级表中包含该网页时,基于算得的评分对评级表中该网页的评分进行更新。
在本发明提供的网页评级方法中,在对评级表中的网页进行排序之后,所述排序步骤还包括,基于评分对排序后的网页进行归类。
在本发明提供的网页评级方法中,所述评级模型是基于所述至少一个关键词的关键词数量、针对每一关键词预先设置的权重以及所述至少一个关键词在待评网页中的出现总次数来构建的。
在本发明提供的网页评级方法中,所述评级模型为:
其中:
其中,q为评分步骤中读取的关键词的数量,x为爬取的至少一个网页中的一个网页x,score(x)为网页x的评分,coord(q)为q个关键词中在网页x中出现的关键词的数量,frequency(i)为q个关键词中第i个关键词在网页x中的出现次数;numpage为爬取的网页的数量,weight(q)为q个关键词组合后的权重,weight(x)为网页x在爬取的网页中的权重,weight(f)为网页x的第f个部分在网页x中的权重,其中,网页x共包含d个部分,numofterm(f为第i个关键词在网页x中的第f个部分中出现的次数。
一种网页评级系统,用于对网页内容进行评级,包括:
评分模块,用于:
读取至少一个关键词;
爬取包含读取的该至少一个关键词的至少一个网页;
对于爬取的每一网页:
基于预先设置的评级模型来计算该网页的评分;
在判定评级表中不包含该网页时,将该网页的地址及评分写入评级表中;
排序模块,用于:
基于评分定期对评级表中的网页进行排序,并输出排序结果。
在本发明提供的网页评级方法中,对于爬取的每一网页,在算得其评分之后,所述评分模块进一步用于,在判定评级表中包含该网页时,基于算得的评分对评级表中该网页的评分进行更新。
在本发明提供的网页评级方法中,在对评级表中的网页进行排序之后,所述排序模块还用于,基于评分对排序后的网页进行归类。
在本发明提供的网页评级方法中,所述评级模型是基于所述至少一个关键词的关键词数量、针对每一关键词预先设置的权重以及所述至少一个关键词在待评网页中的出现总次数来构建的。
在本发明提供的网页评级方法中,所述评级模型为:
其中:
其中,q为评分步骤中读取的关键词的数量,x为爬取的至少一个网页中的一个网页x,score(x)为网页x的评分,coord(q)为q个关键词中在网页x中出现的关键词的数量,frequency(i)为q个关键词中第i个关键词在网页x中的出现次数;numpage为爬取的网页的数量,weight(q)为q个关键词组合后的权重,weight(x)为网页x在爬取的网页中的权重,weight(f)为网页x的第f个部分在网页x中的权重,其中,网页x共包含d个部分,numofterm(f)为第i个关键词在网页x中的第f个部分中出现的次数。
实施本发明的技术方案,具有以下有益效果:本发明提供的技术方案通过读取关键词列表中的多个关键词来爬取包含这些关键词的网页。对于爬取的每一网页,本发明提供的技术方案基于预先设置的评级模型来计算该网页的评分,然后基于评分对爬取的网页进行排序。基于以上排序结果,便可基于预设的过滤标准来自动判定哪些网页属于非法网页。此外,在排序之后,本发明提供的技术方案还可进一步基于评分来对网页进行分类,从而便于工作人员基于归类来手动认定非法网页。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是依据本发明一较佳实施例的网页评级方法的示范性流程图;
图2是依据本发明一较佳实施例的网页评级系统的逻辑结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供了一种网页评级方法和网页评级系统,通过读取关键词列表中的多个关键词来爬取包含这些关键词的网页。对于爬取的每一网页,本发明提供的技术方案基于预先设置的评级模型来计算该网页的评分,然后基于评分对爬取的网页进行排序。基于以上排序结果,便可基于预设的过滤标准来自动判定哪些网页属于非法网页。此外,在排序之后,本发明提供的技术方案还可进一步基于评分来对网页进行分类,从而便于工作人员基于归类来手动认定非法网页。下面就结合附图和具体实施例来对本发明提供的技术方案进行详细描述。
图1是依据本发明一较佳实施例的网页评级方法100的示范性流程图。本发明提供的网页评级方法100用于对网页内容进行评级,以协助审查在网页内容之中是否包含非法信息。具体说来,本发明提供的网页评级方法100基于一个或多个关键字来对网页内容进行搜索,以确定网页中包含上述关键字的情况,例如但不限于包含关键字的种类数量,以及各关键字出现的次数等等。基于上述搜索结果,本发明提供的网页评级方法100对网页进行评分,以指示该网页所包含内容的合法/违法程度。
如图1所示,方法100开始于步骤102。
随后,在下一步骤104,读取至少一个关键词。在具体实现过程中,可从预先设置的包含多个关键词的关键词列表中读取这些关键词。这些关键词是已经认定的极有可能涉及非法信息的敏感词。
随后,在下一步骤106,爬取包含读取的该至少一个关键词的至少一个网页。在具体实现过程中,基于关键词来爬取包含该关键词的网页的相关技术已经在现有技术之中做了清楚的描述,因此此处不再赘述。
随后,在下一步骤108,对于爬取的每一网页,基于预先设置的评级模型来计算该网页的评分。
在具体实现过程中,上述评级模型是基于所述至少一个关键词的关键词数量、针对每一关键词预先设置的权重以及所述至少一个关键词在待评网页中的出现总次数来构建的。
具体来说,可采用下列公式作为评级模型来计算网页的评分:
其中:
在上述公式中,q为评分步骤中读取的关键词的数量,x为爬取的至少一个网页中的一个网页x,score(x)为网页x的评分,coord(q)为q个关键词中在网页x中出现的关键词的数量(在具体实现过程中,爬取的网页不一定包含全部q个关键词,也可能仅包含q个关键词中的一部分关键词),frequency(i)为q个关键词中第i个关键词在网页x中的出现次数;numpage为爬取的网页的数量,weight(q)为q个关键词组合后的权重(在具体实现过程中,除了为每个关键词设置权重外,还可将读取的q个关键词作为一个整体,为其设置一个权重,例如该权重可以是q个关键词中所有关键词权重的和或者乘积),weight(x)为网页x在爬取的网页中的权重(可预先设置网页x的权重),weight(f)为网页x的第f个部分在网页x(网页x共包含d个部分)中的权重(例如网页的标题部分和正文部分分别对应不同的权重),numofterm(f)为第i个关键词在网页x中的第f个部分中出现的次数。
随后,在下一步骤110,对于爬取的每一网页,判断该网页是否包含在评级表中,若是,则转到步骤112,否则转到步骤114。
如上文所述,若在步骤110,判定该网页已经包含在评级表中,则转到步骤112,基于算得的评分对评级表中该网页的评分进行更新。随后,方法100转到步骤116。
如上文所述,若在步骤110,判定该网页尚未包含在评级表中,则转到步骤114,将该网页的地址及评分写入评级表中。随后,方法100转到步骤116。
随后,在下一步骤116,基于评分定期对评级表中的网页进行排序,并输出排序结果。作为可选的,在对评级表中的网页进行排序之后,步骤116还可包括基于评分对排序后的网页进行归类,即基于网页的评分将其划归到不同的类别中。例如,如30分以下为D级网站,30-49分属于C级网站,50-79分属于B级网站,80-100分属于A级网站。
经过排序,便可基于以上排序结果,基于预设的过滤标准来自动判定哪些网页属于非法网页。例如可将过滤标准设置为评分在预设值之下的为非法网页。
此外,在将网页进行归类之后,还可输出归类结果,以便工作人员根据归类情况来手动查找非法网页。
最后,方法100结束于步骤118。
在具体实现过程中,步骤102-114可称为评分步骤,步骤116可称为排序步骤。
本发明还提供了一种网页评级系统,下面就结合图2对其进行详细的描述。
图2是依据本发明一较佳实施例的网页评级系统200的逻辑结构示意图。本发明提供的网页评级系统200用于对网页内容进行评级,以协助审查在网页内容之中是否包含非法信息。具体说来,本发明提供的网页评级系统200基于一个或多个关键字来对网页内容进行搜索,以确定网页中包含上述关键字的情况,例如但不限于包含关键字的种类数量,以及各关键字出现的次数等等。基于上述搜索结果,本发明提供的网页评级系统200对网页进行评分,以指示该网页所包含内容的合法/违法程度。
如图2所示,网站评级系统200包括评分模块202和排序模块204。
评分模块202用于读取至少一个关键词。
在具体实现过程中,可从预先设置的包含多个关键词的关键词列表中读取这些关键词。这些关键词是已经认定的极有可能涉及非法信息的敏感词。
评分模块202还用于爬取包含读取的该至少一个关键词的至少一个网页。在具体实现过程中,基于关键词来爬取包含该关键词的网页的相关技术已经在现有技术之中做了清楚的描述,因此此处不再赘述。此外,评分模块202还用于基于预先设置的评级模型来计算该网页的评分。
此外,评分模块202还用于对于爬取的每一网页,基于预先设置的评级模型来计算该网页的评分。
在具体实现过程中,上述评级模型是基于所述至少一个关键词的关键词数量、针对每一关键词预先设置的权重以及所述至少一个关键词在待评网页中的出现总次数来构建的。
具体来说,可采用下列公式作为评级模型来计算网页的评分:
其中:
在上述公式中,q为评分步骤中读取的关键词的数量,x为爬取的至少一个网页中的一个网页x,score(x)为网页x的评分,coord(q)为q个关键词中在网页x中出现的关键词的数量(在具体实现过程中,爬取的网页不一定包含全部q个关键词,也可能仅包含q个关键词中的一部分关键词),frequency(i)为q个关键词中第i个关键词在网页x中的出现次数;numpage为爬取的网页的数量,weight(q)为q个关键词组合后的权重(在具体实现过程中,除了为每个关键词设置权重外,还可将读取的q个关键词作为一个整体,为其设置一个权重,例如该权重可以是q个关键词中所有关键词权重的和或者乘积),weight(x)为网页x在爬取的网页中的权重(可预先设置网页x的权重),weight(f)为网页x的第f个部分在网页x(网页x共包含d个部分)中的权重(例如网页的标题部分和正文部分分别对应不同的权重),numofterm(f)为第i个关键词在网页x中的第f个部分中出现的次数。
对于爬取的每一网页,评分模块202还用于判断该网页是否包含在评级表中,若是,则基于算得的评分对评级表中该网页的评分进行更新;否则将该网页的地址及评分写入评级表中。
排序模块204,用于基于评分定期对评级表中的网页进行排序,并输出排序结果。作为可选的,在对评级表中的网页进行排序之后,排序模块204还可用于基于评分对排序后的网页进行归类,即基于网页的评分将其划归到不同的类别中。例如,如30分以下为D级网站,30-49分属于C级网站,50-79分属于B级网站,80-100分属于A级网站。
经过排序,便可基于以上排序结果,基于预设的过滤标准来自动判定哪些网页属于非法网页。例如可将过滤标准设置为评分在预设值之下的为非法网页。
此外,在将网页进行归类之后,还可输出归类结果,以便工作人员根据归类情况来手动查找非法网页。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种网页评级方法,用于对网页内容进行评级,其特征在于,包括:
评分步骤,包括:
读取至少一个关键词;
爬取包含读取的该至少一个关键词的至少一个网页;
对于爬取的每一网页:
基于预先设置的评级模型来计算该网页的评分;
在判定评级表中不包含该网页时,将该网页的地址及评分写入评级表中;
排序步骤,包括:
基于评分定期对评级表中的网页进行排序,并输出排序结果。
2.根据权利要求1所述的网页评级方法,其特征在于,对于爬取的每一网页,在算得其评分之后,所述评分步骤进一步包括,在判定评级表中包含该网页时,基于算得的评分对评级表中该网页的评分进行更新。
3.根据权利要求2所述的网站评级方法,其特征在于,在对评级表中的网页进行排序之后,所述排序步骤还包括,基于评分对排序后的网页进行归类。
4.根据权利要求3所述的网页评级方法,其特征在于,所述评级模型是基于所述至少一个关键词的关键词数量、针对每一关键词预先设置的权重以及所述至少一个关键词在待评网页中的出现总次数来构建的。
5.根据权利要求4所述的网页评级方法,其特征在于,所述评级模型为:
其中:
其中,q为评分步骤中读取的关键词的数量,x为爬取的至少一个网页中的一个网页x,score(x)为网页x的评分,coord(q)为q个关键词中在网页x中出现的关键词的数量,frequency(i)为q个关键词中第i个关键词在网页x中的出现次数;numpage为爬取的网页的数量,weight(q)为q个关键词组合后的权重,weight(x)为网页x在爬取的网页中的权重,weight(f)为网页x的第f个部分在网页x中的权重,其中,网页x共包含d个部分,numofterm(f)为第i个关键词在网页x中的第f个部分中出现的次数。
6.一种网页评级系统,用于对网页内容进行评级,其特征在于,包括:
评分模块,用于:
读取至少一个关键词;
爬取包含读取的该至少一个关键词的至少一个网页;
对于爬取的每一网页:
基于预先设置的评级模型来计算该网页的评分;
在判定评级表中不包含该网页时,将该网页的地址及评分写入评级表中;
排序模块,用于:
基于评分定期对评级表中的网页进行排序,并输出排序结果。
7.根据权利要求6所述的网页评级系统,其特征在于,对于爬取的每一网页,在算得其评分之后,所述评分模块进一步用于,在判定评级表中包含该网页时,基于算得的评分对评级表中该网页的评分进行更新。
8.根据权利要求7所述的网页评级系统,其特征在于,在对评级表中的网页进行排序之后,所述排序模块还用于,基于评分对排序后的网页进行归类。
9.根据权利要求8所述的网页评级系统,其特征在于,所述评级模型是基于所述至少一个关键词的关键词数量、针对每一关键词预先设置的权重以及所述至少一个关键词在待评网页中的出现总次数来构建的。
10.根据权利要求9所述的网页评级系统,其特征在于,所述评级模型为:
其中:
其中,q为评分步骤中读取的关键词的数量,x为爬取的至少一个网页中的一个网页x,score(x)为网页x的评分,coord(q)为q个关键词中在网页x中出现的关键词的数量,frequency(i)为q个关键词中第i个关键词在网页x中的出现次数;numpage为爬取的网页的数量,weight(q)为q个关键词组合后的权重,weight(x)为网页x在爬取的网页中的权重,weight(f)为网页x的第f个部分在网页x中的权重,其中,网页x共包含d个部分,numofterm(f)为第i个关键词在网页x中的第f个部分中出现的次数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010179138 CN102253943B (zh) | 2010-05-21 | 2010-05-21 | 一种网页评级方法和网页评级系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010179138 CN102253943B (zh) | 2010-05-21 | 2010-05-21 | 一种网页评级方法和网页评级系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102253943A true CN102253943A (zh) | 2011-11-23 |
CN102253943B CN102253943B (zh) | 2013-09-11 |
Family
ID=44981214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010179138 Expired - Fee Related CN102253943B (zh) | 2010-05-21 | 2010-05-21 | 一种网页评级方法和网页评级系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102253943B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102819595A (zh) * | 2012-08-10 | 2012-12-12 | 北京星网锐捷网络技术有限公司 | 网页分类方法、装置及网络设备 |
CN104580093A (zh) * | 2013-10-21 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 网站通知消息的处理方法、装置及系统 |
CN108351875A (zh) * | 2015-08-21 | 2018-07-31 | 德穆可言有限公司 | 音乐检索系统、音乐检索方法、服务器装置和程序 |
CN108376146A (zh) * | 2017-01-30 | 2018-08-07 | 苹果公司 | 基于域的影响评分 |
CN110069673A (zh) * | 2018-08-14 | 2019-07-30 | 常熟市顺网网络技术服务有限公司 | 一种互联网网站评级的系统及方法 |
CN110795677A (zh) * | 2019-11-12 | 2020-02-14 | 成都知道创宇信息技术有限公司 | 一种cdn节点的分配方法及装置 |
CN111125599A (zh) * | 2019-12-23 | 2020-05-08 | 北京知道创宇信息技术股份有限公司 | 暗网网站的评级方法、装置、存储介质及电子设备 |
CN113190779A (zh) * | 2021-05-08 | 2021-07-30 | 北京百度网讯科技有限公司 | 网页评估方法和装置 |
WO2023045796A1 (zh) * | 2021-09-22 | 2023-03-30 | 中国第一汽车股份有限公司 | 车辆声品质评估方法、装置、评估设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6006225A (en) * | 1998-06-15 | 1999-12-21 | Amazon.Com | Refining search queries by the suggestion of correlated terms from prior searches |
US20050071328A1 (en) * | 2003-09-30 | 2005-03-31 | Lawrence Stephen R. | Personalization of web search |
CN101320375A (zh) * | 2008-07-04 | 2008-12-10 | 浙江大学 | 基于用户点击行为的数字图书搜索方法 |
CN101477554A (zh) * | 2009-01-16 | 2009-07-08 | 西安电子科技大学 | 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法 |
-
2010
- 2010-05-21 CN CN 201010179138 patent/CN102253943B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6006225A (en) * | 1998-06-15 | 1999-12-21 | Amazon.Com | Refining search queries by the suggestion of correlated terms from prior searches |
US20050071328A1 (en) * | 2003-09-30 | 2005-03-31 | Lawrence Stephen R. | Personalization of web search |
CN101320375A (zh) * | 2008-07-04 | 2008-12-10 | 浙江大学 | 基于用户点击行为的数字图书搜索方法 |
CN101477554A (zh) * | 2009-01-16 | 2009-07-08 | 西安电子科技大学 | 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102819595A (zh) * | 2012-08-10 | 2012-12-12 | 北京星网锐捷网络技术有限公司 | 网页分类方法、装置及网络设备 |
CN104580093B (zh) * | 2013-10-21 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 网站通知消息的处理方法、装置及系统 |
CN104580093A (zh) * | 2013-10-21 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 网站通知消息的处理方法、装置及系统 |
WO2015058622A1 (en) * | 2013-10-21 | 2015-04-30 | Tencent Technology (Shenzhen) Company Limited | Method and system for processing notification messages of a website |
US10187419B2 (en) | 2013-10-21 | 2019-01-22 | Tencent Technology (Shenzhen) Company Limited | Method and system for processing notification messages of a website |
CN108351875A (zh) * | 2015-08-21 | 2018-07-31 | 德穆可言有限公司 | 音乐检索系统、音乐检索方法、服务器装置和程序 |
CN108376146A (zh) * | 2017-01-30 | 2018-08-07 | 苹果公司 | 基于域的影响评分 |
CN110069673A (zh) * | 2018-08-14 | 2019-07-30 | 常熟市顺网网络技术服务有限公司 | 一种互联网网站评级的系统及方法 |
CN110795677A (zh) * | 2019-11-12 | 2020-02-14 | 成都知道创宇信息技术有限公司 | 一种cdn节点的分配方法及装置 |
CN111125599A (zh) * | 2019-12-23 | 2020-05-08 | 北京知道创宇信息技术股份有限公司 | 暗网网站的评级方法、装置、存储介质及电子设备 |
CN113190779A (zh) * | 2021-05-08 | 2021-07-30 | 北京百度网讯科技有限公司 | 网页评估方法和装置 |
CN113190779B (zh) * | 2021-05-08 | 2023-07-28 | 北京百度网讯科技有限公司 | 网页评估方法和装置 |
WO2023045796A1 (zh) * | 2021-09-22 | 2023-03-30 | 中国第一汽车股份有限公司 | 车辆声品质评估方法、装置、评估设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102253943B (zh) | 2013-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102253943B (zh) | 一种网页评级方法和网页评级系统 | |
CN102937960B (zh) | 突发事件热点话题的识别与评估装置 | |
CN102708096B (zh) | 一种基于语义的网络智能舆情监测系统及其工作方法 | |
CN103744981B (zh) | 一种基于网站内容用于网站自动分类分析的系统 | |
CN103544255B (zh) | 基于文本语义相关的网络舆情信息分析方法 | |
CN103123634B (zh) | 一种版权资源识别方法及装置 | |
CN103049542A (zh) | 一种面向领域的网络信息搜索方法 | |
CN103309862B (zh) | 一种网页类型识别方法和系统 | |
US20150205580A1 (en) | Method and System for Sorting Online Videos of a Search | |
CN101246499A (zh) | 网络信息搜索方法及系统 | |
CN103077190A (zh) | 基于排序学习技术的热门事件排名方法 | |
CN102831193A (zh) | 基于分布式多级聚类的话题检测装置及方法 | |
CN103218375B (zh) | 一种poi信息补充方法及装置 | |
CN103365902A (zh) | 互联网新闻的评估方法和装置 | |
CN103714149B (zh) | 一种自适应增量式的深层网络数据源发现方法 | |
CN101299217A (zh) | 一种地图信息处理的方法、装置和系统 | |
US20220058759A1 (en) | Method for dividing overlapping boundaries of natural reserves | |
CN104572877A (zh) | 游戏舆情的检测方法及系统 | |
CN101894129A (zh) | 基于在线视频分享网站结构及视频描述文本信息的视频主题发现的方法 | |
CN102402563A (zh) | 网络信息筛选方法和装置 | |
CN101097580A (zh) | 一种对网络广告进行排序的方法 | |
CN103646342A (zh) | 一种搜索引擎消费数据和回报数据的拼接方法和平台 | |
CN105045868B (zh) | 一种搜索热门事件的方法及装置 | |
CN103729374B (zh) | 一种信息搜索方法及搜索引擎 | |
CN102915369A (zh) | 基于超链接来源分析的网页排名方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130911 Termination date: 20200521 |
|
CF01 | Termination of patent right due to non-payment of annual fee |