CN103150310A - 一种提取热点信息的方法及装置 - Google Patents
一种提取热点信息的方法及装置 Download PDFInfo
- Publication number
- CN103150310A CN103150310A CN2011104035928A CN201110403592A CN103150310A CN 103150310 A CN103150310 A CN 103150310A CN 2011104035928 A CN2011104035928 A CN 2011104035928A CN 201110403592 A CN201110403592 A CN 201110403592A CN 103150310 A CN103150310 A CN 103150310A
- Authority
- CN
- China
- Prior art keywords
- information
- hot information
- hot
- module
- key word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000000605 extraction Methods 0.000 claims abstract description 26
- 239000000284 extract Substances 0.000 claims description 42
- 230000010365 information processing Effects 0.000 abstract description 16
- 238000009412 basement excavation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000006748 scratching Methods 0.000 description 1
- 230000002393 scratching effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/101—Collaborative creation, e.g. joint development of products or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种提取热点信息的装置,所述装置包括:对外抓取模块、提取模块和热门信息处理模块;其中,对外抓取模块,用于从指定的社区网站抓取已运营的热点信息并输出给所述热门信息处理模块;提取模块,用于从当前社区中的用户产生内容(UGC)中提取包含有预设关键字的信息并输出给所述热门信息处理模块;热门信息处理模块,用于对输入的信息进行分析处理,获得热点信息。本发明还公开了一种提取热点信息的方法,实现了社区中热点内容的实时快速挖掘,节省了人力成本,提高了热点提取效率。此外,本发明还能够提取潜在热点信息,对社区中有可能成为热点的信息进行提前预警。
Description
技术领域
本发明涉及互联网领域的数据处理技术,尤其涉及一种提取热点信息的方法及装置。
背景技术
随着互联网的蓬勃发展和WEB2.0应用的兴起,用户已经成为互联网不可或缺的重要组成部分,而用户在社区中产生的内容已经成为互联网上最活跃、最受关注和最优价值的资源,尤其是在微博社区中,信息的传播数据非常快,已经有越来越多的事件第一时间出现在微博上,比传统互联网新闻及传统电视广播媒体都要快速。同时用户产生的内容源于真实的世界,很大程度上反映了用户此刻的真实想法和感悟,具有较高的可信度,因此如何在虚拟社区尤其是信息快速传播的微博社区中发掘有意义和有价值的热点信息、以及有可能成为热点的信息变得尤为重要。
对于虚拟社区的热点信息挖掘,目前主要通过以下两种方式实现:第一,词频统计的方法,即通过大量运算,统计社区内容中各种热门词语出现的频次、以及概率等,人工分析热门词语的频次和概率,找出社区的热点信息;第二,关键字(keyword)提取和词频统计相结合的方法,即根据预制词库,提取社区内容中的keywords,通过统计keywords的出现频次,人工找出社区中的热点信息,成型的产品如标签云等。
现有的热点信息提取方法,主要有如下的缺点:挖掘内容中垃圾信息较多,可能包含大量无意义的高频词,且每日热点信息的变化不大,一般仅能发现社区中已成为热点的内容,很难真正反映社区当前正在产生的热点,也无法预知有可能成为热点的信息;需要大量人力负责后期的整理工作,不仅人力成本耗费大,而且热点信息的提取效率低。
发明内容
有鉴于此,本发明的主要目的在于提供一种提取热点信息的方法及装置,能够实现热点信息的自动化提取,提高效率。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种提取热点信息的装置,所述装置包括:对外抓取模块、提取模块和热门信息处理模块;其中,对外抓取模块,用于从指定的社区网站抓取已运营的热点信息,并输出给所述热门信息处理模块;提取模块,用于从当前社区中的用户产生内容(UGC)中提取包含有预设关键字的信息,并输出给所述热门信息处理模块;热门信息处理模块,用于对输入的信息进行分析处理,获得热点信息。
在上述方案中,所述热门信息处理模块,还用于对输入的信息进行分析处理,获得潜在热点信息。
在上述方案中,所述热门信息处理模块,用于对输入的信息的增量变化率进行分析统计,提取增量变化率高于预设的变化率阈值的信息作为所述潜在热点信息。
在上述方案中,所述热门信息处理模块,用于对输入的信息的出现频率进行分析统计,提取出现频率高于预设的频率阈值的信息作为所述热点信息。
在上述方案中,所述装置还包括:热门词库模块,用于保存所述预设关键字;所述提取模块,还用于从当前社区的UGC中提取包含有所述热门词库模块中所述预设关键字的信息。
在上述方案中,所述热门信息处理模块,还用于将获得的热点信息、和/或潜在热点信息输出到所述热门词库模块;所述热门词库模块,还用于将所述热门信息处理模块输出的热点信息、和/或潜在热点信息作为关键字进行保存。
本发明还提供了一种提取热点信息的方法,所述方法包括:从指定的社区网站抓取已运营的热点信息;从当前社区中的UGC中提取包含有预设关键字的信息;对所述已运营的热点信息和所述包含有预设关键字的信息进行分析处理,获得热点信息。
在上述方案中,所述方法还包括:对所述已运营的热点信息和所述包含有预设关键字的信息进行分析处理,获得潜在热点信息。
在上述方案中,所述对所述已运营的热点信息和所述包含有预设关键字的信息进行分析处理,获得热点信息,包括:
对所述已运营的热点信息和所述包含有预设关键字的信息的增量变化率进行分析统计,提取增量变化率高于预设的变化率阈值的信息作为所述潜在热点信息。
在上述方案中,所述对所述已运营的热点信息和所述包含有预设关键字的信息进行分析处理,获得热点信息,包括:对所述已运营的热点信息和所述包含有预设关键字的信息的出现频率进行分析统计,提取出现频率高于预设的频率阈值的信息作为所述热点信息。
在上述方案中,在对所述已运营的热点信息和所述包含有预设关键字的信息进行分析处理,获得热点信息之后,所述方法还包括:将获得的热点信息、和/或潜在热点信息输出到热门词库模块,热门词库模块将所述热点信息、和/或潜在热点信息作为预设关键字进行保存。
本发明的热点信息提取装置及方法,对外抓取、本社区内的提取以及对信息的分析处理,均自动化完成,实现了社区中热点内容的实时快速挖掘,解决了传统热点提取中需要大量后期人工整理的问题,节省了人力成本,提高了热点提取的效率。
此外,本发明还能够提取潜在热点信息,对于社区中有可能成为热点的信息进行提前预警,帮助社区的运营团队快速定位到需要的信息,有效提升社区的活跃度。
附图说明
图1为本发明提取热点信息的装置的组成结构示意图;
图2为本发明提取热点信息的方法的实现流程图;
图3为本发明实施例一提取热点信息的实现过程示意图。
具体实施方式
本发明提出一种提取热点信息的装置,通过抓取其他社区的热点信息,并从本社区的用户生成内容(UGC,User Generated Content)提取包含有预存关键字的信息,最后将从外部抓取的信息以及本社区提取的信息进行分析处理,得到热点消息,实现热点信息的自动化提取,减少人力成本。
本发明的一种提取热点信息的装置,如图1所示,主要包括:对外抓取模块、提取模块和热门信息处理模块;其中,对外抓取模块,用于从指定的社区网站抓取已运营的热点信息并输出给所述热门信息处理模块;提取模块,用于从当前社区中的UGC中提取包含有预设关键字的信息并输出给所述热门信息处理模块;热门信息处理模块,用于对输入的信息进行分析处理,获得热点信息。
其中,所述装置还包括:热门词库模块,用于保存所述预设关键字;所述提取模块,还用于从当前社区的UGC中提取包含有所述热门词库模块中所述预设关键字的信息。
其中,所述热门信息处理模块,还用于对输入的信息进行分析处理,获得潜在热点信息。
具体地,所述热门信息处理模块可以用于对输入的信息的增量变化率进行分析统计,提取增量变化率高于预设的变化率阈值的信息作为所述潜在热点信息。和/或,所述热门信息处理模块,还可以用于对输入的信息的出现频率进行分析统计,提取出现频率高于预设的频率阈值的信息作为所述热点信息。
这里,所述热门信息处理模块,还用于将获得热点信息、和/或潜在热点信息输出到所述热门词库模块;所述热门词库模块,还用于将所述热门信息处理模块输出的热点信息、和/或潜在热点信息作为关键字进行保存。
相应的,本发明还提供了一种提取热点信息的方法,参照图2所示,所述方法包括:
步骤201:从指定的社区网站抓取已运营的热点信息;
步骤202:从当前社区中的UGC中提取包含有预设关键字的信息;
步骤203:对所述已运营的热点信息和所述包含有预设关键字的信息进行分析处理,获得热点信息。
这里,步骤203中还可以包括:对所述已运营的热点信息和所述包含有预设关键字的信息进行分析处理,获得潜在热点信息。
具体地,热门信息处理模块对所述已运营的热点信息和所述包含有预设关键字的信息的增量变化率进行分析统计,提取增量变化率高于预设的变化率阈值的信息作为所述潜在热点信息;和/或,对所述已运营的热点信息和所述包含有预设关键字的信息的出现频率进行分析统计,提取出现频率高于预设的频率阈值的信息作为所述热点信息。
具体地,提取模块从当前社区的UGC中提取包含有预设在热门词库模块中关键字的信息。
这里,在步骤203之后,所述方法还包括:热门信息处理模块将获得热点信息、和/或潜在热点信息输出到热门词库模块;热门词库模块将所述热门信息处理模块输出的热点信息、和/或潜在热点信息作为预设关键字进行保存。
实际应用中,在首次进行热点信息提取时,可以在热门词库模块预先存放关键字,该关键字可以为已有的热点信息,或者根据经验收集的关键字。
实施例一
本实施例中,如图3所示,提取热点信息的装置包括对外抓取模块、提取模块、热点信息处理模块和热门词库,其中,热门词库用于保存所述提取模块提取热点信息时的关键字,提取模块用于从当前社区的UGC中提取包含所述热门词库中关键字的信息,对外抓取模块用于从指定的社区网站中抓取正在运营的热点信息,热点信息处理模块用于对提取模块提取的信息、以及对外抓取模块抓取的信息进行分析处理,得到热点信息以及潜在热点信息,并输出热门榜单、以及更新热门词库。
首先,在热门词库中预置关键字,该关键字可以是已有的热点信息。
具体地,如图3所示,提取热点信息的流程,具体可以包括如下步骤:
步骤301:对外抓取模块以小时为周期定时从各大主流社区中抓取热点信息;
具体地,可以在对外抓取模块中预先设置抓取范围,对外抓取模块根据预置的抓取范围,从指定的社区网站中直接抓取所述社区网站上运营的热点信息。这里,所述抓取范围可以是指定社区网站的统一资源定位符(URL,UniformResource Locator)等信息。特别的,对外抓取模块还可以对各指定社区网站上的热点信息按照预定的分类进行分类抓取。
步骤302:对外抓取模块对所抓取到的热点信息进行排除处理后输出给热点信息处理模块;
步骤303:当前社区产生新的UGC时,提取模块从所述UGC中提取包含有热门词库中关键字的信息,并将所提取的信息输出到热点信息处理模块;
如果需要的话,提取模块也可以对所提取的信息进行排重处理后再输出给热点信息处理模块。
步骤304:热点信息处理模块定期对输入的信息进行分析处理,提取热点信息以及潜在热点信息,生成并输出热点榜单;
具体地,热点信息处理模块对输入的信息进行数据量比对,即将各信息的出现频率进行统计分析,将出现频率超过预设的频率阈值的信息作为热点信息提取;并且,热点信息处理模块还对输入的信息进行增量变化率比对,即将各信息的增量变化率进行统计分析,将增量变化率超过预设的变化率阈值的信息作为潜在热点信息提取。
这里,所述增量变化率表示一个信息在后一指定周期的数据增量与前一指定周期内数据增量的比值。例如,增量变化率可以是一个信息后一小时数据增量与前一小时数据增量的比值;如果在两个连续时间段内,数据增量差值较小,则增量变化率较小。一般变化率阈值的经验值为120%左右,可以根据实际情况的需要做相应调整。
步骤305:热点信息处理模块更新所述热门词库。
具体地,热点信息处理模块生成包含有所提取热点信息的热点榜单并输出,并将所提取的潜在热点信息、以及该热点信息输出给热门词库,更新所述热门词库中热点信息的关键字。
同时,热点信息处理模块在提取热点信息以及潜在热点信息后,还将非热点信息、以及非潜在热点信息丢弃。
这里,热点信息处理模块对输入的信息进行分析处理的周期可以根据实际需要确定,可以与对外抓取模块进行信息抓取的周期相同。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (11)
1.一种提取热点信息的装置,其特征在于,所述装置包括:对外抓取模块、提取模块和热门信息处理模块;其中,
对外抓取模块,用于从指定的社区网站抓取已运营的热点信息,并输出给所述热门信息处理模块;
提取模块,用于从当前社区中的用户产生内容(UGC)中提取包含有预设关键字的信息,并输出给所述热门信息处理模块;
热门信息处理模块,用于对输入的信息进行分析处理,获得热点信息。
2.根据权利要求1所述提取热点信息的装置,其特征在于,所述热门信息处理模块,还用于对输入的信息进行分析处理,获得潜在热点信息。
3.根据权利要求2所述提取热点信息的装置,其特征在于,所述热门信息处理模块,用于对输入的信息的增量变化率进行分析统计,提取增量变化率高于预设的变化率阈值的信息作为所述潜在热点信息。
4.根据权利要求1或2所述提取热点信息的装置,其特征在于,所述热门信息处理模块,用于对输入的信息的出现频率进行分析统计,提取出现频率高于预设的频率阈值的信息作为所述热点信息。
5.根据权利要求2所述提取热点信息的装置,其特征在于,
所述装置还包括:热门词库模块,用于保存所述预设关键字;
所述提取模块,还用于从当前社区的UGC中提取包含有所述热门词库模块中所述预设关键字的信息。
6.根据权利要求5所述提取热点信息的装置,其特征在于,
所述热门信息处理模块,还用于将获得的热点信息、和/或潜在热点信息输出到所述热门词库模块;
所述热门词库模块,还用于将所述热门信息处理模块输出的热点信息、和/或潜在热点信息作为关键字进行保存。
7.一种提取热点信息的方法,其特征在于,所述方法包括:
从指定的社区网站抓取已运营的热点信息;
从当前社区中的UGC中提取包含有预设关键字的信息;
对所述已运营的热点信息和所述包含有预设关键字的信息进行分析处理,获得热点信息。
8.根据权利要求7所述提取热点信息的方法,其特征在于,所述方法还包括:对所述已运营的热点信息和所述包含有预设关键字的信息进行分析处理,获得潜在热点信息。
9.根据权利要求8所述提取热点信息的方法,其特征在于,所述对所述已运营的热点信息和所述包含有预设关键字的信息进行分析处理,获得热点信息,包括:
对所述已运营的热点信息和所述包含有预设关键字的信息的增量变化率进行分析统计,提取增量变化率高于预设的变化率阈值的信息作为所述潜在热点信息。
10.根据权利要求7或8所述提取热点信息的方法,其特征在于,所述对所述已运营的热点信息和所述包含有预设关键字的信息进行分析处理,获得热点信息,包括:
对所述已运营的热点信息和所述包含有预设关键字的信息的出现频率进行分析统计,提取出现频率高于预设的频率阈值的信息作为所述热点信息。
11.根据权利要求8所述提取热点信息的方法,其特征在于,在对所述已运营的热点信息和所述包含有预设关键字的信息进行分析处理,获得热点信息之后,所述方法还包括:
将获得的热点信息、和/或潜在热点信息输出到热门词库模块,热门词库模块将所述热点信息、和/或潜在热点信息作为预设关键字进行保存。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011104035928A CN103150310A (zh) | 2011-12-07 | 2011-12-07 | 一种提取热点信息的方法及装置 |
PCT/CN2012/085985 WO2013083048A1 (zh) | 2011-12-07 | 2012-12-05 | 一种提取热点信息的方法、装置及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011104035928A CN103150310A (zh) | 2011-12-07 | 2011-12-07 | 一种提取热点信息的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103150310A true CN103150310A (zh) | 2013-06-12 |
Family
ID=48548396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011104035928A Pending CN103150310A (zh) | 2011-12-07 | 2011-12-07 | 一种提取热点信息的方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN103150310A (zh) |
WO (1) | WO2013083048A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103823890A (zh) * | 2014-03-10 | 2014-05-28 | 中国科学院信息工程研究所 | 一种针对特定群体的微博热点话题检测方法及装置 |
CN110457594A (zh) * | 2019-08-01 | 2019-11-15 | 深圳市顶尖传诚科技有限公司 | 一种基于大数据的舆论热点预测方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10375204B2 (en) | 2016-05-06 | 2019-08-06 | Microsoft Technology Licensing, Llc | Extraction of dominant content for link list |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101296128A (zh) * | 2007-04-24 | 2008-10-29 | 北京大学 | 一种对互联网信息进行异常状态监测的方法 |
CN101477556A (zh) * | 2009-01-22 | 2009-07-08 | 苏州智讯科技有限公司 | 一种从互联网海量信息中发现热点的方法 |
CN102163198A (zh) * | 2010-02-24 | 2011-08-24 | 北京搜狗科技发展有限公司 | 提供新词或热词的方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101231641B (zh) * | 2007-01-22 | 2010-05-19 | 北大方正集团有限公司 | 一种自动分析互联网上热点主题传播过程的方法及系统 |
CN101923544B (zh) * | 2009-06-15 | 2012-08-08 | 北京百分通联传媒技术有限公司 | 一种监测展示互联网热点的方法 |
-
2011
- 2011-12-07 CN CN2011104035928A patent/CN103150310A/zh active Pending
-
2012
- 2012-12-05 WO PCT/CN2012/085985 patent/WO2013083048A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101296128A (zh) * | 2007-04-24 | 2008-10-29 | 北京大学 | 一种对互联网信息进行异常状态监测的方法 |
CN101477556A (zh) * | 2009-01-22 | 2009-07-08 | 苏州智讯科技有限公司 | 一种从互联网海量信息中发现热点的方法 |
CN102163198A (zh) * | 2010-02-24 | 2011-08-24 | 北京搜狗科技发展有限公司 | 提供新词或热词的方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103823890A (zh) * | 2014-03-10 | 2014-05-28 | 中国科学院信息工程研究所 | 一种针对特定群体的微博热点话题检测方法及装置 |
CN103823890B (zh) * | 2014-03-10 | 2016-11-02 | 中国科学院信息工程研究所 | 一种针对特定群体的微博热点话题检测方法及装置 |
CN110457594A (zh) * | 2019-08-01 | 2019-11-15 | 深圳市顶尖传诚科技有限公司 | 一种基于大数据的舆论热点预测方法 |
CN110457594B (zh) * | 2019-08-01 | 2021-06-01 | 深圳市顶尖传诚科技有限公司 | 一种基于大数据的舆论热点预测方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2013083048A1 (zh) | 2013-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107102941B (zh) | 一种测试用例的生成方法及装置 | |
CN110008378B (zh) | 基于人工智能的语料收集方法、装置、设备及存储介质 | |
CN102043833B (zh) | 一种基于查询词进行搜索的方法和搜索装置 | |
CN104951512A (zh) | 一种基于互联网的舆情数据采集方法及系统 | |
WO2019001075A1 (zh) | 一种垃圾弹幕的识别方法、装置及计算机设备 | |
CN105095399B (zh) | 搜索结果推送方法及装置 | |
CN102184185A (zh) | 一种用于多媒体资源搜索的方法与设备 | |
KR101753762B1 (ko) | 자동 기사 생성을 위한 로봇 저널리즘 시스템 및 방법 | |
CN104239539A (zh) | 一种基于多种信息融合的微博信息过滤方法 | |
CN107566906B (zh) | 一种视频评论处理方法及装置 | |
CN102880609A (zh) | 一种用于提供与查询序列相对应的搜索结果的设备和方法 | |
CN105224604A (zh) | 一种基于堆优化的微博突发事件检测方法及其检测装置 | |
CN103873601A (zh) | 一种寻址类查询词的挖掘方法及系统 | |
CN104615640A (zh) | 一种用于提供搜索关键词及进行搜索的方法与装置 | |
CN111447507B (zh) | 视频制作方法和装置、电子设备和存储介质 | |
CN104408115A (zh) | 一种电视平台上基于语义链接的异构资源推荐方法和装置 | |
CN103150310A (zh) | 一种提取热点信息的方法及装置 | |
CN104331493A (zh) | 通过计算机实现的用于生成趋势解释数据的方法及装置 | |
CN102955825B (zh) | 一种更新输入法词库的方法及系统 | |
CN110532428A (zh) | 热词配置方法、装置、设备和存储介质 | |
CN103324641B (zh) | 信息记录推荐方法和装置 | |
CN101216836B (zh) | 一种网页锚文本去噪系统及方法 | |
CN101673263B (zh) | 视频内容的搜索方法 | |
CN105550179A (zh) | 一种网页收藏方法和浏览器插件 | |
CN108763506A (zh) | 一种消息推送处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130612 |