CN104462253B - 一种面向网络文本大数据的话题检测或跟踪方法 - Google Patents
一种面向网络文本大数据的话题检测或跟踪方法 Download PDFInfo
- Publication number
- CN104462253B CN104462253B CN201410670235.1A CN201410670235A CN104462253B CN 104462253 B CN104462253 B CN 104462253B CN 201410670235 A CN201410670235 A CN 201410670235A CN 104462253 B CN104462253 B CN 104462253B
- Authority
- CN
- China
- Prior art keywords
- topic
- matrix
- document
- keyword
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (7)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410670235.1A CN104462253B (zh) | 2014-11-20 | 2014-11-20 | 一种面向网络文本大数据的话题检测或跟踪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410670235.1A CN104462253B (zh) | 2014-11-20 | 2014-11-20 | 一种面向网络文本大数据的话题检测或跟踪方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104462253A CN104462253A (zh) | 2015-03-25 |
CN104462253B true CN104462253B (zh) | 2018-05-18 |
Family
ID=52908289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410670235.1A Active CN104462253B (zh) | 2014-11-20 | 2014-11-20 | 一种面向网络文本大数据的话题检测或跟踪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104462253B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107943816A (zh) * | 2017-10-09 | 2018-04-20 | 中国电子科技集团公司第二十八研究所 | 一种网络热点话题的发现方法和系统 |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3101563B1 (en) * | 2015-06-05 | 2018-01-10 | Technische Universität Kaiserslautern | Automated determination of network motifs |
CN105630899B (zh) * | 2015-12-21 | 2019-11-08 | 南通大学 | 一种公共卫生事件预警知识库的构建方法 |
CN106970923B (zh) * | 2016-01-14 | 2020-10-09 | 北京国双科技有限公司 | 话题检测的方法和装置 |
US10733221B2 (en) * | 2016-03-30 | 2020-08-04 | Microsoft Technology Licensing, Llc | Scalable mining of trending insights from text |
CN105868186A (zh) * | 2016-06-01 | 2016-08-17 | 清华大学 | 简单高效的话题提取方法 |
CN108062319A (zh) * | 2016-11-08 | 2018-05-22 | 北京国双科技有限公司 | 一种新主题的实时检测方法及装置 |
CN106557558B (zh) * | 2016-11-09 | 2020-09-15 | 中国工商银行股份有限公司 | 一种数据分析方法及装置 |
CN108268560A (zh) * | 2017-01-03 | 2018-07-10 | 中国移动通信有限公司研究院 | 一种文本分类方法及装置 |
CN108959318A (zh) * | 2017-05-25 | 2018-12-07 | 郑州大学 | 基于rdf图的分布式关键词查询方法 |
CN107545033B (zh) * | 2017-07-24 | 2020-12-01 | 清华大学 | 一种基于表示学习的知识库实体分类的计算方法 |
CN107679135A (zh) * | 2017-09-22 | 2018-02-09 | 深圳市易图资讯股份有限公司 | 面向网络文本大数据的话题检测与跟踪方法、装置 |
CN108763206B (zh) * | 2018-05-22 | 2022-04-05 | 南京邮电大学 | 一种对单文本关键字进行快速排序的方法 |
CN108847220B (zh) * | 2018-05-30 | 2020-04-28 | 苏州思必驰信息科技有限公司 | 对话状态跟踪器的训练方法及系统 |
CN110147439A (zh) * | 2018-07-18 | 2019-08-20 | 中山大学 | 一种基于大数据处理技术的新闻事件检测方法及系统 |
CN109326327B (zh) * | 2018-08-28 | 2021-11-12 | 福建师范大学 | 一种基于SeqRank图算法的生物序列聚类方法 |
CN109635081B (zh) * | 2018-11-23 | 2023-06-13 | 上海大学 | 一种基于词频幂律分布特性的文本关键词权重计算方法 |
CN110411724B (zh) * | 2019-07-30 | 2021-07-06 | 广东工业大学 | 一种旋转机械故障诊断方法、装置、系统及可读存储介质 |
CN110765360B (zh) * | 2019-11-01 | 2022-08-02 | 新华网股份有限公司 | 文本话题处理方法、装置、电子设备及计算机存储介质 |
CN111209390B (zh) * | 2020-01-06 | 2023-09-05 | 新方正控股发展有限责任公司 | 新闻展示方法和系统、计算机可读存储介质 |
CN112328795A (zh) * | 2020-11-13 | 2021-02-05 | 首都师范大学 | 一种基于关键词元的话题检测方法、系统及计算机存储介质 |
CN112464638B (zh) * | 2020-12-14 | 2022-12-30 | 上海爱数信息技术股份有限公司 | 一种基于改进谱聚类算法的文本聚类方法 |
CN112685574B (zh) * | 2021-01-06 | 2024-04-09 | 南京大学 | 领域术语层次关系的确定方法、装置 |
CN113420802B (zh) * | 2021-06-04 | 2023-05-30 | 桂林电子科技大学 | 基于改进谱聚类的报警数据融合方法 |
CN115733858A (zh) * | 2022-11-04 | 2023-03-03 | 广州懿豪科技有限公司 | 基于大数据和物联网通信的数据处理方法及系统 |
CN115841110B (zh) * | 2022-12-05 | 2023-08-11 | 武汉理工大学 | 一种获取科学知识发现的方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102890702A (zh) * | 2012-07-19 | 2013-01-23 | 中国人民解放军国防科学技术大学 | 一种面向网络论坛的意见领袖挖掘方法 |
CN103514183A (zh) * | 2012-06-19 | 2014-01-15 | 北京大学 | 基于交互式文档聚类的信息检索方法及系统 |
CN103593418A (zh) * | 2013-10-30 | 2014-02-19 | 中国科学院计算技术研究所 | 一种面向大数据的分布式主题发现方法及系统 |
CN103617169A (zh) * | 2013-10-23 | 2014-03-05 | 杭州电子科技大学 | 一种基于Hadoop的微博热点话题提取方法 |
CN103870474A (zh) * | 2012-12-11 | 2014-06-18 | 北京百度网讯科技有限公司 | 一种新闻话题组织方法及装置 |
CN104050302A (zh) * | 2014-07-10 | 2014-09-17 | 华东师范大学 | 一种基于图谱模型的话题探测系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9053067B2 (en) * | 2011-09-30 | 2015-06-09 | International Business Machines Corporation | Distributed data scalable adaptive map-reduce framework |
-
2014
- 2014-11-20 CN CN201410670235.1A patent/CN104462253B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514183A (zh) * | 2012-06-19 | 2014-01-15 | 北京大学 | 基于交互式文档聚类的信息检索方法及系统 |
CN102890702A (zh) * | 2012-07-19 | 2013-01-23 | 中国人民解放军国防科学技术大学 | 一种面向网络论坛的意见领袖挖掘方法 |
CN103870474A (zh) * | 2012-12-11 | 2014-06-18 | 北京百度网讯科技有限公司 | 一种新闻话题组织方法及装置 |
CN103617169A (zh) * | 2013-10-23 | 2014-03-05 | 杭州电子科技大学 | 一种基于Hadoop的微博热点话题提取方法 |
CN103593418A (zh) * | 2013-10-30 | 2014-02-19 | 中国科学院计算技术研究所 | 一种面向大数据的分布式主题发现方法及系统 |
CN104050302A (zh) * | 2014-07-10 | 2014-09-17 | 华东师范大学 | 一种基于图谱模型的话题探测系统 |
Non-Patent Citations (2)
Title |
---|
Web挖掘中的链接分析与话题检测研究;刘馨月;《中国博士学位论文全文数据库 信息科技辑》;20131015;I138-126 * |
一种基于潜在语义索引的谱聚类方法研究;冯霞 等;《中国民航大学学报》;20110630;第29卷(第3期);第47-51页 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107943816A (zh) * | 2017-10-09 | 2018-04-20 | 中国电子科技集团公司第二十八研究所 | 一种网络热点话题的发现方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104462253A (zh) | 2015-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104462253B (zh) | 一种面向网络文本大数据的话题检测或跟踪方法 | |
Ibrahim et al. | Tools and approaches for topic detection from Twitter streams: survey | |
Sankarasubramaniam et al. | Text summarization using Wikipedia | |
Aggarwal | Data streams: models and algorithms | |
Souravlas et al. | A classification of community detection methods in social networks: a survey | |
Gupta et al. | Scalable machine‐learning algorithms for big data analytics: a comprehensive review | |
US9697475B1 (en) | Additive context model for entity resolution | |
Saraç et al. | An ant colony optimization based feature selection for web page classification | |
CN103678670A (zh) | 一种微博热词与热点话题挖掘系统及方法 | |
CN111353303B (zh) | 词向量构建方法、装置、电子设备及存储介质 | |
CN108647322B (zh) | 基于词网识别大量Web文本信息相似度的方法 | |
Xue et al. | Optimizing ontology alignment through memetic algorithm based on partial reference alignment | |
Papadopoulos et al. | Image clustering through community detection on hybrid image similarity graphs | |
Liu et al. | Dynamic local search based immune automatic clustering algorithm and its applications | |
Zhang et al. | An affinity propagation clustering algorithm for mixed numeric and categorical datasets | |
US20190188276A1 (en) | Facilitation of domain and client-specific application program interface recommendations | |
Jiang et al. | Extracting elite pairwise constraints for clustering | |
Chauhan et al. | Web page ranking using machine learning approach | |
Gamgne Domgue et al. | Community structure extraction in directed network using triads | |
Sun | Personalized music recommendation algorithm based on spark platform | |
Mehmood et al. | Adaptive cutoff distance: Clustering by fast search and find of density peaks | |
He et al. | A topic community-based method for friend recommendation in online social networks via joint nonnegative matrix factorization | |
CN108846142A (zh) | 一种文本聚类方法、装置、设备及可读存储介质 | |
Win et al. | Document clustering by fuzzy c-mean algorithm | |
Yang et al. | A Novel Index Method for K Nearest Object Query over Time‐Dependent Road Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Zou Fuhao Inventor after: Xu Tao Inventor after: Zhou Ke Inventor after: Fan Rui Inventor after: Zheng Sheng Inventor after: Zhang Sheng Inventor after: Chen Jincai Inventor after: Li Chunhua Inventor before: Zou Fuhao Inventor before: Zhou Ke Inventor before: Fan Rui Inventor before: Zheng Sheng Inventor before: Zhang Sheng Inventor before: Chen Jincai Inventor before: Li Chunhua |
|
COR | Change of bibliographic data | ||
GR01 | Patent grant | ||
GR01 | Patent grant |