CN102799666A - 一种基于频繁词集的网络新闻自动文本分类的方法 - Google Patents
一种基于频繁词集的网络新闻自动文本分类的方法 Download PDFInfo
- Publication number
- CN102799666A CN102799666A CN2012102445585A CN201210244558A CN102799666A CN 102799666 A CN102799666 A CN 102799666A CN 2012102445585 A CN2012102445585 A CN 2012102445585A CN 201210244558 A CN201210244558 A CN 201210244558A CN 102799666 A CN102799666 A CN 102799666A
- Authority
- CN
- China
- Prior art keywords
- frequent
- word set
- word
- sup
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
Claims (3)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210244558.5A CN102799666B (zh) | 2012-07-13 | 2012-07-13 | 一种基于频繁词集的网络新闻自动文本分类的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210244558.5A CN102799666B (zh) | 2012-07-13 | 2012-07-13 | 一种基于频繁词集的网络新闻自动文本分类的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102799666A true CN102799666A (zh) | 2012-11-28 |
CN102799666B CN102799666B (zh) | 2015-01-21 |
Family
ID=47198776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210244558.5A Expired - Fee Related CN102799666B (zh) | 2012-07-13 | 2012-07-13 | 一种基于频繁词集的网络新闻自动文本分类的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102799666B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095209A (zh) * | 2014-04-21 | 2015-11-25 | 北京金山网络科技有限公司 | 文档聚类方法及装置、网络设备 |
CN108563735A (zh) * | 2018-04-10 | 2018-09-21 | 国网浙江省电力有限公司 | 一种基于词语关联的数据分割搜索方法 |
CN110489652A (zh) * | 2019-08-23 | 2019-11-22 | 重庆邮电大学 | 基于用户行为检测的新闻推荐方法、系统及计算机设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101634983A (zh) * | 2008-07-21 | 2010-01-27 | 华为技术有限公司 | 一种文本分类方法和装置 |
CN101794303A (zh) * | 2010-02-11 | 2010-08-04 | 重庆邮电大学 | 采用特征扩展分类文本及构造文本分类器的方法和装置 |
CN101853277A (zh) * | 2010-05-14 | 2010-10-06 | 南京信息工程大学 | 一种基于分类和关联分析的漏洞数据挖掘方法 |
CN102043851A (zh) * | 2010-12-22 | 2011-05-04 | 四川大学 | 一种基于频繁项集的多文档自动摘要方法 |
-
2012
- 2012-07-13 CN CN201210244558.5A patent/CN102799666B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101634983A (zh) * | 2008-07-21 | 2010-01-27 | 华为技术有限公司 | 一种文本分类方法和装置 |
CN101794303A (zh) * | 2010-02-11 | 2010-08-04 | 重庆邮电大学 | 采用特征扩展分类文本及构造文本分类器的方法和装置 |
CN101853277A (zh) * | 2010-05-14 | 2010-10-06 | 南京信息工程大学 | 一种基于分类和关联分析的漏洞数据挖掘方法 |
CN102043851A (zh) * | 2010-12-22 | 2011-05-04 | 四川大学 | 一种基于频繁项集的多文档自动摘要方法 |
Non-Patent Citations (1)
Title |
---|
邱江涛: "基于加权频繁项集的文本分类规则挖掘", 《四川大学学报(工程科学版)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095209A (zh) * | 2014-04-21 | 2015-11-25 | 北京金山网络科技有限公司 | 文档聚类方法及装置、网络设备 |
CN105095209B (zh) * | 2014-04-21 | 2019-05-10 | 珠海豹好玩科技有限公司 | 文档聚类方法及装置、网络设备 |
CN108563735A (zh) * | 2018-04-10 | 2018-09-21 | 国网浙江省电力有限公司 | 一种基于词语关联的数据分割搜索方法 |
CN110489652A (zh) * | 2019-08-23 | 2019-11-22 | 重庆邮电大学 | 基于用户行为检测的新闻推荐方法、系统及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN102799666B (zh) | 2015-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101593200B (zh) | 基于关键词频度分析的中文网页分类方法 | |
CN103336766B (zh) | 短文本垃圾识别以及建模方法和装置 | |
CN103500175B (zh) | 一种基于情感分析在线检测微博热点事件的方法 | |
CN106844424A (zh) | 一种基于lda的文本分类方法 | |
CN102622373B (zh) | 一种基于tf*idf算法的统计学文本分类系统及方法 | |
CN102419778B (zh) | 一种挖掘查询语句子话题并聚类的信息搜索方法 | |
CN108763484A (zh) | 一种基于lda主题模型的法条推荐方法 | |
CN101021838A (zh) | 文本处理方法和系统 | |
CN105760493A (zh) | 一种电力营销服务热点95598工单自动分类方法 | |
CN103605665A (zh) | 一种基于关键词的评审专家智能检索与推荐方法 | |
CN103544255A (zh) | 基于文本语义相关的网络舆情信息分析方法 | |
CN103390051A (zh) | 一种基于微博数据的话题发现与追踪方法 | |
CN101630312A (zh) | 一种用于问答平台中问句的聚类方法及系统 | |
CN101127042A (zh) | 一种基于语言模型的情感分类方法 | |
CN101393555A (zh) | 一种垃圾博客检测方法 | |
CN101996241A (zh) | 一种基于贝叶斯算法的内容过滤方法 | |
CN101702167A (zh) | 一种基于互联网的模板抽取属性和评论词的方法 | |
CN103268348A (zh) | 一种用户查询意图识别方法 | |
CN103324745A (zh) | 基于贝叶斯模型的文本垃圾识别方法和系统 | |
CN103309862A (zh) | 一种网页类型识别方法和系统 | |
CN103412878B (zh) | 基于领域知识地图社区结构的文档主题划分方法 | |
CN104050556A (zh) | 一种垃圾邮件的特征选择方法及其检测方法 | |
CN104731958A (zh) | 一种面向用户需求倾向的云制造服务推荐方法 | |
CN100543735C (zh) | 基于文档结构的文档相似性度量方法 | |
CN102073654A (zh) | 生成与维护网页内容抽取模板的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C53 | Correction of patent of invention or patent application | ||
CB03 | Change of inventor or designer information |
Inventor after: Ouyang Yuanxin Inventor after: Yuan Man Inventor after: Zhao Hai Inventor after: Xiong Zhang Inventor before: Yuan Man Inventor before: Ouyang Yuanxin Inventor before: Zhao Hai Inventor before: Xiong Zhang |
|
COR | Change of bibliographic data |
Free format text: CORRECT: INVENTOR; FROM: YUAN MAN OUYANG YUANXIN ZHAO HAI XIONG ZHANG TO: OUYANG YUANXIN YUAN MAN ZHAO HAI XIONG ZHANG |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20170223 Address after: 100055 Beijing City, Guang'an Road, No. 9, the country voted wealth Plaza, building 3, floor 2, Patentee after: Beijing Rock Technology Co., Ltd. Address before: 100191 Haidian District, Xueyuan Road, No. 37, Patentee before: Beihang University |
|
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150121 Termination date: 20190713 |
|
CF01 | Termination of patent right due to non-payment of annual fee |