CN102955856B - 一种基于特征扩展的中文短文本分类方法 - Google Patents
一种基于特征扩展的中文短文本分类方法 Download PDFInfo
- Publication number
- CN102955856B CN102955856B CN201210446997.4A CN201210446997A CN102955856B CN 102955856 B CN102955856 B CN 102955856B CN 201210446997 A CN201210446997 A CN 201210446997A CN 102955856 B CN102955856 B CN 102955856B
- Authority
- CN
- China
- Prior art keywords
- short text
- classification
- text
- word
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 230000029305 taxis Effects 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 9
- 238000013145 classification model Methods 0.000 abstract 4
- 238000005516 engineering process Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (3)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210446997.4A CN102955856B (zh) | 2012-11-09 | 2012-11-09 | 一种基于特征扩展的中文短文本分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210446997.4A CN102955856B (zh) | 2012-11-09 | 2012-11-09 | 一种基于特征扩展的中文短文本分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102955856A CN102955856A (zh) | 2013-03-06 |
CN102955856B true CN102955856B (zh) | 2015-07-08 |
Family
ID=47764662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210446997.4A Expired - Fee Related CN102955856B (zh) | 2012-11-09 | 2012-11-09 | 一种基于特征扩展的中文短文本分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102955856B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491406A (zh) * | 2018-01-23 | 2018-09-04 | 深圳市阿西莫夫科技有限公司 | 信息分类方法、装置、计算机设备和存储介质 |
CN109189880A (zh) * | 2017-12-26 | 2019-01-11 | 爱品克科技(武汉)股份有限公司 | 一种基于短文本的用户兴趣分类方法 |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103745000B (zh) * | 2014-01-24 | 2017-02-01 | 福州大学 | 一种中文微博客的热点话题检测方法 |
CN103942574B (zh) * | 2014-02-25 | 2017-01-11 | 浙江大学 | 3d手写识别svm分类器核参数选取方法及用途 |
CN104765769B (zh) * | 2015-03-06 | 2018-04-27 | 大连理工大学 | 一种基于词矢量的短文本查询扩展及检索方法 |
CN104778256B (zh) * | 2015-04-20 | 2017-10-17 | 江苏科技大学 | 一种领域问答系统咨询的快速可增量聚类方法 |
CN104834747B (zh) * | 2015-05-25 | 2018-04-27 | 中国科学院自动化研究所 | 基于卷积神经网络的短文本分类方法 |
CN104850650B (zh) * | 2015-05-29 | 2018-04-10 | 清华大学 | 基于类标关系的短文本扩充方法 |
CN104951542A (zh) * | 2015-06-19 | 2015-09-30 | 百度在线网络技术(北京)有限公司 | 识别社交短文本类别的方法、分类模型训练方法及装置 |
CN105468713B (zh) * | 2015-11-19 | 2018-07-17 | 西安交通大学 | 一种多模型融合的短文本分类方法 |
CN105912716B (zh) * | 2016-04-29 | 2019-09-10 | 国家计算机网络与信息安全管理中心 | 一种短文本分类方法及装置 |
CN106326458A (zh) * | 2016-06-02 | 2017-01-11 | 广西智度信息科技有限公司 | 一种基于文本分类的城市管理案件分类方法 |
CN106202518B (zh) * | 2016-07-22 | 2019-07-30 | 桂林电子科技大学 | 基于chi和分类别关联规则算法的短文本分类方法 |
CN106528642B (zh) * | 2016-10-13 | 2018-05-25 | 广东广业开元科技有限公司 | 一种基于tf-idf特征提取的短文本分类方法 |
CN108287850B (zh) * | 2017-01-10 | 2021-09-21 | 创新先进技术有限公司 | 文本分类模型的优化方法及装置 |
CN107292348A (zh) * | 2017-07-10 | 2017-10-24 | 天津理工大学 | 一种Bagging_BSJ短文本分类方法 |
CN107609113A (zh) * | 2017-09-13 | 2018-01-19 | 北京科技大学 | 一种文本自动分类方法 |
CN108153895A (zh) * | 2018-01-06 | 2018-06-12 | 国网福建省电力有限公司 | 一种基于开放数据的语料库构建方法和系统 |
CN108520030B (zh) * | 2018-03-27 | 2022-02-11 | 深圳中兴网信科技有限公司 | 文本分类方法、文本分类系统及计算机装置 |
CN108733652B (zh) * | 2018-05-18 | 2022-08-09 | 大连民族大学 | 基于机器学习的影评情感倾向性分析的测试方法 |
CN108647212B (zh) * | 2018-05-18 | 2022-08-02 | 大连民族大学 | 机器学习的影评情感倾向性分析中形成特征集合的方法 |
CN109214455A (zh) * | 2018-09-05 | 2019-01-15 | 北京国网富达科技发展有限责任公司 | 油色谱数据与台账数据的相关性确定方法及系统 |
CN110245228A (zh) * | 2019-04-29 | 2019-09-17 | 阿里巴巴集团控股有限公司 | 确定文本类别的方法和装置 |
CN110750638A (zh) * | 2019-06-28 | 2020-02-04 | 厦门美域中央信息科技有限公司 | 一种基于半监督学习的多标签语料库文本分类方法 |
CN110597991B (zh) * | 2019-09-10 | 2021-08-17 | 腾讯科技(深圳)有限公司 | 文本分类方法、装置、计算机设备及存储介质 |
CN112883158A (zh) * | 2021-02-25 | 2021-06-01 | 北京精准沟通传媒科技股份有限公司 | 对短文本分类的方法、装置、介质以及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101770454A (zh) * | 2010-02-13 | 2010-07-07 | 武汉理工大学 | 短文本特征空间扩展方法 |
CN101794303A (zh) * | 2010-02-11 | 2010-08-04 | 重庆邮电大学 | 采用特征扩展分类文本及构造文本分类器的方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8856050B2 (en) * | 2011-01-13 | 2014-10-07 | International Business Machines Corporation | System and method for domain adaption with partial observation |
-
2012
- 2012-11-09 CN CN201210446997.4A patent/CN102955856B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101794303A (zh) * | 2010-02-11 | 2010-08-04 | 重庆邮电大学 | 采用特征扩展分类文本及构造文本分类器的方法和装置 |
CN101770454A (zh) * | 2010-02-13 | 2010-07-07 | 武汉理工大学 | 短文本特征空间扩展方法 |
Non-Patent Citations (4)
Title |
---|
一种基于频繁词集的文本分类算法;袁满等;《2012年第三届中国计算机学会服务计算学术会议论文集》;20120816;第4页第2段,第5页第2段 * |
一种改进的VSM及其在文本自动分类中的应用;张婷慧等;《微电子学与计算机!》;20051231;第22卷(第12期);24-27 * |
一种改进的基于共现关系的短文本特征扩展算法研究;王细薇等;《河南城建学院学报》;20120731;第21卷(第4期);48-50 * |
中文短文本分类方法研究;王细薇等;《现代计算机》;20100928(第7期);第28页第1栏的第1.2节,第29页第1栏第11-14行、第2栏第2-4行、最后一行,第30页第1-4行 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109189880A (zh) * | 2017-12-26 | 2019-01-11 | 爱品克科技(武汉)股份有限公司 | 一种基于短文本的用户兴趣分类方法 |
CN108491406A (zh) * | 2018-01-23 | 2018-09-04 | 深圳市阿西莫夫科技有限公司 | 信息分类方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102955856A (zh) | 2013-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102955856B (zh) | 一种基于特征扩展的中文短文本分类方法 | |
CN108052593B (zh) | 一种基于主题词向量和网络结构的主题关键词提取方法 | |
CN105069102B (zh) | 信息推送方法和装置 | |
CN106055538B (zh) | 主题模型和语义分析相结合的文本标签自动抽取方法 | |
CN103678412B (zh) | 一种文档检索的方法及装置 | |
CN106383877B (zh) | 一种社交媒体在线短文本聚类和话题检测方法 | |
CN101593200B (zh) | 基于关键词频度分析的中文网页分类方法 | |
CN100595760C (zh) | 一种获取口语词条的方法、装置以及一种输入法系统 | |
CN105718579A (zh) | 一种基于上网日志挖掘和用户活动识别的信息推送方法 | |
CN103617157A (zh) | 基于语义的文本相似度计算方法 | |
CN103049435A (zh) | 文本细粒度情感分析方法及装置 | |
CN104765769A (zh) | 一种基于词矢量的短文本查询扩展及检索方法 | |
CN104376406A (zh) | 一种基于大数据的企业创新资源管理与分析系统和方法 | |
CN105488077A (zh) | 生成内容标签的方法和装置 | |
CN107992542A (zh) | 一种基于主题模型的相似文章推荐方法 | |
CN104484343A (zh) | 一种对微博进行主题发现与追踪的方法 | |
CN102033880A (zh) | 基于结构化数据集合的标注方法和装置 | |
CN103823893A (zh) | 一种基于用户评论的产品检索方法及产品检索系统 | |
CN103207860A (zh) | 舆情事件的实体关系抽取方法和装置 | |
CN102081642A (zh) | 搜索引擎检索结果聚类的中文标签提取方法 | |
CN102419778A (zh) | 一种挖掘查询语句子话题并聚类的信息搜索方法 | |
CN106126605B (zh) | 一种基于用户画像的短文本分类方法 | |
CN108647322A (zh) | 基于词网识别大量Web文本信息相似度的方法 | |
CN108920482A (zh) | 基于词汇链特征扩展和lda模型的微博短文本分类方法 | |
CN108170671A (zh) | 一种提取新闻事件发生时间的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C53 | Correction of patent for invention or patent application | ||
CB03 | Change of inventor or designer information |
Inventor after: Ouyang Yuanxin Inventor after: Yuan Man Inventor after: Luo Jianhui Inventor after: Liu Wenqi Inventor after: Xiong Zhang Inventor before: Ouyang Yuanxin Inventor before: Luo Jianhui Inventor before: Liu Wenqi Inventor before: Xiong Zhang |
|
COR | Change of bibliographic data |
Free format text: CORRECT: INVENTOR; FROM: OUYANG YUANXIN LUO JIANHUI LIU WENQI XIONG ZHANG TO: OUYANG YUANXIN YUAN MAN LUO JIANHUI LIU WENQI XIONG ZHANG |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20170222 Address after: 100055 Beijing City, Guang'an Road, No. 9, the country voted wealth Plaza, building 3, floor 2, Patentee after: Beijing Rock Technology Co., Ltd. Address before: 100191 Haidian District, Xueyuan Road, No. 37, Patentee before: Beihang University |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150708 Termination date: 20181109 |