CN102955856A - 一种基于特征扩展的中文短文本分类方法 - Google Patents
一种基于特征扩展的中文短文本分类方法 Download PDFInfo
- Publication number
- CN102955856A CN102955856A CN2012104469974A CN201210446997A CN102955856A CN 102955856 A CN102955856 A CN 102955856A CN 2012104469974 A CN2012104469974 A CN 2012104469974A CN 201210446997 A CN201210446997 A CN 201210446997A CN 102955856 A CN102955856 A CN 102955856A
- Authority
- CN
- China
- Prior art keywords
- short text
- classification
- feature
- word
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
Claims (4)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210446997.4A CN102955856B (zh) | 2012-11-09 | 2012-11-09 | 一种基于特征扩展的中文短文本分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210446997.4A CN102955856B (zh) | 2012-11-09 | 2012-11-09 | 一种基于特征扩展的中文短文本分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102955856A true CN102955856A (zh) | 2013-03-06 |
CN102955856B CN102955856B (zh) | 2015-07-08 |
Family
ID=47764662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210446997.4A Expired - Fee Related CN102955856B (zh) | 2012-11-09 | 2012-11-09 | 一种基于特征扩展的中文短文本分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102955856B (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942574A (zh) * | 2014-02-25 | 2014-07-23 | 浙江大学 | 3d手写识别svm分类器核参数选取方法及用途 |
CN104765769A (zh) * | 2015-03-06 | 2015-07-08 | 大连理工大学 | 一种基于词矢量的短文本查询扩展及检索方法 |
CN104778256A (zh) * | 2015-04-20 | 2015-07-15 | 江苏科技大学 | 一种领域问答系统咨询的快速可增量聚类方法 |
CN104834747A (zh) * | 2015-05-25 | 2015-08-12 | 中国科学院自动化研究所 | 基于卷积神经网络的短文本分类方法 |
CN104850650A (zh) * | 2015-05-29 | 2015-08-19 | 清华大学 | 基于类标关系的短文本扩充方法 |
CN104951542A (zh) * | 2015-06-19 | 2015-09-30 | 百度在线网络技术(北京)有限公司 | 识别社交短文本类别的方法、分类模型训练方法及装置 |
CN105468713A (zh) * | 2015-11-19 | 2016-04-06 | 西安交通大学 | 一种多模型融合的短文本分类方法 |
CN105912716A (zh) * | 2016-04-29 | 2016-08-31 | 国家计算机网络与信息安全管理中心 | 一种短文本分类方法及装置 |
CN106202518A (zh) * | 2016-07-22 | 2016-12-07 | 桂林电子科技大学 | 基于chi和分类别关联规则算法的短文本分类方法 |
CN106326458A (zh) * | 2016-06-02 | 2017-01-11 | 广西智度信息科技有限公司 | 一种基于文本分类的城市管理案件分类方法 |
CN103745000B (zh) * | 2014-01-24 | 2017-02-01 | 福州大学 | 一种中文微博客的热点话题检测方法 |
CN106528642A (zh) * | 2016-10-13 | 2017-03-22 | 广东广业开元科技有限公司 | 一种基于tf‑idf特征提取的短文本分类方法 |
CN107292348A (zh) * | 2017-07-10 | 2017-10-24 | 天津理工大学 | 一种Bagging_BSJ短文本分类方法 |
CN107609113A (zh) * | 2017-09-13 | 2018-01-19 | 北京科技大学 | 一种文本自动分类方法 |
CN108153895A (zh) * | 2018-01-06 | 2018-06-12 | 国网福建省电力有限公司 | 一种基于开放数据的语料库构建方法和系统 |
CN108287850A (zh) * | 2017-01-10 | 2018-07-17 | 阿里巴巴集团控股有限公司 | 文本分类模型的优化方法及装置 |
CN108520030A (zh) * | 2018-03-27 | 2018-09-11 | 深圳中兴网信科技有限公司 | 文本分类方法、文本分类系统及计算机装置 |
CN108647212A (zh) * | 2018-05-18 | 2018-10-12 | 大连民族大学 | 机器学习的影评情感倾向性分析中形成特征集合的方法 |
CN108733652A (zh) * | 2018-05-18 | 2018-11-02 | 大连民族大学 | 基于机器学习的影评情感倾向性分析的测试方法 |
CN109214455A (zh) * | 2018-09-05 | 2019-01-15 | 北京国网富达科技发展有限责任公司 | 油色谱数据与台账数据的相关性确定方法及系统 |
CN110245228A (zh) * | 2019-04-29 | 2019-09-17 | 阿里巴巴集团控股有限公司 | 确定文本类别的方法和装置 |
CN110597991A (zh) * | 2019-09-10 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 文本分类方法、装置、计算机设备及存储介质 |
CN110750638A (zh) * | 2019-06-28 | 2020-02-04 | 厦门美域中央信息科技有限公司 | 一种基于半监督学习的多标签语料库文本分类方法 |
CN112883158A (zh) * | 2021-02-25 | 2021-06-01 | 北京精准沟通传媒科技股份有限公司 | 对短文本分类的方法、装置、介质以及电子设备 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109189880A (zh) * | 2017-12-26 | 2019-01-11 | 爱品克科技(武汉)股份有限公司 | 一种基于短文本的用户兴趣分类方法 |
CN108491406B (zh) * | 2018-01-23 | 2021-09-24 | 深圳市阿西莫夫科技有限公司 | 信息分类方法、装置、计算机设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101770454A (zh) * | 2010-02-13 | 2010-07-07 | 武汉理工大学 | 短文本特征空间扩展方法 |
CN101794303A (zh) * | 2010-02-11 | 2010-08-04 | 重庆邮电大学 | 采用特征扩展分类文本及构造文本分类器的方法和装置 |
US20120185415A1 (en) * | 2011-01-13 | 2012-07-19 | International Business Machines Corporation | System and method for domain adaption with partial observation |
-
2012
- 2012-11-09 CN CN201210446997.4A patent/CN102955856B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101794303A (zh) * | 2010-02-11 | 2010-08-04 | 重庆邮电大学 | 采用特征扩展分类文本及构造文本分类器的方法和装置 |
CN101770454A (zh) * | 2010-02-13 | 2010-07-07 | 武汉理工大学 | 短文本特征空间扩展方法 |
US20120185415A1 (en) * | 2011-01-13 | 2012-07-19 | International Business Machines Corporation | System and method for domain adaption with partial observation |
Non-Patent Citations (4)
Title |
---|
张婷慧等: "一种改进的VSM及其在文本自动分类中的应用", 《微电子学与计算机!》 * |
王细薇等: "一种改进的基于共现关系的短文本特征扩展算法研究", 《河南城建学院学报》 * |
王细薇等: "中文短文本分类方法研究", 《现代计算机》 * |
袁满等: "一种基于频繁词集的文本分类算法", 《2012年第三届中国计算机学会服务计算学术会议论文集》 * |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103745000B (zh) * | 2014-01-24 | 2017-02-01 | 福州大学 | 一种中文微博客的热点话题检测方法 |
CN103942574A (zh) * | 2014-02-25 | 2014-07-23 | 浙江大学 | 3d手写识别svm分类器核参数选取方法及用途 |
CN103942574B (zh) * | 2014-02-25 | 2017-01-11 | 浙江大学 | 3d手写识别svm分类器核参数选取方法及用途 |
CN104765769A (zh) * | 2015-03-06 | 2015-07-08 | 大连理工大学 | 一种基于词矢量的短文本查询扩展及检索方法 |
CN104765769B (zh) * | 2015-03-06 | 2018-04-27 | 大连理工大学 | 一种基于词矢量的短文本查询扩展及检索方法 |
CN104778256A (zh) * | 2015-04-20 | 2015-07-15 | 江苏科技大学 | 一种领域问答系统咨询的快速可增量聚类方法 |
CN104778256B (zh) * | 2015-04-20 | 2017-10-17 | 江苏科技大学 | 一种领域问答系统咨询的快速可增量聚类方法 |
CN104834747A (zh) * | 2015-05-25 | 2015-08-12 | 中国科学院自动化研究所 | 基于卷积神经网络的短文本分类方法 |
CN104834747B (zh) * | 2015-05-25 | 2018-04-27 | 中国科学院自动化研究所 | 基于卷积神经网络的短文本分类方法 |
CN104850650B (zh) * | 2015-05-29 | 2018-04-10 | 清华大学 | 基于类标关系的短文本扩充方法 |
CN104850650A (zh) * | 2015-05-29 | 2015-08-19 | 清华大学 | 基于类标关系的短文本扩充方法 |
CN104951542A (zh) * | 2015-06-19 | 2015-09-30 | 百度在线网络技术(北京)有限公司 | 识别社交短文本类别的方法、分类模型训练方法及装置 |
CN105468713B (zh) * | 2015-11-19 | 2018-07-17 | 西安交通大学 | 一种多模型融合的短文本分类方法 |
CN105468713A (zh) * | 2015-11-19 | 2016-04-06 | 西安交通大学 | 一种多模型融合的短文本分类方法 |
CN105912716B (zh) * | 2016-04-29 | 2019-09-10 | 国家计算机网络与信息安全管理中心 | 一种短文本分类方法及装置 |
CN105912716A (zh) * | 2016-04-29 | 2016-08-31 | 国家计算机网络与信息安全管理中心 | 一种短文本分类方法及装置 |
CN106326458A (zh) * | 2016-06-02 | 2017-01-11 | 广西智度信息科技有限公司 | 一种基于文本分类的城市管理案件分类方法 |
CN106202518B (zh) * | 2016-07-22 | 2019-07-30 | 桂林电子科技大学 | 基于chi和分类别关联规则算法的短文本分类方法 |
CN106202518A (zh) * | 2016-07-22 | 2016-12-07 | 桂林电子科技大学 | 基于chi和分类别关联规则算法的短文本分类方法 |
CN106528642A (zh) * | 2016-10-13 | 2017-03-22 | 广东广业开元科技有限公司 | 一种基于tf‑idf特征提取的短文本分类方法 |
CN106528642B (zh) * | 2016-10-13 | 2018-05-25 | 广东广业开元科技有限公司 | 一种基于tf-idf特征提取的短文本分类方法 |
CN108287850A (zh) * | 2017-01-10 | 2018-07-17 | 阿里巴巴集团控股有限公司 | 文本分类模型的优化方法及装置 |
CN108287850B (zh) * | 2017-01-10 | 2021-09-21 | 创新先进技术有限公司 | 文本分类模型的优化方法及装置 |
CN107292348A (zh) * | 2017-07-10 | 2017-10-24 | 天津理工大学 | 一种Bagging_BSJ短文本分类方法 |
CN107609113A (zh) * | 2017-09-13 | 2018-01-19 | 北京科技大学 | 一种文本自动分类方法 |
CN108153895A (zh) * | 2018-01-06 | 2018-06-12 | 国网福建省电力有限公司 | 一种基于开放数据的语料库构建方法和系统 |
CN108520030A (zh) * | 2018-03-27 | 2018-09-11 | 深圳中兴网信科技有限公司 | 文本分类方法、文本分类系统及计算机装置 |
CN108520030B (zh) * | 2018-03-27 | 2022-02-11 | 深圳中兴网信科技有限公司 | 文本分类方法、文本分类系统及计算机装置 |
CN108647212A (zh) * | 2018-05-18 | 2018-10-12 | 大连民族大学 | 机器学习的影评情感倾向性分析中形成特征集合的方法 |
CN108733652A (zh) * | 2018-05-18 | 2018-11-02 | 大连民族大学 | 基于机器学习的影评情感倾向性分析的测试方法 |
CN108733652B (zh) * | 2018-05-18 | 2022-08-09 | 大连民族大学 | 基于机器学习的影评情感倾向性分析的测试方法 |
CN109214455A (zh) * | 2018-09-05 | 2019-01-15 | 北京国网富达科技发展有限责任公司 | 油色谱数据与台账数据的相关性确定方法及系统 |
CN110245228A (zh) * | 2019-04-29 | 2019-09-17 | 阿里巴巴集团控股有限公司 | 确定文本类别的方法和装置 |
CN110750638A (zh) * | 2019-06-28 | 2020-02-04 | 厦门美域中央信息科技有限公司 | 一种基于半监督学习的多标签语料库文本分类方法 |
CN110597991A (zh) * | 2019-09-10 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 文本分类方法、装置、计算机设备及存储介质 |
CN110597991B (zh) * | 2019-09-10 | 2021-08-17 | 腾讯科技(深圳)有限公司 | 文本分类方法、装置、计算机设备及存储介质 |
CN112883158A (zh) * | 2021-02-25 | 2021-06-01 | 北京精准沟通传媒科技股份有限公司 | 对短文本分类的方法、装置、介质以及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN102955856B (zh) | 2015-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102955856B (zh) | 一种基于特征扩展的中文短文本分类方法 | |
CN108052593B (zh) | 一种基于主题词向量和网络结构的主题关键词提取方法 | |
CN103049435B (zh) | 文本细粒度情感分析方法及装置 | |
CN106055538B (zh) | 主题模型和语义分析相结合的文本标签自动抽取方法 | |
CN102708100B (zh) | 挖掘相关实体词的关系关键词的方法和装置及其应用 | |
CN101593200B (zh) | 基于关键词频度分析的中文网页分类方法 | |
CN101251855B (zh) | 一种互联网网页清洗方法、系统及设备 | |
CN100595760C (zh) | 一种获取口语词条的方法、装置以及一种输入法系统 | |
Shen et al. | LIEGE: link entities in web lists with knowledge base | |
CN103617157A (zh) | 基于语义的文本相似度计算方法 | |
US20150178273A1 (en) | Unsupervised Relation Detection Model Training | |
CN105718579A (zh) | 一种基于上网日志挖掘和用户活动识别的信息推送方法 | |
CN107992542A (zh) | 一种基于主题模型的相似文章推荐方法 | |
CN102043851A (zh) | 一种基于频繁项集的多文档自动摘要方法 | |
CN104765769A (zh) | 一种基于词矢量的短文本查询扩展及检索方法 | |
CN102033880A (zh) | 基于结构化数据集合的标注方法和装置 | |
CN103207860A (zh) | 舆情事件的实体关系抽取方法和装置 | |
CN103455562A (zh) | 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器 | |
CN105488077A (zh) | 生成内容标签的方法和装置 | |
CN102081642A (zh) | 搜索引擎检索结果聚类的中文标签提取方法 | |
CN108920482B (zh) | 基于词汇链特征扩展和lda模型的微博短文本分类方法 | |
CN101916263A (zh) | 基于加权编辑距离的模糊关键字查询方法及系统 | |
CN104268230B (zh) | 一种基于异质图随机游走的中文微博客观点探测方法 | |
CN106126605B (zh) | 一种基于用户画像的短文本分类方法 | |
CN110287309A (zh) | 快速提取文本摘要的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C53 | Correction of patent of invention or patent application | ||
CB03 | Change of inventor or designer information |
Inventor after: Ouyang Yuanxin Inventor after: Yuan Man Inventor after: Luo Jianhui Inventor after: Liu Wenqi Inventor after: Xiong Zhang Inventor before: Ouyang Yuanxin Inventor before: Luo Jianhui Inventor before: Liu Wenqi Inventor before: Xiong Zhang |
|
COR | Change of bibliographic data |
Free format text: CORRECT: INVENTOR; FROM: OUYANG YUANXIN LUO JIANHUI LIU WENQI XIONG ZHANG TO: OUYANG YUANXIN YUAN MAN LUO JIANHUI LIU WENQI XIONG ZHANG |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20170222 Address after: 100055 Beijing City, Guang'an Road, No. 9, the country voted wealth Plaza, building 3, floor 2, Patentee after: Beijing Rock Technology Co., Ltd. Address before: 100191 Haidian District, Xueyuan Road, No. 37, Patentee before: Beihang University |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150708 Termination date: 20181109 |