CN104820703A - 一种文本精细分类方法 - Google Patents
一种文本精细分类方法 Download PDFInfo
- Publication number
- CN104820703A CN104820703A CN201510239027.0A CN201510239027A CN104820703A CN 104820703 A CN104820703 A CN 104820703A CN 201510239027 A CN201510239027 A CN 201510239027A CN 104820703 A CN104820703 A CN 104820703A
- Authority
- CN
- China
- Prior art keywords
- text
- sorter
- term vector
- responsive dictionary
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510239027.0A CN104820703A (zh) | 2015-05-12 | 2015-05-12 | 一种文本精细分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510239027.0A CN104820703A (zh) | 2015-05-12 | 2015-05-12 | 一种文本精细分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104820703A true CN104820703A (zh) | 2015-08-05 |
Family
ID=53730998
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510239027.0A Pending CN104820703A (zh) | 2015-05-12 | 2015-05-12 | 一种文本精细分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104820703A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106951422A (zh) * | 2016-01-07 | 2017-07-14 | 腾讯科技(深圳)有限公司 | 网页训练的方法和装置、搜索意图识别的方法和装置 |
CN107506475A (zh) * | 2017-09-08 | 2017-12-22 | 国网辽宁省电力有限公司 | 一种基于Spark的海量电力客服文本分类方法 |
CN108804669A (zh) * | 2018-06-08 | 2018-11-13 | 国家计算机网络与信息安全管理中心 | 一种基于意图理解技术的诈骗电话检出方法 |
CN109308317A (zh) * | 2018-09-07 | 2019-02-05 | 浪潮软件股份有限公司 | 一种基于聚类的非结构化文本的热点词提取方法 |
CN109784368A (zh) * | 2018-12-11 | 2019-05-21 | 同盾控股有限公司 | 一种应用程序分类的确定方法和装置 |
CN110019792A (zh) * | 2017-10-30 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 文本分类方法及装置和分类器模型训练方法 |
CN110175238A (zh) * | 2019-05-31 | 2019-08-27 | 杭州网易再顾科技有限公司 | 舆情分类方法、介质、装置和计算设备 |
CN110413789A (zh) * | 2019-07-31 | 2019-11-05 | 广西师范大学 | 一种基于svm的习题自动分类方法 |
CN110704610A (zh) * | 2019-05-15 | 2020-01-17 | 北京信息科技大学 | 体育新闻战报主题分类方法 |
CN110825850A (zh) * | 2019-11-07 | 2020-02-21 | 哈尔滨工业大学(深圳) | 一种自然语言主题分类方法及装置 |
CN111259158A (zh) * | 2020-02-25 | 2020-06-09 | 北京松果电子有限公司 | 一种文本分类方法、装置及介质 |
CN112134920A (zh) * | 2020-08-12 | 2020-12-25 | 新华三技术有限公司 | 一种文件识别方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102033949A (zh) * | 2010-12-23 | 2011-04-27 | 南京财经大学 | 基于修正的k近邻文本分类方法 |
EP2757493A2 (en) * | 2013-01-22 | 2014-07-23 | Maluuba Inc. | Natural language processing method and system |
CN104063472A (zh) * | 2014-06-30 | 2014-09-24 | 电子科技大学 | 一种优化训练样本集的knn文本分类方法 |
CN104361037A (zh) * | 2014-10-29 | 2015-02-18 | 国家计算机网络与信息安全管理中心 | 微博分类方法及装置 |
-
2015
- 2015-05-12 CN CN201510239027.0A patent/CN104820703A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102033949A (zh) * | 2010-12-23 | 2011-04-27 | 南京财经大学 | 基于修正的k近邻文本分类方法 |
EP2757493A2 (en) * | 2013-01-22 | 2014-07-23 | Maluuba Inc. | Natural language processing method and system |
CN104063472A (zh) * | 2014-06-30 | 2014-09-24 | 电子科技大学 | 一种优化训练样本集的knn文本分类方法 |
CN104361037A (zh) * | 2014-10-29 | 2015-02-18 | 国家计算机网络与信息安全管理中心 | 微博分类方法及装置 |
Non-Patent Citations (2)
Title |
---|
勇凤伟: "面向互联网的中文问题分类技术研究", 《中国优秀硕士学位论文全文数据库·信息科技辑》 * |
吴克贤: "基于分类的文本内容判别方法研究", 《中国优秀硕士学位论文全文数据库·信息科技辑》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106951422A (zh) * | 2016-01-07 | 2017-07-14 | 腾讯科技(深圳)有限公司 | 网页训练的方法和装置、搜索意图识别的方法和装置 |
CN107506475A (zh) * | 2017-09-08 | 2017-12-22 | 国网辽宁省电力有限公司 | 一种基于Spark的海量电力客服文本分类方法 |
CN110019792A (zh) * | 2017-10-30 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 文本分类方法及装置和分类器模型训练方法 |
CN108804669A (zh) * | 2018-06-08 | 2018-11-13 | 国家计算机网络与信息安全管理中心 | 一种基于意图理解技术的诈骗电话检出方法 |
CN109308317A (zh) * | 2018-09-07 | 2019-02-05 | 浪潮软件股份有限公司 | 一种基于聚类的非结构化文本的热点词提取方法 |
CN109784368A (zh) * | 2018-12-11 | 2019-05-21 | 同盾控股有限公司 | 一种应用程序分类的确定方法和装置 |
CN110704610A (zh) * | 2019-05-15 | 2020-01-17 | 北京信息科技大学 | 体育新闻战报主题分类方法 |
CN110175238A (zh) * | 2019-05-31 | 2019-08-27 | 杭州网易再顾科技有限公司 | 舆情分类方法、介质、装置和计算设备 |
CN110413789A (zh) * | 2019-07-31 | 2019-11-05 | 广西师范大学 | 一种基于svm的习题自动分类方法 |
CN110825850A (zh) * | 2019-11-07 | 2020-02-21 | 哈尔滨工业大学(深圳) | 一种自然语言主题分类方法及装置 |
CN110825850B (zh) * | 2019-11-07 | 2022-07-08 | 哈尔滨工业大学(深圳) | 一种自然语言主题分类方法及装置 |
CN111259158A (zh) * | 2020-02-25 | 2020-06-09 | 北京松果电子有限公司 | 一种文本分类方法、装置及介质 |
CN111259158B (zh) * | 2020-02-25 | 2023-06-02 | 北京小米松果电子有限公司 | 一种文本分类方法、装置及介质 |
CN112134920A (zh) * | 2020-08-12 | 2020-12-25 | 新华三技术有限公司 | 一种文件识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104820703A (zh) | 一种文本精细分类方法 | |
CN103279478B (zh) | 一种基于分布式互信息文档特征提取方法 | |
CN111177367B (zh) | 案件分类方法、分类模型训练方法及相关产品 | |
CN108875049A (zh) | 文本聚类方法及装置 | |
CN103218405A (zh) | 基于维数约简的集成迁移文本分类方法 | |
CN109492219A (zh) | 一种基于特征分类和情感语义分析的诈骗网站识别方法 | |
CN110226179A (zh) | 通过神经网络整合情境信息来自动检测支付交易流中的欺诈 | |
CN111353050A (zh) | 一种电信客服垂直领域的词库构建方法及工具 | |
Aziguli et al. | A robust text classifier based on denoising deep neural network in the analysis of big data | |
CN109726918A (zh) | 基于生成式对抗网络和半监督学习的个人信用确定方法 | |
CN107229614A (zh) | 用于分类数据的方法和装置 | |
Pramanik et al. | A study on the effect of CNN-based transfer learning on handwritten Indic and mixed numeral recognition | |
CN113486664A (zh) | 文本数据可视化分析方法、装置、设备及存储介质 | |
Karwa et al. | Automated hybrid Deep Neural Network model for fake news identification and classification in social networks | |
CN106844596A (zh) | 一种基于改进的svm中文文本分类方法 | |
Mandivarapu et al. | Efficient document image classification using region-based graph neural network | |
Thakur et al. | MYTHYA: fake news detector, real time news extractor and classifier | |
Schulz et al. | Evaluating multi-label classification of incident-related tweets | |
Jain et al. | Review on analysis of classifiers for fake news detection | |
CN111061939B (zh) | 基于深度学习的科研学术新闻关键字匹配推荐方法 | |
CN104573003B (zh) | 基于新闻主题信息检索的金融时间序列预测方法 | |
Wang et al. | Text length considered adaptive bagging ensemble learning algorithm for text classification | |
Zeng et al. | Using cost-sensitive ranking loss to improve distant supervised relation extraction | |
Jen et al. | Predicting conference paper acceptance | |
Ba Alawi et al. | Yemeni Paper Currency Recognition System Using Deep Learning Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Zheng Sheng Inventor after: Xu Tao Inventor after: Zhang Sheng Inventor after: Zou Fuhao Inventor after: Jiang Dan Inventor after: Xia Ming Inventor after: Zhou Ke Inventor before: Zheng Sheng Inventor before: Zhang Sheng Inventor before: Zou Fuhao Inventor before: Jiang Dan Inventor before: Xia Ming Inventor before: Zhou Ke |
|
COR | Change of bibliographic data | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150805 |
|
RJ01 | Rejection of invention patent application after publication |