CN105260437A - 文本分类特征选择方法及其在生物医药文本分类中的应用 - Google Patents
文本分类特征选择方法及其在生物医药文本分类中的应用 Download PDFInfo
- Publication number
- CN105260437A CN105260437A CN201510642985.2A CN201510642985A CN105260437A CN 105260437 A CN105260437 A CN 105260437A CN 201510642985 A CN201510642985 A CN 201510642985A CN 105260437 A CN105260437 A CN 105260437A
- Authority
- CN
- China
- Prior art keywords
- feature
- context
- sigma
- classification
- prime
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
Abstract
Description
Claims (4)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510642985.2A CN105260437B (zh) | 2015-09-30 | 2015-09-30 | 文本分类特征选择方法及其在生物医药文本分类中的应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510642985.2A CN105260437B (zh) | 2015-09-30 | 2015-09-30 | 文本分类特征选择方法及其在生物医药文本分类中的应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105260437A true CN105260437A (zh) | 2016-01-20 |
CN105260437B CN105260437B (zh) | 2018-11-23 |
Family
ID=55100128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510642985.2A Active CN105260437B (zh) | 2015-09-30 | 2015-09-30 | 文本分类特征选择方法及其在生物医药文本分类中的应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105260437B (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021508A (zh) * | 2016-05-23 | 2016-10-12 | 武汉大学 | 基于社交媒体的突发事件应急信息挖掘方法 |
CN106250367A (zh) * | 2016-07-27 | 2016-12-21 | 昆明理工大学 | 基于改进的Nivre算法构建越南语依存树库的方法 |
CN106326458A (zh) * | 2016-06-02 | 2017-01-11 | 广西智度信息科技有限公司 | 一种基于文本分类的城市管理案件分类方法 |
CN106708959A (zh) * | 2016-11-30 | 2017-05-24 | 重庆大学 | 一种基于医学文献数据库的组合药物识别与排序方法 |
CN107016073A (zh) * | 2017-03-24 | 2017-08-04 | 北京科技大学 | 一种文本分类特征选择方法 |
CN107092679A (zh) * | 2017-04-21 | 2017-08-25 | 北京邮电大学 | 一种特征词向量获得方法、文本分类方法及装置 |
CN107357837A (zh) * | 2017-06-22 | 2017-11-17 | 华南师范大学 | 基于保序子矩阵和频繁序列挖掘的电商评论情感分类方法 |
CN108009152A (zh) * | 2017-12-04 | 2018-05-08 | 陕西识代运筹信息科技股份有限公司 | 一种基于Spark-Streaming的文本相似性分析的数据处理方法和装置 |
CN108205524A (zh) * | 2016-12-20 | 2018-06-26 | 北京京东尚科信息技术有限公司 | 文本数据处理方法和装置 |
CN109117956A (zh) * | 2018-07-05 | 2019-01-01 | 浙江大学 | 一种最佳特征子集的确定方法 |
CN109767814A (zh) * | 2019-01-17 | 2019-05-17 | 中国科学院新疆理化技术研究所 | 一种基于GloVe模型的氨基酸全局特征向量表示方法 |
CN111382273A (zh) * | 2020-03-09 | 2020-07-07 | 西安理工大学 | 一种基于吸引因子的特征选择的文本分类方法 |
CN111475617A (zh) * | 2020-03-30 | 2020-07-31 | 招商局金融科技有限公司 | 事件主体抽取方法、装置及存储介质 |
CN113470779A (zh) * | 2021-09-03 | 2021-10-01 | 壹药网科技(上海)股份有限公司 | 药品类目识别方法及其系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060085750A1 (en) * | 2004-10-19 | 2006-04-20 | International Business Machines Corporation | Intelligent web based help system |
CN101122909A (zh) * | 2006-08-10 | 2008-02-13 | 株式会社日立制作所 | 文本信息检索装置以及文本信息检索方法 |
CN102023967A (zh) * | 2010-11-11 | 2011-04-20 | 清华大学 | 一种面向股票领域的文本情感分类方法 |
CN102257492A (zh) * | 2008-12-19 | 2011-11-23 | 伊斯曼柯达公司 | 用于产生语境增强的交流作品的系统和方法 |
-
2015
- 2015-09-30 CN CN201510642985.2A patent/CN105260437B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060085750A1 (en) * | 2004-10-19 | 2006-04-20 | International Business Machines Corporation | Intelligent web based help system |
CN101122909A (zh) * | 2006-08-10 | 2008-02-13 | 株式会社日立制作所 | 文本信息检索装置以及文本信息检索方法 |
CN102257492A (zh) * | 2008-12-19 | 2011-11-23 | 伊斯曼柯达公司 | 用于产生语境增强的交流作品的系统和方法 |
CN102023967A (zh) * | 2010-11-11 | 2011-04-20 | 清华大学 | 一种面向股票领域的文本情感分类方法 |
Non-Patent Citations (3)
Title |
---|
张彪,等: ""基于关联分析的文本分类特征选择算法"", 《计算机工程》 * |
毛小丽: ""基于特征向量的实体间语义关系抽取研究"", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 * |
胡佳妮,等: ""中文文本分类中的特征选择算法研究"", 《光通信研究》 * |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021508A (zh) * | 2016-05-23 | 2016-10-12 | 武汉大学 | 基于社交媒体的突发事件应急信息挖掘方法 |
CN106326458A (zh) * | 2016-06-02 | 2017-01-11 | 广西智度信息科技有限公司 | 一种基于文本分类的城市管理案件分类方法 |
CN106250367B (zh) * | 2016-07-27 | 2019-04-09 | 昆明理工大学 | 基于改进的Nivre算法构建越南语依存树库的方法 |
CN106250367A (zh) * | 2016-07-27 | 2016-12-21 | 昆明理工大学 | 基于改进的Nivre算法构建越南语依存树库的方法 |
CN106708959A (zh) * | 2016-11-30 | 2017-05-24 | 重庆大学 | 一种基于医学文献数据库的组合药物识别与排序方法 |
CN108205524B (zh) * | 2016-12-20 | 2022-01-07 | 北京京东尚科信息技术有限公司 | 文本数据处理方法和装置 |
CN108205524A (zh) * | 2016-12-20 | 2018-06-26 | 北京京东尚科信息技术有限公司 | 文本数据处理方法和装置 |
CN107016073A (zh) * | 2017-03-24 | 2017-08-04 | 北京科技大学 | 一种文本分类特征选择方法 |
CN107016073B (zh) * | 2017-03-24 | 2019-06-28 | 北京科技大学 | 一种文本分类特征选择方法 |
CN107092679A (zh) * | 2017-04-21 | 2017-08-25 | 北京邮电大学 | 一种特征词向量获得方法、文本分类方法及装置 |
CN107092679B (zh) * | 2017-04-21 | 2020-01-03 | 北京邮电大学 | 一种特征词向量获得方法、文本分类方法及装置 |
CN107357837A (zh) * | 2017-06-22 | 2017-11-17 | 华南师范大学 | 基于保序子矩阵和频繁序列挖掘的电商评论情感分类方法 |
CN107357837B (zh) * | 2017-06-22 | 2019-10-08 | 华南师范大学 | 基于保序子矩阵和频繁序列挖掘的电商评论情感分类方法 |
CN108009152A (zh) * | 2017-12-04 | 2018-05-08 | 陕西识代运筹信息科技股份有限公司 | 一种基于Spark-Streaming的文本相似性分析的数据处理方法和装置 |
CN109117956A (zh) * | 2018-07-05 | 2019-01-01 | 浙江大学 | 一种最佳特征子集的确定方法 |
CN109117956B (zh) * | 2018-07-05 | 2021-08-24 | 浙江大学 | 一种最佳特征子集的确定方法 |
CN109767814A (zh) * | 2019-01-17 | 2019-05-17 | 中国科学院新疆理化技术研究所 | 一种基于GloVe模型的氨基酸全局特征向量表示方法 |
CN111382273A (zh) * | 2020-03-09 | 2020-07-07 | 西安理工大学 | 一种基于吸引因子的特征选择的文本分类方法 |
CN111382273B (zh) * | 2020-03-09 | 2023-04-14 | 广州智赢万世市场管理有限公司 | 一种基于吸引因子的特征选择的文本分类方法 |
CN111475617A (zh) * | 2020-03-30 | 2020-07-31 | 招商局金融科技有限公司 | 事件主体抽取方法、装置及存储介质 |
CN111475617B (zh) * | 2020-03-30 | 2023-04-18 | 招商局金融科技有限公司 | 事件主体抽取方法、装置及存储介质 |
CN113470779B (zh) * | 2021-09-03 | 2021-11-26 | 壹药网科技(上海)股份有限公司 | 药品类目识别方法及其系统 |
CN113470779A (zh) * | 2021-09-03 | 2021-10-01 | 壹药网科技(上海)股份有限公司 | 药品类目识别方法及其系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105260437B (zh) | 2018-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105260437A (zh) | 文本分类特征选择方法及其在生物医药文本分类中的应用 | |
CN110297988B (zh) | 基于加权LDA和改进Single-Pass聚类算法的热点话题检测方法 | |
CN104951548B (zh) | 一种负面舆情指数的计算方法及系统 | |
CN102789498B (zh) | 基于集成学习的中文评论文本的情感分类方法与系统 | |
CN109829166B (zh) | 基于字符级卷积神经网络的民宿顾客意见挖掘方法 | |
CN107239439A (zh) | 基于word2vec的舆情倾向性分析方法 | |
CN109739986A (zh) | 一种基于深度集成学习的投诉短文本分类方法 | |
CN105930411A (zh) | 一种分类器训练方法、分类器和情感分类系统 | |
CN109670014B (zh) | 一种基于规则匹配和机器学习的论文作者名消歧方法 | |
CN106997382A (zh) | 基于大数据的创新创意标签自动标注方法及系统 | |
CN109492105B (zh) | 一种基于多特征集成学习的文本情感分类方法 | |
CN112905739B (zh) | 虚假评论检测模型训练方法、检测方法及电子设备 | |
CN110516074B (zh) | 一种基于深度学习的网站主题分类方法及装置 | |
CN109960799A (zh) | 一种面向短文本的优化分类方法 | |
Hissah et al. | Detecting and classifying crimes from arabic twitter posts using text mining techniques | |
Whitney et al. | Don’t want to get caught? don’t say it: The use of emojis in online human sex trafficking ads | |
CN107609113A (zh) | 一种文本自动分类方法 | |
CN106570170A (zh) | 基于深度循环神经网络的文本分类和命名实体识别一体化方法及系统 | |
CN115952292B (zh) | 多标签分类方法、装置及计算机可读介质 | |
CN107506472A (zh) | 一种学生浏览网页分类方法 | |
Adeleke et al. | Automating quranic verses labeling using machine learning approach | |
Jayakody et al. | Sentiment analysis on product reviews on twitter using Machine Learning Approaches | |
CN110516064A (zh) | 一种基于深度学习的航空科研论文分类方法 | |
Bonny et al. | Deep learning approach for sentimental analysis of hotel review on bengali text | |
CN110348497A (zh) | 一种基于WT-GloVe词向量构建的文本表示方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210727 Address after: No. 86, Yushan West Road, Jiangpu street, Pukou District, Nanjing, Jiangsu 210012 Patentee after: NANJING AUDIT University Address before: No. 86, Yushan West Road, Pukou District, Nanjing City, Jiangsu Province Patentee before: Chen Yifei |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20211220 Address after: 210000 No. 10, Fenghuang street, Jiangpu street, Pukou District, Nanjing, Jiangsu - rh0001 Patentee after: Nanjing Rui Hui Data Technology Co.,Ltd. Address before: No. 86, Yushan West Road, Jiangpu street, Pukou District, Nanjing, Jiangsu 210012 Patentee before: NANJING AUDIT University |
|
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Feature selection method for text classification and its application in biomedical text classification Effective date of registration: 20221011 Granted publication date: 20181123 Pledgee: Nanjing Bank Co.,Ltd. Nanjing Financial City Branch Pledgor: Nanjing Rui Hui Data Technology Co.,Ltd. Registration number: Y2022980017741 |