CN109783816B - 短文本聚类方法及终端设备 - Google Patents
短文本聚类方法及终端设备 Download PDFInfo
- Publication number
- CN109783816B CN109783816B CN201910027851.8A CN201910027851A CN109783816B CN 109783816 B CN109783816 B CN 109783816B CN 201910027851 A CN201910027851 A CN 201910027851A CN 109783816 B CN109783816 B CN 109783816B
- Authority
- CN
- China
- Prior art keywords
- texts
- similarity
- text
- calculating
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (9)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910027851.8A CN109783816B (zh) | 2019-01-11 | 2019-01-11 | 短文本聚类方法及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910027851.8A CN109783816B (zh) | 2019-01-11 | 2019-01-11 | 短文本聚类方法及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109783816A CN109783816A (zh) | 2019-05-21 |
CN109783816B true CN109783816B (zh) | 2023-04-07 |
Family
ID=66500268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910027851.8A Active CN109783816B (zh) | 2019-01-11 | 2019-01-11 | 短文本聚类方法及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109783816B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182206B (zh) * | 2020-09-01 | 2023-06-09 | 中国联合网络通信集团有限公司 | 文本聚类方法及装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103136355A (zh) * | 2013-03-05 | 2013-06-05 | 电子科技大学 | 一种基于自动阈值鱼群算法的文本聚类方法 |
JP2013196212A (ja) * | 2012-03-16 | 2013-09-30 | Fujitsu Ltd | 文書分割装置、文書分割プログラムおよび文書分割方法 |
CN104102626A (zh) * | 2014-07-07 | 2014-10-15 | 厦门推特信息科技有限公司 | 一种用于短文本语义相似度计算的方法 |
CN104778280A (zh) * | 2015-05-04 | 2015-07-15 | 合肥工业大学 | 基于近邻传播的文本数据流聚类算法 |
CN104866572A (zh) * | 2015-05-22 | 2015-08-26 | 齐鲁工业大学 | 一种网络短文本聚类方法 |
CN106096066A (zh) * | 2016-08-17 | 2016-11-09 | 盐城工学院 | 基于随机近邻嵌入的文本聚类方法 |
CN106599029A (zh) * | 2016-11-02 | 2017-04-26 | 焦点科技股份有限公司 | 一种中文短文本聚类方法 |
CN106611041A (zh) * | 2016-09-29 | 2017-05-03 | 四川用联信息技术有限公司 | 一种新的文本相似度求解方法 |
CN106649853A (zh) * | 2016-12-30 | 2017-05-10 | 儒安科技有限公司 | 一种基于深度学习的短文本聚类方法 |
CN108961316A (zh) * | 2017-05-23 | 2018-12-07 | 华为技术有限公司 | 图像处理方法、装置及服务器 |
CN109165696A (zh) * | 2018-09-29 | 2019-01-08 | 联想(北京)有限公司 | 一种聚类方法及电子设备 |
-
2019
- 2019-01-11 CN CN201910027851.8A patent/CN109783816B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013196212A (ja) * | 2012-03-16 | 2013-09-30 | Fujitsu Ltd | 文書分割装置、文書分割プログラムおよび文書分割方法 |
CN103136355A (zh) * | 2013-03-05 | 2013-06-05 | 电子科技大学 | 一种基于自动阈值鱼群算法的文本聚类方法 |
CN104102626A (zh) * | 2014-07-07 | 2014-10-15 | 厦门推特信息科技有限公司 | 一种用于短文本语义相似度计算的方法 |
CN104778280A (zh) * | 2015-05-04 | 2015-07-15 | 合肥工业大学 | 基于近邻传播的文本数据流聚类算法 |
CN104866572A (zh) * | 2015-05-22 | 2015-08-26 | 齐鲁工业大学 | 一种网络短文本聚类方法 |
CN106096066A (zh) * | 2016-08-17 | 2016-11-09 | 盐城工学院 | 基于随机近邻嵌入的文本聚类方法 |
CN106611041A (zh) * | 2016-09-29 | 2017-05-03 | 四川用联信息技术有限公司 | 一种新的文本相似度求解方法 |
CN106599029A (zh) * | 2016-11-02 | 2017-04-26 | 焦点科技股份有限公司 | 一种中文短文本聚类方法 |
CN106649853A (zh) * | 2016-12-30 | 2017-05-10 | 儒安科技有限公司 | 一种基于深度学习的短文本聚类方法 |
CN108961316A (zh) * | 2017-05-23 | 2018-12-07 | 华为技术有限公司 | 图像处理方法、装置及服务器 |
CN109165696A (zh) * | 2018-09-29 | 2019-01-08 | 联想(北京)有限公司 | 一种聚类方法及电子设备 |
Non-Patent Citations (1)
Title |
---|
"基于短文本的热点分析关键技术研究";高华林;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180415;I138-3543 * |
Also Published As
Publication number | Publication date |
---|---|
CN109783816A (zh) | 2019-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9418144B2 (en) | Similar document detection and electronic discovery | |
Oghbaie et al. | Pairwise document similarity measure based on present term set | |
CN111753048B (zh) | 文档检索方法、装置、设备及存储介质 | |
CN111797214A (zh) | 基于faq数据库的问题筛选方法、装置、计算机设备及介质 | |
CN108647322B (zh) | 基于词网识别大量Web文本信息相似度的方法 | |
CN112395875A (zh) | 一种关键词提取方法、装置、终端以及存储介质 | |
CN111126442B (zh) | 一种物品关键属性生成方法、物品分类方法和装置 | |
CN110569289B (zh) | 基于大数据的列数据处理方法、设备及介质 | |
CN112395487A (zh) | 信息推荐方法、装置、计算机可读存储介质及电子设备 | |
Jo | K nearest neighbor for text summarization using feature similarity | |
Jo | Using K Nearest Neighbors for text segmentation with feature similarity | |
Baena-García et al. | TF-SIDF: Term frequency, sketched inverse document frequency | |
CN109783816B (zh) | 短文本聚类方法及终端设备 | |
Zhou et al. | Feature selection based on term frequency reordering of document level | |
CN113761185A (zh) | 主键提取方法、设备及存储介质 | |
CN115544257B (zh) | 网盘文档快速分类方法、装置、网盘及存储介质 | |
WO2022257455A1 (zh) | 一种相似文本的确定方法、装置、终端设备及存储介质 | |
Agnihotri et al. | Mutual information using sample variance for text feature selection | |
CN114780712B (zh) | 一种基于质量评价的新闻专题生成方法及装置 | |
CN110852078A (zh) | 生成标题的方法和装置 | |
CN111090743B (zh) | 一种基于词嵌入和多值形式概念分析的论文推荐方法及装置 | |
CN114818686A (zh) | 基于人工智能的文本推荐方法及相关设备 | |
CN113792131A (zh) | 一种关键词的提取方法、装置、电子设备及存储介质 | |
CN112948545A (zh) | 查重方法、终端设备及计算机可读存储介质 | |
CN107622129B (zh) | 一种知识库的组织方法及装置、计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Dragon Inventor after: Li Tiefei Inventor after: Wei Zhongcheng Inventor after: Wu Di Inventor after: Yang Ruixin Inventor after: Ma Jianfei Inventor after: Huang Zhuyun Inventor after: Zhang Mengtian Inventor after: Sun Lei Inventor before: Wu Di Inventor before: Yang Ruixin Inventor before: Dragon Inventor before: Ma Jianfei Inventor before: Huang Zhuyun Inventor before: Zhang Mengtian Inventor before: Sun Lei |
|
GR01 | Patent grant | ||
GR01 | Patent grant |