CN110688836A - 基于监督学习的领域词典自动化构建方法 - Google Patents
基于监督学习的领域词典自动化构建方法 Download PDFInfo
- Publication number
- CN110688836A CN110688836A CN201910938421.1A CN201910938421A CN110688836A CN 110688836 A CN110688836 A CN 110688836A CN 201910938421 A CN201910938421 A CN 201910938421A CN 110688836 A CN110688836 A CN 110688836A
- Authority
- CN
- China
- Prior art keywords
- word
- domain dictionary
- features
- keywords
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (9)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910938421.1A CN110688836A (zh) | 2019-09-30 | 2019-09-30 | 基于监督学习的领域词典自动化构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910938421.1A CN110688836A (zh) | 2019-09-30 | 2019-09-30 | 基于监督学习的领域词典自动化构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110688836A true CN110688836A (zh) | 2020-01-14 |
Family
ID=69111163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910938421.1A Pending CN110688836A (zh) | 2019-09-30 | 2019-09-30 | 基于监督学习的领域词典自动化构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110688836A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111325033A (zh) * | 2020-03-20 | 2020-06-23 | 中国建设银行股份有限公司 | 实体识别方法、装置、电子设备及计算机可读存储介质 |
CN111428498A (zh) * | 2020-04-02 | 2020-07-17 | 北京明略软件系统有限公司 | 专名词典的词条过滤方法及装置 |
CN111460175A (zh) * | 2020-04-08 | 2020-07-28 | 福州数据技术研究院有限公司 | 一种基于snomed-ct的医学名词词典构造与拓展方法 |
CN111814474A (zh) * | 2020-09-14 | 2020-10-23 | 智者四海(北京)技术有限公司 | 领域短语挖掘方法及装置 |
CN111950729A (zh) * | 2020-07-19 | 2020-11-17 | 中国建设银行股份有限公司 | 一种知识库构建方法、装置、电子设备和可读存储装置 |
CN112101017A (zh) * | 2020-04-02 | 2020-12-18 | 上海迷因网络科技有限公司 | 一种为快速表达力测试生成题目的方法 |
CN112507060A (zh) * | 2020-12-14 | 2021-03-16 | 福建正孚软件有限公司 | 一种领域语料库构建方法及系统 |
CN113191147A (zh) * | 2021-05-27 | 2021-07-30 | 中国人民解放军军事科学院评估论证研究中心 | 无监督的自动术语抽取方法、装置、设备和介质 |
CN113947099A (zh) * | 2021-07-05 | 2022-01-18 | 华北电力大学(保定) | 基于esprit-psa与lgbm的五相异步电动机转子断条数目高精度诊断方法 |
CN115270774A (zh) * | 2022-09-27 | 2022-11-01 | 吉奥时空信息技术股份有限公司 | 一种半监督学习的大数据关键词词典构建方法 |
CN116092672A (zh) * | 2023-03-21 | 2023-05-09 | 四川大学华西医院 | 谵妄识别装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069021A (zh) * | 2015-07-15 | 2015-11-18 | 广东石油化工学院 | 基于领域的中文短文本情感分类方法 |
CN105740229A (zh) * | 2016-01-26 | 2016-07-06 | 中国人民解放军国防科学技术大学 | 关键词提取的方法及装置 |
CN108763196A (zh) * | 2018-05-03 | 2018-11-06 | 上海海事大学 | 一种基于pmi的关键字提取方法 |
-
2019
- 2019-09-30 CN CN201910938421.1A patent/CN110688836A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069021A (zh) * | 2015-07-15 | 2015-11-18 | 广东石油化工学院 | 基于领域的中文短文本情感分类方法 |
CN105740229A (zh) * | 2016-01-26 | 2016-07-06 | 中国人民解放军国防科学技术大学 | 关键词提取的方法及装置 |
CN108763196A (zh) * | 2018-05-03 | 2018-11-06 | 上海海事大学 | 一种基于pmi的关键字提取方法 |
Non-Patent Citations (2)
Title |
---|
ASIA-LEE: ""基于树模型的lightGBM文本分类"", 《 HTTPS://ASIALEE.BLOG.CSDN.NET/ARTICLE/DETAILS/100119892》 * |
喂你在哪: ""NLP之关键词提取"", 《HTTPS://WWW.CNBLOGS.COM/DYL222/P/11052895.HTML》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111325033A (zh) * | 2020-03-20 | 2020-06-23 | 中国建设银行股份有限公司 | 实体识别方法、装置、电子设备及计算机可读存储介质 |
CN111325033B (zh) * | 2020-03-20 | 2023-07-11 | 中国建设银行股份有限公司 | 实体识别方法、装置、电子设备及计算机可读存储介质 |
CN112101017B (zh) * | 2020-04-02 | 2022-09-06 | 上海迷因网络科技有限公司 | 一种为快速表达力测试生成题目的方法 |
CN111428498A (zh) * | 2020-04-02 | 2020-07-17 | 北京明略软件系统有限公司 | 专名词典的词条过滤方法及装置 |
CN112101017A (zh) * | 2020-04-02 | 2020-12-18 | 上海迷因网络科技有限公司 | 一种为快速表达力测试生成题目的方法 |
CN111460175A (zh) * | 2020-04-08 | 2020-07-28 | 福州数据技术研究院有限公司 | 一种基于snomed-ct的医学名词词典构造与拓展方法 |
CN111950729A (zh) * | 2020-07-19 | 2020-11-17 | 中国建设银行股份有限公司 | 一种知识库构建方法、装置、电子设备和可读存储装置 |
CN111814474A (zh) * | 2020-09-14 | 2020-10-23 | 智者四海(北京)技术有限公司 | 领域短语挖掘方法及装置 |
CN112507060A (zh) * | 2020-12-14 | 2021-03-16 | 福建正孚软件有限公司 | 一种领域语料库构建方法及系统 |
CN113191147A (zh) * | 2021-05-27 | 2021-07-30 | 中国人民解放军军事科学院评估论证研究中心 | 无监督的自动术语抽取方法、装置、设备和介质 |
CN113947099A (zh) * | 2021-07-05 | 2022-01-18 | 华北电力大学(保定) | 基于esprit-psa与lgbm的五相异步电动机转子断条数目高精度诊断方法 |
CN115270774A (zh) * | 2022-09-27 | 2022-11-01 | 吉奥时空信息技术股份有限公司 | 一种半监督学习的大数据关键词词典构建方法 |
CN116092672A (zh) * | 2023-03-21 | 2023-05-09 | 四川大学华西医院 | 谵妄识别装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110688836A (zh) | 基于监督学习的领域词典自动化构建方法 | |
CN110119765B (zh) | 一种基于Seq2seq框架的关键词提取方法 | |
CN108829801B (zh) | 一种基于文档级别注意力机制的事件触发词抽取方法 | |
CN110059311B (zh) | 一种面向司法文本数据的关键词提取方法及系统 | |
CN107193959B (zh) | 一种面向纯文本的企业实体分类方法 | |
CN109960724B (zh) | 一种基于tf-idf的文本摘要方法 | |
CN111125349A (zh) | 基于词频和语义的图模型文本摘要生成方法 | |
CN113011533A (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
CN107315738B (zh) | 一种文本信息的创新度评估方法 | |
CN113268995B (zh) | 中文学术关键词抽取方法、装置和存储介质 | |
CN108255813B (zh) | 一种基于词频-逆文档与crf的文本匹配方法 | |
CN107577671B (zh) | 一种基于多特征融合的主题词提取方法 | |
CN107180026B (zh) | 一种基于词嵌入语义映射的事件短语学习方法及装置 | |
CN108363691B (zh) | 一种用于电力95598工单的领域术语识别系统及方法 | |
CN115309872B (zh) | 一种基于Kmeans召回的多模型熵加权检索方法及系统 | |
CN111984782A (zh) | 藏文文本摘要生成方法和系统 | |
CN112069312A (zh) | 一种基于实体识别的文本分类方法及电子装置 | |
CN113836896A (zh) | 一种基于深度学习的专利文本摘要生成方法和装置 | |
CN115017903A (zh) | 文档层次结构联合全局局部信息抽取关键短语方法及系统 | |
CN114491062B (zh) | 一种融合知识图谱和主题模型的短文本分类方法 | |
Farhoodi et al. | N-gram based text classification for Persian newspaper corpus | |
CN106815209B (zh) | 一种维吾尔文农业技术术语识别方法 | |
CN111767733A (zh) | 一种基于统计分词的文献密级甄别方法 | |
CN111400495A (zh) | 一种基于模板特征的视频弹幕消费意图识别方法 | |
CN107729509B (zh) | 基于隐性高维分布式特征表示的篇章相似度判定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Hu Yupeng Inventor after: Feng Xiaobo Inventor after: Si Kai Inventor after: Huang Jing Inventor after: Huang Chongkai Inventor after: Huang Yun Inventor before: Hu Yupeng Inventor before: Si Kai Inventor before: Feng Xiaobo Inventor before: Huang Jing Inventor before: Huang Chongkai Inventor before: Huang Yun |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200114 |