CN104391852B - 一种建立关键词词库的方法和装置 - Google Patents
一种建立关键词词库的方法和装置 Download PDFInfo
- Publication number
- CN104391852B CN104391852B CN201410469628.6A CN201410469628A CN104391852B CN 104391852 B CN104391852 B CN 104391852B CN 201410469628 A CN201410469628 A CN 201410469628A CN 104391852 B CN104391852 B CN 104391852B
- Authority
- CN
- China
- Prior art keywords
- keyword
- project
- obtains
- dictionary
- semantic similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000012216 screening Methods 0.000 claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims description 23
- 230000011218 segmentation Effects 0.000 claims description 5
- 239000000284 extract Substances 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 16
- 238000011160 research Methods 0.000 description 9
- 238000007726 management method Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 238000004445 quantitative analysis Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005295 random walk Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
Abstract
Description
Claims (6)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410469628.6A CN104391852B (zh) | 2014-09-15 | 2014-09-15 | 一种建立关键词词库的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410469628.6A CN104391852B (zh) | 2014-09-15 | 2014-09-15 | 一种建立关键词词库的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104391852A CN104391852A (zh) | 2015-03-04 |
CN104391852B true CN104391852B (zh) | 2017-12-29 |
Family
ID=52609756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410469628.6A Active CN104391852B (zh) | 2014-09-15 | 2014-09-15 | 一种建立关键词词库的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104391852B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105404686B (zh) * | 2015-12-10 | 2018-08-31 | 湖南科技大学 | 一种基于地理特征层次分词的新闻事件地名地址匹配方法 |
CN106776536A (zh) * | 2016-11-21 | 2017-05-31 | 国家电网公司客户服务中心 | 一种供电服务客户满意度关键词库构建方法及装置 |
JP7030434B2 (ja) * | 2017-07-14 | 2022-03-07 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 翻訳方法、翻訳装置及び翻訳プログラム |
CN110750572A (zh) * | 2018-12-06 | 2020-02-04 | 国网河北省电力有限公司经济技术研究院 | 一种科技成果启发式评价的自适应方法和装置 |
CN110175268B (zh) * | 2019-04-19 | 2020-01-17 | 杭州电子科技大学 | 一种最长匹配资源映射方法 |
CN111612420A (zh) * | 2020-05-20 | 2020-09-01 | 江苏中睿联禾知识产权服务有限公司 | 一种科技项目种类筛选定项辅助系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102169495A (zh) * | 2011-04-11 | 2011-08-31 | 趣拿开曼群岛有限公司 | 行业词典生成方法及装置 |
CN103605665A (zh) * | 2013-10-24 | 2014-02-26 | 杭州电子科技大学 | 一种基于关键词的评审专家智能检索与推荐方法 |
-
2014
- 2014-09-15 CN CN201410469628.6A patent/CN104391852B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102169495A (zh) * | 2011-04-11 | 2011-08-31 | 趣拿开曼群岛有限公司 | 行业词典生成方法及装置 |
CN103605665A (zh) * | 2013-10-24 | 2014-02-26 | 杭州电子科技大学 | 一种基于关键词的评审专家智能检索与推荐方法 |
Non-Patent Citations (3)
Title |
---|
2006年知识管理领域关键词共现强度的聚类分析;周爱民;《现代情报》;20080525;第30页第1列第3段,第31-32页 * |
基于语义的中文文本关键词提取算法;王立霞等;《计算机工程》;20120105;第38卷(第1期);全文 * |
领域文本相似度计算方法研究;罗义兵;《中国优秀硕士学位论文全文数据库 信息科技辑》;20120315;第2012年卷(第03期);正文第8页第4段,第9页第4段,第33页,第34页第2,4段,图2.1,6.1 * |
Also Published As
Publication number | Publication date |
---|---|
CN104391852A (zh) | 2015-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104391852B (zh) | 一种建立关键词词库的方法和装置 | |
Hai et al. | Identifying features in opinion mining via intrinsic and extrinsic domain relevance | |
CN105468605B (zh) | 一种实体信息图谱生成方法及装置 | |
CN103927302B (zh) | 一种文本分类方法和系统 | |
CN105830064B (zh) | 情态生成装置以及计算机可读取记录介质 | |
CN109858018A (zh) | 一种面向威胁情报的实体识别方法及系统 | |
CN107153658A (zh) | 一种基于关键字加权算法的舆情热词发现方法 | |
CN102890698B (zh) | 微博话题标签自动化描述方法 | |
CN106570144A (zh) | 推荐信息的方法和装置 | |
CN109800310A (zh) | 一种基于结构化表达的电力运维文本分析方法 | |
CN103678670A (zh) | 一种微博热词与热点话题挖掘系统及方法 | |
CN104077407B (zh) | 一种智能数据搜索系统及方法 | |
CN104699766A (zh) | 一种融合词语关联关系和上下文语境推断的隐式属性挖掘方法 | |
CN107423444A (zh) | 热词词组提取方法和系统 | |
CN109376352B (zh) | 一种基于word2vec和语义相似度的专利文本建模方法 | |
CN101593200A (zh) | 基于关键词频度分析的中文网页分类方法 | |
CN110781679B (zh) | 一种基于关联语义链网络的新闻事件关键词挖掘方法 | |
CN108170666A (zh) | 一种基于tf-idf关键词提取的改进方法 | |
CN107679135A (zh) | 面向网络文本大数据的话题检测与跟踪方法、装置 | |
CN104199838B (zh) | 一种基于标签消歧的用户模型建构方法 | |
CN109947934A (zh) | 针对短文本的数据挖掘方法及系统 | |
CN109033132A (zh) | 利用知识图谱计算文本和主体相关度的方法以及装置 | |
CN106528768A (zh) | 一种咨询热点分析方法及装置 | |
CN102880631A (zh) | 一种基于双层分类模型的中文作者识别方法及其装置 | |
CN106202065A (zh) | 一种跨语言话题检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Chen Xi Inventor after: Peng Xiaobo Inventor after: Hou Dongliang Inventor after: Wang Jinghua Inventor after: Xing Kai Inventor after: Yang Jinfeng Inventor after: Zhang Meng Inventor after: Zhang Liping Inventor after: Gao Bing Inventor after: Wei Minglei Inventor after: Zhang Shujuan Inventor before: Chen Xi Inventor before: Wang Jinghua Inventor before: Xing Kai Inventor before: Yang Jinfeng Inventor before: Zhang Meng Inventor before: Zhang Liping |
|
CB03 | Change of inventor or designer information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |