CN112733928B - 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法 - Google Patents
一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法 Download PDFInfo
- Publication number
- CN112733928B CN112733928B CN202110012346.3A CN202110012346A CN112733928B CN 112733928 B CN112733928 B CN 112733928B CN 202110012346 A CN202110012346 A CN 202110012346A CN 112733928 B CN112733928 B CN 112733928B
- Authority
- CN
- China
- Prior art keywords
- evaluation
- indexes
- disassembled
- index
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 title claims abstract description 17
- 230000011218 segmentation Effects 0.000 claims abstract description 12
- 238000004364 calculation method Methods 0.000 description 5
- 206010036790 Productive cough Diseases 0.000 description 2
- 210000003802 sputum Anatomy 0.000 description 2
- 208000024794 sputum Diseases 0.000 description 2
- 102100033587 DNA topoisomerase 2-alpha Human genes 0.000 description 1
- 101000801505 Homo sapiens DNA topoisomerase 2-alpha Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Stored Programmes (AREA)
Abstract
本发明公开了一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法,包括如下步骤;S1、收集归纳尽可能多的文明城市创建测评标准与拆分后的测评采集指标,建立拆解后指标语料库K1和未拆解指标语料库K2;S2、对语料库K1、K2收集的测评标准分别按行存储,每行是一个标准,用中文分词工具jieba进行分词,剔除停用词建立停用词库等操作,得到每个测评标准的关键词;S3、将拆解后指标的分词结果利用one‑hot encoder的形式传入Word2vec模型中,然后利用计算机语言进行模型训练;S4、将训练好的模型加载进内存中。本发明可以帮助正在参与文明城市创建的城市快速有效智能地拆解创城标准,提高效率,实现精准数据化的采集指标匹配。
Description
技术领域
本发明涉及文明城市建设技术领域,尤其涉及一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法。
背景技术
对创建文明城市的测评指标进行拆解,不仅需要人力和时间,同时需要用到长期积累的经验和文明城市创建的知识。
将测评标准拆解成采集指标是创城测评采集数据标准化的基础。创城测评指标,对并不了解创城知识和缺少创城经验的人来说,需要浪费大量的时间对这些标准进行拆解和处理,面对繁杂多变的测评标准,拆解标准是一个耗费精力的事情。目前,还没有一种高效的方法将创城测评标准与拆解后的采集指标进行对接匹配的智能方法。
基于此,本发明提出一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法。
发明内容
本发明的目的在于将创建文明城市考核中各责任单位的任务量进行量化,提供一种基于文明城市创建项目对责任单位任务量预估的统计计算方法,可以高效地将测评标准与采集指标进行对接匹配。
为了实现上述目的,本发明采用了如下技术方案:
一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法,包括如下步骤;
S1、收集归纳尽可能多的文明城市创建测评标准与拆分后的测评采集指标,建立拆解后指标语料库K1和未拆解指标语料库K2;
S2、对语料库K1、K2收集的测评标准分别按行存储,每行是一个标准,用中文分词工具jieba进行分词,剔除停用词建立停用词库等操作,得到每个测评标准的关键词;
S3、将拆解后指标的分词结果利用one-hot encoder的形式传入Word2vec模型中,然后利用计算机语言进行模型训练;
S4、将训练好的模型加载进内存中;
S5、输入需要拆解的测评标准X,利用K2语料库形成的停用词库等对新输入的指标进行关键词提取,并传入训练好的模型;
S6、根据训练好的模型,可以得到与新输入指标相关的拆解指标Xi;
S7、为使得拆解的指标更精确,利用余弦相似度计算公式:计算模型输出的相关拆解后的测评标准Xi与其本身的相似度按降序排列;
S8、根据相似度的大小,选取N个拆解好的指标作为新输入指标X的拆解指标。
优选地,在所述步骤S2中,测评标准按行存储,每行是一个标准,使每个标准都有各自对应的拆分关键词。
优选地,在所述步骤S5中,输入需要拆解的测评标准不仅可以单个输入,也可分行输入多个测评标准进行拆分。
本发明具有以下有益效果;
1、本发明可以帮助正在参与文明城市创建的城市快速有效智能地拆解创城标准,提高效率,实现精准数据化的采集指标匹配。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的,并不表示是唯一的实施方式。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法,包括如下步骤;
S1、收集归纳尽可能多的文明城市创建测评标准与拆分后的测评采集指标,建立拆解后指标语料库K1和未拆解指标语料库K2;
S2、对语料库K1、K2收集的测评标准分别按行存储,每行是一个标准,用中文分词工具jieba进行分词,剔除停用词建立停用词库等操作,得到每个测评标准的关键词;
S3、将拆解后指标的分词结果利用one-hot encoder的形式传入Word2vec模型中,然后利用计算机语言进行模型训练;
S4、将训练好的模型加载进内存中;
S5、输入需要拆解的测评标准X,利用K2语料库形成的停用词库等对新输入的指标进行关键词提取,并传入训练好的模型;
S6、根据训练好的模型,可以得到与新输入指标相关的拆解指标Xi;
S7、为使得拆解的指标更精确,利用余弦相似度计算公式:计算模型输出的相关拆解后的测评标准Xi与其本身的相似度按降序排列;
S8、根据相似度的大小,选取N个拆解好的指标作为新输入指标X的拆解指标。
在步骤S2中,测评标准按行存储,每行是一个标准,使每个标准都有各自对应的拆分关键词。
在步骤S5中,输入需要拆解的测评标准不仅可以单个输入,也可分行输入多个测评标准进行拆分。
在步骤S8中,输入指标X的拆解指标的测评标准为“环境整洁有序,无乱扔垃圾、随地吐痰现象”,则计算相似度得出与之相近的TOP2个拆解的指标为“有乱扔垃圾例”、“有随地吐痰例”
本发明中,可以帮助正在参与文明城市创建的城市快速有效智能地拆解创城标准,提高效率,实现精准数据化的采集指标匹配。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (2)
1.一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法,其特征在于,包括如下步骤;
S1、收集归纳文明城市创建测评标准与拆分后的测评采集指标,建立拆解后指标语料库K1和未拆解指标语料库K2;
S2、对语料库K1、K2收集的测评标准分别按行存储,每行是一个标准,用中文分词工具jieba进行分词,剔除停用词建立停用词库操作,得到每个测评标准的关键词;
S3、将拆解后指标的分词结果利用one-hot encoder的形式传入Word2vec模型中,然后利用计算机语言进行模型训练;
S4、将训练好的模型加载进内存中;
S5、输入需要拆解的测评标准X,利用K2语料库形成的停用词库对新输入的指标进行关键词提取,并传入训练好的模型;
S6、根据训练好的模型,可以得到与新输入指标相关的拆解指标Xi;
S7、为使得拆解的指标更精确,计算模型输出的相关拆解后的测评标准Xi与其本身的相似度按降序排列;
S8、根据相似度的大小,选取N个拆解好的指标作为新输入指标X的拆解指标。
2.根据权利要求1所述的一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法,其特征在于,在所述步骤S5中,输入需要拆解的测评标准不仅可以单个输入,也可分行输入多个测评标准进行拆分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110012346.3A CN112733928B (zh) | 2021-01-06 | 2021-01-06 | 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110012346.3A CN112733928B (zh) | 2021-01-06 | 2021-01-06 | 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112733928A CN112733928A (zh) | 2021-04-30 |
CN112733928B true CN112733928B (zh) | 2024-04-02 |
Family
ID=75590722
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110012346.3A Active CN112733928B (zh) | 2021-01-06 | 2021-01-06 | 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112733928B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106485370A (zh) * | 2016-11-03 | 2017-03-08 | 上海智臻智能网络科技股份有限公司 | 一种信息预测的方法和装置 |
CN108170853A (zh) * | 2018-01-19 | 2018-06-15 | 广东惠禾科技发展有限公司 | 一种聊天语料自清洗方法、装置和用户终端 |
US10387568B1 (en) * | 2016-09-19 | 2019-08-20 | Amazon Technologies, Inc. | Extracting keywords from a document |
CN111143675A (zh) * | 2019-12-23 | 2020-05-12 | 亿企赢网络科技有限公司 | 一种知识数据推送方法及相关装置 |
CN112035621A (zh) * | 2020-09-03 | 2020-12-04 | 江苏经贸职业技术学院 | 一种基于统计学的企业名名称相似度检测方法 |
-
2021
- 2021-01-06 CN CN202110012346.3A patent/CN112733928B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10387568B1 (en) * | 2016-09-19 | 2019-08-20 | Amazon Technologies, Inc. | Extracting keywords from a document |
CN106485370A (zh) * | 2016-11-03 | 2017-03-08 | 上海智臻智能网络科技股份有限公司 | 一种信息预测的方法和装置 |
CN108170853A (zh) * | 2018-01-19 | 2018-06-15 | 广东惠禾科技发展有限公司 | 一种聊天语料自清洗方法、装置和用户终端 |
CN111143675A (zh) * | 2019-12-23 | 2020-05-12 | 亿企赢网络科技有限公司 | 一种知识数据推送方法及相关装置 |
CN112035621A (zh) * | 2020-09-03 | 2020-12-04 | 江苏经贸职业技术学院 | 一种基于统计学的企业名名称相似度检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112733928A (zh) | 2021-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106980692B (zh) | 一种基于微博特定事件的影响力计算方法 | |
CN105488024B (zh) | 网页主题句的抽取方法及装置 | |
CN106095737A (zh) | 文档相似度计算方法及相似文档全网检索跟踪方法 | |
CN103729402A (zh) | 一种基于图书目录的知识图谱的构建方法 | |
CN105279288A (zh) | 一种基于深度神经网络的在线内容推荐方法 | |
CN100592332C (zh) | 一种基于案例树进行案例推理的装置及方法 | |
CN104933622A (zh) | 一种基于用户和微博主题的微博流行度预测方法及系统 | |
CN104484380A (zh) | 个性化搜索方法及装置 | |
CN101079033A (zh) | 一种综合搜索结果的排序系统及方法 | |
CN102682120B (zh) | 一种网络评论精华文本的获取方法和装置 | |
CN105893585B (zh) | 一种结合标签数据的二部图模型学术论文推荐方法 | |
CN106296286A (zh) | 广告点击率的预估方法和预估装置 | |
CN103399951A (zh) | 一种基于异构图具有自反馈特性的半监督图像重排序方法 | |
CN101980210A (zh) | 一种标的词分类分级方法及系统 | |
CN101339553A (zh) | 面向海量数据近似快速聚类和索引方法 | |
CN103617203B (zh) | 基于查询驱动的蛋白质-配体绑定位点预测方法 | |
CN113806630B (zh) | 基于注意力的多视角特征融合跨域推荐方法及装置 | |
CN104199838B (zh) | 一种基于标签消歧的用户模型建构方法 | |
CN103761286B (zh) | 一种基于用户兴趣的服务资源检索方法 | |
CN104090936A (zh) | 一种基于超图排序的新闻推荐方法 | |
CN105139031A (zh) | 一种基于子空间聚类的数据处理方法 | |
CN109949174A (zh) | 一种异构社交网络用户实体锚链接识别方法 | |
CN108595411B (zh) | 一种同主题文本集合中多文本摘要获取方法 | |
CN1959671A (zh) | 基于文档结构的文档相似性度量方法 | |
Sha et al. | Matching user accounts across social networks based on users message |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |