CN112733928B - 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法 - Google Patents

一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法 Download PDF

Info

Publication number
CN112733928B
CN112733928B CN202110012346.3A CN202110012346A CN112733928B CN 112733928 B CN112733928 B CN 112733928B CN 202110012346 A CN202110012346 A CN 202110012346A CN 112733928 B CN112733928 B CN 112733928B
Authority
CN
China
Prior art keywords
evaluation
indexes
disassembled
index
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110012346.3A
Other languages
English (en)
Other versions
CN112733928A (zh
Inventor
王雁南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui E Test Information Technology Co ltd
Original Assignee
Anhui E Test Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui E Test Information Technology Co ltd filed Critical Anhui E Test Information Technology Co ltd
Priority to CN202110012346.3A priority Critical patent/CN112733928B/zh
Publication of CN112733928A publication Critical patent/CN112733928A/zh
Application granted granted Critical
Publication of CN112733928B publication Critical patent/CN112733928B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法,包括如下步骤;S1、收集归纳尽可能多的文明城市创建测评标准与拆分后的测评采集指标,建立拆解后指标语料库K1和未拆解指标语料库K2;S2、对语料库K1、K2收集的测评标准分别按行存储,每行是一个标准,用中文分词工具jieba进行分词,剔除停用词建立停用词库等操作,得到每个测评标准的关键词;S3、将拆解后指标的分词结果利用one‑hot encoder的形式传入Word2vec模型中,然后利用计算机语言进行模型训练;S4、将训练好的模型加载进内存中。本发明可以帮助正在参与文明城市创建的城市快速有效智能地拆解创城标准,提高效率,实现精准数据化的采集指标匹配。

Description

一种基于文明城市测评项目对测评标准进行标准化拆分匹配 的智能方法
技术领域
本发明涉及文明城市建设技术领域,尤其涉及一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法。
背景技术
对创建文明城市的测评指标进行拆解,不仅需要人力和时间,同时需要用到长期积累的经验和文明城市创建的知识。
将测评标准拆解成采集指标是创城测评采集数据标准化的基础。创城测评指标,对并不了解创城知识和缺少创城经验的人来说,需要浪费大量的时间对这些标准进行拆解和处理,面对繁杂多变的测评标准,拆解标准是一个耗费精力的事情。目前,还没有一种高效的方法将创城测评标准与拆解后的采集指标进行对接匹配的智能方法。
基于此,本发明提出一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法。
发明内容
本发明的目的在于将创建文明城市考核中各责任单位的任务量进行量化,提供一种基于文明城市创建项目对责任单位任务量预估的统计计算方法,可以高效地将测评标准与采集指标进行对接匹配。
为了实现上述目的,本发明采用了如下技术方案:
一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法,包括如下步骤;
S1、收集归纳尽可能多的文明城市创建测评标准与拆分后的测评采集指标,建立拆解后指标语料库K1和未拆解指标语料库K2
S2、对语料库K1、K2收集的测评标准分别按行存储,每行是一个标准,用中文分词工具jieba进行分词,剔除停用词建立停用词库等操作,得到每个测评标准的关键词;
S3、将拆解后指标的分词结果利用one-hot encoder的形式传入Word2vec模型中,然后利用计算机语言进行模型训练;
S4、将训练好的模型加载进内存中;
S5、输入需要拆解的测评标准X,利用K2语料库形成的停用词库等对新输入的指标进行关键词提取,并传入训练好的模型;
S6、根据训练好的模型,可以得到与新输入指标相关的拆解指标Xi
S7、为使得拆解的指标更精确,利用余弦相似度计算公式:计算模型输出的相关拆解后的测评标准Xi与其本身的相似度按降序排列;
S8、根据相似度的大小,选取N个拆解好的指标作为新输入指标X的拆解指标。
优选地,在所述步骤S2中,测评标准按行存储,每行是一个标准,使每个标准都有各自对应的拆分关键词。
优选地,在所述步骤S5中,输入需要拆解的测评标准不仅可以单个输入,也可分行输入多个测评标准进行拆分。
本发明具有以下有益效果;
1、本发明可以帮助正在参与文明城市创建的城市快速有效智能地拆解创城标准,提高效率,实现精准数据化的采集指标匹配。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的,并不表示是唯一的实施方式。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法,包括如下步骤;
S1、收集归纳尽可能多的文明城市创建测评标准与拆分后的测评采集指标,建立拆解后指标语料库K1和未拆解指标语料库K2
S2、对语料库K1、K2收集的测评标准分别按行存储,每行是一个标准,用中文分词工具jieba进行分词,剔除停用词建立停用词库等操作,得到每个测评标准的关键词;
S3、将拆解后指标的分词结果利用one-hot encoder的形式传入Word2vec模型中,然后利用计算机语言进行模型训练;
S4、将训练好的模型加载进内存中;
S5、输入需要拆解的测评标准X,利用K2语料库形成的停用词库等对新输入的指标进行关键词提取,并传入训练好的模型;
S6、根据训练好的模型,可以得到与新输入指标相关的拆解指标Xi
S7、为使得拆解的指标更精确,利用余弦相似度计算公式:计算模型输出的相关拆解后的测评标准Xi与其本身的相似度按降序排列;
S8、根据相似度的大小,选取N个拆解好的指标作为新输入指标X的拆解指标。
在步骤S2中,测评标准按行存储,每行是一个标准,使每个标准都有各自对应的拆分关键词。
在步骤S5中,输入需要拆解的测评标准不仅可以单个输入,也可分行输入多个测评标准进行拆分。
在步骤S8中,输入指标X的拆解指标的测评标准为“环境整洁有序,无乱扔垃圾、随地吐痰现象”,则计算相似度得出与之相近的TOP2个拆解的指标为“有乱扔垃圾例”、“有随地吐痰例”
本发明中,可以帮助正在参与文明城市创建的城市快速有效智能地拆解创城标准,提高效率,实现精准数据化的采集指标匹配。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (2)

1.一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法,其特征在于,包括如下步骤;
S1、收集归纳文明城市创建测评标准与拆分后的测评采集指标,建立拆解后指标语料库K1和未拆解指标语料库K2
S2、对语料库K1、K2收集的测评标准分别按行存储,每行是一个标准,用中文分词工具jieba进行分词,剔除停用词建立停用词库操作,得到每个测评标准的关键词;
S3、将拆解后指标的分词结果利用one-hot encoder的形式传入Word2vec模型中,然后利用计算机语言进行模型训练;
S4、将训练好的模型加载进内存中;
S5、输入需要拆解的测评标准X,利用K2语料库形成的停用词库对新输入的指标进行关键词提取,并传入训练好的模型;
S6、根据训练好的模型,可以得到与新输入指标相关的拆解指标Xi
S7、为使得拆解的指标更精确,计算模型输出的相关拆解后的测评标准Xi与其本身的相似度按降序排列;
S8、根据相似度的大小,选取N个拆解好的指标作为新输入指标X的拆解指标。
2.根据权利要求1所述的一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法,其特征在于,在所述步骤S5中,输入需要拆解的测评标准不仅可以单个输入,也可分行输入多个测评标准进行拆分。
CN202110012346.3A 2021-01-06 2021-01-06 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法 Active CN112733928B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110012346.3A CN112733928B (zh) 2021-01-06 2021-01-06 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110012346.3A CN112733928B (zh) 2021-01-06 2021-01-06 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法

Publications (2)

Publication Number Publication Date
CN112733928A CN112733928A (zh) 2021-04-30
CN112733928B true CN112733928B (zh) 2024-04-02

Family

ID=75590722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110012346.3A Active CN112733928B (zh) 2021-01-06 2021-01-06 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法

Country Status (1)

Country Link
CN (1) CN112733928B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485370A (zh) * 2016-11-03 2017-03-08 上海智臻智能网络科技股份有限公司 一种信息预测的方法和装置
CN108170853A (zh) * 2018-01-19 2018-06-15 广东惠禾科技发展有限公司 一种聊天语料自清洗方法、装置和用户终端
US10387568B1 (en) * 2016-09-19 2019-08-20 Amazon Technologies, Inc. Extracting keywords from a document
CN111143675A (zh) * 2019-12-23 2020-05-12 亿企赢网络科技有限公司 一种知识数据推送方法及相关装置
CN112035621A (zh) * 2020-09-03 2020-12-04 江苏经贸职业技术学院 一种基于统计学的企业名名称相似度检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10387568B1 (en) * 2016-09-19 2019-08-20 Amazon Technologies, Inc. Extracting keywords from a document
CN106485370A (zh) * 2016-11-03 2017-03-08 上海智臻智能网络科技股份有限公司 一种信息预测的方法和装置
CN108170853A (zh) * 2018-01-19 2018-06-15 广东惠禾科技发展有限公司 一种聊天语料自清洗方法、装置和用户终端
CN111143675A (zh) * 2019-12-23 2020-05-12 亿企赢网络科技有限公司 一种知识数据推送方法及相关装置
CN112035621A (zh) * 2020-09-03 2020-12-04 江苏经贸职业技术学院 一种基于统计学的企业名名称相似度检测方法

Also Published As

Publication number Publication date
CN112733928A (zh) 2021-04-30

Similar Documents

Publication Publication Date Title
CN106980692B (zh) 一种基于微博特定事件的影响力计算方法
CN105488024B (zh) 网页主题句的抽取方法及装置
CN106095737A (zh) 文档相似度计算方法及相似文档全网检索跟踪方法
CN103729402A (zh) 一种基于图书目录的知识图谱的构建方法
CN105279288A (zh) 一种基于深度神经网络的在线内容推荐方法
CN100592332C (zh) 一种基于案例树进行案例推理的装置及方法
CN104933622A (zh) 一种基于用户和微博主题的微博流行度预测方法及系统
CN104484380A (zh) 个性化搜索方法及装置
CN101079033A (zh) 一种综合搜索结果的排序系统及方法
CN102682120B (zh) 一种网络评论精华文本的获取方法和装置
CN105893585B (zh) 一种结合标签数据的二部图模型学术论文推荐方法
CN106296286A (zh) 广告点击率的预估方法和预估装置
CN103399951A (zh) 一种基于异构图具有自反馈特性的半监督图像重排序方法
CN101980210A (zh) 一种标的词分类分级方法及系统
CN101339553A (zh) 面向海量数据近似快速聚类和索引方法
CN103617203B (zh) 基于查询驱动的蛋白质-配体绑定位点预测方法
CN113806630B (zh) 基于注意力的多视角特征融合跨域推荐方法及装置
CN104199838B (zh) 一种基于标签消歧的用户模型建构方法
CN103761286B (zh) 一种基于用户兴趣的服务资源检索方法
CN104090936A (zh) 一种基于超图排序的新闻推荐方法
CN105139031A (zh) 一种基于子空间聚类的数据处理方法
CN109949174A (zh) 一种异构社交网络用户实体锚链接识别方法
CN108595411B (zh) 一种同主题文本集合中多文本摘要获取方法
CN1959671A (zh) 基于文档结构的文档相似性度量方法
Sha et al. Matching user accounts across social networks based on users message

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant