CN112733928A - 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能算法 - Google Patents

一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能算法 Download PDF

Info

Publication number
CN112733928A
CN112733928A CN202110012346.3A CN202110012346A CN112733928A CN 112733928 A CN112733928 A CN 112733928A CN 202110012346 A CN202110012346 A CN 202110012346A CN 112733928 A CN112733928 A CN 112733928A
Authority
CN
China
Prior art keywords
evaluation
index
splitting
standard
city
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110012346.3A
Other languages
English (en)
Other versions
CN112733928B (zh
Inventor
王雁南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui E Test Information Technology Co ltd
Original Assignee
Anhui E Test Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui E Test Information Technology Co ltd filed Critical Anhui E Test Information Technology Co ltd
Priority to CN202110012346.3A priority Critical patent/CN112733928B/zh
Publication of CN112733928A publication Critical patent/CN112733928A/zh
Application granted granted Critical
Publication of CN112733928B publication Critical patent/CN112733928B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能算法,包括如下步骤;S1、收集归纳尽可能多的文明城市创建测评标准与拆分后的测评采集指标,建立拆解后指标语料库K1和未拆解指标语料库K2;S2、对语料库K1、K2收集的测评标准分别按行存储,每行是一个标准,用中文分词工具jieba进行分词,剔除停用词建立停用词库等操作,得到每个测评标准的关键词;S3、将拆解后指标的分词结果利用one‑hotencoder的形式传入Word2vec模型中,然后利用计算机语言进行模型训练;S4、将训练好的模型加载进内存中。本发明可以帮助正在参与文明城市创建的城市快速有效智能地拆解创城标准,提高效率,实现精准数据化的采集指标匹配。

Description

一种基于文明城市测评项目对测评标准进行标准化拆分匹配 的智能算法
技术领域
本发明涉及文明城市建设技术领域,尤其涉及一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能算法。
背景技术
对创建文明城市的测评指标进行拆解,不仅需要人力和时间,同时需要用到长期积累的经验和文明城市创建的知识。
将测评标准拆解成采集指标是创城测评采集数据标准化的基础。创城测评指标,对并不了解创城知识和缺少创城经验的人来说,需要浪费大量的时间对这些标准进行拆解和处理,面对繁杂多变的测评标准,拆解标准是一个耗费精力的事情。目前,还没有一种高效的方法将创城测评标准与拆解后的采集指标进行对接匹配的只能算法。
基于此,本发明提出一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能算法。
发明内容
本发明的目的在于将创建文明城市考核中各责任单位的任务量进行量化,提供一种基于文明城市创建项目对责任单位任务量预估的统计计算方法,可以高效地将测评标准与采集指标进行对接匹配。
为了实现上述目的,本发明采用了如下技术方案:
一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能算法,包括如下步骤;
S1、收集归纳尽可能多的文明城市创建测评标准与拆分后的测评采集指标,建立拆解后指标语料库K1和未拆解指标语料库K2
S2、对语料库K1、K2收集的测评标准分别按行存储,每行是一个标准,用中文分词工具jieba进行分词,剔除停用词建立停用词库等操作,得到每个测评标准的关键词;
S3、将拆解后指标的分词结果利用one-hot encoder的形式传入Word2vec模型中,然后利用计算机语言进行模型训练;
S4、将训练好的模型加载进内存中;
S5、输入需要拆解的测评标准X,利用K2语料库形成的停用词库等对新输入的指标进行关键词提取,并传入训练好的模型;
S6、根据训练好的模型,可以得到与新输入指标相关的拆解指标Xi
S7、为使得拆解的指标更精确,利用余弦相似度计算公式:
Figure BDA0002885630180000021
计算模型输出的相关拆解后的测评标准Xi与其本身的相似度(按降序排列);
S8、根据相似度的大小,选取相似度高的前N个拆解好的指标作为新输入指标X的拆解指标。
优选地,在所述步骤S2中,测评标准按行存储,每行是一个标准,使每个标准都有各自对应的拆分关键词。
优选地,在所述步骤S5中,输入需要拆解的测评标准不仅可以单个输入,也可分行输入多个测评标准进行拆分。
优选地,在所述步骤S7中,输出的相关拆解后的测评标准Xi与其本身的相似度按降序排列。
本发明具有以下有益效果;
1、本发明可以帮助正在参与文明城市创建的城市快速有效智能地拆解创城标准,提高效率,实现精准数据化的采集指标匹配。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的,并不表示是唯一的实施方式。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能算法,包括如下步骤;
S1、收集归纳尽可能多的文明城市创建测评标准与拆分后的测评采集指标,建立拆解后指标语料库K1和未拆解指标语料库K2
S2、对语料库K1、K2收集的测评标准分别按行存储,每行是一个标准,用中文分词工具jieba进行分词,剔除停用词建立停用词库等操作,得到每个测评标准的关键词;
S3、将拆解后指标的分词结果利用one-hot encoder的形式传入Word2vec模型中,然后利用计算机语言进行模型训练;
S4、将训练好的模型加载进内存中;
S5、输入需要拆解的测评标准X,利用K2语料库形成的停用词库等对新输入的指标进行关键词提取,并传入训练好的模型;
S6、根据训练好的模型,可以得到与新输入指标相关的拆解指标Xi
S7、为使得拆解的指标更精确,利用余弦相似度计算公式:
Figure BDA0002885630180000041
计算模型输出的相关拆解后的测评标准Xi与其本身的相似度(按降序排列);
S8、根据相似度的大小,选取相似度高的前N个拆解好的指标作为新输入指标X的拆解指标。
在步骤S2中,测评标准按行存储,每行是一个标准,使每个标准都有各自对应的拆分关键词。
在步骤S5中,输入需要拆解的测评标准不仅可以单个输入,也可分行输入多个测评标准进行拆分。
在步骤S7中,输出的相关拆解后的测评标准Xi与其本身的相似度按降序排列。
在步骤S8中,输入指标X的拆解指标的测评标准为“环境整洁有序,无乱扔垃圾、随地吐痰现象”,则计算相似度得出与之相近的TOP2个拆解的指标为“有乱扔垃圾_例”、“有随地吐痰_例”
本发明中,可以帮助正在参与文明城市创建的城市快速有效智能地拆解创城标准,提高效率,实现精准数据化的采集指标匹配。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (4)

1.一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能算法,其特征在于,包括如下步骤;
S1、收集归纳尽可能多的文明城市创建测评标准与拆分后的测评采集指标,建立拆解后指标语料库K1和未拆解指标语料库K2
S2、对语料库K1、K2收集的测评标准分别按行存储,每行是一个标准,用中文分词工具jieba进行分词,剔除停用词建立停用词库等操作,得到每个测评标准的关键词;
S3、将拆解后指标的分词结果利用one-hot encoder的形式传入Word2vec模型中,然后利用计算机语言进行模型训练;
S4、将训练好的模型加载进内存中;
S5、输入需要拆解的测评标准X,利用K2语料库形成的停用词库等对新输入的指标进行关键词提取,并传入训练好的模型;
S6、根据训练好的模型,可以得到与新输入指标相关的拆解指标Xi
S7、为使得拆解的指标更精确,利用余弦相似度计算公式:
Figure FDA0002885630170000011
计算模型输出的相关拆解后的测评标准Xi与其本身的相似度(按降序排列);
S8、根据相似度的大小,选取相似度高的前N个拆解好的指标作为新输入指标X的拆解指标。
2.根据权利要求1所述的一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能算法,其特征在于,在所述步骤S2中,测评标准按行存储,每行是一个标准,使每个标准都有各自对应的拆分关键词。
3.根据权利要求1所述的一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能算法,其特征在于,在所述步骤S5中,输入需要拆解的测评标准不仅可以单个输入,也可分行输入多个测评标准进行拆分。
4.根据权利要求1所述的一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能算法,其特征在于,在所述步骤S7中,输出的相关拆解后的测评标准Xi与其本身的相似度按降序排列。
CN202110012346.3A 2021-01-06 2021-01-06 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法 Active CN112733928B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110012346.3A CN112733928B (zh) 2021-01-06 2021-01-06 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110012346.3A CN112733928B (zh) 2021-01-06 2021-01-06 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法

Publications (2)

Publication Number Publication Date
CN112733928A true CN112733928A (zh) 2021-04-30
CN112733928B CN112733928B (zh) 2024-04-02

Family

ID=75590722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110012346.3A Active CN112733928B (zh) 2021-01-06 2021-01-06 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能方法

Country Status (1)

Country Link
CN (1) CN112733928B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485370A (zh) * 2016-11-03 2017-03-08 上海智臻智能网络科技股份有限公司 一种信息预测的方法和装置
CN108170853A (zh) * 2018-01-19 2018-06-15 广东惠禾科技发展有限公司 一种聊天语料自清洗方法、装置和用户终端
US10387568B1 (en) * 2016-09-19 2019-08-20 Amazon Technologies, Inc. Extracting keywords from a document
CN111143675A (zh) * 2019-12-23 2020-05-12 亿企赢网络科技有限公司 一种知识数据推送方法及相关装置
CN112035621A (zh) * 2020-09-03 2020-12-04 江苏经贸职业技术学院 一种基于统计学的企业名名称相似度检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10387568B1 (en) * 2016-09-19 2019-08-20 Amazon Technologies, Inc. Extracting keywords from a document
CN106485370A (zh) * 2016-11-03 2017-03-08 上海智臻智能网络科技股份有限公司 一种信息预测的方法和装置
CN108170853A (zh) * 2018-01-19 2018-06-15 广东惠禾科技发展有限公司 一种聊天语料自清洗方法、装置和用户终端
CN111143675A (zh) * 2019-12-23 2020-05-12 亿企赢网络科技有限公司 一种知识数据推送方法及相关装置
CN112035621A (zh) * 2020-09-03 2020-12-04 江苏经贸职业技术学院 一种基于统计学的企业名名称相似度检测方法

Also Published As

Publication number Publication date
CN112733928B (zh) 2024-04-02

Similar Documents

Publication Publication Date Title
CN105488024B (zh) 网页主题句的抽取方法及装置
CN107220237A (zh) 一种基于卷积神经网络的企业实体关系抽取的方法
CN106095737A (zh) 文档相似度计算方法及相似文档全网检索跟踪方法
CN105528437B (zh) 一种基于结构化文本知识提取的问答系统构建方法
CN105653706A (zh) 一种基于文献内容知识图谱的多层引文推荐方法
CN104199972A (zh) 一种基于深度学习的命名实体关系抽取与构建方法
CN104392006B (zh) 一种事件查询处理方法及装置
CN105653518A (zh) 一种基于微博数据的特定群体发现及扩充方法
CN104484380A (zh) 个性化搜索方法及装置
CN102722558A (zh) 一种为用户推荐提问的方法和装置
CN106528616B (zh) 一种人机交互过程中的语言纠错方法及系统
CN110209816A (zh) 基于对抗模仿学习的事件识别及分类方法、系统、装置
CN104598648B (zh) 一种微博用户交互式性别识别方法及装置
CN103049581A (zh) 一种基于一致性聚类的Web文本分类方法
CN104636407A (zh) 参数取值训练及搜索请求处理方法和装置
CN103714120B (zh) 一种从用户url访问记录中提取用户兴趣话题的系统
CN104657376A (zh) 基于节目关系的视频节目的搜索方法和装置
CN110347812B (zh) 一种面向司法文本的搜索排序方法及系统
CN106126590A (zh) 一种基于关键信息的无人机侦察视频检索方法
Sha et al. Matching user accounts across social networks based on users message
CN106685707A (zh) 一种分布式基础设施系统中的资产信息控制方法
CN109684460A (zh) 一种基于深度学习的负面网络舆情指数的计算方法及系统
CN104217026A (zh) 一种基于图模型的中文微博客倾向性检索方法
CN112733928A (zh) 一种基于文明城市测评项目对测评标准进行标准化拆分匹配的智能算法
CN110413985B (zh) 一种相关文本片段搜索方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant