CN113672599B - 政务信息化项目建设管理的可视化辅助决策方法 - Google Patents
政务信息化项目建设管理的可视化辅助决策方法 Download PDFInfo
- Publication number
- CN113672599B CN113672599B CN202011062926.5A CN202011062926A CN113672599B CN 113672599 B CN113672599 B CN 113672599B CN 202011062926 A CN202011062926 A CN 202011062926A CN 113672599 B CN113672599 B CN 113672599B
- Authority
- CN
- China
- Prior art keywords
- government
- data
- function
- knowledge
- subsystem
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000000007 visual effect Effects 0.000 title claims abstract description 22
- 238000009430 construction management Methods 0.000 title claims abstract description 14
- 238000013499 data model Methods 0.000 claims abstract description 13
- 238000012800 visualization Methods 0.000 claims abstract description 11
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 4
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 3
- 230000006870 function Effects 0.000 claims description 151
- 238000010276 construction Methods 0.000 claims description 51
- 239000013598 vector Substances 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 18
- 238000011156 evaluation Methods 0.000 claims description 15
- 238000007726 management method Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 239000000463 material Substances 0.000 claims description 6
- 230000001502 supplementing effect Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000002407 reforming Methods 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims description 2
- 230000010354 integration Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000007794 visualization technique Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 239000003637 basic solution Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012482 interaction analysis Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法,包括以下步骤:电子政务领域本体数据模型的构建:以七步法和循环获取法为基础,实现双向本体建模;建立电子政务领域知识图谱:对结构化数据进行整合,对半结构化数据和非结构化数据进行知识抽取和知识扩充,得到初步知识表示后,利用已有知识进行实体链接,得到标准知识表示,利用标准知识修订步骤一的数据模型,得到实例和实例之间的关系,将此规范后得到标准三元组数据,利用标准三元组数据创建电子政务领域知识图谱;以电子政务领域知识图谱为基础,将知识推理与可视化相结合,从已有信息中推理深层信息以可视化的方式呈现,辅助政务信息化项目建设管理。
Description
技术领域
本发明涉及公共管理技术领域,特别是涉及一种通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法。
背景技术
随着社会信息化的普及,政府信息化建设规模不断扩大。如何逐步减少其中大量存在的“信息孤岛”建设就成为降低财政支出、提高建设绩效的关键问题,而有效提高项目实施前的评价科学性问题就变得十分重要。
发明内容
本发明的目的是针对现有电子政务项目中存在的重复投资、重复建设的问题,而提供的一种通过基于领域知识图谱进行知识关联推理与结果可视化以支持电子政务项目管理的辅助决策方法。
为实现本发明的目的所采用的技术方案是:
基于领域知识图谱进行知识关联推理与结果可视化以支持电子政务项目管理的辅助决策方法,包括以下步骤:
步骤一,电子政务领域本体数据模型的构建:以七步法和循环获取法为基础,利用七步法创建实例后,采用本体评估迭代至七步法前端的方式,实现双向本体建模;
步骤二,建立电子政务领域知识图谱:
对结构化数据进行整合,对半结构化数据和非结构化数据进行知识抽取和知识扩充,得到初步知识表示后,利用已有知识进行实体链接,得到标准知识表示,利用标准知识修订步骤一的数据模型,得到实例和实例之间的关系,将此规范后得到标准三元组数据,利用标准三元组数据创建电子政务领域知识图谱;
步骤三,以电子政务领域知识图谱为基础,将知识推理与可视化相结合,从已有信息中推理深层信息以可视化的方式呈现,辅助政务信息化项目建设管理。
在上述技术方案中,所述步骤一中,电子政务领域本体数据模型的构建方法如下:
步骤1,定义本体概念:
政府部门类:省市级政府下属的部门;
政务职能类:省市级政府下属部门的政务职能;
电子政务系统类:政府部门申报、建设的各种电子政务系统;
数据资源类:电子政务系统中采集、调用的数据资源;
主题类:为了表示政务系统对于职能履行的细节性信息,增添主题类;
政务子职能类:政务子职能及所管理的对象与管理权责,政务子职能类为政务职能类的子类;
电子政务子系统类:电子政务系统包含的子系统与功能点描述,电子政务子系统类为电子政务系统类的子类;
步骤2,确定类属性:通过对每个类别的数据及对决策场景的分析,设置重要或者出现次数较多的属性:
政府部门类:下属部门ID,下属部门名称;
政务职能类:职能ID,职能名称;
电子政务系统类:主题权重,建设时间、升级时间、申报资金、审批资金;
数据资源类:数据名,数据描述,数据类型,数据大小,信息项,数据来源,分享类型;
主题类:主题词及主题权重;
政务子职能类:子职能名称、管理对象名称,管理权责描述;
电子政务子系统类:子系统名称,子系统描述,功能点名称,功能点描述;
步骤3,确定对象关系:
DUTY_OF包含职能:政府部门与政务职能之间的关系;
SYSTEM_OF包含系统:政府部门与电子政务系统之间的关系;
FUNCTION_OF包含子系统:电子政务系统和电子政务子系统之间的父子类关系;
BELONG_TO属于:政务职能和电子政务子系统之间的关系,政务子职能和电子政务子系统之间的关系;
SOURCE_OF包含数据资源:电子政务系统和数据资源之间的关系;
TIPIC_OF部门包含的主题:政府部门和主题之间的关系;
S_TIPIC_OF系统包含的主题:电子政务系统和主题之间的关系;
SUB_OF政务职能与政务子职能之间父子类关系;
步骤4,确定类的等级关系同步骤3确定对象间关系;
步骤5,创建实例:从结构化数据、半结构化数据以及非结构化数据中抽取知识,将得到的三元组数据归到建立的本体上,就是创建的实例;
步骤6,本体评估:专家经验人为干预进行本体评估;
步骤7,迭代,对缺漏的本体进行人为补充。
在上述技术方案中,所述步骤二中数据来源如下:
结构化数据来自政务信息化项目申报材料中可获取的信息,包括系统名称、子系统名、系统申报单位、申报时间、升级改造时间、所需数据资源、申报资金、历史相关投资信息;从省级网信部门的数据共享交换平台数据库中获取的申建部门的共享数据资源目录信息;
半结构化数据来自政府政务网站上抓取的信息,包括政府部门名称、权责清单;
非结构化数据是文本数据,来自政务信息系统建设申报材料中项目摘要文本中所抽取的核心内容。
在上述技术方案中,对结构化数据进行整合是是把电子政务系统相关数据和共享数据资源极性收集、整理、清洗,转换后形成一个新数据源;
对半结构化数据和非结构化数据进行处理时,采用基于集成模型的政务子职能命名实体识别方法实现知识抽取,利用基于职能语义的领域知识图谱关系抽取算法,结合政府职能与政务信息系统层次化的特点获取电子政务子系统与政务职能之间的关系,基于LDA主题模型的知识扩充进行半结构化数据的知识抽取。
在上述技术方案中,基于职能语义的领域知识图谱关系抽取算法是通过以下步骤实现的,电子政务系统的子系统依据功能进行定义和划分,基本可划分为“政务职能建设子系统”及“软件功能实现子系统”两类,子系统名称均为短文本且为多个词语的组合,根据词语在子系统中的表达意思的差异,又可将子系统名称中的描述词主要划分成子系统功能描述词、功能执行方式词、软件描述词、功能对象四类,子系统功能描述词:子系统名称中描述和软件实际功能相关的词语,功能执行方式词:实现某功能的方式;软件描述词:与软件概念相关词汇;功能对象:某功能所从属的部门;由于子系统功能描述词基本为名词及动名词,通过分词后的词性筛选,可从由多个词语组成的子系统名称中获取子系统功能描述部分,为了解决细粒度分词对子系统名称中政务含义的破坏,通过排列的方式极大程度的恢复出子系统名称中所有的潜在语义,利用两类子系统与政务职能之间语义相似度的差异及子系统的命名规律,提出基于职能语义的电子政务知识图谱的关系抽取算法,采用Directional Skip-Gram算法训练好大规模近义词词向量进行文本相似度的计算,最后对所有排列的结果进行词向量相似度的计算,选取对应相似度最高的职能词构成子系统及职能间的三元组数据。
在上述技术方案中,所述步骤二中,利用标准三元组数据创建电子政务领域知识图谱时,将标准三元组数据存入到Neo4j图数据库,利用Cypher语言对Neo4j图数据库执行CRUD操作,将这些三元组链接并存入图数据库Neo4j中,得到电子政务领域知识图谱。
在上述技术方案中,在步骤二中得到标准知识表示后进行知识推理,根据步骤一的数据模型和标准三元组数据,依据推理规则进行知识发现,即获取新的知识或者结论,再加入电子政务领域知识图谱;
知识推理采用基于TBox和ABox的推理机制,根据电子政务系统、电子政务子系统、政务职能和子职能之间的关系和类的从属关系,构建如下推理规则即可获取电子政务系统以及电子政务系统与政务职能之间的关系:
其中a为某政务职能变量,Duty_system(a,System)为某职能a及拥有该职能的所有电子政务系统之间的关系;由于Subduty和Duty及Subsystem和System是父子类关系,为了简化表示,所以这里用表示他们的SUB_OF和FUNCTION_OF关系;为所有职能a下的电子政务系统各职能上的系统数量统计;
在上述技术方案中,所述步骤三中,可视化内容包括重复系统饼状图、基于职能建设率、数据资源共享率及资金审批率的政务系统三维雷达图,基于职能建设率、数据资源共享率及资金审批率的政务系统三维散点图,反应政务部门关系的信息化网络关系图。
在上述技术方案中,构建重复系统饼状图时,
某电子政务系统i与另一电子政务系统j的重复率pi,j定义如下:
ti,j=wi.wj
其中,fi,j为系统i同j的重复职能子系统建设率,Fi,j为系统i中和系统j属于同一职能的子系统数量,Fi为系统i中所有用于职能建设的子系统数量,只选取用于职能建设的子系统进行分析,di,j为系统i同j的使用的数据资源重复率,Di,j为系统i中和系统j重复数据资源数量,Di为系统i所用的所有数据资源数量,ti,j为系统i同j的主题相似率,wi、wj分别为系统i和j的主题权重向量;
其中,System(i)为要进行比较的电子政务系统实体i,BELONG_TO(FUNCTION_OF(i,subsystem),duty).duty为电子政务系统i所拥有的政务职能,SIMILAR_DUTY(i,j).i为Fi,j;
Di,j可由下述推理规则得到:
其中,SOURCE_OF(i,sharingdata).sharingdata为电子政务系统i所拥有的数据资源,SIMILAR_SOURCE(i,j).i为Di,j;
wi、wj通过获取主题实体的属性即可得到。
在上述技术方案中,构建政务系统三维雷达图和三维散点图时,
Fduty为某电子政务系统中所包含的实现职能功能的子系统数量,Fall为某电子政务系统中所有的子系统数量;
利用电子政务领域知识图谱进行如下推理,可获得拥有职能-子系统关系的某系统w中的子系统,对其进行统计即可获得Fduty
Dshare表示该系统中和其他系统有共享关系的数据资源,Dall代表该系统中所有的数据资源;
基于知识图谱进行推理,可知某政务系统w中和其他系统拥有数据共享关系的数据资源,对该数据资源进行统计可知Dshare
其中,Ma为审批资金,Ms为申报资金,通过知识图谱中电子政务系统的属性即可获得Ma及Ms;
政务部门关系可视化时,定义各部门的主题可表示为Topic={T1,T2,T3...Tn}主题向量可用主题词表示为T={t1,t2,t3...tn},主题词的权重向量为W={w1,w2,w3...wn}
通过主题词和主题词的权重向量可得知两个部门间的主题相似度矩阵,主题相似度计算公式定义如下:
其中sT,T'为主题T和T'的相似度,similar(ti,t'j)为主题词之间的相似度,利用余弦相似度进行计算,公式如下:
将sT,T'设为网络关系图中的边的权重,就可以得到信息化网络关系图。
与现有技术相比,本发明的有益效果是:
1.电子政务领域知识图谱的创建清晰地定义了电子政务领域重要概念间已有的知识事实与关联,并为机器辅助决策奠定了基础,对于电子政务项目评价与管理的研究与新技术应用具有重要的基础支撑价值。
2.本发明的应用结果证明,应用该方案不仅可以大幅度节约财政的政务信息化建设投资,而且可以促进区域电子政务信息化建设向着规范化和科学化的水平大幅度进步。
3.本发明针对决策场景分别采用二维(柱形、饼状)、三维(雷达、散点、网络关系)的推理结果可视化方案,可以有效呈现出政府部门、政务职能、政务信息系统、政务数据资源间的复杂关联关系,大幅度提升了决策效率与决策科学性。
附图说明
图1是电子政务领域本体数据模型的构建方法流程图。
图2是电子政务领域本体建模图。
图3是电子政务领域知识图谱的构建方法流程图。
图4是数据源介绍图。
图5是集成模型图。
图6是基于职能语义的电子政务知识图谱的关系抽取算法流程图。
图7是电子政务领域知识图谱的截取部分示意图。
图8是基于知识推理的电子政务可视分析流程图。
图9是TBox和ABox上推理机制的逻辑语法。
图10是电子政务领域知识图谱的部分图。
图11是图10对应的echarts图。
图12是重复系统饼状图。
图13是政务系统“三维”雷达图。
图14是政务系统“三维”散点图。
图15是信息化网络关系图。
具体实施方式
以下结合具体实施实例对本发明作进一步详细说明。应当理解,此处所描述的具体实施实例仅仅用以解释本发明,并不用于限定本发明。
实施例1
通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法,包括以下步骤:
步骤一,电子政务领域本体数据模型的构建,如图1所示:
以七步法和循环获取法为基础,利用七步法创建实例后,采用本体评估迭代至七步法前端的方式,实现双向本体建模:
在七步法中,
①定义本体概念,如图2所示:
政府部门类(Department):省市级政府下属的部门。
政务职能类(Duty):省市级政府下属各部门的政务职能。
电子政务系统类(System):政府部门申报、建设的电子政务系统。
数据资源类(SharingData):电子政务系统中采集、调用的数据资源。
主题类(Topic):为了表示政务系统对于职能履行的细节性信息,增添主题类。
政务子职能类:政务职能所包含的子职能、管理的对象与管理权责(政务职能类的子类);
电子政务子系统类:电子政务系统包含的子系统与功能点描述(电子政务系统类的子类);
②确定类属性:通过对每个类别的数据及对决策场景的分析,设置重要或者出现次数较多的属性:
政府部门类:下属部门ID,下属部门名称;
政务职能类:职能ID,职能名称;
电子政务系统类:主题权重,建设时间、升级时间、申报资金、审批资金;
数据资源类:数据名,数据描述,数据类型,数据大小,信息项,数据来源,分享类型;
主题类:主题词及主题权重;
政务子职能类:子职能名称、管理对象名称,管理权责描述;
电子政务子系统类:子系统名称,子系统描述,功能点名称,功能点描述;
③确定对象关系:如图2所示,显示了电子政务领域本体及本体间关系
DUTY_OF(包含职能):政府部门与政务职能之间的关系;
SYSTEM_OF(包含系统):政府部门与电子政务系统之间的关系;
FUNCTION_OF(包含子系统):电子政务系统和电子政务子系统之间的父子类关系;
BELONG_TO(属于):政务职能和电子政务子系统之间的关系,政务子职能和电子政务子系统之间的关系;
SOURCE_OF(包含数据资源):电子政务系统和数据资源之间的关系。
TIPIC_OF(部门包含的主题):政府部门和主题之间的关系。
S_TIPIC_OF(系统包含的主题):电子政务系统和主题之间的关系。
SUB_OF政务职能与政务子职能之间父子类关系。
④确定类的等级关系同③确定对象间关系。
⑤创建实例:
从结构化数据、半结构化数据以及非结构化数据中抽取知识,将得到的三元组数据归到建立的本体上,就是创建的实例;
⑥本体评估:专家经验人为干预进行本体评估;
⑦迭代,对缺漏的本体进行人为补充。
步骤二:建立电子政务领域知识图谱,如图3所示,显示了本发明电子政务领域知识图谱的创建全过程:如图4所示,显示了本发明的数据来源,数据源支持与数据预处理
结构化数据来自:政务信息化项目申报材料中可获取的信息,包括系统名称、子系统名、系统申报单位、申报时间、升级改造时间、所需数据资源、申报资金、历史相关投资等信息;从省级网信部门的数据共享交换平台数据库中可获取申建部门的共享数据资源目录信息;
半结构化数据来自:政府政务网站上抓取的信息,主要包括政府部门名称、权责清单等;
非结构化数据是文本数据,主要来自政务信息系统建设申报材料中项目摘要文本中所抽取的核心内容。
S1,对结构化数据进行整合:是把在不同数据源的数据(此处为电子政务系统相关数据和共享数据资源)收集、整理、清洗,转换后形成一个新的数据源。
按照如下S2和S3对数据进行知识抽取:
S2,采用基于集成模型的政务子职能命名实体识别方法实现知识抽取,如图5所示的集成模型,显示了本发明中基于集成模型的政务子职能命名实体识别方法实现知识抽取的过程。
运用命名实体标注,在《国家政务服务平台服务事项基本目录与实施清单》的9大类政务职能定义(行政许可、行政处罚、行政强制、行政征收、行政给付、行政奖励、行政确认、行政裁决、行政检查)中抽取命名实体,并利用投票法集成四种常用的命名实体方法,如图5所示,X1为输入的半结构化数据,隐马尔可夫模型(HMM)、条件随机场(CRF)、BiLSTM、BiLSTM-CRF,结合职能描述的特点分别分析其对于政务子职能实体识别的效果用于实体识别,比其中的单一方法具有更好的结果。
S3,基于职能语义的电子政务知识图谱的关系抽取算法
基于职能语义的领域知识图谱关系抽取算法利用政府职能与政务信息系统层次化的特点获取电子政务子系统与政务职能之间的关系,并由此关系直接或间接建立起电子政务系统与政务职能之间的关系。算法利用政务子系统命名特征,以中文分词及DSG算法所预训练的词向量相似度为基础,融入排列思想解决细粒度分词所造成的语义缺失及歧义关系的问题,有效地抽取出了电子政务子系统与政务职能间的关系。
基于职能语义的电子政务知识图谱的关系抽取算法流程图如图6所示,电子政务系统的子系统依据功能进行定义和划分,基本可划分为“政务职能建设子系统”及“软件功能实现子系统”两类。子系统名称均为短文本且为多个词语的组合,根据词语在子系统中的表达意思的差异,又可将子系统名称中的描述词主要划分成子系统功能描述词、功能执行方式词、软件描述词、功能对象四类。子系统功能描述词:子系统名称中描述和软件实际功能相关的词语。功能执行方式词:实现某功能的方式;软件描述词:与软件概念相关词汇;功能对象:某功能所从属的部门;由于子系统功能描述词基本为名词及动名词,通过分词后的词性筛选,可从由多个词语组成的子系统名称中获取子系统功能描述部分。为了解决细粒度分词对子系统名称中政务含义的破坏,通过排列的方式极大程度的恢复出子系统名称中所有的潜在语义。利用两类子系统与政务职能之间语义相似度的差异及子系统的命名规律,提出基于职能语义的电子政务知识图谱的关系抽取算法,采用Directional Skip-Gram(DSG)算法训练好大规模近义词词向量进行文本相似度的计算,最后对所有排列的结果进行词向量相似度的计算,选取对应相似度最高的职能词构成子系统及职能间的三元组,在关系抽取的同时消除歧义。
S4,基于LDA主题模型的知识扩充
抽取半结构化数据(项目申报书的项目概述(电子政务系统简介))作为数据源,进行数据清洗,去除停用词、去除非法字符,去除常用软件描述词,之后计算每个部门的文档集的困惑度。当困惑度达到最小时,可以确定主题数。通过训练每一个政务部门的LDA主题模型,可得出每一个部门所对应的主题、主题词及主题词的权重向量,将各部门的主题储存为知识图谱中的主题实体,对应的主题词和主题词的权重向量存为主题的属性。
综合S1中的数据整合、S2和S3中的知识抽取、以及S4中的知识扩充,得到初步知识表示。
S5,利用已有知识(专家知识)进行实体链接后,得到标准知识表示(三元组数据)。在进行实体链接操作时,是利用已有知识对抽取的初步三元组数据进行处理,得到标准三元组数据,然后加入到电子政务领域知识图谱中。实体链接中的关键是实体消歧,目的是将有歧义的命名性指称项映射到实际所指的实体概念上去,主要用于解决一个命名实体的指称项对应了多个实体概念的“一词多义”现象。
基本解决方案是通过手工构建规则完成消歧工作,或通过构建实体的特征向量,基于向量的相似性进行去重、去近似处理,从而完成实体的消歧工作。由于手工消歧的方式费事费力,因而基于词向量相似度进行消歧及链接更为适合本发明。
实体链接后得到标准知识,利用标准知识修订步骤一的数据模型,得到实例和实例之间的关系,将此规范后得到标准三元组数据(标准知识最终表示形态是标准三元组数据)。
S6,创建电子政务领域知识图谱
经过上述处理后得到规范化的三元组,将这些三元组存入到Neo4j图数据库,利用Cypher语言对Neo4j图数据库执行CRUD操作,将这些三元组链接并存入图数据库Neo4j中,就得到了电子政务领域知识图谱,如图7所示。
在步骤S5中得到标准知识表示后进行知识推理,就是根据步骤一的数据模型和标准三元组数据,依据推理规则(人为经验)进行知识发现,即获取新的知识或者结论,再加入电子政务领域知识图谱。步骤三,逻辑推理与二维及三维可视化方法
如图8所示,以电子政务领域知识图谱为基础,将知识推理与可视化相结合,从已有信息中推理深层信息以可视化的方式呈现,经过人与可视化界面的交互分析获取新的知识及结论并且帮助知识图谱的更新,知识可作为新的数据重新进行可视分析的流程。
逻辑推理如图9所示,TBox和ABox上的推理机制:在TBox术语集和ABox断言集的基础上,通过语法构建语义,形成的推理规则,逻辑语法如图9(表)。TBox术语集:是有关概念和角色的蕴含公理集合,声明概念或角色间的包含关系。其中,定义用于引入概念以及关系的名称,包含用于声明具有包含关系的公理。ABox断言集:是有关个体的实例断言集合,断言包括声明个体是某概念的实例,以及个体之间的二元关系。Abox断言包含概念断言和关系断言,概念断言用来表示一个对象是否属于某个概念,关系断言表示两个对象是否满足特定关系。概念和概念,关系和概念之间可以组成更复杂的概念:交并非存在量词和全称量词
按推理规则执行后,得到的知识图谱的一部分,如图10所示。该图对应的echarts图如图11所示,即利用推理逻辑后形成的二维可视化分析结果。
根据电子政务系统、电子政务子系统、政务职能和子职能之间的关系和类的从属关系,构建如下推理规则即可获取电子政务系统以及电子政务系统与政务职能之间的关系:
其中a为某政务职能变量,Duty_system(a,System)为某职能a及拥有该职能的所有电子政务系统之间的关系;由于Subduty和Duty及Subsystem和System是父子类关系,为了简化表示,所以这里用表示他们的SUB_OF和FUNCTION_OF关系;为所有职能a下的电子政务系统各职能上的系统数量统计。
每一职能下的政务系统建设量可以有效地反映出该职能的建设情况,是发现”重复投资问题”的重要依据。将推理后得到的数据进行统计并以二维图呈现,加入时间因素,可更加有效地对比出年度职能建设情况及年度间职能建设上的变化。
重复系统可视化如图12的重复系统饼状图所示,显示了本发明中利用推理逻辑后形成的二维可视化分析结果。每个分区的大小代表该项目和不同项目重复比率的大小。
直接指向政务系统实体的实体有主题、子系统及共享数据资源,因此,分析新建或已有的某一项目与其他项目的重复度可以从这三个角度出发,综合考虑系统所服务的职能、所使用的数据资源来分析和其他系统的重复比率。
某系统i与另一系统j的重复率pi,j定义如下:
ti,j=wi.wj
其中,fi,j为系统i同j的重复职能子系统建设率,Fi,j为系统i中和系统j属于同一职能的子系统数量,Fi为系统i中所有用于职能建设的子系统数量,由于普通操作类的子系统如登录子系统、用户管理子系统等对于真正的政务系统评估不具有太多意义,因此只选取用于职能建设的子系统进行分析。di,j为系统i同j的使用的数据资源重复率,Di,j为系统i中和系统j重复数据资源数量,Di为系统i所用的所有数据资源数量。ti,j为系统i同j的主题相似率,wi、wj分别为系统i和j的主题权重向量。
基于领域知识图谱,Fi,j可由下述推理规则得到:
其中,System(i)为要进行比较的电子政务系统实体i,BELONG_TO(FUNCTION_OF(i,subsystem),duty).duty为电子政务系统i所拥有的政务职能,SIMILAR_DUTY(i,j).i为Fi,j。
Di,j可由下述推理规则得到:
其中,SOURCE_OF(i,sharingdata).sharingdata为电子政务系统i所拥有的数据资源,SIMILAR_SOURCE(i,j).i为Di,j。
wi、wj通过获取主题实体的属性即可得到。
在计算了pi,j的基础上,就能对所要分析的系统i的所有具有重复可能的系统进行排查。
电子政务系统的逻辑推理与“三维”可视分析方法:
采用政务系统的职能建设率、数据资源共享率以及政务系统的资金审批率三个指标对电子政务系统进行三维可视化,就可以进一步明晰上述问题,使得对于项目的重复建设程度具有更加客观的决策依据。针对可视化目标,如下选取了可立体展示的三维散点图以及可以直观展示维度间关系的雷达图进行可视化,以满足管理者对部门电子政务系统全貌中与申报项目的关联关系评判。如图13和图14所示,图13展示单一或少量项目的“三维”情况,图14展示一个部门或多个部门的电子政务系统分布状况,三个坐标轴为分别代表政务系统的职能建设率、数据资源共享率及资金审批率,每一个点代表一个系统,用不同颜色区分出从属的部门。下图中的政务系统的政务职能建设率PF、数据资源共享率PD、资金审批率PM分别进行下述定义。
政务职能建设率PF
根据本文前述的本体概念,电子政务系统分为“政务职能建设子系统”及“软件功能实现子系统”两类,每个政务系统按照这两类不同子系统的不同比例的组合形成一个完整的系统,但其中服务于政府职能建设的只有“政务职能建设子系统”,而其它子系统都只是为了辅助核心功能而存在;另外,当今的软件系统均采用集成式开发环境实现,其基础功能子系统(如用户管理、登录等)都拥有大量的开源资源且可模块化地使用,几乎不再产生开发价值。因此,在评价电子政务系统的有效性时,不能以子系统的数量、规模作为评价要素,而是应该按照《关于开展国家电子政务工程项目绩效评价工作的意见》(发改高技【2015】200号)从职能建设的有效性角度进行评价。为了衡量“政务职能建设子系统”在电子政务系统中的占比,定义政务系统的职能建设率PF如下:
Fduty为某电子政务系统中所包含的实现职能功能的子系统数量,Fall为某电子政务系统中所有的子系统数量。
利用电子政务领域知识图谱进行如下推理,可获得拥有职能-子系统关系的某系统w中的子系统,对其进行统计即可获得Fduty
数据资源共享率PD
在当今政务信息系统普遍使用“政务云”平台的背景下,电子政务系统间的关系也可以用他们之间共享利用的数据资源来表示。一个政务系统所产生的的数据资源如果可以被较多的政务系统需要,说明该系统的建设价值就越高;一个政务系统所利用的共享数据资源类别越多,说明其不重复采集数据的建设规范度越好。为呈现系统的数据资源利用特征,将某系统的数据资源共享率PD定义如下:
其中,Dshare表示该系统中和其他系统有共享关系的数据资源,Dall代表该系统中所有的数据资源。通过此指标可以有效地表示出电子政务系统中所采集、使用的数据的价值。
基于知识图谱进行推理,可知某政务系统w中和其他系统拥有数据共享关系的数据资源,对该数据资源进行统计可知Dshare
资金审批率PM
依赖调阅与查询历史申报数据来识别政府部门政务信息系统的政务职能多频次、短时间的重复建设这一隐性问题一直具有很大难度。为辅助管理者更好地识别此类隐性问题,设计资金审批率可有效地可视化出一个项目政务职能建设的历史资金使用情况。经过项目数据的积累,该指标更可反映出政府部门的信息化管理水平,并为后续的审计工作奠定坚实的基础。资金审批率PM定义如下:
其中,Ma为审批资金,Ms为申报资金,通过知识图谱中电子政务系统的属性即可获得Ma及Ms。
利用上述三个维度的指标可以有效地可视化出部门电子政务系统的职能高效、资源共享的信息化建设管理水平。以平面雷达图(radar)的方式展示单一或少量项目的“三维”情况。以三维散点图(3D scattering)的可视化方式展示一个部门或多个部门的电子政务系统分布状况,三个坐标轴分别代表政务系统的职能建设率、数据资源共享率及资金审批率,每一个点代表一个系统,用不同颜色区分出从属的部门;与此同时,三维散点图可以任意角度旋转,从不同的视角去看整体项目的分布情况,也可以选择一个或多个部门去了解系统的“三维”建设情况。
(8)政务部门关系可视化方法
电子政务领域知识图谱的创建还可以借助政府各部门的系统建设主题分析部门之间的信息系统关系并将其可视化,辅助管理者从更高的层级审视政府部门间的建设合理性问题,从而有效支持管理者决策。
本成果定义各部门的主题可表示为Topic={T1,T2,T3...Tn}主题向量可用主题词表示为T={t1,t2,t3...tn},主题词的权重向量为W={w1,w2,w3...wn}。
通过主题词和主题词的权重向量可得知两个部门间的主题相似度矩阵,主题相似度计算公式定义如下:
其中sT,T'为主题T和T'的相似度,similar(ti,t'j)为主题词之间的相似度,利用余弦相似度进行计算,公式如下:
在此基础上,对省级政府所有部门的关系进行可视化,将sT,T'设为网络关系图中的边的权重,就可以得到信息化网络关系图,如图15所示,通过LDA模型得到的各部门对应的主题词和主题词的权重向量,可计算出部门间的主题相似度矩阵,设定阈值统计主题相似度矩阵中大于阈值的主题个数确定两部门之间的关联关系,在此基础上,对省市的所有部门的关系进行可视化,得到信息化网络关系图。其中各个部门节点的大小由政务系统的数量决定,通过交互可以展示出两个部门之间的关系权重。还可以通过缩小所需了解的部门的范围,更加清晰地了解部门之间的关系。
本发明利用创建电子政务领域知识图谱的方法实现知识关联,通过补充完善决策知识,实现知识推理与可视化问题的方式支持电子政务项目审批决策。本发明依靠半自动化实现,需要政府信息化历史项目数据的支持。本成果的代码实现环境为window10操作系统和python3.6代码环境、MySQL数据库存储初始及中间数据、Neo4j用于知识图谱的存储、Echarts进行可视界面的搭建。本成果形成的各类功能还支持常用编程语言环境(JAVA、C++等)来调用实现或根据本成果的逻辑实现。
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (5)
1.一种通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法,其特征在于,包括以下步骤:
步骤一,电子政务领域本体数据模型的构建:以七步法和循环获取法为基础,利用七步法创建实例后,采用本体评估迭代至七步法前端的方式,实现双向本体建模;
步骤二,建立电子政务领域知识图谱:
对结构化数据进行整合,对半结构化数据和非结构化数据进行知识抽取和知识扩充,得到初步知识表示后,利用已有知识进行实体链接,得到标准知识表示,利用标准知识修订步骤一的数据模型,得到实例和实例之间的关系,将此关系规范后得到标准三元组数据,利用标准三元组数据创建电子政务领域知识图谱;
步骤三,以电子政务领域知识图谱为基础,将知识推理与可视化相结合,从已有信息中推理深层信息以可视化的方式呈现,辅助政务信息化项目建设管理;可视化内容包括重复系统饼状图、基于职能建设率、数据资源共享率及资金审批率的政务系统三维雷达图,基于职能建设率、数据资源共享率及资金审批率的政务系统三维散点图、反应政务部门关系的信息化网络关系图;
所述步骤一中,电子政务领域本体数据模型的构建方法如下:
步骤1,定义本体概念:
政府部门类:省市级政府下属的部门;
政务职能类:省市级政府下属部门的政务职能;
电子政务系统类:政府部门申报、建设的各种电子政务系统;
数据资源类:电子政务系统中采集、调用的数据资源;
主题类:为了表示政务系统对于职能履行的细节性信息,增添主题类;
政务子职能类:政务子职能及所管理的对象与管理权责,即政务职能类的子类;
电子政务子系统类:电子政务系统包含的子系统与功能点描述,即电子政务系统类的子类;
步骤2,确定类属性:通过对每个类别的数据及对决策场景的分析,设置重要或者出现次数较多的属性:
政府部门类:下属部门ID,下属部门名称;
政务职能类:职能ID,职能名称;
电子政务系统类:主题权重,建设时间、升级时间、申报资金、审批资金;
数据资源类:数据名,数据描述,数据类型,数据大小,信息项,数据来源,分享类型;
主题类:主题词及主题权重;
政务子职能类:政务子职能名称,管理对象名称,管理权责描述;
电子政务子系统类:子系统名称,子系统描述,功能点名称,功能点描述;
步骤3,确定对象关系:
DUTY_OF包含职能:政府部门与政务职能之间的关系;
SYSTEM_OF包含系统:政府部门与电子政务系统之间的关系;
FUNCTION_OF包含子系统:电子政务系统和电子政务子系统之间的父子类关系;
BELONG_TO属于:政务职能和电子政务子系统之间的关系,政务子职能和电子政务子系统之间的关系;
SOURCE_OF包含数据资源:电子政务系统和数据资源之间的关系;
TIPIC_OF部门包含的主题:政府部门和主题之间的关系;
S_TIPIC_OF系统包含的主题:电子政务系统和主题之间的关系;
SUB_OF政务职能与政务子职能之间父子类关系;
步骤4,确定类的等级关系同步骤3确定对象间关系;
步骤5,创建实例:从结构化数据、半结构化数据以及非结构化数据中抽取知识,将得到的三元组数据归到建立的本体上,就是创建的实例;
步骤6,本体评估:依据专家经验人为干预进行本体评估;
步骤7,迭代,对缺漏的本体进行人为补充;
构建政务系统三维雷达图和三维散点图时,
Fduty为一电子政务系统中所包含的实现职能功能的子系统数量,Fall为该电子政务系统中所有的子系统数量;
利用电子政务领域知识图谱进行推理,可获得拥有职能-子系统关系的系统w中的子系统,对其进行统计即可获得Fduty;
Dshare表示该系统中和其他系统有共享关系的数据资源,Dall代表该系统中所有的数据资源;
基于知识图谱进行推理,可知政务系统w中和其他系统拥有数据共享关系的数据资源,对该数据资源进行统计可知Dshare
其中,Ma为审批资金,Ms为申报资金,通过知识图谱中电子政务系统的属性即可获得Ma及Ms;
政务部门关系可视化时,定义各部门的主题可表示为Topic={T1,T2,T3...Tn};主题向量可用主题词表示为T={t1,t2,t3...tn},主题词的权重向量为W={w1,w2,w3...wn};
通过主题词和主题词的权重向量可得知两个部门间的主题相似度矩阵,主题相似度计算公式定义如下:
其中sT,T'为主题T和T'的相似度,similar(ti,t'j)为主题词之间的相似度,利用余弦相似度进行计算,公式如下:
将sT,T'设为网络关系图中的边的权重,就可以得到信息化网络关系图。
2.如权利要求1所述的通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法,其特征在于,所述步骤二中数据来源如下:
结构化数据来自政务信息化项目申报材料中可获取的信息,包括系统名称、子系统名、系统申报单位、申报时间、升级改造时间、所需数据资源、申报资金、历史相关投资信息;从省级网信部门的数据共享交换平台数据库中获取的申建部门的共享数据资源目录信息;
半结构化数据来自政府政务网站上抓取的信息,包括政府部门名称、权责清单;
非结构化数据是文本数据,来自政务信息系统建设申报材料中项目摘要文本中所抽取的核心内容。
3.如权利要求2所述的通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法,其特征在于,对结构化数据进行整合是把电子政务系统相关数据和共享数据资源进行收集、整理、清洗,转换后形成一个新数据源;
对半结构化数据和非结构化数据进行处理时,采用基于集成模型的政务子职能命名实体识别方法实现知识抽取,利用基于职能语义的领域知识图谱关系抽取算法,结合政府职能与政务信息系统层次化的特点获取电子政务子系统与政务职能之间的关系,基于LDA主题模型的知识扩充进行半结构化数据的知识抽取。
4.如权利要求3所述的通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法,其特征在于,基于职能语义的领域知识图谱关系抽取算法是通过以下步骤实现的,电子政务系统的子系统依据功能进行定义和划分,可划分为“政务职能建设子系统”及“软件功能实现子系统”两类,子系统名称均为短文本且为多个词语的组合,根据词语在子系统中的表达意思的差异,又可将子系统名称中的描述词划分成子系统功能描述词、功能执行方式词、软件描述词、功能对象四类,子系统功能描述词:子系统名称中描述和软件实际功能相关的词语,功能执行方式词:实现功能的方式;软件描述词:与软件概念相关词汇;功能对象:功能所从属的部门;通过分词后的词性筛选,可从由多个词语组成的子系统名称中获取子系统功能描述部分,为了解决细粒度分词对子系统名称中政务含义的破坏,通过排列的方式恢复出子系统名称中所有的潜在语义,利用两类子系统与政务职能之间语义相似度的差异及子系统的命名规律,提出基于职能语义的电子政务知识图谱的关系抽取算法,采用Directional Skip-Gram算法训练好大规模近义词词向量进行文本相似度的计算,最后对所有排列的结果进行词向量相似度的计算,选取对应相似度最高的职能词构成子系统及职能间的三元组数据。
5.如权利要求1所述的通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法,其特征在于,所述步骤二中,利用标准三元组数据创建电子政务领域知识图谱时,将标准三元组数据存入到Neo4j图数据库,利用Cypher语言对Neo4j图数据库执行CRUD操作,将这些三元组链接并存入图数据库Neo4j中,得到电子政务领域知识图谱。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011062926.5A CN113672599B (zh) | 2020-09-30 | 2020-09-30 | 政务信息化项目建设管理的可视化辅助决策方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011062926.5A CN113672599B (zh) | 2020-09-30 | 2020-09-30 | 政务信息化项目建设管理的可视化辅助决策方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113672599A CN113672599A (zh) | 2021-11-19 |
CN113672599B true CN113672599B (zh) | 2023-05-23 |
Family
ID=78537993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011062926.5A Active CN113672599B (zh) | 2020-09-30 | 2020-09-30 | 政务信息化项目建设管理的可视化辅助决策方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113672599B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114372125A (zh) * | 2021-12-03 | 2022-04-19 | 北京北明数科信息技术有限公司 | 基于知识图谱的政务知识库构建方法、系统、设备及介质 |
CN114255010A (zh) * | 2021-12-23 | 2022-03-29 | 华斌 | 电子政务平台中电子文件档案化管理与知识服务协同实现方法 |
CN114596182B (zh) * | 2022-03-09 | 2023-05-16 | 王淑娟 | 一种基于大数据的政务管理方法及系统 |
CN114647744B (zh) * | 2022-05-23 | 2022-08-12 | 中国人民解放军国防科技大学 | 一种体系结构建模方法及装置 |
CN116702902B (zh) * | 2023-04-14 | 2024-06-25 | 长江水利委员会水文局 | 一种水文数据图谱推理与知识库构建方法 |
CN116628172B (zh) * | 2023-07-24 | 2023-09-19 | 北京酷维在线科技有限公司 | 基于知识图谱的政务服务领域多策略融合的对话方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108345647A (zh) * | 2018-01-18 | 2018-07-31 | 北京邮电大学 | 基于Web的领域知识图谱构建系统及方法 |
CN108874878A (zh) * | 2018-05-03 | 2018-11-23 | 众安信息技术服务有限公司 | 一种知识图谱的构建系统及方法 |
CA3014309A1 (en) * | 2017-08-16 | 2019-02-16 | Royal Bank Of Canada | Expert knowledge platform |
CN111078897A (zh) * | 2019-12-26 | 2020-04-28 | 国衡智慧城市科技研究院(北京)有限公司 | 一种生成六维知识图谱的系统 |
CN111667074A (zh) * | 2020-05-19 | 2020-09-15 | 北京海致星图科技有限公司 | 一种应用知识推理到知识图谱生成方法及系统 |
CN111709235A (zh) * | 2020-05-28 | 2020-09-25 | 上海发电设备成套设计研究院有限责任公司 | 一种基于自然语言处理的文本数据统计分析系统及方法 |
-
2020
- 2020-09-30 CN CN202011062926.5A patent/CN113672599B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3014309A1 (en) * | 2017-08-16 | 2019-02-16 | Royal Bank Of Canada | Expert knowledge platform |
CN108345647A (zh) * | 2018-01-18 | 2018-07-31 | 北京邮电大学 | 基于Web的领域知识图谱构建系统及方法 |
CN108874878A (zh) * | 2018-05-03 | 2018-11-23 | 众安信息技术服务有限公司 | 一种知识图谱的构建系统及方法 |
CN111078897A (zh) * | 2019-12-26 | 2020-04-28 | 国衡智慧城市科技研究院(北京)有限公司 | 一种生成六维知识图谱的系统 |
CN111667074A (zh) * | 2020-05-19 | 2020-09-15 | 北京海致星图科技有限公司 | 一种应用知识推理到知识图谱生成方法及系统 |
CN111709235A (zh) * | 2020-05-28 | 2020-09-25 | 上海发电设备成套设计研究院有限责任公司 | 一种基于自然语言处理的文本数据统计分析系统及方法 |
Non-Patent Citations (2)
Title |
---|
企业法人知识图谱的构建及应用研究;于小洋;信息科技辑;全文 * |
王颖 等.图书情报工作.2015,全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN113672599A (zh) | 2021-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113672599B (zh) | 政务信息化项目建设管理的可视化辅助决策方法 | |
Carreño et al. | Analysis of user comments: an approach for software requirements evolution | |
CN103678670B (zh) | 一种微博热词与热点话题挖掘系统及方法 | |
CN110597870A (zh) | 一种企业关系挖掘方法 | |
Farnadi et al. | Soft quantification in statistical relational learning | |
Gerhana et al. | Comparison of naive Bayes classifier and C4. 5 algorithms in predicting student study period | |
CN113449204B (zh) | 基于局部聚合图注意力网络的社会事件分类方法、装置 | |
CN114579833B (zh) | 一种基于主题挖掘和情感分析的微博舆情可视分析方法 | |
Ibrahim et al. | COVID19 outbreak: A hierarchical framework for user sentiment analysis | |
Liu et al. | Research and citation analysis of data mining technology based on Bayes algorithm | |
Li et al. | Cross-dimension mining model of public opinion data in online education based on fuzzy association rules | |
Williams et al. | Importance nested sampling with normalising flows | |
Glauner | Artificial intelligence for the detection of electricity theft and irregular power usage in emerging markets | |
Köseoğlu et al. | Correlation coefficients of simplified neutrosophic multiplicative sets and their applications in clustering analysis | |
Ahmed et al. | Developed third iterative dichotomizer based on feature decisive values for educational data mining | |
CN116402166B (zh) | 一种预测模型的训练方法、装置、电子设备及存储介质 | |
CN109543959A (zh) | 审批链生成方法、装置、计算机设备及存储介质 | |
Lv et al. | Research on timeliness evaluation model of online teaching based on intelligent learning | |
Sharrock et al. | Tuning-free maximum likelihood training of latent variable models via coin betting | |
Al-Ghalibi et al. | NLP based sentiment analysis for Twitter's opinion mining and visualization | |
Zhichong et al. | Framework of spatial decision support system for large-scale public building evacuation | |
Zhang et al. | Construction method of concept lattice based on improved variable precision rough set | |
Haroonabadi et al. | A novel method for behavior modeling in uncertain information systems | |
CN108491481B (zh) | 侵犯知识产权涉案当事人智能辨识主动预警系统及方法 | |
Radhi | Adaptive learning system of ontology using semantic web to mining data from distributed heterogeneous environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |