CN112712177A - 一种基于协同处理的知识工程方法与装置 - Google Patents

一种基于协同处理的知识工程方法与装置 Download PDF

Info

Publication number
CN112712177A
CN112712177A CN202011598175.9A CN202011598175A CN112712177A CN 112712177 A CN112712177 A CN 112712177A CN 202011598175 A CN202011598175 A CN 202011598175A CN 112712177 A CN112712177 A CN 112712177A
Authority
CN
China
Prior art keywords
knowledge
task
materials
model
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011598175.9A
Other languages
English (en)
Inventor
邓志勇
胡乃庄
黄金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yongxiao Intelligent Technology Co ltd
Original Assignee
Shanghai Yongxiao Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yongxiao Intelligent Technology Co ltd filed Critical Shanghai Yongxiao Intelligent Technology Co ltd
Priority to CN202011598175.9A priority Critical patent/CN112712177A/zh
Publication of CN112712177A publication Critical patent/CN112712177A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及协同处理技术领域,且公开了一种基于协同处理的知识工程方法与装置,包括以下步骤:S1:对素材进行收集管理并对其进行归类,取得了可量化知识来源高效管理素材;S2:根据知识工程师的背景自动分配同等级任务,同等级知识工程师协作完成任务管理内对应的任务;S3:自动化抽取知识,将隐性知识转换到显性知识。本发明中,通过添加素材管理、任务管理实施以及知识抽取实施,有效的解决了知识来源难以归类,知识工程师背景不同,导致知识质量差,多地协作困难重重,没有校验机制,也会导致知识质量差,知识管理难,知识转化上存在由隐性向显性转化问题,没有标注化流程和量化指标可监控等问题。

Description

一种基于协同处理的知识工程方法与装置
技术领域
本发明涉及协同处理技术领域,具体为一种基于协同处理的知识工程方法与装置。
背景技术
协同处理发生在两台或多台计算机分担一个程序或计算任务处理的分布式计算系统中。协同处理需要一个复杂的程序能在网络上处理分配负载、共享数据文件和内存竞争,同时要维持信息的同步安全性和准确性。
现有的基于协同处理的知识工程方法在使用过程中,存在以下问题:
1、知识来源难以归类。
2、知识工程师背景不同,导致知识质量差。
3、多地协作困难重重。
4、没有校验机制,也会导致知识质量差,知识管理难
5、知识转化上存在由隐性向显性转化问题,没有标注化流程和量化指标可监控。为此,我们提出一种基于协同处理的知识工程方法与装置。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于协同处理的知识工程方法与装置。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:一种基于协同处理的知识工程方法,包括以下步骤:
S1:对素材进行收集管理并对其进行归类,取得了可量化知识来源高效管理素材;
S2:根据知识工程师的背景自动分配同等级任务,同等级知识工程师协作完成任务管理内对应的任务;
S3:自动化抽取知识,将隐性知识转换到显性知识。
作为优选,所述S1:对素材进行收集管理并对其进行归类,取得了可量化知识来源高效管理素材中具体的步骤为:
a).素材收集;
素材收集来源:政务系统,书籍,政府发文,公众号,政务官网;
b).素材导入;
将相关原始素材导入到素材库;
c).素材库;
素材库是存储原始素材和做素材拆分的集合;
d).素材分类;
e).元素抽取;
i.业务词抽取;
1).实体抽取,由知识图谱提供;
2).业务词抽取,由积累的知识词库匹配而得;
3).关系抽取,由知识图谱提供。
作为优选,所述d)素材分类中,具体为:
i.利用机器学习算法模型对素材进行分类;
ii.采用的模型1为:基于Bert的预训练模型;
1).模型1针对已有的分类,但是仍然有新增分类和未知分类的情况,此时采用模型2;
2).输入:素材文本;
3).输出:素材分类;
iii.模型2:基于Bert的聚类模型;
1).输入:素材文本;
2).输出:聚类结果;
3).需要人工分析聚类结果并根据结果人工作为出类型的判断;
4).置信度超过阈值可转换为模型1情形。
作为优选,所述S2:根据知识工程师的背景自动分配同等级任务,同等级知识工程师协作完成任务管理内对应的任务中具体为:
a)分配
i.多人,多地协作时,对整个任务进行;
ii.由知识主管创建,分配相应的任务;
iii.创建任务的原则;
1).相同素材分类的创建为一个任务;
2).相同知识工程处理素材的创建为一个任务;
3).相同审批人员素材的创建为一个任务;
4.同地的知识工程的创建为一个任务;
b)协作
i.多人共同处理同一个任务;
ii.标准制定;
1).素材名称;
2).素材答案;
3).知识来源;
4).来源描述;
5).链接;
6).所属知识图谱,知识库;
7).实例名称;
8).是否通用;
9).素材状态;
10).编辑者;
以上需要知识工程师填写,准确无误提交s由知识主管审核,审核通过进入下一个流程,审核不通则重新做直至审核通过;
c)进度
i.以知识工程师个人和整个任务进度为核心;
ii.知识工程师的进度严重拖慢整个任务时,由知识主管确认具体问题是什么,并拆分相关工作给组内其他成员;
iii.知识主管对所属任务负责;
iv.知识工程师对所做知识负责;
v.KPI由两者共同承担。
作为优选,所述S3:自动化抽取知识,将隐性知识转换到显性知识中具体的步骤为:
a).知识管理是这套系统的核心,主要作用在于机器自动抽取知识和知识校验;
b).知识抽取;
i.抽取相关问题及答案;
ii.模型:Retro-Reader模型(回顾式阅读器);
iii.原理;
iv.Retro-Reader·模型包括略读模块(sketchy-reading module)和精读模块(intensive-reading-module)来模拟人类阅读。略读模块用于阅读文章和问题,得到初步的判断;精读模块验证可回答性,并给出候选。两个模块的输出汇总在一起,以做出最终决定。
一种基于协同处理的知识工程装置,包括任务存储模块、知识存储模块以及知识应用模块,
所述任务存储模块具体为:
主要存储于关系型数据库,存储任务相关所有信息,已存储的所有信息都可以追索源头。
所述知识存储模块具体为:
主要存储于知识图谱,知识的最终形态,符号化表示,向量化表示都存储于知识图谱中,统一由知识图谱进行处理。
所述知识应用模块具体为:
a).知识检索
i.使用者可分为;
1).外部使用者:如政务干部,查找相关相近内容;
2).实际用户:业务办理用户,智能咨询;
3).知识工程师:查找相关相近内容。
ii.知识检索的主要作用也是
b).知识问答。
i.针对知识库中的相关知识可做一些问答,智能咨询;
c).数据分析,
i.主要用于统计分析知识库相关状态;
ii.量化知识工程师效率;
iii.量化知识准确性。
(三)有益效果
与现有技术相比,本发明提供了一种基于协同处理的知识工程方法与装置,具备以下有益效果:
该基于协同处理的知识工程方法与装置,通过添加素材管理、任务管理实施以及知识抽取实施,有效的解决了知识来源难以归类,知识工程师背景不同,导致知识质量差,多地协作困难重重,没有校验机制,也会导致知识质量差,知识管理难,知识转化上存在由隐性向显性转化问题,没有标注化流程和量化指标可监控等问题。
附图说明
图1为本发明的软件框架图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,一种基于协同处理的知识工程方法,包括以下步骤:
S1:对素材进行收集管理并对其进行归类,取得了可量化知识来源高效管理素材;
S2:根据知识工程师的背景自动分配同等级任务,同等级知识工程师协作完成任务管理内对应的任务;
S3:自动化抽取知识,将隐性知识转换到显性知识。
所述S1:对素材进行收集管理并对其进行归类,取得了可量化知识来源高效管理素材中具体的步骤为:
a).素材收集;
素材收集来源:政务系统,书籍,政府发文,公众号,政务官网;
b).素材导入;
将相关原始素材导入到素材库;
c).素材库;
素材库是存储原始素材和做素材拆分的集合;
d).素材分类;
e).元素抽取;
i.业务词抽取;
1).实体抽取,由知识图谱提供;
2).业务词抽取,由积累的知识词库匹配而得;
3).关系抽取,由知识图谱提供。
所述d)素材分类中,具体为:
i.利用机器学习算法模型对素材进行分类;
ii.采用的模型1为:基于Bert的预训练模型;
1).模型1针对已有的分类,但是仍然有新增分类和未知分类的情况,此时采用模型2;
2).输入:素材文本;
3).输出:素材分类;
iii.模型2:基于Bert的聚类模型;
1).输入:素材文本;
2).输出:聚类结果;
3).需要人工分析聚类结果并根据结果人工作为出类型的判断;
4).置信度超过阈值可转换为模型1情形。
所述S2:根据知识工程师的背景自动分配同等级任务,同等级知识工程师协作完成任务管理内对应的任务中具体为:
a)分配
i.多人,多地协作时,对整个任务进行;
ii.由知识主管创建,分配相应的任务;
iii.创建任务的原则;
1).相同素材分类的创建为一个任务;
2).相同知识工程处理素材的创建为一个任务;
3).相同审批人员素材的创建为一个任务;
4.同地的知识工程的创建为一个任务;
b)协作
i.多人共同处理同一个任务;
ii.标准制定;
1).素材名称;
2).素材答案;
3).知识来源;
4).来源描述;
5).链接;
6).所属知识图谱,知识库;
7).实例名称;
8).是否通用;
9).素材状态;
10).编辑者;
以上需要知识工程师填写,准确无误提交s由知识主管审核,审核通过进入下一个流程,审核不通则重新做直至审核通过;
c)进度
i.以知识工程师个人和整个任务进度为核心;
ii.知识工程师的进度严重拖慢整个任务时,由知识主管确认具体问题是什么,并拆分相关工作给组内其他成员;
iii.知识主管对所属任务负责;
iv.知识工程师对所做知识负责;
v.KPI由两者共同承担。
所述S3:自动化抽取知识,将隐性知识转换到显性知识中具体的步骤为:
a).知识管理是这套系统的核心,主要作用在于机器自动抽取知识和知识校验;
b).知识抽取;
i.抽取相关问题及答案;
ii.模型:Retro-Reader模型(回顾式阅读器);
iii.原理;
iv.Retro-Reader·模型包括略读模块(sketchy-reading module)和精读模块(intensive-reading-module)来模拟人类阅读。略读模块用于阅读文章和问题,得到初步的判断;精读模块验证可回答性,并给出候选。两个模块的输出汇总在一起,以做出最终决定。
一种基于协同处理的知识工程装置,包括任务存储模块、知识存储模块以及知识应用模块,
所述任务存储模块具体为:
主要存储于关系型数据库,存储任务相关所有信息,已存储的所有信息都可以追索源头。
所述知识存储模块具体为:
主要存储于知识图谱,知识的最终形态,符号化表示,向量化表示都存储于知识图谱中,统一由知识图谱进行处理。
所述知识应用模块具体为:
a).知识检索
i.使用者可分为;
1).外部使用者:如政务干部,查找相关相近内容;
2).实际用户:业务办理用户,智能咨询;
3).知识工程师:查找相关相近内容。
ii.知识检索的主要作用也是
b).知识问答。
i.针对知识库中的相关知识可做一些问答,智能咨询;
c).数据分析,
i.主要用于统计分析知识库相关状态;
ii.量化知识工程师效率;
iii.量化知识准确性。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种基于协同处理的知识工程方法,其特征在于,包括以下步骤:
S1:对素材进行收集管理并对其进行归类,取得了可量化知识来源高效管理素材;
S2:根据知识工程师的背景自动分配同等级任务,同等级知识工程师协作完成任务管理内对应的任务;
S3:自动化抽取知识,将隐性知识转换到显性知识。
2.根据权利要求1所述的一种基于协同处理的知识工程方法,其特征在于:所述S1:对素材进行收集管理并对其进行归类,取得了可量化知识来源高效管理素材中具体的步骤为:
a).素材收集;
素材收集来源:政务系统,书籍,政府发文,公众号,政务官网;
b).素材导入;
将相关原始素材导入到素材库;
c).素材库;
素材库是存储原始素材和做素材拆分的集合;
d).素材分类;
e).元素抽取;
i.业务词抽取;
1).实体抽取,由知识图谱提供;
2).业务词抽取,由积累的知识词库匹配而得;
3).关系抽取,由知识图谱提供。
3.根据权利要求2所述的一种基于协同处理的知识工程方法,其特征在于:所述d)素材分类中,具体为:
i.利用机器学习算法模型对素材进行分类;
ii.采用的模型1为:基于Bert的预训练模型;
1).模型1针对已有的分类,但是仍然有新增分类和未知分类的情况,此时采用模型2;
2).输入:素材文本;
3).输出:素材分类;
iii.模型2:基于Bert的聚类模型;
1).输入:素材文本;
2).输出:聚类结果;
3).需要人工分析聚类结果并根据结果人工作为出类型的判断;
4).置信度超过阈值可转换为模型1情形。
4.根据权利要求1所述的一种基于协同处理的知识工程方法,其特征在于:所述S2:根据知识工程师的背景自动分配同等级任务,同等级知识工程师协作完成任务管理内对应的任务中具体为:
a)分配
i.多人,多地协作时,对整个任务进行;
ii.由知识主管创建,分配相应的任务;
iii.创建任务的原则;
1).相同素材分类的创建为一个任务;
2).相同知识工程处理素材的创建为一个任务;
3).相同审批人员素材的创建为一个任务;
4.同地的知识工程的创建为一个任务;
b)协作
i.多人共同处理同一个任务;
ii.标准制定;
1).素材名称;
2).素材答案;
3).知识来源;
4).来源描述;
5).链接;
6).所属知识图谱,知识库;
7).实例名称;
8).是否通用;
9).素材状态;
10).编辑者;
以上需要知识工程师填写,准确无误提交s由知识主管审核,审核通过进入下一个流程,审核不通则重新做直至审核通过;
c)进度
i.以知识工程师个人和整个任务进度为核心;
ii.知识工程师的进度严重拖慢整个任务时,由知识主管确认具体问题是什么,并拆分相关工作给组内其他成员;
iii.知识主管对所属任务负责;
iv.知识工程师对所做知识负责;
v.KPI由两者共同承担。
5.根据权利要求1所述的一种基于协同处理的知识工程方法,其特征在于:所述S3:自动化抽取知识,将隐性知识转换到显性知识中具体的步骤为:
a).知识管理是这套系统的核心,主要作用在于机器自动抽取知识和知识校验;
b).知识抽取;
i.抽取相关问题及答案;
ii.模型:Retro-Reader模型(回顾式阅读器);
iii.原理;
iv.Retro-Reader·模型包括略读模块(sketchy-reading module)和精读模块(intensive-reading-module)来模拟人类阅读,略读模块用于阅读文章和问题,得到初步的判断;精读模块验证可回答性,并给出候选,两个模块的输出汇总在一起,以做出最终决定。
6.一种基于协同处理的知识工程装置,包括任务存储模块、知识存储模块以及知识应用模块,其特征在于:
所述任务存储模块具体为:
主要存储于关系型数据库,存储任务相关所有信息,已存储的所有信息都可以追索源头。
7.根据权利要求6所述的一种基于协同处理的知识工程装置,其特征在于:所述知识存储模块具体为:
主要存储于知识图谱,知识的最终形态,符号化表示,向量化表示都存储于知识图谱中,统一由知识图谱进行处理。
8.根据权利要求6所述的一种基于协同处理的知识工程装置,其特征在于:所述知识应用模块具体为:
a).知识检索
i.使用者可分为;
1).外部使用者:如政务干部,查找相关相近内容;
2).实际用户:业务办理用户,智能咨询;
3).知识工程师:查找相关相近内容;
ii.知识检索的主要作用也是
b).知识问答;
i.针对知识库中的相关知识可做一些问答,智能咨询;
c).数据分析,
i.主要用于统计分析知识库相关状态;
ii.量化知识工程师效率;
iii.量化知识准确性。
CN202011598175.9A 2020-12-29 2020-12-29 一种基于协同处理的知识工程方法与装置 Pending CN112712177A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011598175.9A CN112712177A (zh) 2020-12-29 2020-12-29 一种基于协同处理的知识工程方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011598175.9A CN112712177A (zh) 2020-12-29 2020-12-29 一种基于协同处理的知识工程方法与装置

Publications (1)

Publication Number Publication Date
CN112712177A true CN112712177A (zh) 2021-04-27

Family

ID=75546525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011598175.9A Pending CN112712177A (zh) 2020-12-29 2020-12-29 一种基于协同处理的知识工程方法与装置

Country Status (1)

Country Link
CN (1) CN112712177A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050017869A (ko) * 2003-08-11 2005-02-23 (주)비아 글로벌 기획과 연구를 위한 전략적 지식관리 시스템 및 서비스
CN1963851A (zh) * 2006-12-06 2007-05-16 上海宝信软件股份有限公司 面向协同工作的知识管理系统
CN103646149A (zh) * 2013-12-23 2014-03-19 四川大学 基于知识工程的方案自动生成、评估系统及方法
TWM488041U (zh) * 2014-05-23 2014-10-11 Immense Digitize Engineering Co Ltd 雲端協同作業平台職能分工管理模組
CN110489749A (zh) * 2019-08-07 2019-11-22 北京航空航天大学 智能办公自动化系统业务流程优化
CN110489613A (zh) * 2019-07-29 2019-11-22 北京航空航天大学 协同可视数据推荐方法及装置
CN111177411A (zh) * 2019-12-27 2020-05-19 赣州市智能产业创新研究院 一种基于nlp的知识图谱构建方法
CN112000791A (zh) * 2020-08-26 2020-11-27 哈电发电设备国家工程研究中心有限公司 一种电机故障知识抽取系统及方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050017869A (ko) * 2003-08-11 2005-02-23 (주)비아 글로벌 기획과 연구를 위한 전략적 지식관리 시스템 및 서비스
CN1963851A (zh) * 2006-12-06 2007-05-16 上海宝信软件股份有限公司 面向协同工作的知识管理系统
CN103646149A (zh) * 2013-12-23 2014-03-19 四川大学 基于知识工程的方案自动生成、评估系统及方法
TWM488041U (zh) * 2014-05-23 2014-10-11 Immense Digitize Engineering Co Ltd 雲端協同作業平台職能分工管理模組
CN110489613A (zh) * 2019-07-29 2019-11-22 北京航空航天大学 协同可视数据推荐方法及装置
CN110489749A (zh) * 2019-08-07 2019-11-22 北京航空航天大学 智能办公自动化系统业务流程优化
CN111177411A (zh) * 2019-12-27 2020-05-19 赣州市智能产业创新研究院 一种基于nlp的知识图谱构建方法
CN112000791A (zh) * 2020-08-26 2020-11-27 哈电发电设备国家工程研究中心有限公司 一种电机故障知识抽取系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHARTON, E.等: "Using Collaborative Tagging for Text Classification: From Text Classification to Opinion Mining", 《INFORMATICS》, vol. 1, no. 1, 28 November 2013 (2013-11-28), pages 32 - 51 *
姚墨涵: "基于分布式架构的半结构化Web论坛信息抽取系统的研究", 《中国优秀硕士学位论文全文数据库:信息科技》, no. 9, 15 September 2012 (2012-09-15), pages 1 - 83 *

Similar Documents

Publication Publication Date Title
CN112182246B (zh) 通过大数据分析建立企业画像的方法、系统、介质及应用
CN114117171A (zh) 一种基于赋能思维的工程档案智能收整方法及系统
CN111967761A (zh) 一种基于知识图谱的监控预警方法、装置及电子设备
CN109408574B (zh) 基于文本挖掘技术的投诉责任认定系统
CN112801530A (zh) 一种基于语意拆分的智能评审系统及工作方法
CN112651218A (zh) 一种标书自动生成方法、管理方法、介质以及计算机
CN115794798B (zh) 一种市场监管信息化标准管理与动态维护系统及方法
CN110544035A (zh) 一种内控检测方法、系统和计算机可读存储介质
CN112052396A (zh) 课程匹配方法、系统、计算机设备和存储介质
CN114491034B (zh) 一种文本分类方法及智能设备
CN110310012B (zh) 数据分析方法、装置、设备及计算机可读存储介质
CN115794803A (zh) 一种基于大数据ai技术的工程审计问题监测方法与系统
CN112200465B (zh) 基于多媒体信息智能分析的电力ai方法及系统
CN117519656A (zh) 一种基于智能制造的软件开发系统
CN117592450A (zh) 基于员工信息整合的全景档案生成方法及系统
CN115329169B (zh) 一种基于深度神经模型的档案归档计算方法
CN113742495B (zh) 基于预测模型的评级特征权重确定方法及装置、电子设备
CN115934927A (zh) 一种安全知识的推送方法、系统、存储介质和电子设备
CN112800219B (zh) 客服日志反馈回流数据库的方法及系统
CN115545985A (zh) 一种基于智慧社区的图书馆档案综合管理系统
CN112712177A (zh) 一种基于协同处理的知识工程方法与装置
CN115600856A (zh) 一种事件自动审核和分发的方法、装置、设备及介质
CN114417010A (zh) 面向实时工作流的知识图谱构建方法、装置和存储介质
CN115204128A (zh) 一种配置文件生成方法、装置和计算机可读存储介质
CN112988972A (zh) 一种基于数据模型的行政处罚案卷评查方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination