CN106599064B - 一种适用于高端装备的复杂知识自动分类、获取及存储方法 - Google Patents

一种适用于高端装备的复杂知识自动分类、获取及存储方法 Download PDF

Info

Publication number
CN106599064B
CN106599064B CN201611030674.1A CN201611030674A CN106599064B CN 106599064 B CN106599064 B CN 106599064B CN 201611030674 A CN201611030674 A CN 201611030674A CN 106599064 B CN106599064 B CN 106599064B
Authority
CN
China
Prior art keywords
knowledge
end equipment
complex
resources
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611030674.1A
Other languages
English (en)
Other versions
CN106599064A (zh
Inventor
周光辉
张超
白权栋
鲁麒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201611030674.1A priority Critical patent/CN106599064B/zh
Publication of CN106599064A publication Critical patent/CN106599064A/zh
Application granted granted Critical
Publication of CN106599064B publication Critical patent/CN106599064B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Manufacturing & Machinery (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种适用于高端装备的复杂知识自动分类、获取及存储方法,包括:从高端装备生命周期维度、知识表现形式维度和知识主题维度三个维度对知识资源进行归纳整理,并采用朴素贝叶斯分类器对其进行自动分类的复杂知识自动分类方法;根据基于元知识模型的复杂知识获取模板,通过基于获取模板的半自动化获取技术对复杂知识资源进行获取的复杂知识获取方法;以及通过一系列的自动切分规则将复杂知识资源从物理上进行分割,并将关键信息压缩后分布式保存到不同存储空间的复杂知识自动存储方法。本发明涵盖了复杂知识自动分类、获取和存储的方法,为高端装备制造企业复杂知识资源的运用提供基础和支撑。

Description

一种适用于高端装备的复杂知识自动分类、获取及存储方法
技术领域:
本发明属于先进制造技术智能化信息技术领域,特别涉及一种适用于高端装备的复杂知识自动分类、获取及存储方法。
背景技术:
以高档数控机床、大型燃气轮机、汽轮机、超/特高压电气装备、智能电力装备等为代表的高端装备制造业是典型的知识密集、技术密集和多学科交叉集成的高科技产业,随着技术的进步,当前高端装备制造企业正从以产品为中心转向以知识为中心的新产品开发中,以知识为中心的新产品开发正成为企业提高其竞争力的核心因素,产品结构日趋复杂,开发过程日趋复杂,产品功能日趋集成化和复合化,导致产品开发直至全生命周期均需各种复杂知识的支持,产品的设计、制造、维护等活动均需要各种知识资源的融合,各种复杂知识的高效运用已成为支撑高端装备产品技术创新的原动力。而复杂知识自动分类、获取及存储方法作为复杂知识运用的核心和关键,制约的因素主要有:
(1)知识分类方面:典型的知识分类方法主要包括波拉尼(Michael Polanyi)知识分类法和联合国经合组织(OECD)的分类法,这两种分类方式有助于对人类总体知识的分析与认知,但并不适用于以支持企业创新为目的的知识资源管理系统的开发;在服务于知识管理系统开发方面的知识分类多数只囊括了产品研发某一领域的知识,或者只从单一维度出发对产品研发各阶段知识进行分类,无法满足高端装备制造企业数量庞大、内容复杂、形式多样、格式异构的知识资源的分类需求。
(2)在知识获取方面:知识获取方面的研究主要聚焦在自动获取技术上,但其涉及到人工智能的多个尚不成熟的研究领域,因此还只是知识获取技术的一个长期奋斗目标;而当前企业主要采用的人工获取方式,虽然获取知识准确度高但效率低,无法胜任高端装备制造企业复杂知识的获取需求。
(3)在知识存储方面:当前,数据库技术虽已日趋成熟,但尚无支持高端装备制造企业数量庞大、内容复杂、形式多样、格式异构的知识资源的存储模型,更缺乏与高端装备制造企业复杂知识资源分类与获取方法相适应的存储方法。
发明内容:
本发明的目的在于针对现有方法的缺陷,提供一种适用于高端装备的复杂知识自动分类、获取及存储方法,为高端装备制造企业复杂知识资源的运用提供基础和支撑。
为达到上述目的,本发明采取如下的技术方案来实现:
一种适用于高端装备的复杂知识自动分类、获取及存储方法,包括以下步骤:
步骤1:根据高端装备制造企业复杂知识资源的特征,从高端装备生命周期维度、知识表现形式维度和知识主题维度三个维度对其进行梳理,并用朴素贝叶斯分类器对其进行自动分类;
步骤2:在上述步骤1对高端装备制造企业复杂知识资源自动分类的基础之上,按照其表现形式选取相应的基于元知识模型的复杂知识获取模板,通过标准化的知识资源获取界面,结合人工获取技术和半自动化获取技术,对复杂知识资源进行获取;
步骤3:针对上述步骤1和步骤2对高端装备制造企业知识资源的自动分类和获取结果,通过一系列的自动切分规则将这些复杂知识资源从物理上进行分割,然后分布式保存到不同的存储空间,并将关键信息压缩成ZIP压缩管理文件,使其以自身40%~90%的大小存储在知识库中,以实现海量知识资源的高效存储。
本发明进一步的改进在于,所述步骤1的知识三维度分类的定义如下:
KTD={LifCycDim,ExpForDim,SubDim}
LifCycDim={ProDes,ProManu,ProAsse,UseMain}
ExpForDim={DoctKn,DataKn,ProsKn,ExptKn}
SubDim={ProObjt,ProDesn,ManuEngr,UseMaint}
KTD表示高端装备复杂知识三个维度分类的集合,元素LifCycDim是知识生命周期维度的集合,元素ExpForDim是知识表现形式维度的集合,SubDim是知识主题维度的集合;
在知识生命周期维度中,元素ProDes为产品设计类知识资源,元素ProManu为产品制造类知识资源,元素ProAsse为产品装配类知识资源,元素UseMain为使用维护类知识资源;
在知识表现形式维度中,元素DoctKn文档类知识资源,元素DataKn为数据类知识资源,元素ProsKn为过程类知识资源,元素ExptKn为专家经验类知识资源;
在知识主题维度中,元素ProObjt为产品对象类知识资源,元素ProDesn为产品设计类知识资源,元素ManuEngr为制造工程类知识资源,元素UseMaint为使用维护类知识资源。
本发明进一步的改进在于,所述步骤1的采用朴素贝叶斯分类器进行分类,包括如下步骤:
步骤1.1:将高端装备制造企业复杂知识资源映射到向量空间中,映射方式如下:
Figure GDA0002184871370000031
其中,x是5000维的特征向量,且xi只能为0或1,其含义是:xi=0表示xi对应于高端装备词典中的内容在该条知识资源中未出现,xi=1表示xi对应于高端装备词典的内容在该条知识资源中出现;其中,高端装备词典是通过计算机选取高端装备领域1000条样本知识资源中出现过5次以上的词汇组成,共计5000个词汇;
步骤1.2:通过m条样本知识资源的学习得到条件概率
Figure GDA0002184871370000032
和先验概率
Figure GDA0002184871370000033
学习方式如下:
Figure GDA0002184871370000041
Figure GDA0002184871370000042
其中,1≤i≤5000,1≤j≤l,Cj表示高端装备复杂知识资源的类别,
Figure GDA0002184871370000043
表示xi对应的词汇在样本知识资源k中出现,C(k)=Cj表示样本知识资源k属于类别Cj,由于从三个维度对高端装备进行分类,且每个维度类别数量不一,这里统一假设复杂知识某一维度分为l 个类别,表示为:C={C1,C2,…,Cl};
符号“1{}”定义为当“{}”内的条件为真时,其值为1,否则为0;
为了使参数
Figure GDA0002184871370000044
Figure GDA0002184871370000045
的值不为0,引入了拉普拉斯平滑对其进行处理,得到最终的参数学习公式:
Figure GDA0002184871370000046
Figure GDA0002184871370000047
步骤1.3:将步骤1.1的特征向量输入到已经训练好的朴素贝叶斯分类器中:
Figure GDA0002184871370000048
其中,C(x)表示特征向量x属于的类别,1≤j≤l;
步骤1.4:根据朴素贝叶斯分类器的计算结果,自动选取使得概率最高的类别为该条知识资源所属的类别。
本发明进一步的改进在于,所述步骤2的基于元知识模型的复杂知识获取模板由<属性> 和<属性值>组成,包括:基于元知识模型的文档类/数据类/经验类知识获取模板和基于元知识模型的过程类知识获取模板。
本发明进一步的改进在于,所述步骤2的半自动化获取技术采用产生式规则对部分模板的<属性值>进行自动获取,且该产生式规则的表现形式为:
<产生式规则>=如果<前件>,那么<后件>。
本发明进一步的改进在于,所述步骤3的对复杂知识资源从物理上进行自动分割和分布式存储的步骤如下:
步骤3.1:将由基于获取模板获取的构成元知识的<属性>和<属性值>的集合存储于元知识表中;
步骤3.2:将元知识内容按文字、音频、视频、模型、图片、公式和表格分解成m个文件分片,记为:F={F1,F2,…Fm},且
Figure GDA0002184871370000051
步骤3.3:将文件分片Fi压缩成ZIP压缩管理文件;
步骤3.4:将压缩后的文件分片Fi哈希化,并对Fi的哈希值进行取模运算,并采用一致性哈希策略将元知识内容分布式存储到N个不同的数据库中。
本发明进一步的改进在于,步骤3.4的对Fi的哈希值进行取模运算的定义如下式:
targetServer=hash(Fi)%N (7)
targetServer表示分配给每个数据库的文件分片的大小,N表示总共有N个数据库。
与现有的技术方法相比,本发明的优点在于:
(1)本发明从高端装备生命周期维度、知识表现形式维度和知识主题维度三个维度对高端装备制造企业的知识资源进行分类与归纳整理,并采用训练好的朴素贝叶斯分类器对其进行自动分类,克服了以往只囊括研发过程中某一领域或者单一维度的知识分类方式的缺陷,满足了高端装备制造企业数量庞大、内容复杂、形式多样、格式异构的知识资源的自动分类需求,实现了对高端装备制造企业复杂知识资源全面、准确的分类。
(2)根据本发明设计的基于元知识模型的复杂知识获取模板,通过标准化的知识资源获取界面,结合人工获取技术和半自动化获取技术,实现了对高端装备制造企业复杂知识资源高效、准确地获取。且基于获取模板的复杂知识半自动化获取方式便于高端装备制造企业实际应用,克服了手动获取方式效率低下、自动获取方式尚不成熟的缺陷。
(3)本发明将复杂知识资源从物理上进行分割,然后分布式保存到不同的存储空间,并将关键信息压缩使其以极小的字节存储在知识库中,实现了对高端装备制造企业数量庞大、内容复杂、形式多样、格式异构的知识资源的高效存储。
附图说明:
图1高端装备制造企业复杂知识资源分类、获取以及存储过程图
图2高端装备制造企业复杂知识资源的分类结构图;
图3元知识建模过程模型;
图4高端装备制造企业复杂知识资源获取模板,其中图3(a)为文档类/数据类/经验类知识资源的获取模板,图3(b)为过程类知识资源的获取模板;
图5高端装备制造企业复杂知识资源的存储模板。
具体实施方式:
以下结合附图对本发明做出进一步的详细说明。
为支持高端装备制造业创新发展,实现高端装备制造企业创新资源高效集成,本发明围绕高端装备产品的全生命周期,从方法和技术层面上,突破了如图1的复杂知识资源自动分类、获取以及存储的方法与技术,实现了对复杂知识资的多维度分类和高效获取与存储。
1.高端装备制造企业复杂知识自动分类方法
1.1高端装备制造企业复杂知识资源特征分析与分类
本发明基于高端装备制造企业知识资源的复杂性、分布性、异构性和变化性的特点,从便于高端装备制造企业知识资源有效管理与应用的角度,提出了如图2的从高端装备生命周期维度、知识表现形式维度和知识主题维度三个维度实现对高端装备制造知识资源进行分类与归纳整理的方法,其中,知识三维度分类的定义如下式:
KTD={LifCycDim,ExpForDim,SubDim}
LifCycDim={ProDes,ProManu,ProAsse,UseMain}
ExpForDim={DoctKn,DataKn,ProsKn,ExptKn}
SubDim={ProObjt,ProDesn,ManuEngr,UseMaint}
KTD表示高端装备复杂知识三个维度分类的集合,元素LifCycDim是知识生命周期维度的集合,元素ExpForDim是知识表现形式维度的集合,SubDim是知识主题维度的集合;
在知识生命周期维度中,元素ProDes为产品设计类知识资源,元素ProManu为产品制造类知识资源,元素ProAsse为产品装配类知识资源,元素UseMain为使用维护类知识资源;
在知识表现形式维度中,元素DoctKn为文档类知识资源,元素DataKn为数据类知识资源,元素ProsKn为过程类知识资源,元素ExptKn为专家经验类知识资源;
在知识主题维度中,元素ProObjt为产品对象类知识资源,元素ProDesn为产品设计类知识资源,元素ManuEngr为制造工程类知识资源,元素UseMaint为使用维护类知识资源。
根据上述定义,本发明建立了表1~3的知识分维度分类表。
1.1.1基于知识生命周期维度的知识资源分类
从产品生命周期维度将知识资源划分为产品设计知识、产品制造知识、产品装配知识、产品维护知识等类型,方便对复杂知识资源的获取管理。表1为建立的基于生命周期维度的复杂知识资源分类表。
表1基于生命周期维度的复杂知识资源分类表
Figure GDA0002184871370000071
Figure GDA0002184871370000081
产品设计知识:产品设计知识主要涵盖产品本身知识,产品设计过程知识,和支持产品设计的相关知识,具体表现会覆盖概念方案设计、基本设计和详细设计,即高端装备完整设计过程。
产品制造知识:产品制造知识可分为设计知识、工艺知识、检验知识和材料知识等,覆盖零部件的加工、标准零部件的选购等方面。
产品装配知识:产品装配知识涉及产品装配基础理论、装配规程设计、装配方案设计、装配路线设计、装配流程、工装设计、装配标准规范等诸多方面;覆盖各模块系统内的装配、不同模块系统间的组装等各个装配阶段。
使用维护知识:使用维护知识主要包含产品的安装调试,产品的操作使用说明及相关注意事项,产品的定期维护保养,及产品出现典型故障时的修理规程及方法。
1.1.2基于知识表现形式维度的知识资源分类
从知识资源的表现形式维度将高端装备制造企业的知识资源划分为数据类知识、文档类知识、过程类知识和经验类知识四种类型,方便复杂知识资源的存储管理。表2为建立的基于表现形式维度的复杂知识资源分类表。
表2基于表现形式维度的复杂知识资源分类表
Figure GDA0002184871370000082
数据类知识:主要包括市场调研数据、商贸数据、高端装备性能参数、精度与可靠性参数、运动功能参数、控制功能参数、电气功能参数、模块内及模块间的装配与配合结构参数、加工/检测设备数据、试验数据、检测数据等。
文档类知识:表现为纯文档、图形文档、图像文档或混合文档的形式,主要包括企业已有高端装备产品的二维图纸与三维模型、设计过程文件、制造与装配工艺文件、通用零部件模型库、标准零部件模型库、维修维护手册、工具书等。
过程类知识:主要表现为程序或软件的形式,包括决策知识软件,各类 CAD/CAE/CAPP/CAM软件,静力学分析、模态分析、动力学分析、温度-结构应力耦合分析等计算分析软件,刀具智能选配、刀具加工过程膜破损监测等过程软件等。
经验类知识:主要指企业研发人员、科研院所研究人员等在高端装备的设计、制造、装配、维修等方面的经验及他们所发表的有关高端装备研发的文章专著,高端装备制造企业所拥有的高端装备各模块研发及整机研发实例等。
1.1.3基于知识主题维度的知识资源分类
从知识资源所属主题领域维度将高端装备企业的知识资源划分为产品对象类知识、产品设计类知识、制造工程类知识和使用维护类,方便对知识资源的语义表达与应用服务。表3 为建立的基于主题维度的复杂知识资源分类表。
表3基于主题维度的复杂知识资源分类表
Figure GDA0002184871370000091
产品对象类知识:要指针对不同类高端装备产品的划分以及同类高端装备产品的细分、高端装备的模块划分、高端装备产品总体参数等。本文中的高端装备产品可分为高档数控机床、大型燃气轮机、汽轮机、超/特高压电气装备、智能电力装备等类别;高档数控机床又细分为加工中心、镗铣床、成型加工机床等不同类型机床;特定高档数控机床又分为机床支承件模块、主运动系统模块、工作台模块、进给运动系统模块、冷却系统模块、润滑系统模块、刀库系统模块、防护系统模块等不同模块系统。
产品设计类知识:用于描述高端装备产品的结构拓扑方案设计、结构基本设计、结构详细设计与结构设计有关的仿真分析与试验等知识资源。以高档数控机床的结构设计为例,在拓扑方案设计阶段,需根据机床总体性能参数对其物理域拓扑方案进行设计,如设计为箱中箱式、龙门式、双床身式、双立柱式等;在基本设计阶段,需对结构的外形及内部加强筋的布局进行设计,如矩形床身、T型床身、矩形立柱、龙门立柱、圆形或方形工作台,井字型、米字型、或其他新型的加强筋布局等;在详细设计阶段,需对结构的具体尺寸进行设计;各个设计阶段涉及到的设计技术有仿真分析与试验等。
制造工程类知识:描述高端装备产品的结构加工制造与装配流程设计等,包含零部件的加工、模块内的装配和模块间的组装。
使用维护类知识:主要包括高端装备保养、使用工作条件、设备工作状态、性能要求、故障诊断、备配件、工具资源、检测方法、维修方法等知识资源。
1.2基于朴素贝叶斯分类器的复杂知识自动分类方法
本发明从三个维度对高端装备制造企业复杂知识资源进行分类,需要说明的是,这三个维度彼此独立,且唯一标识了高端装备领域的某条知识。为解决海量知识资源的分类问题,本发明采用一种生成学习算法——朴素贝叶斯分类器对其进行自动分类。朴素贝叶斯分类方法是一种最常用的监督式文本分类方法,以贝叶斯定理为理论基础,是一种在已知先验概率与条件概率的情况下的模式识别方法。利用朴素贝叶斯分类方法对高端装备制造企业复杂知识进行自动分类包括如下三个步骤:
步骤1:将高端装备制造企业复杂知识资源映射到向量空间中,映射方式如下:
Figure GDA0002184871370000101
其中x是5000维的特征向量,且xi只能为0或1,其含义是:xi=0表示xi对应于高端装备词典中的内容在该条知识资源中未出现,xi=1表示xi对应于高端装备词典的内容在该条知识资源中出现。其中,高端装备词典是由计算机自动选取高端装备领域1000条样本知识资源中出现过5次以上的词汇组成高端装备词典,共计5000个词汇。
步骤2:通过m条样本知识资源的学习得到条件概率
Figure GDA0002184871370000111
和先验概率
Figure GDA0002184871370000112
学习方式如下:
Figure GDA0002184871370000113
Figure GDA0002184871370000114
其中,1≤i≤5000,1≤j≤l,Cj表示高端装备复杂知识资源的类别,
Figure GDA0002184871370000115
表示xi对应的词汇在样本知识资源k中出现,C(k)=Cj表示样本知识资源k属于类别Cj,由于本文从三个维度对高端装备进行分类,且每个维度类别数量不一,这里统一假设复杂知识某一维度分为l个类别,表示为:C={C1,C2,…,Cl};
符号“1{}”定义为当“{}”内的条件为真时,其值为1,否则为0;
为了使参数
Figure GDA0002184871370000116
Figure GDA0002184871370000117
的值不为0,引入了拉普拉斯平滑对其进行处理,得到最终的参数学习公式:
Figure GDA0002184871370000118
Figure GDA0002184871370000119
步骤3:将步骤1.1的特征向量输入到已经训练好的朴素贝叶斯分类器中:
Figure GDA00021848713700001110
其中,C(x)表示特征向量x属于的类别;1≤j≤l
步骤4:根据朴素贝叶斯分类器的计算结果,自动选取使得概率最高的类别为该条知识所属的类别。
2基于知识获取模板的复杂知识资源半自动化获取方法
高端装备制造企业知识资源具有内容复杂、格式异构等特性,为实现对高端装备制造企业知识资源的高效获取,本发明提出了基于知识获取模板的复杂知识资源半自动化获取方法,涉及基于元知识模型的复杂知识资源获取模板的设计方法以及基于获取模板的复杂知识资源半自动化获取技术。
2.1基于元知识模型的高端装备制造企业复杂知识资源获取模板的设计
本发明提出了基于元知识模型的高端装备制造企业复杂知识资源获取模板的设计方法,该方法涉及元知识建模技术和基于元知识模型的高端装备制造企业复杂知识资源获取模板的设计。
2.1.1元知识建模技术
定义2-1元知识及元知识建模:元知识能够独立表达某一概念、原理或事物,它是能够使受用者独立使用,并能解决相关领域问题的最小知识单元。元知识建模是对元知识的正面描述,将元知识抽象化,形成最小的知识描述单元。
元知识建模实际是为高端装备制造企业复杂异构的知识资源提供统一的知识描述形式,因而,为满足高端装备制造企业的实际需求,元知识建模需保证:1)知识描述的兼容性; 2)知识描述的一致性;3)知识描述的唯一性;4)知识描述的全面性;5)知识描述的可扩展性。为此,本发明在对高端数控备、动力装备、电力装备三类高端装备制造企业知识资源进行梳理之后,提出了如图3的统一的元知识建模过程模型。
鉴于企业知识资源绝大部分由文档类知识和过程类知识构成,且数据类知识和经验类知识与文档类知识在知识内容的获取上具有极高的相似性,为此本发明拟建立两类知识内容获取方式,即过程类知识内容获取方式和文档类、数据类、经验类知识共用的知识内容获取方式,以降低高端装备制造企业对复杂异构知识资源的获取难度,保证知识描述的统一性。
2.1.2基于元知识模型的复杂知识资源获取内容设计
元知识建模的最终目的是为高端装备制造企业复杂异构的知识资源提供统一的知识内容获取方式,为此,本发明根据近几个月在企业的深入调研和知识搜集整理的实际情况,针对文档类、数据类、经验类和过程类四大类知识,基于元知识模型,对获取内容设计如下:
1)基于元知识模型的文档类/数据类/经验类知识的获取
在分析文档类、数据类、经验类知识资源的表征上极具相似性的基础上,为实现上述三类知识资源的全面、准确的获取,规划设计出基于元知识模型的文档类/数据类/经验类知识资源的获取内容如表4所示。
表4基于元知识模型的文档类/数据类/经验类知识资源的获取内容
Figure GDA0002184871370000131
2)基于元知识模型的过程类知识资源的获取
针对过程类知识资源的特征和表现形式,本发明规划设计出基于元知识模型的过程类知识资源的获取内容如表5所示。
表5基于元知识模型的过程类知识资源的获取内容
Figure GDA0002184871370000132
Figure GDA0002184871370000141
2.1.3基于元知识模型的复杂知识资源获取模板的设计
根据规划设计出的基于元知识模型的复杂知识资源的获取内容(表4、表5),分别设计出知识资源的获取模板(如图4(a)、4(b)所示)。
2.2基于知识获取模板的复杂知识资源半自动化获取技术
本发明根据知识获取模板的<属性>和<属性值>,采用产生式规则对获取模板的部分属性值进行自动获取,获取规则如下:
<产生式规则>=如果<前件>,那么<后件>。
例如:如果<复杂知识资源是二维设计图纸>,那么<获取模板的生命周期属性的“属性值”应为“详细设计”>。
针对复杂知识获取模板中不能自动获取的<属性值>,本发明采用人工获取的方式对其< 属性值>进行获取。如“知识内容主体”这一属性的<属性值>较难自动获取,本发明采用标准化的获取界面,结合人工获取方式对其<属性值>进行获取。
3.面向高端装备制造企业知识资源的自动存储方法
针对高端装备制造企业的知识资源种类繁多、结构各异的特点,对已获取知识资源的有效存储是知识资源管理的另一关键问题。本发明综合采用数据库管理技术和文件管理技术,来实现对复杂知识资源的分类存储和管理。其中,分如下五个步骤对高端装备制造企业复杂知识资源进行存储:
步骤1:将由基于获取模板获取的构成元知识的<属性>和<属性值>的集合存储于元知识表中;
步骤2:将元知识内容分解成文字、音频、视频、模型、图片、公式、表格等m个文件分片,记为:F={F1,F2,…Fm},且
Figure GDA0002184871370000151
步骤3:将文件分片Fi压缩成ZIP压缩管理文件;
步骤4:将压缩后的文件分片Fi哈希化,并对Fi的哈希值进行取模运算(如式(7)所示),并采用一致性哈希策略将元知识内容分布式存储到N个不同的数据库中。
targetServer=hash(Fi)%N (7)
targetServer表示分配给每个数据库的文件分片的大小,N表示总共有N个数据库。据此,形成图5的高端装备制造企业复杂知识资源存储模板。
基于上述存储模板,采用MySQL大型数据库实现对不同知识资源的存储。将知识资源从物理上进行分割分布式保存到不同存储空间中,并采用数据压缩技术进行存储,以此满足海量知识资源的存储需求。

Claims (6)

1.一种适用于高端装备的复杂知识自动分类、获取及存储方法,其特征在于,包括以下步骤:
步骤1:根据高端装备制造企业复杂知识资源的特征,从高端装备生命周期维度、知识表现形式维度和知识主题维度三个维度对其进行梳理,并用朴素贝叶斯分类器对其进行自动分类;所述步骤1的采用朴素贝叶斯分类器进行分类,包括如下步骤:
步骤1.1:将高端装备制造企业复杂知识资源映射到向量空间中,映射方式如下:
Figure FDA0002184871360000011
其中,x是5000维的特征向量,且xi只能为0或1,其含义是:xi=0表示xi对应于高端装备词典中的内容在该条知识资源中未出现,xi=1表示xi对应于高端装备词典的内容在该条知识资源中出现;其中,高端装备词典是通过计算机选取高端装备领域1000条样本知识资源中出现过5次以上的词汇组成,共计5000个词汇;
步骤1.2:通过m条样本知识资源的学习得到条件概率
Figure FDA0002184871360000012
和先验概率
Figure FDA0002184871360000013
学习方式如下:
Figure FDA0002184871360000014
Figure FDA0002184871360000015
其中,1≤i≤5000,1≤j≤l,Ci表示高端装备复杂知识资源的类别,
Figure FDA0002184871360000016
表示xi对应的词汇在样本知识资源k中出现,C(k)=Cj表示样本知识资源k属于类别Cj,由于从三个维度对高端装备进行分类,且每个维度类别数量不一,这里统一假设复杂知识某一维度分为l个类别,表示为:C={C1,C2,…,Cl};
符号“1{}”定义为当“{}”内的条件为真时,其值为1,否则为0;
为了使参数
Figure FDA0002184871360000021
Figure FDA0002184871360000022
的值不为0,引入了拉普拉斯平滑对其进行处理,得到最终的参数学习公式:
Figure FDA0002184871360000023
Figure FDA0002184871360000024
步骤1.3:将步骤1.1的特征向量输入到已经训练好的朴素贝叶斯分类器中:
Figure FDA0002184871360000025
其中,C(x)表示特征向量x属于的类别,1≤j≤l;
步骤1.4:根据朴素贝叶斯分类器的计算结果,自动选取使得概率最高的类别为该条知识资源所属的类别;
步骤2:在上述步骤1对高端装备制造企业复杂知识资源自动分类的基础之上,按照其表现形式选取相应的基于元知识模型的复杂知识获取模板,通过标准化的知识资源获取界面,结合人工获取技术和半自动化获取技术,对复杂知识资源进行获取;
步骤3:针对上述步骤1和步骤2对高端装备制造企业知识资源的自动分类和获取结果,通过一系列的自动切分规则将这些复杂知识资源从物理上进行分割,然后分布式保存到不同的存储空间,并将关键信息压缩成ZIP压缩管理文件,使其以自身40%~90%的大小存储在知识库中,以实现海量知识资源的高效存储。
2.根据权利要求1所述的一种适用于高端装备的复杂知识自动分类、获取及存储方法,其特征在于,所述步骤1的知识三维度分类的定义如下:
KTD={LifCycDim,ExpForDim,SubDim}
LifCycDim={ProDes,ProManu,ProAsse,UseMain}
ExpForDim={DoctKn,DataKn,ProsKn,ExptKn}
SubDim={ProObjt,ProDesn,ManuEngr,UseMaint}
KTD表示高端装备复杂知识三个维度分类的集合,元素LifCycDim是知识生命周期维度的集合,元素ExpForDim是知识表现形式维度的集合,SubDim是知识主题维度的集合;
在知识生命周期维度中,元素ProDes为产品设计类知识资源,元素ProManu为产品制造类知识资源,元素ProAsse为产品装配类知识资源,元素UseMain为使用维护类知识资源;
在知识表现形式维度中,元素DoctKn文档类知识资源,元素DataKn为数据类知识资源,元素ProsKn为过程类知识资源,元素ExptKn为专家经验类知识资源;
在知识主题维度中,元素ProObjt为产品对象类知识资源,元素ProDesn为产品设计类知识资源,元素ManuEngr为制造工程类知识资源,元素UseMaint为使用维护类知识资源。
3.根据权利要求1所述的一种适用于高端装备的复杂知识自动分类、获取及存储方法,其特征在于,所述步骤2的基于元知识模型的复杂知识获取模板由<属性>和<属性值>组成,包括:基于元知识模型的文档类/数据类/经验类知识获取模板和基于元知识模型的过程类知识获取模板。
4.根据权利要求1所述的一种适用于高端装备的复杂知识自动分类、获取及存储方法,其特征在于,所述步骤2的半自动化获取技术采用产生式规则对部分模板的<属性值>进行自动获取,且该产生式规则的表现形式为:
<产生式规则>=如果<前件>,那么<后件>。
5.根据权利要求1所述的一种适用于高端装备的复杂知识自动分类、获取及存储方法,其特征在于,所述步骤3的对复杂知识资源从物理上进行自动分割和分布式存储的步骤如下:
步骤3.1:将由基于获取模板获取的构成元知识的<属性>和<属性值>的集合存储于元知识表中;
步骤3.2:将元知识内容按文字、音频、视频、模型、图片、公式和表格分解成m个文件分片,记为:F={F1,F2,…Fm},且
Figure FDA0002184871360000031
1≤i<j≤m;
步骤3.3:将文件分片Fi压缩成ZIP压缩管理文件;
步骤3.4:将压缩后的文件分片Fi哈希化,并对Fi的哈希值进行取模运算,并采用一致性哈希策略将元知识内容分布式存储到N个不同的数据库中。
6.根据权利要求5所述的一种适用于高端装备的复杂知识自动分类、获取及存储方法,其特征在于,步骤3.4的对Fi的哈希值进行取模运算的定义如下式:
targetServer=hash(Fi)%N (7)
targetServer表示分配给每个数据库的文件分片的大小,N表示总共有N个数据库。
CN201611030674.1A 2016-11-16 2016-11-16 一种适用于高端装备的复杂知识自动分类、获取及存储方法 Active CN106599064B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611030674.1A CN106599064B (zh) 2016-11-16 2016-11-16 一种适用于高端装备的复杂知识自动分类、获取及存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611030674.1A CN106599064B (zh) 2016-11-16 2016-11-16 一种适用于高端装备的复杂知识自动分类、获取及存储方法

Publications (2)

Publication Number Publication Date
CN106599064A CN106599064A (zh) 2017-04-26
CN106599064B true CN106599064B (zh) 2020-03-17

Family

ID=58592533

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611030674.1A Active CN106599064B (zh) 2016-11-16 2016-11-16 一种适用于高端装备的复杂知识自动分类、获取及存储方法

Country Status (1)

Country Link
CN (1) CN106599064B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239511A (zh) * 2017-05-17 2017-10-10 苏州市千尺浪信息科技服务有限公司 一种数字化信息的整理方法
CN107798387B (zh) * 2017-11-01 2020-07-28 西安交通大学 一种适用于高端装备全生命周期的知识服务系统及方法
CN110019809B (zh) * 2018-01-02 2021-11-19 中国移动通信有限公司研究院 一种分类确定方法、装置及网络设备
CN109828986B (zh) * 2019-01-15 2023-09-01 巨轮智能装备股份有限公司 一种面向定制装备制造协同过程的信息智能化处理方法
CN110209814B (zh) * 2019-05-23 2021-02-02 西安交通大学 一种利用领域建模从百科知识网站抽取知识主题的方法
CN111309928A (zh) * 2020-02-21 2020-06-19 广东电网有限责任公司 一种基于贝叶斯和语义分析的运维知识库构建方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744919A (zh) * 2013-12-26 2014-04-23 广州供电局有限公司 电网知识库的自学习方法和系统
CN105634803A (zh) * 2015-12-29 2016-06-01 清华大学 工程机械生命周期信息追溯系统及追溯方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150347926A1 (en) * 2014-06-02 2015-12-03 Salesforce.Com, Inc. Fast Naive Bayesian Framework with Active-Feature Ordering

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744919A (zh) * 2013-12-26 2014-04-23 广州供电局有限公司 电网知识库的自学习方法和系统
CN105634803A (zh) * 2015-12-29 2016-06-01 清华大学 工程机械生命周期信息追溯系统及追溯方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于可配置模板的产品设计知识多维度表达方法;明振军等;《北京理工大学学报》;20140930;第34卷(第9期);第917-922页 *
基于朴素贝叶斯的分类方法研究;周龙;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20061215(第12期);I140-95 *

Also Published As

Publication number Publication date
CN106599064A (zh) 2017-04-26

Similar Documents

Publication Publication Date Title
CN106599064B (zh) 一种适用于高端装备的复杂知识自动分类、获取及存储方法
Lupinetti et al. Content-based CAD assembly model retrieval: Survey and future challenges
Ahmad et al. Current trend in computer aided process planning
Angrish et al. MVCNN++: computer-aided design model shape classification and retrieval using multi-view convolutional neural networks
CN107967518B (zh) 一种基于产品设计的知识自动关联系统及方法
CN112395424A (zh) 一种复杂产品质量问题追溯方法及系统
KR20190062848A (ko) 점진적 학습 모델을 이용한 빅데이터 마이닝 시스템 및 그 방법
Wang et al. Applying CBR to machine tool product configuration design oriented to customer requirements
Ramanujan et al. A framework for visualization-driven eco-conscious design exploration
Liu et al. A new method of reusing the manufacturing information for the slightly changed 3D CAD model
CN115186745A (zh) 一种基于本体的数字孪生车间多维信息融合方法
Wen et al. The key technologies of machining process design: a review
Bian et al. HG-CAD: hierarchical graph learning for material prediction and recommendation in computer-aided design
Borkar et al. Automatic extraction of machining features from prismatic parts using STEP for downstream applications
Luo et al. An ELM-embedded deep learning based intelligent recognition system for computer numeric control machine tools
CN116662628A (zh) 一种基于复杂薄壁零件的三维cad模型检索方法
CN112487717B (zh) 一种船用柴油机关键件的可制造性智能评价方法
CN107515979B (zh) 一种对大批量工件模型数据的处理方法及处理系统
CN109492303B (zh) 一种基于产品族脚本的推导规则自动生成方法
Yusof et al. Computer aided process planning: a comprehensive survey
Roj et al. Classification of CAD-Models Based on Graph Structures and Machine Learning
Ramanujan et al. ShapeSIFT: Suggesting sustainable options in design reuse from part repositories
Nasr et al. A feature–based approach to an integrated CAD/CAPP system in sheet metal blanking dies
CN111581815A (zh) 一种基于xml的工艺模型本体构建方法
CN111881182A (zh) 一种基于多源异构特征的数据集概况测评方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant