CN107291808A - 一种基于语义的云制造大数据分类方法 - Google Patents

一种基于语义的云制造大数据分类方法 Download PDF

Info

Publication number
CN107291808A
CN107291808A CN201710343275.9A CN201710343275A CN107291808A CN 107291808 A CN107291808 A CN 107291808A CN 201710343275 A CN201710343275 A CN 201710343275A CN 107291808 A CN107291808 A CN 107291808A
Authority
CN
China
Prior art keywords
manufacturing service
cloud
mrow
manufacturing
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710343275.9A
Other languages
English (en)
Inventor
孙雁飞
胡致远
亓晋
许斌
王堃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201710343275.9A priority Critical patent/CN107291808A/zh
Publication of CN107291808A publication Critical patent/CN107291808A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于语义的云制造大数据分类方法,具体包含如下步骤:步骤1,云制造服务平台服务器接收到服务提供方的请求,服务器接收封装后的制造服务信息数据,构成制造服务资源树;步骤2,对制造服务的输出项进行语义相似度计算,形成语义相似度矩阵;步骤3,云制造服务平台服务器使用聚类算法对语义相似度矩阵进行聚类计算;步骤4,云制造服务平台服务器在不破坏制造服务资源树的前提下,依据聚类结果将制造服务数据分为若干个数据块,并将每个聚类中心的输出项语义描述作为标签赋予对应的数据块,进而将数据块存储到数据中心中。使云制造服务平台能够较为方便地进行后续的查询,更新,组合匹配等工作,提高工作效率,降低平台成本。

Description

一种基于语义的云制造大数据分类方法
技术领域
本发明属于数据分类处理领域,尤其涉及一种基于语义的云制造大数据分类方法。
背景技术
互联网经济的快速发展使得经济全球化和全球市场竞争进入了新阶段,受相关商业模式、制造模式、技术平台等诸多因素的影响,制造业正面临资源闲置和资源瓶颈的困局。为了应对这样的困局,并且为了市场多元化和制造服务技术的发展,云制造作为一种面向服务、高效低耗、信息化的智能网络化制造新模式被提出。它将云计算中的软件、平台和基础设施服务化模式拓展到了制造领域,通过制造资源和能力的服务化,形成了更为丰富的“制造即服务模式”,包括:论证即服务、设计即服务、生产加工即服务、实验即服务、仿真即服务、经营管理即服务、集成即服务等。
在云制造环境中,一般包括三种类型的角色,分别是服务提供方、服务使用方和云制造服务平台。服务提供方向云制造服务平台提供自身拥有的制造资源和能力。服务使用方为了实现自身制造和生产任务,通过云制造服务平台按需购买和租用云制造服务平台提供的服务。云制造服务平台为服务提供方存储、管理其提供至该平台的能力和资源的制造服务,同时为服务使用方检索、调度和使用制造服务提供支撑,它可以利用制造服务使能技术将制造资源和能力转化为制造服务,通过智能化的和统一的方式管理操作制造资源和能力,使企业分散且多样化的制造资源和能力能够有效的整合与共享。
随着云制造的普及,越来越多的制造资源和能力会被封装成制造服务注册到云制造服务平台,由于企业的制造水平在不断提高,也就必须对制造服务进行不断的更新。如何预处理海量数据,方便后续的查询,更新,组合等工作,这对云制造服务平台提出了严峻的挑战,针对云制造环境下的大数据处理问题应运而生。
发明内容
本发明所要解决的技术问题是针对背景技术的不足提供了一种基于语义的云制造大数据分类方法;其能够解决云制造服务平台的大数据处理问题,提高数据处理效率,使云制造服务平台能够较为方便地进行后续的查询,更新,组合匹配等工作,提高工作效率,降低平台成本。
本发明为解决上述技术问题采用以下技术方案
一种基于语义的云制造大数据分类方法,具体包括如下步骤:
步骤1,云制造服务平台服务器接收到服务提供方的注册请求,云制造服务平台服务器接收封装后的制造服务,构成制造服务资源树;
步骤2,对制造服务的输出项进行语义相似度计算,形成语义相似度矩阵;
步骤3,云制造服务平台服务器使用聚类算法对语义相似度矩阵进行聚类计算;
步骤4,云制造服务平台服务器在不破坏制造服务资源树的前提下,依据聚类结果将制造服务分为若干个数据块,并将每个聚类中心的输出项语义描述作为标签赋予对应的数据块,进而将数据块存储到数据中心。
作为本发明一种基于语义的云制造大数据分类方法的进一步优选方案,所述制造服务包括输入、输出和评价指标;所述输入指制造服务的基本信息描述,所述输入包括制造服务名称、制造服务类型、制造服务所属企业名称和企业地址;所述输出指制造服务所能完成制造任务的基本信息描述,所述输出包括制造任务名称和制造任务类型;所述评价指标指平台对制造服务的评价指标。
作为本发明一种基于语义的云制造大数据分类方法的进一步优选方案,所述语义相似度具体表示如下:
其中,α12为语义相似度的比较对象,W1,k,W2,k分别为α12中特征值的权值,k为特征值的当前索引下标,n为特征值数量。
作为本发明一种基于语义的云制造大数据分类方法的进一步优选方案,所述云制造服务平台服务器包含控制模块和计算模块,所述控制模块用于根据制造服务的数量将语义相似度计算任务分配给计算模块,以及根据计算模块的返回结果构成语义相似度矩阵;所述计算模块用于完成计算任务并将结果返回给控制模块。
作为本发明一种基于语义的云制造大数据分类方法的进一步优选方案,所述聚类算法采用马尔科夫聚类算法。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
本发明使云制造服务平台能够较为方便地进行后续的查询,更新,组合匹配等工作,利用语义相似度和聚类技术对云制造平台的大数据进行预处理,提高了后续工作效率,降低了云制造平台成本。
附图说明
图1是本发明的流程图;
图2是本发明制造服务资源树的结构示意图;
图3是云制造服务平台服务器的控制模块的结构原理图;
图4是云制造服务平台服务器计算模块的结构原理图;
图5是本发明的数据中心关系图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
如图1所示,本发明提供一种基于语义的云制造大数据分类方法,具体包括如下步骤:
步骤1,云制造服务平台服务器接收到服务提供方的请求(默认为注册请求),服务器接收封装后的制造服务信息数据,构成制造服务资源树如图2所示,制造服务包括输入,输出,评价指标;输入是指制造服务的基本信息描述,包括制造服务名称,制造服务类型,制造服务所属企业名称,企业地址等;输出是指制造服务所能完成制造任务的基本信息描述,包括制造任务名称,制造任务类型等;评价指标是指平台对制造服务的评价指标(默认为QoS指标);
步骤2,云制造服务平台服务器在一段时间之后,会积累一定数量的制造服务,形成制造服务数据集,对数据集中制造服务的输出项进行语义相似度计算,形成语义相似度矩阵。所述语义相似度具体表示如下:
其中,α12为语义相似度的比较对象,W1,k,W2,k分别为α12中特征值的权值,k为特征值的当前索引下标,n为特征值数量。
例如:某封装后的制造服务A和B的输出项分别为{玻璃,后视镜},{玻璃,挡风玻璃},设各向量权值均为1,则特征值向量为{玻璃,后视镜,挡风玻璃},制造服务A的权值向量为{1,1,0},制造服务B的权值向量为{1,0,1},制造服务A与B的语义相似度Similarity(A,B)=1/2;
步骤2.1:云制造服务平台服务器中的控制模块如图3所示。根据制造服务数据集中的制造服务数量,将语义相似度计算任务分配给计算模块;
步骤2.2:云制造服务平台服务器中的计算模块如图4所示,接受到任务后,完成计算任务并将结果返回给控制模块;
步骤2.3:云制造服务平台服务器中的控制模块根据计算模块的返回结果,构成语义相似度矩阵;
步骤3:云制造服务平台服务器使用聚类算法(默认为马尔科夫聚类)对语义相似度矩阵进行聚类计算;
步骤3.1:云制造服务平台服务器中的控制模块将语义相似度矩阵分成若干个矩阵子块,并将矩阵子块分配给计算模块;
步骤3.2:云制造服务平台服务器中的计算模块接受到矩阵子块后,利用聚类算法(默认为马尔科夫聚类)完成计算任务并将结果返回给控制模块;
步骤3.3:云制造服务平台服务器中的控制模块根据计算模块的返回结果,完成矩阵的聚类计算;
步骤4:云制造服务平台服务器在不破坏制造服务资源树的前提下,依据聚类结果将制造服务数据分为若干个数据块,并将每个聚类中心的输出项语义描述作为标签赋予对应的数据块,最后将数据块存储到数据中心中;云制造服务平台拥有若干数据中心如图5所示,
步骤5:云制造服务平台服务器计算数据中心已有数据块标签和将要存储数据块标签的语义相似度,得到最高语义相似度标签所在的数据中心,在数据中心剩余存储资源满足数据块存储要求的前提下,将数据块存储到拥有与自身最高语义相似度数据块所在的数据中心。
本发明使云制造服务平台能够较为方便地进行后续的查询,更新,组合匹配等工作,利用语义相似度和聚类技术对云制造平台的大数据进行预处理,提高了后续工作效率,降低了云制造平台成本。

Claims (5)

1.一种基于语义的云制造大数据分类方法,其特征在于:具体包括如下步骤:
步骤1,云制造服务平台服务器接收到服务提供方的注册请求,云制造服务平台服务器接收封装后的制造服务,构成制造服务资源树;
步骤2,对制造服务的输出项进行语义相似度计算,形成语义相似度矩阵;
步骤3,云制造服务平台服务器使用聚类算法对语义相似度矩阵进行聚类计算;
步骤4,云制造服务平台服务器在不破坏制造服务资源树的前提下,依据聚类结果将制造服务分为若干个数据块,并将每个聚类中心的输出项语义描述作为标签赋予对应的数据块,进而将数据块存储到数据中心。
2.根据权利要求1所述的一种基于语义的云制造大数据分类方法,其特征在于:所述制造服务包括输入、输出和评价指标;所述输入指制造服务的基本信息描述,所述输入包括制造服务名称、制造服务类型、制造服务所属企业名称和企业地址;所述输出指制造服务所能完成制造任务的基本信息描述,所述输出包括制造任务名称和制造任务类型;所述评价指标指平台对制造服务的评价指标。
3.根据权利要求1所述的一种基于语义的云制造大数据分类方法,其特征在于:在步骤2中:所述语义相似度具体表示如下:
<mrow> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mi>i</mi> <mi>l</mi> <mi>a</mi> <mi>r</mi> <mi>i</mi> <mi>t</mi> <mi>y</mi> <mrow> <mo>(</mo> <msub> <mi>&amp;alpha;</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>&amp;alpha;</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>W</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>k</mi> </mrow> </msub> <msub> <mi>W</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>/</mo> <msqrt> <mrow> <mo>(</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msubsup> <mi>W</mi> <mrow> <mn>1</mn> <mo>,</mo> <mi>k</mi> </mrow> <mn>2</mn> </msubsup> <mo>)</mo> <mo>(</mo> <msubsup> <mi>W</mi> <mrow> <mn>2</mn> <mo>,</mo> <mi>k</mi> </mrow> <mn>2</mn> </msubsup> <mo>)</mo> </mrow> </msqrt> </mrow>
其中,α12为语义相似度的比较对象,W1,k,W2,k分别为α12中特征值的权值,k为特征值的当前索引下标,n为特征值数量。
4.根据权利要求1所述的一种基于语义的云制造大数据分类方法,其特征在于:所述云制造服务平台服务器包含控制模块和计算模块,所述控制模块用于根据制造服务的数量将语义相似度计算任务分配给计算模块,以及根据计算模块的返回结果构成语义相似度矩阵;所述计算模块用于完成计算任务并将结果返回给控制模块。
5.根据权利要求1所述的一种基于语义的云制造大数据分类方法,其特征在于:在步骤3中:所述聚类算法采用马尔科夫聚类算法。
CN201710343275.9A 2017-05-16 2017-05-16 一种基于语义的云制造大数据分类方法 Pending CN107291808A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710343275.9A CN107291808A (zh) 2017-05-16 2017-05-16 一种基于语义的云制造大数据分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710343275.9A CN107291808A (zh) 2017-05-16 2017-05-16 一种基于语义的云制造大数据分类方法

Publications (1)

Publication Number Publication Date
CN107291808A true CN107291808A (zh) 2017-10-24

Family

ID=60095278

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710343275.9A Pending CN107291808A (zh) 2017-05-16 2017-05-16 一种基于语义的云制造大数据分类方法

Country Status (1)

Country Link
CN (1) CN107291808A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108681790A (zh) * 2018-05-10 2018-10-19 北京理工大学 一种面向个性化定制产品的装配线模块划分方法
CN109948909A (zh) * 2019-02-26 2019-06-28 国网山东省电力公司莒县供电公司 一种电网数据采集分析方法及系统
CN112564928A (zh) * 2019-09-10 2021-03-26 华为技术有限公司 服务分类方法及设备、互联网系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020722A (zh) * 2012-11-20 2013-04-03 北京航空航天大学 一种支持制造能力按需使用和共享流通的云制造能力描述方法
CN103544255A (zh) * 2013-10-15 2014-01-29 常州大学 基于文本语义相关的网络舆情信息分析方法
US20150006117A1 (en) * 2013-07-01 2015-01-01 Here Global B.V. Learning Synthetic Models for Roof Style Classification Using Point Clouds
CN104731958A (zh) * 2015-04-03 2015-06-24 北京航空航天大学 一种面向用户需求倾向的云制造服务推荐方法
CN105635283A (zh) * 2015-12-30 2016-06-01 南京邮电大学 一种云制造服务的组织管理和使用方法和系统
CN106610951A (zh) * 2016-09-29 2017-05-03 四川用联信息技术有限公司 改进的基于语义分析的文本相似度求解算法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020722A (zh) * 2012-11-20 2013-04-03 北京航空航天大学 一种支持制造能力按需使用和共享流通的云制造能力描述方法
US20150006117A1 (en) * 2013-07-01 2015-01-01 Here Global B.V. Learning Synthetic Models for Roof Style Classification Using Point Clouds
CN103544255A (zh) * 2013-10-15 2014-01-29 常州大学 基于文本语义相关的网络舆情信息分析方法
CN104731958A (zh) * 2015-04-03 2015-06-24 北京航空航天大学 一种面向用户需求倾向的云制造服务推荐方法
CN105635283A (zh) * 2015-12-30 2016-06-01 南京邮电大学 一种云制造服务的组织管理和使用方法和系统
CN106610951A (zh) * 2016-09-29 2017-05-03 四川用联信息技术有限公司 改进的基于语义分析的文本相似度求解算法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108681790A (zh) * 2018-05-10 2018-10-19 北京理工大学 一种面向个性化定制产品的装配线模块划分方法
CN108681790B (zh) * 2018-05-10 2021-08-17 北京理工大学 一种面向个性化定制产品的装配线模块划分方法
CN109948909A (zh) * 2019-02-26 2019-06-28 国网山东省电力公司莒县供电公司 一种电网数据采集分析方法及系统
CN112564928A (zh) * 2019-09-10 2021-03-26 华为技术有限公司 服务分类方法及设备、互联网系统

Similar Documents

Publication Publication Date Title
Hu et al. Time-and cost-efficient task scheduling across geo-distributed data centers
CN108415944B (zh) 一种交通环境下基于微服务的实时计算系统及其实现方法
CN108551766A (zh) 用于与服务提供者的会话建立的自然语言处理
CN106651213A (zh) 服务订单的处理方法及装置
CN102521364B (zh) 一种图上两点间最短路径查询方法
CN107291808A (zh) 一种基于语义的云制造大数据分类方法
Li et al. Resource scheduling based on improved spectral clustering algorithm in edge computing
Li et al. Energy efficient resource management and task scheduling for IoT services in edge computing paradigm
CN109150738A (zh) 工业互联网资源管理方法及系统、可读存储介质和终端
CN105677447A (zh) 分布式云中基于聚类的时延带宽极小化虚拟机部署方法
CN111445094B (zh) 一种结合时间要求的快递车辆路径优化的方法及系统
CN110209674A (zh) 一种工业环境粉尘监控微信小程序的云端数据库统计方法及装置
Zhang et al. Quantified edge server placement with quantum encoding in internet of vehicles
Atta et al. Solving a new variant of the capacitated maximal covering location problem with fuzzy coverage area using metaheuristic approaches
CN106447257A (zh) 一种多功能仓库管理系统
CN104346441B (zh) 一种配电网信息数据动态集成交互方法
CN113127176A (zh) 一种用于工作平台的多角色任务分配方法及系统
CN104778205A (zh) 一种基于异构信息网络的移动应用排序和聚类方法
CN111953788A (zh) 一种大型云平台
CN101516086B (zh) 移动通讯的业务匹配方法
CN110119317A (zh) 一种基于遗传算法的云计算任务调度方法和系统
CN110008970A (zh) 一种地址信息生成方法和装置
CN102929914A (zh) 一种基于p2p节点调度的移动地图服务搜索方法
CN104702676B (zh) 一种铁路分布式数据中心资源调度方法
CN114417577A (zh) 跨平台资源调度与优化控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171024