CN108009089A - 一种基于透明计算的增量机器学习方法及系统 - Google Patents

一种基于透明计算的增量机器学习方法及系统 Download PDF

Info

Publication number
CN108009089A
CN108009089A CN201711245791.4A CN201711245791A CN108009089A CN 108009089 A CN108009089 A CN 108009089A CN 201711245791 A CN201711245791 A CN 201711245791A CN 108009089 A CN108009089 A CN 108009089A
Authority
CN
China
Prior art keywords
transparent
data
service device
test
fringe node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711245791.4A
Other languages
English (en)
Other versions
CN108009089B (zh
Inventor
梁中鹤
郭克华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201711245791.4A priority Critical patent/CN108009089B/zh
Publication of CN108009089A publication Critical patent/CN108009089A/zh
Application granted granted Critical
Publication of CN108009089B publication Critical patent/CN108009089B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3688Test management for test execution, e.g. scheduling of test suites
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于透明计算的增量机器学习方法及系统,采用了基于透明计算的增量机器学习框架,使得其可以在低网络依赖的前提下,高效的进行机器学习。并且本发明将训练数据进行拆分处理,在保证了测试精确度的情况下大幅降低了机器学习的时间消耗,提高了机器学习的效率。另外,本发明还通过增量式的反馈学习,不断地提高机器学习的准确性。

Description

一种基于透明计算的增量机器学习方法及系统
技术领域
本发明涉及机器学习领域,特别是一种基于透明计算的增量机器学习方法及系统。
背景技术
随着移动网络和各种轻量级客户端的普及,物联网不断地改变着我们的日常生活。智能手机、可穿戴设备和移动传感器等各种物联网应用已经广泛应用于医疗、智能家居、环境监测、智能交通等领域。传统上,轻量级客户端只具有数据收集和数据显示的能力。然而,在许多情况下,为了能够确保实时性能,我们更倾向于使得客户端具有一些职能功能,比如面部识别、目标检测等,这些功能不需要将数据传送到服务器进行处理。另外,在一些诸如隧道、偏远地方等网络连接较差的地区,我们更希望客户端具备智能能力。因此,智能化已经逐渐成为了物联网环境下的各类客户的基本要求。
机器学习可以分为无监督学习和监督学习,它是实现机器智能的一种有代表性的技术。与无监督学习相比,监督学习的应用更为广泛。监督学习通常包括数据训练和数据测试,前者输入大量的训练数据,然后使用相应的算法生成相应的测试模型,而后者使用测试模型来对新的样本进行分析判断。一般来说,数据训练需要消耗大量的计算资源,但是一旦测试模型生成,测试就可以以很少的计算资源快速地完成。
在客户端不断轻量化和小型化的趋势下,物联网环境下的机器学习面临着新的问题,即计算能力和服务需求的不匹配。具体而言,包括以下几个方面:
(1)客户端的异构性。客户端采集到的数据往往来自不同的设备,例如传感器、程序生成、用户生成等等。不同的设备需要兼容性各不相同的训练算法,使得训练成本大幅提高。
(2)计算能力有限。客户端的计算能力往往很难存储大量的数据,也很难对其进行较为复杂的运算处理。
(3)通信消耗。当大量数据需要传输到云端服务器进行处理的情况下,服务可能会因为大量的通信消耗而产生延迟,并且训练过程只能在线完成,并不能离线进行。
发明内容
本发明所要解决的技术问题是,针对现有技术不足,提供一种基于透明计算的增量机器学习方法及系统,避免多客户端差异造成的兼容问题,缓解因计算能力不足而导致的系统延迟,缓解由于单个节点存储能力有限而造成的IO阻塞的问题,降低由于通信消耗而造成的系统延迟,提高用户体验度。
为解决上述技术问题,本发明所采用的技术方案是:一种基于透明计算的增量机器学习方法,包括以下步骤:
1)透明客户端、透明服务器以及边缘节点同时进行数据采集;其中,透明客户端采集到的数据发送到透明服务器以及边缘节点的存储空间中;
2)透明服务器和边缘节点根据采集到的数据以及各自的计算能力分别对各自节点上的数据进行训练;
3)透明服务器和边缘节点将训练生成的测试模型分别发送到相应的透明客户端中;
4)将测试数据分别根据不同节点以及服务器获得的测试模型进行测试,透明客户端对静态的测试结果进行整理,根据测试结果的分类概率进行均值计算,进而更新最终的测试结果;
5)用户根据得到的最终的测试结果进行独立判断,并将判断结果反馈到透明服务器或边缘节点中;透明服务器和边缘节点收集到来自用户反馈的数据信息,暂时存储起来,等待收集到的反馈信息积累到一定的量,即各个类别的反馈数据信息都达到了可以进行训练的数量,重复步骤2)到步骤4)。。
相应的,本发明还提供了一种基于透明计算的增量机器学习系统,其包括:
透明客户端:用于与透明服务器以及边缘节点同时进行数据采集,并将采集到的数据发送到透明服务器以及边缘节点的存储空间中;
透明服务器:用于与透明客户端以及边缘节点同时进行数据采集,并根据采集到的数据以及自身的计算能力对自身节点上的数据进行训练,然后将训练生成的测试模型分别发送到相应的透明客户端中;将测试数据分别根据不同的测试模型进行测试,对静态的测试进行动态的更新,最终综合所有的测试结果来更新测试结果;
边缘节点:用于与透明客户端以及透明服务器同时进行数据采集,并根据采集到的数据以及自身的计算能力对自身节点上的数据进行训练,然后将训练生成的测试模型分别发送到相应的透明客户端中;
用户端:用于根据得到的测试结果进行独立判断,并将判断结果反馈到透明服务器或边缘节点中,这些被反馈的数据信息和采集到的数据一起进行下一轮训练。
与现有技术相比,本发明所具有的有益效果为:
(1)解决客户端的异构性,使得不同类型的客户端采集到的数据统一传输到透明服务器或边缘节点来进行训练操作,避免了由于客户端差异而造成的兼容问题。
(2)将数据训练过程分散到透明服务器和各个边缘节点中,减少单个节点的计算量,缓解了因计算能力不足而导致的系统延迟。
(3)采集到的数据通过一种多级缓存管理策略(以往的情况下,客户端承担了存储采集到的数据的任务,但是在这种方法框架下,客户端在第一步直接将采集到的数据转移存储到服务器和边缘节点中)分散存储到透明服务器和边缘节点中,缓解了由于单个节点存储能力有限而造成的IO阻塞的问题。
(4)由于数据被分散到服务端和各个边缘节点进行处理,以及客户端可以通过接收到的测试模型来进行离线测试,所以大幅降低了由于通信消耗而造成的系统延迟。
(5)实时性。由于透明客户端中存储了大量已经训练好的测试模型,进而保证了测试结果能够在离线状态下实时得到,提高用户体验度。
附图说明
图1为本发明系统框架图;
图2为本发明增量学习流程图。
具体实施方式
如图1所示,本发明系统的框架如图1所示。它主要包含三个部分:透明服务器、透明客户端、边缘节点。训练的数据可以从三个部分获得,但数据训练只能在有着较强计算能力的透明服务器和边缘节点上进行。
透明服务器和透明客户端中的网络配置中存储了从客户端到透明服务器之间的所有边缘节点的通讯信息。基于透明客户端上的测试模型,透明客户端可以进行用户测试,并且用户可以对测试的结果进行用户反馈,修订其正确性。透明客户端、边缘节点和透明服务器都可以进行数据采集,一旦数据采集发生在透明客户端,它可以将采集到的数据通过网络发送到边缘节点或者透明服务器。采集到的数据将存储在透明服务器的存储器或者各类节点的缓存中。另外,在边缘节点和透明服务器中还配置了相应的机器学习算法,例如深度学习、支持向量机等等。这些算法都是预配置在系统中的,并且将会在数据进行训练之前通过相应的安装包进行自动安装。机器学习算法还提供了数据训练所需要的训练模型,数据通过这些训练模型生成测试模型,并将这些测试模型发送到相应的透明客户端上,用来进行相应的用户测试。
在系统进行初始化和网络配置之后,系统将以一种增量学习的方式来运行。增量学习的流程如图2所示。
第一步,透明客户端、透明服务器以及边缘节点同时进行数据采集。其中,透明客户端采集到的数据将发送到另外两类节点的存储空间中。
第二步,透明服务器和边缘节点根据采集到的数据以及各自的计算能力分别对各自节点上的数据进行数据训练。
第三步,透明服务器和边缘节点将训练生成的测试模型分别发送到相应的透明客户端中。
第四步,将测试数据分别根据不同的测试模型进行测试,透明客户端将对静态的测试进行动态的更新,最终综合所有的测试结果来更新测试结果,提高测试的准确率。
第五步,用户可以根据得到的结果进行独立判断,判断结果将通过用户反馈将反馈信息重新发送到透明服务器或边缘节点中,这些被反馈的数据信息将和采集到的数据一起进行下一轮训练。
本发明由于采用了基于透明计算的增量机器学习框架,使得其可以在低网络依赖的前提下,高效的进行机器学习。并且本发明将训练数据进行拆分处理,在保证了测试精确度的情况下大幅降低了机器学习的时间消耗,提高了机器学习的效率。另外,本发明还通过增量式的反馈学习,不断地提高机器学习的准确性。

Claims (2)

1.一种基于透明计算的增量机器学习方法,其特征在于,包括以下步骤:
1)透明客户端、透明服务器以及边缘节点同时进行数据采集;其中,透明客户端采集到的数据发送到透明服务器以及边缘节点的存储空间中;
2)透明服务器和边缘节点根据采集到的数据以及各自的计算能力分别对各自节点上的数据进行训练;
3)透明服务器和边缘节点将训练生成的测试模型分别发送到相应的透明客户端中;
4)将测试数据分别根据不同节点以及服务器获得的测试模型进行测试,透明客户端对静态的测试结果进行整理,根据测试结果的分类概率进行均值计算,进而更新最终的测试结果;
5)用户根据得到的最终的测试结果进行独立判断,并将判断结果反馈到透明服务器或边缘节点中;透明服务器和边缘节点收集到来自用户反馈的数据信息,暂时存储起来,等待各个类别的反馈数据信息都达到了可以进行训练的数量,重复步骤2)到步骤4)。
2.一种基于透明计算的增量机器学习系统,其特征在于,包括:
透明客户端:用于与透明服务器以及边缘节点同时进行数据采集,并将采集到的数据发送到透明服务器以及边缘节点的存储空间中;
透明服务器:用于与透明客户端以及边缘节点同时进行数据采集,并根据采集到的数据以及自身的计算能力对自身节点上的数据进行训练,然后将训练生成的测试模型分别发送到相应的透明客户端中;将测试数据分别根据不同的测试模型进行测试,对静态的测试进行动态的更新,最终综合所有的测试结果来更新测试结果;
边缘节点:用于与透明客户端以及透明服务器同时进行数据采集,并根据采集到的数据以及自身的计算能力对自身节点上的数据进行训练,然后将训练生成的测试模型分别发送到相应的透明客户端中;
用户端:用于根据得到的测试结果进行独立判断,并将判断结果反馈到透明服务器或边缘节点中,这些被反馈的数据信息和采集到的数据一起进行下一轮训练。
CN201711245791.4A 2017-12-01 2017-12-01 一种基于透明计算的增量机器学习方法及系统 Active CN108009089B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711245791.4A CN108009089B (zh) 2017-12-01 2017-12-01 一种基于透明计算的增量机器学习方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711245791.4A CN108009089B (zh) 2017-12-01 2017-12-01 一种基于透明计算的增量机器学习方法及系统

Publications (2)

Publication Number Publication Date
CN108009089A true CN108009089A (zh) 2018-05-08
CN108009089B CN108009089B (zh) 2021-02-02

Family

ID=62055746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711245791.4A Active CN108009089B (zh) 2017-12-01 2017-12-01 一种基于透明计算的增量机器学习方法及系统

Country Status (1)

Country Link
CN (1) CN108009089B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985461A (zh) * 2018-06-29 2018-12-11 深圳昂云鼎科技有限公司 一种自主机器学习的方法、装置和终端设备
CN109343951A (zh) * 2018-08-15 2019-02-15 南京邮电大学 移动计算资源分配方法、计算机可读存储介质和终端
CN109358962A (zh) * 2018-08-15 2019-02-19 南京邮电大学 移动计算资源自主分配装置
CN111970374A (zh) * 2020-08-27 2020-11-20 山东有人信息技术有限公司 基于机器学习的数据节点分组方法、系统及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104166586A (zh) * 2014-09-04 2014-11-26 中南大学 一种基于虚拟化技术的透明计算方法及透明计算系统
US9235562B1 (en) * 2012-10-02 2016-01-12 Symantec Corporation Systems and methods for transparent data loss prevention classifications
CN105809110A (zh) * 2016-02-24 2016-07-27 南京大学 一种基于无线信号强度的行为识别系统与方法
CN106815644A (zh) * 2017-01-26 2017-06-09 北京航空航天大学 机器学习方法和从节点

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9235562B1 (en) * 2012-10-02 2016-01-12 Symantec Corporation Systems and methods for transparent data loss prevention classifications
CN104166586A (zh) * 2014-09-04 2014-11-26 中南大学 一种基于虚拟化技术的透明计算方法及透明计算系统
CN105809110A (zh) * 2016-02-24 2016-07-27 南京大学 一种基于无线信号强度的行为识别系统与方法
CN106815644A (zh) * 2017-01-26 2017-06-09 北京航空航天大学 机器学习方法和从节点

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭克华,周孝锞: "基于网络爬虫和改进的LCS算法的网站更新监测", 《计算机应用与软件》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985461A (zh) * 2018-06-29 2018-12-11 深圳昂云鼎科技有限公司 一种自主机器学习的方法、装置和终端设备
CN109343951A (zh) * 2018-08-15 2019-02-15 南京邮电大学 移动计算资源分配方法、计算机可读存储介质和终端
CN109358962A (zh) * 2018-08-15 2019-02-19 南京邮电大学 移动计算资源自主分配装置
CN109343951B (zh) * 2018-08-15 2022-02-11 南京邮电大学 移动计算资源分配方法、计算机可读存储介质和终端
CN109358962B (zh) * 2018-08-15 2022-02-11 南京邮电大学 移动计算资源自主分配装置
CN111970374A (zh) * 2020-08-27 2020-11-20 山东有人信息技术有限公司 基于机器学习的数据节点分组方法、系统及介质
CN111970374B (zh) * 2020-08-27 2023-02-03 山东有人物联网股份有限公司 基于机器学习的数据节点分组方法、系统及介质

Also Published As

Publication number Publication date
CN108009089B (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
CN108009089A (zh) 一种基于透明计算的增量机器学习方法及系统
CN109347668A (zh) 一种服务质量评估模型的训练方法及装置
CN110532152A (zh) 一种基于Kapacitor计算引擎的监控告警处理方法及系统
CN113222170B (zh) 一种用于物联网ai协同服务平台的智能算法和模型
Xu et al. Service migration across edge devices in 6G-enabled Internet of Vehicles networks
Zhang et al. Prediction for network traffic of radial basis function neural network model based on improved particle swarm optimization algorithm
CN107944677A (zh) 业绩追踪方法、应用服务器及计算机可读存储介质
Portelli et al. Leveraging edge computing through collaborative machine learning
CN104346214A (zh) 用于分布式环境的异步任务管理装置及方法
CN107484189B (zh) Lte数据处理系统
Peng et al. A broad learning-driven network traffic analysis system based on fog computing paradigm
Goel et al. Green-IoT (G-IoT) Architectures and Their Applications in the Smart City
Widianto et al. Energy saving on IoT using LoRa: a systematic literature review
Leithon et al. Task scheduling strategies for utility maximization in a renewable-powered IoT node
CN114817389A (zh) 数据处理方法、装置、存储介质及电子设备
Chen Design of computer big data processing system based on genetic algorithm
CN111368060B (zh) 对话机器人的自学习方法、装置、系统、电子设备及介质
CN114374708B (zh) 一种基于协同过滤和mqtt的智能工厂数据自动订阅方法
CN110751055A (zh) 一种智能制造系统
Chen et al. Research on network management technology of power line carrier communication in low-voltage distribution network based on digital twin
Pereira et al. Parallel computational structure and semantics for soil quality analysis based on LoRa and apache spark
CN112486676B (zh) 一种基于边缘计算的数据共享分发装置
CN114818476A (zh) 一种应用于旋转机械设备寿命预测的联邦学习系统及方法
CN110674143A (zh) 一种免耕机作业信息监测系统及方法
CN106875647A (zh) 一种基于物联网的数据服务系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant